开源 - OFweek云计算网
168 2024-09-01
2023中关村论坛已到第四日,本届中关村论坛的主旨为“开放合作共享未来”。在科技创新快速发展的当下,开放合作成为突破发展难题的必然选择,在本届论坛上,来自产学研各个方面的嘉宾,均强调以开放合作促进科技创新实现新突破。
已于26日召开的世界开源创新发展论坛,则以“开放科学背景下的开源教育”为主题,重申了开放和共享这一主旨,备受业界关注。
开源是促进信息技术创新的重要途径,是将源代码、设计文档或其他创作内容开放共享的一种技术开发和发行模式,也是当前全球科技界实现技术开放合作的主要途径之一,开源不仅可以最大限度地利用智力资源,促进技术创新,同时也是把大型企业与机构的研发成果转换成全社会共同价值的重要方式。而所谓开源(Open Source),即开放源代码,该概念出自1998年著名黑客社区Debian的社长BrucePerens起草的“自由软件指导方针”。
开源开放作为全球数字科技创新的关键,2021年底被正式写入《十四五规划》,已成为国家重要技术战略。目前,全球97%的软件开发者和99%的企业已使用开源软件。2021年底,国务院印发《“十四五”数字经济发展规划》,提出支持具有自主核心技术的开源社区、开源平台、开源项目发展,推动创新资源共建共享,促进创新模式开放化演进。
此次中关村论坛,多家科技企业都积极表态支持开源开放,并对外开放基础软件技术,体现了中国开源生态的欣欣向荣。其中蚂蚁集团首次公布以关键基础软件为核心的开源完整版图,宣布9大核心技术全部开源,同时公布开源生僻字解决方案。
据介绍,蚂蚁集团展示了十余年积累的开源技术完整版图及成果,聚焦于数据库、云原生、中间件等基础软件领域,积累了近100个社区头部开源项目、近1600个开源仓库、9大核心开源项目,如“2022世界人工智能大会镇馆之宝”隐语隐私计算技术栈、分布式数据库OceanBase、行业首个通过商用密码产品认证的密码学技术“铜锁”等自研核心技术。
王旭:简单的理解,就是把源代码开放出来,把“软件是怎么写的”开放出来,大家能够看到。最早开源这个事情叫自由软件,它的意思是说源代码是人类共同的精神财富,应该把它分享出来。就好比说,书的作者可以卖书赚钱,但是书里的知识却是所有人应该共享的。所以软件也应该把代码共享,让大家能够学到它,这是开源的基本想法。
软件开源从上世纪80年代开始了,到现在已经有40年历程,在最近的二三十年里边,开源逐步和商业结合起来了。这是为什么呢?就是说当作者把软件的源代码开放后,更多人可以参与和协作,一个人的想象力总是有限的,让更多人参与进来,会有更多的创新出现。原来只靠原作者去想,可能到退休了才能想出来,而软件开源后可以集思广益,大大提高创新的速度,很可能一两年就想出来了,所以软件开源被视作是创新的催化剂。
经济观察网:开源似乎有公益的属性,但显然又不是公益,其中商业利益的考量是怎样的?
王旭:从商业考量来说,当一家公司把源代码开放之后,肯定希望能有商业回报。开源类似于传统商业中的“先尝后买”,用户看到代码,可以运行起来了,但你想跑得更好,一般会需要更多支持,这时开源之后的商业支持就可以跟进了,这件事情闭环起来,就变成一个完整的生态系统。
这次中关村论坛的主题是开放合作,共享未来,其中就蕴含着“商业共赢”的理念,这个主题非常符合蚂蚁集团的理念。蚂蚁集团集中开源基础技术,即云时代里的云原生的技术,还有商业软件经常用到的加密技术。譬如,我们开源的加密算法的“铜锁”是国密算法,还包括大规模分布式数据库技术OceanBase,这些都是基础技术。这些技术开源之后,所有人都可以基于这些技术来构建商业,所以它和我们的商业目标并不冲突。
像蚂蚁的Ant Design,在世界范围内都是特别受欢迎的开源项目,很多年轻人接触软件和代码,从浏览器里面一跑就可以看到,这样的技术开源出来,对年轻人的创新和发展非常有好处。
王旭:比如说我们刚才说的分布式数据库OceanBase,还有我们最近主推的这种图数据库Tugraph,这里的图不是指图片,其实是指“点和连接”,什么叫“点和连接”呢?其实我们每个人就是点,我们之间认识,就是连接。比如我们之间的关系,除了合法性判断,是不是可能有欺诈存在?是不是可能有洗钱存在?这都用到了一些图。蚂蚁集团在图的技术领域是领先的,那我们把它的单机版本开放出来,可以让整个行业往前走很大一步。
另外还有隐私计算框架“隐语”,也是我们一个比较重要的科研技术。此外,开源和共享的同时也要注意保护隐私。其实安全和隐私与共享,两者是彼此结合的。
经济观察网:大家比较关注汉字拾光计划,这是一个什么样的技术?它的开源有什么意义?
王旭:这是我们这次带来的一个较大的项目,就是开源生僻字的汉字拾光计划。在现实生活中,很多人在起名字的时候,用了好听且古雅的生僻字,但这些字很难写。汉字最早数字化是好几十年前的事情,只做了最常用的6000多个汉字。这些生僻字到了今天的数字时代,在输入的时候有很大的麻烦:买火车票、办理银行业务,生僻字都会遭遇麻烦。
蚂蚁集团很早便注意到了这个问题,所以就引入了生僻字的计划,为了解决这个问题,做了很多相关的实名认证。现在新的国家标准18030是包括了两万多个汉字的,比原来6000多个常用汉字扩容了约3倍之多,有些新的汉字就完全囊括进来了,但是原来的输入法,可能输入不进来。那我们的汉字拾光计划,就是帮助大家把生僻字输入进来。这项技术开源之后,能解决很多人的尴尬和困难,这件事听起来是一件小事,但在数字时代,落实到具体的人,却能解决生活中一个烦。
经济观察网:对蚂蚁集团来讲,选择何时开源一些技术和开放哪些技术,是不是仍然有经营战略上的考量?
王旭:是的,开放原代码这件事情,从历史上来说首先是从学术界开始的,因为研究者是崇尚知识共享的,但对于商业公司来说,最开始是的,这和商业利益形成冲突。但现在的商业生态已经是另外一个状况了,你的技术开放之后,进入会更容易,可以有更多用户使用,他们使用的同时就是在你的技术上构建生态,大家会更加信任你。
有一些技术,比如说一些基础的操作系统的底层技术,掌握这些技术的人是很少的,只有合作起来才可以做得更好。对蚂蚁集团来说,我来自蚂蚁的基础设施团队,如果你不能开源,不能让大家都来交流,那我们也不愿意用这样的技术。
王旭:因为这样的核心技术全世界掌握的人不多,它并不能特别得帮助你开展业务,把它开源出去,对自己没有什么损失。但如果把它开源出去,别人就有可能帮你发现问题,最终可以帮助你改进它、完善它,这就是一个互相的促进。
总体上,我们也需要判断什么技术需要开源,什么技术不需要开源,哪些技术开源对社会有好处。
经济观察网:是否可以这么理解,软件源代码开源共享之后,在造福社会的同时,最终也会有利于自身的发展?
王旭:是这样的逻辑。开源的商业化已经20多年了,能够走这么长的路,还是欣欣向荣的状态,其实就证明了开源对大家来说是互利的,它不是单回合博弈,而是协同发展。
经济观察网:蚂蚁集团此次的开源,是我们技术体系的全部开源还是部分开源?就开源的程度来说,我们应该怎么来理解?
王旭:就这次来说,当然我们是有选择的,是着重在基础技术的开源,而且开源之后其社会效果最好的。
另外,就是开源后我们一定保有中立性,开源就意味着放弃一部分控制权,让别人参与进来,大家有参与感才会来贡献,才会让这件事情变好。我们常教育团队内部,开源不是秀肌肉、秀影响力,或是展示我们有多硬核的技术,而是让大家都参与进来,构建一个创新的生态。
你说的开源的比例和数量,其实是很难量化的,因为每天都在产生新的代码。对我们来说,现在支付宝上的每一个应用,都有开源的项目在支撑着。包括这里的分布式的架构、分布式的数据库,还包括安全隔离技术。我们对开源技术的选择,只能说等到一项技术成熟了,到了能共享的时候了,我们就会把它共享出来。