文:吴紫磨
春节上映的电影《流浪地球2》当中,在新型量子计算机的“一揽子”方案技术支持下,人类工程师得以从繁重的底层驱动构建和整体任务调度组织中解放出来,将力量集中于战略层面,最终以超卓的速度完成了剧情设计中给定的宏大而浪漫的拯救计划。相关表现堪称未来版的神笔马良,在新年伊始,给中国的广大观众带来了耳目一新的深刻印象。
科幻是对现实的超前反映,在2023年的今天,以云计算和人工智能为核心,新型的计算技术已经深入介入科学研究前沿探索与技术转化工程应用的方方面面。就算力改造世界这个科学母题而言,奇点迫近,未来已来,并非虚言。
3月28日,中国科学院天津工业生物技术研究所(以下简称“天津工业生物所”)与亚马逊云科技在天津举行了一场联合沟通会。会上,两家重量级的科研实体分享了一系列有关云计算在生物计算设计中的前沿进展与最新应用成果。
工业生物将幻想转化为现实
在生产力并不发达的古代,人们迫切渴望改变现实世界,因而有了“点石成金”的虚妄传说。在21世纪的今天,人们的技术理念得到了极大地发展,得益于对各类型数据的分析和处理,在超级算力的加持下,人们认识世界的深度和广度以空前的方式不断拓展。通过计算来认识细分领域的微观信息,通过大数据互联将不同子领域的强弱关联数据予以结合,从系统性、全局性的方面分析被研究物的宏观架构,两种方式结合之后,将会产生无限可能。在更加深入地认识的基础上,人们有望更加深刻、甚至是神奇地改造我们的世界。
工业生物就是科学界在生物领域利用这种构想进行的实践与探索。作为聚焦工业生物技术的重点单位,天津工业生物所是中国合成生物学领域的核心力量,研究所的创立旨在探索工业生物技术在解决全球经济社会发展面临的各类问题方面所展现出的各种潜能。在气候变化、环境、能源、资源短缺等现实瓶颈面前,工业生物技术能不能成为一个解决社会经济可持续发展的手段?这是业界十分关注的关键问题,对此,天津工业生物所以生物设计为核心,以工程生物学为指导,发展生物科学,打造创新生物技术,进行了坚持不懈的实践。
在此蓝图下,天津工业生物所积极组建国家级创新平台,包括低碳合成工程生物学重点实验室、工业酶国家工程研究中心,以及正在牵头建设的国家合成生物技术创新中心等。
在工业生物领域,近年来,天津工业生物所聚焦国家双碳战略需求,探索二氧化碳生物转化利用,在以二氧化碳作为原料来进行生物合成和制造方面实现了重大科研突破,国际上首次在实验室实现了从二氧化碳到淀粉的人工合成,在二氧化碳到其他复杂化合物的人工合成研究方面,也在长足进步之中。
此外,天津工业生物所在工业发酵菌种自主创新、生物质转化与可再生化工、未来食品制造、植物天然产物微生物重组合成、化学品的绿色生物合成等方面均取得了系列创新成果,相关研究已经或正在实现产业应用。这些科技成果或可大幅度减少传统工业生产的资源消耗、能源消耗,或可实现以可再生生物质为工业原料,或可通过工业生物技术提高生产效率,还有能力直接合成中草药的有效成分,节约土地资源的使用和传统农业生产带来的化肥消耗。
实际上,前沿科技的成果大多从实验室中产生,但如何从实验室中走出,克服产业化应用的瓶颈,则是非常重要的环节。天津工业生物所始终坚持技术立所、应用立所,,积极推进产业合作,搭建成果转移转化的“快车道”,收获了系列优秀科研成果并成功转化,为促进我国经济绿色增长提供重要科技支撑。
亚马逊云科技助力生物计算
2019年,天津工业生物所成立了生物设计中心平台实验室,并围绕生物计算设计,开始与亚马逊云科技共同探索生物技术和信息技术相结合(BT+IT)技术体系,以进一步推动合成生物学发展,以期能够为在健康、能源、农业和环境等领域的重大突破提供技术支撑。至今已推出了全球首个基于图数据库的大肠杆菌调控代谢关系知识图谱ERMer和全流程高通量编辑序列设计云平台AutoESD等20多项生物计算设计网站工具。云原生的开发方式较传统方式大幅缩短开发时间,总体运行成本大幅降低,使得团队可以专注于业务代码和创新。
工业生物是系统工程中的一个重要环节。对于整体的生物产业发展而言,工业生物菌种一如IT业界的各类通用计算和专用计算芯片,是实现串联整个生物技术所依赖的最关键的核心。如果想要设计好工业生物,IT技术的支撑至关重要,具体来说,生物计算涉及到各类模型的生物组分测量,其间产生的数据森罗万象,对软硬件系统的算力要求、算法要求都带来了巨大的挑战。
从研究对象的观察角度出发,工业生物是一个“很小”的系统,然而一旦从细节上展开,它本身也是一个“很大”的系统。生命是世界上最为独特的存在,而伴随生命体而生的工业生物,具备远超普通民用工业中的其他部门的复杂性。人们印象中以精密、复杂而著称的机械、汽车乃至航空器航天器设计,在工业生物面前,计算维度恐怕都容易显得相形见绌。
对工业生物领域来说,研究对象的测量非常困难,相关数据也极易积累较大的误差。传统生物分析方法通常仅仅针对几个基因进行研究,分析过程是相对简单的。但是当工业生物工程,将研究对象的数千个基因放在一起测量计算,那就必须要有更复杂的模型,从而派生出庞大的计算需求。
对天津工业生物所这样诞生时间不长的前沿单位来说,IT部门承担的任务量一直是比较重的。刚成立不久,天津工业生物所有限的计算团队身兼数职,同时承担了计算的开发任务和设备的日常运维任务。随着研究逐渐深入,面对多场景的复杂应用,天津工业生物所逐渐产生了迫切的云端计算需求。
从2019年开始,天津工业生物所开始布局云端的工业生物计算工程,从以前基于本地服务器端的开发模式逐渐转向了云原生的无服务器开发模式。随着时间的推移,自然而然地,天津工业生物所与亚马逊云科技的合作水到渠成。在亚马逊云服务的加持下,围绕着工程菌株的设计、构建、筛选、解析等多个环节,天津工业生物所以工业生物大数据为基础,开发核心的数据库、算法和工具,发展生物元件设计、图片设计和细胞模型构建的一些新方法、新技术、新理论,设计具有优良性状的工业酶和细胞工厂。天津工业生物所计划将现实的生物技术与海量的计算能力、人工智能相结合,为中国的工业生物产业带来更大的突破。
在维端网看来,云端应用由虚向实,实体产业自实向虚,如何巧妙地结合两者需要很高的认知水平,在很多行业,这种结合都产生过一些并不成功的教训。工业生物自身的特性决定了,生物设计是非常适合云端服务的理想目标领域,同时生物设计的进一步发展面临着技术自身的规律性掣肘,也必然无法回避云计算的落地,两者的结合符合产业发展的客观规律,自有一番“历史必然性”蕴藏其中,而亚马逊云科技与天津工业生物所的协作如此顺畅,则是两家有志于应用科技改变生活的机构自身技术实力与实事求是、客观进取精神的自然结果。
生物学数字化,亚马逊云科技优势独到
在多云时代,能够为各类企事业单位和经济实体提供云计算服务的平台很多,供应商之间的竞争趋势呈现愈演愈烈之势。在激烈的竞争环境中,亚马逊云科技与天津工业生物所的合作具有哪些独到之处,是很多业界人士和媒体大众都非常关注的问题。
从业务层面而言,亚马逊云科技具备独到的优势。其可提供各种符合实际的云上应用开发方式,包括纯分析类的、面向用户的工具/网站平台开发,也能提供敏捷开发等为工业生物提供灵活部署的先进特性。
针对生物计算设计,亚马逊云科技可以助力从文献、从各种不同的数据来源里面进行自动化的搜集,包括各种不同的数据库、模型和不同文本的数据,随之借助Amazon Neptune图数据库的搜索后台,为科研人员提供低门槛的复杂的检索。
基于亚马逊云服务的网站UI界面遵从云友好原则,将技术细节隐藏在交互界面之后,用户不需要有任何的编程的基础,通过在网站用鼠标点击选择,就能很方便地去做一些交互式的检索和调控链路的检索。
天津生物工业所在亚马逊云科技的助力下,开发了首个工业微生物领域的知识图谱,并且可以整合不同来源的异质数据,方便数据类型和场景的横向拓展。
此外,针对合成生物学所需要的模块化、标准化特性,天津工业生物所借助亚马逊云科技开发了业内首个适用所有基因组序列操作类型、任何基因组位点和跨物种的精确、自动化和高通量基因编辑序列设计的云平台——AutoESD。该平台可以通过程序流的方式编排不同实验模块,实现有序统一的便捷工具部署。借助云上的Serverless的方式,用户可以在十分钟之内完成千个编辑序列设计任务,大幅度提高了任务效率。
在业务层面之外,亚马逊云科技也具备软性服务与沟通方面的独到优势。比如,在亚马逊云科技内部,有相当数量的工程师和技术专家都具备生物信息和计算化学方面的科研背景,当他们驻场协助云服务的部署时,与天津工业生物所的协作与沟通非常流畅,任务流程得到了非常明晰而简洁的对接和梳理。
天津工业生物所生物设计中心主任马红武强调:“中国科学院天津工业生物技术研究所肩负着国家工业生物技术发展的重任,并正在加速利用云计算推动相关技术的研发和成果落地。亚马逊云科技提供的图数据库和Serverless服务,突破传统的开发模式、提升研发效率、不断优化云上成本,生物技术和信息技术相结合的技术体系将进一步推动合成生物领域的发展和创新。”
“亚马逊云科技为全球数千家生命科学领域客户提供云服务和行业解决方案,助力从实验室到真实世界,全面加速生命科学数字化创新。我们很高兴能够与天津工业生物所一道,通过云技术和深厚的行业实践推动合成生物学领域的技术进步,开拓生物制造产业的数字化创新路径。”亚马逊云科技中国区商用与公共市场事业部总经理李晓芒如是说。
维端网总结,亚马逊云科技与天津工业生物所的应用协作,具备强强联合属性,是业内不可多得的、具备示范性的优质案例。在未来,多云环境下,亚马逊云科技的云技术易于部署、易于交互、易于沟通、高效灵活的特性,必将为中国的各项前沿科技产业带来更多的利好消息。