聚焦:合成化学迈进智能化时代

2022-04-18 14:01:00
admin
原创
1322
摘要:近年来, 人工智能应用于合成化学在欧美发达国家取得了一系列重要成果. 就我国而言, 结合大数据分析、机器学习以及相关智能硬件的集成, 开发中国品牌的“AI Chemists”迫在眉睫.

近年来, 人工智能应用于合成化学在欧美发达国家取得了一系列重要成果. 就我国而言, 结合大数据分析、机器学习以及相关智能硬件的集成, 开发中国品牌的“AI Chemists”迫在眉睫. 


引言

当前, 人工智能(artificial intelligence, AI) 正以不可逆转的方式改变着人类科技、经济以及社会的各个方面. 化学家需要进一步将这项新技术深度融入合成化学, 将人从繁琐的体力劳动中解放出来, 充分发挥智力劳动的创造性优势. 当然在相当长的时间内, 人依然是科学研究的主体, 人工智能是工具. 不过一旦产生海量数据后,很可能进入以数据驱动研究的科学发展新时期. 人工智能的飞速发展为化学研究带来了前所未有的机遇和挑战. 
目前, 人工智能在推动合成化学的自动化与智能化等方面开始发挥重要作用. 人工智能现有的相关应用场景主要包括:
(1) 建立化学基础数据库, 为逆合成路线设计和新材料预测打下基础; 
(2) 进行有机反应预测、逆合成分析和材料的逆向设计; 
(3) 通过知识图谱等方式挖掘数据库中蕴含的物理化学性质和结构信息, 建立相应的构效关系; 
(4) 适配与集成机器人和流动化学系统等硬件设备, 实现高可靠性、高通量及自动化合成(图1).

图1 人工智能在合成化学中的应用场景

经过20多年的积累, 欧美发达国家将人工智能应用于合成化学已经取得了一系列重要成果. 本文结合人工智能在合成化学中的应用场景, 从以下3个方面介绍现阶段人工智能在合成化学领域面临的挑战.

1

数据库的建立与融合

数据库的建立是实现人工智能的基础. 数据的数量与质量是衡量数据可用性的重要指标. 这两项指标的提升可促进相关领域关键技术从量变到质变的发展. 目前国际上已经存在一些有机合成和无机晶体数据库,虽然目前国外的此类数据库占据主导位置, 但科技的进步和计算机技术的发展给数据库的快速更新提供了可能性, 也给我国在此类数据库方面赶超欧美国家带来了前所未有的机遇.
数据库的建立离不开数据的提取和收集, 数据提取的效率和可靠性决定了数据的数量和质量. 收集数据的途径目前主要从文献和专利中提取数据.虽然该数据库具有数据量大的优势, 但是准确性和标准化程度较低. 就目前而言仍然缺乏低效、失败与非典型合成的相关数据. 如果科研人员只能看到经过筛选后产生的成功结果, 并没有考虑筛选的条件及过程, 就会忽略不少被筛掉的关键信息和数据; 而这些数据对于正确规划合成路线同样至关重要.
随着数据的增加, 搜索、共享和协作需求的不断增长, 电子记录在这些方面具有天然的优势,可以实现数据的追溯和快速查找, 数据记录更为规范和标准. 所以 电子记录的使用有利于建立高效追溯、检索的数据库, 从而提高实验数据的质量与准确. 
目前建设标准化的国家级合成化学数据库势在必行. 我国数据库建设面临的主要挑战有:(1) 如何实现数据库的系统化和数据安全.  (2) 怎样确保数据是在安全保护措施下流通和共享? (3)怎样确保在数据共享过程中不会出现安全问题, 让数据的流通和共享更为安全和有序? 
【企业家】精细化工PLM/PDM软件, 通过建立原材料指标大数据、产品大数据、配方理论指标的自动计算,实现配方研发过程的全程信息化,通过建立大数据研发平台,最大限度的减少实验次数、提高研发速度,延长产品生命周期,让经验得以固化,让技术实现传承。
综上所述, 目前我国在合成化学数据库建立和融合的主要任务包括: (1) 整合国内目前已有的相关大数据库和分散存在的小型数据库, 实现数据的标准化和统一化; (2) 发展挖掘合成化学相关数据的方法, 实现数据提取的准确性和高效性; (3) 逐步解决相关数据库的本地化和数据安全问题; (4) 在此类数据库的建设中, 要注意兼顾易获取、易操作和可视化等问题.

2

算法的开发与应用

受各种原因影响,化学反应不计其数, 在不同条件下又变化无穷. 那么如何规划出简洁、可行的路线是一大难题. 目前科研人员需要借助大数据与人工智能来高效搜索与优化反应路径, 以此来大大提升研究效率.人工智能技术凭借自动提取能力便能学习样本数据的特征和规律, 并基于这些特征信息辅助决策. 目前通过对反应中间体、反应步骤或潜在产物的预测, 为目标产物的合成路径提供分析和指导, 从而帮助化学家选择最优的合成路线(图2).

图2 机器学习算法辅助化学合成
目前我们不仅需要依靠机器来分析数据和预测结果, 更重要的是通过机器学习获得的规律凝练为系统化理论知识, 加深对化学反应过程的理解, 发现新的化学原理和规律. 一个可以解释的算法模型意味着运作过程的透明. 利用可以解释的算法模型有助于科研人员对人工智能的决策进行监督及接纳, 以保证算法的公平性、安全性及隐私性, 从而创造更加安全可靠的应用.
综上所述, 人工智能算法日趋成熟, 并且在合成化学领域初显身手. 然而, 在合成化学的广泛应用, 仍面临诸多解决的问题, 包括: (1) 现有算法的可应用性受限于数据量和数据的可靠性, 我们可通过高通量实验和计算, 快速获得标准化程度较高的海量数据, 从而为应用人工智能算法做好数据准备; (2) 进一步提升算法模型的可解释性, 从而开发和保障更加安全可靠的应用; (3) 目前机器学习模型的用户体验不佳, 人工智能算法软件的化学家用户数不足. 因此,我们需要可以进一步优化人工智能算法软件的用户界面, 消除/降低对用户编程能力的要求, 从而提升此类合成化学智能工具的普及率.

3

硬件的集成与自动化

人工智能在化学领域最早的应用场景之一有机合成. 早在1967年, Corey便提出了逆合成分析原理, 论证了运用计算机技术进行有机合成设计的方法和原则, 为化学家完成复杂有机分子的合成提供了强大的思维工具.近几年, 随着机器学习与自动化关键技术的突破, 极大提高了建立自动化/智能合成平台的可行性, 大力推动了合成化学从“手工”时代迈向“智能”时代.
自动化/智能化合成平台可承担大量单调冗长的重复性工作, 解放实验化学家的双手, 使其专注于更具创造性的脑力劳动; 自动化/智能化合成平台快速积累大量标准化、可靠性高的数据为建立高质量本地化数据库奠定基础. 
为实现硬件平台的全自动化与通用化, 可对合成工艺中的硬件设备进行区域化、模块化处理, 通过软件开发将上述硬件进一步集成. 这样便可满足不同化合物的自动合成需求(图3). 由于目前合成自动化和智能化的理念还未引起科研人员的广泛关注, 所以此类自动化/智能化合成平台的实际用户稀缺, 国内外相关的研发机构相对较少. 这一现状恰好为我国在该领域的发展提供了宝贵契机. 

图3 合成化学自动化实验室

综上所述, 虽然人工智能技术在硬件的集成方面已经取得了可喜进展, 但仍面临如下挑战: (1) 发展适用于高通量筛选的化学和工程技术手段, 建立全流程自动化合成实验平台; (2) 为配合数据的标准化, 降低零部件使用成本, 并推广平台的使用, 为相关硬件制定某些统一化标准也十分重要; (3) 鼓励作为终端用户的实验化学家以研究需求为导向, 积极参与到硬件的集成工作中, 与相关学科的研究人员协同合作, 从而加速自动化/智能合成平台的开发与应用.
人工智能的时代已经到来, 它正在促进合成化学研究的变革. 人工智能将最大程度地解放化学家的双手, 使其专注于更具创造性的脑力劳动. 人工智能助力合成化学任重道远, 未来可期.

来源:中国科学:化学 中国科学杂志社

编辑整理:企业家软件

发表评论
评论通过审核后显示。
主页页脚信息
==国家工信部中央财政支持的中小企业数字化转型名单、国家“百城千园行活动”签约单位、中国信通院/中国石油和化学工业联合会“石化化工行业工业互联网产品名录”、广东省政府工业互联网资源池企业、广东省政府智能制造生态伙伴、广东省高新技术企业、江苏省高新技术企业、陕西省高新技术企业、广东省重合同守信用企业、中国感光协会会员单位、广东省涂料行业协会数字化转型联盟秘书长单位、浙江省涂料工业协会优秀供应商、广东省工业互联网联盟成员 ==