本文2527字,阅读约需6分钟
摘 要:株式会社日立制作所(以下简称“日立”)开发了有助于加快材料开发速度的新型机器学习模型,并在与积水化学工业为普及材料信息学所开展的合作创新活动*1中示范了该模型的有效性。该模型采用了能够模拟量子计算机的“CMOS退火”*2技术,通过运用该技术来构建基于决策树的材料性能预测模型,从而使模型能够穷举各种条件。该模型的应用提升了传统机器学习模型的预测精度,并有望将材料开发周期缩短约20%*3。日立将把该技术作为Lumada当中的“材料开发解决方案”*4,并推进其实用化。日立还希望能将该模型应用于生产现场运营和物流优化等更广泛的领域,从而帮助客户创造价值。
关键字:新型机器学习模型、CMOS退火技术、材料开发解决方案、模拟量子技术、新材料开发、决策树算法
传统的材料开发依赖于研究人员的经验与直觉,要实现材料的实用化往往需要耗费大量的时间与经费。然而由于产品生命周期的缩短、资源限制等因素,市场对材料开发提出了更加多样化和高水平的要求。为满足这些要求,日立正不断推动材料信息学的发展。为打造数据管理分析的技术基础,充分利用数据提升材料开发过程的效率,日立一直致力于技术开发,同时面向材料行业等各行各业的客户,提供运用材料信息学的“材料开发解决方案”(Lumada解决方案的一部分),以满足客户各种需求。
在新材料开发领域,有关人员正在评估一种新的工作方法,即预先通过机器学习预测材料特性,缩小备选材料范围,从而缩短开发周期。具体方法如下:①通过让AI学习材料现有相关数据,构建预测模型,预测材料特性;②运用所得的预测模型,寻找实际想开发的材料的最佳制作条件。在这一过程当中所使用的机器学习,需要基于更少的实验数据发现有用的候选材料,因此需要具备高精度预测材料特性的技术。为提升预测精度,让AI在组合多个变量的复合条件下进行学习是有效的,然而有关材料制作的条件众多,如果全部考虑,其组合数量将非常庞大。传统的数据科学家基于自身经验与直觉选择组合条件并建立预测模型,但由于不能穷举所有条件进行评估,其精度的提升是有限的。
图1 本次开发的机器学习模型的概念图
本次,日立开发了一种新的方法,通过将模拟量子计算机技术“CMOS退火”引入决策树算法*5(上文①中构建机器学习模型时,以及材料信息学当中常用的一种算法),穷举材料制作相关条件并进行评估,从而提升了预测精度。将以该方式构建的高精度预测模型应用于现有的有机材料分子构造特性预测问题(上文②),其结果如图2所示。LightGBM和XGBoost*6这两种现有技术在运用机器学习提升预测精度方面均展示出高性能。相较以往单独依靠这两种技术进行预测,应用本技术后,二者的预测精度均得到了提升*7。此外,与使用传统材料信息学方法进行材料开发相比,使用本技术进行材料开发所需的开发周期预计可减少约20%。
图2 将本次开发的方法适用于传统技术后,预测精度的改善结果
本技术可广泛适用于提升基于决策树算法的机器学习的预测精度。未来,日立将把本技术作为为Lumada解决方案当中的“材料开发解决方案”,继续推进其实用化。同时,除了协助半导体、电池、药物研发等领域的客户提升多样化材料开发的效率,日立还将推动本技术在物流、生产等领域的应用,助力客户加速提升自身创造的社会价值,为实现可持续发展社会做出贡献。