数据驱动下的人工智能技术
为计算材料学带来新可能
传统的材料研发一般要经历成分工艺设计、制备表征、系统优化、集成制造、服役评价和工业应用等漫长的过程,需要反复试错,成本昂贵,耗时费力。
计算材料学可以通过计算机模拟对材料的性能进行事先的预测和设计,从而大大减少实验试错的成本和时间。近年来,计算能力突飞猛进,数据快速积累,新兴的大数据技术与人工智能方法令计算材料学如虎添翼。数据驱动的人工智能方法将高通量计算、高通量实验、数据库或机器学习方法高度融合,极大地扩展了计算材料学的预测效率和能力。
材料研究的四种范式:
实验驱动、理论驱动、计算驱动和数据驱动
传统的材料设计方法中需要材料设计者通过不断调整设计参数,在不同参数设置下分别进行实验,来寻找满足需求的材料设计参数。
而以材料数据为支撑,利用以深度学习为代表的人工智能技术,我们能够将材料制备工艺、组分、结构和性能等多模态、多维度下的大量数据进行汇聚,并高效准确地从中提取规律、价值。
借助于此,我们可根据已知实验数据构建机器学习模型,预测某个特定设计参数下的目标响应。这样在面对新的材料设计需求时,便可以借助模型预测值来搜索最优的材料设计参数,从而大大减少实际实验次数,加快材料研发速度、降低材料研发成本、提高材料设计的成功率和效率。
“智能计算材料”
推动材料研发范式变革
将传统计算材料学方法与数据驱动的人工智能方法深度结合,正衍生为新兴的“智能计算材料”研究方向。“智能计算材料”研究方向包括两方面,一是人工智能辅助的计算材料方法,主要是利用人工智能方法扩展传统的计算材料学方法的预测能力和效率;二是基于计算材料数据的人工智能预测方法的发展与应用,主要是以计算数据为基础发展人工智能材料构效关系预测模型。
“智能计算材料”是材料、物理、化学、力学、计算机和数学的交叉融合的跨学科方向,能够用于航空航天、轨道交通、海洋工程、先进制造、电子信息等领域关键材料的设计和应用,将为加速材料研发全流程提供新的研究手段。
“领域知识+计算+AI+数据”的平台建设基本思路
来源:之江实验室
拓展阅读
一
材料数据库的构建
材料研发数据库的构建分为五个步骤:数据库结构构建、数据表结构构建、数据集成、数据关联、数据可视化分析。
1
数据库结构构建
材料数据来源的差异造成数据内容和数据量无法统一,而传统材料数据库的扩展性较差,无法实现材料数据的共享与整合。iDataCenter数据库6级结构用于金字塔式数据库结构的构建,允许用户对数据库层次结构进行扩展。用于多源异构材料数据的分类与组织,实现材料数据的结构化与系统化管理。
2
数据表格结构构建
材料数据的展现形式也多种多样,不仅包括常见的数据和文本字段,还有图片、曲线、表格、三维数据集及特殊的数据形式。iDataCenter具有丰富的字段属性类型,用于数据类型整理、数据存储方式、数据标准化的设计。多种字段类型可基本满足材料科学与工程基础数据的所有数据类型。用户可根据需求在字段属性界面进行数据字段的分类、位置调整、增、删、改。
3
数据集成
用户可以在已经设计好的数据表模板中记录相应的数据,大批量入库的数据可通过文件夹分组管理,同时支持自定义列表显示字段。
为减少实验过程中的人为因素干扰,在实验设备及配套工作站软件支持的情况下拟采用自动数据采集的方式获取实验数据并储存在数据库中。
系统预置导入模板,用于excel、txt、csv、xml等数据结构化较好的文档数据或特殊数据(设备、软件计算结果文件)的直接导入,同时也只支持定制插件将文件进行解析后导入,实现材料数据高效率导入,大大节约时间成本。
4
数据关联
可用关联属性标识该检验记录数据的工艺条件,使多张数据表的数据按需汇总展示,可用关联记录的方式标识性能数据的来源,支持点击查看完整的数据来源信息。
用于数据表、数据记录关联方式的设计,可实现不同类型和来源的数据之间关联,从而提高数据的完整性。
5
数据分析
利用iDateCenter数据库可以将杂乱无章的数据有序储存起来,并通过数据检索筛选等方式快速找到满足要求的数据,可以完成很多专业软件才有的数据统计、分析,其中包括:表格分析、散点分析、曲线分析、曲线对比、公式算法自定义等,分析结果会以视化图表展示出来并支持导出。
二
相关软件产品
iDataCenter
iDataCenter(材料数据智能管理系统)是MatAi自主研发的产品,各项指标达到国际同类软件领先水平,可根据用户需求进行个性化定制与实施,实现材料数据全生命周期管理,全面涵盖材料设计、计算、仿真、测试、生产、应用及服役等环节。材料数据可追溯审计的特性将大幅提升数据质量管控,保证数据一致性,降低高价值数据丢失风险,满足各部门对于多源异构材料数据的管理应用需求。
产品功能
MatAi持续面向2035的新材料战略,并已成功实现了企业级应用。MatAi将大力推进材料基因工程、建设材料数字化研发平台、推动材料基因工程加速融入新材料的研发、设计、制造和应用全生命周期,缩短新材料研发周期,降低研发成本。加强新材料资源共享平台建设,对新材料产品、企业、资金项目、成果奖励、学术文献、标准、专利、专家等海量数据资源进行汇总加工,从而构建新材料行业知识服务系统。
MatAi产品以材料基因工程技术为框架,融合材料信息学、数据挖掘、机器学习及人工智能技术,加速新材料的研发与筛选,助力高新技术企业与科研机构,以低门槛、简易操作、高效率运用材料大数据技术进行材料设计、筛选与发现。