基于大语言模型的智能信息抽取工具辅助构建聚合物加工数据库发表于Polymer期刊

发布时间:2025-10-13  文章来源:陈政元

1.png

聚合物材料制品的最终性能由其从分子到宏观的多尺度结构决定。注塑过程中,材料经历熔体至固态的复杂相变,熔体温度、模具温度、注射速率、保压压力与时间等关键工艺参数构成了调控多尺度结构进而优化制品性能的重要影响因素。然而,面对广泛的参数设计空间,完全通过实验试错优化工艺组合面临周期长、成本高的瓶颈。文献中积累了大量与注塑成型相关的数据,从现有文献中系统挖掘工艺数据并结合大数据分析,成为降低研发成本的重要途径。然而,文献中技术描述语言风格差异显著、专业术语密集,传统方法难以实现准确高效的信息提取。为此,本研究开发了一种基于大语言模型的信息提取工具,通过分位数量化与低秩适配器微调技术,将领域专业知识嵌入模型内部,显著提升了其对专业文本的语义理解与结构化信息抽取能力。利用该工具,我们从相关文献中准确提取了不同聚合物体系的注塑成型关键工艺参数,在测试基准上准确率达到91.1%。本研究提出的方法具有计算高效、对语义变化适应性强等特点,适用于注塑成型领域的高效数据提取,为快速构建聚合物加工数据库提供了可靠的技术路径。

Chen, Z. Y.; Li, T. Y.; Yang, Y.; Huang, H. D.; Lin, H.; Liu, H.; Zhong, G. J.; Li, Z. M. Intelligent information extraction pipeline driven by large language model for building polymer processing database. Polymer 2025, 336, 128875. DOI: 10.1016/j.polymer.2025.128875

四川大学高分子科学与工程学院塑料高性能化加工与装备课题组-版权所有   蜀ICP备17006860号      TECHNICAL SUPPORT:DIANMAI