中国经济周刊-经济网讯 当下,大模型和生成式AI正在以前所未有的速度深刻改变着人类的生活和生产方式。同时,新问题也开始涌现。不少用户发现,当人机交互时,大模型会出现“大模型幻觉”,也就是“一本正经的胡说八道”。
大模型“幻觉”指模型生成不正确、无意义或不真实文本的现象。主要原因和大模型核心技术原理有关,即Transformer架构下的Next Token Prediction,即“下一个字符的预测”。
9月8日,中国工程院院士、清华大学计算机系教授、海致科技首席科学家郑纬民在京发布了由海致科技与高性能图计算院士工作站共同开发的“Atlas LLM知识图谱与大模型融合应用平台”。面向广大B端用户,运用知识图谱,帮助大模型在企业级和工业界应用中克服“幻觉”,实现基于行业与场景的精准推演。
据介绍,该产品已经在能源、金融、政务等领域的场景中进行部署和应用,力图打通通用人工智能进入B端和工业应用的“最后一公里”。
日前,由中国电子技术标准化研究院、全国信标委等单位发起,海致科技全程参与的《知识图谱与大模型融合实践报告》已正式发布,上述成果和部分应用案例为业界共享,推动更多市场主体和技术力量参与到通用人工智能的多技术融合之中。
海致科技知识图谱与大模型融合应用平台正式发布
大模型有“幻觉” 知识图谱开药方
“当大模型从C端走向B端,它就像从玩具走向工具,而工具的精确性至关重要。”海致科技首席科学家郑纬民院士表示。他认为,单纯依靠大模型自身的迭代,“幻觉”难以解决。知识图谱作为更加类脑的人工智能工具,其精确的知识推导能力能和大模型构成良好的相互补充。反之,大模型的快速学习能力,对知识图谱的知识生成也将产生促进。
据悉,由郑纬民院士担任首席科学家的海致科技,是国内目前规模最大、应用客户范围最广的知识图谱和图计算公司。在金融、政务、能源、交通等领域拥有丰富而广阔的知识图谱应用经验,推出全球领先的国产分布式云原生图数据库Atlas Graph。
实现大模型应用质量与效率的平衡
“我们不生产大模型,我们致力于将大模型应用于生产。”海致科技CTO杨娟说,海致Atlas LLM大模型融合应用平台有三个非常独特的定位,一是在全过程实现了知识图谱与大模型的交互,有效克服大模型幻觉对工业应用的干扰;二是更好管理了客户已有的丰富的数据资产,将其与大模型成果统一整理,避免重复造轮子,使得计算更高效,应用更精确;三是能够帮助客户切换和灵活应用不同的开源大模型,实现更高性价比的场景应用。
海致科技高级副总裁瞿珂用上述平台验证过的工业场景为例。在工业制造设备运检领域中,复杂生产系统的故障识别因其故障组合类型复杂、数据异构、以及要求反应速度很快,一直是人们对人工智能寄予厚望的领域。
“过去我们通过利用知识图谱技术,可以将设备间关系以及关联设备量测信号构建成故障知识特征子图,帮助机器自动实现故障识别,但是这一过程需要业务专家配合技术人员开展大量的实体构建和配置工作。如今,我们通过大模型极大地提高这个效率。通过大模型对故障设备及关联量测值的快速提取,帮助知识图谱完成特征图的快速构建;也可以通过业务专家对大模型自动生成的特征图进行更为高效的校验,固化和校准故障特征的经验知识”。
企业“大模型”入门“三步走”
在大模型时代,行业企业客户关心的另外一个重点,是未来的发展。对此,海致科技立足客户需求建立的庞大计算分析应用和业务小模型,按照“基础场景识别+综合场景编排+场景固化发布”的逻辑,实现了大模型应用的“三步走”。
第一步:将客户已有计算分析和业务小模型的基础场景服务通过大模型微调,对场景语义进行标注识别,并形成基础服务场景库。第二步:基于多个基础服务的综合应用高阶场景,结合对应Prompt语义,运用大模型推理能力,对计算调用和计算逻辑进行智能化编排。第三步:通过大模型编排,生成场景编排知识图谱,并基于知识图谱的可观测解释性和可交互操作性,实现对复杂场景大模型编排结果的观测和人工校验调优,形成对应语义的场景知识稳定固化和对外发布能力。
目前,海致已经实现了基于行业客户已有计算分析多能力的基础场景识别,复杂场景编排和基于知识图谱的知识可观测、固化校验及发布能力,使大模型能够在已有计算分析知识和图谱固化场景两个“准确性控制”下,达成以大模型推理生成为核心的精准计算问答。
编辑:贾璇
一审:郑扬波 二审:王新景 三审:周琦