- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
GOFAI遇见生成式AI:通过大规模语言模型开发专家系统
1,23
EduardoC.Garrido-MerchánandCristinaPuente
1QuantitativeMethodsDepartment,ComillasPontificalUniversity
2InstituteofResearchinTechnology(IIT),Madrid,Spain.
3ComputerScienceDepartment,ICAISchoolofEngineering,ComillasPontificalUniversity,
28015Madrid,Spain
2025年7月
本摘要
译大型语言模型(LLMs)的发展成功地变革了基于知识的系统,如开放领域的问题回答系统,能
中够自动生成大量的看似连贯的信息。然而,这些模型存在一些缺点,比如幻觉现象或自信生成错误
1或无法验证的事实。本文介绍了一种利用LLMs以受控和透明的方式开发专家系统的全新方法。通
v
0过限定领域并采用结构良好的基于提示的提取方法,我们生成了Prolog中的知识符号表示形式,这
5种形式可以由人类专家进行验证和修正。这种方法还保证了所开发专家系统的可解释性、扩展性和
5
3可靠性。通过对ClaudeSonnet3.7和GPT-4.1进行定量和定性实验,我们展示了生成的知识库在
1事实准确性和语义连贯性方面具有很强的一致性。本文提出了一种透明的混合解决方案,将LLMs
.
7的记忆能力与符号系统的精度相结合,为敏感领域的可靠AI应用奠定了基础。
0
5
2
:1介绍
v
i
x
r自70年代和80年代开发出首批专家系统如DENDRAL[8,10],MYCIN[29],XCON[2]及其他一些
a
系统以来,这项技术作为知识与建议的辅助手段,在诸如医疗、法律、教学等众多任务中不断演进。
创建专家系统时面临的最大复杂性之一是为其提供完整且可靠的知识。为此任务,通常会使用一
位对该主题有深入了解的人类专家以及大量问卷或其他方法来捕捉以图、决策树、知识规则[13]等形
式获得的知识,以便尽可能有效地提取所获知识[23]。
随着2010年大型语言模型(LLM)的出现,拥有海量数据信息容量的系统,在生成针对特定任
务的小领域系统方面开启了一个全新的世界。因此,医疗、教育和完成类的聊天机器人迅速被创建出
来,允许流畅对话并回答多种新的问题[9]。问题是,并非系统返回的所有知识都是可靠的。正如[15]
和[18]所指出的那样,LLM在急于给出答案时会产生幻觉,即错误或不准确的知识作为答案。这里的
问题很严重,因为如果知识来源不可靠,答案也不应可靠,因此,除非我们进行检查,否则系统将传
播错误信息。
大规模语言模型中的幻觉是系统在数据不准确或内部故障时产生的虚假响应。在将大规模语言模
型应用于系统中时,检测这些幻觉至关重要,因为这可能会导致医疗、科学、商业等敏感过程中出现
严重错误,并且由于缺乏验证或解释[24],可能导致网络中虚假信息的传播。
幻觉的产生可以归类为以下原因中的失败:[27,20]:数据失败[7],因为它们不是必威体育精装版的、存在偏
见的数据或与假新闻混合在一起,访问某些信息源时存在知识产权问题等。在图1提出的情况下,有
1
明显的过时信息案例,因为在提问前的15天内系统数据中没有教宗弗朗西斯去世的信息。即便如此,
它仍然断言截至5月7日,教宗仍然健在。
您可能关注的文档
- 局部化 FNO 在动脉瘤 MRI 中的时空血流动力学上采样-计算机科学-机器学习-脑血管诊断-医疗健康.pdf
- 高效且可扩展的元学习和依赖驱动恢复自愈数据库-计算机科学-元学习-异常检测-图神经网络-可解释人工智能.pdf
- 一个端到端的 DNN 推理框架用于 SpiNNaker2 神经形态 MPSoC-计算机科学-调度算法-深度学习-硬件加速-边缘人工智能.pdf
- 诗歌故事扩散: 在多阶段提示优化中最小化诗歌到图像生成的信息损失-计算机科学-文本到图像-扩散模型-人工智能.pdf
- 一致的解释者还是不可靠的叙述者?理解 LLM 生成的群组推荐-计算机科学-大语言模型-群组推荐系统.pdf
- 高斯核基运动测量-计算机科学-机器学习-健康监测.pdf
- 关键字启发级联:使用大语言模型以成本高效的方式生成文本-计算机科学-大语言模型-自由格式文本生成.pdf
- CU-ICU:通过文本到文本转换变压器针对 ICU 数据集定制无监督指令微调语言模型-计算机科学-大语言模型-医疗保健.pdf
- MD-OFDM:一种适用于资源受限应用的节能低峰均功率比 MIMO-OFDM 变体-计算机科学-机器学习-无线通信-物联网.pdf
- 改进低成本遥操作:通过力增强 GELLO-计算机科学-遥操作系统-机器人.pdf
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)