提示迁移:使用不断发展的大型语言模型稳定生成式 AI 应用-计算机科学-大语言模型-生成式人工智能.pdf

提示迁移:使用不断发展的大型语言模型稳定生成式 AI 应用-计算机科学-大语言模型-生成式人工智能.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

提示迁移:使用不断发展的大型语言模型稳定生成式AI应用

ShivaniTripathi,PushpanjaliNema,AdityaHalder,ShiQiao,AlekhJindal

TursioInc.

ABSTRACT

生成式人工智能通过启用自然语言界面和智能自动化正在改变业务应用程序。然而,底层的

大语言模型(LLMs)发展迅速,因此始终如一地触发它们成为一个挑战。这导致了应用行

本为的不一致性和不可预测性,从而破坏了企业对于关键任务工作流程所需的可靠性。在这篇

译论文中,我们引入提示迁移的概念作为系统化方法来稳定变化中的大语言模型环境下的生成

中式AI应用程序。使用Tursio企业有哪些信誉好的足球投注网站应用程序作为一个案例研究,我们分析了连续GPT模

型升级的影响,详细介绍了我们的迁移框架——包括提示重新设计和一个迁移测试平台,并

1展示了这些技术如何恢复应用的一致性。我们的结果显示结构化的提示迁移可以完全恢复由

v

3于模型漂移而丢失的应用可靠性。最后,我们总结了一些实际的经验教训,强调需要进行提

7示生命周期管理和强大的测试以确保由生成式AI驱动的业务应用程序的可靠运行。

5

5

01介绍

.

7

0大型语言模型(LLMs)迅速成为现代商业应用的基础,驱动着从客户服务聊天机器人和自动化内容生成到高

5

2级数据分析和决策支持系统等一系列广泛的应用场景。

:

v一方面,组织越来越依赖于由LLM驱动的生成式AI(GenAI)应用程序;另一方面,底层模型本身也在以

i

x前所未有的速度演变。例如,在2025年上半年,我们已经看到了OpenAI发布了五个主要的LLM版本,并

r

a且还有来自Google、Anthropic、DeepSeek等其他公司的七个更多版本。这种快速进化给寻求部署稳定GenAI

应用的企业带来了显著挑战。确保这些GenAI应用程序即使在基础LLMs变化的情况下依然保持强大和一致

至关重要,以提供可靠用户体验并保障业务价值。

提示是GenAI应用程序的一个关键组成部分[1],使开发人员能够引导模型的行为和响应。然而,随着LLMs

的发展,现有提示的有效性可能会减弱,导致应用行为不一致或退化。因此,我们需要一种系统的方法来将

现有提示迁移到新的LLM中,确保应用程序可以适应底层模型的变化而不牺牲功能或用户体验。先前的研

究在图像生成的背景下考虑了提示演化的问题,其中提示是通过迭代的方式改进以产生更好的结果[2]。这与

追求跨多个模型版本的一致性结果不同,因为每个更新LLMs的行为可能会有很大差异。

在这篇论文中,我们介绍了迁移提示概念以稳定使用不断发展的大语言模型的GenAI应用程序。我们描述了

Tursio[3]企业有哪些信誉好的足球投注网站应用程序的发展历程,该应用最初于2023年基于GPT-4-32k构建。后来,在2024年6月6

日,GPT-4-32k被弃用,并计划在2025年6月6日关闭(即有一年的过渡期)。Tursio迁移到了GPT-4.5-preview,

后者又于2025年4月14日被弃用,并计划在2025年7月14日关闭(即仅有三个月的过渡期)。目前,Tursio

在GPT-4.1上运行,多次迁移导致建立了一个可靠的测试平台以及一系列提示迁移的最佳实践。我们讨论了

Tursio的发展故事并做出了以下关键贡献:

•我们描述了Tursio企业有哪些信誉好的足球投注网站应用程序及其对大型语言模型(LLMs)的依赖。(第2节)

text-d

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档