上下文学习作为评估 LLM 生成代码功能正确性的有效估计器-计算机科学-上下文学习-代码生成.pdfVIP

上下文学习作为评估 LLM 生成代码功能正确性的有效估计器-计算机科学-上下文学习-代码生成.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

上下文学习作为评估LLM生成代码功能正

确性的有效估计器

SusmitaDasMadhusudanGhoshPriyankaSwami

UniversityofGlasgowIndianAssociationfortheUniversityofGlasgow

Glasgow,UnitedKingdomCultivationofScienceGlasgow,UnitedKingdom

s.das.2@research.gla.ac.ukKolkata,Indiaswamipriyanka98@

madhusuda.iacs@

DebasisGangulyGulCalikli

本UniversityofGlasgowUniversityofGlasgow

译Glasgow,UnitedKingdomGlasgow,UnitedKingdom

中Debasis.Ganguly@glasgow.ac.ukHandanGul.Calikli@glasgow.ac.uk

1摘要Keywords

v

0当将基于LLM的代码生成应用于遵循功能驱动或快上下文学习,代码质量估算,代码生成

0

2速应用开发方法的软件开发项目时,在缺乏测试用例

5

0的情况下,评估生成代码的功能正确性变得必要。正1介绍

.

7如用户从检索到的相关文档列表中选择一个相关文档大型语言模型(LLMs)可以以抽象和通用的方式建模

0

5一样,软件生成工作流程也需要开发者从按后验概率语义,而无需任何特定任务的训练[1,5,20,28],使得

2排序的备选解决方案列表中选择(并可能优化)一个

:它们成为广泛不同下游任务的有效零样本预测器,例

v生成的解决方案。这表明估计排名列表的质量——类

i如评估评论[17]、回答问题[15]、推荐相关文档[19]等。

x似于在信息检索(IR)中的查询性能预测(QPP)中估

r在软件开发的背景下,LLMs已被证明是广泛软

a计“相关性”——对于定义质量为“功能正确性”的件开发任务中的宝贵资源,例如从自然语言问题描述

生成式软件开发也至关重要。本文提出了一种基于上生成代码片段[3,31],或完成部分编写的软件代码以

下文学习(ICL)的方法来评估代码质量。我们的研究实现特定任务[6,12,29],甚至预测生成代码的质量

结果表明,提供来自训练集的功能正确的少量示例可[33]。LLMs自动生成的代码在“人在回路中”的设置下

以提高现有QPP方法以及基于零样本的代码质量估可能特别有益,例如,缺乏经验的软件开发人员可能

计方法的性能。会发现修改为特定功能生成的代码比从头编写代码更

容易[29],或者这有助于减少软件开发团队之间的代

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档