- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
CU-ICU:通过文本到文本转换变压器针对ICU数据
集定制无监督指令微调语言模型
TeerapongPanboonyuen
FacultyofEngineering
ChulalongkornUniversity
teerapong.panboonyuen@
Abstract
本
译将大型语言模型集成到特定领域如医疗保健中提出了独特的挑战,包括领域
中适应和有限的标注数据。我们介绍了CU-ICU,一种利用Text-to-TextTransfer
Transformer(T5)架构为ICU数据集定制无监督指令微调语言模型的方法。
1CU-ICU采用稀疏微调方法,结合了少量样本提示与选择性参数更新,实现
v
5了高效适应并最大限度地减少了监督需求。我们在关键的ICU任务——早
5期败血症检测、死亡率预测和临床笔记生成上的评估表明,CU-ICU在标准
6
3微调方法的基础上始终提高了预测准确性和可解释性。值得注意的是,在其
1最高效的配置中,CU-ICU仅更新了不到1%的模型参数,就实现了高达15%
.
7的败血症检测准确性的提高和20%生成临床相关解释能力的增强。这些结
0果确立了CU-ICU作为一个可扩展、低开销解决方案的地位,能够在现实世
5
2界的ICU环境中提供准确且可解释的临床决策支持。
:
v
i
x1介绍
r
a
大型语言模型(LLMs)在包括医疗保健应用在内的多种自然语言处理任务中展现了显著的
能力。然而,将这些模型有效适应重症监护室(ICU)等专业且数据稀缺的领域仍然具有挑
战性。ICU环境需要及时、准确的预测以及可解释性的说明来支持关键的临床决策。传统的
微调方法通常需要大量的标注数据和计算资源,在实际临床环境中由于注释有限而限制了它
们的应用。
近期迁移学习的进步,特别是文本到文本的迁移变换器(T5)[22],为基于指令的任务微调
提供了一个灵活的框架。扩大指令微调模型的应用范围进一步拓宽了它们的适应性[6],包
括在医疗领域。尽管有了这些改进,在医学数据集上对大语言模型进行微调仍然需要大量的
资源和数据。
为了解决这些限制,我们提出了CU-ICU框架,该框架通过稀疏参数高效微调(PEFT)方法
定制无监督指令微调的T5模型以用于重症监护室任务。具体来说,CU-ICU应用了三种最先
MypassionisdedicatedtosupportingICUhealthcareprofessionalsinThailandbydevelopinginnovative
AIassistancetools.Thisworkisindependentlydriven,withoutexternalfundingorformalprojects.Formore
aboutmyresearchandupdates,pleasevisithttps:/
您可能关注的文档
- 深度 3D 车道:融合单目 3D 车道检测与自监督单目深度估计-计算机科学-机器学习-自动驾驶.pdf
- 用于突尼斯建筑分割的量子辅助注意力 U-Net,采用 Sentinel-1 数据-计算机科学-卷积神经网络-U-Net-合成孔径雷达.pdf
- 动态环境下的多智能体强化学习中的因果知识迁移-计算机科学-多智能体强化学习-因果关系-迁移.pdf
- 分而治之:一个大规模数据集和模型用于左右乳腺 MRI 分割-计算机科学-机器学习-医学图像分割.pdf
- 关于定向线图及相关矩阵的一些简短笔记-计算机科学-机器学习-算法.pdf
- 基于回归的方法估计蜘蛛恐惧症患者在行为回避任务中的焦虑程度-计算机科学-机器学习-可穿戴设备.pdf
- 局部化 FNO 在动脉瘤 MRI 中的时空血流动力学上采样-计算机科学-机器学习-脑血管诊断-医疗健康.pdf
- 高效且可扩展的元学习和依赖驱动恢复自愈数据库-计算机科学-元学习-异常检测-图神经网络-可解释人工智能.pdf
- 一个端到端的 DNN 推理框架用于 SpiNNaker2 神经形态 MPSoC-计算机科学-调度算法-深度学习-硬件加速-边缘人工智能.pdf
- 诗歌故事扩散: 在多阶段提示优化中最小化诗歌到图像生成的信息损失-计算机科学-文本到图像-扩散模型-人工智能.pdf
- Unit 6 Get Close to Nauture Lesson 22 -课件-2025-2026学年度北京版英语四年级上册.pptx
- Unit 7 Be Together Lesson 23 -课件-2025-2026学年度北京版英语四年级上册.pptx
- 2025食品饮料行业AI转型白皮书-2025食品饮料行业数智化转型领先实践.pdf
- Unit 7 Be Together Lesson 24 -课件-2025-2026学年度北京版英语四年级上册.pptx
- Unit 7 Be Together Lesson 25 -课件-2025-2026学年度北京版英语四年级上册.pptx
- Unit 7 Be Together Lesson 26 -课件-2025-2026学年度北京版英语四年级上册.pptx
- 2025年广州体育职业技术学院单招职业倾向性考试题库完美版.docx
- 软件公司员工考勤异常处理.doc
- 2025年土地登记代理人之土地登记相关法律知识题库500道及完整答案【有一套】.docx
- 2025年四平职业大学单招职业适应性考试题库含答案.docx
文档评论(0)