通过输入驱动的显著性适应启用设备端医疗 AI 助手.pdfVIP

通过输入驱动的显著性适应启用设备端医疗 AI 助手.pdf

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

通过输入驱动的显著性适应启用设备端医疗

AI助手

UttejKallakurik,EdwardHumes,RithvikJonna,XiaominLin,TinooshMohsenin

JohnsHopkinsWhitingSchoolofEngineering,Baltimore,Maryland,UnitedStates

{ukallak1,ehumes2,djonna1,xlin52,tinoosh}@

摘要—大型语言模型(LLMs)对医疗场景有显著影响,但

在实时、资源受限的环境中部署仍然过于庞大,例如边缘设备。

在这项工作中,我们介绍了一种新型医疗辅助系统,通过我们

的通用压缩框架进行优化,将大型语言模型(LLMs)定制用于

本专门领域。通过对特定领域的数据测量神经元的重要性,我们

的方法可以激进地修剪不相关的神经元,在减少模型大小的同

译时保持性能。在剪枝之后,我们应用后训练量化进一步减少内

中存占用,并在包括MedMCQA、MedQA和PubMedQA在

3内的医疗基准上评估压缩后的模型。我们还部署了50%压缩的

vGemma和67%压缩的LLaMA3模型到JetsonOrinNano

5

0(峰值18.7W)和RaspberryPi5(峰值6.3W),在硬件限

1制下实现了实时、节能的推理。图1.困惑度与模型大小(以GB为单位,等效32位)的对比,针对LLaMA3-

1IndexTerms—大型语言模型(LLMs)、剪枝、显著性、8B及其剪枝变体。我们的方法(紫色星号)在所有压缩模型中实现了最低的困

1惑度(10.9),同时将参数数量减少到43亿。与LLM-Pruner[17]、SliceGPT[4]

.边缘部署、量化、医疗NLP、设备端AI

6和ATP[15]相比,我们的方法在一个更小的模型大小下实现了最多低1.9

0的困惑度。这证明了任务特定剪枝在激进压缩下保持性能的有效性。

5I.介绍

2关的数据。至关重要的是,变压器模型中的神经元重要

:大型语言模型(LLMs)已经迅速提升了自然语言

v性会随着输入分布的变化而变化;通过利用像Medical

i理解[14]、生成[6]和推理[25]的能力,成为在各种应

xMeadow[10]这样的数据集,我们可以识别出对医学语

r用中至关重要的工具——例如通用对话[5]、引导式对

a言任务至关重要的神经元。这种基于输入的剪枝方法暴

话模拟[20]、内容理解[18]以及特定领域的问题回答

露并保留了与临床相关的神经元,同时安全地移除不活

[12,13]。这些参数以十亿计的模型非常有效,但在临床

跃的神经元,从而在特定任务性能损失最小的情况下实

环境或移动健康应用程序中实时使用的边缘设备上过

现显著的模型压缩。

于消耗资源。在医疗应用中,人们对将LLMs作为医生

图1展示了LLaMA3-8B(这里的B代表参数的十

和患者的虚拟助手越来越感兴趣。这些助手必须解释特

您可能关注的文档

文档评论(0)

专业Latex文档翻译 + 关注
实名认证
服务提供商

专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。

1亿VIP精品文档

相关文档