- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
通过输入驱动的显著性适应启用设备端医疗
AI助手
UttejKallakurik,EdwardHumes,RithvikJonna,XiaominLin,TinooshMohsenin
JohnsHopkinsWhitingSchoolofEngineering,Baltimore,Maryland,UnitedStates
{ukallak1,ehumes2,djonna1,xlin52,tinoosh}@
摘要—大型语言模型(LLMs)对医疗场景有显著影响,但
在实时、资源受限的环境中部署仍然过于庞大,例如边缘设备。
在这项工作中,我们介绍了一种新型医疗辅助系统,通过我们
的通用压缩框架进行优化,将大型语言模型(LLMs)定制用于
本专门领域。通过对特定领域的数据测量神经元的重要性,我们
的方法可以激进地修剪不相关的神经元,在减少模型大小的同
译时保持性能。在剪枝之后,我们应用后训练量化进一步减少内
中存占用,并在包括MedMCQA、MedQA和PubMedQA在
3内的医疗基准上评估压缩后的模型。我们还部署了50%压缩的
vGemma和67%压缩的LLaMA3模型到JetsonOrinNano
5
0(峰值18.7W)和RaspberryPi5(峰值6.3W),在硬件限
1制下实现了实时、节能的推理。图1.困惑度与模型大小(以GB为单位,等效32位)的对比,针对LLaMA3-
1IndexTerms—大型语言模型(LLMs)、剪枝、显著性、8B及其剪枝变体。我们的方法(紫色星号)在所有压缩模型中实现了最低的困
1惑度(10.9),同时将参数数量减少到43亿。与LLM-Pruner[17]、SliceGPT[4]
.边缘部署、量化、医疗NLP、设备端AI
6和ATP[15]相比,我们的方法在一个更小的模型大小下实现了最多低1.9
0的困惑度。这证明了任务特定剪枝在激进压缩下保持性能的有效性。
5I.介绍
2关的数据。至关重要的是,变压器模型中的神经元重要
:大型语言模型(LLMs)已经迅速提升了自然语言
v性会随着输入分布的变化而变化;通过利用像Medical
i理解[14]、生成[6]和推理[25]的能力,成为在各种应
xMeadow[10]这样的数据集,我们可以识别出对医学语
r用中至关重要的工具——例如通用对话[5]、引导式对
a言任务至关重要的神经元。这种基于输入的剪枝方法暴
话模拟[20]、内容理解[18]以及特定领域的问题回答
露并保留了与临床相关的神经元,同时安全地移除不活
[12,13]。这些参数以十亿计的模型非常有效,但在临床
跃的神经元,从而在特定任务性能损失最小的情况下实
环境或移动健康应用程序中实时使用的边缘设备上过
现显著的模型压缩。
于消耗资源。在医疗应用中,人们对将LLMs作为医生
图1展示了LLaMA3-8B(这里的B代表参数的十
和患者的虚拟助手越来越感兴趣。这些助手必须解释特
您可能关注的文档
- 博学者:具有动态分层工作流的自我优化代理.pdf
- 大陪审团:用于动态质量评估标准的协作机器学习模型评估协议.pdf
- 可调腿部刚度在单足跳跃机器人中用于跨越不同地面轮廓的节能垂直跳跃.pdf
- CRYSTALS-Kyber(ML-KEM)作为后量子时代替代 RSA 和 ECC 的性能与存储分析.pdf
- GPS 卫星的姿态确定与控制:稳定化、轨道插入和运行控制机制.pdf
- 云中的 HSM 和 TPM 故障:一种实际世界的分类与新兴防御措施.pdf
- 胶囊-卷积康:一种医学图像分类的混合神经网络方法.pdf
- 偏斜引起的插入损耗偏差(SILD)和 FOM_SILD:量化高速通道中 P/N 偏斜效应的指标.pdf
- 基于精细调整的自监督模型的脑网络分析在脑疾病诊断中的应用.pdf
- 面向可扩展的 SOAP 笔记生成:一种弱监督多模态框架.pdf
- 2025年无人机低空医疗物资投放社会效益报告.docx
- 2025年再生塑料行业包装回收利用产业链重构研究.docx
- 《AI眼镜周边产品市场机遇:2025年终端销售与需求增长洞察》.docx
- 2025年坚果加工行业深加工技术突破与市场拓展策略报告.docx
- 2025年通信芯片行业技术竞争与未来趋势报告.docx
- 《2025年生鲜电商配送冷链事故分析与预防措施》.docx
- 《商业航天融资新趋势2025民营卫星企业资本涌入估值分析市场动态》.docx
- 2025年能源绿色健康行业创新技术与市场应用报告.docx
- 2025年无人机低空医疗救援通信方案分析报告.docx
- 2025年烹饪机器人行业市场集中度分析报告.docx
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
有哪些信誉好的足球投注网站
文档评论(0)