- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
一个基础的多模态模型用于少量样本学习
1111
PengtaoDang,TingboGuo,ShaCao,andChiZhang
1OregonHealthScienceUniversity,Portland,OR,USA
摘要
本少量样本学习(FSL)是一种机器学习范式,旨在从少量标记样本中泛化模型,通常
译每个类别少于10个。FSL在生物医学、环境、材料和机械科学等领域尤为重要,在这些
中领域中,样本有限且数据收集往往代价高昂、耗时或受伦理约束。在这项研究中,我们
1提出了一种创新的FSL方法,展示了通过训练一个大型多模态模型(LMMM),该模型
v
6在一个跨越不同领域、任务类型和输入模态的独立任务集上进行训练,可以显著改善
4
7FSL模型的泛化能力,在相同类型的任务上优于基于传统元学习的方法。为此,我们首
4
0先构建了一个多模态模型少量样本数据集(M3FD,包含超过10K个少量样本),其中
.
8包括2DRGB图像、2D/3D医学扫描、表格和时序数据集,并从中手动整理了如分类
0
5等FSL任务。我们进一步引入了M3F(针对少量样本学习的多模态模型框架),这是一
2个专门为数据受限科学应用定制的新颖大型多模态模型框架。M3F通过一个模块化的
:
v
i管道支持广泛的数据类型。通过对M3FD进行微调,M3F提高了模型性能,使LMMM
x
r在实际FSL部署中成为可能。源代码位于/ptdang1001/M3F。为
a
了促进对复杂FSL数据的访问并推动公共使用的可重复性,M3FD配有一个灵活且用
户友好的工具,该工具支持高效查询、任务特定采样和预处理。综上所述,我们的数据
集和框架提供了一个统一的、可扩展的解决方案,显著降低了在数据稀缺科学领域应
用LMMMs的门槛。
1介绍
科学研究和工业中许多高价值的挑战都以数据极度稀缺为特征。标准的人工智能模型
通过在大规模数据集上训练实现高性能,但在关键领域中的应用受到严重限制,这些领域
的数据收集成本高昂、速度慢或从伦理角度不可能[1,2,3,4]。这些高风险领域——包括用
于诊断罕见疾病的医疗保健、预测独特设备故障的工业制造以及处理罕见边缘情况的自主
系统——通常每个类别只有1到10个标注样本可用。这种范式被称为少样本学习(FSL),
1
旨在从如此有限的数据中构建可靠且通用的模型,但历史上一直面临过拟合和泛化能力差
的问题[5,6]。虽然传统的解决方案如元学习和数据增强提供了部分改进,但在处理复杂、
现实世界应用时,尤其是在应对多样化的数据类型时往往效果不佳[7,8,9,10]。
一个新的范式随着大型多模态模型(LMMMs)的出现而形成。基础研究表明,预先在
大规模网络数据集上训练的模型发展出了强大的新兴推理能力,使它们能够从非常少的例
子中泛化到新任务,这一概念由像GPT-4[11,12,13]这样的语言模型强有力地说明了。我
们的愿景是利用这种力量创建一个基础模型,使其可以从最少的数据中学习,解锁解决因
数据稀缺而被认为无法解决的问题的方法。我们假设,在一组多样化的独立少样本任务上
训练的单一LMMM可以比传统方法实现更优越的泛化。
此外,训练数据的质量和多样性对于这一新范式[14,15]至关重要。我们基于这样的
原则操作:在一个广泛范围的高质量数据上训练单一统一模型——这些数据跨越多种模式
(视觉、文本、表格)、各种任务以及多样化的现实世界
您可能关注的文档
- 利用深度学习减少全球空气质量估算的物理模型偏差.pdf
- 不确定性量化用于表面臭氧仿真器的深度学习方法.pdf
- 余弦调度对于掩码离散扩散模型是 Fisher-Rao 最优的.pdf
- 希尔伯特神经算子:解析信号域中的算子学习.pdf
- 面向序列的 SAC 控制在电气化动力总成中用于发动机燃油消耗优化.pdf
- 基于线性规划的非线性自治系统稳定性条件.pdf
- 用于交通运输应用中的对象检测的双流注意力与多模态查询.pdf
- VER-Bench: 在细粒度视觉证据上的推理评估中对 MLLMs 的评价.pdf
- 多阶段知识蒸馏 VGAE 和 GAT 的鲁棒控制器区域网络入侵检测.pdf
- 数据驱动的 FCC 高熵合金成分-性能关系洞察.pdf
- 边缘辅助的多用户个性化人工智能生成内容 (AIGC)协作微调.pdf
- 通过代理人工智能驱动的转录组特征分析发现疾病关系.pdf
- MissMecha:一个用于研究缺失数据机制的全能 Python 包.pdf
- ERDES:用于眼科超声中视网膜脱落和黄斑状态分类的基准视频数据集.pdf
- 跨域图像合成:从多路生物标志物成像生成 H&E 染色图像.pdf
- 近线性伪多项式时间和多项式空间的子集和问题.pdf
- 面向使用流式 ASR、量化 LLM 和实时 TTS 的低延迟端到端电信语音代理.pdf
- GeoFlow:地理空间任务的代理工作流自动化.pdf
- 人工智能应更贴近人类,而非更加复杂: 一项关于用户偏好在有哪些信誉好的足球投注网站引擎应用中简洁且有出处支持的人工智能回复的大型研究.pdf
- 通过层次序列转换器上的上下文并行性扩展生成推荐.pdf
最近下载
- 新斯的明在临床上应用.pptx VIP
- 2025政府采购评审专家考试试题及答案.docx VIP
- 机械原理第十二章我做.ppt VIP
- 人教版(2019)选择性必修 第四册Unit 3 Sea Exploration Using Language 学案(含答案).docx VIP
- 新初级招采人员《招标采购法律法规》考试复习题库-上(单选题汇总).doc VIP
- 中硼(厦门)医疗器械有限公司生产、销售和使用硼中子俘获治疗系统项目环境影响报告.docx VIP
- Unit 3 School Life话题写作专项 (含答案)冀教版英语七年级下册.docx VIP
- 2025年房屋建筑和市政基础设施工程档案资料管理规范.docx
- 水闸安全鉴定投标方案(技术标).pdf
- 2025学习通《形势与政策》章节测试题库及答案.docx VIP
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
有哪些信誉好的足球投注网站
文档评论(0)