- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
多模态循环集成用于预测对自然电影的脑反应
(Algonauts2025)
SemihEren1,2Deniz
Kucukahmetler1,3Nico
Scherf1,4
1Max
PlanckInstitute
forHumanCognitiveandBrainSciences,
Leipzig,
Germany
2TU
Dresden,
Dresden,
Germany
3School
forEmbeddedandComposite
AI
(SECAI),
Dresden/Leipzig,
Germany
4Center
for
Scalable
Data
Analytics
AI
(ScaDS.AI),
Dresden/Leipzig,
Germany
本Abstract
译
中准确预测自然刺激引起的分布式皮层反应需要能够随时间整合视觉、听觉
和语义信息的模型。我们提出了一种分层多模态递归集成方法,将预训练的
1
v视频、音频和语言嵌入映射到四名受试者观看由Algonauts2025挑战提供的
7近80小时电影时记录的功能磁共振成像时间序列上。特定模式的双向RNN
9
8编码时间动态;它们的隐藏状态被融合并传递给第二个递归层,轻量级的个
7体特异性头部输出1000个皮质分区的反应。训练依赖于一个复合均方误差
1
.–相关损失和一种逐渐将重点从早期感觉区域转移到晚期联合区域的教学
7计划。平均100种模型变体进一步增强了稳健性。该系统在竞赛排行榜上排
0
5名第三,总体Pearsonr=0.2094,并且在所有参与者中实现了最高的单个
2分区峰值分数(均值r=0.63),特别是在最具挑战性的受试者5身上获得
:
v了显著的提高。该方法为未来多模态脑编码基准测试建立了一个简单、可扩
i
x展的基础。
r
a
1介绍
理解复杂的自然刺激如何驱动人脑活动是认知计算神经科学中的核心问题[17,23,15,9]。深
度学习和系统神经科学的必威体育精装版进展产生了将丰富的刺激特征映射到分布式皮层反应的模型。
Algonauts项目2025旨在通过提供一个大型公开数据集和明确的社区基准,支持该领域的进
步,以预测来自自然电影刺激的fMRIBOLD信号[4,12]。借助共同的数据集、标准化指标
以及协作挑战格式,该项目允许研究人员进行思想的直接比较,并推动方法的发展,从而更
准确地解释大脑如何解读现实世界,使这些解释更具生物学基础。
我们的贡献。在此报告中,我们展示了在Algonauts2025挑战赛中获得第三名的编码模型。
我们的主要贡献包括(i)一个多模态RNN架构,该架构融合了来自大规模预训练模型的视
觉、听觉和文本嵌入,并将每个输入序列映射到感兴趣区域(ROI)的BOLD反应序列;(ii)
一种课程加权损失,该损失逐步重新聚焦训练目标,从早期的视觉和体感运动区转向更高级
的脑区,模仿大脑的层级处理动力学;以及(iii)一个由100个模型组成的集成,其预测平
Correspondingauthor:seren@cbs.mpg.de
Codeavailableat/er
您可能关注的文档
- 具有共享权重和注意力机制的 RESNET-CONFORMER 网络用于声音事件定位、检测和距离估计-计算机科学-声事件定位与检测-注意力机制-机器学习.pdf
- SmartAPS:用于运营管理的工具增强型 LLM-计算机科学-机器学习-人工智能-运筹学-人机交互.pdf
- 一语定级万物-计算机科学-自动语音评估-计算机辅助语言学习.pdf
- 分层扩散框架用于伪健康脑 MRI 修复以增强三维一致性-计算机科学-机器学习-扩散模型-健康图像修复.pdf
- 大型云机器人操作的联邦学习:机遇与挑战-计算机科学-机器学习-云计算机器人.pdf
- VeriMinder:缓解 NL2SQL 中的分析漏洞-计算机科学-机器学习-大语言模型-自然语言处理.pdf
- I2I - STRADA – 通过结构化推理代理从信息到洞见的数据分析-计算机科学-多智能体-代理系统.pdf
- 基于安全强化学习的自动发电控制-计算机科学-安全强化学习-自适应通用控制.pdf
- 与物交谈:将大语言模型集成到物联网网络中-计算机科学-大语言模型-物联网-边缘计算.pdf
- ARCADE:一种混合 AI 环境下的 6G 网络 RAN 诊断方法论-计算机科学-人工智能-6G 网络.pdf
- 白天晚上教学课件.ppt
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题带答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解一套.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及完整答案详解1套.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解1套.docx
- 2025年山东菏泽市事业单位招聘急需紧缺岗位目录(第一批)笔试模拟试题参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及答案详解1套.docx
- 画西瓜教学课件.ppt
文档评论(0)