DS@GT 在 CheckThat!上的应用 2025: 集成方法在社交媒体上检测科学话语的应用检查笔记本!CLEF 2025 实验室检查表-计算机科学-大语言模型-科学话语检测.pdfVIP
- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
DS@GT在CheckThat!上的应用2025:集成方法在社交
媒体上检测科学话语的应用
检查笔记本!CLEF2025实验室检查表
AyushParikh,HoangThanhThanhTruong,JeanetteSchofieldandMaximilianHeil1111,∗
1GeorgiaInstituteofTechnology,NorthAveNW,Atlanta,GA30332
Abstract
在本文中,作为参加CLEF2025CheckThat!任务4a科学网络话语检测[1]的DS@GT团队,我们介绍了为这项任务探索的方
法。对于这个多类分类任务,我们判断一条推文中是否包含科学主张、对科学研究或出版物的引用以及/或者提及了诸如大学
或科学家之类的科学实体。我们提出了3种建模方法:Transformer微调、LLM的少量样本提示和一种组合集成模型的设计受
到早期实验的影响。我们的团队在比赛中排名第七,实现了0.8611的宏平均F1分数,比基准DeBERTaV30.8375有所提高。我
们的代码可在Github上找到/dsgt-arc/checkthat-2025-swd/tree/main/subtask-4a。
Keywords
微调,大型语言模型,集成模型,科学话语检测
本
译1.介绍
中如今,大量的科学讨论在线上进行。研究人员分享社交媒体帖子宣布他们的发现,并且个人经常
参与讨论这些结果的线程。许多这些科学发现都是在X平台上讨论的,该平台是一种社交媒体,其
1
v中的帖子被称为推文。建立一个能够确定推文的科学相关性的预测系统可以帮助检查推文的科学准
5确性。此外,它可以为研究人员提供关于其他人推文中提到(引用)他们的工作的数据。
0检查那!2025任务4a[1]询问推文中是否包含科学信息。如果确实包含,它会进一步询问该信息
2是指向一个科学主张(类别1),指向一项科学研究或出版物(类别2),还是提及了一个科学实体
6
0(类别3)。
.本文探讨了DS@GT团队为任务4a所做的工作。我们研究了使用大语言模型的transformer微
7
0调和零样本及少样本提示。我们在开发集上实现了0.86的宏平均F1分数,超过了基准DeBERTaV3
5的0.84。我们的提交在11支队伍中排名第6,根据宏平均F1分数。具体来说,在类别1(科学声明)
2中我们排名第7,在类别2(科学引用)中排名第5,在类别3(科学实体)中排名第4。我们的实现
:
v代码可以在/dsgt-arc/checkthat-2025-swd/tree/main/subtask-4a公开获取。
i
x
r2.相关工作
a
2.1.科学话语检测
在线检测科学话语的前期工作大致涵盖了声明检测、实体识别、引用识别和科学事实核查。
识别科学主张的任务与立场检测和事实性分类密切相关。早期的研究利用了大规模预训练语言
模型,如BERT和RoBERTa,在FEVER[2]数据集等主张验证数据集上进行微调,以在非结构化文本
中识别事实断言。这些方法通常会结合句法特征或利用外部知识库。
社交媒体文本中的实体识别传统上侧重于使用适应嘈杂和非正式语言的模型进行命名实体识
别(NER)。科学实体识别引入了额外的复杂性,因为它需要区分机构、研究人员以及特定领域的术
语。针对特定领域NER的研究,特别是在生物医学和学术语料库中,例如SciSpacy包[3],已经发展
出的方法越来越多地被应用于社交媒体平台。对科学研究引用的识别,即提及或链接到科学研究的
文章,通过引文意图分类和替代计量研究得到了推进。这一系列工作包括将社交媒体内容通过DOI
或预印本库如a
您可能关注的文档
- 鲁宾所见之处 ZTF 观测到的异常:DR23 中的异常有哪些信誉好的足球投注网站-计算机科学-天文数据集-异常检测算法.pdf
- k-意味着有害:在 MAPPER 复形中的任意拓扑变化-计算机科学-机器学习-拓扑数据分析-聚类算法.pdf
- UQLM:一个用于大型语言模型中不确定性量化的大括号 Python 软件包-计算机科学-大语言模型-不确定性量化-幻觉检测-人工智能安全.pdf
- DS@GT 在 CheckThat! 2025 中:评估数值事实验证的上 下文和分词策略 CheckThat! 实验室在 CLEF 2025 的笔记本检查笔记-计算机科学-机器学习-自动事实核查系统.pdf
- 身份并非一切——人口统计能多大程度上决定自我认定的政党认同?-计算机科学-人口统计学-政党认同.pdf
- DS@GT 在 CheckThat! 中 2025: 通过迁移学习和纠正性 数据增强检测主观性 CheckThat! 实验室在 CLEF 2025 的笔记本检查笔记-计算机科学-主观性检测-迁移学习.pdf
- 北师大版(2024)八年级数学上册课件 6.3 哪个团队收益大.pptx
- (人教A版数学选择性必修一)2025年秋季学期讲义第12讲第一章空间向量与立体几何测评卷(基础卷)(学生版+教师版).docx
- 北师大版(2024)八年级数学上册课件 7.1 认识证明 第2课时 定理与证明.pptx
- (人教A版数学选择性必修一)2025年秋季学期讲义第20讲2.4.1圆的标准方程(学生版+教师版).docx
- 北师大版(2024)八年级数学上册课件 3.2 平面直角坐标系 第2课时 点的坐标特征.pptx
- 北师大版(2024)八年级数学上册课件 3.2 平面直角坐标系 第3课时 建立适当的平面直角坐标系.pptx
- 北师大版(2024)八年级数学上册课件 4.3 一次函数的图象 第1课时 正比例函数的图象及性质.pptx
- (人教A版数学选择性必修三)讲义第15讲7.1.1条件概率(学生版+解析).docx
- (人教A版数学选择性必修三)讲义第19讲8.1成对数据的统计相关性(8.1.1变量的相关关系+8.1.2样本相关系数)(学生版+解析).docx
- 北师大版(2024)八年级数学上册课件 5.2 二元一次方程组的解法 第2课时 加减消元法.pptx
- (人教A版数学选择性必修一)2025年秋季学期讲义第01讲1.1.1空间向量及其线性运算(学生版+教师版).docx
- 北师大版(2024)八年级数学上册课件 5.2 二元一次方程组的解法 第1课时 代入消元法.pptx
- 北师大版(2024)八年级数学上册课件 5.3 二元一次方程组的应用 第3课时 二元一次方程组的应用(3).pptx
- 北师大版(2024)八年级数学上册课件 5.4 二元一次方程与一次函数 第2课时 用二元一次方程组确定一次函数表达式.pptx
文档评论(0)