短视频参与度预测的大规模多模态模型.pdfVIP

短视频参与度预测的大规模多模态模型.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

短视频参与度预测的大规模多模态模型

∗∗†

WeiSun,LinhanCao,YuqinCao,WeixiaZhang,WenWen,

KaiweiZhang,ZijianChen,FangfangLu,XiongkuoMin,GuangtaoZhai

EastChinaNormalUniversity,ShanghaiJiaoTongUniversity

CityUniversityofHongKong,ShanghaiUniversityofElectricPower

Abstract1.介绍

短视频平台如TikTok、YouTubeShorts和

本用户生成内容(UGC)在短视频平台上的迅速增长,使Snapchat的广泛流行导致用户生成内容(UGC)出现

译得视频参与度预测对于优化推荐系统和指导内容创作了前所未有的激增。每天有数百万条UGC视频上传到

中变得越来越重要。然而,由于语义内容、视觉质量、音这些平台上,准确预测视频参与度(即,估计视频吸引

2频特征和用户背景等因素之间复杂的相互作用,这一并保持观众注意力的可能性)已成为优化内容推荐、提

v任务仍然具有挑战性。以往的研究利用了来自不同模高用户留存率以及指导内容创作的关键。

6

1态的各种类型的特征,如视觉质量、语义内容、背景声视频参与度通常使用诸如观看次数、平均观看时

5音等,但往往难以有效地建模它们之间的跨特征和跨

2间、平均观看百分比和点赞率等指标来衡量[2]。然而,

0.模态交互。在这项工作中,我们实证研究了大规模多模这些指标可能存在偏差;例如,相比短片,长片完全被

8态模型(LMMs)在视频参与度预测方面的潜力。我们观看的可能性较低。为了解决这样的限制,一些研究提

0采用了两种代表性的LMMs:VideoLLaMA2,该模型

5出了更稳健的参与度指标。吴等。[55]引入了一种相对

2集成了音频、视觉和语言模态;以及Qwen2.5-VL,仅参与度指标,通过建模具有相似时长视频之间的相互

:

v建模视觉和语言模态。具体而言,VideoLLaMA2联合关系和排序顺序来考虑不同的视频时长。展等人。[60]

i

x处理关键视频帧、基于文本的元数据和背景声音,而建议为不同时长的视频训练单独的模型以减轻与时长

r

aQwen2.5-VL仅利用关键视频帧和基于文本的元数据。相关的偏差。李等。[21]提出了两种替代指标:标准化

在SnapUGC数据集上进行训练后,这两个模型相对于

平均观看百分比(NAWP),该指标对视频的平均观看

最先进的基线展示了竞争力的表现,彰显了LMMs在

百分比进行了标准化,以及参与延续率(ECR),该指

参与度预测中的有效性。值得注意的是,VideoLLaMA2

文档评论(0)

专业Latex文档翻译 + 关注
实名认证
服务提供商

专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。

1亿VIP精品文档

相关文档