- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
MoViAD:一个用于视觉异常检测的模块化库
ManuelBaruscoFrancescoBorsatti
UniversityofPadova,ItalyUniversityofPadova,Italy
manuel.barusco@phd.unipd.itfrancesco.borsatti.1@phd.unipd.it
AriannaStropeniDavideDallePezze
UniversityofPadova,ItalyUniversityofPadova,Italy
arianna.stropeni@studenti.unipd.itdavide.dallepezze@unipd.it
本GianAntonioSusto
UniversityofPadova,Italy
译gianantonio.susto@unipd.it
中
2
v
9
4Abstract
0
2VisualAnomalyDetection(VAD)是机器学习中一个关键领域,专注于识别图像中的异常模
1
.式,通常面临异常数据稀缺和需要无监督训练的挑战。为了加速该领域的研究和部署,我们
7
0引入了MoViAD!(MoViAD!),这是一个全面且高度模块化的库,旨在提供快速轻松访问最
5先进的VAD模型、训练器、数据集和VAD工具的功能。MoViAD!支持广泛的场景,包括
2持续学习、半监督学习、少量样本学习、噪声环境等。此外,它通过专门的Edge和Internet
:
vofThings(IoT)设置解决了实际部署挑战,提供了优化模型和骨干网络,并配备了量化和压
i
x缩工具以实现高效的设备执行和分布式推理。运动视觉注意力检测器集成了一部分骨干网
r
a络、鲁棒的VAD评估指标(像素级和图像级)以及用于效率分析的实用配置文件工具。该
库旨在快速轻松地部署,使机器学习工程师能够轻松使用它进行特定设置下的自定义模型、
数据集和骨干网络的应用。同时,它为研究人员提供了开发和实验新方法所需的灵活性和可
扩展性。
Keywords可视化异常检测深度学习库
1介绍
可视化异常检测(VAD)已成为机器学习社区中的一个重要研究领域,旨在区分数据集中的正常图像和异常
图像,并定位图像中导致异常的具体像素。传统的监督学习方法在这种情况下往往表现不佳,原因是代表异
常类别的样本稀缺且多变。为克服这一限制,许多技术设计为仅在正常数据上进行训练,学习其潜在分布并
识别从该分布的偏离作为潜在异常。VAD问题的本质使其在许多现实世界领域中极具实用性和相关性,如自
动工业检测、医疗诊断、机器人学等[1][2][3]。
在过去的几年里,许多研究集中于VAD,特别是针对具有挑战性的无监督场景,取得了优异的结果。然而,
在现实世界的情景中,VAD可能在一个与文献中所研究的不同设置下进行评估。
例如,一些研究开始在经典无监督设置之外处理VAD问题,考虑单个模型需要处理多个类别(多类)[4]或
模型需要适应新项目(连续)[5][6][7]的情况。同样,一些近期的研究开始解决在资源受限设备(边缘或物
联网场景)上部署的需求[8][9],而另一些研究则考虑了正常类别中样本数量为零或很少的情况(零样本和
少样本设置)[10][11]。
因此,为了使研究更容易,提供快速便捷的访问这些模型的方式,并更好地在所有这些异常检测设置
您可能关注的文档
- 用于失眠脑模建的图卷积神经网络-计算机科学-大脑网络-图卷积神经网络-失眠.pdf
- 递归卡尔曼网络:分析由卡尔曼滤波器引导的循环神经网络的泛化能力-计算机科学-卡尔曼滤波器-循环神经网络-机器学习.pdf
- 统一听者评分标准:语音质量评估和连续语音情感识别的比较学习框架-计算机科学-语音识别-语音质量评估-听者建模.pdf
- 心理意象能否提升人工智能系统的思维能力?-计算机科学-大语言模型-机器思维-心理图像-推理.pdf
- Dr.Copilot:一个优化多智能体提示以改善罗马尼亚患者与医生沟通的助手-计算机科学-大语言模型-远程医疗.pdf
- 面向域的小型语言模型在结构化税法预测中的应用-计算机科学-机器学习-编码器-解码器-税法预测.pdf
- 从衣橱到画布:衣橱多联画 LoRA 用于分部可控的人体图像生成-计算机科学-人工智能-扩散模型-图像生成.pdf
- GreenCrossingAI: 用于环境科学研究团体的相机陷阱/计算机视觉管道-计算机科学-人工智能-环境科学.pdf
- 2025辽宁省能源控股集团所属抚矿集团招聘76人笔试参考题库附带答案详解.pdf
- 2024陕西延长石油集团华特新材料股份有限公司社会招聘8人笔试参考题库附带答案详解.pdf
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)