- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
胶囊-卷积康:一种医疗图像分类的混合神经网络方法∗
112
LauraPituková,PeterSinčák,andLászlóJózsefKovács
1DepartmentofCyberneticsandArtificialIntelligence,TechnicalUniversityofKošice
2InstituteofInformationScience,UniversityofMiskolc
摘要
本本研究对四种神经网络架构进行了全面比较:卷积神经网络、胶囊网络、卷积科莫洛夫–阿
译诺德网络和新提出的胶囊-卷积科莫洛夫–阿诺德网络。所提出的胶囊-卷积科莫洛夫–阿诺德
中(Capsule-ConvKAN)架构结合了胶囊网络的动态路由和空间层次能力以及卷积科莫洛夫–阿
诺德网络灵活且可解释的功能近似能力。这种新颖的混合模型旨在改进特征表示和分类准确性,
1
v特别是在具有挑战性的现实世界生物医学图像数据中。这些架构在一个组织病理学图像数据集
7上进行了评估,在此数据集中,胶囊-卷积科莫洛夫–阿诺德(Capsule-ConvKAN)实现了最高
1
4的分类性能,准确率为91.21%。结果展示了新引入的胶囊-卷积科莫洛夫–阿诺德网络在捕捉空
6间模式、管理复杂特征以及解决传统卷积模型在医学图像分类中的局限性方面的潜力。
0
.
7
01介绍
5
2
:
v深度学习的迅速发展推动了图像识别、特征提取和模式分析等领域中新型神经网络架构的创
i
x建。科莫戈罗夫-阿诺德网络(KAN)因其在函数逼近方面的强大理论基础而受到关注,而卷积神
r
a经网络(CNN)则由于其捕捉空间层次结构的能力长期主导视觉任务。将这些理念结合起来产生了
卷积科莫戈罗夫-阿诺德网络(ConvKAN),它结合了卷积特征提取器与类似KAN样式的样条激活
函数。
胶囊添加了额外的结构层:胶囊网络(CapsNet)引入了动态路由和显式姿态向量,使模型能
够保留部分与整体的关系并处理视角变化。将胶囊集成到ConvKAN中产生胶囊-卷积Kolmogorov-
Arnold网络(Capsule-ConvKAN)——据我们所知,这种混合方法尚未得到系统研究。本工作通
过比较在图像分析任务上的性能、效率和鲁棒性来填补这一空白。
柯尔莫哥洛夫-阿诺德表示定理(第2.1节)支撑了KAN的平滑、可解释的功能块,而卷积层
仍然是空间特征提取的主要工具。通过融合CNN和KAN组件,ConvKAN继承了表达能力和可
解释性;胶囊机制的添加进一步增强了模型捕捉分层空间信息的能力。因此,我们研究Capsule-
ConvKAN是否可以超越其纯卷积和基于样条曲线的前辈,在具有挑战性的现实世界生物医学图像
上表现更优。
∗Preprintversion.AcceptedtoIEEESMC2025.
刘等人[?]所做的基础工作将KANs介绍为一种新型神经架构,用可学习的样条函数替换了传
统的权重。这种方法使得灵活性和可解释性更强,同时与传统多层感知器相比提高了准确性并减少
了参数数量。
在此概念的基础上,Drokin[?]提出了Kolmogorov-Arnold卷积的设计原则和实证研究,进一
步推进了在计算机视觉任务中对这种混合方法的理解。作者提出了ConvKAN,将KAN层融入到
CNNs中。他们的架构在MNIST、CIFAR-10/100、TinyImageNet、ImageNet1k和HAM10000等
标准数据集上展示了增强的鲁棒性、可解释性和分类性能。
罗等人将[?]应用于医学成像领域,具体用于基于MRI扫描的脑肿瘤分类。他们的研究将KA
文档评论(0)