时间检索读书报告.docxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
时间检索读书报告   读书报告   学生姓名李帆   学号XX20937   指导教师王琳   院系信息科学与技术学院   专业信号与信息处理   一、题目:面向智能交互的图像识别技术综述与展望   二、作者:蒋树强闵巍庆王树徽   蒋树强:博士生导师,XX-今中国科学院计算技术研究所,研究员。是IEEE高级会员,ACM会员,YOCSEF委员,担任十余个学术会议的组织委员会成员和二十余个学术会议的程序委员会成员。研究方向:图像/视频等多媒体信息的分析、理解、监控、检索等技术的研究开发。   闵巍庆:中国科学院自动化研究所模式识别国家重点实验室研究员、博士生导师,中国-新加坡数字媒体研究院执行院长。IEEEFellow和ACMDistinguishedScientist,担任国际刊物ACM/SpringerMultimediaSystemsJournal,InternationalJournalofMultimediaToolsandApplications,JournalofMultimedia和InternationalJournalofMultimediaIntelligenceandSecurity编委,担任国际顶级多媒体会议XXACMMultimediaConference程序委员会主席,担任XX年全国多媒体会议程序委员会主席,担任XX年泛太地区多媒体国际会议(Pacific-RimMultimediaConference)大会主席,担任过多个知名多媒体国际会议的组织委员会和程序委员会成员,并在一些重要的国际多媒体会议上组织了多个专题研讨会。在多媒体分析、计算机视觉、模式识别、图像处理和数字水印等领域发表论文200多篇,获得发明专利11项。   王树徽:1983年生,博士,副研究员。XX年7月毕业于中国科学院计算技术研究所,XX年10月从中国科学院计算所博士后出站。从事多媒体内容分析检索技术、大数据理论与方法、机器学习等方面的研究,已在诸如IEEE顶级汇刊TMM、TKDE、TIP、TCSVT,以及ACMMultimedia、ICCV、CVPR、SIGMOD、VLDB、ICDM,CIKM等多媒体分析,计算机视觉、数据库和数据挖掘领域的顶级期刊和会议上发表和录用学术论文48篇,申请国家专利3项。研究方向:计算机应用技术。   三、当前工作   视觉在人与人交互以及人与自然界的交互过程中起到非常重要的作用,让终端设备具有智能的视觉识别和交互能力是人工智能和计算机技术的核心挑战和远大目标之一。本文从视觉识别、视觉描述和视觉问答3个角度对图像识别技术   进行综述,对基于深度学习的图像识别以及场景分类技术进行了具体介绍,对视觉描述和问答技术的必威体育精装版技术进行了分析和讨论,同时对面向移动终端和机器人的视觉识别和交互应用进行了介绍,最后对该领域的未来研究趋势进行了分析。   四、文章流程   本文将对图像识别与应用技术的必威体育精装版进展进行介绍。在方法上,将首先对基于深度学习的图像识别技术进展进行讨论,主要从物体识别和场景识别2个角度探讨相关技术的特点。ImageNet是必威体育精装版的常用数据集,主要是物体概念的图像,也包括少量场景概念的图像,该数据集是当前不同深度学习模型的训练数据来源,也是算法性能的主要测试场地;而随着SUN397,Places等大规模场景数据集的出现和普及,场景分类技术成为当前图像识别的重要研究问题,在分类方法和模型训练上都有新的推进,本文也将进行介绍。此外,对近一两年来研究颇多的图像描述与问答技术也进行介绍,这是必威体育精装版研究方向。在面向视觉交互的图像识别应用上,将主要对面向移动终端与面向机器人的视觉识别技术进行讨论,同时对基于图像理解的智能交互的不同应用模式进行分析。在本文的最后,将对未来的研究趋势进行展望和讨论。   1、基于深度学习的图像识别技术   自从Krizhevsky等人在ImageNet上训练一个8层的深度模型并在ImageNet竞赛上取得非常好的效果后,卷积神经网络在图像分类与识别领域受到了广泛关注,取得了巨大成功。之后,在很多图像识别的应用场景中,卷积神经网络也都取得了很大的性能改进。卷积神经网络能够逐层学习图像的特征,其中低层是具有普遍性的特征,如图像的边缘、角点、纹理等;高层特征是低层特征的组合,是针对特定任务的有针对性的特征。逐层特征学习模拟了人脑分层处理信息机制,能够直接从原始像素得到图像特征。将卷积神经网络用于图像识别与分类,可以归纳为3种途径:1)直接在待分类的数据集上训练一个深层的网络。2)在训练好的网络上直接提取特征。3)在目标数据集上对现有深度模型进行“精细化”调整。   随着网络层次的增加,CNN的性能有很大提升,深度学习模型的架构基本没有什么变化,可以通过1)增加网络层数学习更为抽象的表示

文档评论(0)

gz2018gz + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档