- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多源网络数据的学者重名问题研究
相关实验 开发环境 数据库:MongoDB 编程语言:Python 数据集:Pandasearch数据集 相关实验 利用论文单位信息分类 相关实验 利用论文引用信息归并 论文原文 相关实验 利用论文引用信息归并 原文转换 Adobe Acrobat Professional:速度慢、精度较高、早期文献转换空白 Apache Tika:速度快、精度略低、转换无空白 引用提取 阈值确定 相关实验 训练AdaBoost分类器 训练集与测试集 训练集:65个姓名共787个论文-论文组 测试集:23个姓名共246个论文-论文组 训练错误率 相关实验 ROC曲线 相关实验 算法补充 再次利用合作者信息 结果归并 遍历结果集中的每个论文-论文组: 若论文-论文组的结果为-1,则跳到下一个论文-论文组,否则进行第3步; 在结果集1 中查找论文-论文组的两篇论文,若在同一document 中,则跳到下一个论文-论文组;否则,两个document 合并。 实验效果 测试集正确率:95.93%(论文-论文组) 相关实验 结果对比 决策树:错误率过高 KNN:训练集不均衡 网站应用 论文-姓名 论文-Author_id 修正:反馈机制 目 录 研究背景 相关工作 分层学者重名消歧算法 相关实验 总结与展望 相关实验 研究回顾 针对多源网络数据提出分层学者重名消歧算法 将该算法应用到Pandasearch学术有哪些信誉好的足球投注网站网站 未来工作展望 训练集获取——Active Learning 处理速度——内存数据库 特征选取——更加深入 论文原文较少——爬取后加入 论文 已录取论文: Feiran Huang, Jia Li, Jiaheng Lu, Tok Wang Ling, Zhaoan Dong. “PandaSearch: a Fine-grained Academic SearchEngine for Research Documents.” ICDE, 2015. 已投稿论文 李佳,陆嘉恒.“基于多源网络数据的学者重名问题研究.”NDBC, 2015. 研究生阶段工作 软件著作权 软件名称:面向学术的精准有哪些信誉好的足球投注网站系统软件[简称:CS Search] 著作权人:陆嘉恒;顾向南;夏成银;李佳;裴嘉兴;蔡晓华;李德阳;刘钰;董兆安 登记号:2014SR049788 参与项目情况 863计划课题“开放环境下海量 Web 数据抓取、集成、分析和管理系统平台与应用”:参与学术有哪些信誉好的足球投注网站网站(Pandasearch)的开发、参与项目文档、简报的制作以及各项目组的协调工作、参与知识格提取、负责学者重名消歧的研究 感谢各位老师的指导纠正! 基于多源网络数据的学者重名问题研究 答 辩 人 : 李佳 指 导 老 师: 陆嘉恒 教授 专 业: 计算机软件与理论 2015/05/19 目 录 研究背景 相关工作 分层学者重名消歧算法 相关实验 总结与展望 研究背景 学术信息库的兴起 学者重名问题的影响 有哪些信誉好的足球投注网站结果不准确 影响文献计量和成果统计 研究背景 学者重名问题定义 学者同人不同名(synonyms) 学者同名不同人(polysems) 多源网络数据定义 数据来自于多个网站 通过网络爬取获得 多源网络数据的特点 格式各异、错误较多、内容缺失较多 目 录 研究背景 相关工作 分层学者重名消歧算法 相关实验 总结与展望 相关工作 学者重名问题处理方法分类 学者重名 问题 手动处理 自动处理 作者归组 作者分配 作者归组:利用已知参数构造相似度方程,决定是否将相应作者进行聚类 An unsupervised heuristic-based hierarchical method for name disambiguation in bibliographic citations A probabilistic similarity metric for Medline records: A model for author name disambiguation 作者分配:构建代表作者的模型,利用模型,将待确定作者直接分配到已知作者模型中去 OnCU system:ontology-based category utility approach for author name disambiguation Cost-effective on-demand associative author name disambiguation 相关工作 研究现状分析 多针对特定数据集(MEDLINE、DBLP等) 无应对多源网络数据特点的算法 运用的信息越多,精度越准确 算法思
您可能关注的文档
最近下载
- 心理测评399.doc VIP
- 男科的现状与发展战略.pptx VIP
- BOSS效果器ME-70中文说明书.pdf VIP
- 2025年工商管理硕士(MBA)联考综合能力真题及答案.docx VIP
- 5.3 认识直角(课件)2025-2026学年度北师大版数学三年级上册.pptx VIP
- 《大学语文》怎样读懂一首诗(1)-教学课件.ppt
- 幼儿照护中级核心技能考评标准.pdf VIP
- 老视框架眼镜验配专家共识(2025).docx VIP
- 基层医疗卫生机构常见新生儿疾病诊疗指南:新生儿复苏(2025年).pptx VIP
- 《基于STM32单片机的LED室内照明智能调节系统设计(附PCB图和原理图)》11000字.docx
文档评论(0)