- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
WWW 网络的迅猛增长使得有哪些信誉好的足球投注网站引擎面临了前所未有的挑战,有哪些信誉好的足球投注网站引擎如何
适应这种规模的急剧膨胀,成为一个备受关注的问题。面向主题有哪些信誉好的足球投注网站引擎可以有
选择性的抓取与主题相关的网页。选取的对象是一个或一组事先预定义的主题,
其特征由样本网页标志,而不是关键词。一般性的有哪些信誉好的足球投注网站引擎总是抓取尽量多的网
页以满足所有可能的查询请求;而主题有哪些信誉好的足球投注网站被设计为只抓取与选定主题相关的网
页。这不仅能够大大减少系统对硬件和网络资源的需求,而且还有助于提高抓取
的准确率和有哪些信誉好的足球投注网站结果的更新速度。
本文首先对比通用有哪些信誉好的足球投注网站引擎与主题有哪些信誉好的足球投注网站引擎的区别,总结主题有哪些信誉好的足球投注网站引擎的优
点;然后介绍目前世界上主题有哪些信誉好的足球投注网站引擎技术的发展状况。接着,综述了面向主题
中文有哪些信誉好的足球投注网站引擎的设计,详细介绍涉及该领域的三个核心技术:文档分类技术、中
文处理技术和网页搜集预测技术。对于以上三种技术,我们在简述已知算法的基
础上,都阐述了具体系统的实现方案。其中中文切词问题作为工作的重点,在文
章中有比较详尽的介绍,包括中文处理的背景知识,中文切词软件的基本原理和
中文切词词典的改进。
关键词:www 、通用有哪些信誉好的足球投注网站引擎、面向主题有哪些信誉好的足球投注网站引擎、文档分类算法、网页搜
集预测算法、中文切词
1
目录
摘要………………………………………………………………………………………………1
目录………………………………………………………………………………………………2
第一章 引言 ……………………………………………………………………………………3
第二章 面 向主题中文有哪些信誉好的足球投注网站引擎的设计综述………………………………………………5
第三章 文档 自动分类的主要算法和具体实现……………………………………………7
§3.1 文档分类的主要算法………………………………………………………………8
§3.1.1 支持向量机 (SVM)算法……………………………………………………8
§3.1.2 简单Bayes (NB )算法……………………………………………………8
§3.1.3 LLSF (Linear Least Squares Fit )算法……………………………………9
§3.1.4 KNN (K-Nearest Neighbors )算法…………………………………………9
§2.2 文档分类算法的实现………………………………………………………………10
§3.2. 1 文档的向量表示……………………………………………………………10
§3.2.2 特征集的选取……………………………………………………………11
§3.2.4 计算待分类文档与训练集的相似度………………………………………12
§3.2.5 判断待分类文档所属类别…………………………………………………12
第四章 中文信息处理问题…………………………………………………………………14
§4.1 中文信息处理研究背景……………………………………………………………14
§4. 1.1 中文信息的特点……………………………………………………………14
§4.1.2 中文切词对系统的重要性…………………………………………………14
§4.2 中文切词软件的基本原理…………………………………………………………15
§4.2. 1 字典的格式和数据结构表示………………………………………………15
§4.2.2 具体切词过程………………………………………………………………18
§4.3 对中文切词软件的修改……………………………………………………………22
第五章 网页搜集预测算法设计……………………………………………………………23
§5.1 超文本链的相关研究………………………………………………………………23
§5.2 网页搜集预测功能的设计…………………………………………………………24
第六章 工作总结和对未来的展望…………………………………………………………26
致谢
参考文献
2
第一章
文档评论(0)