- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC * WIR WIF WIC Fisher鉴别 以二类学习问题为例,令X和Y分别表示一类向量的集合。向量的元素可以是令向量长度归一的实数 Fisher鉴别在寻找一种映射α*,它使得X和Y两个数据集被映射到二者质心间的距离相对集合内数据的展开幅度达到最大的方向上,即 Fisher鉴别指数 Fisher鉴别是一种变换,具有破坏特征稀疏性的特点 将每个词t都看作为一个候选的方向,即令 αt = (0,…,1,…,0)T,即1只在词t的位置出现,定义t的Fisher鉴别指数为 由于αt的特殊形式,上式可简化为 对于多类问题 排除算法 排除算法从全部词特征集T开始逐步对“无用”特征进行排除,直至获得一个满意的特征子集F 排除算法的核心思想是尽量保持P(C?|T)与P(C|F)的相似性,因为分类与聚类可以基于类(C)的特征条件概率分布来设计算法 P(C?|T)与P(C|F)的相似性可用KL距离来度量 如果P(P=p|Q=q,R=r) = P(P=p|R=r),则称P在R条件下独立于Q 排除算法的核心是寻找类与特征之间的条件独立关系 排除算法复杂度高,优点是考虑了特征之间的相关性 特征维数确认 Validation: 取多少维特征最佳 普通确认 训练数据被分为两部分,分别用于特征排序和测试 交叉确认: 留一法(Leave-One-Out) 训练数据较少时使用 每次留出一个样本用于测试 特征变换 通过数学变换对原始特征进行不同的线性或非线性组合,从新产生的组合中挑选好特征 本质是不同域或空间之间的映射 目的是找到能够用更低维度“紧凑”地表达文档数据的空间,同时,在新空间中,文档之间仍然保持在原空间的亲疏关系 只要能起到特征降维和保持文档之间原有距离的效果的各种数学变换都可应用于文档特征变换 Fourier、Wavelet、PCA、LDA、流形分析 SOM和LSI具有典型意义 SOM (Self-Organizing Map) 输入数据并联地馈入到一维或二维排列的神经元阵列,将多维连续数据空间映射到一维或二维离散数据空间 神经元间的拓扑距离代表使其兴奋的数据在原空间中的亲疏关系,使同一神经元兴奋的数据被认为是一类 工作过程分为竞争、协作和权值调整三个阶段 一个作用是将检索回来的文档的相似性在二维平面上进行可视化 LSI(Latent Semantic Index) 是奇异值分解SVD在文本特征矩阵中应用的产物 每个LSI都是所有原始特征(词)的线性组合,因而具有潜在的语义 对于由特征词集合T所描述的文档集合D,令A={aij}为词-文档矩阵,i = 1,…,|T|, j = 1,…|D| A中的每一列对应一个文档的VSM 矩阵A的秩远小于min{|T|, |D|},可用SVD进行紧致表达 LSI的意义 (ATA)|D|×|D|的元素可被解释为两个文档之间的相似性 (AAT)|T|×|T|的元素可被解释为两个词之间的相似性 A的SVD使上述两个矩阵变为(VΣ2VT)|D|×|D|和(UΣ2UT)|T|×|T| V的第d行是文档d的精炼表示,U的第
您可能关注的文档
- C++程序设计(第2版)吴乃陵 -C++程序设计笔试(下)样卷.doc
- C++程序设计(第2版)吴乃陵 -C++程序设计教学改革幻灯片.ppt
- C++程序设计(第2版)吴乃陵 -C++第八章习题解答.doc
- C++程序设计(第2版)吴乃陵 -C++第二章习题解答.doc
- C++程序设计(第2版)吴乃陵 -C++第六章习题解答.doc
- C++程序设计(第2版)吴乃陵 -C++第七章习题解答.doc
- C++程序设计(第2版)吴乃陵 -C++第十一章习题解答.doc
- C++程序设计(第2版)吴乃陵 -C++第四章习题解答.doc
- C++程序设计(第2版)吴乃陵 -C++第五章习题解答.doc
- C++程序设计(第2版)吴乃陵 -C++教学日历.doc
- web有哪些信誉好的足球投注网站 郭军 chapter4.ppt
- web有哪些信誉好的足球投注网站 郭军 chapter3.ppt
- web有哪些信誉好的足球投注网站 郭军 chapter5.ppt
- web有哪些信誉好的足球投注网站 郭军 chapter6.ppt
- web有哪些信誉好的足球投注网站 郭军 chapter7.ppt
- ZTE Communications期刊Event Normalization Through Dynamic Log Format Detection.pdf
- ZTE Communications期刊MAC Layer Resource Allocation for Wireless Body Area Networks.pdf
- ZTE Communications期刊Prototype for Integrating Internet of Things and Emergency Service in an IP Multimedia Subsystem for Wireless Body Area Networks.pdf
- ZTE Communications期刊Reliability of NFV Using COTS Hardware.pdf
- ZTE Communications期刊Selective ClusterBased Temperature Monitoring System for Homogeneous Wireless Sensor Networks.pdf
文档评论(0)