- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Machine Learning讲座笔记Written by刘佳倩Instructed by 夏粉演讲者:浙江大学 何晓飞演讲时间: 2012-02-14 目录理论知识部分2分类问题2线性可分模型2线性不可分模型4回归问题6分类问题V.S.回归问题6学习模型7流形Manifold9降维PCA9ISOMAP9流形正则化9实际应用部分10图像有哪些信誉好的足球投注网站Image Search10基本知识介绍10图像有哪些信誉好的足球投注网站的步骤10近似有哪些信誉好的足球投注网站10排序学习Learning to Rank11背景描述11模型设计11矩阵分解和推荐Matrix Factorization and Recommendation12基本概念12实际例子12解决方法12注:本文所有插图,除特别注明,均为作者画图板所做,存在一定程度上的比例不调,请多包涵。理论知识部分分类问题线性可分模型如果用一个线性函数可以将两类样本完全分开,就称这些样本是“线性可分”的。以二维为例,假设training data是二维的,分为两类:红和蓝。则图1中的红点和蓝点是线性可分的。(图1)可行划分如何找到一个可行划分呢?有一种方法叫感知机(Perceptron),下面是wikipedia上对感知机的介绍:(/wiki/%E6%84%9F%E7%9F%A5%E5%99%A8源地址)我们首先定义一些变量:x(j)?表示n维输入向量中的第j项w(j)?表示权重向量的第j项f(x)?表示神经元接受输入x产生的输出α是一个常数,符合?(接受率)更进一步,为了简便我们假定偏置量b等于0。因为一个额外的维n?+ 1维,可以用x(n?+ 1) = 1的形式加到输入向量,这样我们就可以用w(n?+ 1)代替偏置量。感知器的学习通过对所有训练实例进行多次的迭代进行更新的方式来建模。令表示一个有m个训练实例的训练集。每次迭代权重向量以如下方式更新:对于每个中的每个(x,y)对,注意这意味着,仅当针对给定训练实例(x,y)产生的输出值f(x)与预期的输出值y不同时,权重向量才会发生改变。如果存在一个正的常数γ和权重向量w,对所有的i满足, 训练集Dm就被叫被做/w/index.php?title=%E7%BA%BF%E6%80%A7%E5%88%86%E9%9A%94action=editredlink=1 \o 线性分隔线性分隔的。Novikoff (1962)证明如果/w/index.php?title=%E8%AE%AD%E7%BB%83%E9%9B%86action=editredlink=1 \o 训练集训练集是线性分隔的,那么感知器算法可以在有限次迭代后收敛,错误的数量由限定,其中R为输入向量的最大平均值。然而,如果训练集不是线性分隔的,那么这个算法则不能确保会收敛。最优划分不同划分对于未知数据会有不同的预测结果。那么如何找到一条效果好的划分呢?(当然我们这里说的效果好只是针对训练数据而言╮(╯▽╰)╭……)图1中的点可能有多种划分方法,见图2:(图2)其中,绿色直线到最近点的距离最大,我们认为它是一条效果很好的划分。注意到,所有可行划分中,存在这样一对平行线,它们距离最远,图2中的绿色直线就位于这两条平行线中间(平分)位置。求解过程中,只需要枚举所有可能的平行线,取距离最远的那一对,即可得出最优划分。为了使平行线距离尽可能大,我们认为这两条平行线一定是夹在三个点之间的,而我们不必枚举所有训练点集,只需要枚举落在包围壳(图3黄色部分)上的点。(图3)最优划分只与包围壳上的部分点(平行线上的点)有关,这些点称为支持向量,有一种算法叫Hard Margin SVM(硬性边缘支持向量机)算法,可以求出这个较优划分。有兴趣的同学可以看看/wiki/Support_vector_machine \l Linear_SVMwikipedia。线性不可分模型图4中的两种颜色的点是无法线性划分的。(图4)模型转化可以将训练数据映射至高维空间,把线性不可分转化为高维空间的线性可分。比如,将图4中的点,以映射到二维空间,它们就线性可分了,如图5:(图5)核函数Kernel Function先来看一下核函数的简介。再来看夏粉对核函数的评价:核函数是机器学习里一个里程碑式的进步,它简化了问题的认识,将核函数生产的空间定义为再生核希尔伯特空间, 比如我们常见的欧式空间就是它的一个特例。有了再生核希尔伯特空间后,算法设计者只需要关心在这个空间里设计线性算法即可,对于算法如何实现其非线性形式只需定义不同的核函数即可。再生核希尔伯特空间完美地解释了核函数,并由此产生了机器学习中核方法这个方向,由此将学习方法与假设空间独立开,使得在线性空间中的任何方法可以无障碍地推广到非线性空间。不过核函数有一个缺点:线性可分的最低维数未知,有可能是无限维。回归问题分类
您可能关注的文档
- Avyftve初级日语学习之动词て形.doc
- A营销商务谈判实训计划指导书一.doc
- AUTOCAD降价促销,中望CAD应势亮剑.doc
- A适合三四年级学生阅读的课外书.doc
- BZYBZY型移动式旋臂起重机说明书.doc
- BUnitFindingyourwayStudyskills.doc
- AutoCAD的基础知识和基本操作方法.doc
- a静】《第二课画楼梯》教学设计及反思.doc
- CAD中的图纸如何转成JPG格式的呢.doc
- CFG桩复合地基施工方法及适用范围.doc
- 301115_2024_#ESG_联检科技_2024年度环境、社会和治理(ESG)报告_2025-04-29.pdf
- 300308_2024_#ESG_中际旭创_2024年环境、社会及公司治理(ESG)报告_2025-04-21.pdf
- 想生科技产品注册公告及所需文件상생기술제품_등록_공고문_및_제출_서류.pdf
- 300760_2024_#SD_迈瑞医疗_2024年度可持续发展报告_2025-04-29.pdf
- 300870_2024_#SD_欧陆通_欧陆通2024年可持续发展报告_2025-04-22.pdf
- 301369_2024_#ESG_联动科技_2024年度环境、社会与公司治理(ESG)报告_2025-04-18.pdf
- 300937_2024_#SD_药易购_2024年度可持续发展报告_2025-04-25.pdf
- 300621_2024_#ESG_维业股份_维业股份:2024年度环境、社会和公司治理(ESG)报告_2025-04-19.pdf
- 300428_2024_#SD_立中集团_立中四通轻合金集团股份有限公司2024年度可持续发展报告-中文版_2025-04-21.pdf
- 301167_2024_#ESG_建研设计_2024年度环境、社会及公司治理(ESG)报告_2025-04-04.pdf
最近下载
- 纪律处分条例解读违反政治纪律案例警示党课PPT.pptx VIP
- 既有线区间光缆敷设专项施工方案(1号线).docx VIP
- 招标代理服务服务方案.doc VIP
- 《信息通信网络线务员》(综合布线装维员)理论考试题库资料大全-中(多选、判断题).pdf VIP
- 北京地方标准建筑消防设施维修保养规程DB11T 1620-2019 .pdf VIP
- 2025年证券从业资格考试《金融市场基础知识》模拟卷及答案.docx VIP
- 高铁路基工程施工方案(3篇).docx
- MD800系列多机传动变频器功能手册.pdf
- 消化道溃疡课件.ppt VIP
- 2025至2030服务器行业市场深度研究与战略咨询分析报告.docx VIP
文档评论(0)