笨蛋也可以用的ibsvm.PDF

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
笨蛋也可以用的ibsvm

笨蛋也可以用的libsvm by pavement@.tw 主要參考: piaip 的 (lib)SVM 簡易入門 /~piaip/svm/svm_tutorial.html A Practical Guide to Support Vector Classification .tw/~cjlin/papers/guide/guide.pdf 前言 : 因為我微積分很爛,libsvm 的原理都聽不懂,可是我還是想用libsvm ,怎麼辦? 還好林智仁老師把libsvm 包得很好用,還寫了很好的tutorial ,piaip 大帥哥似乎 寫了一篇中英對照版的guide ,所以我有點不知道要寫什麼。還是把自己執行的 過程貼一貼好了。 準備工作 : 這篇假設使用的平台是Windows XP ,從命令列執行。先把一些需要的東西裝好, 我們總共需要三個東西:libsvm, python, gnuplot 。 Libsvm : 到.tw/~cjlin/libsvm/ 下載libsvm ,然後解壓縮就好了,這邊 假設解到C槽。 Python : 到/download/ 下載完直接安裝就好了。 Gnuplot : 下載/pub/gnuplot/gp400win32.zip 解壓縮到c:\tmp 這樣就準備好了。 使用說明 : 到C:\libsvm-2.82\windows 下面看看,需要的功能大概就這幾個: Svmtrain Svmpredict Svmscale Svmtoy 先從svmtrain 說起,這個指令可以將一組training data 做成一個model ,最簡單 的用法就是不加參數,直接下指令: C:\libsvm-2.82\windowssvmtrain.exe tdata 意思是以tdata 這個檔案當作training data ,做出一個model ,並輸出成tdata.model 這個檔案。若是用圖形來觀察也許會比較清楚,這時候就可以用svmtoy 看看結 果,執行 C:\libsvm-2.82\windowssvmtoy.exe 應該會跳一個小視窗出來 圖一: 用滑鼠左鍵灑點,”Change”換顏色,可以做出下面的圖二。 圖二: 按下”Run”就會跑出以下的圖。 圖三: 可以發現原先三種顏色的點被分區了,這邊所有的點就是我們的training data , 而model 記錄的就是點的分區狀況。把training data 存起來,再用文字編輯器打 開看看,格式長的像這樣: 1 1:0.386000 2:0.902000 1 1:0.602000 2:0.862000 1 1:0.310000 2:0.792000 1 1:0.302000 2:0.672000 2 1:0.568000 2:0.668000 2 1:0.764000 2:0.524000 2 1:0.514000 2:0.658000 …… 2 1:0.890000 2:0.846000 2 1:0.928000 2:0.684000 2 1:0.650000 2:0.908000 2 1:0.540000 2:0.956000 3 1:0.610000 2:0.458000 3 1:0.780000 2:0.354000 3 1:0.828000 2:0.438000 3 1:0.938000 2:0.368000 3 1:0.898000 2:0.236000 3 1:0.648000 2:0.192000 3 1:0.736000 2:0.126000 挑其中一行來看 3 1: 0.736000 2: 0.126000 冒號的前後分別代表feature 的編號及數值,即,第一個feature 的值為0.736 ,第 二個feature 的值為0.126 。開頭的3 代表這個點屬於第三個分類。從圖上看來, 兩個feature 分別為X 軸及Y 軸,而分類代表顏色。換句話說,座標在(0.736, 0.126) 的點是黃色。做出來的model 可以當作圖上的顏色分區。有了分區後,隨便指定 一個座標,就可以得到對應的顏色了。所以一個好的model ,應該要切得很乾淨, 黃色區域最好不要出現紫色的點。從這裡看來圖三切的有點差,改一下參數就可 以切的好很多。例如參數改成 ”-t 2 –c 100000” ,切出圖四: 圖四: 所以要切的好,參數就要下的好。還好林智仁老師有寫好的tool 幫我們試參數, 不用自己手動試啦。首先,到C:\libsvm-2.82\tools 底下

文档评论(0)

wyw118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档