[轉(zhuǎn)]關(guān)于數(shù)據(jù)集與源代碼 UCI數(shù)據(jù)集是一個常用的標(biāo)準(zhǔn)測試數(shù)據(jù)集,下載地址在 ![]() 我的主頁上也有整理好的一些UCI數(shù)據(jù)集: ![]() 在看別人的論文時,別人使用的數(shù)據(jù)集會給出數(shù)據(jù)集的出處或下載地址(除非是很機密的數(shù)據(jù),例如與國家安全有關(guān))。如果你看的論文沒有給出數(shù)據(jù)集的出處,請立即停止看這篇論文,并且停止看刊發(fā)這篇論文的期刊上的所有文章。因為可以斷定這些文章質(zhì)量很差。 關(guān)于源代碼,網(wǎng)上有很多公開源碼的算法包,例如最為著名的Weka,MLC++等。Weka還在不斷的更新其算法,下載地址: ![]() 很多的機器學(xué)習(xí)的經(jīng)典算法都在里面。而且公布源程序,易于修改。 如果作者沒有公布源程序,可以到作者主頁找找,也可以寫信給作者要,一般論文開頭都會有作者的email地址。寫信的時候要注意要很有禮貌,否則作者,尤其是著名學(xué)者,很有可能不會理睬。如果算法簡單,可以自己實現(xiàn)。 關(guān)于論文的下載,如果能夠訪問電子圖書館是最好的,很多學(xué)校都買了IEEE, Elsevier, Kluwer等,上面的期刊都不錯。有一些很好的期刊是免費的,像JAIR和JMLR,分別在: ![]() ![]() 如果能訪問的免費期刊太少,可以到CiteSeer上搜索( ![]() |
|