由于最近手頭項(xiàng)目需要,我查閱了Python相關(guān)的機(jī)器學(xué)習(xí)庫(kù)。我將不斷地更新本貼,從而詳細(xì)說(shuō)明各個(gè)庫(kù)的優(yōu)劣。 一、前提 在Pthon下做機(jī)器學(xué)習(xí),需要科學(xué)計(jì)算包和繪圖庫(kù)的支持,科學(xué)計(jì)算則是NumPy或SciPy,似乎NumPy更流行些。畫圖工具包則必定為matplotlib。這些都是開源、免費(fèi)使用的,選擇這些庫(kù)主要的原因是做線性代數(shù)中的矩陣計(jì)算極為便利,而且效率比自己開發(fā)高的多。 二、機(jī)器學(xué)習(xí)庫(kù) (1)scikit-learn [http:///] Python下做機(jī)器學(xué)習(xí),首推scikit-learn。該項(xiàng)目文檔齊全、講解清晰,功能齊備,使用方便,而且社區(qū)活躍。 ![]() (2)Orange [http://orange./] 機(jī)器學(xué)習(xí)是其的功能之一,主要還是側(cè)重?cái)?shù)據(jù)挖掘,可以用可視化語(yǔ)言或Python進(jìn)行操作,擁有機(jī)器學(xué)習(xí)組件,還具有生物信息學(xué)以及文本挖掘的插件。 ![]() (3)shogun [http:///] shogun,非日本的老外弄的一個(gè)機(jī)器學(xué)習(xí)庫(kù),還專門配了一個(gè)我們能看懂的日文名“將軍”(是日本幕府時(shí)代的將軍)。文檔齊全,開發(fā)活躍,更新快,運(yùn)算速度也很快。主攻大尺度的核函數(shù),尤其是大尺度核函數(shù)下的SVM。具有很多SVM的高級(jí)用法,比如多核配用等。支持Python、R、C++、Matlab等語(yǔ)言。 ![]() (4)其它 A.pyml(a python module for machine learning,支持svm/knn/k-means==) http://mlpy./ B.milk(python的機(jī)器學(xué)習(xí)工具包,主要是針對(duì)監(jiān)督學(xué)習(xí),包括svm/knn/決策樹) http://pypi./pypi/milk/ 本文參考了oschina.net及http://www.cnblogs.com/wuren/archive/2013/03/27/2985352.html |
|
來(lái)自: 哆啦A夢(mèng) 你好 > 《python》