1.1 機器學習和人工智能、深度學習的關系 機器學習是人工智能的一個子集,深度學習又是機器學習的一個子集。機器學習與深度學習都是需要大量數據來“喂”的,是大數據技術上的一個應用,同時深度學習還需要更高的運算能力支撐,如 GPU。作為目前最熱的機器學習方法,深度學習在計算機視覺、自然語言處理領域已經取得了非凡的成就。但小伙伴們也應注意到,深度學習模型需要大量的訓練數據才能展現出神奇的效果,對于現實生活中常常遇到的小樣本問題,傳統的機器學習方法就已經可以很好地解決了,沒必要“殺雞用牛刀”,且由于數據量小,深度學習方法的精度不一定比傳統的機器學習方法高。 傳統的機器學習算法有很多,如普通最小二乘法、Lasso 回歸、嶺回歸、K-最近鄰、支持向量機、決策樹、隨機森林、AdaBoost、XGBoost 等。在機器學習領域,有種說法叫“世上沒有免費的午餐”,就是說,沒有任何一種算法能在每個問題上都取得最好的效果。針對這個問題,學習算法 a 可能更好,而針對那個問題,學習算法 b 可能更好。在脫離實際問題的情況下,空泛地談論哪種算法好毫無意義,要談論算法優(yōu)劣必須針對具體學習問題。 ![]() 1.2 機器學習建模流程 閑話少敘,進入正題! ![]() ![]() 圖 3 機器學習模型建模流程 4. 選擇合適的機器學習方法,在訓練集上訓練模型。 5. 采用網格搜索和十折交叉驗證方法優(yōu)化機器學習模型的超參數。在機器學習模型中,有兩類參數:1)模型參數,需要從數據中學習得到,如線性回歸的加權系數;2)調優(yōu)參數,需要在訓練機器學習模型之前人為設定,稱為超參數(hyper-parameter)。為達到最優(yōu)的模型性能,通常情況下需要對超參數進行調優(yōu)。 7. 解釋機器學習模型的預測結果,驗證機器學習模型的可靠性。機器學習這類非參數模型是一個“黑箱”,不能對潛在的物理或力學機制給出明確的解釋,如果機器學習模型解釋的規(guī)律與力學規(guī)律不符,即使性能再好,也不能用于生產實踐。機器學習模型解釋的方法很多,如 SHAP 方法、部分依賴圖(PDP)等。
![]() 喬保娟 工學博士 高級工程師 SAUSAGE 軟件計算核心負責人,從事建筑結構非線性分析及軟件開發(fā)研究 肖從真工作室 |
|
來自: nplaiyanfang > 《14-SAUSG》