乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      轉發(fā) | 如何采用機器學習方法提升數據擬合精度?(一)

       nplaiyanfang 2023-08-30 發(fā)布于福建
      身為常跟混凝土打交道的土木人,根據試驗數據擬合經驗公式簡直就是必修課,沒辦法,混凝土太復雜啦!大概的做法是這樣的,先假設公式的形式,再通過試驗數據回歸分析來確定公式中的未知系數。由于所假設的公式形式可能無法充分反映參數間復雜的非線性關系,試驗參數范圍受限,樣本多樣性有限,經驗公式計算結果往往準確性差、離散性大。相比于經驗模型,機器學習模型具有以下優(yōu)點:

      1. 具有強大的捕捉輸入和輸出變量之間復雜非線性關系的能力;

      2. 可以處理大量輸入變量,避免忽略潛在的重要變量;

      3. 可以考慮試驗樣本的多樣性,從海量數據中深入挖掘信息。

      近年來,機器學習這類非參數模型在數據充分、現象復雜的領域受到了廣泛的認可。


      1.1

      機器學習和人工智能、深度學習的關系

      圖片

      圖 1 機器學習和人工智能、深度學習的關系

      機器學習是人工智能的一個子集,深度學習又是機器學習的一個子集。機器學習與深度學習都是需要大量數據來“喂”的,是大數據技術上的一個應用,同時深度學習還需要更高的運算能力支撐,如 GPU。作為目前最熱的機器學習方法,深度學習在計算機視覺、自然語言處理領域已經取得了非凡的成就。但小伙伴們也應注意到,深度學習模型需要大量的訓練數據才能展現出神奇的效果,對于現實生活中常常遇到的小樣本問題,傳統的機器學習方法就已經可以很好地解決了,沒必要“殺雞用牛刀”,且由于數據量小,深度學習方法的精度不一定比傳統的機器學習方法高。

      傳統的機器學習算法有很多,如普通最小二乘法、Lasso 回歸、嶺回歸、K-最近鄰、支持向量機、決策樹、隨機森林、AdaBoost、XGBoost 等。在機器學習領域,有種說法叫“世上沒有免費的午餐”,就是說,沒有任何一種算法能在每個問題上都取得最好的效果。針對這個問題,學習算法 a 可能更好,而針對那個問題,學習算法 b 可能更好。在脫離實際問題的情況下,空泛地談論哪種算法好毫無意義,要談論算法優(yōu)劣必須針對具體學習問題。


      圖片
      圖 2 “世上沒有免費的午餐”

      1.2

      機器學習建模流程

      閑話少敘,進入正題!

      圖片
      一般來說,機器學習方法的建模流程如下:
      圖片

      圖 3 機器學習模型建模流程

      1. 廣泛收集試驗數據??梢允亲约鹤龅脑囼灒部梢允瞧渌麑W者做的試驗,總之,試驗數據越多越好、數據質量越高越好。
      2. 進行特征工程,為機器學習模型選取合適的輸入特征。據統計,大部分的數據挖掘/算法工程師80%的時間在做特征工程,20%的時間在做算法設計和模型優(yōu)化,可見特征工程的重要性。
      3. 將數據集隨機分為訓練集(80%)和測試集(20%)(當然也可以采用其它比例),訓練集用于訓練機器學習模型,測試集用于評估所訓練的機器學習模型的精度。

      4. 選擇合適的機器學習方法,在訓練集上訓練模型。

      5. 采用網格搜索和十折交叉驗證方法優(yōu)化機器學習模型的超參數。在機器學習模型中,有兩類參數:1)模型參數,需要從數據中學習得到,如線性回歸的加權系數;2)調優(yōu)參數,需要在訓練機器學習模型之前人為設定,稱為超參數(hyper-parameter)。為達到最優(yōu)的模型性能,通常情況下需要對超參數進行調優(yōu)。

      6. 在訓練集上使用最優(yōu)超參數訓練機器學習模型,并通過量化指標(如決定系數 R2、均方根誤差RMSE、平均絕對誤差 MAE 等)評估模型在測試集上的性能。

      7. 解釋機器學習模型的預測結果,驗證機器學習模型的可靠性。機器學習這類非參數模型是一個“黑箱”,不能對潛在的物理或力學機制給出明確的解釋,如果機器學習模型解釋的規(guī)律與力學規(guī)律不符,即使性能再好,也不能用于生產實踐。機器學習模型解釋的方法很多,如 SHAP 方法、部分依賴圖(PDP)等。

      看,機器學習建模流程是不是挺簡單?小伙伴們是不是躍躍欲試了呢,下期我們將以基于試驗數據建立鋼筋混凝土柱箍筋計算模型為例來介紹機器學習的實戰(zhàn),歡迎繼續(xù)關注!





      圖片

      喬保娟

      工學博士

      高級工程師

      SAUSAGE 軟件計算核心負責人,從事建筑結構非線性分析及軟件開發(fā)研究

      肖從真工作室

        本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發(fā)現有害或侵權內容,請點擊一鍵舉報。
        轉藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多