哈嘍,【ML 新手村】的小伙伴們! 在上一篇,我們理解了機(jī)器學(xué)習(xí)的核心是讓電腦從數(shù)據(jù)中學(xué)習(xí)規(guī)律?,F(xiàn)在,咱們要開始深入機(jī)器學(xué)習(xí)的種類了! 機(jī)器學(xué)習(xí)主要可以分為幾大類,其中最常見、應(yīng)用也最廣泛的一類叫做 監(jiān)督學(xué)習(xí) (Supervised Learning)。 為什么叫“監(jiān)督”學(xué)習(xí)呢? 想象一下,你是一個(gè)老師,你手里有很多練習(xí)題(數(shù)據(jù))。這些練習(xí)題很特別,每一道題不僅有題目本身(輸入),還!有!正!確!答!案?。ㄝ敵?標(biāo)簽)。 監(jiān)督學(xué)習(xí)就像是:你拿著這些“有答案”的練習(xí)題,去教一個(gè)學(xué)生(機(jī)器學(xué)習(xí)模型)。你讓學(xué)生先看題目,再看正確答案,學(xué)生通過反復(fù)看、反復(fù)練習(xí),慢慢就學(xué)會(huì)了做這類題的方法和規(guī)律。 這里的“正確答案”,就是那個(gè)進(jìn)行“監(jiān)督”的老師。所以,監(jiān)督學(xué)習(xí)最核心的特點(diǎn)就是:我們有帶有“標(biāo)簽”的數(shù)據(jù)來進(jìn)行訓(xùn)練。 什么是“帶標(biāo)簽的數(shù)據(jù)”? 簡單來說,就是每一條數(shù)據(jù)都有一個(gè)明確的“輸入”和一個(gè)明確的“輸出”或“結(jié)果”與它對應(yīng)。這個(gè)“輸出”就是它的標(biāo)簽。 舉幾個(gè)例子:
看到了嗎?在這些例子里,我們總是知道輸入對應(yīng)的正確輸出是什么。機(jī)器學(xué)習(xí)模型就通過學(xué)習(xí)大量的“輸入 → 輸出”的對應(yīng)關(guān)系,來學(xué)會(huì)這個(gè)從輸入到輸出的映射規(guī)律。 監(jiān)督學(xué)習(xí)的目標(biāo):舉一反三 一旦模型通過帶標(biāo)簽的數(shù)據(jù)學(xué)習(xí)到了這個(gè)規(guī)律,它的最終目標(biāo)就是能夠**“舉一反三”**! 也就是說,當(dāng)你給它一個(gè)新的、它從未見過的輸入數(shù)據(jù)時(shí)(這個(gè)新數(shù)據(jù)只有輸入,沒有標(biāo)簽),它也能根據(jù)之前學(xué)到的規(guī)律,預(yù)測出這個(gè)新數(shù)據(jù)最可能的輸出或標(biāo)簽是什么。 這就是為什么機(jī)器學(xué)習(xí)可以用來預(yù)測房價(jià)、識(shí)別新照片里的物體、判斷新的郵件是不是垃圾郵件等等,因?yàn)樗鼘W(xué)會(huì)了從已知推未知的能力。 在監(jiān)督學(xué)習(xí)中,根據(jù)我們要預(yù)測的“標(biāo)簽”類型不同,又可以分為兩大類任務(wù):預(yù)測一個(gè)具體的數(shù)值(回歸)和預(yù)測一個(gè)類別(分類)。 在監(jiān)督學(xué)習(xí)的第2部分,我們將進(jìn)一步詳細(xì)講解這兩種主要的任務(wù)類型:分類 和 回歸。 希望通過這一篇,你對監(jiān)督學(xué)習(xí)的核心——“有標(biāo)簽數(shù)據(jù)”和“學(xué)習(xí)映射關(guān)系”有了清晰的認(rèn)識(shí)! 感謝閱讀!我們下篇見! |
|