機器學(xué)習(xí)中踩過的坑，如何讓你變得更專業(yè)？

漢無為 2021-05-24

展開全文

僅做學(xué)術(shù)分享，如有侵權(quán)，聯(lián)系刪除

轉(zhuǎn)載于：AI科技評論

踩過坑才知道哪些路不可行，有時候犯錯誤也能幫助我們變得更加專業(yè)。

數(shù)據(jù)科學(xué)家Archy de Berker 在本文中詳述了他和周圍同伴在機器學(xué)習(xí)探索中踩過的坑，這也都是大家經(jīng)常性遇到的問題。他希望通過這一篇文章，帶大家了解機器學(xué)習(xí)中一些有趣的錯誤——一些只有你深入了這個領(lǐng)域才能接觸到的錯誤。

這不是一篇入門級的文章，想要讀懂本文，最好先在 Pytorch 或 Tensorow 上多練習(xí)下毀壞模型。

本文主要聚焦于上圖中綠色分布的錯誤，但紫色分布和黃色分布也會部分涉及

機器學(xué)習(xí)中的常見錯誤

Berker 將機器學(xué)習(xí)中出現(xiàn)的各種錯誤歸為三大類，嚴重程度由低到高。

1、這些錯誤只會浪費你的時間

計算科學(xué)中最難的兩件事是命名和緩存失效，圖中這條推文高度概括了此類錯誤。shape error 是最可怕又最常見的錯誤，通常是由于大小不一致的矩陣相乘導(dǎo)致。

本文不會花太多時間來討論這類錯誤，因為錯得非常明顯。大家很容易找到錯誤，然后進行修復(fù)，然后再犯錯，然后再修復(fù)。這是個不斷重復(fù)的過程。

2、這些錯誤會導(dǎo)致結(jié)果不準確

這類錯誤會讓你付出很大代價，因為它會造成模型結(jié)果不準確。

2015年，有一架從澳大利亞悉尼飛往馬來西亞吉隆坡的亞航航班因出現(xiàn)技術(shù)故障，在墨爾本機場緊急降落。如果模型的結(jié)果不準確，就如同這架飛機的技術(shù)故障，最終會飛到錯誤的目的地。

舉個例子，假如你在模型中新增了一個特征并同時增加了許多參數(shù)，在未進行超參數(shù)調(diào)優(yōu)的情況下對比之前的性能，發(fā)現(xiàn)增加特征后模型性能變差了，于是得出結(jié)論，增加的特征會讓模型性能變差。這是不對的，實際上你需要更加規(guī)范化的操作，以尋求更具表現(xiàn)力的模型。

錯誤對于模型的影響會隨著時間而加重，導(dǎo)致更加不準確的實驗結(jié)果。因此，盡早發(fā)現(xiàn)錯誤是非常有價值的。

3、這些錯誤會讓你誤認為自己的模型已經(jīng)“完美”

這是很嚴重的錯誤，會讓你高估模型的性能。這種錯誤通常很難發(fā)現(xiàn)，因為我們從心底里不愿承認看似”完美“的模型可能是假象。

當(dāng)模型表現(xiàn)得出奇差時，我們傾向于不相信然后再測試一遍，但當(dāng)模型表現(xiàn)得出奇好時，我們通常會相信并開始沾沾自喜。這就是所謂的確認偏差（Confirmation Bias），即個人無論合乎事實與否，都傾向于偏好支持自己的見解、猜想。

模型性能看似“完美”，通常是因為過擬合的原因，導(dǎo)致訓(xùn)練數(shù)據(jù)已經(jīng)不再有代表性，或者是因為選錯了評價指標，這兩點后文都會詳細解釋。

如果你只能從本文帶走一點，希望你記住：沒有什么比你發(fā)現(xiàn)模型的真正結(jié)果實際上很糟糕這件事更令人尷尬和沮喪的了。

機器學(xué)習(xí)的生命周期

機器學(xué)習(xí)就如同上圖香腸機的三個階段一樣：獲取數(shù)據(jù)，將數(shù)據(jù)輸入到模型中，然后通過一些指標來量化輸出。

接下來我們會討論到每個階段中一些看似愚蠢的錯誤。

1、輸出什么：評價指標

機器學(xué)習(xí)可以歸結(jié)為不斷減少損失函數(shù)值的過程。

但是，損失函數(shù)絕不是最終的優(yōu)化目標，它只是一個近似值。例如訓(xùn)練分類任務(wù)時，通過交叉熵損失函數(shù)來優(yōu)化訓(xùn)練集或者驗證集，但實際上我們更加信任在測試集上的結(jié)果或者說 F1、AUC 評價指標。

在實際優(yōu)化目標的數(shù)據(jù)差異非常小的情況下，在模型評價上采用低置信度來加速評價過程會導(dǎo)致問題更加嚴重。

無論在哪種環(huán)境下，如果損失函數(shù)已經(jīng)不能代表模型的真實表現(xiàn)，那么麻煩就大了。

此外還有一些讓模型更糟糕的做法：

1）混合訓(xùn)練集和測試集

混合訓(xùn)練集和測試集是很容易的，而且通常會訓(xùn)練出來很不錯的性能，但這樣的模型在復(fù)雜的真實環(huán)境中會表現(xiàn)非常糟糕。

所以，訓(xùn)練集、驗證集、測試集數(shù)據(jù)是不能相交的，各自需要包含不同的樣本數(shù)據(jù)。我們要思考模型需要怎樣的泛化能力，這最終會通過測試集的性能來量化。

以商店收據(jù)的數(shù)據(jù)為例，使用商店的收據(jù)進行分析預(yù)測，那么測試集顯然需要包含以前沒見過的新數(shù)據(jù)，但是測試集是否也需包含以前沒見過的新商品以保證模型不會對特定商店過度測試呢 (過擬合)？

最好的方式是一次性將數(shù)據(jù)分為訓(xùn)練集、驗證集和測試集，然后放在不同的文件夾下，且命名都應(yīng)該非常明確，例如 TrainDataLoader 和 TestDataLoader。

2）錯誤使用損失函數(shù)

錯誤使用損失函數(shù)其實是很少出現(xiàn)的，因為已經(jīng)有無數(shù)的材料教會大家如何使用損失函數(shù)。最常見的兩種錯誤使用損失函數(shù)的情況，一個是搞不清楚損失函數(shù)要使用概率分布還是對數(shù)（即是否需要添加 softmax），另一個就是混淆了回歸函數(shù)和分類函數(shù)。

即使在學(xué)術(shù)界，混淆回歸函數(shù)和分類函數(shù)也是很普遍的。例如亞馬遜用戶的評價和評星數(shù)據(jù) Amazon Reviews 數(shù)據(jù)集，經(jīng)常被頂級實驗室用于分類任務(wù)，但這其實是不太對的，因為與 1 星評價相比，5 星評價顯然更類似于 4 星評價，應(yīng)該采用有序回歸。

2、選錯評價指標

不同的任務(wù)使用的損失函數(shù)不一樣，而在模型性能的驗證上，我們也經(jīng)常組合多個側(cè)重點不一樣的評價指標來評估模型性能。例如，機器翻譯首選 BLEU 作為評價指標，自動文摘采用 ROUGE 來驗證性能，而對于其他任務(wù)，可以選用準確性，精確度或召回率作為評價指標。

通常，評價指標比損失函數(shù)容易讓人理解。一個好的思路是盡可能多地記錄日志。

認真思考如何劃分不相交的訓(xùn)練集、測試集和驗證集，讓模型具有優(yōu)異而不過度的泛化能力。

在訓(xùn)練過程中可以使用評價指標來測試模型性能，而不必等到最后才開始使用測試集來測試。這樣有助于更好地理解模型當(dāng)前的訓(xùn)練結(jié)果，防止問題到最后才暴露。

評價指標的選擇上要多注意。舉個例子，你不能用簡單使用準確性來評估序列模型的性能，因為序列間的非對齊情況會導(dǎo)致準確率為 0。因此對于序列數(shù)據(jù)要采用距離來評估。選錯評價指標是非常痛苦的事情。

還是以序列模型為例，請確保排除了所有特殊字符，特殊字符通常是序列的開頭、結(jié)尾和填充。如果忘記了排除特殊字符，可能會得到看起來不錯的模型性能，但這樣的模型實際上只能預(yù)測充滿填充字符的長序列。

有一個讓作者印象非常深刻的錯誤，其曾經(jīng)做過一些語義解析工作，目的是將自然語言語句轉(zhuǎn)換為數(shù)據(jù)庫查詢，回答諸如「明天從蒙特利爾到亞特蘭大有多少趟航班？」這樣的典型 SQL 問題。

為了評價模型的準確性，他們將模型轉(zhuǎn)義的 SQL 查詢發(fā)送到數(shù)據(jù)庫，檢查返回的內(nèi)容是否與真實查詢的內(nèi)容匹配。他設(shè)置了一種情況，如果向數(shù)據(jù)庫發(fā)送毫無意義的查詢，數(shù)據(jù)庫返回「error」。然后，他發(fā)送了已經(jīng)被損壞的預(yù)測 SQL 和真實 SQL 到數(shù)據(jù)庫查詢，兩者都返回「error」，模型將這種情況計算為：100％準確。

這就引出了指導(dǎo)原則，你犯的任何錯誤只會使性能變差。要堅持檢查模型實際做出的預(yù)測，而不僅僅是關(guān)注評價指標的結(jié)果。

3、避免評價指標的錯誤

1）首先跑一遍所有評價指標

在沒有任何訓(xùn)練的情況下如果模型表現(xiàn)很好，那一定是有問題的。

2）所有過程都記錄日志

機器學(xué)習(xí)是一門定量學(xué)科，但數(shù)字有時候也可能會騙人，所有可以想到的數(shù)字都記錄日志，但要以容易理解的方式記錄。

在 NLP 中，這通常意味著你需要顛倒標記，這過程很復(fù)雜，但百分百是值得的，日志提供了模型訓(xùn)練過程中的定性解釋。例如，語言模型通常從學(xué)習(xí)輸出類似 eeeeeeeeee <PAD> <PAD> <PAD>字符串開始，因為這些都是數(shù)據(jù)中最常見的字符。

如果是處理圖像任務(wù)，那么日志就更加麻煩了，因為你不能將圖片以文本的形式存為日志?？梢酝ㄟ^使用 ASCII 解決這一問題，即在 OCR 的訓(xùn)練過程中使用 ASCII 保存日志，從而能可視化輸入的圖像數(shù)據(jù)：

訓(xùn)練期間，盡可能可視化模型的輸入和輸出

3）研究驗證集

使用測試評價指標來確定集合中性能最佳和最差的樣本。了解樣本情況，使用一些量化置信度的方法（如 softmax），了解模型可能在哪些分布上表現(xiàn)良好、哪些分布上會表現(xiàn)糟糕，

在回歸任務(wù)中殘差分析是很有用的。

但是請記住，正如 Anscombe Quartet 指出的那樣，平均值可能會誤導(dǎo)你。

Anscombe Quartet：所有 4 個模型的均值和方差均相同，而且它們都擬合了同一條回歸線 t。因此，不用過分依賴統(tǒng)計結(jié)果，要理解數(shù)據(jù)本身。（圖注）

如果遇到多維問題，嘗試繪制錯誤與單個特征的關(guān)系圖來找出原因。是否存在模型表現(xiàn)非常差的輸入空間區(qū)域？如果是這樣，你可能需要在該數(shù)據(jù)區(qū)域補充更多數(shù)據(jù)或進行數(shù)據(jù)增強。

考慮消融和干擾在模型性能中的影響。諸如 LIME 和 Eli5 之類的工具可以讓模型變簡單。下面這篇文章很好地描述了擾動分析，揭示了用于 X 射線分類的 CNN 模型使用 X 射線機本身引入的標簽來確定患者是否患有肺炎，而不是 X 射線機的使用本身可能和患病率之間存在的相關(guān)性：

https:///@jrzech/what-are-radiological-deep-learning-models-actually-learning-f97a546c5b98

模型

現(xiàn)在很多課程和文章都將重點放在建模方面。但實際上，作為機器學(xué)習(xí)從業(yè)者，大部分時間都是在處理數(shù)據(jù)和指標，而不是研究創(chuàng)新的算法。

深度學(xué)習(xí)錯誤中的絕大多數(shù)都是形狀錯誤（ shape error），從而導(dǎo)致明顯的錯誤發(fā)生。

1、模型錯誤類型

模型錯誤類型很多，如下：

1）包含不可微分運算操作的模型

在深度學(xué)習(xí)模型中，一切都必須是端到端可微分的，以支持反向計算。因此，你可能希望不可微分操作能夠在 TensorFlow 等深度學(xué)習(xí)框架中被明確標識出來。這是不對的，正如Berker曾經(jīng)對 Keras Lambda 層感到特別困惑，因為它可以破壞反向計算。一個解決辦法是使用 model.summary() 進行檢查，以驗證大多數(shù)參數(shù)是可訓(xùn)練的，如果發(fā)現(xiàn)有不可訓(xùn)練參數(shù)的 layer，則可能是破壞了自動微分能力。

2）在測試時沒有成功關(guān)閉 Dropout

我們都知道，在測試數(shù)據(jù)時需要關(guān)閉 dropout，否則可能獲得的是隨機結(jié)果。這可能非常令人困惑，尤其是對于正在部署模型并開始跑測試集的人而言。

這一問題可以通過 eval() 來解決。另外需要注意的是，在訓(xùn)練模型時 dropout 可能會導(dǎo)致一個奇怪現(xiàn)象——模型在驗證集上的準確性高過比訓(xùn)練集上的準確性。這是因為在驗證集上用到了 dropout，這看起來可能是欠擬合了，而且可以會造成一些讓你頭疼的問題。

3）維度參數(shù)錯誤

不同框架在樣本數(shù) (batch size)，序列長度 (sequence length) 和通道數(shù) (channels) 上有不一樣的約定，有些框架提供了在這三者上的修改空間，但其他的框架是不允許任意修改的，修改就會出錯。

維度參數(shù)錯誤可能會產(chǎn)生奇怪現(xiàn)象。例如，如果你弄錯了樣本數(shù)和序列長度，那么最終可能會忽略部分樣本的信息，并且無法隨著時間保存信息。

2、避免模型的錯誤

1）模塊化，可測試

如果發(fā)現(xiàn)有不可訓(xùn)練參數(shù)的層，則可能是破壞了自動微分能力。

編寫結(jié)構(gòu)合理的代碼并進行單元測試是有助于避免模型錯誤的。

將模型分為幾個離散的代碼塊，每個代碼塊有明確的功能定義，就可以對其進行有效的測試。測試的重點，在于驗證變化樣本數(shù)和輸入數(shù)據(jù)量的情況下，模型是否與預(yù)期一致？Berker 推薦了 Chase Roberts 的一篇帖子，詳細介紹了 ML 代碼的單元測試：

https:///@keeper6928/how-to-unit-test-machine-learning-code-57cf6fd81765

2）維度論斷

Berker 傾向于將維度論斷加入到 ML 代碼中，讓讀者可以清楚地知道哪些維度應(yīng)該更改，哪些不應(yīng)該更改。當(dāng)然，如果發(fā)生意外，它會引發(fā)錯誤。

富有表達力的 Tensorflow 代碼，由 Keith Ito 提供。注意模塊化和形狀注釋。

至少要養(yǎng)成在代碼中添加維度注釋的習(xí)慣，讓讀者可以直接閱讀而不需要記憶大量信息。請前往以下地址查看 Keith Ito 實現(xiàn) beautifulTacotron 的代碼，這是一個注釋的優(yōu)秀范例：

https://github.com/keithito/tacotron/blob/master/models/tacotron.py

3）小數(shù)據(jù)簡單模型的過擬合問題

技巧：先確保模型在非常小的一部分數(shù)據(jù)集上進行過擬合訓(xùn)練，短時間內(nèi)排除明顯的錯誤。

盡量讓模型能輕松通過配置文件進行配置，并指定參數(shù)最少的測試配置。然后在 CI/CD 中添加一個步驟，檢查非常小的數(shù)據(jù)集的過擬合，并自動運行它。這將有助于捕獲破壞模型和訓(xùn)練管道的代碼改動。

數(shù)據(jù)

1、首先，要了解數(shù)據(jù)

在開始建模之前，你應(yīng)該就已經(jīng)厭倦了數(shù)據(jù)探查吧。

大多數(shù)機器學(xué)習(xí)模型都在嘗試復(fù)制人腦的某些模式識別能力。在開始編寫代碼之前需要熟悉數(shù)據(jù)，鍛煉模式識別能力，讓你的代碼寫的更輕松！了解數(shù)據(jù)集有助于整體架構(gòu)的考慮和指標的選擇，而且能夠迅速識別可能會出現(xiàn)性能問題的地方。

一般來說，數(shù)據(jù)本身就可以識別一些問題：數(shù)據(jù)不平衡，文件類型問題或者數(shù)據(jù)偏見。數(shù)據(jù)偏見很難通過算法進行評估，除非你有一個非常「聰明」的模型能識別這些問題。例如，這個「聰明」的模型能自己意識到偏見，「所有貓的照片都是在室內(nèi)拍攝的，所有狗的圖片都是在室外拍攝的，所以也許我正在訓(xùn)練室內(nèi)/室外分類器，而不是識別貓和狗的分類器？」。

Karpathy 為 ImageNet 創(chuàng)建的一個標注平臺，以評估他自己的表現(xiàn)并加深他對數(shù)據(jù)集的理解。

正如 Karpathy 所說的那樣，數(shù)據(jù)探查的系統(tǒng)能夠完成數(shù)據(jù)查看、數(shù)據(jù)切塊和切片。2018 年在倫敦舉辦的 KDD 上，他在演講中強調(diào)，Uber 的許多 ML 工程師并不是在編寫代碼來優(yōu)化模型，而是編寫代碼優(yōu)化數(shù)據(jù)標簽。

要了解數(shù)據(jù)，首先需要明白以下三種數(shù)據(jù)分布：

輸入數(shù)據(jù)的分布情況，例如平均序列長度，平均像素值，音頻時長
輸出數(shù)據(jù)的分布情況，分類失衡是一個大問題
輸出/輸入的分布情況，這通常就是你要建模的內(nèi)容

2、選擇如何加載數(shù)據(jù)

有效地加載和預(yù)處理數(shù)據(jù)是機器學(xué)習(xí)工程中比較痛苦的環(huán)節(jié)之一，往往要在效率和透明度之間權(quán)衡取舍。

像 Tensorow Records 這樣的專用數(shù)據(jù)結(jié)構(gòu)可以將數(shù)據(jù)序列轉(zhuǎn)為大數(shù)據(jù)包，減少對磁盤的頻繁讀取/寫入，但是這樣的作法卻有損透明度：這些結(jié)構(gòu)很難再進一步研究或者分解數(shù)據(jù)，如果你想要添加或者刪除一些數(shù)據(jù)，則必須重新序列化。

目前 Pytorch Dataset 和 DatasetLoader 是平衡透明度和效率比較好的辦法，專用的程序包 torchtext 處理文本數(shù)據(jù)集，torchvision 處理圖像數(shù)據(jù)集，這些程序包提供了相對有效的加載方式，填充并批處理每個域中的數(shù)據(jù)。

3、加快數(shù)據(jù)加載的方法

以下是 Berker 在加快數(shù)據(jù)加載的嘗試過程中所得到的經(jīng)驗教訓(xùn)：

1））不要加載目前正在加載的數(shù)據(jù)

這是因為你最終會發(fā)現(xiàn)，這樣做可能會丟失數(shù)據(jù)或者加載了重復(fù)數(shù)據(jù)。Berker 曾踩過的坑：

編寫正則表達式從文件夾中加載某些文件，但是在添加新文件時沒有更新正則文件，這意味著新文件無法成功加載
錯誤計算一個Epoch中的步數(shù)導(dǎo)致跳過了一些數(shù)據(jù)集
文件夾中有遞歸符號，導(dǎo)致多次加載相同的數(shù)據(jù)（在 Python 中，遞歸限制為 1000）
無法完全遍歷文件層次結(jié)構(gòu)，因而無法將數(shù)據(jù)加載到子文件夾中

2）錯誤存放數(shù)據(jù)

不要把所有數(shù)據(jù)放在一個目錄中。

如果你有上百萬個文本文件全部放在一個文件夾中，那么任何操作都會非常非常慢。有時候哪怕僅僅查看或計算的動作，都需要等待大量的文件夾加載，從而大大降低了工作效率。如果數(shù)據(jù)不在本地，而是遠程存儲在數(shù)據(jù)中心，使用 sshfs 掛載目錄，情況會更加糟糕。

第二個錯誤陷阱就是在預(yù)處理時沒有備份數(shù)據(jù)。正確的做法是將耗時的預(yù)處理結(jié)果保存到磁盤中，這樣就不必在每次運行模型時都要重來一遍，不過要確保不覆蓋原數(shù)據(jù)，并需要一直跟蹤在哪些數(shù)據(jù)上運行了哪些預(yù)處理代碼。

下圖是很好的示例:

3）不恰當(dāng)?shù)念A(yù)處理

在預(yù)處理中出現(xiàn)數(shù)據(jù)濫用的情況是常見的，尤其是在 NLP 任務(wù)中。

非 ASCII 字符的錯誤處理是一個很大的痛點，這種情況不常出現(xiàn)，因此很難發(fā)現(xiàn)。

分詞也會導(dǎo)致很多錯誤發(fā)生。如果使用的是基于詞的分詞，很容易基于一個數(shù)據(jù)集形成詞匯表，結(jié)果在另一個數(shù)據(jù)集上使用的時候發(fā)現(xiàn)，大量的詞匯在詞匯表上找不到。這種情況模型并不報錯，它只是在別的數(shù)據(jù)集上表現(xiàn)不好。

訓(xùn)練集和測試集之間的詞匯差異同樣是問題，因為那些只出現(xiàn)在測試集的詞匯是沒有被訓(xùn)練的。

因此，了解數(shù)據(jù)并盡早發(fā)現(xiàn)這些問題是非常有價值的。

4、避免數(shù)據(jù)處理的錯誤

1）盡可能多記錄日志

確保每次數(shù)據(jù)處理時都有樣本數(shù)據(jù)的日志，不應(yīng)該只記錄模型結(jié)果日志，還應(yīng)該記錄過程日志。

2）熟記模型超參數(shù)

你需要非常熟悉模型超參數(shù)：

有多少樣本數(shù)？
一次訓(xùn)練所選取的樣本數(shù)有多大？
一個Epoch有多少批處理？

這些同樣要記錄日志，或者可以添加一些論斷來確保所有內(nèi)容都沒有拉下。

3）預(yù)處理過程中記錄所有狀態(tài)

某些預(yù)處理步驟需要使用或創(chuàng)建工件，因此需要記得將其保存下來。例如，使用訓(xùn)練集的平均數(shù)和變量正則化數(shù)值數(shù)據(jù)，并保存平均數(shù)和變量，以便可以在測試時應(yīng)用相同的變換。

同樣，在NLP中，如果不保存訓(xùn)練集的詞匯表，就無法在測試時以相同的方式進行分詞。如果在測試中形成新的詞匯表并重新分詞就會產(chǎn)生無意義的結(jié)果，因為每個單詞都將得到一個完全不同的標記。

4）降采樣

當(dāng)數(shù)據(jù)集非常大（例如圖像和音頻）時，將數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)中，期望模型能夠?qū)W習(xí)到最有效的預(yù)處理方法。如果有無限的時間和計算能力，那么這可能是個好方法，但是在實際情況中，降采樣是比較合適的選擇。

我們不需要全高清圖像來訓(xùn)練狗/貓分類器，可以使用擴張卷積來學(xué)習(xí)降采樣器，或者傳統(tǒng)的梯度下降完成降采樣。

降采樣可以更快地完成模型擬合和評估，是較好的節(jié)約時間的做法。

結(jié)論

總結(jié)一下在機器學(xué)習(xí)應(yīng)遵循的 5 條指導(dǎo)原則：

從小處著手，實驗會進行的很快。減少循環(huán)時間能夠及早發(fā)現(xiàn)問題并更快地驗證假設(shè)。
了解數(shù)據(jù)。不了解數(shù)據(jù)就無法做好建模的工作。不要浪費時間在花哨的模型上，要沉心靜氣地完成數(shù)據(jù)探查工作。
盡量多地記錄日志。訓(xùn)練過程的信息越多，就容易識別異常并進行改進。
注重簡單性和透明性而不僅僅是效率。不要為了節(jié)省少量時間而犧牲了代碼的透明性。理解不透明代碼所浪費的時間要比低效算法的運行時間多得多。
如果模型表現(xiàn)優(yōu)異令人難以置信，那可能就是有問題。機器學(xué)習(xí)中存在很多錯誤可能會「愚弄」你，成為一名優(yōu)秀的科學(xué)家意味著要理性的發(fā)現(xiàn)并消除這些錯誤。