摘要:2020GDE全球開發(fā)者大賽-KPI異常檢測告一段落,來自深圳福田蓮花街道的“原子彈從入門到精通”有幸取得了 總榜TOP1的成績,在這里跟大家分享深圳福田蓮花街道在本次比賽的解決方案。 背景介紹 核心網(wǎng)在移動運(yùn)營商網(wǎng)絡(luò)中占據(jù)舉足輕重的地位,其異常往往會導(dǎo)致呼叫失敗、網(wǎng)絡(luò)延遲等現(xiàn)網(wǎng)故障,對全網(wǎng)的服務(wù)質(zhì)量帶來重大的負(fù)面影響,多則影響十?dāng)?shù)萬用戶,并引發(fā)大面積投訴[1]。因此需要快速及時地發(fā)現(xiàn)核心網(wǎng)的異常風(fēng)險,在影響擴(kuò)大之前及時消除故障。 評估指標(biāo): 本賽題采用F1作為評估指標(biāo),具體計(jì)算公式如下: P = TP/(TP+FP) R = TP/(TP+FN) F1 = 2*P*R/(P+R) 數(shù)據(jù)探索 數(shù)據(jù)**有20個不同的KPI,不同的KPI物理意義不同,代表了不同的核心網(wǎng)指標(biāo),由于賽題需要對未來7天的數(shù)據(jù)進(jìn)行預(yù)測,因此對于建模樣本也進(jìn)行周級別的分布查看。從Fig1中可以明顯看到訓(xùn)練集中前三周的異常率顯著低于后續(xù)幾周。進(jìn)一步分析可以發(fā)現(xiàn)雖然賽題提供了[2019-08-01,2019-09-23)的全部數(shù)據(jù),但2019-08-15之前所有20個KPI均毫無異常,第一個異常點(diǎn)是從2019-08-15 02:00:00開始出現(xiàn)的(Fig2),因此推測8.15前的數(shù)據(jù)分布不同于后續(xù)樣本,或8.15之前存在標(biāo)注異常的問題。實(shí)驗(yàn)中剔除8.15之前的樣本建模效果也優(yōu)于保留該時間段樣本,進(jìn)一步驗(yàn)證了該推測。 摘要:2020GDE全球開發(fā)者大賽-KPI異常檢測告一段落,來自深圳福田蓮花街道的“原子彈從入門到精通”有幸取得了 總榜TOP1的成績,在這里跟大家分享深圳福田蓮花街道在本次比賽的解決方案。 背景介紹 核心網(wǎng)在移動運(yùn)營商網(wǎng)絡(luò)中占據(jù)舉足輕重的地位,其異常往往會導(dǎo)致呼叫站長交易失敗、網(wǎng)絡(luò)延遲等現(xiàn)網(wǎng)故障,對全網(wǎng)的服務(wù)質(zhì)量帶來重大的負(fù)面影響,多則影響十?dāng)?shù)萬用戶,并引發(fā)大面積投訴[1]。因此需要快速及時地發(fā)現(xiàn)核心網(wǎng)的異常風(fēng)險,在影響擴(kuò)大之前及時消除故障。 評估指標(biāo): 本賽題采用F1作為評估指標(biāo),具體計(jì)算公式如下: P = TP/(TP+FP) R = TP/(TP+FN) F1 = 2*P*R/(P+R) 數(shù)據(jù)探索 數(shù)據(jù)**有20個不同的KPI,不同的KPI物理意義不同,代表了不同的核心網(wǎng)指標(biāo),由于賽題需要對未來7天的數(shù)據(jù)進(jìn)行預(yù)測,因此對于建模樣本也進(jìn)行周級別的分布查看。從Fig1中可以明顯看到訓(xùn)練集中前三周的異常率顯著低于后續(xù)幾周。進(jìn)一步分析可以發(fā)現(xiàn)雖然賽題提供了[2019-08-01,2019-09-23)的全部數(shù)據(jù),但2019-08-15之前所有20個KPI均毫無異常,第一個異常點(diǎn)是從2019-08-15 02:00:00開始出現(xiàn)的(Fig2),因此推測8.15前的數(shù)據(jù)分布不同于后續(xù)樣本,或8.15之前存在標(biāo)注異常的問題。實(shí)驗(yàn)中剔除8.15之前的樣本建模效果也優(yōu)于保留該時間段樣本,進(jìn)一步驗(yàn)證了該推測。 背景介紹 核心網(wǎng)在移動運(yùn)營商網(wǎng)絡(luò)中占據(jù)舉足輕重的地位,其異常往往會導(dǎo)致呼叫失敗、網(wǎng)絡(luò)延遲等現(xiàn)網(wǎng)故障,對全網(wǎng)的服務(wù)質(zhì)量帶來重大的負(fù)面影響,多則影響十?dāng)?shù)萬用戶,并引發(fā)大面積投訴[1]。因此需要快速及時地發(fā)現(xiàn)核心網(wǎng)的異常風(fēng)險,在影響擴(kuò)大之前及時消除故障。 評估指標(biāo): 本賽題采用F1作為評估指標(biāo),具體計(jì)算公式如下: P = TP/(TP+FP) R = TP/(TP+FN) F1 = 2*P*R/(P+R) 數(shù)據(jù)探索 數(shù)據(jù)**有20個不同的KPI,不同的KPI物理意義不同,代表了不同的核心網(wǎng)指標(biāo),由于賽題需要對未來7天的數(shù)據(jù)進(jìn)行預(yù)測,因此對于建模樣本也進(jìn)行周級別的分布查看。從Fig1中可以明顯看到訓(xùn)練集中前三周的異常率顯著低于后續(xù)幾周。進(jìn)一步分析可以發(fā)現(xiàn)雖然賽題提供了[2019-08-01,2019-09-23)的全部數(shù)據(jù),但2019-08-15之前所有20個KPI均毫無異常,第一個異常點(diǎn)是從2019-08-15 02:00:00開始出現(xiàn)的(Fig2),因此推測8.15前的數(shù)據(jù)分布不同于后續(xù)樣本,或8.15之前存在標(biāo)注異常的問題。實(shí)驗(yàn)中剔除8.15之前的樣本建模效果也優(yōu)于保留該時間段樣本,進(jìn)一步驗(yàn)證了該推測。 |
|