李根 發(fā)自 騰訊濱海大廈 量子位 報(bào)道 | 公眾號(hào) QbitAI “這樣的比賽還可以 more and more.” 在答辯頒獎(jiǎng)后,兩位AI權(quán)威如此慨嘆。 一位是伊利諾伊大學(xué)芝加哥分校杰出教授俞士綸(Philip S. Yu),另一位是亞利桑那州立大學(xué)計(jì)算機(jī)科學(xué)與工程教授劉歡(Huan Liu)。 他們?cè)u(píng)價(jià),無(wú)論是機(jī)器學(xué)習(xí)還是數(shù)據(jù)挖掘,光從教材和學(xué)校解決問(wèn)題,太過(guò)單薄,所以他們殷切希望國(guó)內(nèi)產(chǎn)學(xué)研結(jié)合的大賽能多多益善。 而且騰訊愿意提供脫敏數(shù)據(jù)集,提供計(jì)算平臺(tái)和豐厚獎(jiǎng)勵(lì)。 不論是經(jīng)過(guò)脫敏處理的真實(shí)業(yè)務(wù)數(shù)據(jù),還是接地氣的真實(shí)應(yīng)用場(chǎng)景,都可以讓更多人才學(xué)以致用,甚至能讓那些名校之外的學(xué)生,也有機(jī)會(huì)用實(shí)踐成績(jī)來(lái)證明自己——這一價(jià)值,儼然早已遠(yuǎn)遠(yuǎn)超出了比賽本身。 讓他們?nèi)绱思?dòng)的是“2019騰訊廣告算法大賽”。 三年磨劍:業(yè)務(wù)數(shù)據(jù),真實(shí)場(chǎng)景 騰訊廣告算法大賽,已是連續(xù)第三年舉辦。 今年的賽題是“廣告曝光預(yù)估”,一項(xiàng)騰訊廣告在真實(shí)業(yè)務(wù)場(chǎng)景中面向廣告主提供的重要服務(wù)。 所謂曝光預(yù)估,是在廣告主創(chuàng)建新廣告和修改廣告設(shè)置時(shí),為廣告主提供未來(lái)的廣告曝光效果參考。 通過(guò)預(yù)估參考,廣告主可以根據(jù)曝光預(yù)估結(jié)果提前調(diào)整出價(jià)、定向、時(shí)段等設(shè)置,結(jié)合自身的投放預(yù)期選擇最適合自己的設(shè)置,而不是投放幾天之后再去修改,能避免盲目的優(yōu)化嘗試,有效縮短廣告的優(yōu)化周期,降低試錯(cuò)成本,使廣告效果盡快達(dá)到廣告主的預(yù)期范圍。 但打造這樣一個(gè)算法模型,并不輕而易舉。 從騰訊廣告的實(shí)際場(chǎng)景來(lái)說(shuō),效果廣告主要是展示類(lèi)廣告,背后的算法引擎,本質(zhì)是一個(gè)推薦框架。 技術(shù)角度而言,它首先將廣告設(shè)置的人群定向、投放時(shí)段、選擇的流量版位、競(jìng)價(jià)方式、出價(jià)等廣告業(yè)務(wù)語(yǔ)言來(lái)轉(zhuǎn)化為描述廣告覆蓋用戶(hù)人群的范圍大小以及競(jìng)爭(zhēng)環(huán)境激烈程度、自身競(jìng)爭(zhēng)力相對(duì)水平等可量化的數(shù)值指標(biāo)。 通過(guò)對(duì)歷史中各類(lèi)廣告在競(jìng)價(jià)系統(tǒng)中的曝光歷史進(jìn)行訓(xùn)練,騰訊廣告需要學(xué)習(xí)出競(jìng)爭(zhēng)環(huán)境的變化趨勢(shì)以及廣告競(jìng)爭(zhēng)力水平和最終曝光效果的隱藏聯(lián)系,達(dá)到預(yù)估廣告未來(lái)曝光的目標(biāo)。 而且這也是產(chǎn)學(xué)研結(jié)合的最佳演武場(chǎng)。 當(dāng)前大部分機(jī)器學(xué)習(xí)或人工智能的問(wèn)題,目標(biāo)方向都是“預(yù)估”。 本質(zhì)上都是通過(guò)對(duì)已知的歷史記錄中提取和預(yù)估目標(biāo)相關(guān)的特征表達(dá),并訓(xùn)練出能擬合出最接近預(yù)估值的模型。 具體訓(xùn)練過(guò)程即通過(guò)損失函數(shù)的計(jì)算和迭代優(yōu)化方案,在有限的解空間中搜索誤差最小的最優(yōu)解的過(guò)程。 也是對(duì)目標(biāo)編碼、特征統(tǒng)計(jì)、數(shù)據(jù)挖掘、歷史平移,模型選擇等一系列基本功的考驗(yàn)。 因何而來(lái),往何處而去 騰訊廣告副總裁羅征說(shuō),本次大賽既是通過(guò)業(yè)務(wù)場(chǎng)景創(chuàng)造產(chǎn)學(xué)研交流機(jī)會(huì),也能通過(guò)比賽引起更多人才關(guān)注,同時(shí)也是企業(yè)社會(huì)責(zé)任的一部分。 可能易于被忽略的是,騰訊廣告的數(shù)據(jù)處理量和對(duì)業(yè)務(wù)場(chǎng)景的多元應(yīng)用需求,都位于業(yè)界前列。 一方面是騰訊龐大的體量和社交媒體地位下,廣告數(shù)據(jù)非常龐大。加之服務(wù)的業(yè)務(wù)和應(yīng)用場(chǎng)景很多元, 廣告主對(duì)廣告效果也有不同的需求,這就對(duì)數(shù)據(jù)挖掘、特征學(xué)習(xí)和模型算法等機(jī)器學(xué)習(xí)應(yīng)用帶來(lái)極大的挑戰(zhàn)。 羅征也說(shuō),很多高校學(xué)生知道搜索和推薦系統(tǒng)需要機(jī)器學(xué)習(xí)的加持才能錦上添花。 但可能不知道廣告和營(yíng)銷(xiāo)業(yè)務(wù),同樣是機(jī)器學(xué)習(xí)應(yīng)用的重要戰(zhàn)場(chǎng)。 首先,騰訊廣告業(yè)務(wù)面對(duì)的數(shù)據(jù)量非常龐大,本身就為機(jī)器學(xué)習(xí)提供了得天獨(dú)厚的數(shù)據(jù)基礎(chǔ)。 其次,廣告業(yè)務(wù)的評(píng)估目標(biāo),非常清晰,結(jié)果反饋一目了然,能更快幫助機(jī)器學(xué)習(xí)進(jìn)行模型優(yōu)化和迭代。 最后,技術(shù)的不斷精進(jìn)對(duì)于業(yè)務(wù)價(jià)值的體現(xiàn)也顯而易見(jiàn)。算法越好,模型越強(qiáng),對(duì)于客戶(hù)(廣告主)和用戶(hù)的體驗(yàn),都是雙提升。 當(dāng)然,技術(shù)為業(yè)務(wù)所帶來(lái)的價(jià)值,也是騰訊廣告可以將算法大賽持續(xù)舉辦下去的驅(qū)動(dòng)力之一。 實(shí)際上,本次大賽前后歷時(shí)3個(gè)月,共有海內(nèi)外10,571人參加——如果從數(shù)據(jù)挖掘領(lǐng)域來(lái)看,已是全球參賽人數(shù)最多的比賽之一了?!?/div> 而騰訊廣告除了提供資源——提供真實(shí)業(yè)務(wù)場(chǎng)景下經(jīng)過(guò)脫敏處理后的數(shù)據(jù)集,與騰訊云合作提供智能鈦機(jī)器學(xué)習(xí)平臺(tái),并且拿出真金白銀獎(jiǎng)勵(lì)優(yōu)勝者。 所以搭臺(tái)舉辦算法大賽,并不比寫(xiě)代碼調(diào)模型簡(jiǎn)單。 但羅征認(rèn)為這一賽事值得做,而且想基于大賽提供更友好的算法交流環(huán)境,比如將賽題數(shù)據(jù)集面向?qū)W術(shù)研究開(kāi)源。 這位騰訊廣告副總裁博士學(xué)成于MIT計(jì)算機(jī)系,在2012年加盟騰訊前,曾在谷歌公司任職八年,負(fù)責(zé)AdSense廣告系統(tǒng)、谷歌字典等項(xiàng)目的研發(fā)管理工作。因此,他深知產(chǎn)學(xué)研結(jié)合對(duì)于產(chǎn)業(yè)和人才推動(dòng)的重要意義。 而且從騰訊廣告角度,通過(guò)算法大賽,也是吸引更多優(yōu)秀人才,以及向客戶(hù)展示業(yè)務(wù)技術(shù)實(shí)力的方式之一。 但無(wú)論如何,這樣源自產(chǎn)業(yè),學(xué)界受益,產(chǎn)學(xué)研都得到推動(dòng)的比賽,已經(jīng)展現(xiàn)出越來(lái)越多的持續(xù)良性循環(huán)。 伊利諾伊大學(xué)芝加哥分校杰出教授 俞士綸(Philip S. Yu) 從美國(guó)遠(yuǎn)道而來(lái)的大賽評(píng)委嘉賓:伊利諾伊大學(xué)芝加哥分校杰出教授俞士綸(Philip S. Yu)和亞利桑那州立大學(xué)計(jì)算機(jī)科學(xué)與工程教授劉歡(Huan Liu),都為此感慨中國(guó)AI面臨的歷史機(jī)遇。 一方面,越來(lái)越多的中國(guó)公司愿意反哺學(xué)界,出錢(qián)出資源舉辦這樣的大賽,可以讓更多人才得到產(chǎn)學(xué)一體的鍛煉機(jī)會(huì),學(xué)以致用。 縱觀全球AI發(fā)展,神經(jīng)網(wǎng)絡(luò)早在80年代就已發(fā)明,但只有ImageNet等數(shù)據(jù)集和比賽的出現(xiàn),才真正意義把深度學(xué)習(xí)推向了最前線(xiàn)。 而中國(guó)公司經(jīng)過(guò)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代發(fā)展,現(xiàn)在有能力和實(shí)力可以做更多事情,龍頭公司如騰訊愿意做這樣的事情,還能起到帶頭作用,利于整個(gè)業(yè)界。 另一方面,這也潛藏著中國(guó)人才的機(jī)遇?!爸袊?guó)人才聰明又勤奮,但之前理論功夫扎實(shí),而缺乏這樣的工業(yè)鍛煉,在全球化競(jìng)爭(zhēng)中吃虧在所難免。”劉歡教授就在分享中感慨,求學(xué)海外和發(fā)展過(guò)程中,他有幸遇到俞士綸教授指點(diǎn)和提攜,才不斷在業(yè)界站穩(wěn)腳跟。 亞利桑那州立大學(xué)計(jì)算機(jī)科學(xué)與工程教授 劉歡(Huan Liu) 但現(xiàn)在如騰訊廣告算法大賽,本身就在創(chuàng)造一個(gè)人才交流和互助的平臺(tái),工業(yè)界或更大平臺(tái)里需要的合作能力、領(lǐng)導(dǎo)能力,都可以在其中得到鍛煉。 所以大環(huán)境不斷利好,沒(méi)有理由不相信,這一代中國(guó)AI人才成長(zhǎng)可以更快、更強(qiáng)、更全面。 AI萌新,生逢其時(shí) 這種更快更強(qiáng)更全面的AI養(yǎng)成環(huán)境,本次參賽選手也感受頗深。 本次“終極之戰(zhàn)”的答辯現(xiàn)場(chǎng),共有10支從復(fù)賽脫穎而出的隊(duì)伍上臺(tái)經(jīng)受最后檢驗(yàn)。 與往年不同的是,今年除新增了外部評(píng)委外,還進(jìn)一步提供現(xiàn)場(chǎng)打分環(huán)節(jié),評(píng)委對(duì)選手的現(xiàn)場(chǎng)風(fēng)采、代碼質(zhì)量及比賽策略進(jìn)行現(xiàn)場(chǎng)亮分,為選手們提供公平、透明的競(jìng)技平臺(tái)。 不過(guò)這復(fù)賽10強(qiáng),身份背景也頗有意思。 并非所有人都來(lái)自高校,也并非所有隊(duì)伍都是計(jì)算機(jī)背景。 比如參賽隊(duì)伍ddw,三位隊(duì)員都是廈門(mén)大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)系的學(xué)生,他們首次參加AI相關(guān)競(jìng)賽,雖然缺乏代碼經(jīng)驗(yàn)的他們也在比賽中吃了不少虧,但還是憑借對(duì)問(wèn)題的準(zhǔn)確理解,從解決問(wèn)題出發(fā),找到優(yōu)化之路,最終獲得第五名的好成績(jī)。 還有電信子公司甜橙金融的DataAI團(tuán)隊(duì),也花費(fèi)了業(yè)余時(shí)間參賽。他們的團(tuán)隊(duì)組成也是十分有趣,甜橙金融的老板傅劍文帶著他的員工章建森及陳心童組成隊(duì)伍,并且在決賽獲得第四的好成績(jī)。隊(duì)員們?cè)谔鸪葍?nèi)部主要負(fù)責(zé)風(fēng)控算法,今年看到“預(yù)估”類(lèi)話(huà)題,決定來(lái)一試身手,還自謙說(shuō)“希望認(rèn)識(shí)更多大佬”。 雖是謙虛,但交流和結(jié)識(shí)朋友確實(shí)絕非先例。 在整個(gè)過(guò)程中,很多團(tuán)隊(duì)并非從一開(kāi)始就因?yàn)檎J(rèn)識(shí)而組隊(duì),不少人則是“不打不相識(shí)”,因?yàn)閰①惗Y(jié)緣,進(jìn)一步在賽事交流群內(nèi)找到志同道合的隊(duì)友一起作戰(zhàn)。 所以也能看到不少跨校,甚至跨國(guó)的組合。 本次拿下第七名的“人工智障”團(tuán)隊(duì),核心三位成員分別來(lái)自法國(guó)巴黎、蘇州大學(xué)和電子科技大學(xué)。 在巴黎工作的陸劼介紹說(shuō),看到大賽介紹后,希望在工作之余試一試,先是報(bào)名參加了比賽,再在群內(nèi)找到了兩位志同道合的同伴,攜手合作一路闖入決賽。 由于天各一方,他們?cè)跊Q賽答辯前都保持遠(yuǎn)程線(xiàn)上交流,本次他也是專(zhuān)程從巴黎趕赴深圳,和他的好隊(duì)友進(jìn)行“網(wǎng)友面基”。 最后他們的方案斬獲決賽第七,大賽給他們留下的是一段跨國(guó)跨校協(xié)作的回憶和友誼。 此外,騰訊廣告算法大賽也讓一些對(duì)AI和機(jī)器學(xué)習(xí)等感興趣的同學(xué),驗(yàn)證了研究興趣,找到了持續(xù)鉆研的信心。 2019騰訊廣告算法大賽和答辯單項(xiàng)獎(jiǎng)的雙料No.1,是來(lái)自哈爾濱工業(yè)大學(xué)二年級(jí)碩士生劉育源、中山大學(xué)微軟亞洲研究院聯(lián)合培養(yǎng)博士生郭達(dá)雅及武漢大學(xué)二年級(jí)碩士生王賀組建的三人團(tuán)隊(duì)——“魚(yú)遇雨欲語(yǔ)與余”。該隊(duì)伍從復(fù)賽第一周就取得了十分亮眼的成績(jī)。這支配合高能的隊(duì)伍,終于在終極舞臺(tái)得到最高嘉獎(jiǎng)。 而且這支團(tuán)隊(duì),也在解決問(wèn)題中“不知不覺(jué)”探索了AI學(xué)術(shù)前沿。他們?cè)谒惴P痛蚰ブ?,用了各種維度的數(shù)據(jù),最終在結(jié)果上比其他隊(duì)伍更強(qiáng)。 而根據(jù)俞士綸教授的評(píng)價(jià),他們已經(jīng)在有意無(wú)意使用“廣度學(xué)習(xí)”的方法。 這波AI浪潮復(fù)興以來(lái),深度學(xué)習(xí)人盡皆知,但其實(shí)在另一層面,廣度學(xué)習(xí)也正在帶來(lái)新的可能,它們一齊把AI發(fā)展帶向新高度。 所以產(chǎn)學(xué)研一體,有時(shí)聽(tīng)起來(lái)像是高屋建瓴的指導(dǎo)方針,但在騰訊廣告算法大賽上,選手們所展現(xiàn)出來(lái)的成果也證明了產(chǎn)學(xué)融合的必要性。 這讓主辦方和參賽選手都收獲更多成就感。 騰訊廣告の技術(shù)縮影 其中羅征,自然是對(duì)騰訊廣告算法大賽最富期待的那個(gè)人。 他說(shuō),騰訊廣告技術(shù)團(tuán)隊(duì),應(yīng)該是鵝廠內(nèi)部對(duì)機(jī)器學(xué)習(xí)和算力要求最高的團(tuán)隊(duì)之一。 而且騰訊廣告雖然是重要的業(yè)務(wù)團(tuán)隊(duì),但也滿(mǎn)懷技術(shù)探索之心。 他們每年拿來(lái)做算法大賽挑戰(zhàn)的賽題,不僅在實(shí)際業(yè)務(wù)中具有重要地位,而且自身所探索的算法在行業(yè)內(nèi)也屬于業(yè)界前沿——算是程序員們不斷自我挑戰(zhàn)的方式之一。 羅征透露,內(nèi)部還會(huì)發(fā)起一些有趣的研究,比如讓AI系統(tǒng)去評(píng)價(jià)一條廣告,或是如何評(píng)判一個(gè)廣告創(chuàng)意的“美感”,再或是從視覺(jué)化上做一些相應(yīng)的算法探索。 窺一斑而見(jiàn)全豹。無(wú)論是算法大賽舉辦,還是內(nèi)部興趣研究,都是騰訊廣告技術(shù)積累和信仰的縮影。 羅征認(rèn)為,AI等新技術(shù)帶來(lái)了機(jī)遇,讓廣告等數(shù)據(jù)量豐富的領(lǐng)域可以做得更好更有意思,他們也希望能夠打磨出更高水準(zhǔn)的技術(shù),一方面是讓廣告主體驗(yàn)更流暢,廣告能效更高,另一方面也讓用戶(hù)體驗(yàn)更人性。 不過(guò)鵝廠風(fēng)格低調(diào),如果沒(méi)有此次的騰訊廣告算法大賽,可能更多人還一直在低估如此重要的AI戰(zhàn)場(chǎng)。 騰訊20周年前夕迎來(lái)了“930”組織架構(gòu)變革,騰訊廣告業(yè)務(wù)被進(jìn)一步整合,并且強(qiáng)調(diào)技術(shù)在業(yè)務(wù)和產(chǎn)品中更重要的作用。 而在今年5月的騰訊智慧營(yíng)銷(xiāo)峰會(huì)上,騰訊總裁劉熾平把騰訊廣告的戰(zhàn)略升級(jí)形容為“廣告 ”,其中共要實(shí)現(xiàn)四個(gè)“ ”,讓營(yíng)銷(xiāo)服務(wù)無(wú)論對(duì)廣告主,還是對(duì)消費(fèi)者,都可以提供更好的價(jià)值。而其中第一個(gè)“ ”,就是要“廣告 技術(shù)”,通過(guò)AI等技術(shù),幫客戶(hù)實(shí)現(xiàn)有效投放,減少浪費(fèi),同時(shí)有更高的用戶(hù)體驗(yàn)。 而且廣告業(yè)務(wù),還在巨頭騰訊的營(yíng)收中越來(lái)越重要。 在騰訊2019 Q1的財(cái)報(bào)中,網(wǎng)絡(luò)廣告業(yè)務(wù)的收入同比增長(zhǎng)25%至人民幣133.77億元。社交及其他廣告收入增長(zhǎng)34%至人民幣98.98億元,并且從增長(zhǎng)趨勢(shì)來(lái)看,還會(huì)不斷穩(wěn)固向前。 所以,如果提到騰訊和其技術(shù)應(yīng)用,未來(lái)能聯(lián)想到的,恐怕不僅僅只有各大AI實(shí)驗(yàn)室了。騰訊廣告,一個(gè)可能被低估了的AI業(yè)務(wù),正在越來(lái)越矚目。 —完— |
|