看不見的數(shù)字化工人。
編者注:AI史的敘述方式往往是機(jī)器隨時(shí)間轉(zhuǎn)移而變得越來越聰明。但這種敘述缺少了人的要素,沒有講清楚智能機(jī)器是如何由人的身體和思想來設(shè)計(jì)、訓(xùn)練與賦能的。 為此,IEEE推出了總共六篇的AI秘史系列文章,希望從創(chuàng)新者、思想家、工人甚至小販等人如何創(chuàng)造可復(fù)制人類思想和行為的算法的角度來彌補(bǔ)這一缺失。盡管無需人類輸入的超智計(jì)算機(jī)令人興奮,但智能機(jī)器的真正歷史已經(jīng)證明,AI的水平只能跟我們一樣的好。此文為系列的第六篇,作者是 Oscar Schwartz,原文標(biāo)題為:Untold History of AI: How Amazon’s Mechanical Turkers Got Squeezed Inside the Machine AI秘史(一):查理·巴貝奇與會(huì)下棋的土耳其機(jī)器人 AI秘史(二):美國第一臺(tái)電子計(jì)算機(jī)背后的女性程序員 AI秘史(四):憧憬人機(jī)共生的DARPA夢(mèng)想家 第六部分:土耳其機(jī)器人修訂版千禧之交,Amazon開始將服務(wù)擴(kuò)展到賣書以外的領(lǐng)域。隨著網(wǎng)站的產(chǎn)品款式不斷豐富,公司必須想出新的辦法對(duì)其進(jìn)行分類組織。其中的一部分任務(wù)是將網(wǎng)站上出現(xiàn)的成千上萬重復(fù)產(chǎn)品撤除掉。 公司的工程師試圖寫軟件自動(dòng)消除重復(fù)出現(xiàn)的產(chǎn)品。識(shí)別并刪除對(duì)象看似簡(jiǎn)單的任務(wù),這應(yīng)該在機(jī)器的能力范圍內(nèi)。但工程師很快就放棄了,稱其中的數(shù)據(jù)處理挑戰(zhàn)是“難以克服的”。這項(xiàng)任務(wù)要求具備識(shí)別圖片和文字之間存在細(xì)微差別和相似性,其實(shí)需要的是人的智能。 這個(gè)難題留給了Amazon。刪除網(wǎng)站上的重復(fù)產(chǎn)品對(duì)人來說是一項(xiàng)瑣碎的工作,但重復(fù)產(chǎn)品的絕對(duì)規(guī)模需要大量勞動(dòng)力。一項(xiàng)任務(wù)要協(xié)調(diào)如此眾多的工人就不是一項(xiàng)瑣碎的工作量。 Amazon一位叫做Venky Harinarayan的經(jīng)理想出了一個(gè)解決方案。他的專利描述了一個(gè)“人機(jī)混合的計(jì)算部署”,也就是將任務(wù)分解成小單位,或者“子任務(wù)”,然后分配給一個(gè)工人網(wǎng)絡(luò)。
刪除重復(fù)項(xiàng)的情況下,中心的計(jì)算機(jī)可以將Amazon的網(wǎng)站分割成一塊塊——比方說,100個(gè)開罐器的產(chǎn)品頁,然后通過互聯(lián)網(wǎng)將這部分網(wǎng)頁發(fā)給處理的工人。工人然后識(shí)別這些網(wǎng)頁當(dāng)中的重復(fù)項(xiàng),再把處理過的返回去。 這種分配系統(tǒng)提供了一個(gè)關(guān)鍵優(yōu)勢(shì):工人不需要集中在一個(gè)地方,而是隨時(shí)隨地在自己的個(gè)人計(jì)算機(jī)上完成子任務(wù)。基本上,Harinaryran開發(fā)的是一個(gè)將地技能但又難以自動(dòng)化的工作分配給一個(gè)可并行工作的工人網(wǎng)絡(luò)的有效手段。 在Amazon的內(nèi)部運(yùn)作證明,這個(gè)辦法非常有效,以至于貝索斯決定這個(gè)系統(tǒng)可以作為服務(wù)賣給其他公司。貝索斯將Harinaryan的技術(shù)變成了一個(gè)勞動(dòng)力市場(chǎng)。企業(yè)在這個(gè)市場(chǎng)內(nèi)可以將人容易做(但很難自動(dòng)化)的任務(wù)跟自由職業(yè)工人組成的網(wǎng)絡(luò)漸進(jìn)性匹配,給很少一點(diǎn)錢就可以讓他們完成任務(wù)。 Amazon Mechanical Turk(或者簡(jiǎn)稱Turk)就是這么誕生的。這項(xiàng)服務(wù)于2005年推出,然后用戶群迅速擴(kuò)大。全球的企業(yè)和研究人員開始上傳成千上萬所謂的“人類智能任務(wù)”到平臺(tái)上,比如音頻轉(zhuǎn)錄或者給圖像加標(biāo)題等。然后這些任務(wù)由一支國際化的匿名工人群體以很少的費(fèi)用(有一位憤憤不平的工人報(bào)告稱平均每項(xiàng)任務(wù)的費(fèi)用只有20美分)忠實(shí)地執(zhí)行。 這項(xiàng)新服務(wù)的名字是向18實(shí)際那臺(tái)下棋機(jī)器(參見AI秘史一),販子Wolfgang von Kempelen發(fā)明的土耳其機(jī)器人的致敬。就像那個(gè)騙人的自動(dòng)化(機(jī)器內(nèi)部藏有一個(gè)人類棋手)一樣,mTurk平臺(tái)也是為了讓人類工人不可見。平臺(tái)的工人不提供名字,只有數(shù)字,而且請(qǐng)求者與工人之間的溝通完全是去個(gè)性化的。貝索斯本人把這些去個(gè)性化的工人稱為是“人工的人工智能”。
今天,mTurk是一個(gè)繁榮的市場(chǎng),上面有來自全球的數(shù)十萬工人。盡管該在線平臺(tái)為本來沒機(jī)會(huì)得到工作的人提供了一個(gè)收入來源,但其勞動(dòng)條件是很有問題的。一些人認(rèn)為,通過將工人隱藏起來并且原子化,Amazon可以更容易地盤剝他們。2017年的一篇論文發(fā)現(xiàn),在平臺(tái)上的工人時(shí)薪中位數(shù)大概是2美元,只有4%能拿到7.25美元以上。 有趣的是,mTurk也成為了機(jī)器學(xué)習(xí)應(yīng)用開發(fā)的關(guān)鍵。在機(jī)器學(xué)習(xí)中,AI程序被賦予了一個(gè)很龐大的數(shù)據(jù)集,然后再自行尋找模式并得出結(jié)論。mTurk的工人被頻繁用于建立這些訓(xùn)練數(shù)據(jù)集并打上標(biāo)簽,但他們?cè)跈C(jī)器學(xué)習(xí)中的角色往往被忽視。 AI社區(qū)與mTurk之間進(jìn)行的那些事兒是貫穿整個(gè)機(jī)器智能史的動(dòng)態(tài)之一。我們熱切地贊美自動(dòng)化“智能機(jī)器”的表象,卻又忽視,或者甚至主動(dòng)隱瞞使之變得可能的人類工作。 也許我們可以從作家埃德加·愛倫·坡那里吸取一些經(jīng)驗(yàn)。當(dāng)他看了von Kempelen的土耳其機(jī)器人之后,他并沒有被幻象迷惑。相反,他在想如果棋手被困在里面的話會(huì)怎樣,躲起來的那個(gè)人被齒輪和連桿“擠得扁扁的,處于極其痛苦又尷尬的位置?!?/p> 在當(dāng)下,當(dāng)關(guān)于AI突破的新聞?lì)^條充斥于我們的新聞流時(shí),記住愛倫坡的取證態(tài)度很重要。被卷入到AI的炒作當(dāng)中是令人愉快的,如果說有時(shí)候會(huì)令人擔(dān)憂的話,而不需要凡夫俗子的機(jī)器這一愿景也令人著迷。但如果你再仔細(xì)看看的話,很可能會(huì)看到人類勞動(dòng)的蛛絲馬跡。 |
|