【原編者按】 本文第一作者克勞迪婭·比安科蒂(Claudia Biancotti)自2002年起供職于意大利中央銀行,現(xiàn)任該行國際經(jīng)濟與國際關(guān)系部高級經(jīng)濟學(xué)家,并自2008年10月起擔(dān)任美國彼得森國際經(jīng)濟研究所訪問學(xué)者。主要關(guān)注技術(shù)公司監(jiān)管,側(cè)重競爭政策對人工智能發(fā)展的影響。 本文認為,數(shù)據(jù)集中對集體安全、消費者權(quán)利和競爭構(gòu)成負面影響,而推行強制性的數(shù)據(jù)共享,即要求市場領(lǐng)袖企業(yè)與其他公司和學(xué)術(shù)界共享用戶數(shù)據(jù)將對競爭帶來正面影響。但另一方面,數(shù)據(jù)共享可能加劇已有的消費者隱私風(fēng)險和集體安全風(fēng)險,推動強制性數(shù)據(jù)共享的決策者應(yīng)權(quán)衡利弊得失。 本文原題“Opening Internet Monopolies to Competition with Data Sharing Mandates”,是彼得森國際經(jīng)濟研究所2019年4月發(fā)布的一份政策簡報(Policy Brief 19-3)。 彼得森國際經(jīng)濟研究所(Peterson Institute for International Economics,PIIE)是一家美國的私立、非營利智庫,1981年創(chuàng)辦,位于美國首都華盛頓。據(jù)美國賓夕法尼亞大學(xué)“智庫與公民社會項目”(TTCSP)2019年1月發(fā)布的《全球智庫報告2018》(2018 Global Go To Think Tank Index Report),彼得森國際經(jīng)濟研究所在“全球頂級智庫(美國和非美國)”分類排名中列第12位。 以下是對該文主要觀點的摘譯,具體技術(shù)細節(jié)請參考原文。文中觀點只代表作者個人,請讀者明察。 體量空前的數(shù)據(jù)為何重要 2009年,來自普林斯頓大學(xué)的一個計算機科學(xué)家小組發(fā)布了ImageNet,這是一個最初包含320萬張數(shù)碼圖片、代表大約5000個真實物體的數(shù)據(jù)庫。機器終于能用足夠的數(shù)據(jù)去理解不同物體的外觀,這標(biāo)志著計算機視覺技術(shù)的轉(zhuǎn)折點。到2015年,計算機在對象識別任務(wù)中的表現(xiàn)超過了人類。 ImageNet拉開了機器學(xué)習(xí)飛速發(fā)展的序幕,這是一種基于算法的人工智能,它通過觀察樣本推導(dǎo)出決策規(guī)則。機器學(xué)習(xí)模型需要大量數(shù)據(jù),盡管早在20世紀(jì)50年代其數(shù)學(xué)基礎(chǔ)就已奠定,但數(shù)十年來,數(shù)據(jù)的缺乏阻礙了模型應(yīng)用。互聯(lián)網(wǎng)和經(jīng)濟數(shù)字化的發(fā)展使得越來越多的數(shù)據(jù)可供研究人員和公司使用,機器學(xué)習(xí)變得司空見慣。 隨著時間的推移,人工智能已從諸如區(qū)分靜態(tài)物體這樣的簡單任務(wù)逐步發(fā)展至更為復(fù)雜的應(yīng)用,這進一步增加了數(shù)據(jù)之于技術(shù)、社會和經(jīng)濟進步的重要性。 經(jīng)濟合作與發(fā)展組織(OECD)已將數(shù)據(jù)驅(qū)動型創(chuàng)新定義為“21世紀(jì)經(jīng)濟增長的關(guān)鍵支柱”。 相較其競爭對手而言,GAFAM(指Google、Apple、Facebook、Amazon、Microsoft五大科技巨頭——譯注)享有顯著的數(shù)據(jù)優(yōu)勢。盡管這些公司之間在所收集數(shù)據(jù)的具體變量集方面存在差異,但它們大多掌握用戶的以下信息:個人識別信息,包括身體特征、社交聯(lián)系、地理位置、職業(yè);信仰、觀點和偏好;線上行為,可能包括瀏覽過的網(wǎng)頁、購買的產(chǎn)品、花費的金額、點擊的鏈接、看過的視頻,以及進行的搜索。將例如實體店信用卡使用記錄這樣的線下活動,與線上行為打通結(jié)合的數(shù)據(jù)收集越來越普遍。 數(shù)據(jù)集中的風(fēng)險 與數(shù)據(jù)集中相關(guān)的首要風(fēng)險涉及集體安全。 所有計算機系統(tǒng)都注定存在技術(shù)漏洞,而一心要利用漏洞發(fā)動網(wǎng)絡(luò)攻擊去獲取利益或?qū)崿F(xiàn)戰(zhàn)略目標(biāo)的敵對行動方數(shù)量龐大。因它們擁有的數(shù)據(jù)價值連城,以及為其他經(jīng)濟活動提供服務(wù),GAFAM成為網(wǎng)絡(luò)攻擊的頭號目標(biāo)。 GAFAM擁有的數(shù)據(jù)若遭大規(guī)模泄露,破壞力將遠超過人們所理解的侵犯隱私。 涉及針對商業(yè)破壞的黑客攻擊時,損害也會遠超直接受害者所承受的損失。網(wǎng)絡(luò)攻擊的負外部性是明顯的。 在這方面,GAFAM和社會上其他公司的利益是一致的:它們都希望避免遭遇攻擊。 涉及數(shù)據(jù)和集體安全之間的另一種關(guān)聯(lián)時,即敵對行動者可以利用GAFAM幾乎無所不在的觸角以及它們基于機器學(xué)習(xí)的洞見去操縱公眾輿論,情況就更復(fù)雜了。 到目前為止,整個行業(yè)主要依靠自律。特別是在美國,立法者一直在發(fā)出含混的信號:他們從聽證會和公眾討論中聽到了對GAFAM的指控,即這些巨頭給信息操縱提供了便利,甚至在這一過程中為達到自身目的而扮演了積極角色,但他們沒有做出任何政策回應(yīng)。 問題很難解決,這尤其是因為,在線上平臺的語境下,說服他人(包括在政治活動中)的合法企圖和惡意歪曲信息之間的界限,很難以具有法律意義的方式劃出。此外,旨在管控發(fā)布內(nèi)容的法律往往會引發(fā)審查方面的顧慮。 越來越多的證據(jù)表明存在數(shù)據(jù)驅(qū)動的誤導(dǎo)信息,在這種情形下,無論對GAFAM自身還是對社會來講,不作為的代價都是高昂的。公眾對網(wǎng)絡(luò)平臺的信任崩塌,出現(xiàn)這樣一個轉(zhuǎn)折點是可能的。懷疑會蔓延到其他數(shù)字環(huán)境,致使人們放棄一些新技術(shù),進而對生產(chǎn)力和經(jīng)濟增長造成損害。 與數(shù)據(jù)集中相關(guān)的第二個風(fēng)險涉及消費者權(quán)利。 企業(yè)獲取和使用由個人提供及與個人相關(guān)的數(shù)據(jù)時產(chǎn)生的部分問題由消費者保護法處理。在這種情況下,企業(yè)規(guī)模不是問題:無論擁有多少消費者,所有數(shù)據(jù)收集者都需要遵循相關(guān)法律。然而,在仍然存在的很多灰色地帶,由于GAFAM的決定影響著數(shù)十億人,它們毫無疑問是標(biāo)準(zhǔn)的制定者。 隱私作為已經(jīng)達成了一些共識的一個領(lǐng)域,被定義為個人通過限制誰可以獲取特定信息來區(qū)分私人和公共領(lǐng)域的能力。大多數(shù)OECD國家已經(jīng)就隱私問題制訂了法律,或正在進行立法。相關(guān)的立法基于如下理念:公司收集的個人數(shù)據(jù)在使用、共享和出售時須征求該人同意。在美國,盡管對這一做法的有效性存在重大疑問,聯(lián)邦層面也依舊沒有隱私法,但一些進程正在推進當(dāng)中。 另一方面,提供數(shù)據(jù)的個人和從數(shù)據(jù)中挖掘收益的公司之間在力量和信息方面的不對稱問題尚未得到廣泛解決。GAFAM的普遍做法是免費提供數(shù)字服務(wù)以換取用戶數(shù)據(jù),但經(jīng)濟學(xué)家們質(zhì)疑這樣的條件是否公平地反映了信息的價值。 數(shù)據(jù)驅(qū)動的歧視是另一個值得關(guān)注的問題。 監(jiān)管機構(gòu)難以查明形式更微妙的算法偏見,在這種偏見作用下,族群、性別、年齡和宗教等變量都可能被不恰當(dāng)?shù)禺?dāng)作決策因素,而且找到證據(jù)非常困難,因為在黑箱模型中,這些變量會與其他變量混淆。 最后,數(shù)據(jù)集中會給公平競爭帶來風(fēng)險。 數(shù)據(jù)賦予GAFAM競爭優(yōu)勢的最明顯渠道,是可以運用機器學(xué)習(xí)算法得出更準(zhǔn)確預(yù)測。這將影響到:(1)旗艦產(chǎn)品市場,和(2)其他產(chǎn)品市場。 GAFAM的競爭優(yōu)勢會延伸到技術(shù)發(fā)展方面,這一事實通常沒有被注意到,但從長遠看意義更為重大。機器學(xué)習(xí)是狹義人工智能(narrow artificial intelligence, NAI)或者說能力局限于完成專門任務(wù)的人工智能的一個范例。下一步有待實現(xiàn)的,是像人類一樣具備創(chuàng)造力和靈活性的機器推理[即通用人工智能(artificial general intelligence, AGI),也稱強人工智能(strong AI)]。就通用人工智能未來可以走多遠,以及狹義人工智能如何逐步向通用人工智能發(fā)展,計算機科學(xué)家的意見并不統(tǒng)一。 但無論如何,更多數(shù)據(jù)可能有助于GAFAM比其他競爭對手更快開發(fā)通用人工智能。此外,它們與頂尖研究機構(gòu)一樣更能吸引到數(shù)據(jù)之外的必要補充資源——科學(xué)人才。 經(jīng)濟學(xué)理論假定,無論是在產(chǎn)品市場還是研究中,競爭優(yōu)勢的存在本身都不是負面的。在一段時間內(nèi)擁有市場支配力并獲得利潤的前景,是激勵企業(yè)創(chuàng)新的一種動力。但當(dāng)占主導(dǎo)地位的公司排斥潛在競爭對手時,問題就出現(xiàn)了。 牢固的市場支配地位可能導(dǎo)致消費者面臨永久獨占性定價(supracompetitive prices)和/或質(zhì)量下降。也可能導(dǎo)致創(chuàng)新減少,因為占主導(dǎo)地位的公司不必投資就可以享受租金,但這一論點是否適用于GAFAM,目前仍無清晰證據(jù)。 強制性數(shù)據(jù)共享 2018年8月,德國社會民主黨領(lǐng)袖安德莉亞·納勒斯(Andrea Nahles)提出的立法倡議要求,超過一定規(guī)模的數(shù)字公司與公眾共享其擁有的部分代表性用戶數(shù)據(jù)。她認為,數(shù)據(jù)共享將為規(guī)模更小的公司開辟新的機會,減少不平等并促進經(jīng)濟增長。 此前幾個月,《經(jīng)濟學(xué)人》雜志也曾提出過一個略有不同的方案,建議技術(shù)市場的領(lǐng)袖企業(yè)有償向競爭對手提供部分用戶數(shù)據(jù)。 在一篇刊登于《外交事務(wù)》雜志的文章中,牛津大學(xué)互聯(lián)網(wǎng)治理專家維克托·邁爾-舍恩伯格(Viktor Mayer- Sch?nberger)和科技新聞記者托馬斯·拉姆什(Thomas Ramge)提出了更為激進的版本:“……系統(tǒng)收集和分析數(shù)據(jù)的每一家一定規(guī)模以上公司,都必須允許擁有同樣市場準(zhǔn)入的其他公司獲取其數(shù)據(jù)的子集。某家公司的市場份額越大,其允許其他公司看到的數(shù)據(jù)就應(yīng)該越多?!? 呼吁實行強制性數(shù)據(jù)共享(data sharing mandates, DSMs)以一種新穎且更全面的方式反映了,在競爭政策制訂過程中,人們對個別公司壟斷關(guān)鍵資源長期存在的擔(dān)憂。 2008年,美國司法部批準(zhǔn)了金融數(shù)據(jù)提供商加拿大湯姆森公司(Thomson Corporation)和英國路透集團(Reuters Group)的合并,條件是湯姆森集團將其三個專有數(shù)據(jù)庫的副本和相關(guān)知識產(chǎn)權(quán)出售和授權(quán)給會在與合并后的實體展開競爭時運用這些數(shù)據(jù)提供產(chǎn)品和服務(wù)的某一家或者幾家公司。司法部認為,一家公司獨享數(shù)據(jù)庫“可能導(dǎo)致價格上漲和創(chuàng)新減少”。歐盟委員會對該并購案也給出了類似的結(jié)論。 在湯姆森路透合并案中,數(shù)據(jù)的競爭相關(guān)性是簡單直接的,因為合并雙方都屬于銷售數(shù)據(jù)的商業(yè)領(lǐng)域。競爭監(jiān)管當(dāng)局飽受研究文獻的批評,研究者們指責(zé),它們在ImageNet取得突破后的最初幾年間,在一些案例中未能權(quán)衡數(shù)據(jù)集中的潛在反競爭效應(yīng):這些案例中的公司沒有出售數(shù)據(jù),而是將數(shù)據(jù)作為投入資源,生產(chǎn)出其他產(chǎn)品。 如今,在歐盟和美國的合并審查中,這一側(cè)面已成為例行考慮。2019年初,在一起涉及互聯(lián)網(wǎng)巨頭的反壟斷裁決中,“將數(shù)據(jù)作為投入資源,生產(chǎn)出其他產(chǎn)品”首次成為一個關(guān)鍵因素,當(dāng)時,德國競爭監(jiān)管機構(gòu)禁止臉書(Facebook)在未得到用戶同意的情況下關(guān)聯(lián)不同服務(wù)之間的數(shù)據(jù),并明確將此舉定義為濫用市場支配地位行為。 強制性數(shù)據(jù)共享要求公司對競爭對手銷售數(shù)據(jù),而不是免費給予,這也可被視為是關(guān)鍵設(shè)施原則(essential facilities doctrine)的一種應(yīng)用。該原則認為,假如一家公司獨家控制一項關(guān)鍵設(shè)施,而該設(shè)施對能在下游市場與之形成有效競爭的其他公司不可或缺,那么該公司就有義務(wù)以合理價格交換這項設(shè)施的準(zhǔn)入許可。盡管在法律學(xué)者中該原則頗受爭議,但在美國和歐盟的反壟斷法庭上,它依舊是諸多決策因素之一。 在應(yīng)對數(shù)據(jù)集中負面影響的眾多可能措施中,強制性數(shù)據(jù)共享顯得特別有意義,因其目標(biāo)是壯大可以從信息中獲取價值的經(jīng)濟參與者的隊伍,同時不會過分約束現(xiàn)有企業(yè)。 在所有競爭問題上,政策制定者都必須力求取得微妙的平衡。他們必須打擊濫用支配地位的行為,防止市場中的領(lǐng)袖企業(yè)自滿,確保公平條件下的市場準(zhǔn)入是可能的,以及必須持續(xù)創(chuàng)新以保持優(yōu)勢。同時,他們必須避免采取那種被認為粗暴隨意的利益再分配措施,因為這可能打擊市場領(lǐng)袖企業(yè)和新興企業(yè)的投資。 對GAFAM而言,尋求這種平衡尤為重要。鑒于這些公司具備創(chuàng)新能力,并在數(shù)字經(jīng)濟中扮演著準(zhǔn)基礎(chǔ)設(shè)施(quasi-infrastructure)的角色,錯誤的激勵組合可能嚴重削弱技術(shù)進步的整體速度,最終損害經(jīng)濟增長。此外,基于互聯(lián)網(wǎng)的服務(wù)市場正在逐步全球化,但在一些司法管轄區(qū)向外國供應(yīng)商開放市場準(zhǔn)入的同時,也有地區(qū)實施了限制。美國和歐盟制定的任何旨在遏制GAFAM支配地位帶來的負面效應(yīng)的政策干預(yù)或執(zhí)法策略,都應(yīng)考慮到平等競爭環(huán)境的缺失。當(dāng)下市場準(zhǔn)入的不對稱性不應(yīng)有利于那些源自封閉市場的玩家。 政策權(quán)衡 如果僅依據(jù)潛在的競爭優(yōu)勢進行評估,強制性數(shù)據(jù)共享本質(zhì)上是不錯的,盡管在應(yīng)用范圍上受到一定程度的限制。相關(guān)要求將使得更多企業(yè)有可能在依靠分析人類行為的廣泛領(lǐng)域中收獲基于機器學(xué)習(xí)的見解,或是改進已有的見解。 設(shè)計、生產(chǎn)和營銷選擇都將得到提升,整體經(jīng)濟表現(xiàn)也將得到提升。 然而在競爭事宜之外,強制性數(shù)據(jù)共享并不是一個明確的積極解決方案。一個關(guān)鍵問題是隱私保護。在包括歐盟和加州在內(nèi)的多個管轄區(qū)內(nèi),未經(jīng)數(shù)據(jù)主體同意,企業(yè)向第三方共享其收集的個人數(shù)據(jù)是違法的,而共享匿名數(shù)據(jù)是合法的。 假設(shè)立法者并不介意為推動數(shù)據(jù)共享而放棄通行的數(shù)據(jù)保護法規(guī),那么任何強制性數(shù)據(jù)共享舉措都必定需要獲得數(shù)據(jù)主體同意才能共享可識別信息,或是只能共享匿名數(shù)據(jù)。 依賴用戶同意是極成問題的。個人對隱私的偏好差異很大,難以衡量,有時甚至是矛盾的。 鑒于更小型公司的保護標(biāo)準(zhǔn)與大公司相比通常更弱,增加能接觸到個人信息的實體的數(shù)量一樣會增加歧視的機會和黑客攻擊的風(fēng)險。進而,即使共享的所有參與方都遵守數(shù)據(jù)保護法規(guī),這樣的共享仍威脅到用戶隱私和集體安全。 此外,共享個人身份識別符(personal identifier)的要求,使得強制性數(shù)據(jù)共享對GAFAM來說成本太過高昂。 假設(shè)機器學(xué)習(xí)算法的目標(biāo)是要預(yù)測某個人喜歡什么樣的新音樂,那么它不必知道該人的姓名,有關(guān)人口統(tǒng)計、位置和聆聽習(xí)慣的匿名信息已經(jīng)足夠。但如果廣告商希望向特定的個人推廣唱片,他們就必須獲取他/她的個人信息。 強制共享不含身份信息的數(shù)據(jù),令新興企業(yè)得以運用機器學(xué)習(xí),由此可以促進競爭,但不會立即破壞GAFAM獨占的市場影響力。出于這些原因,強制性數(shù)據(jù)共享理當(dāng)要求相關(guān)企業(yè)在共享數(shù)據(jù)之前對那些數(shù)據(jù)進行匿名處理。但需要注意的是,這個方案仍遠不能消除風(fēng)險。 離群值移除或有限數(shù)據(jù)屏蔽(data obfuscation),在傳統(tǒng)統(tǒng)計學(xué)調(diào)查中已被證明是進行匿名化處理的成功方法,但在數(shù)據(jù)庫巨大、復(fù)雜且高粒度的新環(huán)境下,這一類方法表現(xiàn)并不好。利用多種技術(shù),這些數(shù)據(jù)庫特別容易重新識別出數(shù)據(jù)主體。(粒度,是指數(shù)據(jù)庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合程度的級別——譯注) 就如何更好地防范這一可能并生成保護隱私的人工合成數(shù)據(jù),相關(guān)研究正取得進展。相應(yīng)地,因企業(yè)在機器學(xué)習(xí)方面已有嘗試,這可以減少企業(yè)對大量用戶數(shù)據(jù)的依賴,進而在一定程度上推動所謂機器學(xué)習(xí)的“民主化”。(民主化,意指減少準(zhǔn)入障礙,對更大社區(qū)開放——譯注) 然而,未來仍有很長一段距離要走。 任何基于匿名化處理的強制性數(shù)據(jù)共享都意味著要在隱私保護與信息的經(jīng)濟價值之間進行權(quán)衡。而經(jīng)刪除和處理的信息,其經(jīng)濟價值會減少,因此這一權(quán)衡需要仔細評估。如何確認哪些信息在經(jīng)濟上最有價值,當(dāng)前的知識經(jīng)驗仍非常有限,有待拓展。 在設(shè)計政策糾正數(shù)字經(jīng)濟中的力量不平衡問題時,競爭與隱私之間的權(quán)衡并非唯一考量。培育數(shù)據(jù)市場,讓信息回報在這樣的市場中在消費者和企業(yè)之間進行更公平的分配,從理論上講是有價值的目標(biāo)。這一目標(biāo),或許可以通過實施恰當(dāng)?shù)膹娭苹瘮?shù)據(jù)共享規(guī)范或不同的舉措來實現(xiàn)。 另一方面,安全風(fēng)險可能浮現(xiàn)。如果個人能夠通過出售自己的數(shù)據(jù)獲益,那么遭泄露信息的數(shù)量可能增加,能夠獲取信息的參與方也可能增加。在一個開放的數(shù)據(jù)市場上,GAFAM不會是唯一的可能買家:任何使用機器學(xué)習(xí)或希望拓展其業(yè)務(wù)的企業(yè)都會表現(xiàn)出購買興趣。為防止敵對行動者冒充合法企業(yè)并批量購買個人數(shù)據(jù),保護措施是必要的。 (本文由鄭永妍摘譯 ) |
|