一周前,谷歌發(fā)布的一項(xiàng)創(chuàng)紀(jì)錄的AI(人工智能)研究成果顯示,當(dāng)前的AI繁榮的關(guān)鍵業(yè)務(wù)動(dòng)態(tài):消費(fèi)者和經(jīng)濟(jì)越來(lái)越依賴的科技公司的生態(tài)系統(tǒng),傳統(tǒng)上被認(rèn)為是通過(guò)破壞而保持創(chuàng)新和非壟斷的小型公司的快速發(fā)展壯大。但是當(dāng)競(jìng)爭(zhēng)取決于由大量數(shù)據(jù)所驅(qū)動(dòng)的機(jī)器學(xué)習(xí)系統(tǒng)時(shí),顛覆科技巨頭可能比以往更難! 谷歌公布了與卡內(nèi)基梅隆大學(xué)的合作。他們?cè)趫D像識(shí)別上的實(shí)驗(yàn)花了整整兩個(gè)月的時(shí)間,把50個(gè)強(qiáng)大的圖形處理器捆綁在一起,并使用了空前龐大的3億張標(biāo)記圖像集合(圖像識(shí)別中的大量工作只使用了100萬(wàn)個(gè)圖像的標(biāo)準(zhǔn)集合)。該項(xiàng)目旨在測(cè)試是否可以獲得更準(zhǔn)確的圖像識(shí)別,而不是通過(guò)調(diào)整現(xiàn)有算法的設(shè)計(jì),而只是通過(guò)給他們更多的數(shù)據(jù)。 在Google和CMU的研究人員對(duì)他們的新的數(shù)據(jù)集進(jìn)行了一個(gè)標(biāo)準(zhǔn)的圖像處理系統(tǒng)培訓(xùn)之后,他們表示,它在多個(gè)標(biāo)準(zhǔn)測(cè)試中產(chǎn)生了新的最先進(jìn)的結(jié)果,用于軟件如何解讀圖像,例如檢測(cè)照片中的對(duì)象。他們抽取的數(shù)據(jù)量和出現(xiàn)的圖像識(shí)別算法的準(zhǔn)確性之間存在明確的關(guān)系。 更多的數(shù)據(jù)可以在更大的范圍內(nèi)表現(xiàn)出更多的性能,這表明作為一個(gè)數(shù)據(jù)豐富的科技巨頭,如谷歌、臉譜網(wǎng)或微軟,可能比以前實(shí)現(xiàn)的更大的好處。谷歌的大數(shù)據(jù)集處理3億圖像不產(chǎn)生巨大效益的跳躍從100萬(wàn)到3億的圖像目標(biāo)檢測(cè)評(píng)分增加3個(gè)百分點(diǎn),科技巨頭可以通過(guò)調(diào)整他們的算法更適合于超大型數(shù)據(jù)集擴(kuò)大優(yōu)勢(shì)。 以AI為中心的公司,數(shù)據(jù)囤積已經(jīng)成為一種防御性戰(zhàn)略。谷歌,微軟等人都開(kāi)源軟件,甚至是硬件設(shè)計(jì),但是使用這種工具有用的種類數(shù)據(jù)卻不那么自由。技術(shù)公司確實(shí)發(fā)布數(shù)據(jù):去年,谷歌發(fā)布了超過(guò)700萬(wàn)個(gè)YouTube視頻的大量數(shù)據(jù)集,Salesforce開(kāi)辟了維基百科的一個(gè)數(shù)據(jù)集,幫助算法與語(yǔ)言協(xié)同工作。但是這種版本的大數(shù)據(jù)通常對(duì)潛在競(jìng)爭(zhēng)對(duì)手的價(jià)值并不高,也沒(méi)有太大的商業(yè)價(jià)值,科技巨頭掌握的大數(shù)據(jù)具有商業(yè)價(jià)值的部分是不會(huì)對(duì)外公開(kāi)的。 |
|
來(lái)自: yazhongwang > 《文件夾1》