文/陳根 比爾·蓋茨曾說:“語言理解是人工智能皇冠上的明珠”。 其中,自然語言處理(NaturalLan-guageProcessing,NLP)是將人類交流溝通所用的語言經(jīng)過處理轉化為機器所能理解的機器語言,是一種研究語言能力的模型和算法框架,是語言學和計算機科學的交叉學科,是實現(xiàn)人機間的信息交流,是人工智能、計算機科學和語言學所共同關注的重要方向。 顯然,誰掌握了更高級的自然語言處理技術,誰在自然語言處理的技術研發(fā)中取得了實質突破,誰就將在日益激烈的人工智能軍備競賽中占得先機。一直以來,讓計算機對自然語言的理解和處理能力接近人類,也是科學家們的終極愿景。 近日,來自IBM的AI研究團隊就報告了Project Debater(“辯手項目”)的最新進展,研究團隊表示,該系統(tǒng)已可以與人類專家選手進行體面且有意義的現(xiàn)場辯論,它能通過儲存了4億篇新聞報道和維基百科頁面的知識庫,自行組織開場白和反駁論點。 ![]() 從演示成果來看,研究人員定義了一種辯論形式,它是學術競爭性辯論中常用的辯論風格簡化版,即一旦被稱為 “辯論動議” 的主題宣布,Project Debater 和人類選手都各有 15 分鐘的準備時間。準備就緒后,雙方就開始輪流發(fā)言。 研究人員選擇了 78 個動議來評估當一個新的辯題出現(xiàn)時,各種 AI 系統(tǒng)以及人類專家的表現(xiàn),每一次演講都由 15 位評審員進行了回顧評分,以判斷此演講是否能作為支持辯題立場的良好開場白,其中 5 分表示高度一致。評估結果顯示,Project Debate明顯優(yōu)于其他系統(tǒng),并且非常接近人類專家的得分。 在開場白之后的評估中,研究人員使用了相同的 78 個動議,再次要求被選中的一組人群想象自己是辯論聽眾,在這種情況下,讓他們閱讀三篇辯論演講,但不告知演講的來歷。 結果顯示,所有辯題 Project Debater 的平均得分均高于中立 3 分,78 個動議中有 50 次表現(xiàn)的平均得分≥4 分,這表明,在至少 64% 的動議中,群眾評論員認為 Project Debater 在辯論中表現(xiàn) “良好”。不過,雖然Project Debater 得分顯著高于所有對比基線和對照組的得分,但距離人類專家的得分還有明顯差距。 當然,作為一門包含著計算機科學、人工智能以及語言學的交叉學科,自然語言處理的發(fā)展也經(jīng)歷了曲折中發(fā)展的過程。但現(xiàn)在,在圖像識別和語音識別領域的成果激勵下,人工智能理解人類語言已經(jīng)展現(xiàn)出了過去不曾想像的可能。 |
|