?
?
圖片來源:Werner Pfennig from Pexels
?
機(jī)器之心報道
編輯:魔王、陳萍
?
在人工智能打敗專業(yè)國際象棋選手、圍棋選手,并在多個電子游戲中大展身手之后,現(xiàn)在它沖著職業(yè)辯論選手來了!
?
辯論是指對某個議題或主張,以言語為主要方式,為分辨不同立場之優(yōu)劣而進(jìn)行的一種爭論方式。辯論需要精湛的口才或強(qiáng)大的邏輯? 思辯能力,且講求反應(yīng)。
?
辯論比賽不是人人都能上,很多人甚至連吵完架都后悔沒發(fā)揮好,那么 AI 呢?它能在辯論中發(fā)揮出怎樣的成績呢?
?
2012 年,IBM 海法研究院開始研發(fā)能夠與人類辯論的 AI 系統(tǒng)——Project Debater。2018 年 6 月,Project Debater 打敗人類專業(yè)辯手,并在 2019 年 2 月第二次亮相時,對陣 2016 年世界辯論決賽選手、歐洲辯論賽冠軍 Harish Natarajan。雖然在這次人機(jī) battle 中,Project Debater 未能獲得勝利,但它展示出了優(yōu)秀的構(gòu)建論據(jù)以及決策能力。
?
IBM 關(guān)于 Project Debater 的一項(xiàng)新研究登上了 Nature 封面,介紹了 Project Debater 的架構(gòu)并進(jìn)行了性能評估。
?
?
Project Debater 與人類的對戰(zhàn)
?
辯論賽的一大難點(diǎn)是論據(jù)挖掘,在很長時間里這一能力都被認(rèn)為超出 AI 能力范疇。但 AI 技術(shù)進(jìn)展、日益成熟的工程技術(shù)和廣泛的商業(yè)需求促使該領(lǐng)域快速發(fā)展。IBM 海法研究院 Noam Slonim 博士等人決定開啟一項(xiàng)挑戰(zhàn):開發(fā)一個能夠與人類進(jìn)行現(xiàn)場辯論的完全自主系統(tǒng)。
?
這就是 Project Debater。
?
Project Debater 是一項(xiàng)巨大的工程成就,融合了多種基于文本收集和解釋辯論相關(guān)材料的新方法。
?
研究人員為了評估 Project Debater 系統(tǒng)的總體性能,將其與各種基線進(jìn)行比較,并跟蹤其隨時間的進(jìn)展情況,由結(jié)果可得,Project Debate 的評估結(jié)果明顯優(yōu)于其他系統(tǒng),并且非常接近人類專家的得分。
?
Project Debater 系統(tǒng)對比評估。
?
和幾乎所有目標(biāo)高遠(yuǎn)的 AI 研究一樣,Project Debater 面臨一個關(guān)鍵的瓶頸,即如何獲取足夠的數(shù)據(jù),以便計(jì)算出一個有效的解決方案。Project Debater 用雙管齊下的方法解決了這一問題:它將關(guān)注范圍縮小到約 100 個辯題;從龐大的數(shù)據(jù)集中獲取原材料。
?
在 2018 年和 2019 年的一系列活動中,「Project Debater」與多名才華橫溢、備受矚目的人類辯手進(jìn)行了較量,觀眾對其辯論進(jìn)行了非正式評估。
?
在 1v1 辯論中,該系統(tǒng)進(jìn)行一個 4 分鐘的演講,人類對手對此作出回應(yīng)。然后,「Project Debater」對對手的觀點(diǎn)做出回應(yīng),發(fā)表第二個 4 分鐘辯論,對手用 4 分鐘的時間進(jìn)行反駁。最后,雙方都做了 2 分鐘的最終陳述。
?
人機(jī)比賽的辯論流程
?
該系統(tǒng)最薄弱之處或許是它難以模仿人類辯手的連貫性和流暢度,這與論據(jù)選擇、抽象和編排的最高層次有關(guān)。然而,這種限制并非「Project Debater」所獨(dú)有。盡管對辯論已經(jīng)進(jìn)行了兩千年的研究,但人們對論證結(jié)構(gòu)仍然知之甚少。
?
構(gòu)成優(yōu)秀論證的模型是多樣化的,而構(gòu)成優(yōu)秀辯論的模型僅僅相當(dāng)于形式化的直覺。因此,當(dāng)時 Project Debater 的性能評估僅僅是通過詢問人類觀眾是否認(rèn)為它「表現(xiàn)不錯」來完成的。在幾乎三分之二的辯題中,人類認(rèn)為是這樣的。
?
所有辯論技術(shù)系統(tǒng)面臨的最終挑戰(zhàn)是:將論據(jù)視為受一系列孤立考慮因素影響的局部話語片段,還是將其編入更大范圍的社會規(guī)模辯論中。在很大程度上,這關(guān)乎于如何設(shè)計(jì)待解決的問題,而不是如何制定解決方案。通過在論據(jù)上設(shè)置先驗(yàn)界限,得到理論上的簡化,從而提供計(jì)算優(yōu)勢。
?
此外,在現(xiàn)實(shí)世界中,論據(jù)并不存在明確的界限:發(fā)生在辯論室之外的話語不是離散的,而是與一個交叉引用、類比、舉例和泛化的網(wǎng)絡(luò)連接起來。關(guān)于 AI 如何處理這種論據(jù)網(wǎng)絡(luò)的想法已經(jīng)在理論上被提出,并用軟件實(shí)現(xiàn)——DebateGraph。
?
但這些實(shí)現(xiàn)面臨了棘手的理論挑戰(zhàn)和社會技術(shù)問題。
?
「Project Debater」是辯論技術(shù)發(fā)展的關(guān)鍵一步,也是將論據(jù)作為局部現(xiàn)象來處理的關(guān)鍵一步。它的成功讓我們看到了 AI 系統(tǒng)是如何輕松處理論據(jù)網(wǎng)絡(luò)的。
?
Project Debater 輸出的辯論內(nèi)容類型分析。
?
Project Debater 解決了一項(xiàng)重大挑戰(zhàn),它也代表了 AI 在促進(jìn)人類推理方面的進(jìn)步,正如 Slonim 等人所說,「這遠(yuǎn)遠(yuǎn)超出了當(dāng)前 AI 技術(shù)的舒適區(qū)。」
?
?
如何造就強(qiáng)大的 AI 辯手
?
Project Debater 包含四個主要組件:論據(jù)挖掘、論據(jù)知識庫(AKB)、論點(diǎn)反駁和辯論構(gòu)建。其中前兩個模塊是辯論語音的內(nèi)容源。
?
論據(jù)挖掘組件負(fù)責(zé)找出與辯題相關(guān)的論據(jù)和反駁論據(jù),它包含兩個階段。在離線階段中,該組件處理包含 4 億新聞文章的大型語料庫,將這些文章拆分為句子并進(jìn)行索引。在在線階段中,該模塊基于給出的辯題依靠索引在語料庫中執(zhí)行句子級的論據(jù)挖掘、相關(guān)論斷和論據(jù)檢索。
?
正所謂「知己知彼,百戰(zhàn)不殆」,該模塊還會搜索支持對方觀點(diǎn)的論據(jù),這些論據(jù)將在論點(diǎn)反駁模塊中得到使用。
?
AKB 模塊則包含論據(jù)、反駁論據(jù)和與一般辯論類別相關(guān)的其他文本。給出一道辯題,它就可以找出最相關(guān)的材料。
?
論點(diǎn)反駁模塊基于前兩個模塊預(yù)測對手的反對主張,并生成潛在的回應(yīng)。最后的辯論構(gòu)建模塊則選擇其他模塊提議的文本,并將其組合成流暢的表述。
?
?
此外,IBM 還提供了 Project Debater 12 種底層技術(shù)的云 API,以供學(xué)術(shù)使用。
?
地址:https://early-access-program.debater.res.ibm.com/academic_use.html
?
?
這些 API 包括處理 wikification、維基百科概念間的語義關(guān)聯(lián)、短文本聚類和文本主題提取的自然語言理解能力。API 的核心部分服務(wù)于論據(jù)挖掘與分析,包括檢測包含主張和論據(jù)的句子、檢測句子中的主張界限、評估論據(jù)質(zhì)量和立場分類(支持 / 反對)。
?
此外,Narrative Generation 和 Key Point Analysis API 還提供兩項(xiàng)高級服務(wù)——創(chuàng)建不同類型的總結(jié)。Narrative Generation 為支持或反駁給定主題構(gòu)建結(jié)構(gòu)完備的語音。Key Point Analysis 是一種新型有前景的摘要方法,它可以基于給定主題將評論總結(jié)為一小組關(guān)鍵點(diǎn),每個關(guān)鍵點(diǎn)的重要程度由評論中匹配句子的數(shù)量決定。
?
感興趣的開發(fā)者可以申請?jiān)囉谩?/p>
?
參考鏈接:
https://www.nature.com/articles/d41586-021-00539-5
https://www.ibm.com/blogs/research/2021/03/project-debater-api/
關(guān)注【深圳科普】微信公眾號,在對話框:
回復(fù)【最新活動】,了解近期科普活動
回復(fù)【科普行】,了解最新深圳科普行活動
回復(fù)【研學(xué)營】,了解最新科普研學(xué)營
回復(fù)【科普課堂】,了解最新科普課堂
回復(fù)【科普書籍】,了解最新科普書籍
回復(fù)【團(tuán)體定制】,了解最新團(tuán)體定制活動
回復(fù)【科普基地】,了解深圳科普基地詳情
回復(fù)【觀鳥知識】,學(xué)習(xí)觀鳥相關(guān)科普知識
回復(fù)【博物學(xué)院】,了解更多博物學(xué)院活動詳情