微軟發(fā)布對話(huà)數據集以使聊天機器人更智能

2020-04-04 20:47:34    來(lái)源:新經(jīng)網(wǎng)    作者:安曉星

致力于通用人工智能的微軟公司Maluuba最近發(fā)布了一個(gè)新的開(kāi)放式對話(huà)數據集,該數據集基于預訂假期-尤其是尋找航班和旅館。

聊天機器人的數量最近有所增加,特別是自一年前Facebook 對這些機器人開(kāi)放Messenger平臺以來(lái)。

微軟發(fā)布對話(huà)數據集以使聊天機器人更智能

目前,大多數漫游器僅支持非常簡(jiǎn)單和順序的交互。聊天機器人仍然難以完成旅行計劃之類(lèi)的高級用例。

有了這個(gè)數據集,Maluuba(最近被Microsoft收購)可幫助研究人員和開(kāi)發(fā)人員使其聊天機器人變得更智能。

Maluuba通過(guò)讓兩個(gè)人在聊天框中進(jìn)行通信來(lái)收集此數據。一個(gè)人扮演用戶(hù),而另一個(gè)人則扮演他就像是一臺計算機。

微軟發(fā)布對話(huà)數據集以使聊天機器人更智能

用戶(hù)試圖找到最適合自己航班的優(yōu)惠,而玩聊天機器人的人則使用數據庫來(lái)檢索信息。交互僅由文本組成(沒(méi)有語(yǔ)音交互),這是研究人員的有意識選擇。

大多數人都喜歡打字而不是說(shuō)話(huà),這意味著(zhù)該數據集沒(méi)有不良的語(yǔ)音識別和背景噪音。結果是一個(gè)包含1,369個(gè)旅行計劃對話(huà)的數據集,可以免費下載。

馬魯巴還提出了代表對話(huà)的一種方式。使旅行計劃更加困難的是,用戶(hù)經(jīng)常更改他們的談話(huà)主題。同時(shí),您可能會(huì )討論前往滑鐵盧,蒙特利爾和多倫多的計劃。我們的人類(lèi)毫無(wú)疑問(wèn)地將人們在談話(huà)時(shí)制定的不同計劃分開(kāi)。

微軟發(fā)布對話(huà)數據集以使聊天機器人更智能

不幸的是,如果用戶(hù)在預訂之前瀏覽了多個(gè)選項,則計算機會(huì )遇到問(wèn)題。當您突然進(jìn)入新目的地時(shí),大多數聊天機器人都會(huì )忘記您談?wù)摰乃袃热荨?/span>

在左下方的圖像中,您可以看到與“傳統”聊天機器人的交互。一旦用戶(hù)說(shuō)出新城市,機器人就會(huì )忘記舊城市。在右側,您可以看到發(fā)布的數據集中出現的一種模式:用戶(hù)在做出決定之前先比較多個(gè)城市。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。