在人工智能發(fā)展的早期,研究人員意識到了能夠理解人類(lèi)語(yǔ)音的含義和細微差別的機器的功能和可能性。對話(huà)和人類(lèi)語(yǔ)言是計算機特別具有挑戰性的領(lǐng)域,因為單詞和交流不精確。人類(lèi)語(yǔ)言充滿(mǎn)了細微差別,上下文,文化和社會(huì )深度以及不精確性,可能導致各種各樣的解釋。如果計算機可以理解我們談話(huà)時(shí)的意思,然后以一種我們可以理解的方式與我們交流,那么很顯然,我們已經(jīng)實(shí)現了人工智能的目標。
對話(huà)互動(dòng)是AI的一種模式

AI的這種特殊應用是如此深刻,以至于構成了AI的七個(gè)基本模式之一:對話(huà)和人類(lèi)交互模式。對話(huà)模式的基本目標是使機器能夠以人類(lèi)自然語(yǔ)言模式與人類(lèi)進(jìn)行交流,并使機器能夠以他們所理解的語(yǔ)言與人類(lèi)進(jìn)行交流。對話(huà)模式不要求人類(lèi)遵循諸如打字,滑動(dòng),點(diǎn)擊或使用計算機編程語(yǔ)言之類(lèi)的交互機器模式,而是可以以彼此交互的方式與機器交互:以我們的大腦已經(jīng)被理解的方式進(jìn)行寫(xiě)作和交流。
當今AI狹義應用的許多情況都集中在人類(lèi)交流上。如果計算機能夠理解人類(lèi)在交流時(shí)的含義,那么我們可以創(chuàng )建各種具有實(shí)用價(jià)值的應用程序,從聊天機器人和對話(huà)代理到可以讀取我們在文檔和電子郵件中寫(xiě)的內容的系統,甚至可以準確地翻譯出一個(gè)人的系統。人類(lèi)語(yǔ)言,而又不會(huì )失去意義和語(yǔ)境。
機器對人,機器對機器以及人對機器的交互都是AI如何交流和理解人類(lèi)交流的例子?,F實(shí)生活中的一些示例包括語(yǔ)音助手,內容生成,聊天機器人,情緒分析,情緒分析和意圖分析,以及機器驅動(dòng)的翻譯。對話(huà)模式的應用是如此廣泛,以至整個(gè)市場(chǎng)領(lǐng)域都專(zhuān)注于使用具有AI功能的對話(huà)系統,從對話(huà)金融到遠程醫療等等。除了簡(jiǎn)單地理解書(shū)面或口頭語(yǔ)言外,AI對話(huà)模式的力量還可以通過(guò)機器理解情感,情緒和意圖的能力來(lái)體現,或者通過(guò)視覺(jué)手勢將其轉換為機器可理解的形式。
自然語(yǔ)言處理:在過(guò)去的幾十年中不斷發(fā)展
準確地處理和生成人類(lèi)語(yǔ)言特別復雜,過(guò)去六十年來(lái),技術(shù)不斷發(fā)展。解決問(wèn)題的一種方法是將音頻波形轉換為機器可讀的文本,稱(chēng)為自動(dòng)語(yǔ)音識別(ARS)。盡管ASR的實(shí)現有些復雜,但它通常不需要機器學(xué)習或AI功能,并且幾十年來(lái)已經(jīng)出現了一些相當準確的語(yǔ)音轉文本技術(shù)。語(yǔ)音轉文字不是自然語(yǔ)言的理解。當計算機記錄人類(lèi)在說(shuō)什么時(shí),它會(huì )獲取它能理解的波形并將其轉換為文字。它不會(huì )解釋正在聽(tīng)到的數據。
文本轉換為語(yǔ)音的逆向功能也不需要太多的機器學(xué)習或AI方式。文本到語(yǔ)音只是由計算機生成的波形,用以說(shuō)出已知的單詞。僅使用文本到語(yǔ)音時(shí),對這些單詞的含義沒(méi)有任何了解。文字語(yǔ)音轉換技術(shù)已經(jīng)存在了很多年,您可以在電影《戰爭游戲》(1983年)中聽(tīng)到:“您想玩游戲嗎?”
但是,即使機器學(xué)習已幫助文本轉語(yǔ)音變得更人性化,并且語(yǔ)音轉文本更準確,語(yǔ)音轉文本和文本轉語(yǔ)音也不是需要AI和機器學(xué)習的地方。自然語(yǔ)言處理(NLP)不僅涉及波形的轉換和音頻波形的生成。僅僅因為您有文字并不意味著(zhù)機器可以理解它。為了獲得這種理解,機器需要能夠理解和生成詞性,提取和理解實(shí)體,確定單詞的含義以及使用更為復雜的處理活動(dòng)將概念,短語(yǔ),概念和語(yǔ)法連接在一起,從而形成更大的畫(huà)面。意圖和意義。
自然語(yǔ)言處理包括兩個(gè)部分:自然語(yǔ)言理解和自然語(yǔ)言生成。自然語(yǔ)言理解是指計算機解釋諸如語(yǔ)音或文本之類(lèi)的人類(lèi)輸入并將其轉換為機器能夠以預期方式使用的東西。自然語(yǔ)言理解由許多子域組成,這些子域試圖從音頻波形生成的文本或人類(lèi)在文本模式交互(例如聊天機器人或消息傳遞界面)中鍵入的文本中理解意圖。AI應用于詞法分析,以理解語(yǔ)法規則并將句子分解為結構性成分。不管使用哪種方法,大多數自然語(yǔ)言理解系統都共享一些公共組件。然后,一旦確定了組件,每件作品都可以在語(yǔ)義上理解為基于上下文和單詞順序來(lái)解釋單詞。進(jìn)一步的邏輯分析和推論可用于使用知識圖和其他推論含義的方法,基于各個(gè)部分所指的內容來(lái)確定含義。
自然語(yǔ)言的生成是AI能夠以任何自然的方式聽(tīng)起來(lái)不像是計算機制作的形式為人類(lèi)準備交流的過(guò)程。為了使計算機過(guò)程被視為自然語(yǔ)言的生成,計算機實(shí)際上必須解釋內容并理解其內容以進(jìn)行有效的交流。這涉及自然語(yǔ)言理解中確定的許多步驟的逆轉,這些概念采用概念并通過(guò)機器如何理解人類(lèi)的交流方式來(lái)產(chǎn)生人類(lèi)可理解的對話(huà)。
為什么機器便利的對話(huà)如此重要?
歸結為人與計算機通信的模式時(shí),它受到了極大的關(guān)注,因為有時(shí)我們與系統的交互可能非常困難。鍵入或滑動(dòng)可能會(huì )花費一些時(shí)間,并且無(wú)法正確傳達我們的需求,而閱讀諸如FAQ之類(lèi)的靜態(tài)內容可能對大多數客戶(hù)沒(méi)有幫助。人們希望與機器進(jìn)行高效交互。許多用戶(hù)界面對于人機交互而言并不是最理想的,需要混亂的菜單交互,過(guò)于簡(jiǎn)單的交互式語(yǔ)音響應系統或無(wú)法滿(mǎn)足用戶(hù)需求的基于規則的聊天機器人。
更加智能的對話(huà)系統的開(kāi)發(fā)可以追溯到幾十年前,而ELIZA聊天機器人最早于1966年開(kāi)發(fā),說(shuō)明了機器介導的對話(huà)的可能性。如今,用戶(hù)更加熟悉語(yǔ)音助手,例如Alexa,Google Assistant,Apple Siri,Microsoft Cortana和基于Web的聊天機器人。但是,如果您最近與他們中的任何一個(gè)進(jìn)行過(guò)互動(dòng),那么他們仍然缺乏許多重要方式的理解。毫無(wú)疑問(wèn),人工智能研究人員的許多工作將致力于改善機器能夠理解和生成人類(lèi)語(yǔ)言的方式,從而增強那些利用人工智能對話(huà)模式的應用程序的功能。
