研究發(fā)現機器學(xué)習算法可以監視在線(xiàn)社交媒體的對話(huà)

2020-01-21 11:14:29    來(lái)源:    作者:

該項目將人工智能(AI)研究人員Anima Anandkumar(布倫計算和數學(xué)科學(xué) 教授)和政治學(xué)教授Michael Alvarez的實(shí)驗室聯(lián)合起來(lái) 。他們的工作于12月14日在加拿大溫哥華舉行的2019年神經(jīng)信息處理系統會(huì )議上的AI for Social Good研討會(huì )上進(jìn)行了介紹。他們的研究團隊包括博士后學(xué)者劉安琪。加州理工學(xué)院的大三學(xué)生Maya Srikanth;斯坦福大學(xué)的Nicholas Adams-Cohen(MS '16,PhD '19)。阿爾瓦雷斯說(shuō):“這是我對加州理工學(xué)院的最?lèi)?ài)之一:跨越界限,發(fā)展社會(huì )科學(xué)與計算機科學(xué)之間的協(xié)同作用的能力。”

研究發(fā)現機器學(xué)習算法可以監視在線(xiàn)社交媒體的對話(huà)

要防止在線(xiàn)騷擾,需要快速檢測到令人反感的,騷擾的和負面的社交媒體帖子,進(jìn)而需要監視在線(xiàn)互動(dòng)。當前獲取此類(lèi)社交媒體數據的方法是完全自動(dòng)化且無(wú)法解釋的,或者依賴(lài)一組靜態(tài)的關(guān)鍵字,而這些關(guān)鍵字很快就會(huì )過(guò)時(shí)。斯里坎特說(shuō),這兩種方法都不是很有效。

她說(shuō):“讓人類(lèi)嘗試手工完成這項工作是不可擴展的,而這些人類(lèi)可能有偏見(jiàn)。” “另一方面,關(guān)鍵字搜索受到在線(xiàn)對話(huà)發(fā)展速度的困擾。新術(shù)語(yǔ)出現了,舊術(shù)語(yǔ)改變了含義,因此真誠地使用一天的關(guān)鍵字可能在第二天被諷刺。

研究發(fā)現機器學(xué)習算法可以監視在線(xiàn)社交媒體的對話(huà)

取而代之的是,該團隊使用GloVe(全球單詞表示向量)模型來(lái)發(fā)現新的相關(guān)關(guān)鍵字。GloVe是一個(gè)詞嵌入模型,意味著(zhù)它代表向量空間中的詞,其中兩個(gè)詞之間的“距離”是其語(yǔ)言或語(yǔ)義相似性的量度。從一個(gè)關(guān)鍵字開(kāi)始,此模型可用于查找與該單詞密切相關(guān)的其他關(guān)鍵字,以揭示實(shí)際使用的相關(guān)術(shù)語(yǔ)的群集。例如,在Twitter中搜索對話(huà)中對“ MeToo”的使用,產(chǎn)生了一系列相關(guān)的標簽,如“ SupportSurvivors”,“ ImWithHer”和“ NotSilent”。這種方法為研究人員提供了一個(gè)動(dòng)態(tài)且不斷發(fā)展的關(guān)鍵字集來(lái)進(jìn)行搜索。

但是僅僅知道某個(gè)對話(huà)是否與感興趣的話(huà)題有關(guān)還不夠。上下文很重要。為此,GloVe顯示了某些關(guān)鍵字的關(guān)聯(lián)程度,提供了有關(guān)其用法的輸入。例如,在一個(gè)專(zhuān)門(mén)針對厭女癥的在線(xiàn)Reddit論壇中,“女性”一詞與“性”,“陰性”和“性交”密切相關(guān)。在有關(guān)#MeToo運動(dòng)的Twitter帖子中,“女性”更可能與“公司”,“欲望”和“受害者”相關(guān)。

研究發(fā)現機器學(xué)習算法可以監視在線(xiàn)社交媒體的對話(huà)

該項目是一種概念證明,旨在有一天為社交媒體平臺提供一種更強大的工具,以發(fā)現在線(xiàn)騷擾。Anandkumar參與了將“神經(jīng)信息處理系統”會(huì )議的簡(jiǎn)稱(chēng)從其首字母縮寫(xiě)“ NIPS”更改為“ NeurIPS”的活動(dòng),從而增強了對該主題的興趣。

“人工智能研究領(lǐng)域變得越來(lái)越具有包容性,但總有人抵制變革。”阿南德庫瑪爾說(shuō)。他在2018年發(fā)現自己是網(wǎng)上騷擾和威脅的目標,因為她成功地努力改用了首字母縮寫(xiě)詞,沒(méi)有潛在的冒犯性含義。 。“關(guān)于如何獲得丑陋的巨魔,這真是令人大開(kāi)眼界。希望我們現在正在開(kāi)發(fā)的工具將有助于將來(lái)應對各種騷擾。”

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。