LinkedIn正在使用AI查找和刪除不適當的用戶(hù)帳戶(hù)

2020-01-22 11:19:51    來(lái)源:    作者:

包括Facebook,Twitter和Pinterest在內的社交網(wǎng)絡(luò )都可以利用AI和機器學(xué)習系統來(lái)檢測和刪除濫用內容,就像LinkedIn一樣。微軟擁有的平臺擁有6.6億用戶(hù),其中每月有3.03億活躍。今天,該平臺詳細介紹了其處理包含不當內容的配置文件的方法,從褻瀆到非法服務(wù)廣告。

LinkedIn正在使用AI查找和刪除不適當的用戶(hù)帳戶(hù)

正如軟件工程師Daniel Gorham在博客文章中所解釋的那樣,LinkedIn最初依賴(lài)于阻止列表(一組違反其服務(wù)條款和社區準則的人工編寫(xiě)的單詞和短語(yǔ))來(lái)識別和刪除潛在的欺詐性帳戶(hù)。但是,對其進(jìn)行維護需要大量的工程工作,并且列表往往無(wú)法很好地處理上下文。(例如,雖然“護送”一詞有時(shí)與賣(mài)淫有關(guān),但它也用于“安全護送”或“醫療護送”等語(yǔ)境中。)

這激勵了LinkedIn采取一種涉及卷積神經(jīng)網(wǎng)絡(luò )的機器學(xué)習方法,卷積神經(jīng)網(wǎng)絡(luò )是一類(lèi)通常應用于圖像分析的算法,并接受了公開(kāi)會(huì )員資料內容的培訓。有問(wèn)題的內容包含標記為“不適當”或“適當”的帳戶(hù),其中前者包括由于使用阻止列表和手動(dòng)審核發(fā)現的不適當內容而刪除的帳戶(hù)。Gorham指出,只有每個(gè)帳戶(hù)的“很小”部分都受到這種限制,這需要從整個(gè)LinkedIn成員庫中進(jìn)行下采樣才能獲得帶有“適當”標簽的帳戶(hù),并避免算法偏差。

LinkedIn正在使用AI查找和刪除不適當的用戶(hù)帳戶(hù)

為了進(jìn)一步減少偏見(jiàn),LinkedIn確定了造成大量誤報的有問(wèn)題的單詞,并從包含這些單詞的成員庫中抽取了適當的帳戶(hù)。然后,對帳戶(hù)進(jìn)行人工標記并添加到訓練集中,然后對模型進(jìn)行訓練并將其部署到生產(chǎn)中。

戈勒姆說(shuō),濫用帳戶(hù)檢測器每天會(huì )為新帳戶(hù)評分,并且該帳戶(hù)檢測器是在現有成員基礎上運行的,以識別包含不適當內容的舊帳戶(hù)。展望未來(lái),LinkedIn打算使用Microsoft翻譯服務(wù)來(lái)確保所有語(yǔ)言的一致性能,并完善和擴展培訓集以擴大其能夠在模型中識別的內容范圍。

“檢測和防止LinkedIn上的濫用是一項持續不斷的工作,需要多個(gè)團隊之間的廣泛合作,” Gorham寫(xiě)道。“以有效,可擴展的方式查找和刪除包含不適當內容的配置文件是我們不斷努力提供安全專(zhuān)業(yè)平臺的一種方式。”

LinkedIn正在使用AI查找和刪除不適當的用戶(hù)帳戶(hù)

LinkedIn對AI的使用不僅限于濫用內容檢測。在2019年10月,它拉開(kāi)了模型的帷幕,該模型會(huì )自動(dòng)生成上傳到LinkedIn的圖像的文本描述,這是使用Microsoft的認知服務(wù)平臺和獨特的LinkedIn衍生數據集實(shí)現的。另外,其“ 推薦候選人”功能可學(xué)習給定角色的招聘條件,并在專(zhuān)用選項卡中自動(dòng)顯示相關(guān)候選人。其AI驅動(dòng)的搜索引擎利用數據,例如人們在個(gè)人資料上發(fā)布的內容以及候選人進(jìn)行的搜索以生成最適合工作和求職者的預測。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。