如何應對這些認知缺陷測試,這對AI無(wú)人駕駛汽車(chē)也意味著(zhù)什么

2020-07-12 13:09:07    來(lái)源:新經(jīng)網(wǎng)    作者:馮思韻

好像最近的新聞充滿(mǎn)了關(guān)于進(jìn)行認知缺陷測試的啟示。

一些杰出的政治家尤其注意到了這一點(diǎn),這些政治家似乎試圖在達到人生的年齡,即認知能力下降經(jīng)常浮出水面的時(shí)候,保持頭腦清晰。

如何應對這些認知缺陷測試,這對AI無(wú)人駕駛汽車(chē)也意味著(zhù)什么

此類(lèi)測試更恰當地稱(chēng)為認知評估測試,而不是面向缺乏能力的測試,盡管通常認為,如果所獲得的分數低于預期,則可能得出的結論是該人的智力水平下降了。 。

有時(shí)也稱(chēng)為認知障礙檢測考試,對試圖找出自己的心理狀況的人進(jìn)行包括各種問(wèn)題的測試,并要求他們回答這些問(wèn)題。然后,測試的管理員“對”正確性和流暢性的答案進(jìn)行“評分”,產(chǎn)生一個(gè)分數來(lái)表明該人的整體表現。

然后將該分數與已參加考試的其他人的分數進(jìn)行比較,以嘗試根據更多的應試者群體來(lái)評估該人的認知能力。

同樣,如果某人隨著(zhù)時(shí)間的推移(例如每年一次)參加考試,則將他們以前的分數與最近的分數進(jìn)行比較,以嘗試衡量隨著(zhù)年齡的增長(cháng)是否出現差異。

關(guān)于所有這些認知測驗,都有一些關(guān)鍵的經(jīng)驗法則。

例如,如果某人逐字重復地接受相同的測試,這會(huì )引起關(guān)于測試性質(zhì)與參加測試的人的認知能力性質(zhì)的疑問(wèn)。從本質(zhì)上講,您可能會(huì )在測試中做得更好,因為您之前曾經(jīng)看過(guò)相同的問(wèn)題,并且可能以前也曾被告知過(guò)正確答案是什么。

有一個(gè)論點(diǎn)是,這是在某種程度上評估您記憶自己參加過(guò)考試的能力,但這通常不是這種認知測試應該具有的精神。這個(gè)想法是要評估整體認知,而不僅僅是關(guān)注您的能力是否可以回憶起之前進(jìn)行的特定測試的特定問(wèn)題。

這種認知測驗的另一個(gè)方面是對測驗進(jìn)行正式管理,而不是完全自己進(jìn)行測驗。

盡管您可以下載并私下進(jìn)行許多可用的認知測驗,但有些人會(huì )說(shuō),這與在經(jīng)過(guò)認證或以其他方式授權進(jìn)行此類(lèi)測驗的人的指導和觀(guān)察下完全不同。

聲稱(chēng)需要正式進(jìn)行測試的關(guān)鍵依據是確保參加測試的人員不會(huì )破壞測試或破壞測試過(guò)程。如果應試者向朋友尋求幫助,這顯然會(huì )破壞考試的目的,考試的目的應該是專(zhuān)注于您的孤獨認知,而不是集體的認知。同樣,這些測試通常是定時(shí)的,一個(gè)人可能會(huì )傾向于自己超出正常分配的時(shí)間,另外,該人可能會(huì )試圖查找答案,使用計算器等。

擁有經(jīng)過(guò)適當授權和訓練有素的管理員,最重要的原因可能是試圖從整體上評估認知測試的結果。

認知測驗專(zhuān)家迅速強調,解決問(wèn)題的有效方法不僅包括應試者獲得的數字評分,還包括他們如何整體上與合格且訓練有素的認知測驗管理員互動(dòng)。

與可能為了大學(xué)入學(xué)而不得不辛苦地參加的安全SAT或ACT測試不同,認知評估測試通常旨在以書(shū)面方式和更廣泛的方式評估人的互動(dòng)方式和認知方式。

想象一下,例如某人對筆試進(jìn)行了等級認證,但與此同時(shí),他們卻無(wú)法與管理員進(jìn)行清醒的交談,并且類(lèi)似地,他們在心理上迷失了自己為什么要參加考試或在參加考試時(shí)存在明顯的認知困難處理。應該計算出考試本身之外的那些方面,其中一些方面會(huì )堅決主張,因此,如果一個(gè)人僅自己參加考試,就不太可能被重視。

誠然,盡管我已經(jīng)提到了上述所有方面和整體上的細微差別,但大多數時(shí)候人們想知道的是他們在那令人煩惱的認知測試中的膽怯分數。

您可能想知道是否存在一種用于這些目的的標準化且通用的認知測試。

不,本身不只是一個(gè)。

取而代之的是,這種認知測試令人眼花and亂,名副其實(shí)。

似乎每天都有一些新版本發(fā)布給全世界。在某些情況下,已經(jīng)對準備的認知測驗進(jìn)行了認真的準備,并對其有效性進(jìn)行了分析。不幸的是,在其他情況下,認知測驗是一個(gè)花招,并且是賺錢(qián)的先鋒,因此推動(dòng)測驗的人們旨在使人們相信它,并希望通過(guò)多少人接受測驗并向他們收取費用來(lái)產(chǎn)生收入。相應地。

請不要因為夜間飛行而進(jìn)行認知測試。

令人遺憾的是,有時(shí)某個(gè)知名名人或其他知名度較高的人會(huì )與認知測驗的提升聯(lián)系在一起,并為那些不值得任何善意聲譽(yù)認可的東西添加真實(shí)感。

一些認知測驗持續了時(shí)間的考驗,并被認為是其認知評估能力和有效性的主導或至少被很好地重視。

與此相關(guān)的是,如果一項認知測驗需要很長(cháng)時(shí)間才能完成,比如說(shuō)完成時(shí)間數小時(shí),那么很有可能它不會(huì )被人們普遍接受,也不會(huì )為測驗目的帶來(lái)麻煩。因此,“大眾化”的認知測驗往往需要相對較短的時(shí)間,例如一個(gè)小時(shí)或更短的時(shí)間,在許多情況下甚至只需15分鐘或更短的時(shí)間(這些通常被描述為篩查測驗,而不是成熟的認知評估測試)。

有人譴責只需要花費幾分鐘的時(shí)間進(jìn)行認知測試就充滿(mǎn)了很多問(wèn)題,并且似乎是一種快餐方法,可以解決測量某人認知的一個(gè)非常復雜的話(huà)題。當這些快速測試被人們使用時(shí),那些營(yíng)地里的人不寒而栗,然后四處兜售他們的得分有多高。

相反的論點(diǎn)是,這些短版認知測試是合理的,等同于使用量油尺測量汽車(chē)油箱中的汽油量。觀(guān)點(diǎn)是,只需要一點(diǎn)點(diǎn)測量就可以大致了解某人的心理狀況。一旦制定了總體標準,您就可以隨時(shí)進(jìn)行更深入的認知測試。

鑒于以上所有討論,簡(jiǎn)要介紹一下自1990年代中期以來(lái)一直存在并一直有效使用的眾所周知的認知測試可能很方便,包括據說(shuō)是特朗普總統的測試根據新聞報道于2018年拍攝。

著(zhù)名的MoCA認知測驗

該測試是蒙特利爾認知評估(MoCA)測試。

一些人誤以為該測試的名稱(chēng)感到困惑,并認為這可能只是針對加拿大人的一種測試,因為它在命名中指的是蒙特利爾,但該測試已在全球范圍內使用,并被命名為最初由魁北克蒙特利爾的研究人員開(kāi)發(fā)的。

通常,MoCA的大小為一頁(yè)(請參見(jiàn)此處的示例),對于進(jìn)行這種測試很方便,并且給參加測試的人10分鐘的時(shí)間回答問(wèn)題。在分配的測試時(shí)間中通常會(huì )留有余地,還有一些與使人首先適應測試及其指示有關(guān)的自由度。

但是,不應給參加考試的人說(shuō)兩倍的時(shí)間或如此大的話(huà)。應當在規定的時(shí)間內進(jìn)行測試的原因是,時(shí)間方面被認為與認知敏銳度有關(guān)。

換句話(huà)說(shuō),如果給這個(gè)人的時(shí)間比別人以前得到的時(shí)間更多,那么大概他們可以在認知上投入更多的精神周期或精力,并可能在測試中做得更好。

定時(shí)考試不僅關(guān)乎您本身的認知能力,還關(guān)乎您思考的速度以及思考過(guò)程是否像接受考試的其他過(guò)程一樣流暢。

如果一個(gè)人花了一個(gè)小時(shí)并且他們獲得了最高分,而其他人在十分鐘內得到了最高分,那么我們很難比較他們的結果。您可能將其比作下國際象棋,因為時(shí)間越長(cháng),可能會(huì )預見(jiàn)到更多的國際象棋動(dòng)作,這在某些情況下是可以的,但是在嘗試實(shí)現平衡的游戲環(huán)境時(shí),您需要將計時(shí)器設置為多長(cháng)時(shí)間每個(gè)玩家都必須采取行動(dòng)。

話(huà)雖如此,分配給給定測試的時(shí)間不應短到縮短認知機會(huì )的時(shí)間,這可能會(huì )再次妨礙認知的度量。下棋者僅需說(shuō)兩秒鐘就可以采取行動(dòng),而他們可能會(huì )隨機射擊,而不是將精力投入到這項任務(wù)上。

從理論上講,提供的時(shí)間應該是經(jīng)典的“金發(fā)姑娘”時(shí)間,恰好有足夠的時(shí)間來(lái)允許足夠的精神努力,而沒(méi)有太多的時(shí)間以至于無(wú)意間擴展了認知能力,也許會(huì )使使用時(shí)間的認知能力降低。自我灌輸的拐杖(假設這不是測試所要測量的)。

我將向您解釋MoCA認知測試的具體細節,因此,如果您想在某天參加該測試,請知道我將破壞您的新鮮感(這是破壞者的警報)。

該測試嘗試通過(guò)提供各種認知任務(wù)來(lái)覆蓋很多認知領(lǐng)域,包括數字的使用,單詞的使用,句子的使用,字母的使用以及視覺(jué)認知能力的使用等。如解釋圖像和作文等等。

值得一提的是,僅涵蓋說(shuō)數計數并涉及數字加法的認知測試將只專(zhuān)注于算術(shù)認知。我們知道人類(lèi)具有更廣泛的認知能力。因此,一個(gè)均衡的認知測驗會(huì )嘗試擊穿一些被認為是認知維度的東西。

值得注意的是,這可能很難進(jìn)行一次簡(jiǎn)短的測試,并引起那些認為有人對數字進(jìn)行單個(gè)問(wèn)題,對單詞進(jìn)行單個(gè)問(wèn)題等等,然后試圖對總體進(jìn)行概括的人們的批評。關(guān)于他們在認知方面各個(gè)方面的認知。

讓我們嘗試一個(gè)與數字和算術(shù)有關(guān)的問(wèn)題。

你準備好了嗎?

您將從100倒數到0,然后每次都減去7,而不是一。

好的,您的第一個(gè)答案應該是93,然后您的下一個(gè)答案應該是86,然后是79,依此類(lèi)推。

您不能使用鉛筆和紙,也不能使用計算器。這應該是您的頭上了。使用手指或腳趾也被視為禁忌。

你是怎么做的?

嘗試下一個(gè)。

記住這些詞:臉,天鵝絨,教堂,雛菊,紅色。

我希望您不要看這些話(huà),而是大聲說(shuō)出來(lái),而不必從頁(yè)面上閱讀。

在大約五分鐘內,無(wú)需查看頁(yè)面即可刷新您的記憶,請嘗試再次大聲說(shuō)出這些單詞的含義。

這些認知測驗代表什么?

對于大多數人來(lái)說(shuō),向后計數通常是一項艱巨的任務(wù),因為他們通常不朝那個(gè)方向計數。這會(huì )迫使您放慢腳步,直接思考頭腦中的數字和算術(shù)操作(這也是部分原因,將相同類(lèi)型的測驗用于DUI巷道清醒評估的部分原因)。如果我要求您從零開(kāi)始以七為單位進(jìn)行向上計數,則您可能會(huì )更輕松地進(jìn)行此操作,并且這種工作將減少您在認知上的負擔。

對于記憶一詞,這是對您的短期記憶能力的評估。與我要您記住十個(gè)單詞或五十個(gè)單詞相比,只有五個(gè)單詞。有些人會(huì )通過(guò)在每個(gè)單詞的腦海中想象一個(gè)形象來(lái)試圖記住這五個(gè)單詞,而另一些人則可能將這些單詞拼湊成一個(gè)簡(jiǎn)短的故事,以便他們回憶這些單詞。

無(wú)論哪種方式,這都是嘗試在幾個(gè)方面上進(jìn)行認知,包括短期記憶,遵循和遵守指令的能力,在腦海中編碼單詞的外觀(guān)以及具有其他利用大腦的精神成分。

這些認知測試中的某些問(wèn)題被認為是有爭議的。

在MoCA的情況下,通常會(huì )有一些認知測試專(zhuān)家為之煩惱的時(shí)鐘繪圖任務(wù)。

要求您繪制一個(gè)時(shí)鐘,并將時(shí)鐘上的時(shí)間指示為規定的時(shí)間,例如7點(diǎn)10分鐘左右。理論上,您將畫(huà)一個(gè)圓或類(lèi)似的東西,并在數字周?chē)鷮?xiě)上1到12的數字。橢圓形代表每個(gè)小時(shí),然后您將畫(huà)一條從中心指向7的短線(xiàn),并畫(huà)一條從中心指向2位置的長(cháng)標記(因為分鐘的標記通常代表5分鐘)。

為什么這個(gè)有爭議的認知測試問(wèn)題呢?

一個(gè)令人擔憂(yōu)的問(wèn)題是,在當今世界,我們傾向于使用數字時(shí)鐘來(lái)數字顯示時(shí)間,而不太可能再使用傳統的圓形時(shí)鐘來(lái)表示時(shí)間。

如果參加認知測試的人不熟悉橢圓形的鐘表,那么他們因完成這項任務(wù)的能力差而失去幾個(gè)“認知”點(diǎn)似乎是否合適?

這帶來(lái)了關(guān)于認知測試的更大范圍的疑慮,即,我們如何區分知識與認知行為。

我可能不知道常規時(shí)鐘是什么,但具有出色的認知能力。該測試不公平地將知識特別是認知行為歸因于認知,因此它錯誤地衡量了不一定是被評估的方面的一件事。

假設我問(wèn)了一個(gè)關(guān)于棒球的問(wèn)題,例如,請繼續說(shuō)出壘的名稱(chēng)或各個(gè)球員的位置。如果您了解棒球知識,則可以回答該問(wèn)題,否則,您將無(wú)法通過(guò)該問(wèn)題。

棒球問(wèn)題和您相應的答案是否提供您的認知能力的合理表象?

無(wú)論如何,MoCa認知測驗通常是根據最高分數30來(lái)進(jìn)行評分的,通常使用的評分標準是:

·得分26-30:未檢測到認知障礙

·得分18-25:輕度認知障礙

·得分10-17:中度認知障礙

·分數00-09:嚴重的認知障礙

研究趨于表明,具有示范性阿爾茨海默氏癥的人傾向于得分約16,最終屬于中度認知障礙類(lèi)別。據推測,一個(gè)沒(méi)有明顯的認知障礙的人,至少在此特定的認知測驗中,得分為26分或更高。

是否有可能獲得最高分,得分為26分或更高(表明一個(gè)人沒(méi)有任何認知障礙),并且仍然存在某種形式的認知缺陷?

是的,當然可以,因為這種認知測試只是一個(gè)很小的快照或碎片,并不涵蓋整個(gè)認知范圍或認知范圍,此外,如前所述,有可能先驗地熟悉測試和/或積極地進(jìn)行測試事先為測試做準備,可以從根本上提高性能。

是否可以在輕度,中度或重度認知障礙類(lèi)別中得分,并且不以某種方式真正遭受認知障礙困擾?

是的,當然可以,因為一個(gè)人可能會(huì )承受過(guò)大的壓力和考試的焦慮,因此由于當前的情況而表現不佳,或者可能會(huì )找到與他們的認知能力無(wú)關(guān)的給定任務(wù),例如可能是一個(gè)別出心裁的人具有創(chuàng )造力和認知能力,但在進(jìn)行簡(jiǎn)單的算術(shù)運算或背誦看似無(wú)用的單詞時(shí)會(huì )發(fā)現自己很畏縮。

總而言之,最好在解釋此類(lèi)認知測驗的結果時(shí)要謹慎(并且再次強調,需要采用更全面的方法進(jìn)行認知測驗)。

人工智能和認知測驗

新聞中的另一個(gè)熱門(mén)話(huà)題,似乎與這一認知測試問(wèn)題無(wú)關(guān),是人工智能的出現(請稍等一下,我們將繼續討論)。

您可能會(huì )被眾多似乎不斷發(fā)展并釋放并影響我們日常生活的AI系統感到麻木,其中包括面部識別的興起,自然語(yǔ)言處理(NLP)的出現(例如Alexa等)和Siri等

在那鼓聲之上,還有AI吹捧的奇觀(guān),引發(fā)了關(guān)于A(yíng)I的發(fā)展方向以及AI是否會(huì )超越人類(lèi)智慧的許多(相當狂野的)猜測,甚至可能決定接管我們的飛機并選擇奴役或消滅人類(lèi)(有關(guān)此類(lèi)理論,請參見(jiàn)此處的鏈接分析)。

為什么要提出AI,特別是如果AI與認知測驗和認知測驗無(wú)關(guān)的話(huà)?

好吧,因為AI確實(shí)與認知測試有關(guān),這一點(diǎn)非常重要。

AI的既定目標是達到相當于人類(lèi)智能的水平,這可能會(huì )體現在機器中。我們尚不知道這臺機器將是什么,盡管可能由計算機組成,但是規范并沒(méi)有規定它必須是什么,因此,如果您可以通過(guò)展示人類(lèi)智能的樂(lè )高和膠帶制造一臺機器,您。

簡(jiǎn)而言之,我們要構建人工認知能力,這是人類(lèi)智能的關(guān)鍵所在。

從邏輯上講,由于這是我們正在嘗試實(shí)現的目標,因此可以推斷,我們期望AI能夠輕松通過(guò)以人為中心的認知測試,因為這樣做可以表明AI達到了相似的認知能力。

我不想破滅任何人的泡沫,但是今天沒(méi)有任何AI可以做任何適當的常識性推理,而且距離有感覺(jué)的AI還有很長(cháng)的路要走。

底線(xiàn):今天的AI基本上會(huì )使MoCA認知測驗和任何其他具有類(lèi)似復雜性的測驗不及格。

有些人可能試圖爭辯說(shuō)AI和計算機可以從100倒數,并且可以“記憶”單詞并完成其他陳述的任務(wù),但這是一個(gè)誤導性的主張。這些是由AI系統執行的任務(wù),這些AI系統是為執行這些特定任務(wù)而構造的,旨在與那些以類(lèi)似于人的能力的方式``理解''或``理解''測試相距甚遠,并且誤導了該問(wèn)題的人為化(有關(guān)更多詳細信息,請在此鏈接中查看我的分析)。

尚無(wú)真正可泛化的AI,有人將其稱(chēng)為人工通用人工智能(AGI)。

作為補充說(shuō)明,在A(yíng)I領(lǐng)域中有一個(gè)著(zhù)名的測試,稱(chēng)為圖靈測試(請參見(jiàn)此處的我的解釋)。今天和將來(lái)的AI都無(wú)法通過(guò)全面的圖靈測試,并且在某些方面,能夠通過(guò)像MoCA一樣的認知測試是圖靈測試的一種變體(以極其狹窄的方式)。

人工智能認知與無(wú)人駕駛汽車(chē)

另一個(gè)相關(guān)主題涉及基于A(yíng)I的真正自動(dòng)駕駛汽車(chē)的出現。

我們正在朝著(zhù)使用自動(dòng)駕駛汽車(chē)的方向發(fā)展,這種自動(dòng)駕駛汽車(chē)需要AI來(lái)自動(dòng)駕駛車(chē)輛,而無(wú)須任何駕駛員。

有人想知道,今天的人工智能缺乏任何常識性推理,也沒(méi)有任何感知能力,是否足以在我們的公共道路上駕駛汽車(chē)。批評者認為,我們將用AI代替人類(lèi)駕駛員,但是AI不足以做到這一點(diǎn)(在我的分析中,請參閱有關(guān)此爭論的更多內容)。

其他人則堅持認為,駕駛任務(wù)并不需要人類(lèi)的全部認知能力,因此,人工智能將在指揮自動(dòng)駕駛汽車(chē)方面表現出色。

您是否認為,將您帶到雜貨店的AI必須能夠首先通過(guò)認知測試,并證明它可以充分顯示時(shí)間并指示一天中的時(shí)間?

現在,我們只能說(shuō)時(shí)間會(huì )證明一切。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。