AI進化必須修復“注意力Bug” 目的在于減少對無用線索的關注

2020-05-13 17:28:10來源：科技日報

在未經(jīng)充分訓練的情況下，讓AI關注人是容易的，但關注某個特定的人是困難的。

在美劇《西部世界》中，AI主人公覺醒，并意識到這個世界是人類殺伐決斷的樂園，于是開啟了反抗之路;電影《黑客帝國》中，AI將人類豢養(yǎng)起來，控制了整個世界……那么在科幻世界中擁有了意識的AI，在未來生活中能否實現(xiàn)?

日前，在2020年國際學習表征會議(ICLR)上，圖靈獎得主、蒙特利爾學習算法研究所主任約書亞·本吉奧(Yoshua Bengio)對AI的未來提供了最新見解。他認為未來機器學習完全有可能超越無意識，向全意識邁進。而注意力機制正是實現(xiàn)這一過程的關鍵要素。

人類的注意力機制和人工智能的注意力機制是否一樣?現(xiàn)在應用于人工智能的注意力機制還要解決哪些bug，才能讓AI真正具備注意力?就此，科技日報記者采訪了有關專家。

目的在于減少對無用線索的關注

什么是注意力機制?“注意力機制來源于人類的視覺注意力，即人類在進化過程中形成的一種處理視覺信息的機制。”中國科學院自動化研究所研究員張兆翔說。

張兆翔解釋，人類視覺系統(tǒng)以大約每秒8.96兆比特的速度接收外部視覺信息，雖然人腦的計算能力和存儲能力都非常有限，但卻能有效的從紛繁蕪雜的外部世界中有選擇地處理重要的內(nèi)容，在這個過程中選擇性視覺注意發(fā)揮了重要的作用。如我們在看一個畫面時，會有一處特別顯眼的場景率先吸引我們的注意力，這是因為大腦對這類東西很敏感。

視覺注意機制的理論研究自20世紀80年代以來一直是神經(jīng)科學和認知科學的熱點研究問題，目前研究者們一般按照兩類標準對注意機制進行分類。“從注意產(chǎn)生的方向劃分為：自下而上數(shù)據(jù)驅(qū)動的注意、自上而下任務驅(qū)動的注意、兩者結(jié)合共同產(chǎn)生的注意;從關注的對象劃分為：基于空間的注意、基于特征的注意、基于對象的注意。”中國科學院自動化研究所副研究員王威介紹說。

“而對于人工智能來說，注意力機制是機器學習中的一種數(shù)據(jù)處理方法，廣泛應用在自然語言處理、圖像識別及語音識別等各種不同類型的機器學習任務中，其主要功能是減少對無用線索的關注。”福州大學數(shù)學與計算機科學學院、福建省新媒體行業(yè)技術開發(fā)基地副主任柯逍博士說。

廈門大學科技處副處長、人工智能系教授紀榮嶸認為，從本質(zhì)上說，注意力機制是一個特征信息評估和篩選的過程。

一般認為，深度學習中的注意力機制最早是約書亞·本吉奧等人在2014年提出的軟注意力機制?；诩s書亞·本吉奧的這套理論后續(xù)又發(fā)展出了多步注意力機制、跨模態(tài)交互注意力以及時下非常火熱的Transformer網(wǎng)絡中的自注意力機制。

“目前研究的AI注意力機制各有各的特點，但總的來說就是構(gòu)建輸入與輸出，或者構(gòu)建輸入數(shù)據(jù)在不同層面上的關聯(lián)關系，從而達到重點突出部分區(qū)域或者數(shù)據(jù)間的部分關系，提升任務性能。”張兆翔說。

未經(jīng)訓練難以注意新鮮事物

最近幾年，注意力機制已被應用到了人工智能的許多細分領域中。“人工智能是可以被設計出不同程度的注意力的。當需要不同程度的注意力時，我們可以設計多個注意力網(wǎng)絡。”柯逍說。

據(jù)了解，從2016年開始，谷歌的翻譯系統(tǒng)就已經(jīng)使用了注意力機制來提升翻譯質(zhì)量。在文本問答、對話系統(tǒng)、知識圖譜抽取等自然語言處理任務中，注意力機制基本成為了模型標配。在計算機視覺中，注意力機制的使用也成為了一種趨勢，包括細粒度檢索、圖像分類、行人重識別等在內(nèi)的多個研究任務中都有使用注意力機制的視覺模型。

既然說注意力機制來源于人類的視覺注意力，那么人類的注意力機制和人工智能的注意力機制是否一樣?

柯逍認為，人工智能的注意力在一定程度上是人類視覺注意力機制的仿生，在功能上兩者是近似的，但實際上有很大的不同。

“從過程上來看是非常相似的，都是在給定任務(查詢)內(nèi)容時，幫助人(或模型)去關注最相關的數(shù)據(jù)信息。” 紀榮嶸舉例說，如在被問及“桌子上有什么東西?”的時候，人類就會聚焦到桌子的區(qū)域。同樣，在視覺問答任務中，人工智能模型也會聚焦到包含有桌子的視覺區(qū)域，然后回答“有什么”。

紀榮嶸指出，從原理來說，人工智能的注意力機制主要是通過計算查詢信息與給定特征的語義關聯(lián)程度,來獲得模型的注意力分布，而人類的認知系統(tǒng)則可能會更加復雜。

“人工智能運用注意力的過程實際上是一個記憶查詢的過程，它很快很精確，但無法發(fā)現(xiàn)異常。”柯逍舉例說，如讓AI的注意力多次從同一張圖片上獲取關注區(qū)域信息，結(jié)果永遠是一樣的;但如果讓人類來做這個事，人類看第一次的時候會關注自己感興趣的區(qū)域，但隨著觀察圖片次數(shù)增加，人類可能會關注這張圖片的其他區(qū)域。

柯逍指出，此外人類的注意力很容易就可以做到去關注某個特定的事物，比如人群中的某個人，但是AI注意力沒辦法在未經(jīng)充分訓練的情況下做這件事，讓AI關注人是容易的，但關注某個特定的人是困難的。另外還有一點最大的差別是人類注意力會關注從未見過的新鮮事，而AI注意力機制不會。

與人類注意力相比差距明顯

據(jù)了解，認知神經(jīng)科學對意識的定義是“對一個人內(nèi)在思想的感知，或者是對外部事物或內(nèi)在事物的察覺”。意識形成的過程是一個信息不斷篩選、處理以及演化的過程。

“約書亞·本吉奧在2017年的時候曾嘗試用機器學習的方法來證明這個理論，其中一個關鍵環(huán)節(jié)就是使用注意力機制去選擇‘意識狀態(tài)’。所以，從信息提煉的角度來說，注意力機制對形成機器意識是非常重要的。”紀榮嶸說。

類比人類思維，AI注意力機制靠直覺還是靠推理?

“目前來說，人工智能的注意力機制更接近直覺。”柯逍說，大部分注意力機制，是在訓練過程中重復告訴AI應該注意哪些地方，哪些東西是有關聯(lián)的。如在訓練AI的時候，不斷讓AI學習關注貓在河邊吃魚的區(qū)域，AI再看到有貓?zhí)卣骱汪~特征的圖片時，就會關注貓和魚區(qū)域，而不會看到貓，看到河推理出可能有魚，然后再去找魚，再關注魚的區(qū)域。

“近期的注意力模型研究也有傾向于對推理能力的提升。”紀榮嶸舉例說，如近年熱門的Transformer模型就利用了多層的注意力網(wǎng)絡來不斷提煉和處理輸入的信息。在這一過程中，每一層的注意力結(jié)果都是在變化，從某種程度來說，可以認為模型是在推理。

現(xiàn)在應用于人工智能的注意力機制還要解決哪些問題，才能讓AI真正具備注意力?

“首先需要增加模型的知識儲備。當模型有充足的知識后，才知道哪些信息需要去關注，例如，模型如果沒見過飛機的話，就不能很好地執(zhí)行關于飛機描述的查詢。”紀榮嶸說，另外還需要對注意力模型的結(jié)構(gòu)進行改進，提升模型的推理能力，這樣模型才能夠在復雜的語境下運用注意力完成復雜操作。

柯逍認為，就目前來說，AI注意力和真正的人類注意力距離仍然很遙遠。(記者謝開飛通訊員許曉鳳王憶希)

責任編輯：hnmd003