AI助盲構建“無障礙”場景讓黑暗世界重現光明

2020-12-14 13:43:46來源：科技日報

重見光明，對于全球5000多萬盲人來說，是一個遙不可及的夢想，而能夠讓盲人在黑暗的世界里具有更多的獨立性，現代日新月異的科技，特別是人工智能技術正在給予助力，有望實現。

不久前，谷歌正在測試一種人工智能系統，幫助盲人和有視力障礙的人獨立跑步。那么，這個人工智能系統基于哪些技術如何讓視障人士參加跑步比賽;近年來在幫助視障人士恢復視力等方面，人工智能現階段有哪些階段性成果;目前這些產品距離應用還有多遠，是什么因素限制其推廣普及?

奔跑吧，讓AI來做你的“眼睛”

現在很多崇尚健身的人喜歡挑戰馬拉松，而盲人如何參與跑完“半馬”或“全馬”呢?據一位相關公益組織的人介紹，這需要組織陪跑者幫助他們。為了方便跑步，盲人和陪跑者之間有條牽引繩，各自一頭套在自己手腕上，如同牽手跑步。為了萬無一失，有時需要兩位陪跑者。但是，盲人平時訓練時，隨時找個陪跑者似乎不太現實。

最近，不少城市的公共交通開始逐步接納導盲犬。然而，國內導盲犬的數量十分有限，據統計，截至2017年，數量僅為116只，比大熊貓還稀少，而需要導盲犬服務的盲人卻多達800萬人左右。每一只導盲犬需要耗費12萬到15萬元，壽命也只有十幾年，即使有幸排到一只，當它退役之后，視障者又該如何外出，這是個值得思索的問題。

“谷歌開發的這個系統，不需要讓盲人依靠人類向導或導盲犬即可自己跑完全程。而研發給予幫助的公司旨在‘作盲人的眼’，創始人是一位熱愛跑步的人。”遠望智庫AI事業部部長、圖靈機器人首席戰略官譚茗洲介紹說。

據介紹，這個應用程序使用人工智能模型來識別道路上的一條畫線，并推斷出跑步者與這條線的關系。如果跑步者開始離線太遠，該應用程序就會向他們佩戴的骨導耳機發送信號，播放令人不快的噪音。聲音是哪只耳朵發出的、音量有多大，都能讓跑步者知道他們需要移動的方向及其離終點有多遠。

譚茗洲解釋道，“這有點像汽車上使用的接近警報，當汽車離可能發生碰撞的地方越近，警報的聲音就會越大，頻率也會越快。使用谷歌的這個系統，跑步者需要把一部安卓手機與經設計的腰帶綁在腰上。”

據說，這款應用程序不需要連接互聯網即可工作，而且還可考慮多種光照和天氣條件。顯然，若在一些社區，專門為盲人建立帶有指引標志的賽道，他們自己可以安心愉快地奔跑健身。

構建“無障礙”場景，讓黑暗世界重現光明

“盲人只是眼睛看不見，不過聲音還是可以聽到的，以目前的科技真正讓他們看見世界不太可能，但可以讓他們體驗到‘如同看見’的效果。”譚茗洲指出。

如今，在不同程度上，許多互聯網公司都成功讓盲人得以與它們的服務互動，主要方法就是將文本轉變成由屏幕閱讀器發出的語音。四年前，臉譜發起“無障礙倡議”，嘗試采用人工智能技術來豐富盲人、聾人和其他殘疾人士的用戶體驗，重點工作之一是重新設計菜單和按鈕結構，運用自動口譯某些照片和視頻的算法使其能為屏幕閱讀器所用，為盲人用戶提供前所未有的場景描述。

作為美國一位專業徒步旅行者，盲人特雷弗·托馬斯時不時在臉譜上與粉絲分享其經常帶著愛犬到一些山徑和步道徒步旅行的照片和視頻。他感慨道，“之前因看不見照片，我對是否使用臉譜無所謂，而現在我無法想象沒有臉譜的日子了。”

例如，對于舊金山灣落日的照片，運用人工智能技術的屏幕閱讀器如此描述：這張照片含有“自然、戶外、云朵、草地、地平線、植物或樹木”;一對夫婦帶著孩子站在加州丹麥城著名風車前面的照片，屏幕閱讀器詮釋：這張照片包括了“3個人，微笑，戶外”。

“顯然，這些解釋不能對照片進行全面描述，但在沒有人工幫助的前提下確實填補某些空白，盲人僅需點擊閱讀器來描述，而無須他人來做解釋。”譚茗洲說。

瑞士eyra公司專門為盲人研發一種助讀設備。據介紹，這個裝置由三部分組成：掛在耳朵上面的骨傳導耳機及其上面的高清攝像頭，還有AI智能處理器。AI處理器可以將文字上的文本轉化成有聲小說，當然也不用擔心噪音干擾的問題，因為是骨傳導，可以一定程度上減少噪音干擾，給盲人們的生活帶來便利。

今年在拉斯維加斯舉辦的世界最大消費類電子產品展會上，一款智能手機可以通過語音講述周圍的世界，賦予盲人和弱視用戶獨立自主的能力。該應用還適用于智能眼鏡，可將用戶的智能手機攝像頭變成用戶的眼睛。據介紹，其利用人工智能識別攝像頭指向的視覺信息，包括食品包裝、海報和顯示屏，比如超市的商品信息、車站的顯示投屏、街邊的海報。此外，還可以識別記錄親朋好友的面孔，用戶可以用其掃描和尋找周圍的人和事，如同讓黑暗的世界重現光明。

加速突破性運用，冰冷科技釋放人文關懷

據悉，我國約有1200萬視力障礙者，但受教育者人數僅6萬，作為重要知識來源的書籍對盲人而言幾乎是“奢侈品”。據美國勞工部和美國盲人聯盟的統計資料表明，目前盲人可以順利就業的職業達147種，因此，有學者提出，要想改變我國盲人的就業現狀，教育是關鍵一步，特殊教育也必須科技化。

目前，很多專為視障人士設計的解決方案，凸顯人工智能應用的日益強大和多樣化，人性化的考量，也讓人工智能更顯實用與溫暖。那么，如何加速人工智能產品的突破性運用，讓冰冷科技釋放出人文關懷?

譚茗洲指出，這需要三方面發力。首先要培育創新生態。記得曾在2017年德勤全國創新精英挑戰賽總決賽上，一支四川大學在校學生團隊研發的一款盲人Kindle閱讀器獲獎。我們應該激勵更多像這樣為視障人士創新的技術成果，不讓其沉睡，盡早轉化成真正讓盲人受益的產品。這就需要構建一個良好的創新生態。

再有，要解決算力和成本之間的矛盾。機器學習訓練往往要消耗大量的算力，操作中會出現時間上的延遲與信息隱私的安全隱患，這就要將AI算法中的數據上傳到云端完成。而要滿足終端AI推理運算的實時、可用性需求，就要在本地處理大量的數據，由此，若在終端本身部署高性能的AI芯片，從成本控制上來看不大現實，那么若在實體場景中部署足夠多的邊緣AI倒是有一定可行性。邊緣計算可看作是5G+AI+云計算的絕佳輔助——“神經末梢”。比如AI導盲杖要實現實時交互與判斷，看到紅綠燈變綠，自動能夠判斷出“可通行”。這樣不必將路燈信息上傳到云端，經云服務器層層判斷才發出行走的提醒。無疑大大減少延遲帶來的行進風險，也降低云端計算的超負荷。

再有，需要等待產業環境的全面成熟：基礎設施的完善，軟硬件基本到位，這樣可在終端設備上更好運行深度學習功能;加強5G智能網絡，保障云計算及邊緣計算的每一個節點高效可靠利用。而當產業應用聯動，協同合作，通過技術的整合將會發揮出AI的最大價值，打開視障人士的新視野。

(華凌)

責任編輯：hnmd003