霍金簡史:英特爾如何讓他發聲

雷鋒網 於 16/01/2015 發表 收藏文章

史蒂芬·霍金第一次遇見英特爾聯合創始人戈登·摩爾是在 1997 年的一次大會上。當時摩爾注意到,霍金用來溝通的電腦使用 AMD 處理器。於是摩爾問霍金是否願意使用搭載英特爾處理器的“真正電腦”。自此以後,英特爾就開始為霍金提供定製電腦和技術支持,而且每兩年會更換一次霍金的電腦。

霍金在 1985 年失去了説話的能力,原因是他在日內瓦歐洲核子研究委員會參加會議時罹患了肺炎。在住院期間,霍金需要依靠呼吸機來維持生命。醫生們問霍金當時的妻子簡,是否需要關閉生命維持設備。簡斷然予以拒絕。霍金於是通過飛機轉到了劍橋阿登布魯克醫院,這裏的醫生設法控制了感染。為了幫助霍金呼吸,他們還給霍金做了氣管切開手術,在脖子上開一個洞,將管子放入霍金的氣管中。正因為如此,霍金不可挽回地喪失了説話的能力。

在一段時間裏,霍金通過拼寫卡來交流,即通過揚眉毛來示意字母和組成單詞。一直以來在為霍金開發一套新交流系統的 Martin King 聯繫了一家名為 Words Plus 的加州公司。該公司的電腦程序 Equalizer 可以讓用户通過手敲擊器來選擇單詞和控制電腦上的指令。King 與 Words Plus 首席執行官 Walter Woltosz 取得了聯繫,詢問這一軟件是否能用來幫助一位罹患肌萎縮側索硬化症的英國物理學教授。Woltosz 發明 Equalizer 的初衷就是幫助其同樣罹患肌萎縮側索硬化症而無法説話和寫字的岳母。Woltosz 表示道:“我問是不是史蒂芬·霍金,但 King 表示沒有允許不能透露對方姓名。他在第二天打電話告訴我確實是霍金。我説我願意捐贈任何所需的東西。”

Equalizer 最開始運行在一台 Apple II 電腦上,這台電腦連接着由 Speech Plus 公司開發的語音合成器。隨後,霍金一位護士的工程師丈夫 David Mason 將這一系統移植到了一個可以加載在輪椅扶手上的便攜式系統中。在這一新系統的幫助下,霍金可以以每分鐘 15 個單詞的速度與人交流。

然而,霍金控制手指運動的神經也在不斷惡化。到 2008 年時,霍金的手就虛弱得不能使用敲擊器了。霍金當時的研究生助理髮明瞭一個名為“臉頰開關”的開關裝置。這個裝置安放在霍金的眼鏡上,可以通過一束紅外光來監測霍金的面頰肌肉是否收緊。自此以後,霍金可以只通過一塊肌肉來寫電子郵件,上網,寫書和説話。不過,霍金的交流能力仍然在不斷下降。到 2011 年時,他一分鐘只能説出一到兩個單詞,於是他寫了一封信給摩爾,説:“我現在的語音輸入非常非常慢。英特爾有什麼可以幫到我的技術嗎?”

摩爾要求時任英特爾首席技術官的 Justin Rattner 去研究這一問題。Rattner 從英特爾實驗室中抽調了一組人機交互專家,並在 2012 年 1 月 8 日將他們悉數帶到霍金 70 歲的生日會“宇宙狀態”上。Rattner 向觀眾們表示:“我從英特爾實驗室帶來了一羣專家。我們將仔細研究應用一些頂尖計算機技術來提高霍金的溝通速度。我們希望這一團隊能取得突破,讓霍金恢復幾年前具備的交流水平。”


霍金此時非常虛弱,連自己的生日都無法參加。幾周後,他在自己位於劍橋大學應用數學和理論物理學部門的辦公室中與英特爾的專家們進行了會面。這個團隊由五人組成,包括體驗技術實驗室負責人 Horst Haussecker、先行計算實驗室負責人兼項目負責人 Lama Nachman 以及交互設計師 Pete Denman。“史蒂芬一直都是我的榜樣”,同樣乘坐輪椅的 Denman 説道:“在我摔斷脖子癱瘓以後,我母親給了我一本剛出版的《時間簡史》。她告訴我,輪椅上的人同樣能做大事。回首往事,我發現這真是太有預示性了。”在英特爾團隊成員做了自我介紹後,Haussecker 接過話頭來解釋他們到此的來由以及計劃。Haussecker 繼續説了 20 分鐘,然後霍金突然説起話來。

Denman 表示:“他歡迎了我們,並表達了他對我們到來的喜悦之情。我們不知道的是,他一直在打字。霍金花了 20 分鐘來寫一段由大約 30 個單詞組成的賀詞。我們對此很震驚。這讓人心酸。我們意識到這個問題要比我們原來預想的更大。”

此時霍金的電腦界面是一款名為 EZ Keys 的程序。該程序是之前軟件的升級版,也是由 Words Plus 設計。這個程序會在屏幕上顯示一個鍵盤,同時還配有一個簡單的單詞預測算法。一個光標會逐行逐列自動掃過鍵盤,霍金可以通過運動臉頰來讓光標停止。EZ Keys 還允許霍金控制窗口中的鼠標,以及在電腦上操作其他軟件。霍金通過火狐瀏覽器上網,用 Notepad 來撰寫論文。他在用 Skype 時還使用網絡攝像頭。

這支英特爾團隊也想過大幅改變霍金使用的過時系統,這需要引入新硬件。Nachman 表示道:“Justin 考慮使用面部表情識別、眼球追蹤和腦機交互等技術。最初,我們告訴了霍金許多大膽的想法,也嘗試了許多現有技術。”這些企圖最終都失敗了。眼球追蹤技術無法鎖定霍金的目光,因為霍金的眼臉下垂。在英特爾的項目之前,霍金測試過能讀取腦電波進而可能用來控制電腦的腦電波帽。不過,腦電波帽無法獲得足夠強的腦電波信號。Wood 稱:“我們會在屏幕上顯示字母,帽子會嘗試根據大腦反應來選取正確的字母。這種技術用在我身上很好,但用在霍金身上效果卻不大好。帽子無法獲得足夠強的信號。”

“我們對霍金的觀察和傾聽他的訴求越多,我們也就越發瞭解他真正需要的東西。除了能提高他的交流速度外,他還需要能和電腦更好交互的新功能”,Nachman 説道。在返回英特爾實驗室並進行了幾個月的研究後,Denman 準備了一段 10 分鐘的視頻發送給霍金,描述他們想要部署的新用户界面原型,並徵求霍金的意見。Denman 稱:“我們不會大幅改變霍金使用原有系統的方式,但仍然會產生很大的改變。”這些變化包括增加了一個“後退按鈕”,霍金可以用這個按鈕來刪除字母,也能後退到上一個用户界面;一個單詞預測算法;以及後續單詞導航,這一功能可以讓霍金一個個選擇單詞,而不用輸入單詞。

在 Denman 看來,新系統的主要改變是解決了霍金在操作用户界面時遇到的最大問題:按鍵誤擊。Denman 表示:“霍金經常誤選目標字母相鄰的字母。一旦錯選字母就要返回,再次錯選,再次返回。這一過程令人難以忍受地慢,霍金也會感覺泄氣。”霍金的完美主義更加重了這一問題。“對於霍金來説,正確無誤地表達自己的想法非常重要,標點也要完全正確”,Nachman 表示道:“他在抱有足夠耐心的同時成為了一名完美主義者。他不是別的只想讓消息精髓得到傳播的人。霍金屬於那種想要消息本身就完美的人。”

為了解決按鍵誤擊問題,這個團隊增加了一個可以理解霍金意圖而非實際輸入的原型,該原型使用了字處理軟件和移動手機中使用的類似算法。他們在視頻中解釋道:“你需要相信這個交互功能。當 iPhone 首次進入市場時,人們抱怨預測文本,但不信任很快就轉化成了喜悦。整個過程只需要很短時間來適應,你必須放棄控制來讓系統做事。增加這一功能會提高你的交流速度,讓你專注於內容。”

在視頻結尾時,他們問霍金:“你對此感覺如何?”當年 6 月,霍金造訪了英特爾實驗室,Denman 及其團隊向他介紹了這個名為 ASTER(輔助文本編輯器)的新系統。Denman 告訴霍金:“你目前使用的軟件有點過時了,非常過時了,但你已經非常熟悉使用它。因此,我們改變了後續單詞預測算法,讓它能準確地拼出正確的單詞,即便你按錯了字母。”

霍金回答道:“這和之前的版本相比取得了巨大進步。我真的很喜歡它。”

他們在霍金的電腦上部署了新的用户界面。Denman 認為團隊走在正確的道路上。到 9 月時,他們開始收到反饋:霍金未能適應新系統。新系統太複雜了。後退按鈕以及解決“按鍵誤擊”的原型功能讓霍金感到困惑,不得不拋棄。Denman 説道:“霍金是全世界最聰明的人之一,但我們卻忘了他從未接觸過現代科技。他從未有機會使用 iPhone,而我們卻一直在用技術教全世界最知名、最聰明的 72 歲老爺爺學習新交互方式。”


Denman 和團隊其他成員意識到,他們必須從其他角度來思考這一問題。“我們以為自己在用傳統方式設計軟件,即撒上一張大網,試圖抓上來儘可能多的魚。我們沒意識到這一設計對霍金會有多大影響。我們必須只研究霍金這一個人。”到 2012 年底時,英特爾團隊安裝了一個記錄霍金與電腦互動的系統。他們錄製了數十個小時的視頻,涵蓋了各種各樣的情況:霍金在打字時的情況,霍金疲憊時打字的情況,霍金用鼠標時的情況,霍金試圖調整窗口大小時的情況。Denman 表示:“這些視頻我反覆看了很多次。”

“有時候我會以四倍速度快進着看,卻仍然會有新發現。”

到 2013 年 9 月時,在霍金的研究生助理 Jonathan Wood 的協助下,他們在霍金的電腦上部署了新一代用户界面。“我以為我們成功了,事情到此為止了”,Denman 説道。然而,到第二個月時,事情變得很明朗,霍金還是沒能適應。Denman 回憶道:“霍金的一個助手將新系統稱為‘ASTER’酷刑。當他們這麼説時,霍金也會跟着笑。”

在英特爾團隊推出讓霍金滿意的用户界面之前又過了許多個月。比如,Hawking 現在使用倫敦創業公司 SwiftKey 的適應性單詞預測軟件。通過這一軟件,霍金在輸入一個字母后可以選擇單詞,而在之前的系統中,霍金必須導航到用户界面底部,從一個列表中選擇單詞。Nachman 表示:“霍金以前使用的單詞預測系統非常古老。新系統要快速得多,也要高效得多,但我們必須對霍金進行培訓才能使用它。在最開始,霍金還抱怨它,隨後我才意識到:霍金已經知道了之前的系統會預測出什麼單詞來。他已經習慣於預測自己的單詞預測軟件。”英特爾和 SwiftKey 進行了合作,在系統中集成了許多霍金的文檔。有時候霍金甚至無需輸入字母,預測軟件就能基於上下文預測單詞。“‘the black hole’(黑洞)這個詞組並不需要任何輸入”,Nachman 表示道:“選擇‘the’就會自動預測出‘black’,選擇‘black’就會自動預測出‘hole’。”

霍金的新版用户界面名為輔助語境覺知工具包(ACAT),包括上下文菜單,這可以為霍金提供多種快捷鍵,如説話、搜索和電子郵件;還有一個新的演講管理器,可以讓霍金控制演講中説話的時機。新用户界面還有一個靜音按鈕,可以讓霍金關閉語音合成器。Wood 解釋道:“因為霍金是通過臉頰來控制發聲,如果他在吃飯或旅行時打開語音合成器,就會產生奇怪的聲音。不過霍金有時候確實喜歡用這種方式來產生隨機的聲音。他一直都這麼做,有時候非常不合時宜。記得有一次,他隨機輸入了四個‘x’,他的語音合成器發出了四個聽起來很像‘sex’(性)的音。”

Wood 的辦公室就在霍金辦公室的旁邊。不過霍金的辦公室更像是一個車間而不是書房。有一面牆上滿是電子硬件和實驗原型產品。霍金的辦公桌上有一個攝像頭,這是英特爾正在進行的項目的一部分。Wood 表示:“這個計劃是讓攝像頭拍攝霍金的面部,同時記錄他的臉頰動作和麪部動作。霍金可以上下左右活動下巴,這可以用來指揮鼠標乃至輪椅。這都是些很酷的想法,不過不會很快完成。”

霍金所坐輪椅的製造商在今年早些時候建議進行另一個試驗項目,通過放在霍金下巴上的控制桿來讓霍金獨立操縱輪椅。Wood 表示道:“霍金非常渴望這一功能。問題是霍金的下巴和控制桿的接觸。因為霍金的脖子無法運動,因此很難安裝和拆下控制桿。”

Wood 還保存着霍金的語音合成器的唯一複製品。這是一台 CallText 5010 機器,在霍金於 1988 年造訪其製造商 Speech Plus 時獲贈。這個語音合成器中有一枚能將文本轉換成聲音的處理器,上世紀 80 年代的自動電話應答系統就採用這一設備。

Wood 表示:“我一直在試圖將霍金的聲音軟件化,這樣就不需要依賴這些舊硬件了。”為了實現這一目標,他不得不聯繫最初的 Speech Plus 團隊。在 1990 年,Centigram Communications 收購了 Speech Plus。隨後 Lernout and Hauspie Speech Products 又收購了 Centigram,前者又於 2001 年被 ScanSoft 收購。擁有 35 處辦公室和 1200 名員工的跨國公司 Nuance Communications 之後又收購了 ScanSoft。Wood 聯繫了 Nuance。“他們有保存了霍金自 1986 年以來的聲音的軟件。或許我們會在 Nuance 的備份磁帶中找到它。”

霍金非常懷念自己的聲音:當 Speech Plus 在 1988 年贈送新語音合成器給霍金時,霍金因為聲音很不一樣要求 Speech Plus 用霍金自己的聲音來替換。霍金的聲音在 80 年代早期由 MIT 工程師、文本轉語音算法先驅 Dennis Klatt 製作。Klatt 發明了將文本轉化成語音的首批設備之一 DECtalk。他在一開始製作了三種聲音,分別是他妻子、他女兒和他自己的聲音。其中,女性的聲音名為“魅力的貝蒂”,孩子的聲音名為“小貓咪”,男性的聲音名為“完美的保羅”。霍金的聲音就是“完美的保羅”。

via wired


資料來源:雷鋒網
作者/編輯:1thinc0
標籤: 霍金  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→