Google 鮮為人知的一面:讓全世界都沒“豆腐”吃

雷鋒網 於 01/09/2016 發表 收藏文章

能力有多大,責任就有多大。
Google 的 Noto 字體項目幾年前曝光時,人文學者覺得不可思議,甚至表達過在語言文化方面的擔憂。這是個雄心勃勃的項目,試圖覆蓋全球所有文字和語言,消滅小語種文字無法顯示狀態下的“豆腐塊”(No Tofu,Noto 名字源於此),以及讓不同的文字,並排在一起顯示的時候,可以和諧相處。

Google 找來全世界字體設計方面的頂尖專家,同自己的設計師、工程師一起默默做了 5 年之後,迎來里程碑—— Noto 字體覆蓋的全球人口“接近 100%”。2016年8月中旬,Google 在北京辦公室,向十幾家媒體分享了 Noto 字體項目的進展,“到目前為止支持 100 多種文字,500多種語言,包括了超過11萬的字符”。
負責該項目的團隊,屬於 Google 內部一個叫“國際化”的部門。這個部門的領導者鍾勝華,也來到本次“Google產品之旅”的活動現場。據他介紹,2005年 Google 開始感受到國際化的重要性,由他領導並建立起 Google 國際化部門。當初的宗旨是希望 Google 的眾多產品在全世界任何國家、任何地區、任何語言都能給用户最好的體驗。 2011年,為了把 Android 和 Chrome OS 操作系統發佈給全球用户,這個團隊開始為其開發覆蓋全世界語言的字體。

Google 的創始人做事風格卻不是這樣的,通常都是要做就做全部的

“也許其他公司也做國際化,他們會根據哪幾個國家、哪幾個地區對他們的產品是最重要的,然後集中火力去做這幾個國家或者這幾個地區。但Google 的創始人做事風格卻不是這樣的,通常都是要做就做全部的。 ”

參與 Noto 項目的 Google 工程經理陳雍昇進一步介紹:“以前開發字體,第一個決定因素是這個字常不常用,值不值得我們花錢去設計這個字。如果用的機率不是很高,有很多設計字體的製造廠家可能決定不把它納入。Google 做 Noto 是隻要出來 Unicode(萬國碼)標準就將它納入,所以反而不需要做什麼考慮。”


陳雍昇告訴雷鋒網,Noto 團隊最主要考慮的是設計的和諧度,新的字跟其他100多種文字都需要有和諧度。掏出一張人民幣,看看背面的 4 種少數民族文字(Noto均支持),就能明白,讓上百種文字在排版時“和諧相處”的難度。

Google 花了 5 年時間在字體方面搞“基礎設施建設”。做好之後,又把這套字體開源出去,任何人都可以免費下載使用。從計算機的原理上説,字體解決的是輸出的問題,國際化團隊還有一個輸入的問題需要解決。

Google 國際化部門的員工分佈在世界各地。其中負責輸入法的主力團隊在中國,包括剛剛在 iOS 上推出,並引起關注的 Gboard 輸入法,也是中國團隊參與開發的。Google 在輸入法上最大的難點是怎麼支持超過 100 種語言,讓全世界任何地方的人,都可以使用母語進行輸入。

拉丁語系之外大部分的語言在互聯網上的信息比例,明顯的少於用户數量的比例

這一點中國用户感受不深,因為中文輸入法領域,本土企業提供了高水平的產品。但是,放眼全球,據輸入法團隊的Google工程經理楊帆透露,現在互聯網上的信息大部分是英文,而除了拉丁語系之外大部分的語言在互聯網上的信息比例,明顯的少於用户數量的比例。“所以我們希望解決這個問題,幫助用户可以更好的產生母語的內容。這個是輸入法團隊存在的價值,我們認為這是對全世界用户都很有意義的事情。 ”楊帆説。


如果説字體設計是個具備人文藝術方向特質的工作,那麼輸入法更理性、更技術一些。楊帆的工程團隊並沒有採用傳統的做輸入法的方式,而是引入機器學習技術,加快覆蓋一種新語言的速度。楊帆介紹,Google輸入法的印度版本發佈的時候,因為擁有好的軟件架構和語言無關的機器學習方法,他們在幾個月之內就可以做出 11 種語言(印度憲法承認的語言有15種),甚至軟件工程師都不懂印度語。

他告訴雷鋒網(搜索“雷鋒網”公眾號關注),Google 做各種語言的輸入法有一個通用的方法。首先,保證客户端框架是可以適用所有語言的,團隊裏有接近20年輸入法開發經驗的高級工程師,他們設計了可以適應所有語言的框架。“當你要添加語言的時候,不用改代碼,只要有更多的數據放到算法模型裏去,就可以直接把需要的語言導出來。”

其次,通過機器學習的方法,建立通用的數據索引和輸入模型,這些都是和語言無關的。“這跟傳統做法很不一樣,傳統做法是一個語言就需要一個語言的模式,如果用機器學習就可以用一個比較通用的模式做到全球化。”

Google 用這樣的方法,做了全球 100 多種語言的基礎功能。然後再對每個語言做深入的做用户調研,去做各種語言特殊的功能。


本次活動,來自 Google 上海的“用户體驗經理 ”張英惠,還分享了由 Google 倡導的,用來表達職業和活動的 Emoji 表情。過去,女性的表情只有剪頭、按摩、結婚、公主等,職業和活動的表情均是以男性為藍本的。Google 的 Emoji 團隊,讓(不同膚色的)男女都有各種職業可選擇,讓女性“想當醫生的當醫生,想當工程師的當工程師,想當搖滾歌手的也可以。”

這套表達職業的 Emoji 已經被 Unicode 接納,接下來就會看大其他各個大公司和軟件平台設計出相應的職業表情版本。張英惠説,“希望我們的工作,能夠幫助世界往更多元化和性別平等的方向繼續邁進。”

Google 在做很多事情,但在推動全球化方面的基礎工作,很少出現在中文媒體的版面上。這些事情顯然沒有無人駕駛汽車和熱氣球性感,卻是這家公司在全球各地擁有眾多粉絲的重要原因之一。


資料來源:雷鋒網
作者/編輯:郝曉茹

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→