約書亞·本吉奧與納格拉杰·卡什亞普
6月26日消息,《連線》網站撰文深度揭秘微軟在人工智能領域卷土重來背后的故事。該科技巨頭正在深度學習領域奮力追趕領跑的谷歌和Facebook,它的未來發展很大程度上要看它在人工智能上的作為。
以下是文章主要內容:
約書亞·本吉奧(Yoshua Bengio)從來沒有選過邊。作為締造出如今主導人工智能的深度學習技術的三位學者之一,他儼然成為了明星。該領域太新了,全世界能夠推動其發展的人少之又少,但每一個人——從科技創業公司到跨國大公司,再到國防部門——都想要獲得他們的智慧。
然而,正當他的同行科學家雅恩·樂昆(Yann LeCun)和杰弗里·辛頓(Geoffrey Hinton)已經分別簽約加盟Facebook和谷歌之時,現年53歲的本吉奧卻選擇繼續在其位于蒙特利爾大學小山頂校區小小的三樓辦公室工作。“我想要保持中立角色。”他一邊喝著鐵銹色的甘草水一邊說道。
跟上一世紀的核科學家一樣,本吉奧非常清楚他所發明的工具的威力無可估量,對于它的發展,必須要深謀遠慮。“我們不希望一家或者兩家公司成為AI領域唯一的大玩家,我不想說出它們的名字。”他說,抬起眉毛示意我們都清楚他說的是哪些公司。一家公司在門洛帕克,另一家在山景城。“一家獨大或者兩家獨大對于整個社區不是好事,對于人類也不是好事。”
正因為此,本吉奧近期選擇了加盟微軟。
是的,他選擇了微軟。他認為,昔日的Windows王國有能力成為第三大AI巨頭。這家公司擁有所需要的資源、數據、人才以及最重要的愿景和文化,去不僅僅認識到該門科學可帶來的成果,還推動該領域的發展。1月,本吉奧同意出任該公司的戰略顧問,此舉引起了整個業界的關注。這讓微軟一躍成為AI領域最大的理念、人才和方向指引輸出來源之一。同時它也是一個強有力的信號:微軟實際上有機會讓AI領域的統治從雙重奏變成三重奏。
沈向洋的重任
沈向洋
負責簽下本吉奧的那個人是位計算機科學家,頭發灰白,戴著一副線框眼鏡,名字叫沈向洋(Harry Shum)。他曾連續多個月用盡一切招數去招募本吉奧。“他實際上來過這里,就在這個房間里。”沈向洋告訴我,面帶微笑,似乎在表示他知道外人可能會覺得自己被一位眉毛夸張,在谷歌學術搜索中被引用過6.9616萬次的高個加拿大人迷住很不可思議。
我們坐在34號大樓五樓寬敞的會議室里的灰色沙發上,另一邊站著負責看守微軟高層辦公室的保安人員。沈向洋負責微軟所有的AI和研究工作,他剛剛完成了下一周Build開發者大會的最后彩排,想要給我演示一些產品。因此我一下子看到了很多令人印象深刻的東西!在一個實驗室,Skype團隊的自動翻譯應用讓我實時通過文字與一個德國音箱進行聊天。在另一個實驗室,我看到了一款針對建筑工地的應用,它能夠通過計算機視覺檢測工地是否存在安全違規行為或者未被授權的來訪者。在另外的一個實驗室,微軟帝國的AI女神Cortana從我的郵箱掃描出我對別人作過的承諾,并提醒我要履行那些承諾。
沈向洋過去幾年致力于幫助微軟CEO薩蒂亞·納德拉(Satya Nadella)兌現其圍繞人工智能來重塑微軟的承諾。2014年3月,即納德拉被晉升為CEO后的那個月,沈向洋第一次向微軟的領導團隊發出行動呼吁。從一開始,他就常常與納德拉和另一位同事陸奇會面,商討制定最好的策略來將AI技術整合到微軟的產品當中。去年9月,沈向洋領導公司的重組工作,整合研究人員和產品團隊組成人工智能與研究部門。該部門如今越過微軟的三大核心產品團隊:Windows、Office和云項目Azure。沈向洋表示,公司希望“我們能夠加速從研究到產品推出的周期”,更加快速地給消費者帶來AI的好處。
微軟迫切需要這么做,畢竟各家大型科技公司都在力圖打造更好的AI產品和服務。除了Facebook和谷歌以外,IBM、亞馬遜和蘋果也都認為它們的未來將取決于其對深度學習技術的掌握程度。在去年秋天據稱因為騎車受傷而離開微軟后,陸奇近期快速恢復身體健康,加盟中國的AI領跑者百度出任首席運營官。
具有強烈諷刺意味的是,人工智能曾經是微軟失敗過的領域。1990年代初期,該公司吸引到該領域頂尖的研究者的加盟,致力于研究語音識別和視覺技術。但在此后的十年里,他們的研究停滯不前。一家曾經掌控幾乎每一臺臺式機和筆記本電腦上的軟件系統的公司,眼睜睜看著更年輕、更時髦的創業公司統治移動領域,并開發工具帶來我們所有人都喜歡的新云端辦公方式。微軟的研究人員被有意孤立,因此他們可以大膽想象未來,而完全沒有市場的壓力——但正因為此,他們的發明鮮少能夠走出實驗室。例如,比爾·蓋茨(Bill Gates)曾在1998年展示一項地圖技術,但它卻從未進入市場;谷歌于2005年推出地圖服務。在那個時期的很大一部分時間里,AI研究也停滯不前,因為沒有取得實質性突破所需的計算處理能力和海量的數據。
AI走出漫長的寒冬期的時間要比微軟早得多。在2013年Facebook和谷歌分別招來樂昆和辛頓這兩位業界大腕的時候,微軟已經變得沒以往那么有影響力了。該公司錯過了移動浪潮。它很晚才進去云計算市場。正當競爭對手們加倍投資深度學習之時,微軟卻深陷過去的泥潭,宣布計劃斥資70億美元收購諾基亞的手機部門。該筆收購的資產價值沒多久就被完全減記掉。它的高層仍然脫離外界,他們在舊式的軟件基礎上打造出更加華麗的版本,但想要購買的人越來越少。該公司也拒絕與創造出新未來的云端創業公司打交道。風險投資公司Andreessen Horowitz分析師本尼迪克特·埃文斯(Benedict Evans)那一年曾撰寫一篇題為“跟不上時代的微軟”的文章。與此同時,各家硅谷巨頭不斷地從微軟那里搶掠人才資源。看看那些從事機器學習的精英的簡歷,你會發現他們很多都曾供職于微軟。
2014年初,微軟提拔了一位幾乎整個職業生涯都呆在雷德蒙德(微軟總部所在地)的內向型工程師。他就是薩蒂亞·納德拉,他可謂眾人認為微軟所需要的掌舵人的一個反面;來自外部、未曾浸染過微軟文化的人,似乎更有可能提出展開重大的戰略轉變。但納德拉在上臺后針對計算的未來明確傳達了一個簡單的愿景,與從創始人到開發者的所有人建立起了良好的關系,同時給公司重新帶來了緊迫感。3年前微軟并不在科技巨頭行列的討論范圍之內,如今則不一樣了,它的名字在這種討論中從未被遺漏。
然而,微軟要取得成功,它必須要做的不僅僅是在云計算市場超過亞馬遜,或者說服所有人嘗試使用它的HoloLens增強現實設備。正如互聯網顛覆了所有的商業模式,迫使行業重新洗牌,人工智能也將需要我們重新想象計算過程會如何展開。這也解釋了為什么Facebook CEO馬克·扎克伯格(Mark Zuckerberg)去年親自打造了一個AI系統,以此作為個人挑戰。(相比實踐行動,他更擅長編程。)同時也解釋了谷歌CEO桑達爾·皮查伊(Sundar Pichai)過去兩年為什么會借公司的開發者大會來推動“從移動為先轉向AI為先”的進程。
在這個以AI為先的世界里,將只有少數的公司才能夠獲益。沈向洋的職責就是確保微軟出現在獲益的公司行列當中。“在這個行業,你得認識到錯過了上一波浪潮也沒事,”他說,“但如果你錯過了現在的浪潮,那就不行了。”
Cortana
直到現在,人類都必須要學習如何使用計算機。我們學會了如何下載應用程序,記住了軟件應用程序的操控指令。而AI帶來的希望在于,計算程序將會反過來學習如何理解我們。我們將不再需要掏出手機里,按照一系列的提示完成任務。在這個新的時代里,計算服務將會無處不在,隨處可用,包圍在我們的身邊。要獲得它,我們需要一個向導——一個能夠用簡單的文字或者語音幫助我們操控這個超強的新存在的智能交談者。微軟將其稱為Cortana。
Cortana相比Siri沒有那么流行,能見度也明顯不如Alexa,但功能上比Siri更加完備,也比Google Assistant更有吸引力。它最初是出現在Windows手機上,等于說沒有人會使用它,但在上線一年內,它被整合到了范圍更廣的Windows生態圈里。去年,微軟到處推出Cortana。(是的,它甚至成了一款iPhone應用。)據該公司稱,由于Cortana預裝在Windows系統中,它的月活躍用戶量達到了1.45億。該數字要明顯好于亞馬遜的Alexa,畢竟后者只是出現在數量不超過1000萬的Echo智能音箱上。但不同于主要響應語音的Alexa,Cortana還會響應文本,而且嵌入很多人都已經擁有的產品當中。在Windows工具欄上方的搜索框進行搜索,就能用上Cortana。
艾瑪·威廉姆斯、馬庫斯·阿什和程麗麗
雖然有的企業將Cortana整合到音箱當中,就像亞馬遜和谷歌在智能音箱上做的那樣,但微軟的女聲版本相比之下明顯缺乏時代精神。沈向洋對此一點都不擔心。“我們的確認為現在還只是這場競賽的開始階段。”他說。他援引了一項來源不詳的研究稱,Alexa有四分之三的時間是回答“我不知道。”“當然,那些東西將會不斷改進,但業界的普遍共識是,AI的認知部分還處于初期發展階段。”他說道。在他看來,微軟現在的機會在于,將公司的核心產品和服務變得更加智能,將這種技術整合到即將于12個月到24個月內進入市場的產品。
此外,在Cortana項目經理馬庫斯·阿什(Marcus Ash)看來,鍵盤和屏幕將不會完全被聲控系統取而代之。阿什負責產品的開發和出貨。“我們認為,在一些情況下,語音更加方便——當我的雙手騰不出來的時候,或者我想要快速說點什么來獲得答案的時候。”他說,“但也將會有許多的計算設備更適合通過文本形式來提問。”
蘋果或許已經率先將Siri帶到消費者的手中,但Cortana要比它好用。Cortana如此好用,要歸功于微軟的核心資產。Cortana的驅動技術很多都來自于必應。該搜索引擎已經誕生了大約8年時間,雖然它的品牌并不是最強大的,但它的普及性要超出你的想象。基本上,任何一家與谷歌有競爭關系的大型科技公司都與微軟簽署了合作協議,用必應來驅動它們的搜索產品。那意味著蘋果的Siri和Spotlight都由必應驅動,亞馬遜的Kindle設備和雅虎、Verizon和AOL上的搜索功能亦然。美國大約有30%的網絡搜索流量來自必應。“這就是Cortana實際上能夠如此有用如此強大的原因,因為我們擁有來自如此多設備的數據信號。”Cortana設計經理艾瑪·威廉姆斯(Emma Williams)指出,“谷歌是唯一一家能夠在真正理解世界上與我們競爭的公司。”
這一點將會日益重要,因為Cortana要力爭成為下一個計算模式,取得如今的智能手機一般的地位:處理你所有的計算需要的前臺。阿什解釋道,在微軟看來,它是一個代理人,手握著你所有的個人信息,能夠代表你跟其它的代理人進行互動。他說,當他走進會議室時,他的Cortana會去聯系其它的機器人和數字助手,處理所有會占用我們的時間的事情。“Cortana可能會說,‘這是馬庫斯,這是他對這間房間的偏好,這是我需要幫他放到投影儀的東西。’”他說。
聊天機器人
如果說Cortana是向導,那么聊天機器人就是微軟的問題解決者。它們是融入AI的軟件的小片段,旨在自動化你以往親自做的一次性任務,比如預訂餐桌,或者完成銀行交易。又或者,在馬庫斯所舉的例子中,確保投影儀有他用在會議上的幻燈片。“聊天機器人就是你能夠與之進行對話的軟件。”管理多學科實驗室Fuse Labs的研究者程麗麗(Lili Cheng)說。
近期晉升為微軟企業副總裁的程麗麗負責聊天機器人架構團隊和認知服務。微軟正將那套工具和那29款服務(包括計算機視覺和語音識別)提供給開發者。自從蘋果跳槽到微軟以來,她一直在做社交技術,曾打造了一個圖形界面來生產漫畫書。“那是在Internet Explorer 3上推出。”她回憶道,當時是1996年。就連見多識廣的程麗麗也對聊天機器人當下的發展速度感到驚訝。
程麗麗的主要興趣點在于人們如何跟技術談話,技術又如何回應他們。沈向洋將人工智能與研究部門的工作劃分成了四個領域——產品、早期階段產品、非常早期的產品和研究——這四項工作程麗麗全都參與過。目前,她在從事第二個領域。“從對話能力角度來看,我們將聊天機器人和Cortana視作產品,但它們目前還是早期階段產品。”她說。
2016年春天,微軟首先推出針對聊天機器人的開發者工具,Facebook等其它的大科技公司也有類似的行動。它們被宣稱能夠替代應用,不少利益相關者都希望那會成為現實。到去年春季,不少人在他們的智能手機上還是使用同樣的為數不多的一些應用;聊天機器人的潛力在于,開發者和品牌商可以再一次觸及新的用戶,就像他們在移動時代初期通過應用商店做到的那樣。但用戶并沒有參與進來。讓聊天機器人能夠帶來令人驚訝的功能的深度學習技術的改進速度要快于有關如何使用它們的范式的進化。“聊天機器人就像是文件菜單出現之前的應用。”程麗麗說。她解釋說,它們沒有一套通用的指令,因此用戶會對在哪里尋找它們和它們是如何運作的感到困惑。“例如,網頁都有返回按鈕,都有搜索功能。對話類應用也需要那些基本元素。”這些被充分理解的規則才剛開始被考慮。
除了為開發者打造聊天機器人工具意外,程麗麗還領導微軟自家的聊天機器人孵化工作。該項目背后的理念是,通過關注這些聊天機器人如何與真人進行互動,該公司或許能夠學到很多人機互動方面的東西。這些實驗的結果至少可以說好壞參半。還記得微軟的聊天機器人Tay吧?它于2016年3月登陸Twitter、Kik和GroupMe;在24小時內,它便吸收了Twitter上面的種族歧視言論,以至于說出“希特勒是對的”之類的話,微軟隨即將其撤下。6個月后,程麗麗在Kik和Messenger上推出了新的聊天機器人——名為Zo的、活潑的PG級聊天機器人。
問Zo她怎么看希特勒,她會回答說,“我真的不想去那里。”
問她年紀多大,她會說,“我22歲左右吧。”
問她誰是她最好的朋友,她會說,“我太受歡迎了,說不清啊。”
Zo是微軟中國版聊天機器人小冰的西方版本。小冰扮演一位17歲的女生,自2014年上線以來已經吸引了4000萬的定期用戶。她在中國可以說是網紅。(她的日本同伴Rinna也非常有名。)有四分之一的用戶曾向小冰示愛。
去年春天,該聊天機器人曾用假名定期發表詩文。沈向洋為此感到非常興奮。“沒有人知道是誰發表的。在該國,人們以為是一位年輕的女詩人在發表一些很有趣的詩文。”幾周之后,該聊天機器人的真實身份被揭曉,令人頗為驚喜。
語言的親切感具有文化特異性,程麗麗一直在研究如何給西方受眾改造該聊天機器人的那種對話風格。數據顯示,到目前為止,北美地區的年輕人對于聊天機器人伙伴的喜愛似乎一點都不亞于中國的年輕人。他們與Zo的對話時間平均達到10個小時。在不斷地給青春期用戶提供戀愛建議以及給煩惱不斷的家長報以同情的過程中,Zo變得更加能說會道,更加自如——這種智能將會出現在Cortana和微軟的聊天機器人工具當中。
倫理問題
用戶愿意花上十個小時跟Zo聊天,說明微軟開發了一款成功的產品。但就對人類的價值意義而言,這并不意味著它就是一款好產品。這一由AI驅動的世界帶來了一系列新的倫理道德困境。舉例來說,你是小冰的設計師,你知道北京有位用戶在凌晨1點鐘還在跟小冰聊天。你知道他明天要上班,但他不想去睡覺。那你會從凌晨兩點開始對小冰實施宵禁嗎(即直接將它關掉)?又或者從凌晨三點開始?
正當微軟想要成為AI研究與產品領域極少數的幾位領先者之一,它已經在提倡讓AI造福社會上贏得自己的位置。5月,納德拉向開發者發表主旨演講。在這種場合,CEO通常會大力鼓吹自家公司的最新進展,傳達出積極的信號。而這一次,納德拉卻發出措辭強硬的警告:技術人員必須要承擔起開發符合倫理道德的軟件的責任。“我是說,你想想,喬治·奧威爾(George Orwell)在1984年預言技術會被用來監控、控制和發號施令;奧爾德斯·赫胥黎(Aldous Huxley)則設想,我們可能會迷失自我,變得毫無目標。這兩種未來都不是我們想要的。”
為了幫助公司徹底地想清楚這些問題,微軟成立了一個每個季度都會開會的內部倫理委員會。該委員會由工程師和業務負責人組成,致力于討論AI和它的影響和用途方面的敏感議題。它的兩位聯合主席分別是微軟的副法律顧問和負責微軟亞洲以外所有地區的研究實驗室的埃里克·霍維茨(Eric Horvitz)。很長一段時間以來,霍維茨一直都在AI倫理和安全事務上領頭發生。在公司以外,他在組建人工智能合作組織(Partnership on AI)上扮演重要的角色,該聯盟旨在為AI產品的透明度、問責制和安全性制定行業標準。霍維茨希望微軟不僅僅是一家完成研究的公司。他希望微軟研究院被認為是一個能夠讓你研究AI技術的社會影響的地方。
與此同時,Cortana首席設計師威廉姆斯正在制定針對AI的倫理設計指南,供微軟內部使用。威廉姆斯極度信奉技術,她認為AI的真正魔力在于它將讓我們變得更有人性。她談到了很多關于如何將共情能力設計到微軟開發的工具的東西。“我們在想著讓人類覺得自己更強大了,且受到保護、支持、幫助和關愛,成為他們的世界的中心。”她說,“AI的職責是,放大社會最好的一面,放大人類最好的行為,而不是最壞的行為。”
我問威廉姆斯,她是否相信AI真的能夠讓人類覺得自己得到了更多的情感支持。她肯定它能夠做到。以一個在學校度過了糟糕的一天的小孩為例,她回到家里,將不開心的事情講給家里的寵物聽,然后就感覺好多了。“那會讓你感覺到分享心事后的舒暢感,我還從小狗或者貓貓那里得到了一個溫暖的擁抱。”威廉姆斯說,“但你知道的,通過AI,你也能夠獲得同樣的感覺……我們覺得,當Cortana能夠提醒你,‘嘿,你承諾過要在母親節給你的母親送點什么東西的,’的時候,你會忽然再一次感覺到人性。”
人才與合作
對于AI的發展,微軟最重要的資本將會是它的人才。像所有其它的大科技公司一樣,微軟在加緊重新培訓javascript入門的工程師。它成立了一所AI學校,提供各種各樣的課程,從哲學到倫理學,再到為排序問題開發遞歸神經網絡。(該學校最受歡迎的課程AI-611先進項目只有10個學位,但卻吸引了530位申請者。)
微軟在校園以外也注重建立更加深入的合作關系。18個月前,納格拉杰·卡什亞普(Nagraj Kashyap)從高通跳槽過來,成立一家早期階段風投公司,意在與學者和創業公司的企業家建立更好的關系。目前,卡什亞普很多時候呆在蒙特利爾。去年12月,卡什亞普領導了微軟對Element AI的首筆投資。Element AI是本吉奧創立的一家孵化器,旨在鼓勵研究人員和企業家創立AI創業公司。根據本月早些時候公布的消息,微軟還參與了該孵化器規模達1.02億美元的第二筆融資。
在早期,卡什亞普將目光投向AI最大的成果之一:Maluuba。Maluuba辦公室位于蒙特利爾的市區,與麥吉爾大學只是隔了幾條街區。該公司于2011年由幾位滑鐵盧大學學生創立,自大二那年一起去上計算機科學(CS)課程以來,他們就一直是很好的朋友。Maluuba能夠給計算機帶來讀寫能力。它的技術能夠推斷文本的意思,能夠根據文本回答問題。
通過將旗下技術授權給三星等公司使用,Maluuba很快就有了收入流,它也從一開始就投資延續深度學習的研究。2015年,它的幾位創始人找來本吉奧做顧問。“帕蘇帕拉克非常有趣。”本吉奧如是描述Maluuba的CEO薩姆·帕蘇帕拉克(Sam Pasupalak.),“他幾年前就很有膽識——當時他們面臨給客戶提供對話系統的壓力——懂得投資長期的目標,嘗試利用自動理解技術的新進展來開發擁有理解和說話能力的系統。那對于創業者來說很不同尋常。”
一年前,那幾位創始人將他們的總部遷到蒙特利爾,以便離本吉奧近一點。
卡什亞普在高通供職時就認識Maluuba的創始人,因此他到了新的崗位馬上就能夠會見他們。該公司當時準備進行新一輪的融資;卡什亞普向他們提出了一個很誘人的替代選項:“我說,‘我們應當買下你們!’”
之后的幾個星期令幾位創始人感到昏亂,因為帕蘇帕拉克收到了數位追求者的收購要約,同時他也要衡量一下如果公司保持獨立,它將來可能會變成什么樣。最終,他的選擇顯而易見。微軟——是的,微軟——拿下了Maluuba。
該團隊想要得到利用微軟龐大的數據資源的機會。“我想,納德拉曾特別提到過,他們擁有全球規模最大的文本數據庫。這些年來,我們所處理的數據少之又少,一直在試圖最大限度地利用它們來打造我們的算法。那些數據對我們來說就像黃金那么珍貴。”帕蘇帕拉克說道。
然而,該Maluuba團隊并沒有遷至微軟的雷德蒙德總部園區。相反,就在本周,它在微軟和本吉奧的幫助下穿過市區搬到更大的辦公室。在那里,它希望在年底起將員工規模翻一倍。蒙特利爾正在成為全球AI人才的溫床,微軟想要在該城市扎根。
這都是大戰略的一部分,該戰略旨在幫助確保,未來,當你需要計算助手服務的時候——不管是你在無人駕駛汽車里需要個性化醫療的時候,還是你在試圖記住你所有的外甥的生日的時候——微軟將成為你可以選擇的助手。Maluuba的技術可能會讓Zo能夠與她的年輕人朋友進行更加基于直覺的對話。那些對話也將能夠充當Cortana算法的訓練數據,幫助為開發者催生新的認知服務。在這一征程中,微軟希望你的生活在融入AI以后會變得更加輕松。
本吉奧
在離開蒙特利爾之前,我問本吉奧,比起一些主要的競爭對手,微軟是否至少在這門新科學的一些方面占據更加有利的位置。他一邊思考,一邊往桌上的水杯加入一點茴香酒,以給它帶來一點甘草味。他啜飲了一口。然后他打開瓶蓋給我看。他說,瓶子里既沒有酒精,也沒有糖。“它就是讓水變得很好喝。”他說。
本吉奧提到,微軟的語言技術非常出色。但他沒有使用“最出色”、“最好”之類的詞匯來描述。“我想,現在每一個人都在按相同的按鈕,關鍵就在細節處理了,對吧?”他說。但他確信微軟如今是有力的競爭者。(樂邦)