AI領域最牛的女人李飛飛,她的自傳我打10星!

腳踏實地,仰望星空。

作者丨溫妮

編輯丨關雎

李飛飛,是難得的社交平臺活躍分子,堪稱“AI界大活人”,她的推特保持着幾乎每天更新的頻率。

最新內容之一是轉發斯坦福大學AI實驗室關於機器人的最新研究突破:

視頻裡兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包,流暢度滿分。

這些流暢的動作是通過一項被稱爲關係關鍵點約束(ReKep)的新技術實現的。

這項技術很好地解決了機器人與世界互動時的複雜約束模擬,在空間智能方面有很大的潛力,而這正是李飛飛最新創業的方向。

李飛飛在轉發時配文:

我們實驗室的新工作展示了視覺和機器學習更深層次的整合!

末尾還有星星眼和加油的小圖標,驕傲感溢出屏幕。

李飛飛的推特簡介是一連串標籤,一個形容詞也沒有:

斯坦福計算機科學教授、斯坦福以人爲本人工智能研究院(HAI)聯合主任、AI4ALL聯合創始人及主席、研究員(AI、計算機視覺、機器學習、AI醫療)。

雖然她33歲就獲得斯坦福終身副教授職稱,是斯坦福大學人工智能實驗室首位女性主任、斯坦福大學首位紅杉講席教授,還當選美國三院院士,創建了現代人工智能的關鍵催化劑ImageNet數據集……

這些開創性成就,在幾乎由男性統治的全球科技界,無疑是耀眼的存在,但她從未標榜這些,彷彿這些只是追逐科學夢想路上的小小注腳。

除了最新的AI進展以及關於AI監管的一些發文,李飛飛也在推特,宣揚自己最新的自傳作品《The Worlds I see》,中文版已於今年4月份出版,題爲《李飛飛自傳:我看見的世界》。 (編者按:近幾年最佳傳記,看完後你會打10星!)

與在AI方面所表現出來的高調不同,李飛飛在宣揚新書時,表現出了非常的謙遜和低調。

這種反差,也貫穿了《我看見的世界》全書前後:浩瀚的人工智能發展史和個人的追夢史,對於那些生命中給過哪怕只是很小幫助的人,李飛飛花了很大的筆墨來描述,而對於自己的成就,只是輕輕帶過。

但又有誰,可以像她一樣,能將自己的個人史,寫成一部波瀾壯闊、跌宕起伏的人工智能發展史?

“移民”“女性”雙重弱勢標籤疊加,進一步增加了衝關的難度。

從成都到新澤西州,爲什麼癡迷物理的李飛飛轉向了AI?是什麼點亮了她的北極星?她是如何在科技界實現人生逆勢的?她因何創建AI4ALL?她眼中的人工智能是怎樣的?如今她又在解決什麼樣的難題?

書中都有答案。

“飛飛”與好奇心

李飛飛名字的由來,頗具戲劇性。

1976年,李飛飛出生那天,父親姍姍來遲,並不是因爲路上堵車或其他意外,而是因爲他一時興起,跑到公園觀鳥,忘了時間。

取名“飛飛”,也是觀鳥時想的。

母親勃然大怒,但也覺得這是一個好名字。

父親的這種好奇心傳染給了李飛飛,小時候,父親常帶她到公園觀鳥,去田裡看水牛或捕捉昆蟲,激發了她對世界強烈的探索慾望。

中學接觸到物理後,這成了她最癡迷的科目,連騎自行車轉彎時都思考加速度和角動量的變化。

她還對物理學歷史上一個又一個偉大人物感興趣,對阿基米德洗澡時發現浮力定律、牛頓在瘟疫肆虐時躲在家鄉寫《自然哲學的數學原理》等事件浮想聯翩。

爲了追逐李飛飛的科學夢,權衡之下,父母舉家遠赴美國。

在美國上高中時,她有段時間特別迷戀相對論,但是搞不懂,覺得特別難。但突然有一天,做夢的時候好像把相對論搞懂了。她特別興奮,半夜起來在那寫。

沿着對物理的好奇心,李飛飛找到了自己的北極星。

大二的時候,她開始讀一些物理學家的書,不約而同地,她最崇拜的物理學家,包括愛因斯坦,他們在人生的後半程,不光是思考物理的問題,光子原子或是宇宙的源頭,而是開始思考生命的問題。

李飛飛也開始對生命好奇,最讓她好奇的,關於生命的故事,就是Intelligence,爲什麼生命會Intelligent,而Intelligence到底是什麼,是不是隻有人類的生命可以Intelligent?

出於這些思考,讀博士時,李飛飛找到了AI,那個時候沒人知道AI,還是AI的冬天。

好奇心就像一個探照燈,你把好奇心打開,這個燈可以照到不同的地方,也許照到的第一個第二個地方不是你喜歡的,但是你不斷的通過這個好奇心去找,不斷look for it,你就會看到讓你特別特別興奮,有意思喜歡的東西。 ——李飛飛

“浪費的中獎彩票”與北極星

剛到美國的日子很難捱,一家三口擠在只有一間臥室的公寓裡,傢俱是從路邊遺棄的垃圾裡撿的。

李飛飛父親在一家華人開的店找到維修相機的工作,每天很晚才下班。母親在商店找到一份收銀員的工作,做重複和機械性的操作,遠離了她熱愛的文學作品。

爲了補貼家用,每一個不上學的日子,李飛飛都會去打零工。

最常見的工作是去中餐館打雜,每天從上午11點工作到晚上11點,總共12個小時,時薪2美元。

在餐館打雜時,趁着下午換班,李飛飛會利用難得的空隙去讀母親分享給她的文學名著,餐館經理對此不屑一顧。“他覺得對我們這樣的人來說,想象力在生活中是多餘的”,李飛飛回憶稱。

對這些連英語都不會說的華裔移民來說,階層躍遷是個遙不可及的夢。

曾經引以爲傲的學業也變成負擔。李飛飛幾乎不會說英語,每天回家做作業,她都要準備兩本詞典,一本英譯中,一本中譯英,否則就寫不了作業。

儘管學習的時間少得可憐,但李飛飛還是考出了SAT1250,數學滿分的成績。

她申請了三所大學,麻省理工、 普林斯頓、和新澤西州立羅格斯大學。

最終,三所學校都發了錄取通知,普林斯頓大學更是開出了幾乎全額的獎學金。

李飛飛要去普林斯頓讀書的消息轟動整個社區,一度還登上了本地的報紙。

但讓人略感遺憾的是,李飛飛沒有選擇醫學、金融這種能通向富裕階層的敲門磚專業,而是選擇了自己癡迷的——物理。

“真是張好彩票,可惜浪費了。”鄰居們無法理解。

1999年,李飛飛在普林斯頓大學的大學學習生涯即將結束,再次面臨科學抱負與現實生活之間的抉擇。

讀研的誘惑與開啓職業生涯的壓力讓她左右爲難。

包括高盛和美林在內的衆多知名企業向她拋出了橄欖枝,他們提供了一切:福利、晉升機會、令人豔羨的起薪,當然還有醫療保險。他們承諾免除債務,結束乾洗店的勞累,在母親的健康狀況日益惡化的情況下爲她的家庭提供保障。

而這唯一要求就是讓她放棄科學。

在自己斟酌了大半個星期之後,李飛飛跟母親在乾洗店有了如下對話(以下爲原文摘錄):

“媽媽,我在考慮幾個選擇。我面試了幾家‘公司’,中文是叫‘公司’吧?就是華爾街巨頭。我必須得承認,他們給的條件很誘人。”

“華爾街巨頭?”

我意識到,她並不熟悉這些美國文化術語。

“就是股票、交易什麼的。搞投資的。當然,還有很多東西要學,不過如果我真的下定決心,我覺得還是能學會的。”

“嗯。”她平淡地回答,“這是你想要的嗎?”

“我的意思是……光是薪水就足以改變我們的生活了,而且——”

“飛飛,這是你想要的嗎?”

“你知道我想要什麼,媽媽。我想成爲一名科學家。”

“那還有什麼好說的呢?”

李飛飛選擇繼續學業。

在加州理工大學的博士生生涯即將結束時,李飛飛再次處於人生的十字路口。

世界知名管理諮詢公司麥肯錫的合夥人過來招聘,他們正在尋找一個實習級別的分析師。

李飛飛申請了面試,甚至爲此買了一套遠超預算的西服,小心翼翼地把標籤藏在領子下面,這樣穿完後馬上就能退貨。

面試不可思議地進行得非常順利。

麥肯錫公司立即給了肯定的邀請,並且決定將李飛飛的實習機會轉爲長期的正式職位。

這份工作似乎可以讓她卸下長久揹負的重擔,也是通往每個移民家庭都希望自己孩子擁有的職業生涯的捷徑。

但代價還是要放棄她的北極星——科學。

李飛飛回到家裡分享了這個“好消息”,告訴她起薪、以及優厚的待遇(以下爲原文摘錄):

“我們真的要再次討論這個問題嗎? ”

“媽媽,我知道,但聽我說——”

“我瞭解自己的女兒。她不是管理顧問,或者其他什麼職務。她是個科學家。”

“想想你的身體吧,媽媽!想想我們的開銷。搞學術能給我們帶來什麼呢?”

“飛飛,我們走到這一步,不是讓你現在放棄的。”

“這不是放棄!這是我夢寐以求的工作,一份事業,可以讓我們擺脫目前的困境。看看我們現在活成什麼樣了!三個大人住在一個宿舍裡!”

母親停頓了一會兒,也許是在思考這些話,然後回答說:“飛飛,你一直在說自己走的路很‘自私’,就好像你追求科學是在犧牲我們一樣。”

“我怎麼能沒有這種感覺呢?我現在本來可以養活咱們全家,而且——”

“你沒明白我的意思。這從來就不是你一個人的路。從一開始,這就是我們全家的路。不管你是註定要成爲科學家、研究員,還是其他我沒有辦法想象的職業,也不管你能不能從中賺到錢,從我們的飛機離開上海的那一刻開始,我們全家就一直在爲這個目標努力。”

我不知道該說什麼。

“我再說最後一次:我們走到這一步,不是讓你現在放棄的。”她是對的。

她總是對的。這一次,不知什麼原因,我終於聽進去了她的話。我再也不會質疑自己的道路了。

“我聽到的勸阻之聲已經多得夠

我用一輩子了”與ImageNet

2006年,計算機視覺研究仍然是一個缺乏資金,且很少受到外界關注的學科。

許多研究人員專注於構建更好的算法。

他們堅信,算法是計算機視覺的中心,如果把機器智能與生物智能做類比,那麼算法就相當於機器的突觸,或者說是大腦中錯綜複雜的神經迴路。

但李飛飛並不這麼認爲。在攻讀博士期間,李飛飛意識到了這種研究思路的侷限性:

如果訓練算法的數據不能很好地反映現實世界,那麼即使是最好的算法也無法很好地完成工作。

李飛飛的想法是:構建一個能夠完全反映真實世界的數據集。

教機器像人一樣識別圖片中的物體,是人工智能研究領域一直都希望攻克的一項重大難題。

而這也是李飛飛最重要的貢獻——創建了數據庫ImageNet,有人工智能領域的從業者評論,“沒有ImageNet,就沒有現在的深度學習革命”。

ImageNet的宏偉目標是爲每個類別收集1000張獨特的圖片,從小提琴到德國牧羊犬,再到抱枕,涵蓋了22000個類別,總計需要約2000萬張圖片。

但在起步之初,李飛飛ImageNet的想法就遭到了幾乎所有人的一致反對。“我聽到的勸阻之聲已經多得夠我用一輩子了(可能下輩子也夠了)。”李飛飛說。

最後她終於遇到了第一位支持者,李凱教授是微處理器架構領域的領軍人物。

微處理器架構是一門將數百萬納米級晶體管排列到世界上最複雜的設備中的藝術,因此他比大多數人都更瞭解指數思維的力量。他相信李飛飛的方向是正確的。

李凱教授

他毫不猶豫地爲李飛飛的研究捐贈了一套工作站,解決了項目亟需的算力問題。

同時因爲自己即將離任,他也將自己的學生鄧嘉推薦給了李飛飛。

李飛飛和鄧嘉組成了兩人團隊,開啓了這個困難重重的項目。

起初,李飛飛採用的策略是支付本科生每小時10美元的報酬,手動搜索並添加圖片到數據庫。

“我從理論上能理解,但這個工作量也太大了,屬於天文數字,可不是谷歌搜索幾次就能完成的。”鄧嘉面露疑色。

按照既定的速度,ImageNet的完工需要整整19年的時間。

在一位叫孫民的研究生的建議下,李飛飛知道了亞馬遜開發的土耳其機器人項目,通過人力衆包來完成電腦力有不逮的細碎、精確的智能工作。

正是這款機器人把ImageNet的大學生標註員隊伍變成了一個由數十人、數百人、數千人組成的國際團隊。

隨着獲得的支持不斷擴大,鄧嘉給出的預計完成時間急劇縮短,先是15年,然後是10年、5年、2年,最後不到1年。

但資金需求,也逼近團隊所能負擔的極限,2009年,李飛飛跳槽去斯坦福,這裡爲她的研究提供了新的研究資金。

2009年6月,ImageNet的初始版本終於完成:收集了1500萬張圖片,涵蓋了2.2萬個不同類別。這些圖片篩選自近10億張候選圖片,並由來自167個國家的4.8萬多名全球貢獻者進行了標註。

ImageNet不僅在規模和多樣性上達到了李飛飛多年來夢寐以求的水平,還保持了一致的精確度:每張圖片都經過了手工標註,並在層次結構中進行了組織,經過了三重驗證。

從數量上看,李飛飛已經實現了既定目標,建立起了當時人工智能史上最大的人工編輯數據集。

“我們的研究大膽且具有前瞻性,雖然並不完備,但能引發思考,其中很多在概念上也很簡單。但直到ImageNet出現,一切才變得切實可行起來。”李飛飛說。

機器具備像人一樣“看”的能力,歷史上第一次變成現實。

更重要的是,她用大數據訓練多層神經網絡的想法,從圖像擴展到語音、文字、視頻等其他領域,引爆了持續到現在的AI革命。

AI4ALL(AI FOR ALL)

消除偏見

2015年,雅虎Flickr一經推出,即麻煩纏身,接二連三出現失誤,描述56歲黑人男子的單色肖像爲“猿”,將達豪集中營大門的照片標記爲攀爬架,把一位臉上塗有彩色粉末的白人婦女貼上了“猿”的標籤。

谷歌也陷入了類似的爭議,因爲谷歌照片服務將兩個黑人青少年錯誤地標記爲“大猩猩”。

人工智能是“男性之海”,包括ImageNet在內的數據集由於缺乏多樣性,導致算法無意中帶有偏見,在非白人、非男性用戶身上表現不佳;未經充分測試的算法和存疑的決策又進一步加劇了負面影響。

當互聯網呈現的是以白人、西方人和男性爲主的日常生活畫面時,技術就很難理解其他人羣了。

除了數據集不平衡,模型本身是否存在問題?在依賴所有數據的算法架構中,是否隱藏着未被發現的弱點?可以促進訓練過程的學習技術有問題嗎?

爲了消除偏見,李飛飛和她的學生奧爾佳向九年級和十年級的女生開放了斯坦福大學人工智能實驗室課程。

邀請少數人羣參加人工智能課程的想法非常受歡迎,她們的項目很快就像滾雪球一樣發展成爲全國性的非營利組織,遍佈北美各地校園,使命範圍也不斷擴大。

很快,她們也開始向有色人種學生和經濟困難學生等邊緣羣體提供類似項目。

在短短几年後,項目被正式命名爲AI4ALL,梅琳達·弗倫奇·蓋茨(Melinda French Gates)的Pivotal Ventures和英偉達創始人黃仁勳提供了一輪資金。

AI4All還在持續影響世界。

它關注AI領域目前佔比很少的學生,如女生、非裔美國人、拉丁裔學生,或低收入背景的孩子,目標是激勵更多年輕人追求AI的工作,以增加人工智能的多樣性,抵消機器學習算法中嵌入的偏見和歧視的證據。

在業界追逐人工智能未來時,往往肆意而爲,缺乏自省,而AI4All的努力表明,至少有一小部分人在逆向而行。

“以人爲本的人工智能”

2018年,李飛飛回歸斯坦福大學之後,正式宣佈啓動以人爲本人工智能項目,創建了以人爲本人工智能研究院(Stanford Human-Centered AI Institute (HAI)),目標將人性置於人工智能的中心。

HAI 聯合主任:John Etchemendy和李飛飛

她在倡議書中提到,“以人爲本”的人工智能( Human-Centered AI)源自於三個簡單而又有力的想法:

1、爲了讓人工智能更好地服務於我們的需要,其必須包含人類智慧中的多樣性、細微差別及深度。

2、人工智能的發展應與其對人類社會影響的長期研究相結合,並據此加以指導。

3、人工智能的最終目的應該是增強我們的人性,而不是削弱或取代它。

這意味着人工智能,需要與神經科學、心理學和其他學科合作起來,以創建更具有人類敏感性的算法,確保AI幫助人們完成工作,而不是取代他們。

李飛飛和斯坦福大學醫學院教授阿尼·米爾斯坦(Arnie Milstein)合作的“環境智能”技術,便是以人爲本的很好的體現。

這是從“洗手”這件小事,切入的研究。

洗手是預防感染傳播的最重要手段,但直到今天,醫務人員不洗手或洗手方法不當仍然是造成醫療環境中疾病傳播的重要因素。

李飛飛和阿尼設想了一種旨在用智能且可靠的感知來填充空間的技術,最大的特點就是不會引人注目。

與人類監察員不同,他們的技術將悄然融入背景之中,默默監視,只有在察覺到危險時纔會發出警報。

“無論是解決數據中的偏見,還是保護醫院裡的病人,這一切的共同點是我們的技術如何對待人,尤其是如何保護個體的尊嚴。‘尊嚴’,這是我一直強調的關鍵詞。最重要的問題就是,人工智能如何才能尊重人的尊嚴呢?這個問題是一切研究工作的立足點。”

“以人爲本的人工智能。”這個詞我琢磨了好幾個月,現在終於說了出來,“我一直這樣表述自己的理念。我希望這個詞能恰如其分地詮釋我今後的職業生涯。我希望在未來的歲月裡,‘以人爲本的人工智能’對你們所有人都能有一定的意義。” ——李飛飛