4月22日,一年一度的中國綠公司年會(huì)在鄭州召開,馬云、馬蔚華等知名企業(yè)家在大會(huì)上做了演講,依圖科技創(chuàng)始人朱瓏也受邀前往,圍繞人工智能做了深度分享。
以下為朱瓏演講全文:
我們?cè)谛侣劗?dāng)中看到都是推崇本科生創(chuàng)業(yè),甚至推崇沒畢業(yè)的本科生去創(chuàng)業(yè)。我比較極端一點(diǎn),我是博士后,還好,中國人比較尊敬這個(gè)學(xué)歷。
但其實(shí)學(xué)術(shù)界的人來創(chuàng)業(yè),也是一個(gè)重新學(xué)習(xí)的過程。尤其商業(yè)領(lǐng)域上,如果不是特別有天賦,從履歷上來講天生是一個(gè)短板。
所以我是一個(gè)非典型的創(chuàng)業(yè),這種非典型的創(chuàng)業(yè)也給我有一個(gè)非常特殊的視角,對(duì)科學(xué)、對(duì)學(xué)術(shù)的理解,以及我創(chuàng)業(yè)幾年來,有些共同點(diǎn)和不同點(diǎn),也有一些不同的思考。
我有三段學(xué)術(shù)歷史,前2段歷史,鄧總(注:北極光創(chuàng)投創(chuàng)始人鄧鋒)剛才介紹的比較多了,我拿天使輪融資的時(shí)候,見到真格基金徐小平老師,講到MIT我的第二段學(xué)術(shù)經(jīng)歷,徐老師就要投了。去年我碰見徐老師,我才和他說我是人工智能的行家,因?yàn)槲业谌蔚膶W(xué)術(shù)背景。
深度學(xué)習(xí)是在2013、2014年開始在全世界火起來的,我第三個(gè)實(shí)驗(yàn)室的老板(Yann Lecun ,現(xiàn)任Facebook人工智能實(shí)驗(yàn)室的負(fù)責(zé)人)在深度學(xué)習(xí)領(lǐng)域從業(yè)了30年。在我創(chuàng)業(yè)的時(shí)候,也就是2012年,在全球深度學(xué)習(xí)相對(duì)而言都是一個(gè)非常冷門的專業(yè),非常好的博士生并不去到這樣的實(shí)驗(yàn)室、這個(gè)學(xué)科中來。
直到2013年,到中國可能是2014年,一夜之間全球的博士開始跳到這個(gè)專業(yè)來學(xué)習(xí),那就凸現(xiàn)了過去在這個(gè)專業(yè)領(lǐng)域里人才儲(chǔ)備的不足。講這個(gè)過程是說,非常短的時(shí)間里有非常巨大的變化。
人工智能比較火,談的人比較多,對(duì)我來說是非常難談的。我先給兩個(gè)定義:
一個(gè)是,難辨的技術(shù),
真假非常難辨,泡沫非常難辨。
但是談的人又多,專家非常多,無論是投資人、高校的人,還有創(chuàng)業(yè)的從業(yè)者。我自己有一個(gè)理解,現(xiàn)在是一個(gè)沒有權(quán)威的時(shí)代。
我今年年初在硅谷呆了一個(gè)月,有一些體會(huì)跟大家分享一下。什么是難辨的技術(shù)?
人工智能屬于科學(xué)的范疇,科學(xué)是離大眾很遠(yuǎn)的。不要說,我們最好的實(shí)驗(yàn)室,去評(píng)價(jià)另外一個(gè)實(shí)驗(yàn)室的工作,如果只看論文,看公開流通的文章,不是那么容易評(píng)論,評(píng)估成本是很高的,還要根據(jù)多年來兩個(gè)實(shí)驗(yàn)室的交流,以及互相理解的基礎(chǔ),才能評(píng)價(jià)他們的工作。這對(duì)圈內(nèi)人已經(jīng)是比較難,更何況現(xiàn)在流動(dòng)非常大。
我們對(duì)科學(xué)預(yù)設(shè)了一個(gè)立場(chǎng),就是客觀事實(shí)。但很多在市面上評(píng)價(jià)的東西都是比較主觀的,很多科學(xué)家、教授、研究員并不在業(yè)界的一線,盡管他是全職教授,或者是名牌大學(xué)的教授,很多他聽到的進(jìn)展,更多來自于新聞。比如說依圖科技的進(jìn)展,他也是看新聞了解到。但新聞可能不是最核心、最領(lǐng)先的一些技術(shù),以這個(gè)不是那么嚴(yán)謹(jǐn)?shù)乃夭淖鲱A(yù)測(cè)和評(píng)論的時(shí)候,其實(shí)是和真相差距比較大的。
科學(xué)是一個(gè)很嚴(yán)肅的東西,是一個(gè)客觀存在的東西,但是談的時(shí)候這個(gè)誤差是比較大的,容易被談的這個(gè)人的身份有一個(gè)預(yù)設(shè)的牽引。
另外一個(gè)是,這是一個(gè)沒有權(quán)威的時(shí)代。
我在美國最好的實(shí)驗(yàn)室呆過,他們要了解今天全球最先進(jìn)的技術(shù)在發(fā)生什么,也不是了解的那么全面。為什么?因?yàn)楝F(xiàn)在人工智能發(fā)展的速度太快了,甚至在各地都有跳躍性的發(fā)展。
谷歌一個(gè)AI的總監(jiān)不見得理解透自己公司的另外一個(gè)部門的所有進(jìn)展,對(duì)他們來講是比較困難的;全球最好的專家要理解全球最好的技術(shù),不見得是全面的。更不用說今天在美國頂級(jí)的學(xué)術(shù)界或者名牌學(xué)校里面的老教授,它已經(jīng)很難很難點(diǎn)評(píng)全球最好的技術(shù)在發(fā)生什么。
這和10年前的學(xué)術(shù)界是不一樣的,學(xué)術(shù)界3個(gè)全球最好的教授,實(shí)驗(yàn)室?guī)熜值軒讉€(gè)人湊在一起,差不多把全球的進(jìn)展,甚至未來3年的進(jìn)展就都預(yù)測(cè)了。
這就是一個(gè)沒有權(quán)威的時(shí)代,任何一個(gè)今天新的技術(shù),有可能是有突破性的社會(huì)意義和學(xué)術(shù)價(jià)值。這是我的一個(gè)體會(huì)。
因?yàn)榭茖W(xué)很難談,所以我先從不需要任何專業(yè)背景,不需要跨越文化的東西,就是知識(shí)的東西,來看看AI今天是一個(gè)什么狀態(tài)。
大家可以看一下這四對(duì)圖,你看哪一組是同一個(gè)人,哪一組不是同一個(gè)人。你們通過這個(gè)過程來感受一下你到底是怎么認(rèn)識(shí)人的,當(dāng)你辨別人的時(shí)候,到底是看眼睛像不像,還是嘴巴像不像。結(jié)論是右下角這組。
機(jī)器很容易找到一張圖來迷惑或者超過人的辨識(shí)邊界。這個(gè)話題很有意思,在非常早期的時(shí)候,大概3年前,出現(xiàn)了非常重要的邊界線。機(jī)器做的識(shí)別,跟普通的人作為一個(gè)識(shí)別的基礎(chǔ)比較的話,機(jī)器的識(shí)別能力已經(jīng)超過人類,這是一個(gè)很重要的界線。
很多最基礎(chǔ)的功能上機(jī)器超過人類,機(jī)器就可以替代人從事這部分工作,有太多場(chǎng)合可以替代,比如機(jī)器幾乎不會(huì)存在速度和體力的問題,一秒鐘看1個(gè)人,還是1秒鐘看1億人機(jī)器都可以,很多場(chǎng)合都可以被替代,這是很重要的分界線。
剛識(shí)別這四組人像的問題,有的人可能會(huì)問,在座的100多位都不認(rèn)識(shí)這幾個(gè)人,有可能識(shí)別不了,大家對(duì)陌生人的識(shí)別能力下降,可是對(duì)熟悉的、我的朋友的辨識(shí),機(jī)器不太可能超越我。
我們做了一個(gè)實(shí)驗(yàn)。我們有一個(gè)公安的客戶,他在一千萬數(shù)據(jù)庫當(dāng)中,把他女朋友的照片放進(jìn)去搜索,然后拿出相似的前十名出來,打亂了出來,問他哪個(gè)是他女朋友,他辨別不出來的,有可能是一個(gè)是證件照一個(gè)是生活照的原因,有可能因?yàn)槟挲g的原因,也可能有化妝的原因。
所以你非常熟悉的人,比如你女朋友,你不見得比機(jī)器更認(rèn)識(shí)你的女朋友,因?yàn)楣庹战嵌取⒒瘖y,人是很容易受主觀性的影響。今天機(jī)器做到一個(gè)程度,對(duì)非常熟悉的人的辨識(shí),機(jī)器也可以很穩(wěn)定的超越人類。
再拓展一點(diǎn),到更專業(yè)的領(lǐng)域,醫(yī)學(xué)上,一個(gè)專家他可能訓(xùn)練了3年或者5年,機(jī)器還是可能超越人類。我們還做了一個(gè)統(tǒng)計(jì),我們嘗試想回答一個(gè)問題,在中國大約13億人中有多少人和你長得一樣?
長得一樣的標(biāo)準(zhǔn),就是你媽辨別不清楚誰是誰,這個(gè)問題純粹是對(duì)世界的好奇。結(jié)論是每一億個(gè)人中有一個(gè)人和你一樣,全中國平均有12個(gè)人跟你長得一樣。你找得到12個(gè)“替身”,而且是你媽辨別不出來。
這是很重要的一個(gè)科學(xué)統(tǒng)計(jì)的結(jié)果,這是在其他任何地方都不知道的結(jié)論。
這是什么意思呢?我們做人工智能,除了產(chǎn)業(yè)化的意義意外,今天的人工智能,把機(jī)器的邊界不斷往前推進(jìn)的時(shí)候,它能夠幫助人類看到我們的智慧、天生的能力邊界在哪里。從前這個(gè)課題沒法被討論沒法被回答,以前沒有這么大規(guī)模的科學(xué)手段,這非常有意義。
雖然人臉識(shí)別非常普羅大眾,大家討論智能,容易講AlphaGo,講棋手。我對(duì)智能有一個(gè)很重要的理解,人工智能應(yīng)該是先解決一件什么事情?其中應(yīng)該是人天生就具備的能力,它應(yīng)該是3歲、5歲小孩就應(yīng)該有的能力。
這是人成為人的一個(gè)最重要的基礎(chǔ),它的很多智能是由這些衍生出來的,不是人掌握的那些知識(shí)。這種智能就是體現(xiàn)差異的,不是棋手才有的智能,也不是英國人美國人特有的智能,也不是上了大學(xué)的人才有的智能,只要你是人就會(huì)有這個(gè)智能。談?wù)撨@個(gè)事情,是回答人最本質(zhì)的東西。
再往下,我們談一談社會(huì)上的意義。
有的人可能聽說過這個(gè)案子,我們布了全球最大的人臉?biāo)阉饕?,公安可以通過這個(gè)搜索引擎追逃逃犯。這個(gè)案子是十幾年前的殺人犯,逃到廟里做主持,通過一個(gè)系統(tǒng)交叉比對(duì),把這個(gè)通緝犯和現(xiàn)有的十幾億人或者一個(gè)省的一億人,做大規(guī)模的幾萬億次的或者幾十萬億次的交叉比對(duì)。大部分逃犯可能都是改了證件、做了漂白,這可以說是大海撈針的方式。
另外一個(gè)是在派出所,老人帶著小孩走丟了,他說不清楚自己是誰,記不起身份證號(hào)碼。以前這個(gè)很難辦,公安也不知道該去收容所還是社保,很難處理這件事?,F(xiàn)在在派出所拍一下就知道這個(gè)人是誰,也比較簡單。
這個(gè)是講這個(gè)攝像頭用到了哪些位置,像是在公共的攝像頭,辦案過程已經(jīng)鎖定嫌疑人,公共攝像頭抓拍到了嫌疑人,比較遠(yuǎn)而且是運(yùn)動(dòng)的、模糊的、低清像素的情況下,基本都能識(shí)別出來。
這是在網(wǎng)吧,以前的小案件很難報(bào)案,幾百塊或者幾千塊錢,比如手機(jī)被人偷,既沒法查也比較難抓,現(xiàn)在是這種角落里的攝像頭,即便有角度的差異,也基本上可以查出來。
還有比較典型的應(yīng)用是在ATM機(jī)上,以前比較難做。ATM機(jī)上的魚眼攝像頭拍到的人像,現(xiàn)在也可以用這些人像抓捕疑犯。
中國的人工智能局面,先進(jìn)的技術(shù)結(jié)合垂直的場(chǎng)景,具有世界范圍內(nèi)領(lǐng)先意義。
今天的人臉識(shí)別技術(shù)在不同的區(qū)域、不同的場(chǎng)景下,能做到非常多事情。作為從業(yè)者,特別是從科學(xué)到創(chuàng)業(yè)圈,還是非常激動(dòng)人心的。我和一線的民警聊,過去民警工作中希望用到的科技手段,這2年下來基本都能做到了,更重要的意義是,你們看過的美國科幻大片里面的場(chǎng)景,我可以回答,我們都能做,而且基本上只有中國能做到。
美國和其他國家,像這種視頻條件和人臉識(shí)別的技術(shù)都很難做到。美國的人臉識(shí)別技術(shù)很好,好在哪里?美國只是谷歌的技術(shù)好,最多再加一個(gè)Facebook的技術(shù)好,但它的創(chuàng)業(yè)氛圍和政府的圈子的意識(shí)不見得是最領(lǐng)先的。
今天的局面是,像我這樣的留學(xué)生回國的比較多,中國出現(xiàn)這種先進(jìn)的技術(shù)和垂直領(lǐng)域相結(jié)合的產(chǎn)品是比較有代表性的,做出來不只是解決中國的問題,在世界范圍內(nèi)都是非常領(lǐng)先的。
我們剛介紹做人臉識(shí)別,其實(shí)我們還做其他方面。這是新的統(tǒng)計(jì)建模和人工智能在城市管理的應(yīng)用。
做一件什么事情呢?在杭州試點(diǎn),把道路上的車和燈以及路,比如有多少個(gè)車道,道路上車輛通過的速度,這些參數(shù)拿進(jìn)來進(jìn)行建模,能夠給交通一些優(yōu)化的建議,比如說紅燈可以從50秒調(diào)到40秒,能使道路通行的速度提高5%或10%,類似的預(yù)測(cè)在宏觀上做交通管理。
如果有個(gè)大的事件或活動(dòng),要做個(gè)預(yù)測(cè),過去都是憑著政府管理者的經(jīng)驗(yàn),都是經(jīng)驗(yàn)型的,不是大數(shù)據(jù)驅(qū)動(dòng)的決策機(jī)制?,F(xiàn)在可以靠真正的科學(xué)來輔助決策。
還有比較直接的應(yīng)用,是在醫(yī)學(xué)領(lǐng)域的肺的CT片,科學(xué)統(tǒng)計(jì)結(jié)果,今天機(jī)器可以做到和醫(yī)院副主任醫(yī)師看CT片子相當(dāng)?shù)乃健?/p>
這是屬于自然語言理解的范疇,大家看左上角,這是機(jī)器對(duì)小孩發(fā)燒狀況的描述,機(jī)器是可以通過技術(shù),把專業(yè)的醫(yī)學(xué)中的自由文本轉(zhuǎn)化成帶有語意結(jié)構(gòu)的,比如身體的部位,病灶程度、屬性等,全部能精確的摘要出來,形成智能的決策,給出相似的可能性的癥狀,以及相似的病例和一些診療方案。
以上就是一些不同的人工智能在今天在不同場(chǎng)所應(yīng)用,希望給大家一些人工智最前沿的傳達(dá)。
AI在今天發(fā)展速度是非常快的,即使現(xiàn)在非常熱的情況下,以BAT、創(chuàng)業(yè)者或是投資人,大家還是低估AI最前沿的技術(shù)有可能有跳躍性的進(jìn)步。