“2018中國(guó)綠公司年會(huì)”于4月22日-24日在天津舉行,主題為:智能商業(yè)時(shí)代 高質(zhì)量發(fā)展與價(jià)值創(chuàng)造。出門(mén)問(wèn)問(wèn)創(chuàng)始人兼CEO李志飛出席【全會(huì)-AI專(zhuān)場(chǎng)】并演講。
以下為李志飛演講全文:
李志飛:標(biāo)題是“AI語(yǔ)音怎樣如何打造企業(yè)競(jìng)爭(zhēng)力”。出門(mén)問(wèn)問(wèn)干了兩件事情,自己開(kāi)發(fā)語(yǔ)音交互技術(shù),從麥克風(fēng)的陣列到環(huán)形,到語(yǔ)音識(shí)別,到對(duì)接、TTS,一整套的端到端的語(yǔ)音交互技術(shù),在全世界或者中國(guó)創(chuàng)業(yè)公司比較特別一點(diǎn)的,因?yàn)橐话愕膭?chuàng)業(yè)公司是開(kāi)發(fā)一個(gè)單一技術(shù),而出門(mén)問(wèn)問(wèn)是開(kāi)發(fā)端到端的語(yǔ)音交互技術(shù),在中國(guó)和全世界都是比較少見(jiàn)的,這是第一件事情。
第二件事情,出門(mén)問(wèn)問(wèn)把語(yǔ)音交互運(yùn)用到智能硬件場(chǎng)景下,主要是自己直接面對(duì)消費(fèi)者,跟全世界99%的AI創(chuàng)業(yè)公司不太一樣,主要業(yè)務(wù)是ToC,因?yàn)橐话愕腁I公司是ToB。
過(guò)去大概五年多的時(shí)間我們做了很多探索,對(duì)AI到底怎么落地消費(fèi)場(chǎng)景有一些想法。第一,軟硬結(jié)合是落地ToC的主要方式,今天聽(tīng)起來(lái)比較容易理解,但在2013、2014年做智能硬件的時(shí)候,很多人覺(jué)得為什么算法公司一定要做硬件,不太理解。舉兩個(gè)例子,一個(gè)是谷歌,一個(gè)是我們自己。谷歌在過(guò)去硬件方面,比如智能手機(jī)、智能音箱、智能耳機(jī),這是非常非常嚴(yán)肅的事情??赡芤郧按蠹依斫夤雀韪嗟氖欠?wù)、軟件公司,但它在硬件方面,尤其是過(guò)去兩年花了很大的血本做硬件。出門(mén)問(wèn)問(wèn),智能音響、智能手表做了很多硬件嘗試。很多人問(wèn)為什么谷歌和出門(mén)問(wèn)問(wèn)做AI落地,為什么自己做硬件,而不像以前安卓系統(tǒng),像谷歌開(kāi)發(fā)安卓,很多合作伙伴做硬件,這是時(shí)代的變化,階段也不太一樣,今天最主要的原因我認(rèn)為是AI技術(shù)非常不成熟,不像一個(gè)查檢直接插到另外一個(gè)地方拼起來(lái)就可以直接用。在這種情況下,如果想把AI落地,想依賴于合作伙伴跟你有同樣的想法,對(duì)AI有同樣的態(tài)度,是比較難的,過(guò)去無(wú)數(shù)次證明,每次做一個(gè)證明都發(fā)現(xiàn)很難找到合適的合作伙伴,連谷歌都存在這樣的問(wèn)題。軟硬件結(jié)合才能做出好的用戶體驗(yàn),這是最主要的核心問(wèn)題。
當(dāng)然,另外一個(gè)觀點(diǎn),可能是因?yàn)锳I的商業(yè)化如果純粹靠軟件是比較難以商業(yè)化的,必須通過(guò)硬件作為一個(gè)載體進(jìn)行AI的商業(yè)化,如果AI是靈魂,各種硬件就是體,靈魂需要護(hù)體才能產(chǎn)生價(jià)值,至少未來(lái)一兩年,軟硬結(jié)合是AI落地最主要的方式。
語(yǔ)音交互大家都覺(jué)得很重要,但如果大家去做一個(gè)調(diào)查,在日常生活中,語(yǔ)音交互不是主流的交互方式,最主要的還是用鍵盤(pán)、觸摸屏,為什么?未來(lái)語(yǔ)音交互是不是一定沒(méi)有希望?接下來(lái)講一下我們的觀察,解釋這幾個(gè)問(wèn)題。
首先看一下欲活躍,大家都用過(guò)各種設(shè)備,手表、音箱,出門(mén)問(wèn)問(wèn)做ToC,在所有設(shè)備商都做過(guò)語(yǔ)音交互運(yùn)用。手機(jī)的欲活躍非常低,一百個(gè)手機(jī)用戶,可能四個(gè)用語(yǔ)音交互。我們?cè)?jīng)做過(guò)谷歌語(yǔ)音搜索應(yīng)用,2014年,中國(guó)80%以上的谷歌硬件都裝在我們的語(yǔ)音搜索應(yīng)用,那個(gè)場(chǎng)景下,用戶打開(kāi)谷歌,可能90%的用戶都會(huì)用到語(yǔ)音交互,因?yàn)槟鞘俏ㄒ坏慕换シ绞?。智能手表、音像的活躍率遠(yuǎn)遠(yuǎn)大于手機(jī)。為什么語(yǔ)音交互今天沒(méi)有成為主流的交互方式呢?非常量化的看這個(gè)問(wèn)題,原因就是因?yàn)榻裉?5%的智能設(shè)備都是智能手機(jī),像智能手表、音箱、耳機(jī)、收集、智能車(chē)載,這是今天主要的交互設(shè)備是智能手機(jī),但活躍度不是很高,導(dǎo)致語(yǔ)音交互沒(méi)有成為一個(gè)主流的交互方式。未來(lái)語(yǔ)音交互是不是沒(méi)有希望了?也不是,因?yàn)榇蠹乙吹揭粋€(gè)大的趨勢(shì),未來(lái)幾年,非手機(jī)類(lèi)的智能設(shè)備增長(zhǎng)幅度遠(yuǎn)遠(yuǎn)超過(guò)手機(jī),這是以前的數(shù)據(jù)。上一個(gè)季度,中國(guó)智能手機(jī)不但沒(méi)有增長(zhǎng),可能是負(fù)增長(zhǎng),智能手機(jī)設(shè)備飽和率非常高,已經(jīng)很難再有大規(guī)模增長(zhǎng),但是其它類(lèi)別,耳機(jī)、音箱的增長(zhǎng)都是30%、50%、100%。做一個(gè)簡(jiǎn)單的數(shù)學(xué),今天的絕對(duì)數(shù)量,再算一下未來(lái)的增長(zhǎng)率,可以很快的做一個(gè)判斷,在將來(lái)三年、五年會(huì)看到非手機(jī)類(lèi)的智能設(shè)備超過(guò)30%以上,美國(guó)會(huì)走的更快一點(diǎn),其次是歐洲,然后才是中國(guó)。
為什么非手機(jī)類(lèi)的設(shè)備占到30%以上如此重要?因?yàn)榉鞘謾C(jī)類(lèi)的智能設(shè)備語(yǔ)音交互方式是非常重要的方式,30%的設(shè)備都是非手機(jī)類(lèi)的時(shí)候,首先這些設(shè)備都是小型化的,第二,是便攜的。美國(guó)計(jì)算機(jī)博物館,隨著年代的進(jìn)程,網(wǎng)絡(luò)、村存儲(chǔ)、計(jì)算的設(shè)備都是小型的、便攜化的,無(wú)論是耳機(jī)還是手表和其它車(chē)載設(shè)備都是小型化、便攜化,沒(méi)有屏幕了,沒(méi)有鍵盤(pán)了,而且是隨身攜帶的,在路上很不方便用鍵盤(pán)、觸摸屏,在車(chē)?yán)锖懿环奖阌糜|摸屏、鍵盤(pán)。30%的設(shè)備都是非手機(jī)類(lèi)的,而且沒(méi)有屏幕、鍵盤(pán),語(yǔ)音交互就是非常重要的,甚至在某種程度下是唯一的交互方式,這個(gè)時(shí)候語(yǔ)音交互才會(huì)成為一個(gè)主流的交互方式。
作為AI公司,怎么打造語(yǔ)音的競(jìng)爭(zhēng)力,我從出門(mén)問(wèn)問(wèn)的角度,或者怎么幫助第三方的角度講一下。任何一個(gè)AI公司,要有比較大的競(jìng)爭(zhēng)力,關(guān)鍵的一句話,找到可以掌控的規(guī)?;瘓?chǎng)景。過(guò)去很多人一直討論到底AI是數(shù)據(jù)重要還是算法重要、技術(shù)重要還是場(chǎng)景重要?到了一定規(guī)模下,一定是場(chǎng)景更重要,特別重要的是場(chǎng)景是可以掌控的,比如谷歌為什么一定做AI,一定要做硬件,只有硬件才是他自己可以掌控的場(chǎng)景,而且是規(guī)?;膱?chǎng)景,這是今天很多AI公司做到所謂獨(dú)角獸階段要面臨的問(wèn)題,怎么打造自己可掌控而且是規(guī)?;膱?chǎng)景,數(shù)據(jù)、算法只是敲門(mén)磚,不能構(gòu)成絕對(duì)的壁壘。
出門(mén)問(wèn)問(wèn)具體到怎么打造規(guī)模化的場(chǎng)景?都是大白話,很多時(shí)候特別忙,是不是每天都能思考一下幾個(gè)點(diǎn),是不是打造一個(gè)可控的、規(guī)?;氖褂脠?chǎng)景。出門(mén)問(wèn)問(wèn)有幾點(diǎn),第一,持續(xù)的迭代提升語(yǔ)音交互核心技術(shù),雖然技術(shù)不能構(gòu)成絕對(duì)的壁壘,但必須持續(xù)性的保持領(lǐng)先,才有可能保持競(jìng)爭(zhēng)力。第二,不停打造語(yǔ)音交互可以應(yīng)用的場(chǎng)景,無(wú)論是車(chē)載還是家居,還是智能的可穿戴。當(dāng)產(chǎn)品打造出來(lái),特別重要的是真正規(guī)模化,而不是做一下PR或者融一下資,搞一個(gè)發(fā)布會(huì)就結(jié)束了。今天很多AI公司確實(shí)都沒(méi)有找到,當(dāng)你做一個(gè)硬件達(dá)到一百萬(wàn)臺(tái),是特別重要的指標(biāo)。出門(mén)問(wèn)問(wèn)為了做銷(xiāo)量,無(wú)論做線下還是國(guó)際化,還是做線上,都花了很多精力,比如國(guó)際化,今天的智能手表在美國(guó)、歐洲、德國(guó)都是排前五名的,包括進(jìn)入美國(guó)最主流的best Buy的營(yíng)銷(xiāo)渠道。
由于今天的營(yíng)銷(xiāo)規(guī)模不夠大,必須把ToB也能滲透到ToC里去。2012年首先做技術(shù)、場(chǎng)景,第一次做軟硬結(jié)合的閉環(huán),最近持續(xù)把閉環(huán)更大規(guī)模上循環(huán)的疊加。過(guò)去做了很多產(chǎn)品,有智能手表、音箱、耳機(jī)、車(chē)載設(shè)備,在市場(chǎng)上有一些產(chǎn)品表現(xiàn)的不錯(cuò),放在第三方的合作伙伴的場(chǎng)景。ToB,更多是利用在ToC打造的端到端的產(chǎn)品體驗(yàn),幫助合作伙伴提升他們的體驗(yàn),像谷歌或者大眾汽車(chē)都是ToB的合作,有麥克風(fēng)的陣列,也有智能語(yǔ)音機(jī)器人,包括對(duì)智能、新零售,所有的都是語(yǔ)音交互方式,放到ToB的環(huán)境里,給客戶提供更好的體驗(yàn)。
謝謝大家!
鄧鋒:
算法、數(shù)據(jù)、場(chǎng)景,從場(chǎng)景入手,找到可控制的規(guī)模化場(chǎng)景很好。但是大家都這么想,選擇場(chǎng)景有規(guī)模,但很多人都在做,包括亞馬遜、BAT、小米,作為一個(gè)小公司,靠什么建立競(jìng)爭(zhēng)壁壘,跟這些大公司競(jìng)爭(zhēng)?
李志飛:
這是特別難但是又必須回答的問(wèn)題,比如出門(mén)問(wèn)問(wèn)做智能手表,已經(jīng)不算小公司,200名工程師專(zhuān)門(mén)做智能手表場(chǎng)景,大公司的項(xiàng)目特別多,怎樣建立競(jìng)爭(zhēng),沒(méi)有大家想象得那么可怕,但是確實(shí)在特別關(guān)鍵的場(chǎng)景,比如智能家居,這是現(xiàn)在面臨最大的競(jìng)爭(zhēng),在美國(guó)有谷歌,中國(guó)有百度、騰訊、阿里,都在做智能音箱,對(duì)我們來(lái)說(shuō)唯一能夠生存的方式不是硬碰硬,唯一能做的就是垂直化,比如智能音箱,我們的產(chǎn)品是兒童ID,給兒童看的,整個(gè)語(yǔ)音交互,從喚醒到內(nèi)容,到語(yǔ)音識(shí)別都是為兒童場(chǎng)景優(yōu)化的,這就是垂直化的例子,因?yàn)楣雀?、阿里很難在這一刻說(shuō)專(zhuān)注兒童的場(chǎng)景,這是我們選擇的一個(gè)方式。
鄧鋒:
還有一個(gè)問(wèn)題,語(yǔ)音交互可簡(jiǎn)單,可復(fù)雜。從你的角度看,中國(guó)做語(yǔ)音交互的技術(shù),不光是語(yǔ)音識(shí)別,跟世界最先進(jìn)的水平到底有差別嗎?差多遠(yuǎn)?
李志飛:
鄧總講了特別核心的話題,一說(shuō)到語(yǔ)音交互,就說(shuō)是語(yǔ)音識(shí)別,其實(shí)最難的問(wèn)題是加上對(duì)話,物理世界特別復(fù)雜,很多東西不可預(yù)測(cè),這是確實(shí)必須承認(rèn)有難度。具體說(shuō)中國(guó)到美國(guó),在核心算法上可能有一點(diǎn)點(diǎn)差距,但是還是場(chǎng)景,做通用的對(duì)話系統(tǒng),我覺(jué)得很難,基本上現(xiàn)在不太可能。但是做車(chē)載的時(shí)候,就那么幾個(gè)事情,導(dǎo)航、聽(tīng)音樂(lè)、打電話,不會(huì)硬要聊天,談情說(shuō)愛(ài),在這種情況下,中國(guó)公司反而會(huì)做得更好,因?yàn)槲覀兟涞馗?,而且更接地氣?/p>
鄧鋒:
家恩你們也做語(yǔ)音交互,也是這方面的專(zhuān)家,業(yè)務(wù)上不知道有多少重疊,你應(yīng)該理解很深。
梁家恩:
語(yǔ)音交互也是我們認(rèn)為未來(lái)物聯(lián)網(wǎng)落地非常關(guān)鍵的環(huán)節(jié)。語(yǔ)音交互,用戶想要的并不是交互,而是內(nèi)容跟服務(wù),做C端的產(chǎn)品應(yīng)用,后邊的內(nèi)容、服務(wù)如何跟百度這樣的巨頭競(jìng)爭(zhēng)?
李志飛:
今天的內(nèi)容反而不是太大的問(wèn)題,比如大眾點(diǎn)評(píng)、高德的API數(shù)據(jù)都是開(kāi)放的,對(duì)他們來(lái)說(shuō)要的是更多用戶使用。我們?cè)?013年就跟他們產(chǎn)生了關(guān)系,開(kāi)始做端到端的服務(wù),用戶不是為了交互,而是為了用后面的內(nèi)容。今天反而出門(mén)問(wèn)問(wèn)作為第三方的公司,內(nèi)容不是問(wèn)題。為什么?百度內(nèi)容再多,也不可能把所有的內(nèi)容都做到,阿里也是,騰訊也是,至少目前來(lái)說(shuō)我們不是瓶頸,他們?cè)敢忾_(kāi)放給我們?nèi)ビ谩?/p>
鄧鋒:
未來(lái)發(fā)展,如果內(nèi)容可以跟他們對(duì)接,你就做前端的產(chǎn)品。
李志飛:
我們就是給用戶提供新的交互方式。
余凱:
志飛的嘗試,在人工智能創(chuàng)業(yè)厲害是很獨(dú)特的,從技術(shù)走到產(chǎn)品,走到ToC,我一直在想蘋(píng)果除了做無(wú)疑倫比的軟硬件產(chǎn)品,還創(chuàng)造了APP Store非常強(qiáng)大的生態(tài),生態(tài)本身也成為一個(gè)壁壘,志飛有沒(méi)有想過(guò)在哪一個(gè)層面上打造生態(tài)?做音箱、耳機(jī)、車(chē)載、手表,有可能做著做著,是不是越來(lái)越像小米了?硬件的生態(tài),還是想在硬件的平臺(tái)之上,是軟件應(yīng)用的生態(tài),怎么思考未來(lái)路徑問(wèn)題?
李志飛:
首先出門(mén)問(wèn)問(wèn)是一個(gè)小公司,談不上生態(tài),還是踏實(shí)一點(diǎn),先做了智能手表是不是賣(mài)的好,做的智能音箱是不是賣(mài)得好,這是第一層思考。如果未來(lái)出門(mén)問(wèn)問(wèn)真能夠成為不錯(cuò)的公司,或者一個(gè)大公司,一定是獨(dú)一無(wú)二的,也不是蘋(píng)果,也不是小米。
余凱:
要不要開(kāi)線下體驗(yàn)店?今年會(huì)開(kāi)嗎?
李志飛:
一定會(huì)。做這到一步,再繼續(xù)往下做,中間沒(méi)有回頭路,這是非常堅(jiān)決的。
鄧鋒:
所以聽(tīng)起來(lái),未來(lái)更像硬件公司。
李志飛:
我不承認(rèn),未來(lái)的商業(yè)不會(huì)存在像過(guò)去純硬件公司,我們還是以AI為核心的軟硬件公司。
鄧鋒:
家恩問(wèn)的問(wèn)題比較客氣,我稍微問(wèn)的更尖銳一點(diǎn),百度有內(nèi)容,有用戶,有搜索技術(shù),你剛才講的不是完全交互、全內(nèi)容的任何場(chǎng)景下的對(duì)話,百度的搜索技術(shù)也很強(qiáng),提供這個(gè)平臺(tái),跟硬件廠商合作,甚至類(lèi)似于小米或者跟其它的硬件廠商合作,像百度的阿波羅一樣,開(kāi)放平臺(tái)你去做,那個(gè)時(shí)候你們?cè)趺醋?
李志飛:
任何東西都有時(shí)間性的,比如未來(lái)一兩年,為什么谷歌在AI落地上不能像安卓那么成功,這就是原因,第一是技術(shù)不成熟,第二,硬件廠商認(rèn)識(shí)到了數(shù)據(jù)跟軟件、服務(wù)的價(jià)值,不會(huì)心甘情愿把這些東西交給你。我想知道百度今天,包括訊飛做了這么久,能夠控制小米、華為這樣的情況下的掌控力嗎?沒(méi)有,三年以后有可能有變化,但是那個(gè)時(shí)候我相信出門(mén)問(wèn)問(wèn)要么自己的硬件已經(jīng)非常成功了,要么這個(gè)公司不存在了,都有這種可能性。對(duì)我們來(lái)說(shuō),要的就是今天能夠把AI技術(shù)做好,把場(chǎng)景做好,把場(chǎng)景規(guī)模做好。