地平線鄭治泰:深度解讀軟件2.0時(shí)代AI無(wú)人化“玩法” | GTIC2020
在峰會(huì)上午場(chǎng),地平線首席戰(zhàn)略官鄭治泰,發(fā)表了題為《軟件2.0時(shí)代AI芯片的挑戰(zhàn)》的演講。
鄭治泰認(rèn)為,AI系統(tǒng)的數(shù)據(jù)系統(tǒng)和計(jì)算系統(tǒng),是軟件2.0時(shí)代的兩大要素。在未來(lái),機(jī)器將解決AI系統(tǒng)中的大部分問(wèn)題,而人類科學(xué)家則負(fù)責(zé)對(duì)AI系統(tǒng)的算法參數(shù)進(jìn)行調(diào)優(yōu)。據(jù)此,地平線推出MAPS(在精度有保障范圍內(nèi)的平均處理速度)評(píng)估方法,為人類科學(xué)家調(diào)優(yōu)AI系統(tǒng)提供輔助。MAPS系統(tǒng)可通過(guò)可視化、量化的方式,在合理的精度范圍內(nèi),從“快”和“準(zhǔn)”兩個(gè)維度評(píng)估芯片對(duì)數(shù)據(jù)的平均處理速度。此外,鄭治泰透露,地平線征程5芯片正在研發(fā)中,將于明年發(fā)布。相比業(yè)界某品牌同樣計(jì)劃于明年發(fā)布的GPU新品,征程5芯片有望實(shí)現(xiàn)至少3倍的性能提升。 在過(guò)去的五年中,地平線取得了比較好的商業(yè)成就。去年到今年,地平線的AI芯片實(shí)現(xiàn)量產(chǎn)上車,并已達(dá)到10萬(wàn)的出貨量。明年,地平線將挑戰(zhàn)100萬(wàn)的AI芯片出貨量。
這些商業(yè)結(jié)果源于地平線對(duì)技術(shù)棧、技術(shù)趨勢(shì)的把握。在今天看得到的商業(yè)化落地結(jié)果背后,最根本的是面向未來(lái)的思考。 借助GTIC 2020 AI芯片創(chuàng)新峰會(huì)的平臺(tái),鄭治泰分享了其對(duì)軟件2.0時(shí)代的思考,并回顧了人工智能發(fā)展的歷史。 鄭治泰認(rèn)為,在軟件2.0時(shí)代,數(shù)據(jù)系統(tǒng)和計(jì)算系統(tǒng)兩個(gè)部分構(gòu)成了整個(gè)AI系統(tǒng)。這其中,無(wú)論是數(shù)據(jù)系統(tǒng)還是計(jì)算系統(tǒng),均由機(jī)器學(xué)習(xí)技術(shù)來(lái)解決最困難、最復(fù)雜的部分,人已經(jīng)不在其中發(fā)揮太多的作用。 當(dāng)人和專家不再成為數(shù)據(jù)系統(tǒng)和計(jì)算的瓶頸的時(shí)候,人類社會(huì)將會(huì)發(fā)生質(zhì)變,人類將大踏步地進(jìn)入到AI時(shí)代。到那時(shí),由自動(dòng)駕駛引發(fā)的機(jī)器人時(shí)代也必將開(kāi)啟。
未來(lái)要實(shí)現(xiàn)AI系統(tǒng)的閉環(huán)無(wú)人化應(yīng)用
鄭治泰認(rèn)為,AI問(wèn)題,特別是面向一個(gè)復(fù)雜物理世界的問(wèn)題,需要一個(gè)新的解決范式。 傳統(tǒng)的算法采用的是拆解問(wèn)題的范式,即把問(wèn)題分解為子系統(tǒng)、子系統(tǒng)被分解為子模塊、在子模塊應(yīng)用核心的算法?,F(xiàn)在看來(lái),這種方式幾乎失靈了。 大家可以想見(jiàn),假設(shè)一臺(tái)車在北京出廠,它的用戶可能在新疆、海南、沙漠等地。如果這臺(tái)車產(chǎn)生的巨量corner case(極端情況),只能依靠專家、標(biāo)定人員、測(cè)試人員進(jìn)行重新優(yōu)化和迭代算法,那么我們可能永遠(yuǎn)無(wú)法實(shí)現(xiàn)人工智能驅(qū)動(dòng)的自動(dòng)駕駛。 也就是說(shuō),在未來(lái)的時(shí)候,我們需要實(shí)現(xiàn)整個(gè)人工智能系統(tǒng)的閉環(huán)無(wú)人化應(yīng)用。 回顧機(jī)器視覺(jué)的發(fā)展,非常經(jīng)典的應(yīng)用是用機(jī)器視覺(jué)方法識(shí)別圖片中的貓狗。這一應(yīng)用中,計(jì)算機(jī)識(shí)別不同的點(diǎn)陣數(shù)據(jù),并進(jìn)行數(shù)據(jù)計(jì)算。最終,計(jì)算機(jī)給出一個(gè)范式,確定圖片中是貓還是狗。這個(gè)問(wèn)題剛被提出時(shí),大家認(rèn)為它的難度僅相當(dāng)于一個(gè)本科生暑假作業(yè)的難度。 但是人類社會(huì)對(duì)AI走進(jìn)物理世界的追求并未停止。在整個(gè)科技向前發(fā)展的過(guò)程中,盡管面臨失敗,科學(xué)家仍一次又一次地嘗試,去掌控發(fā)展的節(jié)奏和參與其中。
最初,機(jī)器視覺(jué)鼻祖馬爾提出“分解”的機(jī)器視覺(jué)方法。1986年到1990年間,人們用分解的方案解決機(jī)器視覺(jué)問(wèn)題,即對(duì)整個(gè)圖進(jìn)行描邊,形成有景深信息的二維圖片,再通過(guò)完整的幾何計(jì)算,抽象出三維物體。后來(lái),人們發(fā)現(xiàn)這一解決方案存在局限性,這是因?yàn)楫?dāng)面對(duì)不同角度下同一物體的圖片,或者同一角度不同光影下的物體圖片時(shí),計(jì)算機(jī)無(wú)法用上述的拆解數(shù)學(xué)模型去定義物體。 在1990年代,人工智能進(jìn)入到下一個(gè)階段??茖W(xué)家往后退了一步,將所有的物體類別定義出來(lái),全部由數(shù)據(jù)系統(tǒng)使用機(jī)器識(shí)別方法去實(shí)現(xiàn),通過(guò)不斷調(diào)優(yōu)、不停移動(dòng)分類面,提升識(shí)別的精度和準(zhǔn)確率。 后來(lái),人們又發(fā)現(xiàn)這一方法仍無(wú)法解決所有問(wèn)題。在整個(gè)物理世界中,一臺(tái)車面對(duì)著十分復(fù)雜的外部環(huán)境,人類想用幾個(gè)簡(jiǎn)單的數(shù)學(xué)公式集合完成整個(gè)定義是不可能的。 2012年至今,機(jī)器視覺(jué)發(fā)生了一個(gè)深刻的變革??茖W(xué)家和碼農(nóng)開(kāi)始把整個(gè)計(jì)算過(guò)程全部交由機(jī)器去做,讓計(jì)算機(jī)做識(shí)別,而科學(xué)家則承擔(dān)模型結(jié)構(gòu)和算法超參數(shù)調(diào)優(yōu)的工作。這一過(guò)程中,基于隨機(jī)的算法和參數(shù),科學(xué)家評(píng)估輸入輸出的結(jié)果,不斷對(duì)不正確的gap進(jìn)行反向調(diào)優(yōu)。 2017年,專家又后退一步,將模型結(jié)構(gòu)設(shè)計(jì)也交由機(jī)器學(xué)習(xí)來(lái)設(shè)計(jì),依賴TPU提供的充沛算力。到2019年,機(jī)器設(shè)計(jì)的模型性能遠(yuǎn)超過(guò)人類專家設(shè)計(jì)出來(lái)的模型。 在軟件2.0時(shí)代,不增加數(shù)據(jù)的量,而增加計(jì)算量的時(shí)候,人們發(fā)現(xiàn)模型識(shí)別的錯(cuò)誤率下降一半。如果數(shù)據(jù)量和計(jì)算量都提升的話,模型識(shí)別錯(cuò)誤率下降三分之二。增加計(jì)算量、增加數(shù)據(jù)量,都可以自動(dòng)化進(jìn)行。這意味著機(jī)器自動(dòng)化、持續(xù)降低識(shí)別錯(cuò)誤率是可能的。 為什么在海量數(shù)據(jù)和大模型的時(shí)代,機(jī)器會(huì)比人更加厲害?鄭治泰稱,這是因?yàn)槿祟悓<以诔橄蟆⒕植坑邢薜男?shù)據(jù)、小模型應(yīng)用中占據(jù)優(yōu)勢(shì)。但在大數(shù)據(jù)、大模型的應(yīng)用中,計(jì)算機(jī)的準(zhǔn)確識(shí)別和網(wǎng)絡(luò)設(shè)計(jì)能力,能夠超常發(fā)揮。 現(xiàn)在,利用機(jī)器學(xué)習(xí)重新開(kāi)發(fā)和設(shè)計(jì)網(wǎng)絡(luò)模型、重新計(jì)算識(shí)別的精度協(xié)議的趨勢(shì),并沒(méi)有顯示出終止的跡象,這就催生出一個(gè)非常重要的可能性,即我們可以面向物理世界,提供AI服務(wù),即全自動(dòng)無(wú)人駕駛汽車等“像人一樣的智能”。
針對(duì)AI系統(tǒng)的數(shù)據(jù)和計(jì)算,這兩大軟件2.0時(shí)代的核心要素,人類工程師在打造數(shù)據(jù)系統(tǒng)的閉環(huán)、提升數(shù)據(jù)閉環(huán)效率的同時(shí),還要結(jié)合軟件和硬件底層的邏輯設(shè)計(jì),逐步提高計(jì)算的效率和性能。 基于此,地平線提出MAPS(在精度有保障范圍內(nèi)的平均處理速度)的概念和評(píng)估方法。借助這套方法,客戶可以直接面向物理世界,評(píng)估AI系統(tǒng)的效能。這一方法并不是單純計(jì)算峰值算力或軟件的算法效率,而是計(jì)算這兩者在物理世界可接受的精度范圍內(nèi)的處理速度。地平線計(jì)算的是什么?是AI系統(tǒng)能跑得多快、跑得多準(zhǔn)。 為實(shí)現(xiàn)數(shù)據(jù)閉環(huán),幾乎所有的AI公司都在圍繞數(shù)據(jù)的搜集、采集、標(biāo)注、模型訓(xùn)練進(jìn)行部署。相較而言,地平線是利用自身的核心技術(shù)能力,給整個(gè)行業(yè)賦能。如果客戶需要打造一套完整的數(shù)據(jù)閉環(huán),地平線可以為其提供技術(shù)支持和服務(wù)。 鄭治泰透露,目前,地平線正與國(guó)內(nèi)頭部的汽車企業(yè)攜手,打造不少于3~5個(gè)聯(lián)合實(shí)驗(yàn)室。 通過(guò)這種聯(lián)合實(shí)驗(yàn)室,地平線計(jì)劃為車企提供毫無(wú)保留的技術(shù)支持。地平線秉持開(kāi)放賦能的宗旨,可以提供芯片,也可以提供芯片+工具鏈,還可以提供芯片+工具鏈+算法。此外,就算客戶想要完全脫離地平線的技術(shù)產(chǎn)品來(lái)打造AI能力,地平線也會(huì)100%為客戶賦能。針對(duì)物理世界中的海量數(shù)據(jù)問(wèn)題,地平線以幫助合作伙伴具備真正的AI生產(chǎn)力為目標(biāo)。
2015年,地平線成立,初創(chuàng)團(tuán)隊(duì)具備算法背景。當(dāng)時(shí),團(tuán)隊(duì)發(fā)現(xiàn)在處理邊緣計(jì)算時(shí),需要在物理世界中定義一個(gè)問(wèn)題,提出算法模型。根據(jù)算法模型重新定義適合這個(gè)算法模型的芯片架構(gòu),芯片流片后,再回到物理世界中,求得一個(gè)最優(yōu)解。 鄭治泰認(rèn)為,在計(jì)算閉環(huán)中,人類科學(xué)家需要做到三件事: 第一,人類科學(xué)家要持續(xù)提升這顆芯片的有效計(jì)算效率和計(jì)算能力; 第二,人類科學(xué)家要持續(xù)提升算法的效率; 第三,人類科學(xué)家需根據(jù)要解決的實(shí)際問(wèn)題,進(jìn)行聯(lián)合調(diào)優(yōu),得到最優(yōu)解。 地平線團(tuán)隊(duì)認(rèn)為,用傳統(tǒng)模型來(lái)進(jìn)行計(jì)算能力評(píng)估的方式是有局限性的。 首先,一些模型早已過(guò)時(shí),而要解決未來(lái)自動(dòng)駕駛場(chǎng)景中的實(shí)際問(wèn)題,需要更先進(jìn)的模型。芯片在設(shè)計(jì)的時(shí)候,就需要考慮到對(duì)未來(lái)模型、算法的引進(jìn)。其次,同一個(gè)芯片搭載不同的模型,其利用率也會(huì)表現(xiàn)出差異。 基于這兩點(diǎn),地平線從算法開(kāi)始進(jìn)行產(chǎn)品開(kāi)發(fā),然后再設(shè)計(jì)芯片,進(jìn)而回到場(chǎng)景中去解決實(shí)際問(wèn)題。
地平線征程5芯片明年發(fā)布,性能有望超競(jìng)品3倍
據(jù)鄭治泰分享,地平線團(tuán)隊(duì)MAPS評(píng)測(cè)結(jié)果顯示,市場(chǎng)上的高能效芯片,通常達(dá)到約30%的利用率。 人工智能面臨識(shí)別、檢測(cè)兩個(gè)問(wèn)題。在識(shí)別方面,相比市面上現(xiàn)有最好、最普遍的端側(cè)GPU產(chǎn)品,地平線的征程3芯片用8%的功耗實(shí)現(xiàn)了50%的MAPS,具備4~6倍的能耗優(yōu)勢(shì);征程5芯片用50%的功耗實(shí)現(xiàn)了5倍的MAPS,實(shí)現(xiàn)了將近10倍的能耗優(yōu)勢(shì)。 檢測(cè)方面,地平線征程5芯片用50%的功耗實(shí)現(xiàn)了13倍的MAPS,達(dá)到26倍的提升。據(jù)稱,明年上述GPU品牌推出的新品,相比其上代產(chǎn)品實(shí)現(xiàn)了7倍的性能提升?;诖?,地平線將于明年推出的征程5芯片,相比該品牌明年發(fā)布的GPU新品,將有至少3倍的提升。 近期,地平線科學(xué)家定義的有效評(píng)估人工智能計(jì)算效能的方法,正為整個(gè)產(chǎn)業(yè)鏈賦能。鄭治泰提到,地平線希望,產(chǎn)業(yè)鏈伙伴都能使用這一方法,讓整個(gè)產(chǎn)業(yè)進(jìn)入非常良性的循環(huán)。 展望未來(lái),人類科學(xué)家要做的事情并不多,其中包括搭建和調(diào)優(yōu)整個(gè)系統(tǒng)、看著機(jī)器用海量數(shù)據(jù)輸出結(jié)果等。這就是軟件2.0所暗示的未來(lái),自動(dòng)駕駛、無(wú)人駕駛等人工智能應(yīng)用,將普惠到每個(gè)人的生活。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。