地平線鄭治泰：深度解讀軟件2.0時(shí)代AI無(wú)人化“玩法” ｜ GTIC2020

發(fā)布人：芯東西時(shí)間：2020-12-14 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

GTIC 2020全球AI芯片創(chuàng)新峰會(huì)剛剛在北京圓滿收官！在這場(chǎng)全天座無(wú)虛席、全網(wǎng)直播觀看人數(shù)逾150萬(wàn)次的高規(guī)格AI芯片產(chǎn)業(yè)峰會(huì)上，19位產(chǎn)學(xué)界重磅嘉賓從不同維度分享了對(duì)中國(guó)AI芯片自主創(chuàng)新和應(yīng)用落地的觀察與預(yù)判。

在峰會(huì)上午場(chǎng)，地平線首席戰(zhàn)略官鄭治泰，發(fā)表了題為《軟件2.0時(shí)代AI芯片的挑戰(zhàn)》的演講。

鄭治泰認(rèn)為，AI系統(tǒng)的數(shù)據(jù)系統(tǒng)和計(jì)算系統(tǒng)，是軟件2.0時(shí)代的兩大要素。在未來(lái)，機(jī)器將解決AI系統(tǒng)中的大部分問(wèn)題，而人類科學(xué)家則負(fù)責(zé)對(duì)AI系統(tǒng)的算法參數(shù)進(jìn)行調(diào)優(yōu)。據(jù)此，地平線推出MAPS（在精度有保障范圍內(nèi)的平均處理速度）評(píng)估方法，為人類科學(xué)家調(diào)優(yōu)AI系統(tǒng)提供輔助。MAPS系統(tǒng)可通過(guò)可視化、量化的方式，在合理的精度范圍內(nèi)，從“快”和“準(zhǔn)”兩個(gè)維度評(píng)估芯片對(duì)數(shù)據(jù)的平均處理速度。此外，鄭治泰透露，地平線征程5芯片正在研發(fā)中，將于明年發(fā)布。相比業(yè)界某品牌同樣計(jì)劃于明年發(fā)布的GPU新品，征程5芯片有望實(shí)現(xiàn)至少3倍的性能提升。

在過(guò)去的五年中，地平線取得了比較好的商業(yè)成就。去年到今年，地平線的AI芯片實(shí)現(xiàn)量產(chǎn)上車，并已達(dá)到10萬(wàn)的出貨量。明年，地平線將挑戰(zhàn)100萬(wàn)的AI芯片出貨量。

這些商業(yè)結(jié)果源于地平線對(duì)技術(shù)棧、技術(shù)趨勢(shì)的把握。在今天看得到的商業(yè)化落地結(jié)果背后，最根本的是面向未來(lái)的思考。

借助GTIC 2020 AI芯片創(chuàng)新峰會(huì)的平臺(tái)，鄭治泰分享了其對(duì)軟件2.0時(shí)代的思考，并回顧了人工智能發(fā)展的歷史。

鄭治泰認(rèn)為，在軟件2.0時(shí)代，數(shù)據(jù)系統(tǒng)和計(jì)算系統(tǒng)兩個(gè)部分構(gòu)成了整個(gè)AI系統(tǒng)。這其中，無(wú)論是數(shù)據(jù)系統(tǒng)還是計(jì)算系統(tǒng)，均由機(jī)器學(xué)習(xí)技術(shù)來(lái)解決最困難、最復(fù)雜的部分，人已經(jīng)不在其中發(fā)揮太多的作用。

當(dāng)人和專家不再成為數(shù)據(jù)系統(tǒng)和計(jì)算的瓶頸的時(shí)候，人類社會(huì)將會(huì)發(fā)生質(zhì)變，人類將大踏步地進(jìn)入到AI時(shí)代。到那時(shí)，由自動(dòng)駕駛引發(fā)的機(jī)器人時(shí)代也必將開(kāi)啟。

未來(lái)要實(shí)現(xiàn)AI系統(tǒng)的閉環(huán)無(wú)人化應(yīng)用

鄭治泰認(rèn)為，AI問(wèn)題，特別是面向一個(gè)復(fù)雜物理世界的問(wèn)題，需要一個(gè)新的解決范式。

傳統(tǒng)的算法采用的是拆解問(wèn)題的范式，即把問(wèn)題分解為子系統(tǒng)、子系統(tǒng)被分解為子模塊、在子模塊應(yīng)用核心的算法?，F(xiàn)在看來(lái)，這種方式幾乎失靈了。

大家可以想見(jiàn)，假設(shè)一臺(tái)車在北京出廠，它的用戶可能在新疆、海南、沙漠等地。如果這臺(tái)車產(chǎn)生的巨量corner case（極端情況），只能依靠專家、標(biāo)定人員、測(cè)試人員進(jìn)行重新優(yōu)化和迭代算法，那么我們可能永遠(yuǎn)無(wú)法實(shí)現(xiàn)人工智能驅(qū)動(dòng)的自動(dòng)駕駛。

也就是說(shuō)，在未來(lái)的時(shí)候，我們需要實(shí)現(xiàn)整個(gè)人工智能系統(tǒng)的閉環(huán)無(wú)人化應(yīng)用。

回顧機(jī)器視覺(jué)的發(fā)展，非常經(jīng)典的應(yīng)用是用機(jī)器視覺(jué)方法識(shí)別圖片中的貓狗。這一應(yīng)用中，計(jì)算機(jī)識(shí)別不同的點(diǎn)陣數(shù)據(jù)，并進(jìn)行數(shù)據(jù)計(jì)算。最終，計(jì)算機(jī)給出一個(gè)范式，確定圖片中是貓還是狗。這個(gè)問(wèn)題剛被提出時(shí)，大家認(rèn)為它的難度僅相當(dāng)于一個(gè)本科生暑假作業(yè)的難度。

但是人類社會(huì)對(duì)AI走進(jìn)物理世界的追求并未停止。在整個(gè)科技向前發(fā)展的過(guò)程中，盡管面臨失敗，科學(xué)家仍一次又一次地嘗試，去掌控發(fā)展的節(jié)奏和參與其中。

最初，機(jī)器視覺(jué)鼻祖馬爾提出“分解”的機(jī)器視覺(jué)方法。1986年到1990年間，人們用分解的方案解決機(jī)器視覺(jué)問(wèn)題，即對(duì)整個(gè)圖進(jìn)行描邊，形成有景深信息的二維圖片，再通過(guò)完整的幾何計(jì)算，抽象出三維物體。后來(lái)，人們發(fā)現(xiàn)這一解決方案存在局限性，這是因?yàn)楫?dāng)面對(duì)不同角度下同一物體的圖片，或者同一角度不同光影下的物體圖片時(shí)，計(jì)算機(jī)無(wú)法用上述的拆解數(shù)學(xué)模型去定義物體。

在1990年代，人工智能進(jìn)入到下一個(gè)階段?？茖W(xué)家往后退了一步，將所有的物體類別定義出來(lái)，全部由數(shù)據(jù)系統(tǒng)使用機(jī)器識(shí)別方法去實(shí)現(xiàn)，通過(guò)不斷調(diào)優(yōu)、不停移動(dòng)分類面，提升識(shí)別的精度和準(zhǔn)確率。

后來(lái)，人們又發(fā)現(xiàn)這一方法仍無(wú)法解決所有問(wèn)題。在整個(gè)物理世界中，一臺(tái)車面對(duì)著十分復(fù)雜的外部環(huán)境，人類想用幾個(gè)簡(jiǎn)單的數(shù)學(xué)公式集合完成整個(gè)定義是不可能的。

2012年至今，機(jī)器視覺(jué)發(fā)生了一個(gè)深刻的變革?？茖W(xué)家和碼農(nóng)開(kāi)始把整個(gè)計(jì)算過(guò)程全部交由機(jī)器去做，讓計(jì)算機(jī)做識(shí)別，而科學(xué)家則承擔(dān)模型結(jié)構(gòu)和算法超參數(shù)調(diào)優(yōu)的工作。這一過(guò)程中，基于隨機(jī)的算法和參數(shù)，科學(xué)家評(píng)估輸入輸出的結(jié)果，不斷對(duì)不正確的gap進(jìn)行反向調(diào)優(yōu)。

2017年，專家又后退一步，將模型結(jié)構(gòu)設(shè)計(jì)也交由機(jī)器學(xué)習(xí)來(lái)設(shè)計(jì)，依賴TPU提供的充沛算力。到2019年，機(jī)器設(shè)計(jì)的模型性能遠(yuǎn)超過(guò)人類專家設(shè)計(jì)出來(lái)的模型。

在軟件2.0時(shí)代，不增加數(shù)據(jù)的量，而增加計(jì)算量的時(shí)候，人們發(fā)現(xiàn)模型識(shí)別的錯(cuò)誤率下降一半。如果數(shù)據(jù)量和計(jì)算量都提升的話，模型識(shí)別錯(cuò)誤率下降三分之二。增加計(jì)算量、增加數(shù)據(jù)量，都可以自動(dòng)化進(jìn)行。這意味著機(jī)器自動(dòng)化、持續(xù)降低識(shí)別錯(cuò)誤率是可能的。

為什么在海量數(shù)據(jù)和大模型的時(shí)代，機(jī)器會(huì)比人更加厲害？鄭治泰稱，這是因?yàn)槿祟悓＜以诔橄蟆⒕植坑邢薜男?shù)據(jù)、小模型應(yīng)用中占據(jù)優(yōu)勢(shì)。但在大數(shù)據(jù)、大模型的應(yīng)用中，計(jì)算機(jī)的準(zhǔn)確識(shí)別和網(wǎng)絡(luò)設(shè)計(jì)能力，能夠超常發(fā)揮。

現(xiàn)在，利用機(jī)器學(xué)習(xí)重新開(kāi)發(fā)和設(shè)計(jì)網(wǎng)絡(luò)模型、重新計(jì)算識(shí)別的精度協(xié)議的趨勢(shì)，并沒(méi)有顯示出終止的跡象，這就催生出一個(gè)非常重要的可能性，即我們可以面向物理世界，提供AI服務(wù)，即全自動(dòng)無(wú)人駕駛汽車等“像人一樣的智能”。

借助MAPS評(píng)估方法為產(chǎn)業(yè)鏈賦能

針對(duì)AI系統(tǒng)的數(shù)據(jù)和計(jì)算，這兩大軟件2.0時(shí)代的核心要素，人類工程師在打造數(shù)據(jù)系統(tǒng)的閉環(huán)、提升數(shù)據(jù)閉環(huán)效率的同時(shí)，還要結(jié)合軟件和硬件底層的邏輯設(shè)計(jì)，逐步提高計(jì)算的效率和性能。

基于此，地平線提出MAPS（在精度有保障范圍內(nèi)的平均處理速度）的概念和評(píng)估方法。借助這套方法，客戶可以直接面向物理世界，評(píng)估AI系統(tǒng)的效能。這一方法并不是單純計(jì)算峰值算力或軟件的算法效率，而是計(jì)算這兩者在物理世界可接受的精度范圍內(nèi)的處理速度。地平線計(jì)算的是什么？是AI系統(tǒng)能跑得多快、跑得多準(zhǔn)。

為實(shí)現(xiàn)數(shù)據(jù)閉環(huán)，幾乎所有的AI公司都在圍繞數(shù)據(jù)的搜集、采集、標(biāo)注、模型訓(xùn)練進(jìn)行部署。相較而言，地平線是利用自身的核心技術(shù)能力，給整個(gè)行業(yè)賦能。如果客戶需要打造一套完整的數(shù)據(jù)閉環(huán)，地平線可以為其提供技術(shù)支持和服務(wù)。

鄭治泰透露，目前，地平線正與國(guó)內(nèi)頭部的汽車企業(yè)攜手，打造不少于3～5個(gè)聯(lián)合實(shí)驗(yàn)室。

通過(guò)這種聯(lián)合實(shí)驗(yàn)室，地平線計(jì)劃為車企提供毫無(wú)保留的技術(shù)支持。地平線秉持開(kāi)放賦能的宗旨，可以提供芯片，也可以提供芯片+工具鏈，還可以提供芯片+工具鏈+算法。此外，就算客戶想要完全脫離地平線的技術(shù)產(chǎn)品來(lái)打造AI能力，地平線也會(huì)100%為客戶賦能。針對(duì)物理世界中的海量數(shù)據(jù)問(wèn)題，地平線以幫助合作伙伴具備真正的AI生產(chǎn)力為目標(biāo)。

2015年，地平線成立，初創(chuàng)團(tuán)隊(duì)具備算法背景。當(dāng)時(shí)，團(tuán)隊(duì)發(fā)現(xiàn)在處理邊緣計(jì)算時(shí)，需要在物理世界中定義一個(gè)問(wèn)題，提出算法模型。根據(jù)算法模型重新定義適合這個(gè)算法模型的芯片架構(gòu)，芯片流片后，再回到物理世界中，求得一個(gè)最優(yōu)解。

鄭治泰認(rèn)為，在計(jì)算閉環(huán)中，人類科學(xué)家需要做到三件事：

第一，人類科學(xué)家要持續(xù)提升這顆芯片的有效計(jì)算效率和計(jì)算能力；

第二，人類科學(xué)家要持續(xù)提升算法的效率；

第三，人類科學(xué)家需根據(jù)要解決的實(shí)際問(wèn)題，進(jìn)行聯(lián)合調(diào)優(yōu)，得到最優(yōu)解。

地平線團(tuán)隊(duì)認(rèn)為，用傳統(tǒng)模型來(lái)進(jìn)行計(jì)算能力評(píng)估的方式是有局限性的。

首先，一些模型早已過(guò)時(shí)，而要解決未來(lái)自動(dòng)駕駛場(chǎng)景中的實(shí)際問(wèn)題，需要更先進(jìn)的模型。芯片在設(shè)計(jì)的時(shí)候，就需要考慮到對(duì)未來(lái)模型、算法的引進(jìn)。其次，同一個(gè)芯片搭載不同的模型，其利用率也會(huì)表現(xiàn)出差異。

基于這兩點(diǎn)，地平線從算法開(kāi)始進(jìn)行產(chǎn)品開(kāi)發(fā)，然后再設(shè)計(jì)芯片，進(jìn)而回到場(chǎng)景中去解決實(shí)際問(wèn)題。

地平線征程5芯片明年發(fā)布，性能有望超競(jìng)品3倍

據(jù)鄭治泰分享，地平線團(tuán)隊(duì)MAPS評(píng)測(cè)結(jié)果顯示，市場(chǎng)上的高能效芯片，通常達(dá)到約30%的利用率。

人工智能面臨識(shí)別、檢測(cè)兩個(gè)問(wèn)題。在識(shí)別方面，相比市面上現(xiàn)有最好、最普遍的端側(cè)GPU產(chǎn)品，地平線的征程3芯片用8%的功耗實(shí)現(xiàn)了50%的MAPS，具備4～6倍的能耗優(yōu)勢(shì)；征程5芯片用50%的功耗實(shí)現(xiàn)了5倍的MAPS，實(shí)現(xiàn)了將近10倍的能耗優(yōu)勢(shì)。

檢測(cè)方面，地平線征程5芯片用50%的功耗實(shí)現(xiàn)了13倍的MAPS，達(dá)到26倍的提升。據(jù)稱，明年上述GPU品牌推出的新品，相比其上代產(chǎn)品實(shí)現(xiàn)了7倍的性能提升?；诖?，地平線將于明年推出的征程5芯片，相比該品牌明年發(fā)布的GPU新品，將有至少3倍的提升。

近期，地平線科學(xué)家定義的有效評(píng)估人工智能計(jì)算效能的方法，正為整個(gè)產(chǎn)業(yè)鏈賦能。鄭治泰提到，地平線希望，產(chǎn)業(yè)鏈伙伴都能使用這一方法，讓整個(gè)產(chǎn)業(yè)進(jìn)入非常良性的循環(huán)。

展望未來(lái)，人類科學(xué)家要做的事情并不多，其中包括搭建和調(diào)優(yōu)整個(gè)系統(tǒng)、看著機(jī)器用海量數(shù)據(jù)輸出結(jié)果等。這就是軟件2.0所暗示的未來(lái)，自動(dòng)駕駛、無(wú)人駕駛等人工智能應(yīng)用，將普惠到每個(gè)人的生活。

以上是鄭治泰演講內(nèi)容的完整整理。除鄭治泰外，在本屆GTIC 2020 AI芯片創(chuàng)新峰會(huì)期間，清華大學(xué)微納電子系尹首一教授，比特大陸、燧原科技、黑芝麻智能、壁仞科技、光子算數(shù)、知存科技、億智電子、豪微科技等芯片創(chuàng)企，全球FPGA領(lǐng)先玩家賽靈思，知名IP供應(yīng)商安謀中國(guó)、Imagination，全球EDA巨頭Cadence，以及北極光創(chuàng)投、中芯聚源等知名投資機(jī)構(gòu)，分別分享了對(duì)AI芯片產(chǎn)業(yè)的觀察與思考。如感興趣更多嘉賓演講的核心干貨，歡迎關(guān)注芯東西后續(xù)推送內(nèi)容。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。