AI 芯片“涼了又熱”,RISC-V 芯片能否成為 AIoT 市場(chǎng)主角
AI 的熱潮已經(jīng)過(guò)去?許多關(guān)注 AI 的人或許會(huì)給出的判斷。這種判斷也有一些依據(jù),AI 發(fā)展三大要素之一的 AI 芯片,在 2016 年左右出現(xiàn)大量的初創(chuàng)公司,之后火熱了兩年左右時(shí)間后,又逐漸涼了下來(lái)。
但 2020 年下半年開始,AI 芯片初創(chuàng)公司的融資消息又多了起來(lái),在本月的 WAIC 2021 期間,多家云端 AI 芯片和邊緣 AI 芯片初創(chuàng)公司都發(fā)布了新產(chǎn)品,AI 芯片似乎又熱了起來(lái)。
AI 芯片為什么“涼”了幾年又“熱”了起來(lái)?AI 普及的關(guān)鍵到底是什么?RISC-V 芯片會(huì)成為 AIoT 市場(chǎng)的主角嗎?
體驗(yàn)不好的 AI 產(chǎn)品傷害了消費(fèi)者
2017 年左右掀起的新一輪 AI 熱潮,有兩個(gè)關(guān)鍵性事件。一個(gè)是 2012 年 AlexNet 在 ImageNet 大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽中用卷積神經(jīng)網(wǎng)絡(luò)(CNN)贏得了圖像識(shí)別競(jìng)賽,再次掀起了學(xué)界研究 AI 的熱潮。到了 2017 年,AlphaGo 戰(zhàn)勝人類頂級(jí)棋手柯潔,并橫掃整個(gè)圍棋界。AI 的熱潮從學(xué)界蔓延至產(chǎn)業(yè)界,并引發(fā)全民關(guān)注。
“我覺(jué)得 AI 能再一次熱起來(lái)是因?yàn)樯窠?jīng)網(wǎng)絡(luò)在技術(shù)有了突破后,能夠解決一些問(wèn)題,而這恰好能滿足消費(fèi)者對(duì)智能美好生活的向往。”嘉楠科技創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官?gòu)堥s表示。
很快地,AI 音箱、AI 機(jī)器人、AI 家電、AI 故事機(jī)等眾多 AI 產(chǎn)品迅速推向市場(chǎng),其中出貨量最大的 AI 音箱迅速普及,但很快被消費(fèi)者拋棄。
“通過(guò)縮減材料降低成本,推出體驗(yàn)不好的產(chǎn)品對(duì)市場(chǎng)傷害非常大,因?yàn)闆](méi)有好的體驗(yàn),整個(gè)市場(chǎng)的規(guī)模很難變大。降低成本應(yīng)該靠更好的技術(shù)?!睆堥s說(shuō),“AI 產(chǎn)品還是沒(méi)有達(dá)到消費(fèi)者的預(yù)期,消費(fèi)者需要的是一個(gè)完整的產(chǎn)品,這是我認(rèn)為 AI 又涼下來(lái)的原因?!?/p>
英特爾研究院副總裁、英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)表示:“現(xiàn)在很多 AI 系統(tǒng),只有一個(gè)原型,但到商業(yè)化的時(shí)候,原型是不行的。AI 創(chuàng)新要真正的規(guī)?;l(fā)展起來(lái),一定要很認(rèn)真嚴(yán)肅地做垂直整合?!?/p>
也就是說(shuō),AI 產(chǎn)品的實(shí)際體驗(yàn)與消費(fèi)者期待的產(chǎn)品之間仍有鴻溝。從 AI 智能硬件公司的角度,在 AI 芯片和 AI 算法的支持下,他們推出了比以往更加智能的產(chǎn)品,產(chǎn)品性能有了顯著的提升。但從消費(fèi)者的角度,AI 產(chǎn)品依舊不夠智能,甚至有些傻,很難持續(xù)使用或購(gòu)買新的 AI 產(chǎn)品。
“還有一個(gè)問(wèn)題是價(jià)格,對(duì)于智能硬件和白色家電,消費(fèi)者的要求是性能是世界級(jí),但價(jià)格預(yù)期是‘地獄級(jí)’,這是矛盾所在。”張楠賡說(shuō)?!安贿^(guò),只要有明確的需求和目標(biāo),實(shí)現(xiàn)世界級(jí)的性能,同時(shí)兼顧可接受的價(jià)格并非不能達(dá)成的目標(biāo),嘉楠希望在未來(lái) 1-3 年內(nèi)達(dá)成這個(gè)目標(biāo)?!?/p>
還要看到,邊緣推理是 AI 應(yīng)用大規(guī)模落地的關(guān)鍵。這是因?yàn)?,云邊協(xié)同已經(jīng)成為主流的計(jì)算范式。在云邊協(xié)同的架構(gòu)中,邊緣 AI 在數(shù)據(jù)脫敏、數(shù)據(jù)感知和實(shí)時(shí)決策上有效彌補(bǔ)了時(shí)延和數(shù)據(jù)隱私上的短板,也能降低高昂的 IT 基礎(chǔ)設(shè)施成本。
此時(shí),更高性能的 AI 芯片非常關(guān)鍵。
需求釋放,邊緣 AI 芯片市場(chǎng)規(guī)模絕對(duì)值快速增加
嘉楠在 AI 邊緣芯片市場(chǎng)占有先發(fā)優(yōu)勢(shì),2018 年推出了首款 AI 推理芯片勘智 K210,這款 AI SoC 投片的時(shí)候還沒(méi)有 MobileNetV2 和 YOLOv3 算法,所以只有 1TOPS 的 AI 算力?!坝捎诳敝?K210 研發(fā)時(shí)間較早,在算力規(guī)劃上沒(méi)有考慮到后來(lái)才出現(xiàn)的算法模型,導(dǎo)致這款芯片在應(yīng)用場(chǎng)景的拓展上受到限制?!睆堥s如此評(píng)價(jià)這款芯片。
在整個(gè)業(yè)界探索 AI 芯片和 AI 應(yīng)用的背景下,嘉楠的首款 AI 芯片獲得了多個(gè)頭部教育機(jī)器人客戶的訂單。在 2020 年全球疫情和缺芯的環(huán)境下也實(shí)現(xiàn)了可觀的營(yíng)收。
“今年很多應(yīng)用市場(chǎng)需求快速增加,僅上半年我們就實(shí)現(xiàn)了 1300 多萬(wàn)的 AI 芯片營(yíng)收,如果下半年產(chǎn)能問(wèn)題不能解決,我預(yù)計(jì)營(yíng)收和上半年相當(dāng)?!睆堥s說(shuō),“我看到的是今年市場(chǎng)需求特別旺盛,增長(zhǎng)比較快。”
當(dāng)然,AI 邊緣芯片市場(chǎng)仍舊處于絕對(duì)值增長(zhǎng)很快,但總體規(guī)模依舊不大的狀態(tài)。在快速增長(zhǎng)的市場(chǎng)里,除了 AI 教育以及增加 AI 功能網(wǎng)絡(luò)攝像機(jī)(IPC),用邊緣 AI 芯片做人群聚集檢測(cè)、超聲波定位、機(jī)器狗、跟拍云臺(tái)等創(chuàng)新的產(chǎn)品越來(lái)越多。
“勘智主打的還是 AI 性能,基于勘智 K210 的能力,有些創(chuàng)新應(yīng)用是我們沒(méi)有想到的。更加智能的產(chǎn)品也需要更高性能的 AI 芯片,其實(shí)像家庭場(chǎng)景里的掃地機(jī)器人,面對(duì)的環(huán)境也非常復(fù)雜,需要比較高的算力,還要控制成本。”張楠賡表示。
為此,嘉楠推出了勘智 K510 邊緣推理芯片,CPU 依舊采用 RISC-V(雙核 64 位),全新的 KPU 將 AI 性能提升至 3TOPS,支持 TensorFlow、PyTorch 和 ONNX 模型導(dǎo)入,配合 KPU 為 AI 加速還增加了 DSP。
另外,勘智 K510 支持三路傳感器輸入 1080P 視頻,擁有眾多高速和低速接口,其中高速接口 DDR PHY 和 MIPI RX/TX DPHY 均是嘉楠完全自主知識(shí)產(chǎn)權(quán)的 IP。
從推出的時(shí)間看,勘智 K510 比嘉楠的產(chǎn)品路線圖晚了半年多時(shí)間。據(jù)我們了解,其中的原因包括這是嘉楠第一個(gè)比較大規(guī)模的 AI 芯片,幾乎重新設(shè)計(jì)了 AI 加速單元 KPU,高速接口也是完全自研,再加上產(chǎn)能緊缺等多重因素,導(dǎo)致勘智 K510 推出的時(shí)間比預(yù)期晚一些。
“產(chǎn)品更早推出肯定會(huì)更好一些,但稍微晚一點(diǎn)也有好處。我們推出第一款 AI 芯片的時(shí)候,絕大部分中小客戶只能用原廠的芯片做一些嵌入式的開發(fā)。今年有能力開發(fā) AI 芯片的客戶多了很多,許多客戶還有自己的 AI 算法。市場(chǎng)在成熟,應(yīng)用場(chǎng)景也在不斷增加,這對(duì)我們產(chǎn)品的推廣是好事?!睆堥s如此解釋。
與傳統(tǒng)的功能芯片不同,AI 芯片的開發(fā)者并不知道自己明確的需求,這對(duì)要預(yù)測(cè)未來(lái)三到五年市場(chǎng)需求的 AI 芯片公司來(lái)說(shuō),定義產(chǎn)品難度更大。但比較明確的是,隨著 AI 應(yīng)用復(fù)雜程度的增加,對(duì) AI 的算力需求也隨之增加,提升 AI 性能成為關(guān)鍵。
“勘智 K510 的 KPU 相比上一代基本是重新設(shè)計(jì)。原來(lái)的 KPU 比較簡(jiǎn)單,如果用第一代架構(gòu)進(jìn)行等比放大提升性能會(huì)有很多問(wèn)題。新設(shè)計(jì)的第二代架構(gòu)更加通用,可伸縮性更好,很容易實(shí)現(xiàn)零點(diǎn)幾 TOPS 到幾 TOPS 的算力,同時(shí)兼容性也更好?!睆堥s表示。
提升 AI 性能的同時(shí),勘智 K510 的視覺(jué)性能也有了顯著提高,集成了最新一代圖像處理單元和 3D ISP 模塊,支持深度攝像頭 TOF 傳感器,可以在無(wú)需軟件參與的情況下自動(dòng)解析和提取深度圖像,加速 3D 圖像處理。
張楠賡指出,勘智 K510 是一款中高端算力芯片,視覺(jué)硬件配置也是這款芯片的重頭戲,同時(shí)支持最多 3 個(gè)攝像頭的輸入,其中一路支持 3D 功能,也是迎合市場(chǎng)需求,能夠滿足比如活體檢測(cè)等需求。勘智 K510 也能夠應(yīng)用于高清航拍器、視頻會(huì)議、機(jī)器人、STEAM 教育、工業(yè)相機(jī)和輔助駕駛等場(chǎng)景。
我們注意到,勘智 K510 在降低功耗方面從多角度入手,比如通過(guò) NoC 總線架構(gòu)解決龐大時(shí)鐘樹帶來(lái)的芯片大功耗和大面積問(wèn)題;KPU 根據(jù)不同層級(jí)的帶寬、計(jì)算和存儲(chǔ)需求的調(diào)整,提高數(shù)據(jù)的復(fù)用率降低芯片功耗;還通過(guò)支持語(yǔ)音 VAD 功能,滿足低功耗設(shè)計(jì)需求等。
不過(guò),能夠?qū)⒓伍?AI 芯片推向更廣闊市場(chǎng)的關(guān)鍵是 RISC-V。
沖向萬(wàn)億美元的 AIoT 市場(chǎng)
“易用性非常重要,開發(fā)者如果使用 CPU 或者 DSP 就能實(shí)現(xiàn)功能,能夠降低開發(fā)成本和加速產(chǎn)品上市時(shí)間?!睆堥s說(shuō),“這也是我們?cè)陔p核 64 位 RISC-V CPU 基礎(chǔ)上增加 DSP 的重要原因。”
更強(qiáng)的 CPU 性能對(duì)于一款 SoC 的重要性也越來(lái)越高?!坝幸粋€(gè)很有意思的現(xiàn)象,5 年前,業(yè)界很多人認(rèn)為 SoC 中的 CPU 的作用會(huì)被弱化,大部分的任務(wù)都會(huì)用硬件加速器處理,包括 AI 應(yīng)用。但這兩年,無(wú)論是手機(jī)還是 PC,CPU 的競(jìng)爭(zhēng)越來(lái)越激烈,絕大部分的任務(wù)還是在 CPU 上完成,CPU 又變得很重要,所以對(duì) CPU 的性能需求也大幅度增加?!睆堥s表示。
“我認(rèn)為,未來(lái)幾年桌面級(jí)和移動(dòng)端先進(jìn)的技術(shù)和架構(gòu)會(huì)迅速下放到原來(lái)的 MCU 中,這個(gè)變化可能要到將來(lái) 3-5 年才能看到?!彼鞒鲱A(yù)測(cè)。
CPU 在 SoC 中的重要性又變得重要,意味著 CPU 的性能和易用性成為競(jìng)爭(zhēng)的關(guān)鍵。在 AIoT 市場(chǎng),雖然統(tǒng)治移動(dòng)市場(chǎng)的 Arm 占據(jù)優(yōu)勢(shì)地位,但最近兩年 RISC-V 指令集芯片在這一市場(chǎng)進(jìn)展迅猛,在對(duì)軟件支持要求不高的應(yīng)用中,RISC-V 已經(jīng)被大量應(yīng)用,但需要更高性能和更多軟件支持的應(yīng)用就面臨挑戰(zhàn)。
實(shí)際上,勘智 K510 的 CPU 是嘉楠自研?!暗谝淮a(chǎn)品我們用的是 RISC-V 開源內(nèi)核,明顯的優(yōu)勢(shì)是不需要買版權(quán)節(jié)省成本,但漏洞也比較多。新一代的勘智 AI 芯片之所以選擇自研,主要還是因?yàn)槲覀兊男枨蟪^(guò)了開源內(nèi)核的需求。”張楠賡解釋為何開始自研 RISC-V CPU。
硬件的自研對(duì)于有實(shí)力的芯片公司而言相對(duì)容易,但軟件生態(tài)的建設(shè)就需要整個(gè)行業(yè)的共同努力?!盁o(wú)論是阿里在 RISC-V 方面的工作,或者如果英特爾收購(gòu) SiFive,這對(duì)整個(gè) RISC-V 生態(tài)的建設(shè)都有非常積極的作用?!睆堥s說(shuō):“我們是 RISC-V 堅(jiān)定的擁護(hù)者,所以我們無(wú)論是硬件還是軟件,都受益于 RISC-V 社區(qū),當(dāng)然我們也將自己的設(shè)計(jì)和文檔都上傳到 RISC-V 社區(qū),希望能夠以身作則推動(dòng) RISC-V 生態(tài)的發(fā)展。”
“更多系統(tǒng)的支持對(duì)于我們產(chǎn)品的規(guī)模推廣有非常明顯的效果。剛推出勘智 K210 的時(shí)候,沒(méi)有系統(tǒng)的支持,開發(fā)者想要開發(fā)難度很大。后來(lái)有了 RTOS 和 Linux 的支持,這對(duì)我們勘智 K510 的應(yīng)用非常有用。”張楠賡表示。
“目前看來(lái),RISC-V 芯片用到游戲領(lǐng)域可能會(huì)差一些,但除此之外的應(yīng)用,使用 RISC-V 芯片都問(wèn)題不大?!睆堥s認(rèn)為“但我也不認(rèn)為 RISC-V 會(huì)完全淘汰 Arm,Arm 在很多領(lǐng)域依舊會(huì)占有一席之地。”
不可否認(rèn)的是,RISC-V 的生態(tài)建設(shè)依舊是在追趕 Arm 的生態(tài),遠(yuǎn)談不上趕超。就嘉楠而言,他們?cè)O(shè)計(jì)出更高性能的 AI 芯片之后,但很多功能的實(shí)現(xiàn)因?yàn)檐浖藛T的缺乏,進(jìn)度受阻。
張楠賡說(shuō)他早已意識(shí)到缺乏軟件人員的問(wèn)題,但他并不打算采用大量招聘軟件人才的方式解決這一問(wèn)題,而是保持嘉楠硬件的基因,通過(guò)與更專業(yè)的合作伙伴共同解決軟件方面的挑戰(zhàn)。
張楠賡透露,嘉楠最早會(huì)在今年下半年公布在軟件方面的合作進(jìn)展。
還有一個(gè)更深層次的問(wèn)題,嘉楠為什么要選擇不成熟的 RISC-V CPU 推出 AI 芯片?張楠賡的回答是:“在行業(yè)的選擇上,我們選擇了 AI 這個(gè)有巨大需求量的市場(chǎng),在技術(shù)上,選擇 RISC-V 有成本優(yōu)勢(shì),在未來(lái)的 AI 市場(chǎng)會(huì)大有所為,開源開放也是我們一直擁護(hù)的?!?/p>
麥肯錫預(yù)測(cè),全球 AIoT 市場(chǎng)規(guī)模 2025 年或?qū)⑦_(dá)到 11.2 萬(wàn)億美元。張楠賡對(duì)嘉楠未來(lái) 3-5 年實(shí)現(xiàn)億元級(jí)別的 AI 營(yíng)收繼續(xù)保持樂(lè)觀,并且預(yù)測(cè),當(dāng)嘉楠的 AI 業(yè)務(wù)營(yíng)收達(dá)到 500 萬(wàn)到 1.5 億美元的某個(gè)時(shí)點(diǎn),會(huì)迎來(lái)爆發(fā)點(diǎn)。
小結(jié)
AI 和 AI 芯片為什么會(huì)在幾年的火熱之后就涼了?可以說(shuō)是落地進(jìn)展緩慢,更進(jìn)一步來(lái)說(shuō)缺少完整的 AI 產(chǎn)品,給消費(fèi)者提供良好的體驗(yàn)。作為提升產(chǎn)品體驗(yàn)的關(guān)鍵,芯片算力的提升至關(guān)重要。嘉楠作為率先推出 AI 芯片,也是最早選擇 RISC-V 的公司,其產(chǎn)品和技術(shù)的演進(jìn)給我們了解 AIoT 市場(chǎng)的發(fā)展提供了非常多可參考的信息。
從使用公版 CPU 到選擇自研,從 KPU 架構(gòu)的升級(jí),到自研高速接口,可以看到這個(gè)市場(chǎng)在高速增長(zhǎng),也能看到嘉楠對(duì)于 AI 市場(chǎng),以及做一件更大事情的信心。
張楠賡說(shuō):“一個(gè)公司的成功,最核心的是戰(zhàn)略的正確,對(duì)于嘉楠來(lái)說(shuō)堅(jiān)持自主研發(fā)就是戰(zhàn)略,解決別人沒(méi)有解決的事情。”
芯片出貨量已過(guò)億級(jí),已經(jīng)有 300 人芯片團(tuán)隊(duì)的嘉楠,保持每?jī)赡甑豢?AI 芯片,按照算力高低分為 2 系、5 系、8 系滿足終端和邊緣市場(chǎng)需求,針對(duì)場(chǎng)景優(yōu)化的勘智芯片,會(huì)帶給我們什么驚喜?
