AI能為企業(yè)實(shí)現(xiàn)降本增收,但GPU價(jià)格勸退不少用戶,CPU能接手嗎?
近半年來(lái),ChatGPT 所帶來(lái)的 AI 熱度是大家能直觀感受到的。
其實(shí),在不那么直觀的地方,數(shù)據(jù)也在悄然發(fā)生變化:斯坦福大學(xué)發(fā)布的「2023 年 AI 指數(shù)報(bào)告」顯示,2022 年采用 AI 的公司比例自 2017 年以來(lái)翻了一番以上。這些公司報(bào)告稱,采用 AI 之后,它們實(shí)現(xiàn)了顯著的成本降低和收入增加。
雖然 2023 年的數(shù)據(jù)還沒(méi)出來(lái),但僅憑被 ChatGPT 帶火的 AIGC 領(lǐng)域就不難推測(cè),上述數(shù)字將在今年迎來(lái)新的拐點(diǎn)。AIGC 大有掀起第四次產(chǎn)業(yè)革命之勢(shì)。
但與此同時(shí),這些企業(yè)在構(gòu)建 AI 基礎(chǔ)設(shè)施方面也迎來(lái)了新的挑戰(zhàn)。
首先,就算力而言,AI 領(lǐng)域 算力需求激增和供給不足形成的矛盾在今年變得尤其激烈 ,就連 OpenAI CEO Sam Altman 都坦言自家公司正被算力短缺問(wèn)題困擾,其 API 的可靠性和速度問(wèn)題屢遭投訴。此外,大批公司還面臨這波需求高漲帶來(lái)的算力成本上升問(wèn)題。
其次,在模型的選擇上,不少企業(yè)發(fā)現(xiàn),當(dāng)前討論熱度最高的 大模型其實(shí)還沒(méi)有一個(gè)成熟的商業(yè)模式 ,其安全性等方面還存在問(wèn)題。以三星設(shè)備解決方案部門為例,他們?cè)趩⒂?ChatGPT 不到一個(gè)月的時(shí)間內(nèi),就發(fā)生了三起數(shù)據(jù)泄露事件,這讓原本打算直接調(diào)用 OpenAI API 的企業(yè)打了退堂鼓。此外,自己訓(xùn)練、部署超大模型同樣很勸退:想象一下,僅僅簡(jiǎn)單地向一個(gè)大模型發(fā)送一次請(qǐng)求,可能就需要昂貴的 GPU 卡進(jìn)行獨(dú)占性的運(yùn)算,這是很多企業(yè)都難以承受的。
不過(guò),話說(shuō)回來(lái),像 ChatGPT 那樣「無(wú)所不知」的超大模型真的是企業(yè)所必需的嗎?
性能與成本的艱難抉擇
如果要分析最早應(yīng)用人工智能提升效益的行業(yè),互聯(lián)網(wǎng)是繞不開(kāi)的一個(gè),其典型工作負(fù)載 —— 推薦系統(tǒng)、視覺(jué)處理、自然語(yǔ)言處理等 —— 的優(yōu)化都離不開(kāi) AI。不過(guò),隨著業(yè)務(wù)量的激增,他們也在性能和成本等層面面臨著不同的挑戰(zhàn)。
首先看 推薦系統(tǒng) 。
推薦系統(tǒng)在電子商務(wù)、社交媒體、音視頻流媒體等許多領(lǐng)域都有廣泛的應(yīng)用。以電子商務(wù)為例,在每年的 618、雙十一等購(gòu)物高峰,阿里巴巴等頭部電商企業(yè)都會(huì)面臨全球龐大客戶群發(fā)出的數(shù)億實(shí)時(shí)請(qǐng)求,因此他們希望滿足 AI 推理在吞吐量與時(shí)延方面的要求,同時(shí)又能確保 AI 推理精確性,保證推薦質(zhì)量。
接下來(lái)看 視覺(jué)處理。
僅美團(tuán)一家,我們就能找到智能圖片處理、商戶入駐證照識(shí)別、掃碼開(kāi)單車、掃藥盒買藥等多個(gè)應(yīng)用場(chǎng)景。AI 已經(jīng)成為其業(yè)務(wù)版圖中很重要的一部分。不過(guò),隨著美團(tuán)業(yè)務(wù)與用戶量的高速增長(zhǎng),越來(lái)越多的應(yīng)用需要通過(guò)視覺(jué) AI 構(gòu)建智能化流程,美團(tuán)需要在保證視覺(jué) AI 推理精度的同時(shí),提升視覺(jué) AI 推理的吞吐率,以支撐更多的智能化業(yè)務(wù)。
最后看 自然語(yǔ)言處理 。
得益于 ChatGPT 帶來(lái)的熱度,自然語(yǔ)言處理正獲得前所未有的市場(chǎng)關(guān)注與技術(shù)追蹤。作為國(guó)內(nèi) NLP 技術(shù)研究的先行者,百度已在該領(lǐng)域構(gòu)建起完整的產(chǎn)品體系與技術(shù)組合。ERNIE 3.0 作為其飛槳文心?NLP 大模型的重要組成部分,也在各種 NLP 應(yīng)用場(chǎng)景,尤其是中文自然語(yǔ)言理解和生成任務(wù)中展現(xiàn)出卓越的性能。不過(guò),隨著 NLP 在更多行業(yè)中實(shí)現(xiàn)商業(yè)化落地,用戶對(duì) ERNIE 3.0 也提出了更多細(xì)分需求,例如更高的處理效率和更廣泛的部署場(chǎng)景等。
所有這些問(wèn)題的解決都離不開(kāi)大規(guī)模的基礎(chǔ)設(shè)施投入,但困擾這些企業(yè)的共同問(wèn)題是: 獨(dú)立 GPU 雖然可以滿足性能所需,但是成本壓力較大,因此一味擴(kuò)充 GPU 規(guī)模并不是一個(gè)最佳選項(xiàng) 。
CPU也能搞出大模型
AMD在CES上宣布了一系列以AI為核心功能的新芯片。這些產(chǎn)品將人工智能功能與去年早些時(shí)候收購(gòu)Xilinx時(shí)獲得的技術(shù)相結(jié)合。
公司XDNA架構(gòu)中的產(chǎn)品具有適應(yīng)性,并允許公司將人工智能“從PC擴(kuò)展到智能終端、邊緣設(shè)備和云”。她補(bǔ)充說(shuō),加速器可以適應(yīng)應(yīng)用和功率效率。
同時(shí)還宣布該公司正在測(cè)試其第一款推理加速器,名為Alveo V70。它基于AMD的XDNA技術(shù),可以插入服務(wù)器。
Alveo V70旨在加速視頻分析和客戶推薦引擎等應(yīng)用程序。該卡以較小的外形尺寸提供了性能效率。該加速器每秒提供400萬(wàn)億次人工智能計(jì)算性能,支持PCIe 5.0,并消耗75瓦功率。
蘇博士聲稱其Alveo V70在圖像分類和物體檢測(cè)等應(yīng)用中提供了比英偉達(dá)T4 GPU加速器更好的性能。芯片制造商共享模擬到最佳條件的性能數(shù)據(jù),以使其芯片優(yōu)于競(jìng)爭(zhēng)對(duì)手產(chǎn)品。真實(shí)世界的性能數(shù)字通常與供應(yīng)商提供的數(shù)字非常不同。
AMD正在進(jìn)行Alveo V70預(yù)購(gòu),芯片將在今年春季上市。
Alveo V70 AI芯片的核心技術(shù)也在AMD最新的筆記本電腦芯片Ryzen 7040中,該芯片在CES上發(fā)布?!斑@是業(yè)界第一個(gè)集成了專用片上AI引擎的移動(dòng)x86處理器,我們稱之為Ryzen AI?!?/span>
Ryzen 7040芯片同時(shí)運(yùn)行四個(gè)AI流,每秒提供多達(dá)12萬(wàn)億次操作。該芯片有八個(gè)基于Zen 4架構(gòu)的CPU內(nèi)核,運(yùn)行速度高達(dá)5.2GHz。該芯片采用臺(tái)積電的4nm制造工藝制造。這些芯片將用于三月份上市的筆記本電腦。
微軟首席產(chǎn)品官Panos Panay表示,用戶將能夠在Ryzen CPU內(nèi)部的AI引擎上運(yùn)行大規(guī)模模型,而只需要一小部分功率,在這之前需要GPU功率。例如,在Windows 11上提供的Windows Studio Effects中,Ryzen AI將對(duì)視頻進(jìn)行增強(qiáng),以減少背景模糊、改善肖像、抑制背景噪音和自動(dòng)設(shè)置視頻幀?!斑@些體驗(yàn)每秒需要數(shù)萬(wàn)億次的運(yùn)算……它們現(xiàn)在可以在AMD的AI引擎上運(yùn)行,而不會(huì)對(duì)CPU或GPU造成負(fù)擔(dān),同時(shí)只消耗100毫瓦?!?/span>
AI大模型會(huì)怎樣改變B端企業(yè)生態(tài)
從高速生成圖像和視頻到全方位增強(qiáng)客戶的體驗(yàn),生成式AI已經(jīng)被證明是跨越各個(gè)行業(yè)的工具。
以下是我們探討出可能會(huì)使企業(yè)利用AI實(shí)現(xiàn)巨大增長(zhǎng)的一些方式。
內(nèi)容的極大豐富:目前的主流AI模型及其應(yīng)用,能夠讓企業(yè)快速和高效的創(chuàng)建內(nèi)容,無(wú)論是文章,圖片還是視頻,從效率和質(zhì)量上都可以獲得相當(dāng)好的性價(jià)比,這有利于率先采用AI的企業(yè)在擁擠的市場(chǎng)中脫穎而出。例如善用Stable diffusion生成高質(zhì)量的圖像和圖形,能極大的提升企業(yè)自身出圖的生產(chǎn)效率和質(zhì)量。自動(dòng)化創(chuàng)意過(guò)程也能極大的節(jié)省時(shí)間和資源。只需要合理的提示詞+預(yù)先微調(diào)好適合自己企業(yè)的模型,企業(yè)就可以生成大量的圖像和文本,無(wú)論這些是用于內(nèi)部還是用于對(duì)客戶。
加速自動(dòng)化: 相當(dāng)多的軟件工程AI可以有效的提升企業(yè)的工程能力,提高公司開(kāi)發(fā)人員的效率。copilot這樣的ai提供了可靠的自動(dòng)化支持,降低了企業(yè)內(nèi)部的運(yùn)營(yíng)成本。很多補(bǔ)充功能也有利于讓沒(méi)那么經(jīng)驗(yàn)豐富的工程師獲得極大的能力提升。
個(gè)性化營(yíng)銷:我們總說(shuō)要進(jìn)行個(gè)性化營(yíng)銷,但最多也就做到按照有限的客戶Tag分類來(lái)進(jìn)行分類營(yíng)銷,并不是完全的個(gè)性化。而AI讓真正的千人千面形成了可能,提供超級(jí)個(gè)性化的營(yíng)銷活動(dòng)。甚至通過(guò)分析客戶的數(shù)據(jù),可以根據(jù)用戶獨(dú)特的喜好來(lái)創(chuàng)建動(dòng)態(tài)內(nèi)容,從而優(yōu)化參與度和轉(zhuǎn)化率,能提高營(yíng)銷投資的回報(bào)率。
聊天機(jī)器人和虛擬助理:AI支持的聊天機(jī)器人和虛擬助理可以對(duì)客戶的查詢提供即時(shí),準(zhǔn)確的響應(yīng)。傳統(tǒng)的客服機(jī)器人只能應(yīng)對(duì)有限和預(yù)設(shè)的問(wèn)題,而且從效果來(lái)看越來(lái)越低效。而全新的AI智能系統(tǒng)可以“理解”客戶的需求并提供個(gè)性化的支持,增強(qiáng)客戶的服務(wù),減少等待時(shí)間,這樣可以極大的提升客戶的滿意度和忠誠(chéng)度。而還有一點(diǎn)很重要,即完全沒(méi)有技術(shù)背景的員工和團(tuán)隊(duì)也可以用ai來(lái)構(gòu)建屬于自己的機(jī)器人來(lái)為自己的團(tuán)隊(duì)和客戶提供服務(wù),而這些成本會(huì)非常低。
更強(qiáng)大的翻譯能力:全球經(jīng)濟(jì)越來(lái)越緊密的如今,語(yǔ)言障礙將會(huì)隨著AI的發(fā)展迅速弱化。企業(yè)可以越來(lái)越容易的面對(duì)全球客戶,無(wú)論所處的行業(yè)是電商,游戲,還是開(kāi)發(fā)。曾經(jīng)的翻譯模式無(wú)法很好的融合進(jìn)業(yè)務(wù)本身,但生成式AI的速度和能力都遠(yuǎn)遠(yuǎn)超過(guò)了傳統(tǒng)的翻譯模式,你的交流甚至不需要預(yù)先去選擇對(duì)方的語(yǔ)言是什么??缇碂o(wú)縫溝通會(huì)讓更多的企業(yè)更容易的全球化。
信息和網(wǎng)絡(luò)安全:生成式AI會(huì)讓信息安全更加快速的響應(yīng),通過(guò)分析大數(shù)據(jù)的模式,企業(yè)或組織可以迅速檢測(cè)和防止欺詐、保護(hù)敏感信息和數(shù)據(jù)資產(chǎn)。當(dāng)然這里會(huì)有很大的挑戰(zhàn),但我們有理由相信這已經(jīng)是一種不可阻擋的趨勢(shì)。
準(zhǔn)確的預(yù)測(cè)和分析:相比于傳統(tǒng)的數(shù)據(jù)分析系統(tǒng)和數(shù)據(jù)分析模式,生成式AI所帶來(lái)的預(yù)測(cè)分析方面表現(xiàn)更為出色。企業(yè)可以利用AI做出準(zhǔn)確的市場(chǎng)預(yù)測(cè)和及時(shí)的決策,從而優(yōu)化供應(yīng)鏈管理、庫(kù)存和需求規(guī)劃。例如曾經(jīng)需要月甚至季度才能處理的市場(chǎng)情形,在AI加持下可以提升到天,甚至小時(shí)級(jí)的突發(fā)情況,這極大的提升了很多傳統(tǒng)企業(yè)的運(yùn)營(yíng)效率。
學(xué)術(shù)研究:有相當(dāng)多的企業(yè)(醫(yī)療,科技,工程等)擁有自己的學(xué)術(shù)研究部門或與大學(xué)合作展開(kāi)的科研項(xiàng)目,諸多學(xué)術(shù)方面的AI模型會(huì)極大的提升科研效率,從而讓企業(yè)更快的進(jìn)行研發(fā)迭代和市場(chǎng)投放。
以上的每一種方法都是AI可能會(huì)給B端帶來(lái)的助力,一定會(huì)有一些企業(yè)率先摸索到了AI的正確打開(kāi)方式從而獲得本行業(yè)的巨大發(fā)展優(yōu)勢(shì)。無(wú)論是內(nèi)部流程的簡(jiǎn)化,還是對(duì)客戶體驗(yàn)的增強(qiáng),數(shù)據(jù)驅(qū)動(dòng)的決策和創(chuàng)新等等,都會(huì)提升效率,盈利能力和競(jìng)爭(zhēng)力。而重要的是,對(duì)企業(yè)有利的事情同時(shí)也對(duì)企業(yè)服務(wù)的客戶更有利,無(wú)論是更低的成本還是更好的體驗(yàn),都會(huì)再當(dāng)今快速發(fā)展的數(shù)字環(huán)境中獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。
