科技大廠競逐AIGC,中國的ChatGPT在哪?
最近,AI(人工智能)圈一股以“ChatGPT”為核心的熱潮從美國“硅谷”涌入中國。
2022年11月底,初創(chuàng)公司OpenAI發(fā)布了名為ChatGPT的對話式聊天機器人模型,一經(jīng)推出,便在網(wǎng)絡上迅速走紅。
進入2023年,微軟推新,谷歌入局,“ChatGPT”熱潮迅速升溫,國內(nèi)的科技巨頭也陸續(xù)涌入潮中。ChatGPT發(fā)布后,包括百度、科大訊飛、京東等在內(nèi)的多家企業(yè)紛紛公布自己在AI領(lǐng)域的布局。
圖源:OpenAI官網(wǎng)
中國AI水平與ChatGPT有多大的差距?中國如何訓練出這樣的GPT大模型?難點又在哪里?
ChatGPT是AIGC的一種實現(xiàn)。在AIGC的大模型建設和應用層面,國內(nèi)企業(yè)在技術(shù)基礎(chǔ)和創(chuàng)新環(huán)境上都存在著相對優(yōu)勢。
首先,國內(nèi)持續(xù)投入大模型研發(fā)、技術(shù)基礎(chǔ)扎實。目前,阿里達摩院的多模態(tài)大模型M6參數(shù)量已達10萬億,是全球最大的AI預訓練模型;華為盤古、百度文心等大模型的參數(shù)量都超過了千億,其中百度文心模型參數(shù)量已經(jīng)達到2600億,不遜于GPT-3。
圖片來源:鈦媒體結(jié)合東吳證券數(shù)據(jù)整理而成
其次,國內(nèi)加快“產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型”、實現(xiàn)人工智能與實體經(jīng)濟融合等政策為人工智能提供了創(chuàng)新發(fā)展環(huán)境。近年來,我國發(fā)布了一系列政策文件,為人工智能核心技術(shù)攻關(guān)、產(chǎn)品落地應用以及探索發(fā)展新模式新路徑提供支持。
把握優(yōu)勢的同時,也要看到目前面臨的一些挑戰(zhàn)。如AI領(lǐng)軍人才相對短缺,AI與實體經(jīng)濟的融合程度仍需進一步加深等等。對此,董曉飛建議,要特別關(guān)注一些底層技術(shù)的發(fā)展,如大模型框架、算法等,還要進一步拓展AI的應用場景。
這場由硅谷率先發(fā)起的新一輪“軍備競賽”正式進入風口,但是,對于國內(nèi)科技公司而言,加入戰(zhàn)場之前,真正需要思考的是應用場景的變革。
01 科技大廠競逐AIGC
2022年11月30日,OpenAI首席執(zhí)行官山姆·阿爾特曼當天發(fā)布了一則推特,“今天我們推出了ChatGPT,嘗試在這里與它交談”,還包括一個鏈接,任何人都可以點擊鏈接,免費與ChatGPT交談。
與Siri、小愛同學等語音助手類似,ChatGPT也是人機交互應用的一種。但在與ChatGPT“對話”的過程中,人們發(fā)現(xiàn)它的“智慧程度”遠超其他的人工智能機器人。除了聊天,ChatGPT被網(wǎng)友們用來寫文案、翻譯文本、為代碼糾錯,甚至用來編寫代碼。
憑借出色的表現(xiàn),ChatGPT僅用兩個月便吸引了超過1億用戶的關(guān)注,一躍成為20年來互聯(lián)網(wǎng)領(lǐng)域增長最快的消費類應用。
北京時間2月7日凌晨,美國科技巨頭谷歌緊急入局,宣布基于LaMDA大模型的人工智能對話式機器人“Bard”正在進行內(nèi)測。次日,微軟宣布推出由ChatGPT支持的最新版本Bing搜索引擎和Edge瀏覽器。臉書也表示,將向OpenAI支付數(shù)百萬美元,采用ChatGPT為Facebook和Instagram生成創(chuàng)作者內(nèi)容。亞馬遜成立了一個小型工作組,拓展ChatGPT等AI工具對企業(yè)的工作職能……
ChatGPT火爆,搜索引擎巨頭百度率先坐不住了。
就在谷歌官宣Bard內(nèi)測的當天下午,百度官宣了大模型新項目“文心一言”(ERNIE Bot),并表示預計在3月完成內(nèi)測。隨后一段時間,阿里巴巴、360、科大訊飛、騰訊等多家國內(nèi)企業(yè)紛紛表示對AI技術(shù)發(fā)展的關(guān)注。2月10日,京東云宣布旗下言犀人工智能應用平臺將推出產(chǎn)業(yè)版ChatGPT--ChatJD。
可見,大廠的態(tài)度十分鮮明:ChatGPT已經(jīng)是既定的未來,這場新的科技競技賽哨聲響起,誰都不甘落于下風。從科技巨頭,到行業(yè)龍頭,中國企業(yè)競逐AI賽道,AIGC(利用人工智能技術(shù)來生成內(nèi)容)等人工智能概念在股市一路狂飆,雖然在監(jiān)管出手后很快平息躁動,但漲勢依然存在。
ChatGPT在全球的流行正在推動AIGC產(chǎn)業(yè)化全面提速,將引領(lǐng)創(chuàng)成式AI新變革。
02 大廠如何應對ChatGPT的挑戰(zhàn)?
GPT是OpenAI推出的AI大模型系列。從2018年到2022年,OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3和InstructGPT,此次發(fā)布的ChatGPT就是在GPT-3的基礎(chǔ)上通過指令微調(diào)后得到的。
圖源:OpenAI官網(wǎng)
結(jié)果,2022年年底ChatGPT實現(xiàn)了現(xiàn)象級的傳播,這出乎制作團隊所料。OpenAI用了5年時間在GPT大模型迭代上完成了一場自我革命,在對話的場景中實現(xiàn)爆發(fā)。
所以說ChatGPT的成功并非偶然,“OpenAI在GPT系列模型的基礎(chǔ)上,對算法、算力、數(shù)據(jù)等人工智能關(guān)鍵要素都進行了一定的升級和優(yōu)化。”中國信通院云計算與大數(shù)據(jù)研究所人工智能部副主任董曉飛說。
算法、算力及數(shù)據(jù)是人工智能行業(yè)發(fā)展的三大核心要素。
在算法層面,ChatGPT的基礎(chǔ)是世界上最強大的LLM(大語言模型)之一——GPT-3,同時引入了基于人類反饋的強化學習方法,提高了對話的質(zhì)量?!皬?span style="font-size: 16px; font-family: Calibri;">GhatGPT的表現(xiàn)上來看,它的精確性和整個性能效果確實提高了。”董曉飛說。
同時,AI的訓練和使用也需要強大的算力支持。ChatGPT的訓練是在微軟云上進行的,在全球云計算市場,微軟云的市場份額排名第二。高水平、高市場份額,再加上芯片技術(shù)的高速發(fā)展,這都為ChatGPT的橫空出世奠定了堅實的算力基礎(chǔ)。
除了算法和算力,AI大模型的進步迭代,需要大量的數(shù)據(jù)進行訓練。2020年發(fā)布的GPT-3,其訓練參數(shù)量已經(jīng)達到了驚人的1750億個,“大量的數(shù)據(jù)被反復‘喂’給ChatGPT?!?
而且,ChatGPT的訓練成本支出巨大。據(jù)Lambda Labs首席科學官Chuan li介紹,擁有1750億個參數(shù)的GPT-3單次訓練成本達到460萬美元。在知乎上,網(wǎng)友在討論ChatGPT時,也都認為它很“燒錢”。因此,可以說ChatGPT是一個靠大算力、高成本,用大規(guī)模的數(shù)據(jù)“喂”出來的AI模型。
03 看清方向,謹慎入局
ChatGPT總共可以分為三個訓練階段:人工“投喂”數(shù)據(jù)進行標注;類似于獎勵模型,對輸出的內(nèi)容進行排序和比較;強化學習,利用上一階段的內(nèi)容升級。每一階段都是“燒錢”換來的,資本的門檻無形隔斷了絕大部分企業(yè)。
董曉飛指出,基于大模型的聊天機器人成本投入巨大,“企業(yè)前期投入需保持一定的謹慎,且需要看清方向?!?
“目前來看,國內(nèi)大模型開發(fā)廠商一是布局以大模型為基礎(chǔ)的通用對話、生成等能力;二是將其能力整合到搜索引擎、智能客服、智能音箱等產(chǎn)品線中;三是通過能力調(diào)用為中小企業(yè)滿足具體場景落地需求?!倍瓡燥w說。
隨著ChatGPT的爆火,隨之而來的安全、隱私保護、知識產(chǎn)權(quán)等問題也值得關(guān)注。“目前國外出現(xiàn)有學生使用ChatGPT寫論文作弊的情況。模型使用大量的數(shù)據(jù)進行訓練,也存在使用過程中可能提供他人創(chuàng)作的侵權(quán)行為風險?!倍瓡燥w認為,如何防止ChatGPT類產(chǎn)品的濫用對社會產(chǎn)生潛在負面影響亟須得到重視,“更希望我們目前的一些主流企業(yè)、科研機構(gòu),在生成式AI上發(fā)力,能引領(lǐng)新時代的AI發(fā)展?!?/span>
我愛方案網(wǎng)是一個電子方案開發(fā)供應鏈平臺,提供從找方案到研發(fā)采購的全鏈條服務。找方案,上我愛方案網(wǎng)!在方案超市找到合適的方案就可以直接買,沒有找到就到快包定制開發(fā)。我愛方案網(wǎng)積累了一大批方案商和企業(yè)開發(fā)資源,能提供標準的模塊和核心板以及定制開發(fā)服務,按要求交付PCBA、整機產(chǎn)品、軟件或IoT系統(tǒng)。
技術(shù)服務靳工:15529315703
