馬斯克口中的“地球最聰明AI”來了!
關(guān)鍵詞: xAI Grok 3 馬斯克 推理能力 競品
北京時間2月18日,埃隆?馬斯克旗下xAI公司正式發(fā)布最新一代大模型Grok 3?!癎rok 3具有極強推理能力,在我們迄今為止所做的測試中,其表現(xiàn)優(yōu)于我們所知的任何已發(fā)布產(chǎn)品?!瘪R斯克稱之為“地球最聰明的AI”,并表示“我們有信心Grok 3會比其他任何AI都強,將成為AI領(lǐng)域真正的顛覆者”。
根據(jù)官方公布的測試數(shù)據(jù),Grok3和Grok3 mini在數(shù)學、科學、代碼等性能上都超過或媲美Gemini、DeepSeek和ChatGPT等對手。具備推理能力的Grok3 Reasoning Beta和Grok3 mini Reasoning則是超越了類似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。
在現(xiàn)場演示過程中,xAI展示了Grok 3的推理+編程能力,其中一個問題是“生成3D動畫代碼,演示從地球發(fā)射、著陸火星,然后在下一個發(fā)射窗口返回地球的過程”。經(jīng)過近兩分鐘的思考,Grok 3生成了可以直接跑起來的python代碼,3D動畫可以運行,但是否正確還有待驗證。
據(jù)悉,Grok 3是Grok的第三代版本,被視作OpenAI最新的旗艦模型o3的競品。馬斯克強調(diào),Grok3可以減少AI幻覺,方法是通過來回檢查數(shù)據(jù)并嘗試實現(xiàn)邏輯一致性。他還透露,訓練Grok3所使用的算力遠多于此前的版本,并使用了大量合成數(shù)據(jù)。
不同于DeepSeek的算法優(yōu)化路徑(DeepSeek-V3用2048個H800 GPU,訓練2788千小時),xAI透露,Grok3的開發(fā)得益于用8個月時間建成的Colossus超級計算機,它由10萬個英偉達的H100 GPU驅(qū)動,為訓練提供了2億個GPU小時,比Grok2多了十多倍。
xAI團隊介紹,Grok3的性能比Grok2提升了一個數(shù)量級,并引入了“思維鏈”(Chain Of Thought)推理能力,讓其能夠像人類認知過程一樣逐步處理復雜任務。不過,一切還處在早期階段,Grok 3仍在訓練中。今天發(fā)布會現(xiàn)場展示的只是Grok 3推理模型的一部分。
馬斯克透露,Grok計劃以聊天機器人的形態(tài)在X平臺、獨立網(wǎng)站以及iOS應用上與用戶見面。雖然網(wǎng)頁和iOS版本已準備就緒,但語音模式還需等待大約1周的時間才能正式上線。而且,為了滿足開發(fā)者的需求,Grok后續(xù)還會開放API,方便開發(fā)者將其集成到更多的應用場景中,進一步釋放Grok的潛力。
此外,記者了解到,近日xAI公司正尋求一輪約100億美元的融資,此輪融資將使公司估值達到約750億美元。包括紅杉資本、Andreessen Horowitz以及Valor Equity Partners在內(nèi)的現(xiàn)有投資者正在洽談參與此次交易。
值得一提的是,就在xAI發(fā)布Grok3前的幾個小時,其競爭對手公司OpenAI首席執(zhí)行官兼聯(lián)合創(chuàng)始人SamAltman于凌晨在社交平臺表示:“對于高要求的測試者來說,試用GPT-4.5的體驗,遠比我預期的要深刻得多!”業(yè)內(nèi)人士預計,這說明GPT-4.5已經(jīng)進入測試階段,離正式發(fā)布的時間非常近了。
