DeepSeek贏麻了,首個推理模型就超越OpenAI o1
Napoleon Chan / 2024-11-21 17:5492464今年早些時候,國內(nèi)科技公司DeepSeek(深度求索)因V2模型一舉成名,成名的原因簡單粗暴,主打高性價比。在當時,DeepSeek V2的API定價約等于谷歌的七分之一,GPT-4 Turbo的七十分之一。
時隔幾個月,這家被業(yè)界冠以“AI界拼多多”之稱的公司,迅速推出首個推理模型「DeepSeek-R1預(yù)覽版」。該模型一經(jīng)推出,便在AIME以及全球頂級編程競賽(codeforces)等權(quán)威評測中,大幅超越了GPT4o,甚至o1-preview,一夜之間轟動全球。

時間倒退回今年5月前后,在大模型領(lǐng)域,國內(nèi)各大廠牌內(nèi)卷最兇猛,創(chuàng)立于2023年4月的DeepSeek一戰(zhàn)成名,毫無疑問是當時的“黑馬”。但是,人們提起DeepSeek總是帶著“高性價比”的標簽,不自覺讓大家忽視他們強大的技術(shù)力。
如今,推理模型DeepSeek-R1預(yù)覽版在AIME和MATH這兩個關(guān)鍵基準測試上超越了OpenAI o1,大家終于不只以“性價比”來衡量DeepSeek。

這里簡單解釋一下,AIME在美國數(shù)學競賽(AMC)中難度等級最高,所以常被用來測試不同模型解決推理問題的性能。DeepSeek-R1預(yù)覽版在解決這些復(fù)雜數(shù)學問題時擁有極強的“拆解能力”,能夠?qū)?fù)雜任務(wù)分解為更小的步驟并逐一執(zhí)行,從而提高其準確性。
同時,DeepSeek-R1預(yù)覽版的思維過程是完全透明的,允許用戶驗證不同階段得出的答案。

值得注意的是,DeepSeek-R1預(yù)覽版與OpenAI o1模型類似,會根據(jù)問題的復(fù)雜度,在回答前“思考”一會兒,有時甚至長達數(shù)十秒。
就在該預(yù)覽版發(fā)布后不久,DeepSeek便表示計劃開源DeepSeek-R1并發(fā)布API,果然,這就是開源精神。在中國所有大模型創(chuàng)業(yè)公司中,DeepSeek是為數(shù)不多未做to C應(yīng)用的公司,而且堅持開源,深受社區(qū)歡迎。

此次一戰(zhàn)成名,全世界不少人對DeepSeek這家中國公司產(chǎn)生興趣。雖然DeepSeek是打響“價格戰(zhàn)”后讓大家熟知,但深入了解后發(fā)現(xiàn),DeepSeek不僅沒有燒錢補貼,甚至有利潤。
在DeepSeek-R1預(yù)覽版后,低調(diào)的“技術(shù)大牛”形象深入人心,讓我們更加期待DeepSeek(深度求索)未來繼續(xù)帶來更多驚艷的AI模型。
DeepSeek贏麻了,首個推理模型就超越OpenAI o1














滬公網(wǎng)安備 31010702005758號
發(fā)表評論注冊|登錄