DeepSeek贏麻了，首個推理模型就超越OpenAI o1

DeepSeek贏麻了，首個推理模型就超越OpenAI o1

Napoleon Chan / 2024-11-21 17:5498086

今年早些時候，國內科技公司DeepSeek（深度求索）因V2模型一舉成名，成名的原因簡單粗暴，主打高性價比。在當時，DeepSeek V2的API定價約等于谷歌的七分之一，GPT-4 Turbo的七十分之一。

時隔幾個月，這家被業界冠以“AI界拼多多”之稱的公司，迅速推出首個推理模型「DeepSeek-R1預覽版」。該模型一經推出，便在AIME以及全球頂級編程競賽（codeforces）等權威評測中，大幅超越了GPT4o，甚至o1-preview，一夜之間轟動全球。

圖片29.JPG

時間倒退回今年5月前后，在大模型領域，國內各大廠牌內卷最兇猛，創立于2023年4月的DeepSeek一戰成名，毫無疑問是當時的“黑馬”。但是，人們提起DeepSeek總是帶著“高性價比”的標簽，不自覺讓大家忽視他們強大的技術力。

如今，推理模型DeepSeek-R1預覽版在AIME和MATH這兩個關鍵基準測試上超越了OpenAI o1，大家終于不只以“性價比”來衡量DeepSeek。

圖片30.JPG

這里簡單解釋一下，AIME在美國數學競賽（AMC）中難度等級最高，所以常被用來測試不同模型解決推理問題的性能。DeepSeek-R1預覽版在解決這些復雜數學問題時擁有極強的“拆解能力”，能夠將復雜任務分解為更小的步驟并逐一執行，從而提高其準確性。

同時，DeepSeek-R1預覽版的思維過程是完全透明的，允許用戶驗證不同階段得出的答案。

圖片31.JPG

值得注意的是，DeepSeek-R1預覽版與OpenAI o1模型類似，會根據問題的復雜度，在回答前“思考”一會兒，有時甚至長達數十秒。

就在該預覽版發布后不久，DeepSeek便表示計劃開源DeepSeek-R1并發布API，果然，這就是開源精神。在中國所有大模型創業公司中，DeepSeek是為數不多未做to C應用的公司，而且堅持開源，深受社區歡迎。

圖片32.JPG

此次一戰成名，全世界不少人對DeepSeek這家中國公司產生興趣。雖然DeepSeek是打響“價格戰”后讓大家熟知，但深入了解后發現，DeepSeek不僅沒有燒錢補貼，甚至有利潤。

在DeepSeek-R1預覽版后，低調的“技術大?！毙蜗笊钊肴诵?，讓我們更加期待DeepSeek（深度求索）未來繼續帶來更多驚艷的AI模型。