3.高性能 強推理:Deepseek算法能力突出,模型性能躋身世界前列
DeepSeek-R1 在繼承了V3的創新架構的基礎上,在後訓練階段大規模使用了強化學習技術,自動選擇有價值的數據進行標注和訓練,減少數據標注量和計算資源浪費,並在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上, DeepSeek在 AIME 2024 測評中上獲得 79.8% 的 pass@1 得分,略微超過 OpenAI-o1;在 MATH-500 上,獲得了 97.3% 的得分,與 OpenAI-o1性能相當,並且顯著優於其他模型。
圖8:DeepSeek模型性能優異
資料來源:DeepSeek官網,源達信息證券研究所
DeepSeek的蒸餾技術顯著提升小模型推理能力。據 DeepSeek-V3的技術文檔,該模型使用數據蒸餾技術生成的高質量數據提升了訓練效率。通過已有的高質量模型來合成少量高質量數據,作為新模型的訓練數據,從而達到接近於在原始數據上訓練的效果。DeepSeek發布了從15億到700億參數的R1蒸餾版本。這些模型基於Qwen和Llama等架構,表明複雜的推理能力可以被封裝在更小、更高效的模型中。蒸餾過程包括使用由完整 DeepSeek-R1 生成的合成推理數據對這些較小的模型進行微調,從而在降低計算成本的同時保持高性能。讓規模更大的模型先學到高水平推理模式,再把這些成果移植給更小的模包。
圖9:蒸餾技術原理
資料來源:CSDN,源達信息證券研究所
圖10:DeepSeek蒸餾小模型超越OpenAI o1-mini
資料來源:DeepSeek官網,源達信息證券研究所
二、DeepSeek驅動模型平價化,建議關注算力、AIAgent和端側的投資機會
1.DeepSeek驅動模型平價化,算力需求大幅增長
DeepSeek的爆火使得“傑文斯悖論”這一經濟學名詞受到關注。“傑文斯悖論”⠧濟學家威廉・斯坦利・傑文斯於 1865 年提出。當時,英國麵臨煤炭資源可能耗盡的擔憂,人們認為提高煤炭使用效率能緩解資源短缺。但傑文斯卻指出,技術進步帶來的效率提升,反而會導致資源消耗的增加。例如,當煤炭動力技術效率提高,意味著能以更低成本獲取更多能量,這會促使更多依賴煤炭能源的產業興起,如工廠、火車、輪船等,進而刺激煤炭需求大幅增長,加速煤炭資源的消耗。
DeepSeek爆火使得更多用戶開始使用 AI服務,如同打開了 AI 應用需求的 “潘多拉魔盒”。隨著更多用戶對 DeepSeek 的使用,以及未來更多AI 應用的不斷湧現,對算力的需求呈現出幾何級增長趨勢。AI 技術的進步,就像曾經煤炭動力技術的提升,雖然模型效率提高了,但不斷增長的用戶和應用數量,卻對算力資源提出了更高要求,消耗也隨之劇增。
DeepSeek用戶量大幅攀升,麵臨服務器資源不足的問題。目前網站已經暫停API充值,顯示“當前服務器資源緊張,為避免對您造成業務影響,我們已暫停API服務充值。存量充值金額可繼續調用,敬請諒解”。我們在使用時也發現,網頁deepseek問答經常反饋“服務器繁忙,請稍後再試”。
圖11:DeepSeek顯著提升了算力利用效率
資料來源:甲子光年智庫,源達信息證券研究所
圖12:DeepSeek麵臨服務器資源不足的問題
資料來源:DeepSeek官網,源達信息證券研究所
建議關注以國產算力和AI推理需求為核心的算力環節,尤其是IDC、服務器、國產芯片等算力配套產業,推薦海光信息、浪潮信息。
2.AIAgent市場空間廣闊,B端、C端應用大有可為
DeepSeek迅速集成進各雲廠商的平台中,直接拉高模型能力下限,AI 應用開發提速升級。在 AI 領域蓬勃發展的當下,1 月 20 日深度求索推出的大模型 DeepSeek - R1 憑借其在數學、代碼、自然語言推理等任務上比肩 OpenAI o1 模型正式版的出色性能,以及 MIT 許可協議下支持免費商用、任意修改和衍生開發的優勢,迅速成為了海內外各大雲廠商的寵兒。截至 2 月 5 日,華為雲、騰訊雲、阿裏雲、百度智能雲等國內主流雲平台,以及亞馬遜 AWS、微軟 Azure 等國際雲巨頭紛紛宣布將 DeepSeek 迅速集成進各自的平台中。比如騰訊雲將 R1 大模型一鍵部署至高性能應用服務 HAI 上,開發者僅需 3 分鍾就能接入調用 ,還推出 “開發者大禮包”,實現 DeepSeek 全係模型一鍵部署;阿裏雲 PAI Model Gallery 支持雲上一鍵部署 DeepSeek - V3、DeepSeek - R1。這種廣泛且迅速的集成,直接拉高了模型能力下限。以往一些受限於基礎模型能力不足而難以實現的複雜功能,在集成 DeepSeek 後得以輕鬆達成。眾多企業借助這些集成了 DeepSeek 的雲平台,在開發 AI 應用時,從模型搭建到功能實現的周期大幅縮短,開發效率顯著提升,實現了 AI 應用開發的提速升級。
表3:國內外雲廠商接入DeepSeek模型
评论
谷歌留痕
回复你好你好好的话说
谷歌留痕
回复哈哈哈回家试试