DeepSeek V4发布前,梁文锋连发3篇论文,我读完发现一个规律

1.46萬
2026-01-14
329
AI进化论花生
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
00:32
如何用AI讓BP翻唱 #ai工具 #kpop #免版權音樂 #AI翻唱 #AIcover #AICoverSong #AI歌聲 #AI音樂#虛擬歌手 #AI生成 #AIVoice #AI創作
09:43
5分鐘用 ChatGPT 教你製作 LINE 貼圖並上架賺錢!(2025 最新 AI 教學) | chatGPT | 吉卜力風格 | AI繪圖
17:03
開源 AI 模型比付費的更香?Hugging Face 就是你的軍火庫,免費玩頂級開源 AI 還能本地客製化!
16:41
【別鬧了快用 AI】ChatGPT Atlas 跟 SEO 結合?用它來生成關鍵字、分析網站,甚至 SEO 優化建議
11:57
2025 學好最受歡迎的筆記工具 Notion 不嫌晚!全新保姆級教學手把手示範,打造專屬你的個人知識庫!【上集】

༺ 資料蒐集來源: YouTube
本站不需註冊加入會員,保障個人隱私,完全不用Cookei