首頁
影片
頻道
食衣住行
全部
30157
DIY
1936
衣著
536
妝扮
932
車
3873
房屋
1854
社會
5275
政論
88
美食
5090
烹飪
8679
新聞
220
環保
374
點心
1300
休閒娛樂
全部
85236
ASMR
152
小說
3260
戶外
1299
日常
4619
卡通
1220
民俗
1779
休閒
1158
收藏
779
明星
4562
玩具
1297
美女
901
音樂
7611
旅遊
1056
神秘
1762
配音
514
偶戲
741
動漫
6378
開箱
653
新奇
831
運動
2308
遊戲
10265
電視劇
10554
電影
5542
漫畫
795
綜藝
5857
劇場
1054
廣播
444
趣味
4022
寵物
1581
魔術
2242
教學知識
全部
46721
3C
1564
人物
432
人際
129
心靈
1978
文化
1273
文學
700
生物
164
地理
683
宇宙
395
兒童
1169
兩性
1363
命理
1189
宗教
3793
法律
490
知識
2310
科學
1809
軍武
1289
財經
6014
健康
4190
動物
1943
教育
2467
軟體
1096
植物
308
園藝
2622
演講
321
綜合
1703
歷史
2024
職場
450
雜談
1003
藝術
1263
攝影
587
我要推薦
回上一頁
DeepSeek V4发布前,梁文锋连发3篇论文,我读完发现一个规律
1.46萬
2026-01-14
329
AI进化论花生
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
00:32
如何用AI讓BP翻唱 #ai工具 #kpop #免版權音樂 #AI翻唱 #AIcover #AICoverSong #AI歌聲 #AI音樂#虛擬歌手 #AI生成 #AIVoice #AI創作
09:43
5分鐘用 ChatGPT 教你製作 LINE 貼圖並上架賺錢!(2025 最新 AI 教學) | chatGPT | 吉卜力風格 | AI繪圖
17:03
開源 AI 模型比付費的更香?Hugging Face 就是你的軍火庫,免費玩頂級開源 AI 還能本地客製化!
16:41
【別鬧了快用 AI】ChatGPT Atlas 跟 SEO 結合?用它來生成關鍵字、分析網站,甚至 SEO 優化建議
11:57
2025 學好最受歡迎的筆記工具 Notion 不嫌晚!全新保姆級教學手把手示範,打造專屬你的個人知識庫!【上集】
༺ 資料蒐集來源:
YouTube
༻
本站不需註冊加入會員,保障個人隱私,完全不用Cookei