首頁
影片
頻道
食衣住行
全部
30157
DIY
1936
衣著
536
妝扮
932
車
3873
房屋
1854
社會
5275
政論
88
美食
5090
烹飪
8679
新聞
220
環保
374
點心
1300
休閒娛樂
全部
85236
ASMR
152
小說
3260
戶外
1299
日常
4619
卡通
1220
民俗
1779
休閒
1158
收藏
779
明星
4562
玩具
1297
美女
901
音樂
7611
旅遊
1056
神秘
1762
配音
514
偶戲
741
動漫
6378
開箱
653
新奇
831
運動
2308
遊戲
10265
電視劇
10554
電影
5542
漫畫
795
綜藝
5857
劇場
1054
廣播
444
趣味
4022
寵物
1581
魔術
2242
教學知識
全部
46721
3C
1564
人物
432
人際
129
心靈
1978
文化
1273
文學
700
生物
164
地理
683
宇宙
395
兒童
1169
兩性
1363
命理
1189
宗教
3793
法律
490
知識
2310
科學
1809
軍武
1289
財經
6014
健康
4190
動物
1943
教育
2467
軟體
1096
植物
308
園藝
2622
演講
321
綜合
1703
歷史
2024
職場
450
雜談
1003
藝術
1263
攝影
587
我要推薦
回上一頁
DeepSeek V4发布前,梁文锋连发3篇论文,我读完发现一个规律
1.46萬
2026-01-14
329
AI进化论花生
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
01:05
威力導演教學|手機影片1 分鐘學會! #影片剪輯教學 #威力導演
17:55
本地部署ollama ai大模型,让局域网其他设备可正常访问使用,也就能使用这个免费翻译工具来使用本地模型实现实时翻译,来看无字幕的视频直播?翻译效果杠杠的!!一个视频详细分享从搭建到实战使用!
03:38
如何快速把想法落地成可以商业的应用?
04:51
Google 最強 AI 畫圖 Nano Banana 2 免費使用教學!性能逆天!
06:33
算力之后,内存暴涨
༺ 資料蒐集來源:
YouTube
༻
本站不需註冊加入會員,保障個人隱私,完全不用Cookei