DeepSeek R1-0528:一次意外的惊喜更新
DeepSeek R1-0528:一次意外的惊喜更新
就在昨天(5月28日)凌晨,中国AI公司DeepSeek在Hugging Face上悄悄发布了一个”小更新”——DeepSeek R1-0528。虽然官方说是小更新,但开发者们试用后发现,这次升级的效果比预期好了很多,不少人都觉得这是开源AI的一个重要进展。
什么是R1-0528?一次超出预期的升级
DeepSeek这次的发布方式很简单直接。他们没有开发布会,没有大量宣传,甚至连详细的技术文档都还没发布,就直接把新模型放到了网上。公司只是在微信群里简单说了句:“R1模型完成了一个小版本升级,大家可以开始测试了。”
但开发者们一试用就发现,这个”小升级”的效果其实挺明显的。
技术参数:实用性不错的配置
R1-0528基于混合专家(MoE)架构,总参数量有670-685亿,但因为用了稀疏激活技术,实际推理时只需要用到约37亿参数。这样设计的好处是既保证了性能,又不会太消耗资源。
另一个比较实用的改进是,R1-0528的上下文窗口扩展到了128K tokens(有些测试中能达到164K),这样就能处理比较大的文档或代码了。
测试成绩:编程能力排到第四名
在编程测试LiveCodeBench中,R1-0528拿到了73.1的Pass@1分数,排第四名,前面是OpenAI的O3和O4-Mini模型。对于一个开源模型来说,这个成绩已经很不错了。
数学推理方面进步比较明显。在AIME 2025测试中,准确率从70%提升到87.5%,思考过程也变得更深入,平均每个问题的推理长度从12,000个token增加到23,000个token。
实际使用体验:确实有改进
测试分数是一回事,实际用起来怎么样才是关键。不少开发者都试了试新版本,反馈还挺正面的。
编程方面: 有人让模型做Instagram界面,R1-0528做出来的效果更流畅,UI响应也更好。还有人测试3D物理模拟,R1-0528不仅完成了基本要求,还自动加了光照效果和界面,比其他一些模型做得更细致。
创意任务: 在制作小游戏的测试中,R1-0528不光能生成基础代码,还会主动添加一些游戏功能,表现比预期好。
思考深度: 有用户说新版本能进行比较长时间的深度思考(30-60分钟),处理复杂问题时更仔细。
成本优势:便宜很多
说到成本,R1-0528确实有优势。跟OpenAI的o1比起来,API使用成本便宜了大约27倍(o1每百万输出token要60美元,R1-0528只要2.19美元)。这样的价格让更多人能用得起。
而且R1-0528还是开源的,用的是MIT许可证,商业使用和修改都没问题。对于预算不多的个人开发者和小团队来说,这很实用。
功能改进:一些实用的小变化
除了核心性能,R1-0528还加了一些实用功能:
- 新功能: 支持JSON输出和函数调用,开发者集成起来更方便
- 体验优化: 界面响应更快,用起来更顺手
- 准确性提升: 输出更可靠,“胡说八道”的情况少了
- 系统提示: 加了系统提示功能,能更好理解用户想要什么
需要注意的问题:并非完美
当然,R1-0528也不是没有问题。有安全专家测试发现,这个模型在某些情况下比较容易被”忽悠”,可能会输出一些不合适的内容。如果要在正式项目中使用,安全方面还是要多考虑一下。
另外,模型的思维过程比较”啰嗦”,可能会增加使用成本,在一些对效率要求高的场景中需要权衡。
小规模版本:资源不够也能用
值得一提的是,DeepSeek还发布了一个小版本——DeepSeek-R1-0528-Qwen3-8B。这个80亿参数的版本在保持不错性能的同时,只需要16GB显存就能跑,对硬件要求不高的用户也能试试。
后续发展:R2什么时候来?
有意思的是,DeepSeek把这次更新还是叫R1,而不是直接升级到R2。这让不少人好奇:既然R1的更新版就已经这么好用了,那真正的R2会是什么样?
从目前的情况看,DeepSeek正在证明开源AI也能做得很好,在某些方面甚至能超过一些闭源模型。这对整个AI行业的发展还是有积极影响的。
总结:一次值得关注的更新
DeepSeek R1-0528的发布,算是给开源AI社区带来了一个不错的惊喜。它证明了好用的AI不一定要花大价钱,开源模型也能有很好的表现。
对开发者来说,现在有了更多选择——性能不错,价格便宜,还能自由修改。对AI行业来说,这也意味着竞争会更激烈,技术进步可能会更快。
总的来说,这是个值得关注的发展。AI正在变得更容易获得,这对大家都是好事。