DeepSeek R1-0528：一次意外的惊喜更新

就在昨天（5月28日）凌晨，中国AI公司DeepSeek在Hugging Face上悄悄发布了一个”小更新”——DeepSeek R1-0528。虽然官方说是小更新，但开发者们试用后发现，这次升级的效果比预期好了很多，不少人都觉得这是开源AI的一个重要进展。

什么是R1-0528？一次超出预期的升级

DeepSeek这次的发布方式很简单直接。他们没有开发布会，没有大量宣传，甚至连详细的技术文档都还没发布，就直接把新模型放到了网上。公司只是在微信群里简单说了句：“R1模型完成了一个小版本升级，大家可以开始测试了。”

但开发者们一试用就发现，这个”小升级”的效果其实挺明显的。

R1-0528基于混合专家（MoE）架构，总参数量有670-685亿，但因为用了稀疏激活技术，实际推理时只需要用到约37亿参数。这样设计的好处是既保证了性能，又不会太消耗资源。

另一个比较实用的改进是，R1-0528的上下文窗口扩展到了128K tokens（有些测试中能达到164K），这样就能处理比较大的文档或代码了。

在编程测试LiveCodeBench中，R1-0528拿到了73.1的Pass@1分数，排第四名，前面是OpenAI的O3和O4-Mini模型。对于一个开源模型来说，这个成绩已经很不错了。

数学推理方面进步比较明显。在AIME 2025测试中，准确率从70%提升到87.5%，思考过程也变得更深入，平均每个问题的推理长度从12,000个token增加到23,000个token。

测试分数是一回事，实际用起来怎么样才是关键。不少开发者都试了试新版本，反馈还挺正面的。

编程方面： 有人让模型做Instagram界面，R1-0528做出来的效果更流畅，UI响应也更好。还有人测试3D物理模拟，R1-0528不仅完成了基本要求，还自动加了光照效果和界面，比其他一些模型做得更细致。

创意任务： 在制作小游戏的测试中，R1-0528不光能生成基础代码，还会主动添加一些游戏功能，表现比预期好。

思考深度： 有用户说新版本能进行比较长时间的深度思考（30-60分钟），处理复杂问题时更仔细。

说到成本，R1-0528确实有优势。跟OpenAI的o1比起来，API使用成本便宜了大约27倍（o1每百万输出token要60美元，R1-0528只要2.19美元）。这样的价格让更多人能用得起。

而且R1-0528还是开源的，用的是MIT许可证，商业使用和修改都没问题。对于预算不多的个人开发者和小团队来说，这很实用。

除了核心性能，R1-0528还加了一些实用功能：

当然，R1-0528也不是没有问题。有安全专家测试发现，这个模型在某些情况下比较容易被”忽悠”，可能会输出一些不合适的内容。如果要在正式项目中使用，安全方面还是要多考虑一下。

另外，模型的思维过程比较”啰嗦”，可能会增加使用成本，在一些对效率要求高的场景中需要权衡。

值得一提的是，DeepSeek还发布了一个小版本——DeepSeek-R1-0528-Qwen3-8B。这个80亿参数的版本在保持不错性能的同时，只需要16GB显存就能跑，对硬件要求不高的用户也能试试。

有意思的是，DeepSeek把这次更新还是叫R1，而不是直接升级到R2。这让不少人好奇：既然R1的更新版就已经这么好用了，那真正的R2会是什么样？

从目前的情况看，DeepSeek正在证明开源AI也能做得很好，在某些方面甚至能超过一些闭源模型。这对整个AI行业的发展还是有积极影响的。

DeepSeek R1-0528的发布，算是给开源AI社区带来了一个不错的惊喜。它证明了好用的AI不一定要花大价钱，开源模型也能有很好的表现。

对开发者来说，现在有了更多选择——性能不错，价格便宜，还能自由修改。对AI行业来说，这也意味着竞争会更激烈，技术进步可能会更快。

总的来说，这是个值得关注的发展。AI正在变得更容易获得，这对大家都是好事。