🤖 AI 工具

最强编程模型Claude 3.7 Sonnet 发布,并同步新增 Claude Code

最强编程模型Claude 3.7 Sonnet 发布,并同步新增 Claude Code

✍️ Jeffrey

2025年2月24日,Anthropic发布了Claude 3.7 Sonnet和Claude Code,标志着AI辅助编程领域的重要里程碑。

Claude 3.7 Sonnet:集成推理能力的全新模型

与市场上其他推理模型不同,Claude 3.7 Sonnet采用了一种全新的设计理念。正如人类使用同一大脑既能快速响应又能深度思考,Anthropic认为推理能力应该是前沿模型的集成功能,而非完全独立的模型。

Claude 3.7 Sonnet具有两种工作模式:

  • 标准模式:作为Claude 3.5 Sonnet的升级版,提供快速响应
  • 扩展思考模式(Extended Thinking Mode):在回答前进行自我反思,显著提升在数学、物理、指令遵循和编程等任务的表现

对于API用户,Claude 3.7 Sonnet还提供了精细的思考预算控制,允许用户指定模型最多思考N个token(最高可达128K token)。这种设计使用户可以根据需要平衡速度(和成本)与回答质量。

卓越的编程能力表现

根据早期测试,Claude 3.7 Sonnet在编程能力方面表现出色,成为同类最佳:

  • 复杂代码库处理:能够理解并操作大型代码库
  • 前端Web开发:在前端开发方面有显著提升
  • 工具使用:能够更好地使用各种开发工具
  • 全栈更新:能够处理从前端到后端的全面更新

实际测试中,Claude 3.7 Sonnet在SWE-bench Verified(评估AI模型解决真实世界软件问题的能力)和TAU-bench(测试AI代理在复杂真实任务中的表现)等基准测试中都达到了最先进的性能。

Claude Code:AI辅助编程的革命性工具

随同模型发布的Claude Code,是Anthropic首款用于辅助编程的代理工具,目前处于有限研究预览阶段。Claude Code直接在终端中运行,成为开发者的活跃协作者,能够:

  • 搜索并阅读代码:理解项目结构和逻辑
  • 编辑文件:修复bug或添加新功能
  • 编写和运行测试:确保代码质量
  • 提交代码到GitHub:自动处理版本控制
  • 使用命令行工具:执行各种开发任务

尽管Claude Code仍是一个早期产品,但已经在Anthropic内部显示出惊人的价值。在早期测试中,Claude Code能够一次性完成通常需要45分钟以上人工工作的任务,极大地减少了开发时间和工作量。

实际用户体验

早期用户反馈显示,Claude 3.7 Sonnet在处理复杂编程任务方面表现卓越。在金融分析和算法交易等领域的测试中,与OpenAI的o3-mini相比,Claude 3.7 Sonnet能够:

  • 更准确地理解模糊查询并生成有效的SQL查询
  • 为算法交易生成更高质量的策略
  • 在解决复杂问题时展示更强的推理能力

一位测试者表示:“Claude 3.7 Sonnet能够找到符合我复杂标准的股票,而其他模型则完全失败。它生成的算法交易策略不仅性能更好,还展示了清晰的思考过程。“

定价和可用性

Claude 3.7 Sonnet现已在所有Claude计划上提供,包括免费版、Pro版、团队版和企业版,以及通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用。扩展思考模式在免费Claude层级以外的所有平台上可用。

价格方面,Claude 3.7 Sonnet与前代模型保持一致:每百万输入token 3美元,每百万输出token 15美元(包括思考token)。虽然价格高于OpenAI的一些竞争产品,但其在复杂编程任务上的卓越性能对许多开发者来说物有所值。

总结

Claude 3.7 Sonnet和Claude Code代表了AI辅助编程的重要里程碑。混合推理模型的推出,以及Claude Code这样的专用工具,使开发人员能够更高效地解决复杂编程问题。无论是理解复杂代码库、生成高质量代码,还是自动化测试和调试过程,Claude 3.7 Sonnet都展示了强大的能力。

随着AI编程工具的不断发展,Claude 3.7 Sonnet和Claude Code将帮助开发者提高生产力,专注于更有创意和更高价值的工作。对于希望利用最新AI技术提升编程效率的开发者来说,Claude 3.7 Sonnet无疑是一个值得关注的重要更新。