最强编程模型Claude 3.7 Sonnet 发布，并同步新增 Claude Code

2025年2月24日，Anthropic发布了Claude 3.7 Sonnet和Claude Code，标志着AI辅助编程领域的重要里程碑。

Claude 3.7 Sonnet：集成推理能力的全新模型

与市场上其他推理模型不同，Claude 3.7 Sonnet采用了一种全新的设计理念。正如人类使用同一大脑既能快速响应又能深度思考，Anthropic认为推理能力应该是前沿模型的集成功能，而非完全独立的模型。

Claude 3.7 Sonnet具有两种工作模式：

标准模式：作为Claude 3.5 Sonnet的升级版，提供快速响应
扩展思考模式（Extended Thinking Mode）：在回答前进行自我反思，显著提升在数学、物理、指令遵循和编程等任务的表现

对于API用户，Claude 3.7 Sonnet还提供了精细的思考预算控制，允许用户指定模型最多思考N个token（最高可达128K token）。这种设计使用户可以根据需要平衡速度（和成本）与回答质量。

卓越的编程能力表现

根据早期测试，Claude 3.7 Sonnet在编程能力方面表现出色，成为同类最佳：

复杂代码库处理：能够理解并操作大型代码库
前端Web开发：在前端开发方面有显著提升
工具使用：能够更好地使用各种开发工具
全栈更新：能够处理从前端到后端的全面更新

实际测试中，Claude 3.7 Sonnet在SWE-bench Verified（评估AI模型解决真实世界软件问题的能力）和TAU-bench（测试AI代理在复杂真实任务中的表现）等基准测试中都达到了最先进的性能。

Claude Code：AI辅助编程的革命性工具

随同模型发布的Claude Code，是Anthropic首款用于辅助编程的代理工具，目前处于有限研究预览阶段。Claude Code直接在终端中运行，成为开发者的活跃协作者，能够：

搜索并阅读代码：理解项目结构和逻辑
编辑文件：修复bug或添加新功能
编写和运行测试：确保代码质量
提交代码到GitHub：自动处理版本控制
使用命令行工具：执行各种开发任务

尽管Claude Code仍是一个早期产品，但已经在Anthropic内部显示出惊人的价值。在早期测试中，Claude Code能够一次性完成通常需要45分钟以上人工工作的任务，极大地减少了开发时间和工作量。

实际用户体验

早期用户反馈显示，Claude 3.7 Sonnet在处理复杂编程任务方面表现卓越。在金融分析和算法交易等领域的测试中，与OpenAI的o3-mini相比，Claude 3.7 Sonnet能够：

更准确地理解模糊查询并生成有效的SQL查询
为算法交易生成更高质量的策略
在解决复杂问题时展示更强的推理能力

一位测试者表示：“Claude 3.7 Sonnet能够找到符合我复杂标准的股票，而其他模型则完全失败。它生成的算法交易策略不仅性能更好，还展示了清晰的思考过程。“

定价和可用性

Claude 3.7 Sonnet现已在所有Claude计划上提供，包括免费版、Pro版、团队版和企业版，以及通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用。扩展思考模式在免费Claude层级以外的所有平台上可用。

价格方面，Claude 3.7 Sonnet与前代模型保持一致：每百万输入token 3美元，每百万输出token 15美元（包括思考token）。虽然价格高于OpenAI的一些竞争产品，但其在复杂编程任务上的卓越性能对许多开发者来说物有所值。

总结

Claude 3.7 Sonnet和Claude Code代表了AI辅助编程的重要里程碑。混合推理模型的推出，以及Claude Code这样的专用工具，使开发人员能够更高效地解决复杂编程问题。无论是理解复杂代码库、生成高质量代码，还是自动化测试和调试过程，Claude 3.7 Sonnet都展示了强大的能力。

随着AI编程工具的不断发展，Claude 3.7 Sonnet和Claude Code将帮助开发者提高生产力，专注于更有创意和更高价值的工作。对于希望利用最新AI技术提升编程效率的开发者来说，Claude 3.7 Sonnet无疑是一个值得关注的重要更新。