当前位置：首页 > ai >正文

2025 年使用大模型进行软件工程：现实检验

ai 2025/7/14 4:34:24

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

以工程经理与资深工程师的视角，探讨大厂与初创公司的挑战,以及与 Anthropic、Cursor 等 AI 公司工程师，与 Google、Amazon 等大厂工程师，以及多位资深工程师的对话，从中归纳 AI 工具的使用状况与发展趋势。

一、两极现象

乐观派观点：AI 企业高管的话语

许多 AI 基础设施公司高管发出过类似预言：

“Anthropic 的 CEO 表示未来一年所有代码都将由 AI 生成”（Inc Magazine，2025 年 3 月）。
“微软 CEO 称 AI 目前可编写约 30% 的公司代码，部分项目代码将完全由 AI 生成”（Tom’s Hardware，2025 年 4 月）。
“Google 首席科学家预测 AI 在一年内可达初级程序员水平”（Business Insider，2025 年 5 月）。

这些言论常伴随着乐观预期，但它们往往来自拥有 AI 产品并希望推动销售的公司。

悲观派观点：开发者的失望

开发者社区不乏 AI 工具失误的案例：

一位工程师使用名为 Devin 的工具错误生成代码，导致 PostHog 产生数百万无效事件，造成约 733 美元损失。
GitHub Copilot Agent 在 .NET 代码库的公测版中出现大量错误，生成不通过的单元测试，导致微软工程团队放弃相关 pull request。

这些事件表明现阶段 AI 工具仍不够可靠。

二、AI 开发工具初创公司

这些公司的工程团队强烈 Dogfood 自家产品：

Anthropic：内部 90% 的 Claude Code 源码由 Claude Code 编写。据称 Sonnet 4 与 Code 的推出，使使用量大增，并显著提升开发效率（“双倍甚至十倍”）。
Windsurf：约 95% 的代码使用其代理 Cascade 与标签页自动补全完成。
Cursor：估计 40%–50% 的代码来自 Cursor，团队成员每天都在使用。

三、大厂状况

Google

Google 构建了紧密集成的工具链，包括 Borg、Cider、Critique、Code Search、Gemini LLM、NotebookLM 等。多名工程师表示：

通过谨慎部署 AI 功能，逐步建立信任。
许多组织内部正在尝试 AI 项目，并为有潜力的项目持续投入资源。
SRE 团队预计将迎来代码量增长 10 倍的挑战，包括代码审查、部署、BUG 管控等也需倍增。

Amazon

Amazon 推出了多款 AI 工具：

Amazon Q Developer：相当于 Copilot，现已进入 Pro 级，支持单文件场景、Java 特征，使用 AWS Bedrock 和 MCP 插件。
Claude Sonnet：用于撰写 PR / FAQ 文档、自评、绩效评估。
MCP 架构与其 API-first 文化高度契合，使得各类内部工具都可被代理调用，提高自动化协作能力。
多数团队已接入 MCP，用于 Wiki、票务系统、Quip、CLI 等，从而链式自动化工作流。

四、AI 初创企业（非开发工具）

incident.io：该团队高度依赖 Claude Code、Cursor、Granola 等工具，通过 Slack 汇报经验，持续优化代码风格与架构一致性。
某生物科技公司：虽然尝试过 AI 工具，但发现其效果不如提升开发环境工具（如 high‑performance Python 库、ruff linter 等），因而多数 AI 工具“未贴合”其复杂软件开发需求。

五、资深工程师的看法

Armin Ronacher（Flask 创始人）：从怀疑转为信任，称 Claude Code 可在命令行执行反馈，是决定性转折因素。
Peter Steinberger（PSPDFKit 创始人）：发现工具提升与定价使得他重新热爱编程，并认为产出提升 10–20 倍。
Birgitta Böckeler（Thoughtworks 董事工程师）：认为 GenAI 是一种横向创新，可更自然地指令驱动各层级抽象。
Simon Willison（Django 创始人）：实验证明“编码代理”已产生实际效果，通过循环执行编译、测试、linting 等操作，能够完成开发任务。
Kent Beck（XP 与 TDD 提倡者）：表示 52 年生涯中体验到的最具乐趣的编程时期。
Martin Fowler（思维与重构大师）：称 LLM 将带来与从汇编语言转向高级语言相似的抽象革命，但它们是非确定性的工具，颠覆传统编程范式。

六、未解之问

为何创始人与 CEO 更乐观？ 高层多为推动者，关注传播与投资潜力。
开发者普及程度如何？ DX 研究显示：50% 的开发者每周使用 AI 工具，“顶级”公司比例达 62%。
AI 节省时间多少？ 开发者平均每周节省 4 小时（约占 40 小时工作周的 10%）；这一数据与 Google CEO Sundar Pichai 的预估相符。
为何团队层面尚未高效？ AI 主要提升个体编码速度，但团队层面需强化代码审查、测试、部署等流程协同，且方案落地需时间。
为何很多开发者未立即上手？ Simon Willison 观察指出，一味理解 LLM 运作机制反而成为阻碍，反而轻触试用更有效。

总结

AI 开发工具初创公司 与 大厂内部工具 推动技术前沿，已普遍 Dogfood 自家产品。
AI 相关初创公司 虽高度尝试，但效果不一；有些领域如高性能计算样受益更多。
资深工程师们 多从怀疑转为热情，认为工具如 Claude Code、Cursor 等已带来革命性转变。
AI 工具虽仍有不稳定与流程整合问题，但已经具备可用性与生产力提升潜力。
实验价值显著，建议尝试多种工具（如 Claude Code、OpenAI Codex、Gemini CLI、Amazon Q CLI、Cursor、Windsurf、VS Code + Copilot、Aider、Zed 等），这类工具将在未来几年内与 IDE、Git 同级成为“开发标配”。

结语：如 Kent Beck 所言，如今“一切成本结构已被重构”，开发者正处在 AI 带来变革的风口，只要主动尝试，就能在这一时代收获创新的红利。

查看全文

http://www.xdnf.cn/news/14848.html