当前位置: 首页 > ai >正文

2025 年使用大模型进行软件工程:现实检验

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

以工程经理与资深工程师的视角,探讨大厂与初创公司的挑战,以及与 Anthropic、Cursor 等 AI 公司工程师,与 Google、Amazon 等大厂工程师,以及多位资深工程师的对话,从中归纳 AI 工具的使用状况与发展趋势。


一、两极现象

乐观派观点:AI 企业高管的话语

许多 AI 基础设施公司高管发出过类似预言:

  • “Anthropic 的 CEO 表示未来一年所有代码都将由 AI 生成”(Inc Magazine,2025 年 3 月)。
  • “微软 CEO 称 AI 目前可编写约 30% 的公司代码,部分项目代码将完全由 AI 生成”(Tom’s Hardware,2025 年 4 月)。
  • “Google 首席科学家预测 AI 在一年内可达初级程序员水平”(Business Insider,2025 年 5 月)。

这些言论常伴随着乐观预期,但它们往往来自拥有 AI 产品并希望推动销售的公司。

悲观派观点:开发者的失望

开发者社区不乏 AI 工具失误的案例:

  • 一位工程师使用名为 Devin 的工具错误生成代码,导致 PostHog 产生数百万无效事件,造成约 733 美元损失。
  • GitHub Copilot Agent 在 .NET 代码库的公测版中出现大量错误,生成不通过的单元测试,导致微软工程团队放弃相关 pull request。

这些事件表明现阶段 AI 工具仍不够可靠。


二、AI 开发工具初创公司

这些公司的工程团队强烈 Dogfood 自家产品:

  • Anthropic:内部 90% 的 Claude Code 源码由 Claude Code 编写。据称 Sonnet 4 与 Code 的推出,使使用量大增,并显著提升开发效率(“双倍甚至十倍”)。
  • Windsurf:约 95% 的代码使用其代理 Cascade 与标签页自动补全完成。
  • Cursor:估计 40%–50% 的代码来自 Cursor,团队成员每天都在使用。


三、大厂状况

Google

Google 构建了紧密集成的工具链,包括 Borg、Cider、Critique、Code Search、Gemini LLM、NotebookLM 等。多名工程师表示:

  • 通过谨慎部署 AI 功能,逐步建立信任。
  • 许多组织内部正在尝试 AI 项目,并为有潜力的项目持续投入资源。
  • SRE 团队预计将迎来代码量增长 10 倍的挑战,包括代码审查、部署、BUG 管控等也需倍增。

Amazon

Amazon 推出了多款 AI 工具:

  • Amazon Q Developer:相当于 Copilot,现已进入 Pro 级,支持单文件场景、Java 特征,使用 AWS Bedrock 和 MCP 插件。
  • Claude Sonnet:用于撰写 PR / FAQ 文档、自评、绩效评估。
  • MCP 架构与其 API-first 文化高度契合,使得各类内部工具都可被代理调用,提高自动化协作能力。
  • 多数团队已接入 MCP,用于 Wiki、票务系统、Quip、CLI 等,从而链式自动化工作流。


四、AI 初创企业(非开发工具)

  • incident.io:该团队高度依赖 Claude Code、Cursor、Granola 等工具,通过 Slack 汇报经验,持续优化代码风格与架构一致性。
  • 某生物科技公司:虽然尝试过 AI 工具,但发现其效果不如提升开发环境工具(如 high‑performance Python 库、ruff linter 等),因而多数 AI 工具“未贴合”其复杂软件开发需求。


五、资深工程师的看法

  • Armin Ronacher(Flask 创始人):从怀疑转为信任,称 Claude Code 可在命令行执行反馈,是决定性转折因素。
  • Peter Steinberger(PSPDFKit 创始人):发现工具提升与定价使得他重新热爱编程,并认为产出提升 10–20 倍。
  • Birgitta Böckeler(Thoughtworks 董事工程师):认为 GenAI 是一种横向创新,可更自然地指令驱动各层级抽象。
  • Simon Willison(Django 创始人):实验证明“编码代理”已产生实际效果,通过循环执行编译、测试、linting 等操作,能够完成开发任务。
  • Kent Beck(XP 与 TDD 提倡者):表示 52 年生涯中体验到的最具乐趣的编程时期。
  • Martin Fowler(思维与重构大师):称 LLM 将带来与从汇编语言转向高级语言相似的抽象革命,但它们是非确定性的工具,颠覆传统编程范式。


六、未解之问

  1. 为何创始人与 CEO 更乐观? 高层多为推动者,关注传播与投资潜力。
  2. 开发者普及程度如何? DX 研究显示:50% 的开发者每周使用 AI 工具,“顶级”公司比例达 62%。
  3. AI 节省时间多少? 开发者平均每周节省 4 小时(约占 40 小时工作周的 10%);这一数据与 Google CEO Sundar Pichai 的预估相符。
  4. 为何团队层面尚未高效? AI 主要提升个体编码速度,但团队层面需强化代码审查、测试、部署等流程协同,且方案落地需时间。
  5. 为何很多开发者未立即上手? Simon Willison 观察指出,一味理解 LLM 运作机制反而成为阻碍,反而轻触试用更有效。


总结

  • AI 开发工具初创公司大厂内部工具 推动技术前沿,已普遍 Dogfood 自家产品。
  • AI 相关初创公司 虽高度尝试,但效果不一;有些领域如高性能计算样受益更多。
  • 资深工程师们 多从怀疑转为热情,认为工具如 Claude Code、Cursor 等已带来革命性转变。
  • AI 工具虽仍有不稳定与流程整合问题,但已经具备可用性与生产力提升潜力。
  • 实验价值显著,建议尝试多种工具(如 Claude Code、OpenAI Codex、Gemini CLI、Amazon Q CLI、Cursor、Windsurf、VS Code + Copilot、Aider、Zed 等),这类工具将在未来几年内与 IDE、Git 同级成为“开发标配”。


结语:如 Kent Beck 所言,如今“一切成本结构已被重构”,开发者正处在 AI 带来变革的风口,只要主动尝试,就能在这一时代收获创新的红利。

http://www.xdnf.cn/news/14848.html

相关文章:

  • [附源码+数据库+毕业论文]基于Spring+MyBatis+MySQL+Maven+jsp实现的高校实验室资源综合管理系统,推荐!
  • 汽车功能安全系统阶段开发【技术安全需求TSR】4
  • 算法学习笔记:8.Bellman-Ford 算法——从原理到实战,涵盖 LeetCode 与考研 408 例题
  • Python 3 -- 第一章 基础语法
  • RSTP 拓扑收敛机制
  • 牛客周赛99
  • java ThreadLocal源码分析
  • 基于Java+springboot 的车险理赔信息管理系统
  • centos7.9安装ffmpeg6.1和NASM、Yasm、x264、x265、fdk-aac、lame、opus解码器
  • CentOS-7的“ifupdown“与Debian的“ifupdown“对比 笔记250706
  • 【LeetCode 热题 100】240. 搜索二维矩阵 II——排除法
  • [netty5: WebSocketFrameEncoder WebSocketFrameDecoder]-源码解析
  • 《Spring AI实战:Java智能开发速成指南》
  • 设计模式---观察者模式(发布-订阅模式)
  • 【STM32】通用定时器PWM
  • Spring AI(12)——调用多模态模型识别和生成图像
  • 关于笔记本充电,使用氮化镓充电器
  • Omi录屏专家 Screen Recorder by Omi 屏幕录制Mac
  • 高效处理大体积Excel文件的Java技术方案解析
  • 云原生 Serverless 架构下的智能弹性伸缩与成本优化实践
  • SNAT DNAT实验
  • 探索实现C++ STL容器适配器:优先队列priority_queue
  • MySQL CDC与Kafka整合指南:构建实时数据管道的完整方案
  • 前端常见 HTTP 状态码
  • DPDK 网卡驱动
  • WPF学习笔记(25)MVVM框架与项目实例
  • Stlink v2调试器采用SWD模式连接stm32f103c8t6核心板的接线方式
  • AI小智项目全解析:软硬件架构与开发环境配置
  • 信号与槽的总结
  • Linux内核深度解析:IPv4策略路由的核心实现与fib_rules.c源码剖析