当前位置：首页 >新媒易动态 >视频号购买

呈现“你的 Agent 为你雇佣另一个 Agent”的场景

2025-06-07

开端的起点，其实是在咱们测验对接 Google Drive 和 GitHub。咱们发现这两个功能尽管本质上都是“把上下文引入模型”，但内部完成却彻底不同。咱们马上还要做集成，看起来又将是一次全新的、重复造轮子的开发。

所以我通常的形式是：做次之后，就能够总结出笼统层级，构成规范。而 MCP 便是这么来的。一开端，并不是从“咱们要拟定一个统一的协议”这种顶层规划开端的，而是两个工程师觉得这样做更合理，于是就动手去原型验证、重复迭代。

后来咱们花了许多精力把这个协议做得更好、更敞开，期望它不只是 Anthropic 内部运用的东西，而是真实有机会成为职业规范。现在，MCP 现已开端被更广泛地采用。

Lauren：从一个“自下而上”的主意出发，到现在落地扩展，你们是怎么培养并开展这个产品的？

Mike：我现在最重视的两个方向，都是环绕 MCP 展开的。第一是“履行能力”。MCP 开端的规划方针是引入上下文，现在咱们现已能够集成 GitHub、触发 Zapier 等操作。但更重要的是下一阶段，咱们期望模型能自动完成任务。它们不仅要能“了解”，还要能“行动”，自动履行工作流。

第二是“Agent 之间的协作”。咱们现在还处于十分早期的探究阶段，乃至还不适合立即建立规范。但很显着，未来不同的 Agents 会彼此交互、协作，乃至“雇佣”其他 Agent 来完成任务。这将构成一种新的 AI 经济体系。

咱们内部现已开端评论，比方未来是否会呈现“你的 Agent 为你雇佣另一个 Agent”的场景。这些主意令人兴奋。

Lauren：你们在编程方面现已做得很老练，看起来不只是“自下而上的小测验”。你是怎么看待这类产品的定位？你觉得现在做对了哪些事？

Mike：即使是编程这块，我仍然充满敬畏。许多立异都不是靠“战略”定出来的，而是由几个研讨员突破边界推动的。比方前面说到的 RL（强化学习）探究，便是从详细研讨中天然开展出来的。

咱们一直坚持的一点是：不仅仅盯着 Benchmark 分数，更重要的是——模型生成的代码用户是否喜爱用？它是否真实带来了好结果？这点咱们会持续强化。

“Vibe Coding”这个说法，其实不是咱们提出来的，但它的确有必定价值。你用模型生成代码时，或许会感受到某种“氛围”或许“灵感”，这在小项目里很有意思。

但假如是要构建一个大型代码库、一个百人团队协作的工程体系，这种方法就不够用了。咱们正在探究生成式 AI 在整个开发流程中的定位。比方，现在咱们公司内部超越 70% 的 Pull Request 都是由 Claude 代码生成的。

但这也带来一个新问题：代码审查怎么做？你能够用 Claude 来审查 Claude 生成的代码，但这就像是“套娃”——每一层都仍是 AI。那咱们该怎么保持技术架构的可控性？是否会走入技术债的死胡同？这些问题，咱们还在摸索，相信整个职业都在摸索。

咱们内部感受到的最大变化之一是：AI 让工程功率大幅提升后，安排中“非工程环节”的低效变得愈加刺眼。比方，以前一个对齐会议只会耽误一个工程师一小时，现在或许等于耽误了“8 小时的 AI 产出”。

你会发现安排里的“瓶颈”并没有被 AI 优化，反而被扩大了。这导致产品流程中的不协调变得更显着、更痛苦。尽管模型能够总结会议、提出下一步主张，但它们现在还做不到真实协助咱们做出安排层面的决议计划。

从东西到协作：安排怎么习气 AI 年代的功率重构

Lauren：你说到 Anthropic 内部在广泛运用 Claude。能分享一下哪些运用方法是你觉得特别值得推广的吗？有没有一些你们曩昔半年内测验、并且觉得其他人也应该测验的用法？

Mike：我最喜爱看到的是——非技术团队开端自动运用大模型。比方销售团队，会用 Claude 来预备客户会议。他们一开端只是用公共版本，但当碰到详细妨碍时，咱们就会依据他们的需求开发专属东西。这种需求驱动的方法，十分有效。

不过坦率地说，即便在咱们这样的 AI 实验室，运用 AI 的能力也分布不均。有的职工用得十分熟练，高效地解决问题；而有的人还停留在传统流程。我自己则把 Claude 当成“思维合伙人”。

无论是写战略文档、拟定规划，仍是写绩效评语，我都习气先经过 Claude 进行一轮“脑力激荡”。就像有了 Copilot 之后，我在飞机上没有它会觉得“不会写代码了相同”，我现在也很难回到没有 AI 协助的写作状况了。

曩昔一年半里，我亲眼看到 Anthropic 内部的文化发生了变化。起初，许多人在写绩效评语、工作总结时会犹豫：我能用 Claude 生成初稿吗？这是不是“作弊”？但现在，咱们现已开端鼓舞这种用法了。

当然，用 AI 写完后你要自己校对，保证内容精确、有判断。但假如它能帮你节约两小时，让你腾出时间去做更重要的事——那为什么不必？咱们有一个内部东西，能够跨过整个 Slack 和所有内部文档运转。它支撑公共和私密频道，但大多数人更喜爱用“揭露版”，由于这意味着他们运用 AI 的进程是可见的。