
新媒易动态
NEWS CENTER
NEWS CENTER
2025-06-07
开端的起点,其实是在咱们测验对接 Google Drive 和 GitHub。咱们发现这两个功能尽管本质上都是“把上下文引入模型”,但内部完成却彻底不同。咱们马上还要做集成,看起来又将是一次全新的、重复造轮子的开发。
所以我通常的形式是:做次之后,就能够总结出笼统层级,构成规范。而 MCP 便是这么来的。一开端,并不是从“咱们要拟定一个统一的协议”这种顶层规划开端的,而是两个工程师觉得这样做更合理,于是就动手去原型验证、重复迭代。
后来咱们花了许多精力把这个协议做得更好、更敞开,期望它不只是 Anthropic 内部运用的东西,而是真实有机会成为职业规范。现在,MCP 现已开端被更广泛地采用。
Lauren:从一个“自下而上”的主意出发,到现在落地扩展,你们是怎么培养并开展这个产品的?
Mike:我现在最重视的两个方向,都是环绕 MCP 展开的。第一是“履行能力”。MCP 开端的规划方针是引入上下文,现在咱们现已能够集成 GitHub、触发 Zapier 等操作。但更重要的是下一阶段,咱们期望模型能自动完成任务。它们不仅要能“了解”,还要能“行动”,自动履行工作流。
第二是“Agent 之间的协作”。咱们现在还处于十分早期的探究阶段,乃至还不适合立即建立规范。但很显着,未来不同的 Agents 会彼此交互、协作,乃至“雇佣”其他 Agent 来完成任务。这将构成一种新的 AI 经济体系。
咱们内部现已开端评论,比方未来是否会呈现“你的 Agent 为你雇佣另一个 Agent”的场景。这些主意令人兴奋。
Lauren:你们在编程方面现已做得很老练,看起来不只是“自下而上的小测验”。你是怎么看待这类产品的定位?你觉得现在做对了哪些事?
Mike:即使是编程这块,我仍然充满敬畏。许多立异都不是靠“战略”定出来的,而是由几个研讨员突破边界推动的。比方前面说到的 RL(强化学习)探究,便是从详细研讨中天然开展出来的。
咱们一直坚持的一点是:不仅仅盯着 Benchmark 分数,更重要的是——模型生成的代码用户是否喜爱用?它是否真实带来了好结果?这点咱们会持续强化。
“Vibe Coding”这个说法,其实不是咱们提出来的,但它的确有必定价值。你用模型生成代码时,或许会感受到某种“氛围”或许“灵感”,这在小项目里很有意思。
但假如是要构建一个大型代码库、一个百人团队协作的工程体系,这种方法就不够用了。咱们正在探究生成式 AI 在整个开发流程中的定位。比方,现在咱们公司内部超越 70% 的 Pull Request 都是由 Claude 代码生成的。
但这也带来一个新问题:代码审查怎么做?你能够用 Claude 来审查 Claude 生成的代码,但这就像是“套娃”——每一层都仍是 AI。那咱们该怎么保持技术架构的可控性?是否会走入技术债的死胡同?这些问题,咱们还在摸索,相信整个职业都在摸索。
咱们内部感受到的最大变化之一是:AI 让工程功率大幅提升后,安排中“非工程环节”的低效变得愈加刺眼。比方,以前一个对齐会议只会耽误一个工程师一小时,现在或许等于耽误了“8 小时的 AI 产出”。
你会发现安排里的“瓶颈”并没有被 AI 优化,反而被扩大了。这导致产品流程中的不协调变得更显着、更痛苦。尽管模型能够总结会议、提出下一步主张,但它们现在还做不到真实协助咱们做出安排层面的决议计划。
Lauren:你说到 Anthropic 内部在广泛运用 Claude。能分享一下哪些运用方法是你觉得特别值得推广的吗?有没有一些你们曩昔半年内测验、并且觉得其他人也应该测验的用法?
Mike:我最喜爱看到的是——非技术团队开端自动运用大模型。比方销售团队,会用 Claude 来预备客户会议。他们一开端只是用公共版本,但当碰到详细妨碍时,咱们就会依据他们的需求开发专属东西。这种需求驱动的方法,十分有效。
不过坦率地说,即便在咱们这样的 AI 实验室,运用 AI 的能力也分布不均。有的职工用得十分熟练,高效地解决问题;而有的人还停留在传统流程。我自己则把 Claude 当成“思维合伙人”。
无论是写战略文档、拟定规划,仍是写绩效评语,我都习气先经过 Claude 进行一轮“脑力激荡”。就像有了 Copilot 之后,我在飞机上没有它会觉得“不会写代码了相同”,我现在也很难回到没有 AI 协助的写作状况了。
曩昔一年半里,我亲眼看到 Anthropic 内部的文化发生了变化。起初,许多人在写绩效评语、工作总结时会犹豫:我能用 Claude 生成初稿吗?这是不是“作弊”?但现在,咱们现已开端鼓舞这种用法了。
当然,用 AI 写完后你要自己校对,保证内容精确、有判断。但假如它能帮你节约两小时,让你腾出时间去做更重要的事——那为什么不必?咱们有一个内部东西,能够跨过整个 Slack 和所有内部文档运转。它支撑公共和私密频道,但大多数人更喜爱用“揭露版”,由于这意味着他们运用 AI 的进程是可见的。