托管式 Agent 成为主流方向
AI Agent 正从技术概念快步走向生产应用。然而当开发者试图将原型推向生产环境时往往发现从跑通 Demo到稳定上线每一步都是对基础设施的真实考验。更聪明的模型解决不了这道鸿沟——企业真正需要的是一个能全面承接底层复杂性的基础设施平台。这正是阿里云 AgentRun 的出发点。 自 2025 年 12 月正式发布以来AgentRun 以生态开放、灵活组装为设计理念为 AI Agent 提供从开发、部署到运维的全生命周期管理。在已落地的企业客户中平均 TCO 降低 60%。与此同时托管式 Agent 正在成为行业共识。Anthropic 推出 Claude Managed Agents进一步印证了这一方向的确定性——越来越多的平台开始把 Agent Loop、沙箱隔离、会话管理这些底层复杂性从开发者手里接管过来开发者只需声明需要一个什么样的 Agent剩下的推理、工具调用、上下文管理交给平台承接。这套托管范式的核心设计已逐渐收敛通常围绕四个概念展开Agent 定义声明模型、系统提示词、可用工具创建一次多个会话复用运行环境Agent 的容器模板定义网络策略、文件系统等隔离边界会话将 Agent 与运行环境绑定代表一次完整的任务执行事件流会话内的消息通道实时推送用户输入、模型回复、工具调用一次典型的执行流程是声明 Agent → 初始化运行环境 → 创建会话 → 发送消息 → 接收事件流。作为一站式 Agentic AI 基础设施平台阿里云 AgentRun 在这条主线上走得更深模型无关是基础——通义千问、DeepSeek、智谱AI、自部署开源模型均可自由接入企业级能力是重点投入——数据不出域、多租户隔离、全链路可观测、Serverless 原生弹性。这些在真实落地中反复被客户验证的能力构成了 AgentRun 区别于通用托管产品的核心差异。二、AgentRun 如何定义托管 AgentAgentRun 的几个核心抽象可以和上述托管范式对应起来超级 Agent内置 Agent Loop 的可执行对象对应Agent 定义 内置运行时Agent Runtime 与 Sandbox运行环境和隔离沙箱底层是阿里云函数计算FC会话管理一次任务对应一个会话持有上下文、中间状态、事件流MCP 工具 与 Skills 市场工具级扩展 任务级扩展两条路径并存模型服务 ModelService模型代理层解耦 Agent 逻辑和模型选择记忆与知识库长期记忆和 RAG 检索作为 Agent 常驻上下文使用流程上和其他托管平台一致声明一个超级 Agent、创建会话、发送消息、接收事件流。差异落在能力拆分的粒度、模型接入方式、以及企业场景的深度支持上。三、AgentRun 拥有的差异化能力是什么Claude Managed Agents 把 Agent 托管需要的几件核心事情做齐了Agent 定义、Environment 容器沙箱、Session 会话、Events 事件流再加上绑定 Claude 模型与一组内置工具Bash、文件操作、Web 搜索。这套组合足以支撑大多数通用场景也把托管 Agent 的产品范式清晰地立了起来。AgentRun 在同一条主线上因为定位是云平台视角的运行时在四个地方做了更深一些的投入运行时与沙箱基于阿里云函数计算 FC启动到毫秒级内核级隔离下能装下代码解释器、浏览器自动化、Computer Use 这类更重的能力模型服务做到厂商无关通义千问、DeepSeek、OpenAI、自部署开源模型可以自由切换和组合工具与技能同时支持 MCP 和 Skills 市场覆盖工具级和任务级两个粒度会话与记忆把长期记忆和知识库作为 Agent 常驻的一等上下文业务层不用再自建一套。3.1 Agent运行时与Sandbox更低的隔离层级Agent 运行时与 Sandbox 底层基于阿里云函数计算FC。每个沙箱与运行时独立内核启动在毫秒级。这样设计有两个原因一是多租户隔离更彻底。不同租户、不同会话的沙箱从内核就是隔离的不存在容器逃逸的风险面。二是沙箱能装下更重的能力。代码解释器需要挂 Jupyter Kernel、浏览器自动化需要 Headless Chromium、GUI 自动化需要完整桌面环境。这些在 MicroVM 里做资源控制和兼容性空间更大。目前 Sandbox 内置的能力Bash 与文件系统完整 Shell 环境文件上传下载双向打通代码解释器Python、Node.js、Java 的 Jupyter Kernel执行状态跨多轮保留浏览器自动化基于 CDP over WebSocket支持完整 Chromium 控制Computer Use桌面级 GUI 操作能力3.2 厂商无关的模型服务将模型选择留给用户AgentRun 不绑定特定模型厂商。通过模型服务层同一个 Agent 可以在通义千问、DeepSeek、OpenAI、自部署开源模型之间切换也可以按任务类型路由到不同模型。这是云平台视角产品的一个自然选择。面向不同行业和合规要求的客户模型无关是一种基础能力成本敏感场景优先走小模型必要时 Fallback 到大模型代码生成、长文本理解、多模态处理各自适合的模型不同合规场景对数据出境有硬性要求只能使用境内或自部署模型AgentRun的模型服务统一承载这些策略同时提供 Token 级限流、多模型 Fallback、调用级成本归因。业务代码不感知底层模型变化切换模型是配置层面的事。3.3 MCP 与 Skills工具级扩展与任务级复用工具是 Agent 完成实际任务的双手。AgentRun 提供两条互补的路径MCP原生支持标准协议生态里已有的 MCP Server 直接接入粒度小、组合自由Skills 市场任务级能力单元上千种经过测试的预置技能网页检索、文档解析、数据可视化、SaaS API 对接一次勾选挂到 Agent 上使用私有 Skills 托管同样打通支持上传 Python / Node.js 包或用 Markdown 声明式语法描述AI 自动生成脚手架托管时做代码安全扫描。来源不确定的 Skill 可挂到独立 Sandbox 运行异常被 MicroVM 隔离在沙箱内。Skills 基于 Serverless 按需加载配合find-agentrun-skills工具链打通本地开发与云端托管。3.4 会话与记忆会话事件流通过 SSE 推送前端或上游应用可以实时拿到 Agent 的回复、工具调用、思考过程。会话的上下文、中间状态、文件产物都会持久化支持后续恢复。记忆独立于会话。短期记忆跟随会话长期记忆跨会话保留用户偏好、历史结论、跨任务的知识知识库承载 RAG 场景的完整链路文档切片、向量化、检索召回。多轮对话或长时间任务这类需求业务层不用再自己搭一套。四、企业级场景AgentRun 的深水区能力作为建立在阿里云上的托管 Agent 产品AgentRun 的定位决定了企业级能力必须做深。这一节集中展开几个方向也是我们在项目落地中反复被客户提到的关键点。4.1 数据不出域VPC 与专有网络金融、政务、医疗类行业对数据主权的要求非常硬。Agent 不能把企业内网数据传给外部服务同时又需要访问内部数据库、中间件和内部 API。AgentRun 基于函数计算的网络能力提供三种模式PUBLIC完全公网访问PRIVATE完全 VPC 内不接公网混合既能访问公网也能打通 VPCAgent 可以直接访问企业 VPC 内的数据库、中间件、内部 API请求链路在阿里云内部闭环。专有云和边缘部署形态也在规划中。4.2 统一凭证管理Agent 调用外部 API 时凭证是绕不开的一环。如果留给业务层自行处理AK/SK 和 Token 很容易散落在 Prompt 和工具代码里难以审计和轮换。AgentRun 把 Credential 作为一级资源支持 OAuth2、API Key、JWT、Basic Auth、AK-SK、自定义 Header 等多种类型。凭证统一创建、绑定到工具或技能上、按需禁用和轮换传输与存储全程加密。这个抽象的价值在落地中体现得很直接出问题时凭证可以快速禁用审计要求来时操作链路有据可查不同环境之间的凭证隔离也不用靠手工维护。4.3 RAM 集成与多租户AgentRun 对接阿里云 RAM 权限体系。不同子账号、不同团队看到的 Agent、工具、模型资源各自隔离权限粒度可细到资源级。多租户场景下每个租户的会话、文件、凭证在数据层完全隔离运行时由 MicroVM 沙箱保证隔离。这套能力对于 SaaS 类产品或大型集团内部多业务线共用 Agent 平台的场景尤其重要。4.4 可观测性OpenTelemetry 全链路Agent 在生产环境的问题大多不是代码 Bug而是 Prompt 触发了意外行为、模型输出不稳定、工具链路某一环超时。没有全链路 Tracing排查非常困难。AgentRun 集成 OpenTelemetry生产环境可以看到每一次模型调用的耗时、Token 消耗、命中的模型每个工具调用的入参、出参、延迟任务整体成本按 Agent、会话、工具维度归因数据接入日志服务后可以直接用于告警、成本报表、性能分析。对于大规模使用的 Agent 系统这一层往往决定了能不能规模化。4.5 模型治理ModelService 除了模型无关还承担了企业级的模型治理职责多 Key 负载均衡避免单个 Key 触发限流主备模型 Fallback一个模型不可用时自动切换Token 级限流和并发控制防止成本失控调用级成本归因能追溯每一次推理的费用对规模化使用模型的企业来说这一层是刚需。没有它配额被耗尽和成本失控都是时间问题。4.6 Serverless 原生弹性

相关新闻

一句话生成漫剧、漫画、小说:AI全模态创作平台实测,创作效率提升10倍

一句话生成漫剧、漫画、小说:AI全模态创作平台实测,创作效率提升10倍

前言 上篇文章我拆解了一句话生成小说的全流程,很多读者留言问:能不能直接出漫画?能不能自动合成漫剧? 答案是:能。同一个平台,同一套工作流。 极栈创作平台(极栈创作平台 - JZCloud&#xf…

2026/6/26 4:17:40阅读更多 →
HTML5 Boilerplate:活了 10 年的前端模板,Star 5.7 万

HTML5 Boilerplate:活了 10 年的前端模板,Star 5.7 万

文章目录HTML5 Boilerplate:活了 10 年的前端模板,Star 5.7 万它到底包含什么为什么能火这么久实际用起来怎么样不过也要想清楚HTML5 Boilerplate:活了 10 年的前端模板,Star 5.7 万 最近翻 GitHub 的时候看到一个项目&#xff0…

2026/6/26 4:17:40阅读更多 →
Zabbix、Prometheus、Grafana、Nightingale,四个监控如何选型?

Zabbix、Prometheus、Grafana、Nightingale,四个监控如何选型?

调研监控系统的时候,通常会看到这四个产品:Prometheus、Grafana、Zabbix、Nightingale,对新手而言,是个选型难题。本文尝试分别解释其适用场景和优缺点,当然了,每个人的认知都有局限,仅供大家参…

2026/6/26 4:17:40阅读更多 →
高防IP一个月6500还只是起步?聊聊小团队能用的DDoS防护方案

高防IP一个月6500还只是起步?聊聊小团队能用的DDoS防护方案

先交代一下背景。我们做海外工具站的,日活不算大,几万的样子,但架不住被同行和黑产轮流盯上。 去年被一次100G的UDP Flood直接打穿,免费清洗就是个摆设,业务停了6个小时。老板批了预算让我找防护,我花了一个…

2026/6/26 4:57:42阅读更多 →
运维转大模型:把学习路线变成作品集

运维转大模型:把学习路线变成作品集

先说一句实在的:别急着背概念,先看它在真实项目里到底解决什么问题。摘要这篇面向想从运维、SRE 转向 AI 自动化平台的工程师,但不会把“运维转大模型:把学习路线变成作品集”写成概念清单。我会按运维工程化实战教程的思路&#…

2026/6/26 4:57:42阅读更多 →
3种方法解决macOS上Intel无线网卡驱动问题:itlwm项目完全指南

3种方法解决macOS上Intel无线网卡驱动问题:itlwm项目完全指南

3种方法解决macOS上Intel无线网卡驱动问题:itlwm项目完全指南 【免费下载链接】itlwm Intel Wi-Fi Drivers for macOS 项目地址: https://gitcode.com/gh_mirrors/it/itlwm 你是否正在为macOS上Intel无线网卡没有官方驱动而烦恼?想要在Mac系统上使…

2026/6/26 4:57:42阅读更多 →
李丰从“钱”角度剖析2026 AI热潮:成因、资本现状与未来走向几何?

李丰从“钱”角度剖析2026 AI热潮:成因、资本现状与未来走向几何?

2026 WAVES大会聚焦AI:从“钱”的角度剖析热潮成因、资本现状与未来走向2026年,创投圈的浪潮再次翻涌:AI从技术概念走进产业深水区,硬科技创业从“小众赛道”变成“主流共识”,年轻的创业者们正在用代码和双手&#xf…

2026/6/26 4:57:42阅读更多 →
7步终结Windows运行库依赖难题:VisualCppRedist AIO深度解析与实战指南

7步终结Windows运行库依赖难题:VisualCppRedist AIO深度解析与实战指南

7步终结Windows运行库依赖难题:VisualCppRedist AIO深度解析与实战指南 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 当你在Windows系统上尝试运行…

2026/6/26 4:57:42阅读更多 →
Rust 异步运行时的设计哲学

Rust 异步运行时的设计哲学

Rust 异步运行时的设计哲学 Rust 的异步运行时设计体现了其核心目标:高效、安全、灵活。在现代高并发场景下,异步编程成为提升性能的关键手段,而 Rust 通过独特的运行时设计,既避免了传统回调地狱的复杂性,又确保了零…

2026/6/26 4:52:42阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/25 9:39:54阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/26 4:15:25阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/25 9:01:34阅读更多 →
HPE (慧与) 服务器专用 ESXi 9 全套官方定制资源详解 + 完整部署升级教程

HPE (慧与) 服务器专用 ESXi 9 全套官方定制资源详解 + 完整部署升级教程

一、前言:企业运维痛点与资源价值自博通收购 VMware 之后,原 VMware 公开免费下载渠道全面关闭,企业运维人员想要获取适配 HPE 慧与服务器的 ESXi 9 原厂镜像,必须注册博通账号、绑定有效授权才能下载,无授权账号无法获…

2026/6/26 0:02:15阅读更多 →
Kotlin的@JvmStatic与@JvmField:与Java互操作的注解

Kotlin的@JvmStatic与@JvmField:与Java互操作的注解

Kotlin作为一门现代编程语言,与Java的互操作性一直是其核心优势之一。为了让Kotlin代码能够无缝对接Java,Kotlin提供了多种注解来优化互操作体验,其中JvmStatic和JvmField是两个关键注解。它们分别用于解决静态成员和字段在Java中的访问问题&…

2026/6/26 0:02:15阅读更多 →
深入解析musl libc中的mmap实现源码

深入解析musl libc中的mmap实现源码

最近在阅读musl libc源码时,发现其mmap的实现非常精妙,特分享给大家。 一、代码整体结构 这段代码实现了__mmap函数,并通过weak_alias导出为mmap。这是典型的musl libc风格——提供弱符号以便用户可以重写。 weak_alias(__mmap, mmap); 二…

2026/6/26 0:02:15阅读更多 →