阿里国际副总裁张凯夫：人类跟AI交流，告诉它不要做什么特别重要,阿里创始人张近东

“虽然OpenAI的Deep Research能力很强，但其适合做广泛的搜索和很长的报告。对于出口商品HS Code这样一个具体要求精确答案的任务，正确率却只有5%。我们在垂直数据库上，做了工具的减法，以及上下文工程。这个垂直Deep Research范式的HS Code判定工具，准确率可以做到80%。”

在2025世界人工智能大会期间跟媒体交流的时候，阿里国际副总裁、阿里国际AI Business负责人张凯夫如是说。

近半年来，包括Deep Research和Manus在内的各类智能体产品纷纷涌现，AI Agent俨然已经成为人工智能赛道的“必争之地”。近期以来，面向跨境贸易、跨境电商等实际场景，阿里国际数字商业集团推出了多款智能体应用产品，如智能退款agent、海关编码HScode agent以及在线招商agent等，在行业里获得关注。

7月26日，2025世界人工智能大会卓越人工智能引领者SAIL奖公布，阿里国际跨境电商AI解决方案Marco斩获本届SAIL之星，成为该领域的首个获得者。在同观察者网等媒体交流时，张凯夫多次谈到了AI Agent的发展。张凯夫认为，在很多实际功能上，垂直Agent的机会可能比垂直模型的机会还要大。

为了服务更多出海贸易商家，阿里国际AI Business开始做中国商家自己的“Deep Research”和垂直AI Agent。

“海关编码HScode agent，商家自己去匹配的准确率比较低，我们自己的Agent的正确率能到80%。”谈到研发经验，张凯夫表示，“先做减法，把数据限制好。只让Agent去关注相关部门的数据，而不是去互联网上乱搜；在Agent的思考进程里（thinking process），我们也使用了较为领先的模型和优质的案例。”

“人跟AI交流，给它定好约束条件，告诉它不要干什么特别重要。”

人类跟AI交流，告诉它不要做什么特别重要

“通用”和“垂直”的路线之争，一直是人工智能领域的母命题。

2023年，国内业界、学界围绕“做基础大模型，还是做垂直/行业大模型”进行了不少讨论。有的从业者认为，要抓紧基础大模型的研究，在底座模型上奋力追赶，尤其是要摆脱对国外开源模型的依赖；也有从业者认为，中国市场巨大、数据丰富，应用场景多元，可以用应用发展来带动模型进步，走一条“农村包围城市”的路线。

从DeepSeek搅动全球风云，到各行各业的专业大模型集体涌现，事实上，中国在这两条路上走得其实都不错。

近年来，人工智能领域的竞争开始从类GPT式的问答对话，向具体场景的智能体Agent迁移。从OpenAI的Deep Research，到轰动一时的Manus，能够调用多种能力，解决具体问题的智能体，成为行业竞相追逐的焦点。这也让“通用”和“垂直”的路线差异，再一次显现。

此时此刻，恰如彼时彼刻。

谈到行业观察，阿里国际副总裁、阿里国际AI Business负责人张凯夫对观察者网等媒体表示，AI应用领域已经随着行业从AIGC（生成式人工智能）走向了Agent（智能体）：以前的应用很多是AIGC，比如生成图、搞翻译、弄创意；今年更多是智能体，比如硅谷很火的BD agent，去找中小企业的联系方式；合规Agent，从厚厚的法律材料中寻找合规相关内容；比如营销Agent，根据客户需要去各种社交媒体发帖等等——这些过程都是自动的。

正如上文中所举的“海关编码案例”一样，在张凯夫看来，在Agent时代，很多专业领域的垂直Agent更有机会给人们带来的巨大收益；相反，通用型的AI Agent，表现反而没有那么好——OpenAI Deep Research不能搞定的专业工作，一个更加接近行业的垂直Agent可能就能处理得很好。

“最近硅谷很火的概念是context engineering（语境工程，或上下文工程），我们用一个模型，语境（context）非常重要。现在我们做智能体也是一样，语境的约束特别重要，有时候你喂给它（Agent）的东西越多越不好，你一定要非常有针对性地喂给它一些内容。”

张凯夫进一步表示，现在人类和AI交流，给它定好约束条件，告诉它不要干什么特别重要——包括AI coding（用AI写代码）。“想让AI干嘛，大家都可以表达，但真正地核心在于让AI明确，解决这个问题的时候不是要新建代码文件，而是找到对应的具体代码去修改。如果没有这个约束条件，代码库就会越来越大，到后面一塌糊涂。”

“我们做一个Agent也是一样的，语境缩减和精准选择是非常重要的一件事情。”

阿里国际AI Business算法负责人骆卫华补充道，Deep Research等通用性Agent，在解决很多通用性问答时是没问题的。甚至通过底座模型能力，可以通过prompt（关键提示词）调优来获得更好的结果。但是真正落地到非常专业、垂直的领域，通用型Agent是不够用的，比如在海关编码HScode上，它就是只有个位数的正确率。

“但是，如果我们通过引入更多的知识库——既包括我们收集的规则，也包括一些判例，甚至包括一些已有的case（案例）——有一些历史的、标注过的，正确的或者错误的case，用这些具体的专业知识去强化Agent。后面我们发现，他们对agent效果的提升是非常大的，是几十个点的提升。”

张凯夫认为，整体来看，垂直Agent的发展，对当前的国内外AI Agent生态是一个非常好的事情。在一些不需要那么精确的问题上，ChatBot或者Deep Research提供的能力，其实也够了；但在具体的问题上，在细分的领域上，实际上还有千千万的问题可以通过垂直Agent解决——这也是垂直Agent的机会。

日均10亿次调用，中国跨境电商成为第一个实现规模级AI应用的行业

相比于通用模型谈概念、讲参数，更贴近中国普通人经营实际的是，海关编码HScodeAgent等国产垂直Agent，正在增强中国中小企业的竞争力。数据显示，仅阿里国际旗下的AI Business团队，其提供的AI能力，可以帮中小企业解决60多个电商场景中遇到的问题，并在不同环节，带来1%-30%不等的显著提升。

正如我们之前访谈中所观察到的一样：越是中小企业，越能从AI的应用中获益。

公开资料显示，阿里国际的所有电商平台均已应用AI，已服务了超50万卖家，形成了以服务中小企业出海为核心，覆盖全球多元市场、多种电商模式的规模级AI应用。截至本月（2025年7月），阿里国际AI服务的调用量每两个月就会翻一番，平均日调用量已突破10亿次。这使得跨境电商成为第一个实现规模级AI应用的行业。

内部报告显示，过去一年，国内商家使用频次最高的AI功能分别是：图文翻译、图像识别并完善商品信息、营销文案生成。其中，翻译在去年底实现了全面从小模型向大模型的转换。在欧洲TOP语种中，因为翻译效果的提升，消费者满意度提升了30%；在SEO场景下，AI提供的SEO占到了整体SEO的近4成，未来有望达到一半甚至更高。

Agent时代，国产自研的AI产品，进一步完善了普通中国商家应对风险和变化的能力。

以海关编码HS code（Harmonized System Code）为例。HS Code是国际通用的商品分类编码体系，由世界海关组织（WCO）制定并维护。它通过统一的分类规则，将全球贸易商品分为5000多种品目，每个商品类别由6位数字编码表示，是国际贸易、海关清关、关税征收和贸易统计的基础工具。

HS Code在国际贸易中极其重要，关系到商家的合规和效率。但并非每个企业都能拥有自己的HS Code顾问。

AI Agent无疑为这个问题提供了更多解。例如阿里国际旗下的海关编码HS code agent，可以利用Reasoning模型（推理模型）的Planning（任务拆解&步骤规划）、Tool Use（工具调用）、Reflection（自我迭代）能力，通过多轮调用工具不断自主探索，从工作环境中获取更为精确的信息，并不断更新步骤，以得到导向正确答案的路径。

数据显示，在HS code agent的帮助下，跨境商家们对10位HS code填写准确率提升了23%。

不过，谈到AI Agent的“未来”，张凯夫表示，做“最通用的”和“最垂直的”，其实都是可以的——最重要的是研发者和使用者明确人类使用AI的场景。“做非常通用的智能体，类似OpenAI ChatBot，没有任何问题；或者做特别垂直的，把自己专业领域的知识弄得非常明白——比较让人害怕的是夹在中间，因为夹在中间没有壁垒。”

和大模型时代，很多从业者坚信“全球竞逐基础大模型的，最终只有个位数玩家”的研判类似；在对话的最后，张凯夫也关注理性竞争和投入的问题。“现在的行业格局，能做出特别通用的AI Agent的，全世界只有少数几家企业。庞大的机会依然在垂直领域。”

Top

1、铭记历史缅怀先烈|陈济桓：用血肉之躯书写不屈民族魂

2、外交部回应长和最新公告：中国政府将依法进行监管

3、“查大和尚”只是开始——宗教领域也该来场反腐风暴了

阿里国际副总裁张凯夫：人类跟AI交流，告诉它不要做什么特别重要,阿里创始人张近东

Top

小编推荐

相关阅读

网友评论