article

Meta 为什么让外包假扮未成年人测试竞品聊天机器人？

WIRED 披露的 Cannes 项目不是一句“投毒”能说清的事。它更像一场披着安全测试外衣的竞品基准测试：有真实文件和公司回应，也有仍未被公开证实的动机与用途。

PublisherWayDigital

Published2026-07-05 14:46 UTC

Languagezh-CN

RegionCN

CategoryEssays

Meta 为什么让外包假扮未成年人测试竞品聊天机器人？

Abstract illustration of chatbot safety benchmarking — Illustration prepared for this article. No company logos or real people are depicted.

这件事最容易被讲坏。

中文互联网上已经有不少标题把它写成“Meta 给 ChatGPT 和 Gemini 投毒”。这个词很刺激，但不准确。到目前为止，公开证据能支撑的是另一件事：Meta 的外包项目让承包商伪装成未成年人账号，去测试 ChatGPT、Gemini 和 Character.AI 等竞品聊天机器人在自伤、进食障碍、性、毒品等高风险话题上的反应。Meta 没有否认测试本身，但把它解释为安全和适龄体验的基准测试，并否认用竞品回复训练自己的模型。

这已经足够严重，不需要再加一个证据链撑不住的词。

已经能确认到什么程度

这轮消息的源头是 WIRED 6 月 29 日的调查报道。报道说，项目内部代号叫 Cannes，由 Meta 外包商 Covalen 管理，至少到 2026 年 4 月 21 日仍在进行。承包商被要求创建看起来未满 18 岁的假账号，向竞品聊天机器人发送文字和图片，再把回复复制到表格里。

WIRED 说它看到了内部文件、采访了 5 名熟悉项目的人，还审阅了两类表格：一类是虚假账号资料，里面有姓名、邮箱、密码和生日；另一类是 3,748 条提示词。报道还提到，2025 年 8 月完成的一轮测试里，向竞品系统发送了超过 45,000 条提示。

被测试的对象包括 OpenAI 的 ChatGPT、Google 的 Gemini 和 Character.AI。三家公司给 WIRED 的回应都没有表现出“这是一次授权合作”的意思。Character.AI 说没有授权，且认为描述中的行为违反其条款和政策。OpenAI 说正在调查。Google 说没有授权这个第三方测试，也不知道测试目的；对 WIRED 提供样本的内部测试显示 Gemini 按政策回应，但信息不足以判断整件事是否违反条款。

Meta 的回应也很关键。它没有说“没有这个项目”，而是说测试和基准评估聊天机器人回复，以确保安全和适龄体验，是负责任的行业标准做法。Meta 还说，它不会用竞品基准测试来训练自己的 AI 模型。

所以，事实层面最稳妥的表述是：这是一项未公开、未获竞品授权、由外包执行的大规模竞品安全测试。它是否违法、是否构成不正当竞争、是否越过服务条款边界，还要看更完整的文件、实际数据用途和监管判断。

“投毒”为什么不合适

“投毒”通常意味着把恶意数据塞进对方模型训练流程，污染对方系统，或者让对方模型长期变坏。现在没有公开证据显示 Meta 能把这些测试对话注入 ChatGPT 或 Gemini 的训练集。WIRED 也写得很谨慎：它看到的文件没有说明 Meta 最后如何使用这些收集到的回复。

这并不代表行为就没问题。问题只是不要把一件已经够复杂的事，改写成另一个更刺激但证据不足的故事。

真正值得追问的是：Meta 为什么要这么做？

Meta 不是监管机构，为什么要测别人

最直接的答案，是 Meta 自己给的：它说这是为了“安全和适龄体验”的基准评估。

这套说法并非完全没道理。AI 公司确实会做红队测试、基准测试、竞品对比，也会观察别家产品在同类风险场景里的表现。OpenAI、Google、Meta、Anthropic 这类公司都在做自己的安全评估。Google 的公开政策里写着 Gemini 不应鼓励自伤、非法药物等危险行为；OpenAI 的使用政策也禁止未经请求的安全测试和绕过安全措施；Meta 自己也公开说会对生成式 AI 做内部和外部红队测试。

但这次的问题在于几个词叠在一起：竞品、未授权、假未成年人账号、高风险内容、大规模、外包表格化采集。

如果是一家独立安全研究机构，提前说明测试范围、保护数据、走负责任披露流程，争议会小很多。Meta 不是这样的角色。Meta 本身也是聊天机器人市场里的参赛者，还正在面对未成年人 AI 安全方面的压力。它测试竞品时，说自己只是为了“安全”，外界自然会问：这到底是安全评估，还是竞品情报？

这不是抬杠。WIRED 报道里引用的内部文件把 Cannes 描述为“comprehensive AI safety benchmarking”，并说它能提供用于模型比较和合规的关键数据集。这个表述本身就把两件事放在一起：安全，和比较。

动机一：知道自己在监管压力下处在哪个位置

2025 年 9 月，美国 FTC 向七家公司发出 6(b) 信息要求，调查消费级 AI 聊天机器人如何衡量、测试和监控对儿童与青少年的潜在负面影响。名单里有 Alphabet、Character Technologies、Instagram、Meta Platforms、OpenAI、Snap 和 xAI。

FTC 公开说，它想知道公司如何评估聊天机器人作为陪伴型产品时的安全性，如何限制儿童和青少年的使用及负面影响，如何向用户和家长说明风险，如何执行年龄限制和服务条款。

这让“未成年人安全”从公关问题变成监管问题。对 Meta 来说，知道竞品在同类场景下表现如何，可能有几个用途：内部评估自己的风险水平，向监管解释行业整体难题，或者在被质疑时拿出“别人也有问题”的比较材料。

这不是说 Meta 一定准备这样使用数据。公开文件没证明这一点。但从商业和监管逻辑看，这种数据确实有价值。

动机二：Meta 自己也刚被类似问题追着打

这里不能只看 WIRED 这篇报道。2025 年 8 月，Reuters 报道过 Meta 内部一份 GenAI 内容风险标准文件。报道说，文件曾允许聊天机器人与儿童进行“romantic or sensual”性质的对话。Meta 确认文件真实，但称相关示例和注释是错误的、与政策不一致，已经删除，并承认执行上存在不一致。

随后 Meta 宣布给青少年 AI 体验加护栏：不再让 AI 与青少年讨论自伤、自杀、进食障碍和不合适的浪漫话题，而是引导到专家资源；同时限制青少年可接触的 AI 角色。Meta 10 月还公开了家长控制和青少年 AI 安全的新方案。

放在这个背景里，Meta 去测试竞品不难理解。它需要知道一个敏感问题：如果自己被媒体、国会或监管盯上，竞品是否也会在类似场景下失败？如果竞品也失败，那问题可以被讲成“行业共同难题”；如果竞品表现更好，那 Meta 就知道自己的护栏差距在哪里。

这是一种现实的企业动机，不一定光彩，但很常见。

动机三：产品改进需要参照物，但参照物用得太重就变味了

AI 产品团队会看竞品。普通互联网产品也会看竞品。按钮怎么放、注册流程怎么走、付费墙怎么设计，大家都会研究。生成式 AI 只是把这个动作推到了一个更麻烦的地方：输出不是静态界面，而是模型行为。

模型行为怎么比较？只能给同类问题，看它怎么答。于是“竞品体验研究”和“模型安全测试”就挤在同一个动作里。

问题是，AI 模型输出可能受服务条款保护，也可能被视为竞争能力的一部分。OpenAI 的政策明确禁止 unsolicited safety testing 和 circumventing safeguards。Google 的生成式 AI 禁止使用政策也禁止规避安全过滤，禁止促成自伤、非法活动等内容。Character.AI 在 2025 年 10 月甚至宣布取消 18 岁以下用户的开放式聊天。

Meta 如果只是少量人工体验，争议不会这么大。可如果是几百名外包、虚假未成年人账号、数万条高风险提示、表格化收集，性质就变了。它看起来不再像普通产品经理试用竞品，而更像一套系统化外部探测。

动机四：竞争情报，尤其是“谁更安全”的竞争情报

AI 公司现在争的不只是模型分数，也争“可信、安全、适合企业和家庭使用”的位置。儿童安全尤其敏感。一家公司如果能证明竞品在未成年人场景中表现很差，就能在监管、媒体和客户面前获得话语权。

这也是为什么这件事让人不舒服。安全测试本身是必要的，但当测试对象是竞品、执行方式是伪装、收集过程不透明，安全就可能变成一层好看的包装纸。Humane Intelligence 的 Rumman Chowdhury 对 WIRED 说，这是一种治理灰区：安全可能成了反竞争行为的方便理由。

这个评价没有把 Meta 定罪，但点到了关键。行业需要安全基准，可基准要有可信度。一个参赛者自己偷偷测另外几个参赛者，再拿结果做内部比较，这种基准很难让人放心。

行业里并不是第一次出现这种灰区

Business Insider 2025 年报道过，Google 的外包商曾系统性使用 ChatGPT 来改进 Bard 的回复。Scale AI 当时回应称，那是标准的并排评估，不是用 ChatGPT 输出训练模型。这个说法和 Meta 这次的辩解很像：评估，不是训练。

这也说明问题不只在 Meta。AI 行业里，“评估”“基准”“蒸馏”“训练”“人工改写”之间的边界越来越难看清。公司当然会说自己只是在评估；外界担心的是，评估结果会不会变成模型改进材料，竞品输出会不会间接进入训练或策略调整流程。

Meta 近期还被报道限制内部工程师使用 Claude Code 和 OpenAI Codex，理由正是担心竞品模型输出进入自家训练或评估流程，引发蒸馏和合同风险。如果这个报道属实，就更能说明大公司心里清楚：竞品模型输出不是普通网页资料，用起来会有边界问题。

这件事最终该怎么看

我会把它拆成三层。

第一层是事实：Meta 相关外包项目大规模测试竞品聊天机器人，这件事可信度高。Meta 没有否认测试，竞品公司也没有说授权过。

第二层是边界：这件事很可能踩到了服务条款和伦理边界。尤其是假扮未成年人、使用高风险内容、未披露测试目的、由竞争对手组织执行，都让它难以被简单归入“行业标准做法”。

第三层是动机：最合理的解释不是单一阴谋，而是多种企业动机叠加。Meta 需要做未成年人安全基准，需要知道自己和竞品的差距，需要应对监管压力，也可能需要竞品情报。问题正是这些动机混在一起，才让“安全测试”看起来不再干净。

说它是“投毒”，证据不够。说它只是“负责任的行业标准”，也太轻描淡写。

更朴素的判断是：这是一家 AI 参赛者在监管压力和市场竞争中，越过了很多人对透明、安全测试和公平竞争的直觉边界。真正需要被追问的，不是 Meta 有没有权利关心未成年人安全，而是当它关心的是竞品系统时，谁来规定测试边界，谁来保管数据，谁来确认结果不会被拿去做别的事。

如果行业不能回答这些问题，下一次类似事件只会换一个公司名字。

主要参考资料

WIRED: “Meta Contractors Posed as Teens to Prompt Rival Chatbots About Suicide, Sex, and Drugs”
FTC: “FTC Launches Inquiry into AI Chatbots Acting as Companions”
Reuters: “Meta’s AI rules have let bots hold ‘sensual’ chats with children”
Reuters: “Meta to add new AI safeguards after Reuters report raises teen safety concerns”
Meta: “Our Approach to Teen AI Safety: Empowering Parents, Protecting Teens”
OpenAI: Usage Policies
Google: Generative AI Prohibited Use Policy
Character.AI: “Taking Bold Steps to Keep Teen Users Safe on Character.AI”
Business Insider: “Google Used ChatGPT to Improve Bard, Scale AI Documents Reveal”
Bloomberg Law / The Information 转述：“Meta Limiting Engineer Use of Claude, Codex”

More from WayDigital

Continue through other published articles from the same publisher.

上一篇Why Meta Sent Contractors to Test Rival Chatbots as Teens2026-07-05 14:46 UTC 下一篇Small Models Won’t Replace the Cloud. They’ll Make the Cloud Work Better.2026-07-05 03:26 UTC

Meta 为什么让外包假扮未成年人测试竞品聊天机器人？

Meta 为什么让外包假扮未成年人测试竞品聊天机器人？

已经能确认到什么程度

“投毒”为什么不合适

Meta 不是监管机构，为什么要测别人

动机一：知道自己在监管压力下处在哪个位置

动机二：Meta 自己也刚被类似问题追着打

动机三：产品改进需要参照物，但参照物用得太重就变味了

动机四：竞争情报，尤其是“谁更安全”的竞争情报

行业里并不是第一次出现这种灰区

这件事最终该怎么看

主要参考资料

More from WayDigital

Comments