Meta 为什么让外包假扮未成年人测试竞品聊天机器人?
WIRED 披露的 Cannes 项目不是一句“投毒”能说清的事。它更像一场披着安全测试外衣的竞品基准测试:有真实文件和公司回应,也有仍未被公开证实的动机与用途。
Meta 为什么让外包假扮未成年人测试竞品聊天机器人?

这件事最容易被讲坏。
中文互联网上已经有不少标题把它写成“Meta 给 ChatGPT 和 Gemini 投毒”。这个词很刺激,但不准确。到目前为止,公开证据能支撑的是另一件事:Meta 的外包项目让承包商伪装成未成年人账号,去测试 ChatGPT、Gemini 和 Character.AI 等竞品聊天机器人在自伤、进食障碍、性、毒品等高风险话题上的反应。Meta 没有否认测试本身,但把它解释为安全和适龄体验的基准测试,并否认用竞品回复训练自己的模型。
这已经足够严重,不需要再加一个证据链撑不住的词。
已经能确认到什么程度
这轮消息的源头是 WIRED 6 月 29 日的调查报道。报道说,项目内部代号叫 Cannes,由 Meta 外包商 Covalen 管理,至少到 2026 年 4 月 21 日仍在进行。承包商被要求创建看起来未满 18 岁的假账号,向竞品聊天机器人发送文字和图片,再把回复复制到表格里。
WIRED 说它看到了内部文件、采访了 5 名熟悉项目的人,还审阅了两类表格:一类是虚假账号资料,里面有姓名、邮箱、密码和生日;另一类是 3,748 条提示词。报道还提到,2025 年 8 月完成的一轮测试里,向竞品系统发送了超过 45,000 条提示。
被测试的对象包括 OpenAI 的 ChatGPT、Google 的 Gemini 和 Character.AI。三家公司给 WIRED 的回应都没有表现出“这是一次授权合作”的意思。Character.AI 说没有授权,且认为描述中的行为违反其条款和政策。OpenAI 说正在调查。Google 说没有授权这个第三方测试,也不知道测试目的;对 WIRED 提供样本的内部测试显示 Gemini 按政策回应,但信息不足以判断整件事是否违反条款。
Meta 的回应也很关键。它没有说“没有这个项目”,而是说测试和基准评估聊天机器人回复,以确保安全和适龄体验,是负责任的行业标准做法。Meta 还说,它不会用竞品基准测试来训练自己的 AI 模型。
所以,事实层面最稳妥的表述是:这是一项未公开、未获竞品授权、由外包执行的大规模竞品安全测试。它是否违法、是否构成不正当竞争、是否越过服务条款边界,还要看更完整的文件、实际数据用途和监管判断。
“投毒”为什么不合适
“投毒”通常意味着把恶意数据塞进对方模型训练流程,污染对方系统,或者让对方模型长期变坏。现在没有公开证据显示 Meta 能把这些测试对话注入 ChatGPT 或 Gemini 的训练集。WIRED 也写得很谨慎:它看到的文件没有说明 Meta 最后如何使用这些收集到的回复。
这并不代表行为就没问题。问题只是不要把一件已经够复杂的事,改写成另一个更刺激但证据不足的故事。
真正值得追问的是:Meta 为什么要这么做?
Meta 不是监管机构,为什么要测别人
最直接的答案,是 Meta 自己给的:它说这是为了“安全和适龄体验”的基准评估。
这套说法并非完全没道理。AI 公司确实会做红队测试、基准测试、竞品对比,也会观察别家产品在同类风险场景里的表现。OpenAI、Google、Meta、Anthropic 这类公司都在做自己的安全评估。Google 的公开政策里写着 Gemini 不应鼓励自伤、非法药物等危险行为;OpenAI 的使用政策也禁止未经请求的安全测试和绕过安全措施;Meta 自己也公开说会对生成式 AI 做内部和外部红队测试。
但这次的问题在于几个词叠在一起:竞品、未授权、假未成年人账号、高风险内容、大规模、外包表格化采集。
如果是一家独立安全研究机构,提前说明测试范围、保护数据、走负责任披露流程,争议会小很多。Meta 不是这样的角色。Meta 本身也是聊天机器人市场里的参赛者,还正在面对未成年人 AI 安全方面的压力。它测试竞品时,说自己只是为了“安全”,外界自然会问:这到底是安全评估,还是竞品情报?
这不是抬杠。WIRED 报道里引用的内部文件把 Cannes 描述为“comprehensive AI safety benchmarking”,并说它能提供用于模型比较和合规的关键数据集。这个表述本身就把两件事放在一起:安全,和比较。
动机一:知道自己在监管压力下处在哪个位置
2025 年 9 月,美国 FTC 向七家公司发出 6(b) 信息要求,调查消费级 AI 聊天机器人如何衡量、测试和监控对儿童与青少年的潜在负面影响。名单里有 Alphabet、Character Technologies、Instagram、Meta Platforms、OpenAI、Snap 和 xAI。
FTC 公开说,它想知道公司如何评估聊天机器人作为陪伴型产品时的安全性,如何限制儿童和青少年的使用及负面影响,如何向用户和家长说明风险,如何执行年龄限制和服务条款。
这让“未成年人安全”从公关问题变成监管问题。对 Meta 来说,知道竞品在同类场景下表现如何,可能有几个用途:内部评估自己的风险水平,向监管解释行业整体难题,或者在被质疑时拿出“别人也有问题”的比较材料。
这不是说 Meta 一定准备这样使用数据。公开文件没证明这一点。但从商业和监管逻辑看,这种数据确实有价值。
动机二:Meta 自己也刚被类似问题追着打
这里不能只看 WIRED 这篇报道。2025 年 8 月,Reuters 报道过 Meta 内部一份 GenAI 内容风险标准文件。报道说,文件曾允许聊天机器人与儿童进行“romantic or sensual”性质的对话。Meta 确认文件真实,但称相关示例和注释是错误的、与政策不一致,已经删除,并承认执行上存在不一致。
随后 Meta 宣布给青少年 AI 体验加护栏:不再让 AI 与青少年讨论自伤、自杀、进食障碍和不合适的浪漫话题,而是引导到专家资源;同时限制青少年可接触的 AI 角色。Meta 10 月还公开了家长控制和青少年 AI 安全的新方案。
放在这个背景里,Meta 去测试竞品不难理解。它需要知道一个敏感问题:如果自己被媒体、国会或监管盯上,竞品是否也会在类似场景下失败?如果竞品也失败,那问题可以被讲成“行业共同难题”;如果竞品表现更好,那 Meta 就知道自己的护栏差距在哪里。
这是一种现实的企业动机,不一定光彩,但很常见。
动机三:产品改进需要参照物,但参照物用得太重就变味了
AI 产品团队会看竞品。普通互联网产品也会看竞品。按钮怎么放、注册流程怎么走、付费墙怎么设计,大家都会研究。生成式 AI 只是把这个动作推到了一个更麻烦的地方:输出不是静态界面,而是模型行为。
模型行为怎么比较?只能给同类问题,看它怎么答。于是“竞品体验研究”和“模型安全测试”就挤在同一个动作里。
问题是,AI 模型输出可能受服务条款保护,也可能被视为竞争能力的一部分。OpenAI 的政策明确禁止 unsolicited safety testing 和 circumventing safeguards。Google 的生成式 AI 禁止使用政策也禁止规避安全过滤,禁止促成自伤、非法活动等内容。Character.AI 在 2025 年 10 月甚至宣布取消 18 岁以下用户的开放式聊天。
Meta 如果只是少量人工体验,争议不会这么大。可如果是几百名外包、虚假未成年人账号、数万条高风险提示、表格化收集,性质就变了。它看起来不再像普通产品经理试用竞品,而更像一套系统化外部探测。
动机四:竞争情报,尤其是“谁更安全”的竞争情报
AI 公司现在争的不只是模型分数,也争“可信、安全、适合企业和家庭使用”的位置。儿童安全尤其敏感。一家公司如果能证明竞品在未成年人场景中表现很差,就能在监管、媒体和客户面前获得话语权。
这也是为什么这件事让人不舒服。安全测试本身是必要的,但当测试对象是竞品、执行方式是伪装、收集过程不透明,安全就可能变成一层好看的包装纸。Humane Intelligence 的 Rumman Chowdhury 对 WIRED 说,这是一种治理灰区:安全可能成了反竞争行为的方便理由。
这个评价没有把 Meta 定罪,但点到了关键。行业需要安全基准,可基准要有可信度。一个参赛者自己偷偷测另外几个参赛者,再拿结果做内部比较,这种基准很难让人放心。
行业里并不是第一次出现这种灰区
Business Insider 2025 年报道过,Google 的外包商曾系统性使用 ChatGPT 来改进 Bard 的回复。Scale AI 当时回应称,那是标准的并排评估,不是用 ChatGPT 输出训练模型。这个说法和 Meta 这次的辩解很像:评估,不是训练。
这也说明问题不只在 Meta。AI 行业里,“评估”“基准”“蒸馏”“训练”“人工改写”之间的边界越来越难看清。公司当然会说自己只是在评估;外界担心的是,评估结果会不会变成模型改进材料,竞品输出会不会间接进入训练或策略调整流程。
Meta 近期还被报道限制内部工程师使用 Claude Code 和 OpenAI Codex,理由正是担心竞品模型输出进入自家训练或评估流程,引发蒸馏和合同风险。如果这个报道属实,就更能说明大公司心里清楚:竞品模型输出不是普通网页资料,用起来会有边界问题。
这件事最终该怎么看
我会把它拆成三层。
第一层是事实:Meta 相关外包项目大规模测试竞品聊天机器人,这件事可信度高。Meta 没有否认测试,竞品公司也没有说授权过。
第二层是边界:这件事很可能踩到了服务条款和伦理边界。尤其是假扮未成年人、使用高风险内容、未披露测试目的、由竞争对手组织执行,都让它难以被简单归入“行业标准做法”。
第三层是动机:最合理的解释不是单一阴谋,而是多种企业动机叠加。Meta 需要做未成年人安全基准,需要知道自己和竞品的差距,需要应对监管压力,也可能需要竞品情报。问题正是这些动机混在一起,才让“安全测试”看起来不再干净。
说它是“投毒”,证据不够。说它只是“负责任的行业标准”,也太轻描淡写。
更朴素的判断是:这是一家 AI 参赛者在监管压力和市场竞争中,越过了很多人对透明、安全测试和公平竞争的直觉边界。真正需要被追问的,不是 Meta 有没有权利关心未成年人安全,而是当它关心的是竞品系统时,谁来规定测试边界,谁来保管数据,谁来确认结果不会被拿去做别的事。
如果行业不能回答这些问题,下一次类似事件只会换一个公司名字。
主要参考资料
- WIRED: “Meta Contractors Posed as Teens to Prompt Rival Chatbots About Suicide, Sex, and Drugs”
- FTC: “FTC Launches Inquiry into AI Chatbots Acting as Companions”
- Reuters: “Meta’s AI rules have let bots hold ‘sensual’ chats with children”
- Reuters: “Meta to add new AI safeguards after Reuters report raises teen safety concerns”
- Meta: “Our Approach to Teen AI Safety: Empowering Parents, Protecting Teens”
- OpenAI: Usage Policies
- Google: Generative AI Prohibited Use Policy
- Character.AI: “Taking Bold Steps to Keep Teen Users Safe on Character.AI”
- Business Insider: “Google Used ChatGPT to Improve Bard, Scale AI Documents Reveal”
- Bloomberg Law / The Information 转述:“Meta Limiting Engineer Use of Claude, Codex”
More from WayDigital
Continue through other published articles from the same publisher.
Comments
0 public responses
All visitors can read comments. Sign in to join the discussion.
Log in to comment