Anthropic在4月发布博客称,其AI模型Claude Mythos可发现数千个“高危”网络安全漏洞,且能力超过人类专家;公司同时警告,若被滥用,相关能力可能对经济、公共安全和国家安全造成严重影响。 [1]

Anthropic表示,已与40多个组织建立合作,正紧急修补Mythos识别出的漏洞。 [1] 该公司把这项能力描述为防御网络攻击的重要工具,但外界对其说法并不买账。 [1]

AI Now Institute的Heidy Khlaaf质疑Mythos的“优越性”主张,理由是Anthropic没有披露误报率,也没有给出与现有工具的对比基准。 [1] 批评者认为,在缺少这些数据的情况下,很难判断该模型是否真比使用多年的安全工具更有效。 [1]

围绕AI风险的争论并不新鲜。2023年,包括OpenAI首席执行官山姆·奥特曼、比尔·盖茨和Google DeepMind首席执行官德米斯·哈萨比斯在内的数百名科技人士曾联名呼吁,把AI风险缓解列为全球优先事项。 [1] 奥特曼也曾批评Anthropic在AI问题上搞“恐惧营销”。 [1]

围绕这家公司的表述,学界和业界都在争论动机与效果。香农·瓦洛尔说,如果把这些技术描绘成“几乎具有超自然危险性的东西”,公众会觉得无力,仿佛唯一能依靠的只剩这些公司本身。 [1] 艾蜜莉·本德则说,一些公司在提醒人们关注“会毁灭人类的坏东西”时,可能借机转移对环境破坏、劳工剥削和社会制度受损的注意力。 [1]

Anthropic没有说明Mythos何时会面向更大范围发布,外界则有猜测称,算力成本可能迫使公司推迟大规模上线。 [1]