今日概要
2026年4月13日,AI安全与主权成为绝对焦点。Anthropic发布Claude Mythos Preview——一款被公司自评"太危险不能公开"的网络安全AI模型,已发现数万个零日漏洞,并联合12家科技巨头推出Project Glasswing进行系统性防御。与此同时,Z.ai开源GLM-5.1(7540亿参数),在SWE-Bench Pro上超越Opus 4.6和GPT-5.4,开源模型长程自主能力突破临界点。Nvidia在GTC 2026发布企业级AI Agent平台,17家软件巨头入局。Anthropic宣布从4月4日起禁止第三方Agent工具使用订阅额度,引发开源社区强烈反弹。OpenAI因Axios供应链攻击泄漏macOS签名证书,正全面更换。
🤖 技术突破
Anthropic发布危险AI模型Claude Mythos Preview:太危险不公开,先给防御者用
2026年4月7日,Anthropic发布Project Glasswing,核心是Claude Mythos Preview——一款被公司自评"太危险不能公开"的通用前沿AI模型。该模型已在所有主流操作系统和浏览器中发现数万个高危零日漏洞,并自主开发了相关漏洞利用程序,全部过程无人工参与。
三大标志性发现:①在号称"最安全操作系统"的OpenBSD中发现存在27年的远程崩溃漏洞;②在FFmpeg中发现16年间5百万次自动化测试从未捕获的漏洞;③在Linux内核中自主链接多个漏洞实现从普通用户权限到完全机器控制的提权。所有漏洞均已上报并修复。
Anthropic已与AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、Nvidia、Palo Alto Networks共12家巨头启动合作,承诺投入1亿美元Claude使用额度和400万美元捐款。Mythos Preview在CyberGym基准得分83.1%(Opus 4.6仅66.6%),SWE-bench Pro达77.8%(Opus 4.6仅53.4%)。
来源:VentureBeat | Anthropic官方
Z.ai开源GLM-5.1:7540亿参数,8小时自主任务,超越Opus 4.6
2026年4月,Z.ai发布GLM-5.1(MIT许可证),成为开源社区首个可验证的长程自主任务模型。该模型是7540亿参数的MoE模型,在单个任务上可持续自主工作8小时,跨越1700步工具调用,而去年最好水平仅约20步。
在VectorDBBench中,GLM-5.1通过655次迭代、6000多次工具调用,将向量数据库性能从3547 QPS优化至21500 QPS(提升6倍),全程无需人工介入。在KernelBench Level 3中,实现3.6倍加速,显著超越前代GLM-5的2.6倍天花板,虽仍低于Claude Opus 4.6的4.2倍,但已是开源最强。
定价方面,GLM-5.1 API价格为$1.40/百万输入token、$4.40/百万输出token,定位低于GPT-5.4($17.5)和Opus 4.6($30)。
来源:VentureBeat | Z.ai
Nvidia GTC 2026:发布企业AI Agent平台,17家软件巨头入局
Nvidia CEO黄仁勋在GTC 2026发布Nvidia Agent Toolkit,这是一个用于构建自主AI Agent的开源平台,包含Nemotron(Agent推理优化开源模型)、AI-Q(企业知识感知Blueprint)、OpenShell(策略安全沙箱运行时)和cuOpt(优化技能库)。
17家企业宣布采用:Adobe、Salesforce、SAP、ServiceNow、Siemens、CrowdStrike、Atlassian、Cadence、Synopsys、IQVIA、Palantir、Box、Cohesity、Dassault Systèmes、Red Hat、Cisco、Amdocs。Adobe将把Agent Toolkit作为生成式AI工作流基础;Salesforce将通过Slack作为编排层运行Agentforce Agent。
来源:VentureBeat | Nvidia News
Memento-Skills框架:AI Agent可自主重写技能,无需重新训练底层模型
学术界发布Memento-Skills框架,赋予AI Agent自我进化能力。核心创新是"读写反思学习"机制——Agent执行任务后评估结果,主动重写技能代码和提示词,而非简单记录日志。在GAIA基准上提升13.7个百分点(66.0% vs 52.3%),在专家级HLE基准上从17.9%跃升至38.7%。技能路由器基于离线强化学习,避免传统RAG的语义相似性陷阱(50%成功率→80%)。
种子5个技能可自主扩展至GAIA的41个或HLE的235个技能。已开源:GitHub
来源:VentureBeat
AI-RAN:将无线网络变为边缘AI计算平台
Booz Allen与Cerberus联合推进AI-RAN(AI无线接入网),将5G/6G基础设施改造为同时承担通信、感知和AI推理的融合平台。核心是ISAC(集成感知与通信)技术,使网络本身成为传感器,实现亚米级资产追踪、周边入侵检测等。AI-RAN将推理延迟从云端"秒"级压缩至"毫秒"级,支撑实时机器人控制和质量检测。
来源:VentureBeat
💰 资本动态
Anthropic年化收入突破300亿美元,$100万+客户超1000家
Anthropic同期披露其运行率收入已突破300亿美元($30B),较2025年底约90亿翻超3倍;年消费超100万美元的企业客户超过1000家,两个月内翻番。同时宣布从微软挖走资深高管Eric Boyd领导基础设施扩张。
来源:VentureBeat | Anthropic官方
Anthropic封禁第三方Agent:订阅额度禁止用于OpenClaw等工具
Anthropic宣布自2026年4月4日12pm PT起,Claude Pro/Max订阅不再可用于为OpenClaw等第三方Agent工具提供算力,理由是第三方工具未优化Prompt Cache导致资源浪费。订阅用户需转向按量付费API或"Extra Usage"附加包。Anthropic为受影响用户提供一次性积分补偿和高达30%的预购折扣。OpenClaw创始人Peter Steinberger(现已在OpenAI)公开批评此举"先复制热门功能再封锁开源"。
来源:VentureBeat
🏛️ 政策监管
Axios供应链攻击:朝鲜黑客植入恶意代码影响OpenAI
2026年3月31日,npm上流行的JavaScript库Axios被朝鲜黑客组织攻破,1.14.1和0.30.4版本被植入远程访问木马。OpenAI在macOS应用签名流程的GitHub Actions中执行了该恶意版本,可能暴露了ChatGPT Desktop、Codex、Codex-cli和Atlas的代码签名证书。OpenAI表示无用户数据泄露,正在全面更换证书,5月8日后旧证书版本将无法运行。
来源:OpenAI官方公告 | The Verge
🏢 企业应用
MassMutual:AI落地成果显著,30%开发效率提升
MassMutual分享企业AI落地经验:开发效率提升30%,IT服务台解决时间从11分钟缩至1分钟,客服通话从15分钟降至1-2分钟。关键经验:①从"为什么做"出发定义指标;②无锁定策略,构建微服务解耦层便于切换模型;③用信任评分降低幻觉率,监控特征和输出漂移;④设立"大红色按钮"可随时终止AI系统。
来源:VentureBeat
Mass General Brigham:从"千花齐放"到AIchampion集中化治理
Mass General Brigham曾采用"千花齐放"AI试点策略,后主动关闭无治理试点,转向Microsoft Copilot集中分发+受控"着陆区"测试。关键洞察:与Epic、Workday、ServiceNow、Microsoft平台商谈后发现许多自建工具供应商已在提供。最终策略:跨业务线部署"AI champion"角色替代无序扩散,临床场景永远保留医生最终决策权。
来源:VentureBeat
Block推出Managerbot:从响应式聊天到主动式AI Agent
Block发布Square AI Agent产品Managerbot,标志其从响应式FAQ聊天机器人向主动式AI Agent的质变。Managerbot可主动监控销售、员工和业务绩效数据,在问题发生前介入,而非被动回答问题。
来源:VentureBeat
🔮 一周展望
- Anthropic:Project Glasswing启动,Claude Mythos Preview将接受12家合作伙伴验证,零日披露节奏备受关注
- Nvidia:GTC 2026发布的Agent Toolkit将加速企业AI Agent落地,生态争夺白热化
- Z.ai:GLM-5.1 MIT开源将激发开源社区长程Agent研究热潮
- OpenAI:Axios供应链攻击后证书更换进度,macOS用户更新情况
- 监管:Anthropic第三方Agent封禁引发的监管和社区反弹可能持续发酵