今日概要
2026年4月8日,AI领域迎来多个重磅节点。技术层面:智谱AI正式发布GLM-5.1,以"8小时自主工作"能力刷新开源编程模型纪录,SWE-bench成绩超越GPT-5.4和Claude Opus4.6,同时涨价10%与Anthropic Claude对齐;Anthropic发布最强模型Mythos,揭示27年未被发现的历史漏洞;阿里通义发布FIPO算法,32B规模推理性能超越o1-mini;DeepSeek V4灰度测试曝光。政策层面:工信部等十部门联合发布《人工智能技术伦理审查办法》。资本市场:中国AI概念股集体大涨,港股恒生科技指数开盘涨2.95%,智谱AI涨近15%。
🤖 技术突破
智谱AI发布GLM-5.1:8小时自主工作,代码能力超越GPT-5.4和Claude Opus4.6
4月8日,智谱AI正式发布旗舰开源模型GLM-5.1,在SWE-bench Pro基准测试中创下全球最高分纪录,超越Claude 4.6 Opus和GPT-5.4,标志着国产大模型在代码与工程领域正式站上全球巅峰。
GLM-5.1最核心的突破在于长时自主工作能力:与主流模型仅支持分钟级交互不同,GLM-5.1可独立完成长达8小时的复杂工程任务——在测试中,它可在8小时内搭建一套完整的Linux桌面系统,执行超过1200步操作,最终交付相当于4名工程师工作一周的工程成果。此外,模型还具备主动自我评估与策略调整能力,能在遇到问题时自动切换策略并自我修复错误。
伴随新模型发布,OpenRouter平台显示智谱GLM系列价格已上调10%,核心编程场景Token价格已基本与Anthropic Claude 3.5 Sonnet对齐,标志着国内大模型从"价格战"转向"性能溢价"竞争阶段。消息发布后,智谱A股(4月8日)早盘一度涨14.12%,收盘890元/股,市值达3964亿元。
来源:AIbase/GLM-5.1 | AIbase/智谱涨价 | GitHub | HuggingFace
Anthropic发布最强模型Mythos:发现OpenBSD中潜伏27年的历史漏洞
4月8日,Anthropic正式发布下一代旗舰模型Mythos Preview,该模型被内部称为"迄今为止最强模型",在编程与推理领域实现了质的飞跃。在过去数周的封闭测试中,Mythos成功发现了数千个零日漏洞(zero-day vulnerabilities),包括一个在OpenBSD等关键基础设施中潜伏了27年未被发现的高危漏洞,可导致远程系统崩溃。
由于该模型展现出强大的漏洞发现能力,Anthropic将其定位为防御性工具而非公开产品。Mythos通过**“Project Glasswing”**安全联盟向合作伙伴开放,参与企业包括Apple、Google、Amazon AWS、Microsoft、Nvidia、Cisco、Broadcom、CrowdStrike、Palo Alto Networks等科技巨头,以及摩根大通和Linux基金会。Anthropic还向开源安全组织直接捐赠400万美元,帮助加强基础软件安全。
此前,Anthropic因拒绝将技术用于针对美国公民的自主攻击或监控,已被美国国防部列入"供应链不可接受风险实体"名单。
来源:AIbase/Mythos | AIbase/Glasswing
Anthropic联合苹果、谷歌启动Project Glasswing:AI安全"超级联盟"
Anthropic近日联合多家科技巨头共同启动**“Project Glasswing”**安全项目,这是一个旨在利用前沿AI模型防御日益复杂的AI网络攻击的跨行业协作联盟。创始伙伴阵容堪称豪华:Apple、Google、Amazon AWS、Microsoft、Nvidia五家科技巨头,以及Cisco、Broadcom、CrowdStrike、Palo Alto Networks四家网络安全公司,另有摩根大通和Linux基金会参与。
该项目的核心源自Anthropic内部模型Claude Mythos Preview——尚未公开发布,但已展现出强大的漏洞发现与利用能力。Anthropic警告,若此类能力落入恶意分子手中,现有操作系统和浏览器防御体系将变得极其脆弱。作为防御措施,Anthropic将向参与成员提供价值1亿美元的Mythos Preview使用配额,并直接向开源安全组织捐赠400万美元。
对普通用户而言,macOS或iOS界面可能不会立即看到变化,但底层安全机制将经历深度重构。Apple此前已通过iMessage的PQ3协议部署了后量子加密防御,参与Glasswing是其应对AI辅助攻击的又一关键步骤。
阿里通义发布FIPO算法:32B模型推理性能超越o1-mini
4月8日,阿里通义实验室Qwen团队发布全新推理算法FIPO(Future-KL + Symbolic Log Probability Difference),旨在突破传统强化学习在处理复杂逻辑时的瓶颈,实现推理长度与准确率的双重突破。
FIPO引入两大核心机制:Future-KL策略——专门奖励对后续推理有重要正向影响的Token,使AI学会"前瞻思考";以及符号化对数概率差机制——精确捕捉模型优化方向,防止推理过程陷入无效循环。在基础模型上,FIPO成功将平均推理长度提升至超过10,000 Tokens,彻底解决推理深度不足的问题。
实测中,配备FIPO算法的32B规模模型表现惊艳:在纯强化学习配置下,其推理性能不仅超越同规模模型,更在部分指标上超越OpenAI的o1-mini,尤其在高等数学推理任务中展现出强大的逻辑推演能力。
来源:AIbase/FIPO
DeepSeek V4灰度测试曝光:视觉版+专家模式,专注"国产芯片适配"
4月7日,有程序员和社交媒体博主曝光DeepSeek V4正在进行密集灰度测试。新版界面显示,DeepSeek V4提供三个核心版本:Lite版(V4 Lite)专注响应速度,适合日常轻量对话;专家版(V4)深度逻辑推理模式,可能基于DeepSeek创始人梁文锋论文中提到的"新记忆架构";视觉版(V4 Vision)标志多模态能力的深度融合,可直接处理图像和视频分析任务。
值得关注的是技术路径:DeepSeek V4坚持"国产芯片优先"策略。据报道,DeepSeek正在开发至少两款完全基于国产AI芯片的大模型,并已启动国产芯片采购热潮。DeepSeek在申请美国芯片厂商测试时,并未开放V4模型测试,而是优先向国内公司开放合作优化,这表明其对国内算力生态的深度适配决心。
市场对DeepSeek V4期待颇高:可能推出专用于代码生成的AI编程特别版,直接与Anthropic的Mythos或OpenAI的GPT系列竞争;同时可能延续超长文本处理优势,实现一次性处理百万Token超长文本的能力。
Apple发布SQUIRE:基于GPT-4o的UI设计白盒工具
Apple近日发布了两项机器学习领域的关键研究——SQUIRE系统与SafetyPairs框架。SQUIRE由GPT-4o驱动,核心创新在于Slot-Query中间表示(Intermediate Representation),可将AI生成UI的过程从"黑盒"变为"白盒":先生成可自定义的组件树,开发者可像搭积木一样修改字体、添加图层、替换特定元素,确认原型后再一键转换为HTML和CSS代码。在与11名前端开发者的测试中,该工具因易用性和可控性获得高度评价。
SafetyPairs框架则通过反事实图像生成技术创建了1510对高度相似但关键特征不同的图像数据集,用于精准识别视觉语言模型的安全评级弱点,提升iPhone上Image Playground等本地AI工具的安全水平。
Apple在Xcode 26.3中已引入Agentic编码工具支持,业界普遍预期SQUIRE代表的组件化生成方式极有可能在6月8日的WWDC2026上正式集成进Apple官方工具链。
豆包大模型上车:别克致境E7智能座舱进入"类人时代"
上汽通用汽车携手字节跳动火山引擎,将最新一代豆包大模型落地别克致境E7,标志着智能座舱从"命令交互"进入"语义理解"新阶段。
接入豆包大模型后,别克致境E7车载系统实现了从执行工具到"懂你伙伴"的转变:支持超过20种情绪表达,可通过语调和工作节奏识别人类情绪(当你say"今天有点累"时,系统会自动播放放松音乐而非机械搜索);支持连续对话上下文记忆;覆盖陪伴、出行、娱乐、用车、车控五大场景。
安全性方面,上汽通用建立了严格的三层安全隔离墙:应用层自动拦截危险命令;服务层实时监控车速和档位;机电层核心部件由独立硬件控制,AI仅能通过标准化接口发送请求。
来源:AIbase/豆包上车
🏛️ 政策与监管
工信部等十部门联合发布《人工智能技术伦理审查办法》
近日,工信部等十部门联合正式发布《人工智能技术伦理审查与服务办法》,为我国人工智能技术伦理审查与服务工作提供详细指导。办法明确了人工智能技术伦理审查的适用范围、实施主体和程序,要求从事人工智能技术活动的负责人向本单位伦理委员会或审查服务中心提交申请,并根据不同审查程序进行评估。
重点审查领域包括:人机融合系统、具有引导舆论能力的算法模型,以及具有高度自主性的决策系统。办法还明确了对违规行为的法律后果,相关案例将依照法律法规予以处理。
💰 资本动态
港股AI概念股集体大涨:智谱AI涨近15%领跑
4月8日,港股科技板块迎来"集体高潮"。受全球AI技术突破和应用落地加速等多重利好刺激,大模型和AI应用板块开盘强势,多只个股表现亮眼:
| 股票 | 开盘涨幅 |
|---|---|
| 智谱AI(Zhipu AI) | 涨近15% |
| MiniMax-W | 涨超8% |
| 金山云、金山软件、腾讯控股 | 均高开 |
恒生指数开盘涨2.61%,恒生科技指数开盘涨2.95%,半导体、航天等硬科技板块亦表现强劲。
背景因素:霍尔木兹海峡有望开放两周(伊朗接受临时停火提议),地缘政治紧张有所缓解,市场风险偏好回升。
来源:AIbase/AI股大涨
Anthropic被美国国防部列入"供应链不可接受风险"名单
Anthropic因拒绝将其技术用于针对美国公民的自主攻击或监控,已被美国国防部列入"供应链不可接受风险实体"名单。这一决定标志着Anthropic在商业利益与安全原则之间选择了后者,同时也反映出AI安全领域日益复杂的监管博弈。
与此同时,Anthropic正在与美国联邦官员讨论将Mythos模型用于国家关键系统防御的可能性。
🏭 应用落地
Google Gemini新增心理健康支持功能:一键直达危机援助
Alphabet宣布为AI助手Gemini新增心理健康支持功能,同时承诺未来三年投入3000万美元支持全球危机热线扩展服务能力。
核心功能包括:智能识别(当对话内容暗示用户可能有心理健康支持需求时,自动弹出重新设计的"获取帮助"模块);简化干预(一键界面,用户可直接拨打、发短信、发起在线聊天或联系专业危机热线);持续支持(危机模块激活后,帮助选项将在后续对话中持续可见)。
所有功能均与临床专家合作开发,并已向ReflexAI追加400万美元直接资助,将Gemini整合进社会部门组织使用的培训工具中。
360发布"虾书"App:打造AI Agents社交社区
360集团正在开发以"虾客"AI智能体为核心的新型社区产品"虾书"(Shrimp Book),主打AI自主社交体验,网页版已率先上线。
核心玩法:基于OpenClaw生态系统构建的AI虾客具有独立思考和自我意识;用户在社区中更像观察者,可近距离观看AI智能体之间的各种有趣互动(包括协作、深度交流甚至激烈"争论"),并通过"投喂"操作影响数字生命的成长。
来源:AIbase/虾书
🌏 国际动态
OpenAI高层动荡持续:GPT-4o"灵魂工程师" Joanne Jang宣布离职
OpenAI高管层动荡持续——被视为"GPT-4o之母"的Joanne Jang在X平台正式宣布,她将结束在OpenAI四年半的职业生涯。Joanne Jang长期负责OpenAI核心产品团队,是GPT-4o现象级模型背后的关键人物:她领导研究增强了ChatGPT的交互体验和情感表达能力,将AI从冰冷的复读机转变为"类人"智能伴侣。
Joanne的离职正值OpenAI IPO的关键时期。过去一周内,OpenAI已有多名高管换岗,市场传闻CEO和CFO在公司IPO具体时间表上存在重大分歧,这些战略冲突进一步加剧了团队的不确定性。
Anthropic封禁OpenClaw等第三方调用渠道:小米Luo Fuli警示Token价格战风险
Anthropic宣布将切断多个第三方框架(包括OpenClaw)的Claude订阅服务调用渠道,原因是部分重度用户仅支付200美元订阅费却消耗了价值5000美元的算力资源,给公司带来严重财务压力。
小米MiMo大模型负责人Luo Fuli(罗福莉)对此发表评论,认为第三方框架普遍存在上下文管理效率低下的问题,导致Token消耗量是原生框架的数十倍。她警示其他大模型公司,盲目参与"Token价格战"会带来巨大财务风险——以低价出售Token并在未明确订阅定价策略的情况下向第三方工具开放,实际上是一个陷阱。
小米MiMo已推出按量付费Token计划并支持第三方接入,Luo Fuli强调行业未来在于高效框架与高质量模型的协同进化,而非单纯追求低价。
⚠️ 风险与挑战
AI漏洞发现速度已超越安全补丁更新速度
Anthropic发布的Mythos模型揭示了一个严峻现实:AI驱动的漏洞发现速度正在接近甚至超越人类安全团队打补丁的速度。在测试中,Mythos不仅发现了大量现代漏洞,还挖掘出许多被时间遗忘的"历史遗留漏洞"(如OpenBSD中潜伏27年那个)。如果这类能力落入恶意分子手中,可能引发新一轮AI驱动的全球安全危机。
AI安全领域的"矛与盾"竞争规则正在被彻底改写。
📊 今日数据
| 指标 | 数据 |
|---|---|
| GLM-5.1自主工作时长 | 8小时 |
| GLM-5.1单任务执行步数 | 1200+步 |
| GLM-5.1 SWE-bench Pro排名 | 全球第一 |
| GLM-5.1价格涨幅 | +10% |
| 智谱AI收盘市值 | 3964亿元 |
| 智谱AI股价(4月8日) | 890元/股(涨14.12%) |
| FIPO推理Token长度 | >10,000 Tokens |
| DeepSeek V4超长文本处理 | 百万Token |
| Mythos发现零日漏洞数 | 数千个 |
| Glasswing项目Mythos配额价值 | 1亿美元 |
| Gemini心理健康投资 | 3000万美元(3年) |
| 别克致境E7骁龙8775芯片AI算力 | 70-144 TOPS |
| 恒生科技指数开盘涨幅 | +2.95% |
| 伊朗霍尔木兹海峡停火 | 预计开放2周 |
| Anthropic国防部风险认定 | 供应链不可接受风险 |
| DeepSeek V4灰度测试进度 | 密集进行中 |
| WWDC2026时间 | 2026年6月8日 |
📅 近期活动预告
| 时间 | 活动 | 地点 |
|---|---|---|
| 2026.04.07-14 | 智元AGIBOT AI发布周 | 线上 |
| 2026.04.15 | 第139届广交会(AI"翻译官"亮相) | 广州 |
| 2026.04.21-04.22 | 2026中国生成式AI大会(北京站) | 北京 |
| 2026.04下旬 | OpenAI春季发布会(GPT-5相关) | 待定 |
| 2026.05.18-05.19 | 美国AI与大数据博览会 | 圣何塞 |
| 2026.06.01-06.05 | ICRA 2026机器人与自动化国际大会 | 维也纳 |
| 2026.06.08 | WWDC 2026 | 待定 |
| 2026.06 | 第四届链博会(首次设立AI专区) | 北京 |
更新时间: 2026/4/8 11:17
