今日概要

今日AI领域热闹非凡:阿里发布Qwen3.5-Omni全模态大模型,斩获215项SOTA全面超越Gemini;月之暗面ARR发布仅一个月正式突破1亿美元大关;Apple Intelligence国行版凌晨意外上线数小时后紧急闪退,苹果暂无正式发布计划;OpenAI Sora因日亏百万美元将于4月正式关停;微软推出GPT+Claude协作深度研究智能体;爱诗科技PixVerse V6引领AI视频进入"物理常识"时代;百度PaddleOCR登顶GitHub Star全球第一;LiteLLM因合规造假丑闻与Delve终止合作。


🤖 技术突破

215项SOTA!阿里发布Qwen3.5-Omni:全模态性能跨越式超越Gemini

3月30日,阿里通义实验室正式发布千问新一代全模态大模型Qwen3.5-Omni。该模型采用混合注意力MoE架构,实现图片、视频、语音及文字的无缝全模态输入与输出,在音视频理解、识别与交互等共计215项测试任务中均取得SOTA表现,大幅领先Google的Gemini-3.1Pro。

核心技术突破方面,Thinker(理解中枢)升级为Hybrid-Attention MoE,支持256K超长上下文,可处理长达10小时的音频或1小时的视频;Talker(表达中枢)引入全新ARIA技术,赋予模型语音控制与语义打断能力。该模型还支持113种语言及方言识别,以及"动动嘴编程"——用户仅需对着草图口述需求,模型即可直接生成产品原型界面。

价格方面,阿里云百炼平台Plus/Flash/Light三种API每百万Tokens输入成本低于0.8元,仅为Gemini的十分之一。千问已服务超100万家客户,稳居中国企业级大模型调用市场第一。

来源:AIbase | AIbase

模型界"强强联手"!微软发布深度研究智能体:GPT负责草拟,Claude负责审稿

3月31日,微软宣布对365Copilot研究代理功能进行重磅更新,用户可在同一研究任务中同时调用OpenAI GPT和Anthropic Claude两大顶级模型协作。

“Critique"功能设定了一套严谨流水线:GPT先生成研究初稿,Claude按学术评审流程审查准确性和引证质量。未来还将支持双向运行。此外,微软推出"Council"机制,让GPT和Claude独立研究同一课题,最终由裁判模型提炼共识并指出分歧。

根据DRACO基准测试,多模型协作产出质量明显优于单一模型。微软365和Copilot副总裁Nicole Herskowitz表示,这种方法能有效限制AI幻觉。尽管微软与OpenAI有深厚绑定,但与Anthropic的50亿美元投资和最新合作显示其策略正走向多元整合。

来源:AIbase

爱诗科技发布PixVerse V6:AI视频迈入"物理常识"时代

3月31日,爱诗科技正式发布视频生成大模型PixVerse V6,在人物真实感、物理模拟及叙事连贯性上实现全面突破。

人物表现方面,新版本生成的皮肤具备真实纹理结构、毛孔与细纹,光影反射自然,表情随镜头推进展现细腻情感。物理模拟方面,角色间运动关系高度稳定,大幅减少穿模与干扰现象,液体流动、布料摆动及物体碰撞的物理逻辑均得到深度理解。

最值得关注的是叙事升级:镜头从远景切换至近景时,人物运动惯性、光源方向与阴影关系均保持统一,解决了AI视频长期存在的镜头连贯性难题。创作门槛也大幅降低——用户通过简短描述即可生成包含子弹时间、FPV(第一人称视角)等专业特效的镜头。

来源:AIbase

PaddleOCR登顶GitHub Star全球第一:中国开源力量领跑OCR领域

百度旗下PaddleOCR项目正式登顶GitHub Star排名,成为全球OCR(光学字符识别)领域关注度最高的开源项目,成功超越Tesseract等老牌国际开源项目。

PaddleOCR首创的PP-OCR系列模型以"超轻量"著称,在保持高精度的同时极大缩小模型体积,降低了在手机、嵌入式设备等边缘端的部署门槛。目前已支持80余种主流语言识别,针对表格识别、文档分析等复杂场景提供专项优化方案。

截至目前,该项目已累计获得超过4.3万个Star,吸引了全球数千名贡献者参与,被广泛应用于金融票据审核、工业零件编码识别、医疗档案数字化等多个垂直行业。

来源:AIbase


💰 资本与产业

商业化神话!Kimi K2.5发布仅一月,月之暗面ARR突破1亿美金

3月30日,据Readhub报道,月之暗面(Moonshot AI)发布Kimi K2.5模型仅一个月后,年度经常性收入(ARR)已正式突破1亿美金大关,创下"AI六小虎"中的新纪录。

随着K2.5性能爆发,其API供应的TPM配额迅速告急,已有企业客户开出千万美元级别消费承诺以锁定优先供应权。K2.5已从单体智能升级为多智能体集群(Agent Swarm),支持多个AI Agent并行协作处理复杂任务。市场传闻月之暗面正在商议新一轮10亿美元融资,若达成估值将攀升至180亿美元。

来源:AIbase

OpenAI Sora 4月正式关停:每天亏损百万美元

据《华尔街日报》最新报道,OpenAI计划于今年4月正式关闭视频生成应用Sora,API服务于9月停止支持。

Sora发布初期曾吸引约100万用户,但热度迅速腰斩,日均活跃用户跌至约50万。与此同时,该项目每天运营亏损约100万美元,且面临版权纠纷及用户生成低质内容对品牌形象的侵蚀。在Anthropic等对手崛起的竞争压力下,OpenAI选择将重心转向编码工具、企业级服务及Agent产品。原Sora团队已转向"机器人世界模型"领域。

来源:AIbase


📱 应用与产品

Apple Intelligence国行版凌晨闪退:苹果暂无正式发布计划

北京时间3月31日凌晨,苹果公司旗下Apple Intelligence国行Beta版在部分已升级至iOS 26.4及以上系统的设备上分批激活,带来全新Siri界面及照片消除、智绘表情、实时翻译等功能。然而大批用户反映功能激活不稳定,GPT扩展插件也无法正常使用。

然而,据彭博社知名记者马克·古尔曼(Mark Gurman)消息,此次上线属非计划内的意外事件——苹果尚未获得中国监管部门最终批准,且目前无明确近期发布计划。支撑"意外论"的证据还包括:苹果极少在缺乏官方公告情况下于战略级市场发布重大功能;该测试版本中谷歌反向图片搜索功能在中国境内无法连接。苹果已紧急下线处理。

来源:AIbase

“龙虾"出海:联想天禧 AI Claw开启内测,主打离线任务持续运行

3月30日,联想天禧AI生态官方宣布,代号为"龙虾"的 天禧 AI Claw正式启动内测,标志着联想在个人超级智能体领域的进一步深化布局。

天禧 AI Claw采用端云混合部署方案,将本地终端即时算力与云端高性能资源深度整合。即便本地设备关机,用户于云端发起的AI任务仍能保持运行,确保复杂工作流进度不因硬件状态中断。符合条件的用户需将"天禧个人超级智能体"升级至3.6版本,通过内置入口申请排队获取邀请码体验。

来源:AIbase

小米自研输入法曝光:内置MiMo大模型,支持"系统级"AI纠错

小米近日向miclaw内测用户推送了澎湃OS 3 Beta更新,首次集成小米自研系统级输入法。该输入法核心依托于小米自研MiMo大模型,是国内首个在手机端实现类OpenClaw Agent交互的尝试。

通过内置AI,输入法可实现智能纠错、语义联想及文本补齐。语音输入方面支持自动去除口语词(“嗯”、“啊”)、基础语法纠错及个性化词库调整,用户随口表达可被即时转化为准确书面化文字。

来源:AIbase


⚠️ 安全与合规

LiteLLM踢出Delve:AI网关巨头深陷合规造假风波

全球热门AI网关开发商LiteLLM正式宣布,终止与合规初创公司Delve的所有合作,并计划通过竞争对手Vanta重新进行安全认证。

事件起因是LiteLLM开源版本上周遭遇严重凭证窃取恶意软件攻击。LiteLLM此前依靠Delve的合规服务获得两项关键安全认证,但Delve随后被指控通过伪造数据和雇佣"草率签字"的审计人员来误导客户。LiteLLM首席技术官已明确立场:立即切割与Delve的合作,委托Vanta重新认证,并聘请独立第三方审计机构进行深度验证。

作为拥有数百万开发者的AI网关标杆,LiteLLM的"断腕自救"反映了AI行业对合规真实性的高度敏感。

来源:AIbase


🏛️ 政策与社会

超75%美国民众对AI持怀疑态度:行业陷入"塔西佗陷阱”

一份最新深度调查报告显示,超过四分之三的美国受访者对AI发展持有明显保留意见甚至强烈不信任感。公众主要焦虑点集中在个人隐私泄露、虚假信息泛滥以及潜在的就业替代风险。

多数受访者认为AI生成内容透明度极低,难以分辨信息真实性和偏见性。这种认知迷茫导致公众在面对AI驱动的金融、医疗及政务服务时,往往下意识产生抵触心理。民众同时对监管机构缺位表达不满,认为当前法律框架远滞后于算法演进速度。

AI行业已步入关键的"信任重塑期”——技术能力领先已不再是衡量成功的唯一标准,企业若不能从底层逻辑解决算法黑箱和数据确权问题,再强大的模型也难以跨越公众认知的鸿沟。

来源:AIbase

苹果出手整顿"氛围编程":Replit、Vibe Code等多款AI代码工具遭下架

苹果应用商店近期针对"氛围编程"(Vibe Coding)类应用展开严厉整顿。知名编程工具"Anything"已于上周被正式下架,Replit和Vibe Code等知名AI编程应用也接连遭遇更新拦截。

苹果官方表示,根据审核指南第2.5.2条,所有App必须在自身包内独立运行,开发者严禁通过外部手段下载或执行会改变应用现有功能的新代码。苹果强调此次行动并非针对AI技术,而是维护App Store的安全与审核一致性——担心允许App在运行中随意加载未经审核代码会带来巨大安全隐患。

开发者们正试图在"自然语言编程"的创新与苹果严苛审核机制之间寻找新的平衡点,整个AI编程社区已处于高度紧张状态。

来源:AIbase