每日AI快讯 - 轻工具导航

7月3·周五

谷歌开源零样本表格基础模型，支持对混合数值与类别特征的结构化数据进行分类和回归，无需微调或超参数搜索。模型在数百亿合成表格数据上预训练，采用Transformer序列架构，在TabArena基准51个数据集上超越梯度提升树等强基线。

英伟达开源，基于预训练自回归骨干的离散扩散语言模型，能解决大模型Token生成速度瓶颈。模型总参数60B，采用双塔架构——30B自回归上下文塔与30B扩散去噪塔，各塔激活3B参数。上下文塔保持冻结维护自回归上下文，去噪塔负责噪声块去噪，两者通过逐层交叉注意力协作。

阿里全面禁用Claude

阿里巴巴内部宣布全面禁用Anthropic旗下Claude系列产品，包括Sonnet、Opus、Fable等多个系列模型，以及等Agent产品。导火索是Claude Code被曝存在植入后门的安全风险，其从2.1.91版本起内置隐蔽木马系统，通过检测本地时区和代理关键词标记中国用户。

7月2·周四

快手旗下可灵AI将完成30亿美元融资

快手旗下AI视频生成业务将完成30亿美元（约203.8亿元）融资，腾讯参与了本轮融资，投后估值180亿美元，较此前200亿美元目标下调20亿美元。快手预计12个月内启动可灵AI赴港IPO，募资将用于算力建设和人才引进。可灵AI年化收入已超3亿美元，Q1收入7500万美元，主要来自海外市场。

AI 版支付宝开放公测，无需邀请码即可体验

支付宝AI智能体”“结束内测，正式面向iOS和安卓用户开放公测，无需邀请码即可体验。用户可在应用商店或支付宝App内搜索”阿宝”或”蚂蚁阿宝”可直接使用。阿宝从海量办事服务中整理出72项技能，涵盖居家保洁、出行订票、购物优惠、社保查询、账单分析等72项生活服务，支持模糊口语理解、全场景服务覆盖及长期陪伴互动。

昆仑万维天工 3.2 推出团队级 AI Agent 协作功能 Skywork Tags

昆仑万维 3.2 升级上线，支持将 Skywork Agent 接入 Slack、飞书、钉钉、Discord、Telegram 等即时通讯工具，以”团队成员”身份常驻工作群聊。区别于让用户迁移上下文到独立平台的传统模式，Skywork Tags 直接进驻团队现有沟通环境，无需导出聊天记录或切换窗口。

xAI推出生产级语音智能体平台 Voice Agent Builder

xAI推出测试版，基于Grok Voice端到端语音模型的零代码生产级语音智能体平台。用户用自然语言描述，2分钟可配置智能体，支持SIP接入、知识库实时检索、Google Calendar等工具连接及MCP集成。平台提供80+内置语音和品牌克隆功能，具备完整可观测性与护栏机制。

元空AI推出企业级桌面版 AI 数据智能体 ChatExcel Ultra

桌面版正式上线，定位为企业级AI数据办公工具。产品将数据安全与本地化处理能力——文件全程留在本地电脑和企业内网，不经过外部服务器，满足财务、医疗、政务等敏感场景的合规需求。同时支持数据库直连与跨库联合分析，用户无需编写SQL可用自然语言完成复杂查询。

Meta 开源 React 设计系统 Astryx

Meta正式开源React设计系统，目前处于Beta阶段。系统基于React与StyleX构建，历经8年内部打磨，支撑Facebook、Instagram等超1.3万个应用。系统提供150+可访问组件、品牌级主题、暗黑模式、即用型模板及CLI工具集，开发者无需额外构建插件，导入预编译CSS即可使用。

7月1·周三

Anthropic推出最强智能体模型 Claude Sonnet 5

Anthropic推出，定位为其最具Agent能力的Sonnet模型，支持制定计划、调用浏览器和终端等工具自主执行复杂任务，整体能力接近Opus 4.8但价格更低。模型已面向所有套餐开放，成为Free和Pro用户默认模型，支持Claude Code和Platform调用。

谷歌推出轻量级 AI 图像生成模型 Nano Banana 2 Lite

谷歌推出AI图像模型，4秒可生成一张图像，每1000张收费0.034美元，主打速度与批量处理能力，适合高频内容生产场景。模型已上线谷歌AI Studio、Gemini API及企业平台，将取代初代Nano Banana。

Anthropic 推出 AI 科研工作平台 Claude Science

Anthropic 推出面向科学家的AI工作平台。平台提供统合式研究环境，可帮助科研人员分析文献、执行多步骤研究、生成详细成果，支持反复完善图表与文稿直至发表标准。每个输出均提供可审计的生成历史记录，确保结果可验证与复现。平台内置超60种精选技能与连接器，配备审阅智能体进行核查。

AI 芯片初创公司 Etched 完成流片，获得8亿美元融资

Transformer专用AI芯片初创公司Etched完成A0芯片流片，并获得8亿美元融资及10亿美元客户订单。公司由哈佛辍学生创立，获卡帕西、李飞飞、辛顿等AI巨头投资。Etched推出首款机柜产品，采用低电压推理（LVI）和集群规模内存（CSM）技术，专为万亿参数级MoE模型推理优化，计划今夏出货。

6月30·周二

OpenAI 推出首款 AI 硬件，Codex 联名键盘

OpenAI 开发者官方账号 6 月 30 日在 X 平台宣布，将与客制化键盘厂商 Work Louder 合作推出品牌专用输入设备，定于 7 月 15 日上线。设备基于 Creator Micro 2 微型快捷键盘打造，配备 12 个可自定义机械按键、八向摇杆及无极旋转旋钮，专为 AI 开发场景优化。

美团开源新一代万亿参数大模型 LongCat-2.0

美团正式开源万亿参数大模型，模型总参数 1.6T、平均激活 48B，是业界首个在五万卡国产算力集群上完成全流程训练与推理的模型。模型原生支持 1M 超长上下文，专为 Agentic Coding 任务优化，预览版已跻身 OpenRouter 全球调用量前三。

腾讯视频推出工业级 AI 漫剧制作平台 WorkRally

腾讯视频推出工业级AI漫剧制作平台，面向2D/3D动漫及AI仿真人剧，覆盖剧本解析、分镜生成、内容生产到资产管理的完整链路。平台内置S+级影视动漫技能库，支持专家级Agent生成与智能流水线调度，可实现角色一致性管理与穿帮检测。

清华系初创「厘清智能」完成数亿元种子轮融资

清华系初创厘清智能完成数亿元种子轮融资，顺为资本、红杉中国、高瓴创投等参投。团队由清华AI学院助理教授李一鸣创立，团队平均年龄23岁。公司拒绝”世界模型”标签，定位Physical AI基础设施商，自研数据管线与可微物理引擎，实现Real-to-Sim-Real闭环，可用1%真机数据达同等训练效果。

华为开源盘古920亿参数模型 openPangu-2.0-Flash

华为正式开源920亿参数的模型，基于昇腾原生训练与推理技术，为 Agent 时代打造智能底座。模型权重、基础推理代码及训推算子已上线开源平台，Pro 版将于7月发布，更多组件下半年陆续推出。

全球金融科技平台 Airwallex 空中云汇完成H轮3.2亿美元融资

全球金融科技平台 Airwallex 空中云汇宣布完成 H 轮 3.2 亿美元融资，投后估值达 110 亿美元，半年内从 80 亿美元跃升约 40%。本轮由 Addition 领投，多家国际机构跟投。公司同步发布两款 AI 产品：AI 原生财务平台与智能体消费者钱包 Airi，资金将用于 AI 产品研发、全球合规布局及团队扩充。

6月29·周一

OpenAI 推出最新一代大语言模型系列 GPT-5.6

OpenAI 推出系列限量预览版，包含旗舰 Sol、平衡 Terra 和性价比 Luna 三款模型。Sol 在编程、网络安全和生物学领域表现突出，新增 max 深度推理和 ultra 多 Agent 协同模式；Terra 以 GPT-5.5 一半价格提供同等性能；Luna 主打轻量高速。模型因应美国政府要求改为限量预览，原计划为开放访问。

DeepSeek 联合北大开源推测解码加速框架 DSpark

DeepSeek 与北京大学联合推出大模型推理加速框架，已进入系列生产系统。在总吞吐不变的情况下，DeepSeek-V4-Flash 单用户生成速度提升 60%–85%，DeepSeek-V4-Pro 提升 57%–78%。DSpark 采用半自回归架构与置信度调度验证机制，兼顾草稿生成速度与连贯性，能根据系统负载动态调整验证长度。

高德推出 AI 应用生成平台「袋马」

高德内测Vibe Coding产品「」，主打自然语言驱动零门槛构建应用，聚焦微信小程序与iOS原生场景，可快速生成可直接上线、真机可用的应用。产品面向无专业研发团队的个人从业者与中小主体，用户无需编程知识，通过自然语言描述需求可生成完整App，支持获取真机二维码测试与持续迭代。

阿里通义千问推出独立AI语音输入法「千问输入法」

阿里巴巴通义千问团队推出独立AI语音输入法「」，主打”说得随意，写得漂亮”。产品底层接入千问大模型CosyVoice能力，能语音转文字，更能理解语义、自动去除语气词、纠正口误，将散装口语整理为结构化书面文本。千问输入法支持最快300字/分钟输入、9种方言识别与中英混说。

生数科技推出的 AI 陪伴应用 Vidy

生数科技推出AI陪伴应用，定位”AI Vibe Buddy”，支持文字、语音及实时通话互动。产品内置Humi等差异化AI角色，搭载关系成长记忆系统，可随对话积累理解用户习惯与情绪。依托自研U-ViT架构和Vidu视频大模型，Vidy计划实现AI形象实时表情动作生成，将陪伴从文字语音推向面对面视频通话层级。

自变量连续完成4轮融资，估值超过200亿元

自变量（X SQUARE ROBOT）两个月内连续完成四轮融资，投后估值突破200亿元，成为大湾区首家估值超200亿元的具身大脑公司。投资方超30家，美团、阿里、字节、小米四大互联网巨头分别领投各轮次，小米连续三轮加注，58集团、奇瑞、中国移动、红杉中国等悉数入场。

6月26·周五

DeepReinforce 开源 Agentic 编程系列模型 Ornith-1.0

DeepReinforce团队推出开源Agentic编程模型，基于与基座，采用自改进训练框架。模型涵盖9B至397B四种规格，在Terminal-Bench 2.1和SWE-Bench Verified基准上达到同级SOTA。旗舰397B版本得分77.5/82.4超越Claude Opus 4.7；35B MoE版以64.4分超越Qwen 3.5-397B。

腾讯混元开源 4B 参数手机 Agent 模型 PhoneBuddy

腾讯混元开源 4B手机Agent模型，同步推出PhoneWorld、PhoneHarness等5篇论文，系统覆盖环境、训练、执行、隐私与安全全链路。模型核心创新采用Real+Mock混合RL训练，将真实App与自建PhoneWorld mock环境结合，使4B模型在150项真机评测中多项指标超越GPT-5.4。

Mistral AI 推出新一代文档识别模型 Mistral OCR 4

Mistral AI 推出最新文档识别模型，支持横跨10个语族的170种语言，在OmniDocBench基准上获得93.07分。相比GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞品，模型输出更受人类青睐。模型在输出文本的同时可提供边框、区域分类和置信度评分，支持RAG语义分块等下游工作负载。

6月25·周四

OpenAI 推出首款自研推理加速芯片 Jalapeño

OpenAI 发布首款自研推理芯片 Jalapeño，联合博通与 Celestica 打造，专为 ChatGPT、Codex 等模型量身定制。项目由前谷歌 TPU 核心成员 Richard Ho 主导，仅用 270 天完成从设计到流片，创高性能 ASIC 最快纪录。芯片通过优化数据搬运与资源平衡提升实际利用率，计划 2026 年底部署，每瓦性能大幅优于现有方案。

华为宣布全机型开放鸿蒙龙虾「小艺 Claw」

华为宣布鸿蒙”龙虾” 全机型开放，HarmonyOS 5.0 及以上机型只需将小艺 App 升级至 11.6.4.300 及以上版本即可使用。同时小艺 Claw 的套餐服务同步更新，49 元体验包上线 Auto-Model 模式，199 元标准包支持、DeepSeek V4-Flash、、四种模型自选。

阿里云推出 AI 语音输入法 CosyVoice

阿里云推出新一代AI语音输入法，搭载千问大模型，支持语音实时转写、自动过滤口语冗余、识别自我修正及结构化整理。工具可理解用户意图生成制式文稿，支持上海话、粤语、四川话等多种方言转普通话。工具主打大模型深度赋能的语义级理解与文本再生成能力，区别于传统语音输入法仅做声学转写。

阿里云推出 AI 互动故事创作与阅读平台「向尾」

阿里云推出AI互动故事创作与阅读平台，支持从零起稿、文稿续写及长篇小说分章规划三种模式，覆盖网文、剧本、儿童故事等场景。阅读时AI实时生成场景背景图，读者可在关键节点选择剧情走向或自定义输入，平台即时续写并保持人设一致。

网易有道开源 TTS 语音合成引擎 Confucius4-TTS

网易有道开源TTS模型。模型实现三大突破：3秒零样本语音克隆、14种语言跨语种无口音合成，以及情感韵律迁移。模型底层采用语音编码器+大语言模型+流匹配生成的端到端架构，完整54G权重支持本地离线部署。