谷歌开源零样本表格基础模型,支持对混合数值与类别特征的结构化数据进行分类和回归,无需微调或超参数搜索。模型在数百亿合成表格数据上预训练,采用Transformer序列架构,在TabArena基准51个数据集上超越梯度提升树等强基线。
英伟达开源,基于预训练自回归骨干的离散扩散语言模型,能解决大模型Token生成速度瓶颈。模型总参数60B,采用双塔架构——30B自回归上下文塔与30B扩散去噪塔,各塔激活3B参数。上下文塔保持冻结维护自回归上下文,去噪塔负责噪声块去噪,两者通过逐层交叉注意力协作。
阿里巴巴内部宣布全面禁用Anthropic旗下Claude系列产品,包括Sonnet、Opus、Fable等多个系列模型,以及等Agent产品。导火索是Claude Code被曝存在植入后门的安全风险,其从2.1.91版本起内置隐蔽木马系统,通过检测本地时区和代理关键词标记中国用户。
快手旗下AI视频生成业务将完成30亿美元(约203.8亿元)融资,腾讯参与了本轮融资,投后估值180亿美元,较此前200亿美元目标下调20亿美元。快手预计12个月内启动可灵AI赴港IPO,募资将用于算力建设和人才引进。可灵AI年化收入已超3亿美元,Q1收入7500万美元,主要来自海外市场。
支付宝AI智能体”“结束内测,正式面向iOS和安卓用户开放公测,无需邀请码即可体验。用户可在应用商店或支付宝App内搜索”阿宝”或”蚂蚁阿宝”可直接使用。阿宝从海量办事服务中整理出72项技能,涵盖居家保洁、出行订票、购物优惠、社保查询、账单分析等72项生活服务,支持模糊口语理解、全场景服务覆盖及长期陪伴互动。
昆仑万维 3.2 升级上线,支持将 Skywork Agent 接入 Slack、飞书、钉钉、Discord、Telegram 等即时通讯工具,以”团队成员”身份常驻工作群聊。区别于让用户迁移上下文到独立平台的传统模式,Skywork Tags 直接进驻团队现有沟通环境,无需导出聊天记录或切换窗口。
xAI推出测试版,基于Grok Voice端到端语音模型的零代码生产级语音智能体平台。用户用自然语言描述,2分钟可配置智能体,支持SIP接入、知识库实时检索、Google Calendar等工具连接及MCP集成。平台提供80+内置语音和品牌克隆功能,具备完整可观测性与护栏机制。
桌面版正式上线,定位为企业级AI数据办公工具。产品将数据安全与本地化处理能力——文件全程留在本地电脑和企业内网,不经过外部服务器,满足财务、医疗、政务等敏感场景的合规需求。同时支持数据库直连与跨库联合分析,用户无需编写SQL可用自然语言完成复杂查询。
Meta正式开源React设计系统,目前处于Beta阶段。系统基于React与StyleX构建,历经8年内部打磨,支撑Facebook、Instagram等超1.3万个应用。系统提供150+可访问组件、品牌级主题、暗黑模式、即用型模板及CLI工具集,开发者无需额外构建插件,导入预编译CSS即可使用。
Anthropic推出,定位为其最具Agent能力的Sonnet模型,支持制定计划、调用浏览器和终端等工具自主执行复杂任务,整体能力接近Opus 4.8但价格更低。模型已面向所有套餐开放,成为Free和Pro用户默认模型,支持Claude Code和Platform调用。
谷歌推出AI图像模型,4秒可生成一张图像,每1000张收费0.034美元,主打速度与批量处理能力,适合高频内容生产场景。模型已上线谷歌AI Studio、Gemini API及企业平台,将取代初代Nano Banana。
Anthropic 推出面向科学家的AI工作平台 。平台提供统合式研究环境,可帮助科研人员分析文献、执行多步骤研究、生成详细成果,支持反复完善图表与文稿直至发表标准。每个输出均提供可审计的生成历史记录,确保结果可验证与复现。平台内置超60种精选技能与连接器,配备审阅智能体进行核查。
Transformer专用AI芯片初创公司Etched完成A0芯片流片,并获得8亿美元融资及10亿美元客户订单。公司由哈佛辍学生创立,获卡帕西、李飞飞、辛顿等AI巨头投资。Etched推出首款机柜产品,采用低电压推理(LVI)和集群规模内存(CSM)技术,专为万亿参数级MoE模型推理优化,计划今夏出货。
OpenAI 开发者官方账号 6 月 30 日在 X 平台宣布,将与客制化键盘厂商 Work Louder 合作推出 品牌专用输入设备,定于 7 月 15 日上线。设备基于 Creator Micro 2 微型快捷键盘打造,配备 12 个可自定义机械按键、八向摇杆及无极旋转旋钮,专为 AI 开发场景优化。
美团正式开源万亿参数大模型 ,模型总参数 1.6T、平均激活 48B,是业界首个在五万卡国产算力集群上完成全流程训练与推理的模型。模型原生支持 1M 超长上下文,专为 Agentic Coding 任务优化,预览版已跻身 OpenRouter 全球调用量前三。
腾讯视频推出工业级AI漫剧制作平台 ,面向2D/3D动漫及AI仿真人剧,覆盖剧本解析、分镜生成、内容生产到资产管理的完整链路。平台内置S+级影视动漫技能库,支持专家级Agent生成与智能流水线调度,可实现角色一致性管理与穿帮检测。
清华系初创厘清智能完成数亿元种子轮融资,顺为资本、红杉中国、高瓴创投等参投。团队由清华AI学院助理教授李一鸣创立,团队平均年龄23岁。公司拒绝”世界模型”标签,定位Physical AI基础设施商,自研数据管线与可微物理引擎,实现Real-to-Sim-Real闭环,可用1%真机数据达同等训练效果。
华为正式开源920亿参数的 模型,基于昇腾原生训练与推理技术,为 Agent 时代打造智能底座。模型权重、基础推理代码及训推算子已上线开源平台,Pro 版将于7月发布,更多组件下半年陆续推出。
全球金融科技平台 Airwallex 空中云汇宣布完成 H 轮 3.2 亿美元融资,投后估值达 110 亿美元,半年内从 80 亿美元跃升约 40%。本轮由 Addition 领投,多家国际机构跟投。公司同步发布两款 AI 产品:AI 原生财务平台 与智能体消费者钱包 Airi,资金将用于 AI 产品研发、全球合规布局及团队扩充。
OpenAI 推出 系列限量预览版,包含旗舰 Sol、平衡 Terra 和性价比 Luna 三款模型。Sol 在编程、网络安全和生物学领域表现突出,新增 max 深度推理和 ultra 多 Agent 协同模式;Terra 以 GPT-5.5 一半价格提供同等性能;Luna 主打轻量高速。模型因应美国政府要求改为限量预览,原计划为开放访问。
DeepSeek 与北京大学联合推出大模型推理加速框架,已进入 系列生产系统。在总吞吐不变的情况下,DeepSeek-V4-Flash 单用户生成速度提升 60%–85%,DeepSeek-V4-Pro 提升 57%–78%。DSpark 采用半自回归架构与置信度调度验证机制,兼顾草稿生成速度与连贯性,能根据系统负载动态调整验证长度。
高德内测Vibe Coding产品「」,主打自然语言驱动零门槛构建应用,聚焦微信小程序与iOS原生场景,可快速生成可直接上线、真机可用的应用。产品面向无专业研发团队的个人从业者与中小主体,用户无需编程知识,通过自然语言描述需求可生成完整App,支持获取真机二维码测试与持续迭代。
阿里巴巴通义千问团队推出独立AI语音输入法「」,主打”说得随意,写得漂亮”。产品底层接入千问大模型CosyVoice能力,能语音转文字,更能理解语义、自动去除语气词、纠正口误,将散装口语整理为结构化书面文本。千问输入法支持最快300字/分钟输入、9种方言识别与中英混说。
生数科技推出AI陪伴应用 ,定位”AI Vibe Buddy”,支持文字、语音及实时通话互动。产品内置Humi等差异化AI角色,搭载关系成长记忆系统,可随对话积累理解用户习惯与情绪。依托自研U-ViT架构和Vidu视频大模型,Vidy计划实现AI形象实时表情动作生成,将陪伴从文字语音推向面对面视频通话层级。
自变量(X SQUARE ROBOT)两个月内连续完成四轮融资,投后估值突破200亿元,成为大湾区首家估值超200亿元的具身大脑公司。 投资方超30家,美团、阿里、字节、小米四大互联网巨头分别领投各轮次,小米连续三轮加注,58集团、奇瑞、中国移动、红杉中国等悉数入场。
DeepReinforce团队推出开源Agentic编程模型,基于与基座,采用自改进训练框架。模型涵盖9B至397B四种规格,在Terminal-Bench 2.1和SWE-Bench Verified基准上达到同级SOTA。旗舰397B版本得分77.5/82.4超越Claude Opus 4.7;35B MoE版以64.4分超越Qwen 3.5-397B。
腾讯混元开源 4B手机Agent模型,同步推出PhoneWorld、PhoneHarness等5篇论文,系统覆盖环境、训练、执行、隐私与安全全链路。模型核心创新采用Real+Mock混合RL训练,将真实App与自建PhoneWorld mock环境结合,使4B模型在150项真机评测中多项指标超越GPT-5.4。
Mistral AI 推出最新文档识别模型,支持横跨10个语族的170种语言,在OmniDocBench基准上获得93.07分。相比GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞品,模型输出更受人类青睐。模型在输出文本的同时可提供边框、区域分类和置信度评分,支持RAG语义分块等下游工作负载。
OpenAI 发布首款自研推理芯片 Jalapeño,联合博通与 Celestica 打造,专为 ChatGPT、Codex 等模型量身定制。项目由前谷歌 TPU 核心成员 Richard Ho 主导,仅用 270 天完成从设计到流片,创高性能 ASIC 最快纪录。芯片通过优化数据搬运与资源平衡提升实际利用率,计划 2026 年底部署,每瓦性能大幅优于现有方案。
华为宣布鸿蒙”龙虾” 全机型开放,HarmonyOS 5.0 及以上机型只需将小艺 App 升级至 11.6.4.300 及以上版本即可使用。同时小艺 Claw 的套餐服务同步更新,49 元体验包上线 Auto-Model 模式,199 元标准包支持 、DeepSeek V4-Flash、、 四种模型自选。
阿里云推出新一代AI语音输入法,搭载千问大模型,支持语音实时转写、自动过滤口语冗余、识别自我修正及结构化整理。工具可理解用户意图生成制式文稿,支持上海话、粤语、四川话等多种方言转普通话。工具主打大模型深度赋能的语义级理解与文本再生成能力,区别于传统语音输入法仅做声学转写。
阿里云推出AI互动故事创作与阅读平台,支持从零起稿、文稿续写及长篇小说分章规划三种模式,覆盖网文、剧本、儿童故事等场景。阅读时AI实时生成场景背景图,读者可在关键节点选择剧情走向或自定义输入,平台即时续写并保持人设一致。
网易有道开源TTS模型。模型实现三大突破:3秒零样本语音克隆、14种语言跨语种无口音合成,以及情感韵律迁移。模型底层采用语音编码器+大语言模型+流匹配生成的端到端架构,完整54G权重支持本地离线部署。