SpaceX宣布以全股权交易600亿美元收购AI编程工具母公司Anysphere,Cursor将成为SpaceX全资子公司,预计2026年Q3完成交割。SpaceX刚完成纳斯达克上市,市值达2.5万亿美元。Cursor年度B2B收入约26亿美元,此前底层模型依赖Anthropic和OpenAI,面临断供风险;并入后可用xAI超算训练自有代码模型。
完成首次对外融资,募资超 500 亿元(约 74 亿美元),估值超 500 亿美元(约 3380 亿元),创国内 AI 行业最大单笔融资纪录。交易结构特殊:资金需投入梁文锋管理的有限合伙企业,外部投资者股份锁定五年且无投票权;国家 AI 产业投资基金例外,直接投资 10 亿元。梁文锋个人出资 200 亿元,腾讯、宁德时代等参投。
智谱科技上线并开源 模型,在 Code Arena 前端评估中位列全球可用模型第一。模型专为长程任务设计,支持 1M 无损上下文,在 FrontierSWE 等基准上表现接近 。GLM-5.2 引入 effort level 控制,通过 IndexShare 架构优化降低 FLOPs,原生适配华为昇腾等国产算力。
小米推出正式版,搭载旗舰模型,原生适配OpenClaw框架与MCP协议,支持百万级超长上下文。联动金山办公生态,实现Word、Excel、PPT、PDF全链路文档生成与编辑闭环。产品采用云端免部署架构,提供7×24小时专属Agent服务。
微信支付正式推出,率先接入。用户只需一句话,AI可代为查找餐厅、领取优惠券、团购下单并完成支付。资金安全采用专款专用+笔笔确认机制,每笔支付需用户手机端亲自授权。目前仅支持WorkBuddy mac电脑版5.1.1及以上版本,用户可在专家页面召唤美团生活助手体验。
开源原生多模态旗舰模型,总参数 428B、激活参数 23B,采用自研 MSA 稀疏注意力架构降低长上下文计算成本,是首个从 Step 0 开始多模态混合训练的开源模型。发布后在 Artificial Analysis 综合智能指数、GDPval-AA、Code Arena WebDev 等多个榜单取得开源模型第一,获 Vercel CEO 及 YC 创始人等业界好评。
支付宝推出,用户右滑可进入清爽对话界面,用语音或文字指令办理政务、出行、生活等上万项服务,实现对话即服务。涉及资金变动需用户本人确认,保障安全。AI版已开启邀测,与经典版可自由切换,平台同步开放服务生态,面向10亿用户推进普惠AI。
硅基流动近日完成超20亿元B轮融资,由携程、晶科能源、金蝶、联通、壁仞、蔚来、商汤、巨人网络、国泰君安、纪源资本等产业链头部企业与知名机构联合投资,华兴资本担任独家财务顾问。公司定位”Token工厂”模式,日均Token调用量达数万亿,服务超1000万用户及1万家企业客户,营收同比增长超10倍。
阿里通义推出 机器人基础模型套件,包含 RobotNav(导航)、RobotManip(操作)与 RobotWorld(世界预测)三大模型,通过语言优先接口将视觉语言模型与物理动作对齐。套件在导航、操作、世界模型等10余项基准上达到SOTA。
上线视频生成模型,主打极致性价比,720P单秒生成成本低至0.16元,用更低价格实现相同生成效果。模型面向广大创作者开放,用户可前往即梦网页端抢先体验首发价,享受高性价比的AI视频创作服务。
火山引擎旗下火山方舟体验中心上线Seedance 2.0 mini视频生成模型,并将于近期开放API服务。模型定位高性价比,面向广泛视频创作与规模化生产需求。图生视频定价0.023元/千tokens,视频生视频0.014元/千tokens;按720P规格折算,单秒生成成本约0.5元,相较成本降低约50%。
智谱推出模型,支持1M上下文,模型长程任务领先,定位最强国产Coding模型。GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite / Pro / Max / 团队版。GLM-5.2 API 本周将上线,同时模型也将开源,遵循 MIT 协议。
Kimi K2.7 Code 高速版,模型ID:kimi-k2.7-code-highspeed已上线 Kimi API 开放平台,输出速度达普通版 5-6 倍,定价为普通版 2 倍。 相比 在长上下文编程、token 效率上显著提升,平均 token 消耗减少 30%,基准测试性能提升 11%-31.5%。
大晓机器人完成天使+轮融资,上半年累计融资数亿美元,达晨财智、深创投等参投。资金将投入世界模型及软硬一体解决方案。为全球首个开源量产世界模型,多项权威评测第一,支持7分钟长时序视频生成,已实现端侧部署。
上线 服务,通过多模型并行作答与裁判模型融合,实现高性价比智能输出。DRACO 基准显示,Gemini 3 Flash、Kimi K2.6 与 DeepSeek V4 Pro 的预算组合以半价取得 64.7% 得分,逼近 的 65.3%。该机制具备单模型故障自动替补的鲁棒性,支持 API 直接调用与自定义模型组合。
百度飞桨正式推出,首次推出Tiny/Small/Medium三档模型。模型检测与识别精度较v5提升4.9%和5.1%,CPU推理速度最高达前代5.2倍。模型支持50种语言,新增电路板、数码管等工业场景,鲁棒性史上最高。模型现已上线官网并开源至GitHub和HuggingFace。
月之暗面开源编程模型,相比在长上下文编程、指令遵循及Agent自主执行能力上显著提升,代码基准测试提升11%-31.5%,token消耗减少30%,API定价与K2.6持平。模型须开启思考模式发挥最佳性能。
MiniMax推出的桌面端多模态创意Agent平台正式上线。平台将文案、图像、视频、音频等多模态Agent整合到同一画布上,支持多Agent并行工作流,实现从创意构思到成片输出的一站式创作。用户只需输入创意简报,平台可自动调度各Agent协同完成内容生产,涵盖营销短片生成、长视频拆条、品牌物料批量出图等场景。
OpenAI 宣布收购初创公司 Ona,为编程助手 提供安全、预配置云环境。Ona 技术将帮助 Codex 执行更长时间任务,支持用户将 AI 智能体安全部署到生产环境,同时强化企业对基础设施、数据资产和安全边界的掌控。双方未公布交易金额,Ona 团队将加入 OpenAI 参与 Codex 项目研发。
Nous Research 为 推出 Profile Builder,将原本分散的命令行配置整合为网页端一站式可视化流程。用户通过5步可完成智能体角色创建:设定身份名称与描述、选择模型与服务商、配置内置技能、安装 Skills Hub 技能、接入 MCP 服务器,最后预览确认。
Visa 宣布与 OpenAI 达成战略合作,双方将推动智能体商业进入市场,探索 AI 智能体交易新模式。Visa 将把全球支付网络、支付标记化、授权机制、身份识别及欺诈检测技术引入 OpenAI 产品,确保 AI 发起的交易安全可控,最终决策权仍保留在用户手中。同时双方将探索把支付能力整合到开发者工具中。
小米大模型团队开源终端AI编程助手 ,内置限时免费的 模型,同时支持 DeepSeek、Kimi 等主流模型。核心特性包括独创持久记忆系统、Compose 模式实现全流程自动开发、/dream 命令定期整理记忆,以及语音输入控制。在 SWE-Bench Pro 和 Terminal Bench 2 基准上,相同模型下表现优于 Claude Code。
智象未来推出商用图像生成模型,在 Artificial Analysis 文生图榜单上以 1265 ELO 位列全球第三、中国第一,仅次于 OpenAI 的 GPT Image 系列,超越 Google、NVIDIA 及字节跳动等主流模型。模型基于原生全模态架构 UiT,在语义遵循、文字渲染、复杂排版及多主体一致性上表现突出。
阿里开源命令行工具,帮助本地AI编程项目一键部署上线。安装后,、、等本地Agent可通过自然语言调用云端能力,自动完成数据库接入、用户登录、文件存储、AI模型调用及项目发布,10分钟内将本地Demo变为可访问的线上应用。
科大讯飞推出智慧空间Agentic架构,推动智能家居从被动响应进入L2.5主动智能时代。SpaceMind用毫米波雷达为核心感知源,实现5厘米级定位与呼吸级微动检测;采用双路由架构与本地语义模型+云端大模型协同,设备控制响应低至700毫秒。系统具备持久记忆、多Agent协作和主动服务能力,可基于用户习惯自动调节环境。
专注数字人与AIGC视频生成的八点八数字公司宣布,旗下AI短剧协作平台完成近亿元融资,由北京泰中合领投。本轮资金将重点用于技术研发与创作者生态建设。平台通过打通短剧创作全流程,解决行业制作成本高、周期长等痛点。
GUI Agent 执行平台 Core-Mate 完成数千万元融资,由敦鸿资产独家投资。团队核心成员来自字节跳动,曾在抖音、豆包担任产品经理。Core-Mate 让 AI 真正接手网页和 App 中的真实操作,通过开源的 OpenGUI 框架融合视觉、控件树与页面状态实现稳定屏幕语义理解。
Anthropic推出Claude最强模型,性能全面超越前代,在SWE-Bench Pro等基准大幅领先。模型可在1天内完成5000万行代码库迁移,且Token效率更高。Anthropic同时推出无护栏版Claude Mythos 5,仅向Glasswing合作伙伴开放。Claude Fable 5设有安全护栏,敏感请求降级至。
字节跳动旗下 宣布 TRAE SOLO 正式升级为 ,品牌内涵从The Real AI Engineer拓展为The Real AI Enabler。TRAE Work 面向更广泛的真实工作场景,包含 Work 模式与 Code 模式。TRAE Work 已覆盖 PC、移动端和 Web 三端,支持多任务并行,并于5月完成与飞书打通。
蚂蚁集团推出AI应用生成平台,用户通过一句话自然语言描述可零代码生成可运行应用。平台内置灵感橱窗辅助创意,依托支付宝账号体系保障安全。目前产品处于内测阶段,需邀请码使用,旨在大幅降低应用开发门槛,实现从创意到产物的极速跨越。
谷歌正式推出实时语音互译模型,可自动识别 70 余种语言,生成保留原说话者语调、语速和音高的流畅翻译语音。模型在等待上下文与即时翻译间取得平衡,仅比说话者慢几秒。模型已面向开发者开放 Gemini Live API 预览,企业用户可在 Google Meet 中使用,普通用户可通过谷歌翻译 App 体验。
阿里上线国内首个全周期高考志愿填报Agent,为全国考生免费提供志愿填报服务。产品基于千问高考志愿大模型和夸克8年高考数据,具备志愿日历、志愿报告和志愿问答三大能力。志愿报告实现Agent化升级,支持细节需求捕捉与实时动态调整。
高德地图推出,首个3D原生城市世界模型。模型支持图像、文本等多模态输入,可在消费级单卡GPU上10分钟内生成1平方公里高保真3D城市场景。模型基于3D Gaussian Splatting表示,采用原生LoD解码器和滑窗无缝推理策略,覆盖全球190余个国家和地区、300余城市。
小米联合TileRT推出 UltraSpeed模式,在通用GPU上实现万亿参数模型生成速度首次突破1000 tokens/s。该模式定价为普通版的3倍,输出速度提升约10倍,仅支持API体验。MiMo-V2.5-Pro UltraSpeed模式采用申请制限时开放,优先审核企业与专业开发者。
井英科技(CreativeFitting)完成数千万美元A轮及A+轮融资,投资方包括王慧文家办、蚂蚁集团等,同时宣布原AWS首席应用科学家王敏捷加盟任首席科学家。公司定位为内容行业首家Agent原生公司,以AI短剧为首个场景,构建创作者Agent可接入、可自我进化的强化学习环境,通过真实消费反馈驱动迭代。