Lucius 完成数百万美元天使轮融资,由明势创投领投,蓝狮资本担任独家财务顾问。Lucius 聚焦企业组织记忆缺失痛点,通过 AI Teammate 记录问题判断非仅存储答案,已服务 30 余家客户。典型案例 Dubbing AI 接入后社区自解决率从 29% 跃升至 88%。
腾讯内测操作系统级 AI 助手腾讯Marvis,由应用宝团队开发,可在用户电脑本地部署 6 个 AI 智能体协同工作。产品支持自然语言指令完成文件管理、系统设置调整、跨模态内容检索及多任务自动化执行,采用云端效率与本地隐私双模式运行,敏感操作设 L2 级硬垂询确认
OpenHuman连续霸榜GitHub Trending第一,获9k+ Star。OpenHuman无需用户调教,可一键连接118+服务(Gmail、GitHub等),每20分钟自动同步数据并构建卡帕西式本地记忆树,同时兼容Obsidian。工具内置TokenJuice技术能降低80% Token消耗,支持虚拟形象参会及后台自主执行。
xAI推出首款 AI 编程智能体Grok Build,对标Claude Code,支持并行Subagents、兼容现有工作流与MCP,具备计划模式与终端内图像视频生成能力,目前面向SuperGrok Heavy订阅用户开放。与此同时,xAI正经历动荡,马斯克将xAI并入SpaceX并更换logo。
LibTV团队版正式上线,定位为AI视频专业级协作工作台。LibTV团队版提供专属项目空间、多人实时画布协作、统一资产库、分级权限管理、共享积分池及成员资产自动交接六大功能,面向AI视频工作室、短剧承制方、品牌市场部及企业内容团队。
腾讯推出探索型vibe coding产品吐司,定位应用生成及灵感共创平台,用户无需代码基础,自然语言描述可让AI完成从功能拆解到App打包的全流程。产品支持创造应用、社交分享、灵感广场复刻创作及AI应用搜索,构建”想法→应用→分发→共创”闭环。
腾讯AI设计工具Ardot正式全面公测,面向产设研团队开放。Ardot支持文/图生成UI设计稿、局部修改及批量图标,通过MCP协议实现设计稿一键转代码,兼容CodeBuddy、Cursor等IDE。产品具备多人协作、权限管理与开发者模式,深度兼容Figma且性能更优。
OpenAI 宣布 Codex 正式登陆 ChatGPT 手机 App,iOS 与 Android 双端同步开启预览,免费用户也能使用。用户可随时随地在手机上审批代码、查看线程动态、批准命令或启动新项目,Codex 在本地或远程环境中持续运行,状态实时同步至移动端。OpenAI 同步推出远程 SSH 连接、程序化访问令牌、Hooks 及 HIPAA 合规支持,进一步扩展团队自动化与安全管理能力。
月之暗面推出 Kimi WebBridge 浏览器插件,面向 Kimi Code、Claude Code、Cursor、Codex 等本地 AI Agent,让 AI 携带用户登录状态与 Cookie 直接操作浏览器,实现点击、滑动、输入、填表、跨站信息整合等自动化任务。用户只需在 Chrome/Edge 安装扩展并运行一条命令安装本地守护程序即可使用。
阿里推出 Qoder 1.0,从 AI IDE 升级为智能体自主开发工作台。新版本推出 Quest 独立视窗,支持跨项目多任务并行;整合记忆、Repo Wiki 与知识卡片为团队级知识引擎,引入 Experts 专家团及自定义 Agent 团队。目前 Windows、macOS 和 Linux 全平台已开放下载。
阿里云发布企业级 AI 建站平台万小智 2.0,启用全新升级品牌 LOGO 与虚拟人形象。新版本从单纯生成页面扩展为建站全链路覆盖:支持行业模板、参考网站一键搭建及专业需求文档生成;原生集成域名注册、ICP 备案、SSL 证书与一键部署,实现合规上线;配备可视化管理后台、智能问答与创意中心,交付可持续运营的线上阵地。
墨刀AI正式上线AI生成App功能,用户一句话描述需求,AI会主动反问对齐产品定位、视觉风格等细节,智能选定Ant Design、Shadcn UI等主流设计系统,快速生成基于React/HTML代码的高保真App应用。生成的设计稿可一键切换查看前端代码,直接交付开发。
小米具身智能团队开源Xiaomi OneVL一步式潜空间语言视觉推理框架。模型在业内率先实现 VLA、世界模型与潜空间推理的统一,兼具强悍推理能力与高速响应,精度超越显式 CoT,速度对齐潜空间 CoT 方案。在 ROADWork、Impromptu、Alpamayo-R1 等多项基准上达到 SOTA,提供语言与视觉双维度可解释性。
Runway正式推出Runway Agent,对话式AI视频创作智能体。用户仅需描述需求,Agent在单轮对话中完成从概念构思、故事分镜到视觉方向的全流程规划,自动生成包含多场景、配音、对白及配乐的高分辨率成品视频。
字节跳动旗下豆包输入法macOS版本正式上线,苹果电脑用户可通过语音实现”用嘴打字”。macOS版本基于豆包App同款语音模型,支持任意输入框实时语音转文字,边说边出字且无时长限制。功能上支持多种方言及中英混说,可智能修正语气词、语病和口误,能记住用户个性化改词习惯等。
谷歌在安卓Show大会上推出首款为Gemini量身打造的Googlebook笔记本,搭载智能光标并支持跨设备体验。同时发布安卓版Gemini Intelligence,支持跨App自动执行多步骤任务、Chrome集成Gemini插件、Rambler语音转文字及自定义桌面组件。谷歌还与苹果联手新增端到端加密RCS,预告下周I/O大会将抢先预览智能眼镜。
MiniMax推出MiniMax Agent升级版Mavis,上线Agent Teams功能,支持多角色Agent并行协作,通过Owner、Worker、Verifier架构解决单Agent停摆、漂移等痛点;同时合并TokenPlan与Agent Plan,一份订阅打通CLI、API、Agent全链路,覆盖M2.7及音视频模型,Credits额度灵活共享。
前阿里千问大模型技术负责人林俊旸已正式创业,聚焦世界模型与具身大脑。他已招募来自字节、腾讯及海外背景的核心成员,以约20亿美元估值启动融资,接触红杉中国、高榕创投等机构。此前,林俊旸因阿里云计划拆分Qwen团队离职,具身智能也是其在阿里未竟之业。
Anthropic为Claude Code推出Agent View研究预览版,支持开发者在一个终端界面内同时调度、监控多个并行AI会话,无需多开窗口。用户可实时查看各任务状态,随时介入回复或切换会话且不丢进度。功能支持后台持续运行,将Claude Code从单线程对话工具升级为多任务”指挥中心”,适用所有付费计划。
OpenAI宣布成立OpenAI Deployment Company,获超40亿美元初始投资并收购英国AI咨询公司Tomoro,将150名前沿部署工程师嵌入企业,帮助客户将AI部署到销售、法务等核心业务流程,从模型提供商转型为AI经济部署层。同时推出AI网络安全工具Daybreak,整合最强模型、Codex及安全合作伙伴,自动化漏洞发现与修复,加速网络防御并持续保障软件安全。
商汤办公小浣熊桌面版2.0升级发布,从”桌面入口”转型为”执行助手”,新增六大能力:直接读取本地20+格式文件、一句话操控浏览器、⌘K全局快捷唤起、连接飞书/企微/钉钉、本地跨会话记忆、定时自动执行任务。现Mac端已开启首批内测招募,限时免费使用,Windows端预计5月中下旬上线。
OpenBMB开源 MiniCPM-V 4.6 端侧多模态大模型,LLM 参数量仅 1.3B,模型总体积约 1.6GB,最低 6GB 内存即可流畅运行。模型基于 llama.cpp 框架,完整支持 iOS、Android、HarmonyOS NEXT 三大平台纯本地离线部署,具备图像理解、OCR、视频理解等多模态能力。
码上飞宣布全新升级,进化为”用AI帮你做生意”的一站式平台。用户用中文可一句话生成微信小程序、App及网站。新版本为每个应用自动配备专属AI员工,支持内容创作、客户回复、数据分析等运营。同时自动生成管理后台集中管理订单、商品与经营数据,助力个人及小团队零门槛跑通业务。
千问APP与淘宝全面打通,用户更新至6.9.1版本后,可在千问内直接完成商品挑选、对比及下单。依托AI能力,千问支持复杂条件精准筛选、模糊需求智能理解、场景化商品组合推荐,能识别”智商税”理性劝退,实现从搜索到购买的全链路AI购物体验。
具身智能底层基础设施公司 Uncharted Dynamics 完成数百万美元种子轮融资,由险峰长青领投。公司聚焦高精度多体动力学求解器研发,为具身智能提供物理层面的”真值地基”,解决现有仿真系统在刚柔耦合、柔性接触等复杂交互中物理失真、导致模型难以迁移至现实的问题。
2026移动云大会在苏州召开,中国移动围绕”算力新动能、智能新空间”为主题,设8大分论坛及8000㎡展区,吸引超10万人次观展。中国移动发布三大首创:桌面级AI办公智能体MobileClaw、大模型聚合平台MoMA、支持电话交互的移动AI云电脑,和AI-eSIM卡及万亿级Token服务体验包,布局吉瓦级AI数据园区。
火山引擎正式推出Agent套餐包Agent Plan,首次将多模态模型与Harness工具深度整合。套餐聚合字节跳动自研的Doubao-Seed、Seedance、Seedream系列及GLM-5.1、Kimi-K2.6等主流模型,内置联网搜索、embedding等工具,适配Claude Code、OpenClaw等平台。
谷歌云智能体开源官方命令行工具agents-cli,专为简化企业级 AI Agent 从开发到部署的全生命周期设计。工具集成 Gemini CLI、Claude Code、Codex、Cursor 等主流编程 Agent,内置 Workflow、Scaffold、Eval、Deploy 等7个技能包,支持本地模拟评估、自动化部署至 Cloud Run/GKE,提供人工模式随时接管流程。
腾讯QClaw正式上线「文件空间」功能,一次授权可打通本地文件、腾讯文档与ima知识库。用户可直接在QClaw内调用腾讯文档和ima资料让AI处理,生成内容后一键保存为腾讯文档并生成协作链接,或沉淀回ima知识库。实现从资料调取、AI加工到团队协作的全流程闭环。
阶跃星辰正式推出新一代实时语音大模型StepAudio 2.5 Realtime,模型具备三大核心能力:顶级副语言能力,可精准感知语调、语速、停顿等情绪细节;千万人设自定义,支持从性格到口癖的精细调节,打造专属AI角色;对话双商领跑,在情商与智商上双重进阶。
百度文心 5.1正式上线,总参数压缩至文心 5.0 的约 1/3、激活参数约 1/2,预训练成本仅为业界同规模模型的 6%。模型在 Arena 搜索榜以 1223 分位列全球第四、国内第一,Agent 能力超越 DeepSeek-V4-Pro,AIME26 数学竞赛得分 99.6 仅次于 Gemini-3.1 Pro。
蚂蚁百灵正式推出Ring-2.6-1T,模型采用万亿级参数规模,在推理、编程、多模态理解等能力上实现显著提升。百灵团队通过创新的训练架构优化,在保证模型性能的同时有效降低推理成本。Ring-2.6-1T 已面向开发者和企业用户开放 API 调用,支持文本、图像、代码等多种任务场景,进一步丰富国内大模型生态的选择。
通义灵码推出RepoWiki功能,支持为代码库自动生成覆盖模块关系、接口定义与实现逻辑的结构化知识文档,解决 AI 编程工具碎片化理解代码的痛点。RepoWiki支持全量生成、增量更新与 Git 目录同步,Wiki 文件可随代码提交实现团队共享。Repo Wiki 目前处于 Beta 阶段,面向企业标准版与专属版用户开放免费体验,
OpenAI 宣布推出GPT-5.5-Cyber限量预览版,优先向经过审核的网络防御者开放。模型基于 Trusted Access for Cyber(TAC)框架,在 GPT-5.5 基础上降低安全相关任务的拒绝率,支持漏洞验证、恶意软件分析等防御工作流,同时保留对恶意活动的防护。
OpenAI推出三款实时语音模型:GPT-Realtime-2具备GPT-5级推理与工具调用能力;GPT-Realtime-Translate支持70多种语言实时互译,每分钟成本仅约0.25元,较人类同传降低百倍;GPT-Realtime-Whisper实现低延迟语音转录。三模型均通过Realtime API开放,端到端处理保留语调情感。
商汤推出新一代轻量化多模态智能体模型SenseNova 6.7 Flash-Lite,采用原生多模态架构实现”看、想、做”一体化,Token 消耗较纯文本智能体直降 60%,在多项权威智能体基准测试中获同级别 SOTA。同时同步推出 SenseNova Token Plan 限时免费,支持每 5 小时 1500 次调用。
美团推出 AI 原生社区觅游并开启公测。产品定位为面向大模型与 Agent 的共生社区,首创养虾模式,用户饲养的 AI Agent 虾可协助寻找赚钱机会、结识伙伴。目前平台已入驻超 3000 个 Agent、汇聚 4 万余项 Skill。
360集团旗下360 AI办公平台推出 AI PPT 工具 JJT,支持一句话生成、文档/大纲转 PPT、长内容总结汇报等创作模式,兼容 PDF、DOC、PPTX 等十余种格式上传。工具智能编辑能力涵盖一键换风格、精准配图、电影级转场、数据转图表及 AI 撰写演讲稿,支持 PPTX、HTML、PDF 多格式导出。
共绩科技宣布完成近亿元Pre-A轮融资,由春华创投、彼岸时代联合领投。公司独创”电网式算力调度网络”,整合全球闲时、异构算力资源,通过AI算法实现供需动态匹配,让算力像电力一样按需取用、按量计费。平台已服务超5000家团队及企业,帮助客户降低算力成本超50%,典型客户包括LiblibAI、Remy等。
OpenAI 正式推出Codex Chrome扩展插件,支持 Codex 直接操作用户已登录的 Chrome 浏览器,包括读取打开标签页、页面内容及已登录网站信息,支持导航、点击、输入和截图等交互操作。用户可随时停止任务并在设置中管理访问权限,与新网站交互前需经确认。
Anthropic 在 Code with Claude 开发者大会连放数招:Claude Code 调用限额翻倍至 10 小时并取消高峰削减,Claude Opus API 速率限制大幅放宽;托管智能体新增多智能体编排、目标结果与自主推演三大能力;Claude Code 更新远程控制、无闪烁渲染等十余项功能,同时与 SpaceX 达成算力合作。
月之暗面(Kimi)完成约20亿美元D轮融资,投后估值突破200亿美元,创中国大模型最大单笔融资纪录。本轮由美团龙珠领投,中国移动等参投,累计融资超44亿美元居国内大模型创业公司之首。公司4月年度经常性收入超2亿美元,并发布开源旗舰模型Kimi K2.6。
据《金融时报》报道,国家集成电路产业投资基金(大基金)正洽谈领投 DeepSeek,本轮估值接近 450 亿美元(约 3067 亿元),较半月前 200 亿美元翻倍。创始人梁文锋或亲自跟投,腾讯、阿里亦在洽谈参投。大基金此前从未投资 AI 大模型公司,DeepSeek 为首家。
字节跳动开源全球首个25B级统一多模态模型Mamoda2.5,基于Qwen3-VL-8B架构,总参数250亿每次仅激活约3亿。模型实现了文生图、文生视频、视频编辑等全任务SOTA,推理速度比阿里Wan2.2快12倍、比美团LongCat Video快18倍,视频编辑延迟仅9.2秒。模型在多项视频编辑基准测试中排名第一,性能接近闭源Sora和Kling。
无问芯穹宣布再获超7亿元融资,由杭州高新金投集团和惠远资本联合领投,持续稳居中国AI原生基础设施公司融资规模之首。公司首发”AI生产力公式”,定位Token经济枢纽,其Agentic MaaS平台日均Token调用量较去年底增长超20倍。
OpenAI 联合 AMD、博通、英特尔、微软、英伟达五大巨头推出多路径可靠连接(MRC)协议,通过 OCP 向全行业开源。MRC 基于 RoCE 扩展,采用多平面网络设计与自适应数据包喷淋技术,将数据包分散至数百条路径并行传输,避免网络拥塞与热点,使故障恢复从秒级缩短至微秒级。
像素绽放PixelBloom完成C轮融资,由国科投资与商汤国香资本联合领投。公司从AI视觉表达平台全面跃迁为”AI办公解决方案Agent”,推出全球首个营销方案Agent”小方同学”,实现从”生成内容”到”交付结果”的质变。C端产品AiPPT已覆盖3000万用户,B端深度嵌入联想、华为等硬件生态及中信证券、安利中国等头部企业。
据IDC报告,2025年中国企业级MaaS市场规模达1944万亿Tokens,同比增长16倍。硅基流动作为唯一创业公司跻身公有云MaaS前四,与火山引擎、阿里云、百度智能云同处第一梯队,验证”第三类MaaS”模式价值。