AI 无涯日报 · 2026 年 6 月 5 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. Nex-N2-Pro 发布:基于 Qwen3.5 的 397B MoE 推理模型来源:SiliconFlow
neolab 推出 Nex-N2-Pro,基于 Qwen3.5-397B-A17B,总参数 397B 的 MoE 推理模型,支持 262K 上下文与多模态(VLM),性能达到 GPT-5.5 和 Claude Opus 4.7 级别。模型可自动调节推理深度,减少 30-50% 思考 token 且无性能折损,在 Terminal Bench 2.1、GDPVal、SWE-Verified 上取得 SOTA。擅长智能体编码、深度搜索和工具使用,兼容 Claude Code、Cursor 等工具。硅基流动已提供 T+0 支持,前两周免费使用。
2. NVIDIA Nemotron 3 Ultra:为长时间运行的智能体带来更快推理来源:NVIDIA / LMSYS
NVIDIA 发布 Nemotron 3 Ultra 模型,专为长时间运行的 ...
AI 无涯日报 · 2026 年 6 月 4 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. MiniMax M3 发布:稀疏注意力将百万 token 解码提速 15.6 倍来源:Fireworks AI / MiniMax (official)
MiniMax M3 引入 MiniMax Sparse Attention(MSA),在百万 token 长度下解码速度提升 15.6 倍。若数据属实,长文档应用的推理成本将大幅降低,合同审查、长篇小说生成等场景可立即试用。
2. Grok Imagine 1.5 预览版通过 API 开放来源:DogeDesigner / xAI
xAI 发布 Grok Imagine 1.5 预览版,即日起可在 API 中体验。图像生成军备竞赛再添新选手,开放 API 让开发者可直接对比 Midjourney 和 SD 的差距。
3. Miso One 发布:8B 参数开源情感 TTS 模型,110ms 低延迟来源:kimmonismus / Elvis Saravia (DAIR.A ...
AI 无涯日报 · 2026 年 6 月 3 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. 微软发布首款高级推理 AI 模型 MAI-Thinking-1来源:The Verge / Microsoft
微软在 Build 2026 上发布了其首款高级推理 AI 模型 MAI-Thinking-1。该模型被定位为”中等规模”,能在关键软件工程基准测试中达到领先水平。微软称其完全从头使用干净数据进行训练,未涉及从第三方模型进行知识蒸馏,标志着微软在自研 AI 模型上迈出重要一步,与此前主要依赖 OpenAI 的策略形成对比。
2. 微软三款多模态模型同步上线 OpenRouter来源:Microsoft AI
MAI-Image-2.5、MAI-Transcribe-1.5 和 MAI-Voice-2 三款模型同时上架 OpenRouter,覆盖图像生成、语音转录和语音合成领域。开发者可直接调用 API 集成到应用中,降低多模态能力接入门槛。
3. NVIDIA DGX Station GB300 开始发货来源:NVIDIA
搭载 GB ...
AI 无涯日报 · 2026 年 6 月 2 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. xAI 发布 Composer 2.5:专注长任务与复杂指令的编程模型来源:xAI
xAI 的最新编程模型 Composer 2.5 现已在 Grok Build 中可用。这是一款快速、先进的模型,擅长处理长时间运行的任务和复杂指令,面向 SuperGrok 和 X Premium+ 用户开放。
2. Qwen3.7-Plus:多模态智能体模型全面升级来源:通义千问 / Qwen
Qwen Studio 提供涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具使用及制品生成的全面功能。Qwen3.7-Plus 将多模态与 Agent 能力打包进一个模型。
3. Mellum2:JetBrains 推出 12B 混合专家模型来源:JetBrains / Hugging Face
JetBrains 发布 Mellum2 模型,采用混合专家架构,参数规模为 12B。这是 JetBrains 的首个自研模型,主打代码场景, ...
AI 无涯日报 · 2026 年 6 月 1 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. MiniMax M3 开源:1M 上下文,编码能力超越 GPT-5.5来源:MiniMax
MiniMax M3 是一个开源前沿模型,具备先进的编码与 AI 智能体能力。支持 100 万 token 超长上下文,采用新型 MSA(MiniMax Sparse Attention)稀疏注意力架构,每 token 计算成本降至前代的 1/20,预填充速度提升 9 倍以上。在 SWE-Bench Pro 上得分 59.0%,超越 GPT-5.5 和 Gemini 3.1 Pro,接近 Claude Opus 4.7。
2. NVIDIA RTX Spark:专为本地 AI 智能体设计的 Windows 电脑来源:NVIDIA
NVIDIA 发布 RTX Spark,提供 1 petaflops AI 算力与 128GB 统一内存。其 OpenShell 运行时与微软合作,基于新的 Windows 安全原语,确保智能体在设备端安全私密运行。通过多 to ...
AI 无涯日报 · 2026 年 5 月 31 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. NVIDIA 预告 ARM 笔记本芯片 N1X:整合 Blackwell GPU来源:NVIDIA
NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标,暗示 6 月 1 日发布会将有重大动作。这被视为 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合 CPU、基于 Blackwell 架构的 GPU 及 AI 单元,目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 从显卡供应商向整机核心方案提供商转型,直接冲击 Intel、AMD 和高通在 PC 市场的地位。
产品发布/更新2. Tesla FSD V14.3.3 完成全球首次横穿加拿大自动驾驶来源:Tesla
一辆特斯拉搭载 FSD V14.3.3 从温哥华出发,历时 4 天 21 小时,行驶 6,051 公里抵达哈利法克斯,全程零人工干预。所有驾驶操作(高速并线、复杂路况、自动泊车)均由系统自主完成,无任何系统退出或人工 ...
AI 无涯日报 · 2026 年 5 月 30 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. xAI 最大 GPU 客户放弃 JAX,自研 C 训练框架来源:JAX NVIDIA GPU & XLA
据报道 xAI 的最大 GPU 客户已宣布放弃 JAX GPU,宁愿用 Grok Build “氛围编程” 构建一个 C 训练框架。此前 xAI 的 JAX 堆栈 MFU(模型算力利用率)低于 10%,NVIDIA JAX 团队过去两年全力支持 xAI 却未能解决。这一事件表明 JAX 在大规模训练场景下的底层缺陷可能比预期更严重。
2. OpenAI 发布 gpt-realtime-translate — 实时语音翻译模型来源:OpenAI
OpenAI 推出全新模型 gpt-realtime-translate,可接收任意语言的语音输入,直接输出翻译后的语音。这是 OpenAI 在实时多模态翻译领域的重磅产品。
3. 小米开源 ControlFoley — 可控视频音效生成模型来源:小米大模型应用团队
小米发布开源可控视频音效生成模型 ...
AI 无涯日报 · 2026 年 5 月 29 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. Claude Opus 4.8 发布:编码、智能体技能与推理全面升级来源:Anthropic Newsroom
Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。同步推出的新功能包括:用户可控制任务投入程度、Claude Code 新增”动态工作流”特性,以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。该模型在 Online-Mind2Web 测评中得分 84%,超越了 Opus 4.7 和 GPT-5.5,代码错误漏检率降低了约 75%。
2. Grok Build 0.2.7 发布 — 新增用量查询与共享终端来源:xAI News
Grok Build 更新至 0.2.7 版本,新增 /usage 使用量查询、/login 登录功能、跨子智能体共享终端,并改进了图像理解能力。xAI 持 ...
AI 无涯日报 · 2026 年 5 月 28 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
产品发布/更新1. Runway 推出 Model Context Protocol 服务器Runway:News(网页)
Runway 正式推出 Runway MCP 服务器,允许任何兼容 MCP 的 AI 智能体(如 Claude、ChatGPT、Cursor)在对话界面中直接生成图像与视频,无需切换工作流。该服务器接入了 Runway 最新的多款 SOTA 模型,包括 Gen-4.5、Seedance 2.0、GPT Image 2、Kling 3.0 及 Nano Banana Pro。其应用场景涵盖为产品制作营销视频、批量生成网站视觉素材、创作角色广告以及在应用开发中集成视觉内容。用户设置简便,通过 runwayml.com/mcp 添加服务器并登录现有 Runway 账户即可使用,无需单独申请 API 密钥。
2. Claude Code v2.1.152 更新发布Claude Code:GitHub Releases(RSS)
Claude Cod ...
AI 无涯日报 · 2026 年 5 月 27 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新1. 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题IT之家(RSS)
2. 面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上IT之家(RSS)
面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数,在AA-Index榜单上超越所有2B参数以下模型,相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB,支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,现已全面开源模型权重、训练数据集与部署方案。
3. 腾讯混元新翻译模型双榜亮眼,小程序发布X:腾讯混元 (@TencentHunyuan)
腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本 ...
