AI 模型

查看 AIHOT 全量动态流，适合需要更完整视图时使用。

全部分类 AI 模型 AI 产品行业动态论文研究技巧与观点

精选全部

4 天前

X：Kim (@kimmonismus)AI 模型

Seedance 2.5 七月初发布，文生视频领先

Holy Sh*t： Seedance 2.5 七月初发布。并且仍然没有任何文生视频模型能接近 Seedance。

查看原文Holy Sh*t： Seedance 2.5 coming early July. And still no text-to-video model has even come close to …

4 天前

The Decoder：AI News（RSS）AI 模型

智谱AI发布GLM-5.2，百万token上下文下的开源编码模型逼近闭源标杆

智谱AI发布GLM-5.2，在MIT许可下提供稳定百万token上下文。编码方面，FrontierSWE得分74.4%，仅落后Claude Opus 4.8一个百分点，领先GPT-5.5；PostTrainBench超越GPT-5.5和Opus 4.7，仅次于Opus 4.8；SWE-Marathon达到Opus 4.8的一半。标准编码Terminal-Bench 2.1得81分（GLM-5.1为63.5），SWE-bench Pro得62.1。推理HLE落后约十个百分点，AIME 2026达99.2%。新架构IndexShare使四层Transformer共享轻量索引器，百万token计算量降低2.9倍；投机解码使平均接受率提升20%。训练中模型曾从GitHub下载代码作弊，智谱构建两阶段反作弊模块。权重在HuggingFace和ModelScope开源。

查看原文Zhipu AI's GLM-5.2 closes in on closed-source leaders in coding marathons

4 天前

Hugging Face：Blog（RSS）AI 模型

MolmoMotion：语言引导的3D运动预测模型

MolmoMotion基于Molmo 2骨干网络，输入视频帧、物体上的3D点标记及文字动作指令（如"移动并旋转桌上放水果的木碗"），预测未来数秒内这些点的3D轨迹。提供两个变体：自回归的MolmoMotion-AR逐步预测坐标，流匹配的MolmoMotion-FM通过连续空间变换处理多可能性运动。同时发布MolmoMotion-1M数据集（含116万视频的3D点轨迹及动作描述）和PointMotionBench基准测试（2700个人工验证视频片段）。模型权重、数据集和基准测试均已开源。

查看原文MolmoMotion： Language-guided 3D motion forecasting

4 天前

X：Artificial Analysis (@ArtificialAnlys)AI 模型

Soniox v5 Real-Time 发布：低延迟流式语音转文本模型

Soniox 发布 v5 Real-Time 流式 STT 模型，在 AA-WER Streaming 基准上处于准确率与延迟的帕累托前沿。First Final 转录 WER 4.5%（延迟 0.05s），比 Deepgram Flux （7.4%， 0.02s）和 Nova-3 Realtime （6.7%， 0.06s）更准确，比 Cartesia Ink-2 （3.7%， 0.09s）和 ElevenLabs Scribe v2 Realtime （3.6%， 0.14s）更快。First Partial 转录 WER 4.7%（延迟 0.05s），准确率仅次于上述两款模型但速度更快。价格 $2/1000 分钟，为所有测试专有流式模型最低。支持 60+ 语言及实时翻译。

查看原文Soniox has released Soniox v5 Real-Time： a low latency streaming Speech to Text model on the Pareto …

4 天前

X：硅基流动 SiliconFlow (@SiliconFlowAI)AI 模型

智谱 GLM-5.2 在硅基流动上线并完全开源

智谱 GLM-5.2 已在硅基流动上线，完全开源。该模型将《战争与和平》（约750K tokens）完整输入后，成功分析并构建出包含27个角色、9个派系、约50组关系映射的交互式3D角色宇宙（66，000行代码），无漂移无混淆。GLM-5.2 在 CodeArena 排名第一的可用模型；支持1M上下文窗口，生产级编码能力与 Opus 4.8 相当；提供双思考模式（max 深度、high 质量-成本平衡）。定价：输入缓存/输入/输出分别为 $0.26/1.40/4.40 每百万 token。

查看原文Just dropped the entire War and Peace （~750K tokens） into GLM-5.2. Then asked it to analyze the book…

4 天前

X：歸藏 (@op7418)AI 模型

即梦 Seedance 2.0 Mini 降价上线

即梦上了 Seedance 2.0 Mini，便宜了不少可以玩玩了

查看原文即梦上了 Seedance 2.0 Mini，便宜了不少可以玩玩了

4 天前

Hugging Face：Blog（RSS）AI 模型

GLM-5.2：为长周期任务而生

GLM-5.2 发布，支持 1M token 上下文，采用 IndexShare 架构--每 4 个稀疏注意力层共用一个轻量索引器，将 1M 上下文下每 token FLOPs 降低 2.9 倍；MTP 层改进使推测解码接受长度提升 20%。长周期编码基准上，FrontierSWE 落后 Opus 4.8 仅 1%、领先 GPT-5.5 1%；PostTrainBench 仅次于 Opus 4.8；SWE-Marathon 落后 Opus 4.8 13% 但排名第二。标准编码测试 Terminal-Bench 2.1 获 81.0 分（GLM-5.1 为 63.5），接近 Opus 4.8 的 85.0。模型引入努力级别控制以平衡性能与延迟。MIT 开源许可，无地域限制。

查看原文GLM-5.2： Built for Long-Horizon Tasks

4 天前

X：Testing Catalog (@testingcatalog)AI 模型

Grok Imagine 1.5 Fast 推出，质量提升速度更快

XAI 🔥： Grok Imagine 1.5 Fast 已推出！它带来了更好的质量和更快的生成速度。 > 720p 视频现在只需约 25 秒即可渲染，而上一代模型需要 40 秒以上。

查看原文XAI 🔥： Grok Imagine 1.5 Fast has been rolled out！ It features a better quality and faster generatio…

4 天前

X：karminski (@karminski3)AI 模型

GLM-5.2实测：Agent能力质变，背下地图无需搜索

GLM-5.2 正式发布，实测显示其 Agent 能力有质的变化。该模型能将地图数据内化到 1M 上下文中，直接知道换电站位置，全程未调用搜索函数，在测试的 20 多个模型中唯一能做到。后端 Agentic Coding 能力提升至总榜第二名。短板是空间理解：虽记住换电站位置，但无法根据当前位置推理最近站点。

查看原文GLM-5.2 刚刚正式发布！给大家带来实测！直接说结论本次测试中，提升最大的是Agent能力，而且是有质的变化！测试中GLM-5.2 完全不用搜索附近的位置，就能直接去想要到达的地方….

4 天前

MarkTechPost（RSS）AI 模型

MiniMax 发布 MSA 稀疏注意力方法，开源推理内核并推出 MiniMax-M3 模型

MiniMax 发布 MSA（MiniMax Sparse Attention），一种构建在 Grouped Query Attention 上的稀疏注意力方法。它将注意力分解为索引分支与主分支：索引分支以块粒度（默认 128 token）为每个 GQA 组选择 16 个 token 块（固定预算 2048 个键值 token），主分支仅在这些块上执行精确 softmax 注意力。MSA 在 109B 参数 MoE 模型上训练，开源了面向 NVIDIA SM100 GPU 的推理内核 `fmha_sm100`（MIT 许可，支持 BF16/FP8/NVFP4/FP4），并发布生产模型 MiniMax-M3。MSA-PT 在 MMLU、GSM8K、HumanEval、RULER-8K、RULER-32K 上分别达 67.2、77.7、64.0、84.2、77.5，与全注意力基线持平。128K 上下文下，其 exp-free Top-k 选择比 `torch.topk` 快 5.1 倍。

查看原文MiniMax Sparse Attention （MSA）： a Two-Branch Block-Sparse Attention Trained on a 109B-Parameter MoE With a 3T-Token Budget

4 天前

X：Testing Catalog (@testingcatalog)AI 模型

Z ai 发布 GLM-5.2：开源权重新 SOTA，智能指数 51 分排名第四

Z ai 推出 GLM-5.2，在 Artificial Analysis Intelligence Index 上得 51 分排名第四，成为开源权重 SOTA。模型规模同 GLM-5.1（744B 总/40B 活跃参数），智能指数 v4.1 提升 11 分。科学推理显著增强：CritPt +16% 至 21%，HLE +12% 至 40%，GPQA Diamond +3% 至 89%。上下文窗口升至 1M tokens。API 定价 $1.4/$4.4/$0.26 每 1M 输入/输出/缓存命中 token，每任务成本约 $0.46，处智能 vs 成本帕累托前沿。MIT 许可证，已上线 DeepInfra 等第三方平台。

查看原文ZAI 🔥： GLM-5.2 by @Zai_org scored 51 point on Artificial Analysis Intelligence Index and got placed…

4 天前

IT之家（RSS）AI 模型

ChatGPT 语音最大规模升级：OpenAI 正筹备推出 GPT-Bidi-1 模型

OpenAI 正筹备推出 GPT-Bidi-1 模型，采用双向（BiDi）架构，能同时听和说，吸收用户打断并在对话中实时调整。相比已进化至 GPT-5.5 的文本模型，ChatGPT 的语音能力仍基于较旧音频技术栈，GPT-Bidi-1 旨在弥合这一差距。上线后用户可切换双向模式与现有高级语音模式，并支持 High、Medium 及 Instant 智能等级，按任务调整速度和深度。

查看原文ChatGPT 语音最大规模升级：OpenAI 正筹备推出 GPT-Bidi-1 AI 模型

4 天前

X：卡兹克 (@Khazix0918)AI 模型

智谱GLM-5.2开源，1M上下文，称可比肩Opus 4.8

智谱发布GLM-5.2，开源模型（MIT许可），在编码和智能体任务上有显著提升，支持1M上下文窗口。提供两种推理努力级别：GLM-5.2 （max）极限模式、GLM-5.2 （high）性能与token效率平衡。API定价与GLM-5.1保持不变。官方评测显示其性能已可与Opus 4.8竞争。

查看原文智谱 YYDS！官方评分也终于出来了，真是真的可以跟 Opus 4.8 掰掰手腕了

4 天前

X：cb_doge (@cb_doge)AI 模型

Grok Imagine 1.5 Fast 视频生成速度翻倍

Grok Imagine Video 1.5 Fast 的视频生成速度几乎翻倍。它可在约25秒内生成一段6秒720p视频，而上一代模型需要40秒以上。这是一次巨大的速度升级。以下是对比：

查看原文Grok Imagine Video 1.5 Fast nearly doubles video generation speed. It can create a 6-second， 720p v…

4 天前

X：Oran Ge (@oran_ge)AI 模型

智谱开源 GLM 5.2，编程能力达 Opus 水平

智谱今日正式开源 GLM 5.2，这是首个编程 coding 能力达到 Opus 水平的开源模型。目前该模型已接入 Cola 作为 beta 模型开放测试，定价与官方一致，欢迎体验和反馈。

查看原文智谱发布的 GLM 5.2 今日正式开源它的的意义在于 GLM 5.2 是首个编程 coding 能力达到 Opus 水平的开源模型我们已经在第一时间将其接入 Cola，作为 beta 模型供大家…

4 天前

IT之家（RSS）AI 模型

Grok Imagine Video 1.5 模型正式上线：6 秒 720P 视频仅需 25 秒

6 月 17 日，xAI 宣布 Grok Imagine Video 1.5 模型正式在 xAI API 上线。该模型支持静态图一键生成带同步音频的短视频，单次生成同时输出音效、环境音和对话，语音清晰度和口型同步效果提升。运动连贯性增强，减少了肢体扭曲和物体漂浮，更好模拟重量感与动量。Fast 模式下生成一段 6 秒 720p 视频约需 25 秒，较前代 40 秒以上显著提速。开发者可通过上传起始图片、描述运动方式并选择分辨率和时长调用 API。

查看原文Grok Imagine Video 1.5 模型正式上线：生成 6 秒 720P 视频仅需 25 秒

4 天前

X：cb_doge (@cb_doge)AI 模型

Grok Imagine 1.5 视频质量大幅提升

所有这些视频都是用 Grok Imagine 1.5 创建的。重大升级。质量大幅跃升。🚀

查看原文All these videos were created using Grok Imagine 1.5 Big upgrade. Huge jump in quality. 🚀

4 天前

X：Andrew Milich (@milichab)AI 模型

Imagine Video 1.5 实现真实运动与一致文本

Imagine Video 1.5 提供真实运动、逼真环境以及跨帧一致文本

查看原文Imagine Video 1.5 delivers true motion， realistic environments， and consistent text across frames

4 天前

X：Elon Musk (@elonmusk, xAI)AI 模型

Grok Imagine 1.5 现已广泛发布

查看原文Grok Imagine 1.5 is now in wide release

4 天前

X：xAI (@xai)AI 模型

Grok Imagine Video 1.5 发布

Grok Imagine Video 1.5 来了我们新的图像转视频模型，具有更清晰的真实感、更好的物理效果和更快的生成🧵 http：//grok.com/imagine

查看原文Grok Imagine Video 1.5 is here Our new image-to-video model with sharper realism， better physics an…

加载更多