AI 模型

查看 AIHOT 全量动态流，适合需要更完整视图时使用。

全部分类 AI 模型 AI 产品行业动态论文研究技巧与观点

精选全部

6 天前

X：Kim (@kimmonismus)AI 模型

Mistral Le Chaton Fat 让 Fable 5 失色

有了 Mistral 的 Le Chaton Fat，谁还需要 Fable 5？

查看原文Who needs Fable 5 when you got Le Chaton Fat by Mistral

6 天前

IT之家（RSS）AI 模型

MiniMax M3 模型正式开源：原生多模态、百万上下文

MiniMax 于 6 月 12 日开源 MiniMax M3 模型权重并发布 MSA 技术论文。M3 是原生多模态旗舰模型，总参数 428B，激活参数 23B，为首个从 Step 0 开始多模态混合训练的开源模型。在 Artificial Analysis 综合智能指数上获全球开源最高排名。输出速度从约 30 TPS 提升至约 80 TPS，后续还将提速 30-40%。M3 在编码与智能体评测中达行业顶尖水平，具备自主任务拆解、工具调用与多步推理能力，上下文支持百万级别。

查看原文

6 天前

公众号：MiniMax（稀宇科技）AI 模型

MiniMax 开源 M3 模型权重及 MSA 技术论文

MiniMax 上周五开源了 428B 总参数、23B 激活参数的 M3 模型权重，同步发布 MSA（MiniMax Sparse Attention）技术论文，该架构显著降低长上下文计算成本。M3 是首个从预训练阶段就进行文本、图像等多模态交错混合训练的开源模型。发布两周后，M3 在 Artificial Analysis 综合智能指数、GDPval-AA 排行榜均获开源模型第一，Code Arena WebDev 跻身帕累托最优序列，Vals.AI 榜单居国产模型首位。输出速度已从约 30 TPS 提升至约 80 TPS，计划再提速 30-40%；Token Plan 后台新增调用量看板。

查看原文我们开源了 MiniMax M3

6 天前

X：小互 (@xiaohu)AI 模型

Perceptron发布Agentic Detection视觉检测模型

Perceptron推出Agentic Detection视觉检测模型，用户只需提供一张图片并用自然语言描述目标，即可自动框出并分类，无需预先训练。该模型还能处理物理推理检测任务，例如定位森林火灾的起火点（"烟的来源"）、挑出变形电线杆（"需要维修的电线杆"）、标记空车位等。引用推文指出，该模型支持用自然语言或示例描述任意物体进行定位。

查看原文兄弟们这个牛P啊 Agentic Detection：一个视觉检测模型用一句话描述，AI 就在图里精确圈出目标你只需要给它一张照片，描述你要找什么，它要把里面的东西用方框圈出来，再告诉你…

6 天前

IT之家（RSS）AI 模型

理想汽车宣布下半年马赫VLA能力持续进化，第四季度对齐特斯拉FSD V14能力

理想汽车在 Livis Day 发布会上宣布，第三季度 AD Max 推送全新马赫 VLA，第四季度对齐特斯拉 FSD V14 能力。双马赫 M100 芯片算力 2560TOPS，模仿学习规模提升 50%、强化学习提升 15 倍、模型参数量提升 10 倍、计算量提升 15 倍。自研马赫 Mind-4 系列基座大模型包括 Mind-Pro 和 Mind-Edge；Mind-Pro 在多项基准及 Agent 评测中领先，Mind-Edge 为端侧原生具身智能体，数据不上传。

查看原文理想汽车宣布下半年马赫 VLA 能力持续进化，第四季度对齐特斯拉 FSD V14 能力

6 天前

X：Berry Xia (@berryxia)AI 模型

Gemma 4 12B Coder GGUF 发布：将 Fable 5 推理链蒸馏至本地可跑

Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型，训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行，甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化，无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构，目前下载量已破六千，社区反馈其在本地 coding 场景表现出色，填补了云端模型与本地可用之间的鸿沟。

查看原文一个12B的本地模型，直接把Fable 5的推理链条蒸馏进去了，现在你能在消费级显卡上离线跑顶级coding能力。这个Gemma 4 12B Coder GGUF是基于Google的gemma-4…

6 天前

X：邵猛 (@shao__meng)AI 模型

智谱推出ZCode：非Codex

智谱的 Codex？不，是 ZCode！

查看原文智谱的 Codex ？不，是 ZCode ！