AI 模型
查看 AIHOT 全量动态流,适合需要更完整视图时使用。
6 天前
X:Kim (@kimmonismus)AI 模型有了 Mistral 的 Le Chaton Fat,谁还需要 Fable 5?
查看原文Who needs Fable 5 when you got Le Chaton Fat by Mistral
6 天前
IT之家(RSS)AI 模型MiniMax 于 6 月 12 日开源 MiniMax M3 模型权重并发布 MSA 技术论文。M3 是原生多模态旗舰模型,总参数 428B,激活参数 23B,为首个从 Step 0 开始多模态混合训练的开源模型。在 Artificial Analysis 综合智能指数上获全球开源最高排名。输出速度从约 30 TPS 提升至约 80 TPS,后续还将提速 30-40%。M3 在编码与智能体评测中达行业顶尖水平,具备自主任务拆解、工具调用与多步推理能力,上下文支持百万级别。
6 天前
公众号:MiniMax(稀宇科技)AI 模型MiniMax 上周五开源了 428B 总参数、23B 激活参数的 M3 模型权重,同步发布 MSA(MiniMax Sparse Attention)技术论文,该架构显著降低长上下文计算成本。M3 是首个从预训练阶段就进行文本、图像等多模态交错混合训练的开源模型。发布两周后,M3 在 Artificial Analysis 综合智能指数、GDPval-AA 排行榜均获开源模型第一,Code Arena WebDev 跻身帕累托最优序列,Vals.AI 榜单居国产模型首位。输出速度已从约 30 TPS 提升至约 80 TPS,计划再提速 30-40%;Token Plan 后台新增调用量看板。
查看原文我们开源了 MiniMax M3
6 天前
X:小互 (@xiaohu)AI 模型Perceptron推出Agentic Detection视觉检测模型,用户只需提供一张图片并用自然语言描述目标,即可自动框出并分类,无需预先训练。该模型还能处理物理推理检测任务,例如定位森林火灾的起火点("烟的来源")、挑出变形电线杆("需要维修的电线杆")、标记空车位等。引用推文指出,该模型支持用自然语言或示例描述任意物体进行定位。
查看原文兄弟们 这个牛P啊 Agentic Detection:一个视觉检测模型 用一句话描述,AI 就在图里精确圈出目标 你只需要给它一张照片,描述你要找什么,它要把里面的东西用方框圈出来,再告诉你…
6 天前
IT之家(RSS)AI 模型理想汽车在 Livis Day 发布会上宣布,第三季度 AD Max 推送全新马赫 VLA,第四季度对齐特斯拉 FSD V14 能力。双马赫 M100 芯片算力 2560TOPS,模仿学习规模提升 50%、强化学习提升 15 倍、模型参数量提升 10 倍、计算量提升 15 倍。自研马赫 Mind-4 系列基座大模型包括 Mind-Pro 和 Mind-Edge;Mind-Pro 在多项基准及 Agent 评测中领先,Mind-Edge 为端侧原生具身智能体,数据不上传。
查看原文理想汽车宣布下半年马赫 VLA 能力持续进化,第四季度对齐特斯拉 FSD V14 能力
6 天前
X:Berry Xia (@berryxia)AI 模型Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型,训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行,甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化,无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构,目前下载量已破六千,社区反馈其在本地 coding 场景表现出色,填补了云端模型与本地可用之间的鸿沟。
查看原文一个12B的本地模型,直接把Fable 5的推理链条蒸馏进去了,现在你能在消费级显卡上离线跑顶级coding能力。 这个Gemma 4 12B Coder GGUF是基于Google的gemma-4…
查看原文智谱的 Codex ? 不,是 ZCode !