AI 模型

查看 AIHOT 全量动态流,适合需要更完整视图时使用。

5 天前
X:硅基流动 SiliconFlow (@SiliconFlowAI)AI 模型
智谱 GLM 5.2 在编码评测 CodeArena 的可用模型中排名第一。硅基流动同步首发,定价 Input Cache/Input/Output 分别为 $0.26/1.40/4.40 每百万 token,支持 1M 上下文,具备可靠的长时间任务执行能力,编码性能与 Opus 4.8 持平。提供双思考模式:max 侧重深度,high 侧重质量成本平衡。模型完全开源。
查看原文Code like a real G😎 Congrats to @Zai_org 's GLM 5.2 ranks #1 as available model on CodeArena 💪 Sil…
5 天前
IT之家(RSS)AI 模型
6 月 17 日,大晓机器人联合香港中文大学发布并开源具身操作 VLA 模型 ACE-Ego。在 RoboCasa GR1 TableTop 基准上,ACE-Ego 以 72.8% 平均成功率刷新纪录,超越英伟达 GR00T 等模型;在 RoboTwin 2.0 强域随机化测试中成功率达 90.62%。该模型已能稳定完成塑料袋打包、鞋子装入鞋盒等长周期复杂零售操作。
查看原文大晓机器人开源 ACE-Ego 具身操作 VLA 模型,能稳定完成塑料袋打包、鞋子装入鞋盒等操作
5 天前
X:歸藏 (@op7418)AI 模型
智谱 GLM-5.2 正式发布并开源,定位处理长周期任务。模型具备稳定的100万上下文窗口,并引入思考力度控制。架构上采用 IndexShare 机制,每四层稀疏注意力共享同一个 indexer,在百万 token 上下文中将每 token 计算量降低约 2.9 倍。用户现可在 Codepilot 模型管理中添加使用 GLM-5.2。
查看原文智谱 GLM-5.2 可以在 Codepilot 模型管理里面自行添加哈
5 天前
X:karminski (@karminski3)AI 模型
智谱(Z.ai)发布GLM-5.2模型,编程与智能体任务显著改进,支持1M上下文窗口。提供两种推理模式:GLM-5.2(max)追求极限性能,GLM-5.2(high)平衡性能与token效率。模型权重以MIT许可开源,API定价与GLM-5.1保持一致。
查看原文GLM-5.2正式发布啦!一会给大家带来评测视频~
5 天前
X:Oran Ge (@oran_ge)AI 模型
GLM-5.2 开源模型发布,其编程(Coding)能力首次达到Opus级别。该模型在编程与智能体(Agentic)任务上显著提升,支持1M上下文窗口,提供两级推理难度--GLM-5.2 (max) 追求极限性能,GLM-5.2 (high) 平衡性能与token效率。采用MIT许可证开源,API定价与GLM-5.1保持一致。
查看原文GLM 5.2 的意义在于 开源模型的 Coding 能力第一次达到了 Opus 水平
5 天前
X:歸藏 (@op7418)AI 模型
智谱发布并开源 GLM-5.2,定位长周期任务,支持 100 万 token 稳定上下文。引入思考力度控制:GLM-5.2 max 追求极限性能,GLM-5.2 high 兼顾效率。架构采用 IndexShare 机制,每四层稀疏注意力共享 indexer,百万 token 下每 token 计算量降低约 2.9 倍。编码与智能体任务表现显著提升。模型权重以 MIT 许可证开源,API 定价与 GLM-5.1 一致。
查看原文智谱 GLM-5.2 正式发布和开源了,基准测试成绩相当吓人 核心定位是处理长周期任务,并且有稳定的 100 万上下文,模型还引入了思考力度控制。 架构层面,GLM-5.2 提出了 IndexSh…
5 天前
IT之家(RSS)AI 模型
智谱今日开源GLM-5.2模型,稳定支撑1M上下文。在Code Arena盲测中取得全球可用模型第一,主流编程基准保持开源SOTA,与Claude Opus 4.8可比。通过极致Infra优化,1M上下文下单位token FLOPs降至2.9倍。Day 0已适配华为昇腾、平头哥、摩尔线程、寒武纪等国产算力平台,预计下半年昇腾950超节点将成为其算力底座。开源链接已发布于GitHub、HuggingFace、ModelScope。
查看原文智谱开源 GLM-5.2 模型:1M 无损上下文,Code Arena 上全球可用模型第一
5 天前
公众号:智谱(GLM)AI 模型
智谱今日发布并开源GLM-5.2,在前端开发盲测系统Code Arena上取得全球可用模型第一。该模型专为长程任务设计,实现1M无损上下文,支持跨越数天的任务执行。在FrontierSWE上仅比Claude Opus 4.8低1%,超过GPT-5.5(1%)和Opus 4.7(11%);Terminal-Bench 2.1上比Opus 4.8低4%,较GLM-5.1提升17.5%。引入思考档位控制,Coding能力介于Opus 4.7与4.8之间。提出IndexShare架构降低单位FLOPs至2.9倍,改进MTP层提升接受长度20%。已在华为昇腾等国产算力平台适配。模型权重以MIT协议开源,API已上线并纳入GLM Coding Plan。
5 天前
HuggingFace Daily Papers(社区热门论文)AI 模型
Sumi(日语"墨")是一个完全开源的7B参数均匀扩散语言模型,从零开始在1.5T模型token上预训练。它在知识、推理和编程评测中与同等token预算的自回归模型表现相当,但在常识推理benchmark上略逊,教育密集型数据混合可能是原因之一。Sumi开放模型权重、检查点及完整训练配方(含公开语料数据混合说明),为社区提供首个大规模均匀扩散模型的基准参考。
查看原文Sumi: Open Uniform Diffusion Language Model from Scratch
5 天前
xAI:News(网页)AI 模型
6 月 17 日,xAI 宣布 Grok 4.3 在 Amazon Bedrock 上全面可用。该模型在前沿模型中达成最低幻觉率,支持 100 万 token 上下文窗口,并提供可配置推理努力(none/low/medium/high)。在 Artificial Analysis Omniscience 基准排名第一,在 Tau2 Telecom 基准评估客服智能体真实工具调用性能排名第一,在 Vals AI Case Law 和 Corporate Finance 基准的复杂文档理解任务排名第一。定价为输入每百万 token 1.25 美元、输出每百万 token 2.50 美元,每美元智能度是其他前沿模型的 2-10 倍。
查看原文Grok on Amazon Bedrock Jun 17, 2026 # Grok on Amazon Bedrock Grok models are now available via Amazon Bedrock. Read More
5 天前
X:Berry Xia (@berryxia)AI 模型
GLM-5.2 以 MIT 协议开源权重,支持 1M 上下文窗口。相比 GLM-5.1,在 Coding、Tool use、Reasoning 上明显提升,尤其在长程 Agent 任务(大规模代码实现、自动化研究、性能优化、复杂调试)中更稳定。提供 Max 和 High 两种推理模式,分别侧重极致性能与 Token 效率平衡。API 价格与上一代相同。社区已在 DeepSWE 等基准上验证其能力。此外,Slide 生成、长文档处理和角色扮演等任务也有进步。
查看原文兄弟们,Claude Fable5 连夜下架! GLM-5.2 直接宣布免费开源啊! 而且直接把GLM-5.2的权重都开源了,而且还是MIT协议,1M上下文,在Coding和Agent任务上还有大…
5 天前
Hacker News 热门(buzzing.cc 中文翻译)AI 模型
SubQ 1.1 Small 基于 Subquadratic Sparse Attention (SSA),在 needle-in-a-haystack 测试中接近完美检索 12M token,注意力计算减少近 1000 倍。1M token 时计算量仅密集注意力的 1/64.5,速度是 FlashAttention-2 的 56 倍。GPQA Diamond 85.4%,LiveCodeBench v6 pass@4 89.7%,AutomationBench Finance 13%。模型基于现有开源前沿模型改造,通过阶段上下文扩展(262K 至 2M)和约 1 万亿 token 继续预训练实现。已与设计合作伙伴部署,计划年内推出 2M-12M token 更大系列。
查看原文SubQ 1.1 小型
5 天前
Hacker News 热门(buzzing.cc 中文翻译)AI 模型
Qwen-Robot Suite 包含三个基础模型:Qwen-RobotNav 通过可控观察编码统一指令跟随、点/物体目标导航、目标跟踪和自动驾驶五个导航域;Qwen-RobotManip 利用规范状态-动作空间和相机帧增量位姿,在超3.81万小时开源语料上实现跨具身操作对齐;Qwen-RobotWorld 以自然语言为动作接口,联合训练20余种具身,预测物理世界动态。三者可组合成通用智能体系统。
5 天前
X:Rohan Paul (@rohanpaul_ai)AI 模型
Catnip推出MaineCoon,一个22B参数的实时音频-视觉基础模型,能将文本提示词转化为带同步语音、动作和表情的实时角色流,支持无限时长交互。作为首个流式原生模型,MaineCoon实现亚秒级首帧,单张H100上达47.5FPS,单张RTX Pro 6000上达30FPS,内部测试吞吐量比同类音频-视觉系统快约7倍。与被动视频生成不同,它能因果性地实时响应,记住自身不完美的过去,并保持角色身份、声音和节奏的连贯一致,让AI从轮次式应答变为"与你同在"的实时存在。
查看原文Catnip just dropped MaineCoon, a 22B real-time audio-visual foundation model that turns text prompts…
5 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)AI 模型
Z.AI 发布 GLM-5.2,采用 MIT 许可证开源权重。模型在编码与智能体任务上显著提升,支持 1M 上下文窗口,具备长时能力。提供两种推理力度:GLM-5.2 (max) 与 GLM-5.2 (high),后者平衡性能与 token 效率。API 定价与 GLM-5.1 相同。DAIR.AI 的 Elvis Saravia 评价其在前沿开放权重模型中表现令人印象深刻,并关注其长时任务表现。
查看原文No time wasting on the frontier of open-weight models. GLM-5.2 looks impressive based on the resul…
5 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)AI 模型
智谱发布GLM-5.2,在Design Arena评测中跃居第1名,Elo评分1360,超过已下架的Claude Fable 5,提升4个名次和27 Elo分。该模型为开源权重。DAIR.AI创始人Elvis Saravia表示若属实则令人印象深刻,并称已在内部用例测试,后续将汇报结果。
查看原文Impressive if true! Better than Claude Fable 5? Wow! Design is really lacking in these frontier mo…
5 天前
X:Kim (@kimmonismus)AI 模型
GLM-5.2 作为开放权重模型发布,采用 MIT 许可,拥有 1M 上下文窗口。提供两种推理模式:max(极限推理)和 high(平衡性能与 token 效率)。在编码和智能体任务上有显著提升,专为大规模实现、自动化研究、性能优化和复杂调试训练。API 定价与 GLM-5.1 保持一致。
查看原文Lets go, GLM-5.2 released as Open Weights model. tl;dr -1M context window -MIT-licensed open weigh…
5 天前
X:OpenRouter (@OpenRouter)AI 模型
来自 @Zai_org 的 GLM-5.2 已在 OpenRouter 上线! Z.ai 的旗舰模型,专为长期任务设计,现在拥有 1M token 上下文窗口,能够在冗长杂乱的编码智能体工作中保持可靠。
查看原文GLM-5.2 from @Zai_org is live on OpenRouter! http://Z.ai's flagship for long-horizon tasks, now wit…
5 天前
X:Testing Catalog (@testingcatalog)AI 模型
ZAI 在 Hugging Face 上发布 GLM-5.2,采用 MIT 开源许可,API 定价与 GLM-5.1 相同。模型支持 1M 上下文窗口,提供两种推理努力级别:max(极致性能)和 high(平衡性能与 token 效率)。在编程和 AI 智能体任务上有显著提升,具备长程任务能力。DeepSWE 基准得分 46.2%,创下开源权重模型的 SOTA 纪录。
查看原文ZAI 🔥: GLM-5.2 is now available on huggingface! > It comes with a 1M context window and 2 level…
5 天前
X:智谱 Z.ai (@Zai_org)AI 模型
智谱(Z.ai)正式发布GLM-5.2,采用MIT开源协议开放模型权重。相比前代,在编码和智能体任务上有显著提升,支持1M上下文窗口。提供两种推理努力级别:GLM-5.2(max)追求极致性能,GLM-5.2(high)在效果与token效率间取得平衡。API定价与GLM-5.1保持一致。技术博客、权重及API文档均已上线。
查看原文Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and a…