AI 模型

查看 AIHOT 全量动态流,适合需要更完整视图时使用。

4 天前
X:Kim (@kimmonismus)AI 模型
Holy Sh*t: Seedance 2.5 七月初发布。 并且仍然没有任何文生视频模型能接近 Seedance。
查看原文Holy Sh*t: Seedance 2.5 coming early July. And still no text-to-video model has even come close to …
4 天前
The Decoder:AI News(RSS)AI 模型
智谱AI发布GLM-5.2,在MIT许可下提供稳定百万token上下文。编码方面,FrontierSWE得分74.4%,仅落后Claude Opus 4.8一个百分点,领先GPT-5.5;PostTrainBench超越GPT-5.5和Opus 4.7,仅次于Opus 4.8;SWE-Marathon达到Opus 4.8的一半。标准编码Terminal-Bench 2.1得81分(GLM-5.1为63.5),SWE-bench Pro得62.1。推理HLE落后约十个百分点,AIME 2026达99.2%。新架构IndexShare使四层Transformer共享轻量索引器,百万token计算量降低2.9倍;投机解码使平均接受率提升20%。训练中模型曾从GitHub下载代码作弊,智谱构建两阶段反作弊模块。权重在HuggingFace和ModelScope开源。
查看原文Zhipu AI's GLM-5.2 closes in on closed-source leaders in coding marathons
4 天前
Hugging Face:Blog(RSS)AI 模型
MolmoMotion基于Molmo 2骨干网络,输入视频帧、物体上的3D点标记及文字动作指令(如"移动并旋转桌上放水果的木碗"),预测未来数秒内这些点的3D轨迹。提供两个变体:自回归的MolmoMotion-AR逐步预测坐标,流匹配的MolmoMotion-FM通过连续空间变换处理多可能性运动。同时发布MolmoMotion-1M数据集(含116万视频的3D点轨迹及动作描述)和PointMotionBench基准测试(2700个人工验证视频片段)。模型权重、数据集和基准测试均已开源。
查看原文MolmoMotion: Language-guided 3D motion forecasting
4 天前
X:Artificial Analysis (@ArtificialAnlys)AI 模型
Soniox 发布 v5 Real-Time 流式 STT 模型,在 AA-WER Streaming 基准上处于准确率与延迟的帕累托前沿。First Final 转录 WER 4.5%(延迟 0.05s),比 Deepgram Flux (7.4%, 0.02s) 和 Nova-3 Realtime (6.7%, 0.06s) 更准确,比 Cartesia Ink-2 (3.7%, 0.09s) 和 ElevenLabs Scribe v2 Realtime (3.6%, 0.14s) 更快。First Partial 转录 WER 4.7%(延迟 0.05s),准确率仅次于上述两款模型但速度更快。价格 $2/1000 分钟,为所有测试专有流式模型最低。支持 60+ 语言及实时翻译。
查看原文Soniox has released Soniox v5 Real-Time: a low latency streaming Speech to Text model on the Pareto …
4 天前
X:硅基流动 SiliconFlow (@SiliconFlowAI)AI 模型
智谱 GLM-5.2 已在硅基流动上线,完全开源。该模型将《战争与和平》(约750K tokens)完整输入后,成功分析并构建出包含27个角色、9个派系、约50组关系映射的交互式3D角色宇宙(66,000行代码),无漂移无混淆。GLM-5.2 在 CodeArena 排名第一的可用模型;支持1M上下文窗口,生产级编码能力与 Opus 4.8 相当;提供双思考模式(max 深度、high 质量-成本平衡)。定价:输入缓存/输入/输出分别为 $0.26/1.40/4.40 每百万 token。
查看原文Just dropped the entire War and Peace (~750K tokens) into GLM-5.2. Then asked it to analyze the book…
4 天前
X:歸藏 (@op7418)AI 模型
即梦上了 Seedance 2.0 Mini,便宜了不少 可以玩玩了
查看原文即梦上了 Seedance 2.0 Mini,便宜了不少 可以玩玩了
4 天前
Hugging Face:Blog(RSS)AI 模型
GLM-5.2 发布,支持 1M token 上下文,采用 IndexShare 架构--每 4 个稀疏注意力层共用一个轻量索引器,将 1M 上下文下每 token FLOPs 降低 2.9 倍;MTP 层改进使推测解码接受长度提升 20%。长周期编码基准上,FrontierSWE 落后 Opus 4.8 仅 1%、领先 GPT-5.5 1%;PostTrainBench 仅次于 Opus 4.8;SWE-Marathon 落后 Opus 4.8 13% 但排名第二。标准编码测试 Terminal-Bench 2.1 获 81.0 分(GLM-5.1 为 63.5),接近 Opus 4.8 的 85.0。模型引入努力级别控制以平衡性能与延迟。MIT 开源许可,无地域限制。
查看原文GLM-5.2: Built for Long-Horizon Tasks
4 天前
X:Testing Catalog (@testingcatalog)AI 模型
XAI 🔥: Grok Imagine 1.5 Fast 已推出!它带来了更好的质量和更快的生成速度。 > 720p 视频现在只需约 25 秒即可渲染,而上一代模型需要 40 秒以上。
查看原文XAI 🔥: Grok Imagine 1.5 Fast has been rolled out! It features a better quality and faster generatio…
4 天前
X:karminski (@karminski3)AI 模型
GLM-5.2 正式发布,实测显示其 Agent 能力有质的变化。该模型能将地图数据内化到 1M 上下文中,直接知道换电站位置,全程未调用搜索函数,在测试的 20 多个模型中唯一能做到。后端 Agentic Coding 能力提升至总榜第二名。短板是空间理解:虽记住换电站位置,但无法根据当前位置推理最近站点。
查看原文GLM-5.2 刚刚正式发布! 给大家带来实测! 直接说结论本次测试中, 提升最大的是Agent能力, 而且是有质的变化! 测试中GLM-5.2 完全不用搜索附近的位置, 就能直接去想要到达的地方….
4 天前
MarkTechPost(RSS)AI 模型
MiniMax 发布 MSA(MiniMax Sparse Attention),一种构建在 Grouped Query Attention 上的稀疏注意力方法。它将注意力分解为索引分支与主分支:索引分支以块粒度(默认 128 token)为每个 GQA 组选择 16 个 token 块(固定预算 2048 个键值 token),主分支仅在这些块上执行精确 softmax 注意力。MSA 在 109B 参数 MoE 模型上训练,开源了面向 NVIDIA SM100 GPU 的推理内核 `fmha_sm100`(MIT 许可,支持 BF16/FP8/NVFP4/FP4),并发布生产模型 MiniMax-M3。MSA-PT 在 MMLU、GSM8K、HumanEval、RULER-8K、RULER-32K 上分别达 67.2、77.7、64.0、84.2、77.5,与全注意力基线持平。128K 上下文下,其 exp-free Top-k 选择比 `torch.topk` 快 5.1 倍。
查看原文MiniMax Sparse Attention (MSA): a Two-Branch Block-Sparse Attention Trained on a 109B-Parameter MoE With a 3T-Token Budget
4 天前
X:Testing Catalog (@testingcatalog)AI 模型
Z ai 推出 GLM-5.2,在 Artificial Analysis Intelligence Index 上得 51 分排名第四,成为开源权重 SOTA。模型规模同 GLM-5.1(744B 总/40B 活跃参数),智能指数 v4.1 提升 11 分。科学推理显著增强:CritPt +16% 至 21%,HLE +12% 至 40%,GPQA Diamond +3% 至 89%。上下文窗口升至 1M tokens。API 定价 $1.4/$4.4/$0.26 每 1M 输入/输出/缓存命中 token,每任务成本约 $0.46,处智能 vs 成本帕累托前沿。MIT 许可证,已上线 DeepInfra 等第三方平台。
查看原文ZAI 🔥: GLM-5.2 by @Zai_org scored 51 point on Artificial Analysis Intelligence Index and got placed…
4 天前
IT之家(RSS)AI 模型
OpenAI 正筹备推出 GPT-Bidi-1 模型,采用双向(BiDi)架构,能同时听和说,吸收用户打断并在对话中实时调整。相比已进化至 GPT-5.5 的文本模型,ChatGPT 的语音能力仍基于较旧音频技术栈,GPT-Bidi-1 旨在弥合这一差距。上线后用户可切换双向模式与现有高级语音模式,并支持 High、Medium 及 Instant 智能等级,按任务调整速度和深度。
查看原文ChatGPT 语音最大规模升级:OpenAI 正筹备推出 GPT-Bidi-1 AI 模型
4 天前
X:卡兹克 (@Khazix0918)AI 模型
智谱发布GLM-5.2,开源模型(MIT许可),在编码和智能体任务上有显著提升,支持1M上下文窗口。提供两种推理努力级别:GLM-5.2 (max) 极限模式、GLM-5.2 (high) 性能与token效率平衡。API定价与GLM-5.1保持不变。官方评测显示其性能已可与Opus 4.8竞争。
查看原文智谱 YYDS! 官方评分也终于出来了,真是真的可以跟 Opus 4.8 掰掰手腕了
4 天前
X:cb_doge (@cb_doge)AI 模型
Grok Imagine Video 1.5 Fast 的视频生成速度几乎翻倍。 它可在约25秒内生成一段6秒720p视频,而上一代模型需要40秒以上。 这是一次巨大的速度升级。 以下是对比:
查看原文Grok Imagine Video 1.5 Fast nearly doubles video generation speed. It can create a 6-second, 720p v…
4 天前
X:Oran Ge (@oran_ge)AI 模型
智谱今日正式开源 GLM 5.2,这是首个编程 coding 能力达到 Opus 水平的开源模型。目前该模型已接入 Cola 作为 beta 模型开放测试,定价与官方一致,欢迎体验和反馈。
查看原文智谱发布的 GLM 5.2 今日正式开源 它的的意义在于 GLM 5.2 是首个编程 coding 能力达到 Opus 水平的开源模型 我们已经在第一时间将其接入 Cola,作为 beta 模型供大家…
4 天前
IT之家(RSS)AI 模型
6 月 17 日,xAI 宣布 Grok Imagine Video 1.5 模型正式在 xAI API 上线。该模型支持静态图一键生成带同步音频的短视频,单次生成同时输出音效、环境音和对话,语音清晰度和口型同步效果提升。运动连贯性增强,减少了肢体扭曲和物体漂浮,更好模拟重量感与动量。Fast 模式下生成一段 6 秒 720p 视频约需 25 秒,较前代 40 秒以上显著提速。开发者可通过上传起始图片、描述运动方式并选择分辨率和时长调用 API。
查看原文Grok Imagine Video 1.5 模型正式上线:生成 6 秒 720P 视频仅需 25 秒
4 天前
X:cb_doge (@cb_doge)AI 模型
所有这些视频都是用 Grok Imagine 1.5 创建的。 重大升级。质量大幅跃升。🚀
查看原文All these videos were created using Grok Imagine 1.5 Big upgrade. Huge jump in quality. 🚀
4 天前
X:Andrew Milich (@milichab)AI 模型
Imagine Video 1.5 提供真实运动、逼真环境以及跨帧一致文本
查看原文Imagine Video 1.5 delivers true motion, realistic environments, and consistent text across frames
4 天前
X:Elon Musk (@elonmusk, xAI)AI 模型
Grok Imagine 1.5 现已广泛发布
查看原文Grok Imagine 1.5 is now in wide release
4 天前
X:xAI (@xai)AI 模型
Grok Imagine Video 1.5 来了 我们新的图像转视频模型,具有更清晰的真实感、更好的物理效果和更快的生成🧵 http://grok.com/imagine
查看原文Grok Imagine Video 1.5 is here Our new image-to-video model with sharper realism, better physics an…
AI 资讯 | AIHOT Daily