论文研究

查看 AIHOT 全量动态流,适合需要更完整视图时使用。

5 天前
OpenAI:Alignment 研究博客(RSS)论文研究
OpenAI利用WildChat公开数据集(2023年4月至2024年5月收集的100万条对话)模拟模型部署,预测GPT-5.1、GPT-5.2、GPT-5.4在真实生产环境中的不良行为率。与私有生产数据对比发现,WildChat模拟的平均预测误差约3倍;但对技术性和智能体型失调的预测精度下降。研究验证了公开数据集作为外部审计工具的可行性。
查看原文Can public chat data predict real-world AI misalignments?
5 天前
X:AK (@_akhaliq)论文研究
μ_0 一个可扩展的3D交互追踪世界模型
查看原文μ_0 A Scalable 3D Interaction-Trace World Model
5 天前
X:AK (@_akhaliq)论文研究
World Tracing 超越可见的生成式像素对齐几何
查看原文World Tracing Generative Pixel-Aligned Geometry Beyond the Visible
5 天前
X:AK (@_akhaliq)论文研究
JoyAI-VL-Interaction 实时视觉语言交互智能
查看原文JoyAI-VL-Interaction Real-Time Vision-Language Interaction Intelligence
5 天前
LMSYS:Blog(Chatbot Arena 团队)论文研究
SGLang-JAX现已支持inclusionAI的Ling-2.6-1T(1T稀疏MoE,63B激活参数,256路由专家,top-8路由加共享专家)在TPU v7x上高效推理。团队开发了Fused MoE V2--一个融合scatter、专家FFN和gather的Pallas核,通过将MoE数据移动隐藏在计算中,使MoE预填充延迟从5.16ms降至2.42ms(降幅53%),解码核延迟从0.249ms降至0.211ms(降幅约15%)。仅替换MoE核即提升预填充吞吐量24.8%,解码吞吐量18.5%-35.3%。在SGLang解码基准测试中,16块TPU v7x芯片输出吞吐量达16块H200 GPU的1.29倍(mc=128)至1.77倍(mc=512)。完整上线还包含混合KV/循环内存池、GLA线性注意力和单控制器数据并行支持。
查看原文Blog Optimizing Ling-2.6-1T on TPU with SGLang-JAX: Hiding MoE Data Movement Behind Compute with One Pallas Kernel SGLang-JAX now supports efficient serving of inclusionAI's Ling-2.6-1T on TPU v7x. With a working baseline in place, profiling pointed to the Mixture-of-Experts (MoE) path as the main bottleneck: each… Prayer, JamesBrianD, Haolin Fu, Haoguang Cai, Qinghan Chen
5 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)论文研究
OpenClaw-Skill是一种为LLM智能体构建可复用技能库的方法。传统技能归纳通常将单条轨迹一次蒸馏成扁平的单次启发式规则,而OpenClaw-Skill通过搜索候选技能树来替代贪婪蒸馏,在迭代阶段中利用集体信号联合生成、识别和组合技能节点,最终输出结构化的技能树,旨在提升技能的多样性和泛化能力。论文详见arxiv。
查看原文// OpenClaw-Skill: Searching a Tree of Agent Skills // If you build reusable skill libraries for yo…
5 天前
X:Rohan Paul (@rohanpaul_ai)论文研究
论文分析Claude Code,其有效工作核心并非复杂AI大脑,而是简单AI循环--调用模型、执行已批准工具、回传结果、重复--被精心构建的外围系统(工具、安全、记忆、权限、恢复)包裹。作者研究公开TypeScript源码,主agent循环代码量极小,大量代码来自harness(常规软件),负责定义工具、权限、记忆及故障处理。上下文管理是主要设计挑战,采用多层压缩或总结旧信息避免模型空间耗尽。论文强调能运行shell命令和编辑文件的编码智能体不能等同于带插件的聊天机器人,每个动作都有副作用,需要明确边界约束。
查看原文The paper is saying that Claude Code works well not because it has a complex AI brain, but because a…
6 天前
X:Artificial Analysis (@ArtificialAnlys)论文研究
Artificial Analysis 发布 Intelligence Index v4.1,转向智能体任务。升级 Terminal-Bench 2.1、τ3-Bench Banking、GDPval-AA v2(Elo 重基线、引入前沿模型评审、回合上限增至250),移除饱和的 IFBench。新增每任务成本、时间、输出 token 指标及缓存 token 影响。关键结果:Claude Fable 5(60分)领先但不可用;可用模型中 Claude Opus 4.8(max)56分居首,GPT-5.5(xhigh)55分。开源 DeepSeek V4 Pro 与 MiniMax M3 均44分。成本方面,Opus 4.8 每任务 $1.78,GPT-5.5 $0.99,DeepSeek V4 Pro 仅 $0.04。时间方面,Grok 4.3 最快(1.5分钟),Opus 4.8 需6.4分钟,GPT-5.5 需3.7分钟,Gemini 3.1 Pro Preview 以1.6分钟得46分。
查看原文Announcing Artificial Analysis Intelligence Index v4.1: a shift toward agentic workloads, featuring …
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
法律AI聚合幻觉率约52%,但掩盖了错误集中方向。LegalHalluLens审计框架包含:类型化幻觉档案(数字、时间、义务权利、事实四类)、风险方向指数(RDI)及校准辩论管线。在510份合同、249,252条款实例中,同一模型内义务/数字类与时间类幻觉率差距达38-40个百分点;两个均报告52%幻觉率的系统RDI可能相反。辩论管线将虚假检测减少45%,以4B参数匹配商业API。类型档案和RDI暴露隐藏失败模式,作为多智能体辩论校准输入。
查看原文LegalHalluLens: Typed Hallucination Auditing and Calibrated Multi-Agent Debate for Trustworthy Legal AI
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
本文提出OPAC算法,从仅含轨迹级标签(标量回报)的离线数据中学习隐式奖励模型并优化策略。理论证明其高概率保证为tilde O(H^2C_{sa(π^star)}/n)并给出匹配下界。该框架可扩展至偏好反馈。进一步研究发现,当目标和监督均为轨迹级非线性聚合时,一般情形不可学习(全成功目标需Ω(2^H)条轨迹);引入结构系数κ_μ(σ)和χ_μ(σ)后,广义OPAC可实现多项式样本复杂度。
查看原文When Does Trajectory-Level Supervision Permit Efficient Offline Reinforcement Learning?
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
MaineCoon 是一个 22B 参数的实时音频-视频自回归模型,在单 GPU 上实现最高 47.5 FPS 的流式生成与亚秒级交互,是首个专为社交交互场景优化的实时音视频生成模型。训练中引入自重采样、跨模态表示对齐、领域偏好优化和 Reinforced Online-Policy Distillation(ROPD)。同时设计了首个智能体流推理框架,通过智能缓存管理与提示规划支持千秒级以上的长序列生成并缓解漂移。该模型在高质量、低延迟、长时域音视频自回归建模上确立了新 SOTA 基准。
查看原文MaineCoon: Pursuing A Real-Time Audio-Visual Social World Model
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
提出 LLM-as-Environment-Engineer 框架,使当前策略模型能基于失败轨迹与上下文自动修改下一阶段训练环境配置。引入可控测试床 MAPF-FrozenLake,支持多维环境配置生成与基准评估。以 Qwen3-4B 为骨干,该框架在基准测试中取得最强综合性能,超越 GPT、Gemini 等更大专有模型及固定环境基线。分析发现,成功环境更新依赖失败证据并保留已有配置;当前 RL 检查点作为环境工程师优于原始基座模型,表明策略学习提升了模型诊断自身弱点的能力。
查看原文From Trainee to Trainer: LLM-Designed Training Environment for RL with Multi-Agent Reasoning
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
稀疏自编码器(SAE)将残差流激活分解为可解释特征,但干预特定特征后,通过优化残差扰动可恢复原有行为。研究发现这是一种可恢复失败模式:干预阻断一条可见行为路径,却未消除行为本身。即使干预在整个优化和生成期间保持激活,恢复依然可行。在TPP、遗忘、IOI和拒绝引导场景中均观察到可恢复行为。安全关键的拒绝引导场景下有效样本恢复率达95.8%,被防御特征的相对漂移仅0.131。归因分析将恢复路径定位到SAE重建残差,表明控制SAE特征并不能保证控制底层行为。
查看原文SAE Interventions are Unreliable: Post-Intervention Recovery of Suppressed Behavior
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
SR-REAL 为空间 VLM 配备两条互补推理路径:纯语言推理(LOR)和检测后推理(DTR)。LOR 执行逐步语言演绎,DTR 先通过区域 token 检测 3D 几何线索(中心点或边界框),再进行几何推理。框架先经冷启动有监督微调构建两条路径的思维链监督,随后用准确率和格式奖励进行强化学习优化,DTR 额外使用基于离散中心的检测奖励。在多个空间基准上,SR-REAL 显著优于基线:单个 RL 训练模型支持两种路径,联合训练实现互相增强,且模型无需调优即可跨数据集和领域泛化。
查看原文Reinforcing Dual-Path Reasoning in Spatial Vision Language Models
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
Kairos是面向Physical AI的原生世界模型栈。它采用跨具身数据课程进行原生预训练,融合开放世界视频、人类行为数据和机器人交互。其统一架构配备混合线性时间注意力:滑动窗口捕获局部动态,扩张滑动窗口捕获中距离依赖,门控线性注意力维持持久全局记忆,理论上保证长时域状态传播误差可控。通过部署感知系统协同设计,在服务器和消费级硬件上实现低延迟的观察-行动-反馈循环。在具身世界模型、长时域和行为策略基准上,Kairos达到顶级性能并展现强效率-能力权衡。
查看原文Kairos: A Native World Model Stack for Physical AI
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
GUI grounding要求视觉语言模型在高分辨率截图中识别小目标并预测精确坐标。OPSD(在策略自蒸馏)虽能提供密集token级教师信号,但朴素OPSD中学生生成前缀偏离目标时坐标token信号质量下降。本文提出质量感知自蒸馏,通过软正确性感知门控和教师概率缩放改善信号质量:门控检查教师当前坐标预测能否在给定前缀下完成到真实框,否则降权;教师概率缩放用置信度校准监督强度。两个组件单独无效,组合持续有效。在六个GUI grounding基准上一致提升基础模型并超越强基线。
查看原文Trust the Right Teacher: Quality-Aware Self-Distillation for GUI Grounding
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
Guava 是一个用于具身工具使用的框架,通过系统探索智能体工作流、动作空间和观察空间,确定了三个关键设计:迭代感知-推理-动作循环、语义动作抽象和多模态观察。研究还开发了端到端训练流程,将具身操作能力蒸馏至一个 4B 开源模型,仅用少于 2K 条模拟轨迹。仿真与真实实验表明,Guava 性能接近前沿专有模型,对未见物体、新指令和长时任务有强泛化能力。结果表明,精心设计的框架可作为模型无关的具身操作接口,以极少数据为紧凑开源模型带来涌现能力。
查看原文Guava: An Effective and Universal Harness for Embodied Manipulation
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
CEO-Bench通过模拟初创公司500天运营,评估AI智能体在不确定性中规划、获取信息、适应变化和协调多目标的能力。智能体需通过Python接口管理定价、营销、预算等决策,并处理嘈杂数据库。最强模型(Claude Opus 4.8、GPT-5.5)虽能编写复杂代码预测现金流、挖掘客户偏好,但仅勉强使余额维持起始的100万美元以上,无法持续盈利。该基准首次衡量驱动长期自适应进展所需的智能。
查看原文CEO-Bench: Can Agents Play the Long Game?
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
PAIWorld 是一种基于扩散 Transformer 的世界基础模型,通过三大组件解决多视图三维不一致问题:几何感知跨视图注意力模块建立显式视图间通信,几何旋转位置编码将相机光线方向和外部位姿编码进注意力机制,潜在三维 REPA 从冻结的三维基础模型中蒸馏三维感知特征。它在机器人操作基准上达到最优多视图三维一致性,WorldArena 排行榜第一,AgiBot-Challenge2026 排行榜第二,并支持基于模型的规划、世界动作模型和多视图策略后训练等下游应用。
查看原文PAIWorld: A 3D-Consistent World Foundation Model for Robotic Manipulation
6 天前
HuggingFace Daily Papers(社区热门论文)论文研究
EgoCS-400K是基于CS/CS2职业比赛demo构建的大规模第一人称数据集,保留了人类游戏轨迹并支持解析、回放、渲染和时间对齐。包含超过40万段第一人称视频、1万小时游戏内容,来自1000多场比赛和4万回合,覆盖13张地图、每回合10个玩家视角。数据集提取了玩家状态、视角方向、移动、键盘/按键输入、视角变化、武器使用、游戏事件和回合上下文,并渲染出干净的第一人称视频。支持动作条件未来预测、状态与事件场景展开、回放字幕生成及智能体第一人称动作理解等任务,连接了被动网络视频、可控游戏仿真和昂贵的真实世界具身数据。
查看原文EgoCS-400K: An Egocentric Gameplay Dataset for World Models