全部 AI 动态

查看 AIHOT 全量动态流，适合需要更完整视图时使用。

3 天前

X：小互 (@xiaohu)AI 模型

豆包实时语音模型3.0 API正式上线。支持全双工（同时听和说，可随时插话）和端到端（语音进、语音出，无转录），交互更快速自然。具备精准遵循指令能力，如设定"先不出声，聊到世界杯再加入"后安静待命。关键升级是支持自定义工具，可在实时对话中直接调用工具完成任务（预定日历、发邮件、总结文档、发起查询等），从"语音助手"向"语音 Agent"迈进。

查看原文豆包实时语音模型3.0 API 上线看演示还是很牛P的，能干不少事情了全双工：能同时听和说，像真人聊天那样可以随时插话端到端：语音进、语音出，不进行转录，更快、更自然。精准遵循 + 适…

3 天前

X：Greg Brockman (@gdb)AI 产品

OpenAI推出企业信用分析与支出控制

为企业推出信用使用分析和更新的支出控制，可在我们的全局管理控制台中使用：

查看原文Launching credit usage analytics and updated spend controls for enterprises， available in our global…

3 天前

X：Ethan Mollick (@emollick)技巧与观点

管理者使用Claude Code编码成功率最高

一些（初步）证据表明，管理者在使用Claude Code进行编码时成功率最高。我一直认为管理是AI的超级能力，因为明确说明你想要什么、如何做以及什么样子算好，是使用智能体的关键。https：//www.oneusefulthing.org/p/management-as-ai-superpower

查看原文Some （early） evidence that managers have the highest success rate in using Claude Code for coding. …

3 天前

Hacker News 热门（buzzing.cc 中文翻译）技巧与观点

我们在 Elasticsearch 上构建了一个持久化代理内存层，其召回率为0.89

Agent Builder 正式上市（GA）。基于 Elasticsearch 的持久化内存层将记忆分为情景、语义、程序三类，分别存入独立索引，各设不同写速率与过期规则。召回采用 BM25 与 Jina v5 稠密向量的 RRF 融合，再经交叉编码器重排序。在 168 道 QA 题评估中，R@10 平均 0.89，零跨租户泄漏。该层可通过支持 MCP 协议的客户端访问，不绑定特定运行时，已开源至 GitHub。

查看原文我们在 Elasticsearch 上构建了一个持久化代理内存层，其召回率为 0.89

3 天前

X：小互 (@xiaohu)AI 产品

Codex 推出 Record & Replay 功能：演示一次操作即可自动复用

Codex 推出 Record & Replay 功能，用户可在电脑上演示一次操作流程，Codex 观察并自动生成可复用的 Skill。下次遇到同类任务，Codex 即可自动执行。官方以"发 YouTube 视频"演示：手动走完拉元数据、配缩略图和字幕、上传存为私密、核对等流程，新对话中 Codex 自动完成无差错。该功能适用于报销贴票、文件批量重命名归档、每周数据填报表、网上订票等重复性电脑操作，实现从"每次写提示词"到"演示一次就够"的跨越。

查看原文牛P了 Codex推出一个 Record & Replay功能也就是你可以教Codex干活你把你在电脑上经常操作的人物给它演示一遍 Codex 会观察学习你的整个操作过程，然后自动生成一…

3 天前

The Verge：AI（RSS）行业动态

OpenAI 企业 AI 销售主管 Barret Zoph 重返五个月后再离职

OpenAI 企业 AI 销售主管 Barret Zoph 在重返公司仅五个月后再次离职。他于今年 1 月中旬回归，此前是 Mira Murati 创办的 Thinking Machines Lab 联合创始人兼 CTO。Zoph 最初于 2024 年秋离开 OpenAI 加入该实验室，但在 2026 年 1 月因涉及与同事未公开关系的不当行为指控而突然离职。OpenAI 确认了 Zoph 的离职，他已在公司 Slack 中发布告别消息。

查看原文Barret Zoph is out at OpenAI again after just five months

3 天前

X：阿易 AI Notes (@AYi_AInotes)AI 产品

阿里开源向量数据库Zvec，UCSD黄碧薇教授提出因果AI第四代范式

阿里开源内部向量数据库Zvec，pip install zvec免费使用，对标Pinecone每月70美元能力。支持十亿向量毫秒级检索，无需单独起服务，全平台兼容；v0.5.0新增原生全文混合搜索。UCSD黄碧薇教授（causal-learn作者）提出AI四代范式：相关性小模型→因果小模型→相关性大模型（LLM）→因果大模型，认为当前正站在第四代门口。其创立的Aether AI完成首轮融资，致力于从视频中自动抽取物理规律，探索下一代因果AI范式。

查看原文卧槽，阿里把内部用了多年的向量数据库直接开源了，Pinecone每月70刀的能力，它pip一行免费就能用，十亿向量毫秒级还不用单独起服务🤯 以后做RAG和AI搜索的，不用再每月给Pinecone交…

3 天前

公众号：火山引擎未分类

全议程公布！FORCE原动力大会，6.23-24北京见

查看原文

3 天前

X：Jason Liu (@jxnlco)行业动态

Jason Liu 公布 Codex 团队列表

Codex 团队列表抢先说：别私信我说我没在列表上 https：//x.com/i/lists/2067819170989854863？s=20

查看原文the codex team list inb4 someone dm's me for not being on the list https：//x.com/i/lists/20678191…

3 天前

X：Peter Steinberger (@steipete)技巧与观点

Peter Steinberger 评 Codex Record & ReplayTM️：一切皆快或慢 API

Peter Steinberger 引用 @nickbaumann_ 介绍 Codex Record & ReplayTM️ 新原语：让 Codex 观看用户电脑操作，通过录制和事件（与 computer use 同框架）理解操作，转化为未来可复用的技能。使用案例：按个人风格格式化日历邀请（GCal 插件）、起草 PR 并分享到指定 Slack 频道、录制入职流程发现摩擦点（不生成技能）。Steinberger 称"所有东西要么是快速 API 要么是慢速 API"。

查看原文Everything's either a fast or slow API now.

3 天前

X：阿易 AI Notes (@AYi_AInotes)技巧与观点

DeepSeek研究员开源AutoResearch：AI自主跑通285B模型RL研究闭环

DeepSeek研究员Deli Chen将AutoResearch协议开源，并发布Self-play综述论文。其AI智能体首次完全自主地在DeepSeek 285B模型上完成完整RL研究闭环--从实验设计、写代码、提交GPU任务、debug到结论总结，全程零人工干预。系统调用了GRPO工具，被视为持续学习研究的开端。

查看原文这可能是我近期看到的最值得深入研究的一次skills开源和工程脚手架，最后总结的5个工程思路大家可以直接拿去用。 DeepSeek 研究员 Deli Chen 把他的 AutoResearch 协议…

3 天前

X：Vista (@vista8)AI 产品

《道德经》AI配图版开源，Seedream 5生图

一个将《道德经》每句拆解翻译成大白话并配以AI生图的漫画项目已开源，在线体验和GitHub仓库已公开。生图基于Seedream 5模型，目前效果尚有优化空间（图文相关性不够稳定），但整体阅读体验有所提升。

查看原文道德经配图版已开源，但生图用的Seedream 5，效果还有优化空间，经常图文不相关，但整体阅读体验有提升。在线体验：https：//daodejing.qiaomu.ai/ 开源地址：http…

3 天前

X：Vista (@vista8)技巧与观点

Codex MCP集成Claude Code和多模型协作开源

开发者在Codex基础上开发了一个MCP，支持在Codex中调用Claude Code（用于写作等场景用Claude Sonnet 4.6，前端网页用Claude 4.8），并可随时调用国产廉价模型如智谱GLM-5.2、Deepseek V4 Flash用于开发、翻译等。该MCP还支持多模型多轮讨论，由Codex汇总方案。项目已免费开源。

查看原文Codex产品优秀，但有些场景还是需要Claude Code。比如写作还是用4.6 sonnet，前端网页用4.8 。还有些场景要随时调用国产便宜模型，比如智谱 GLM-5.2，Deepsee…

3 天前

Steve Yegge：Medium（RSS）技巧与观点

Fable模型被美国临时关闭，AI安全管控时代来临

美国政府短暂关闭了Mythos类中的Fable模型，标志着AI模型已越过危险门槛。作者预测最多两三代模型后，超级智能将像核武器一样被管控，大多数Fortune 500企业无法访问或仅受控使用。开源模型落后前沿约七个月，且面临算力和政府锁定的双重壁垒。人类的"辨别地平线"使许多人感觉模型进步停止，但实际指数增长未停--只是用户缺少足够困难的问题。Fable类已能解决此前Opus 4.8无法完成的复杂任务（如React客户端），AI将彻底改变编程和知识工作，但多数人只能使用当前等级模型。

查看原文The Flat Curve Society

3 天前

IT之家（RSS）技巧与观点

蔡崇信：阿里全面投入 AI，开源的主要推动力量来自中国企业

蔡崇信昨日在 VivaTech 2026 上表示，AI 的总潜在市场规模达 50 万亿美元，对标人类生产力，阿里巴巴正全面投入 AI。其全栈 AI 优势包括：中国高效低成本的能源供给，提前布局的云计算和芯片，全球最受欢迎的开源模型千问（Qwen），以及覆盖电商、即时零售等丰富应用场景。他同时指出，当前全球 AI 开源的主要推动力量来自中国企业，阿里巴巴团队在推动前沿模型开源方面做出巨大贡献。

查看原文

3 天前

X：智谱 Z.ai (@Zai_org)AI 模型

GLM-5.2 移动开发长程任务性能翻倍

智谱 GLM-5.2 在内部 35 项挑战性移动开发任务（共 70 次试验）中完成率达 48/70，较 GLM-5.1 的 21/70 提升超两倍；同期 Claude Fable 5 为 56/70。主推文指出长程能力应落地真实场景，更多场景即将推出。

查看原文Long-horizon is more than a concept. It should live in real-world scenarios， empowering AI builders …

3 天前

X：Ethan Mollick (@emollick)技巧与观点

有益RL数据可提升模型广泛对齐能力

研究表明，用"邪恶"数据训练AI会导致普遍的不对齐；而使用少量有益特质数据（即使仅限健康领域）进行强化学习，也能显著提升模型在广泛的对齐和益处评估上的表现。该研究希望推动更广泛、更持久的有益模型发展。

查看原文There are papers that show training AI on "evil" data results in general misalignment， so it is nice…

3 天前

X：Claude Devs (@ClaudeDevs)行业动态

Claude Code 使用限制显示错误已修复

今天早些时候，约3%的Claude Code Max和Pro用户遇到了一个bug，显示错误的每周使用限制，并在某些情况下阻止他们发送消息。此问题已修复，我们正在重置所有受影响用户的5小时和每周限制。对此造成的不便深表歉意。

查看原文Earlier today， ~3% of Claude Code Max and Pro users hit a bug that showed an incorrect weekly usage …

3 天前

X：邵猛 (@shao__meng)技巧与观点

今天在香港，习惯性打开 ChatGPT，才意识到在香港不能用 😂 想想也挺有意思，在大陆和香港都不能用，但原因还不太一样一个是有人替我们拒绝了 OpenAI，一个是 OpenAI 拒绝了他们

查看原文

3 天前

MarkTechPost（RSS）技巧与观点

Salesforce CodeGen教程：生成、验证并重排序Python函数（含单元测试与安全检查）

本教程实现一个基于Salesforce CodeGen的端到端代码生成工作流。从HuggingFace加载CodeGen模型（支持350M、2B、codegen2-1B、codegen25-7b等版本），通过自然语言提示生成Python函数，随后进行函数提取、语法检查、静态安全检查、单元测试验证、best-of-N候选重排序、多步程序合成、提示词实验、基准可视化及导出。展示了CodeGen作为结构化代码生成流水线的能力，不仅完成代码补全，还能评估、筛选和组织生成结果。

查看原文Salesforce CodeGen Tutorial： Generate， Validate， and Rerank Python Functions With Unit Tests and Safety Checks

加载更多