全部 AI 动态
查看 AIHOT 全量动态流,适合需要更完整视图时使用。
3 天前
X:小互 (@xiaohu)AI 模型豆包实时语音模型3.0 API正式上线。支持全双工(同时听和说,可随时插话)和端到端(语音进、语音出,无转录),交互更快速自然。具备精准遵循指令能力,如设定"先不出声,聊到世界杯再加入"后安静待命。关键升级是支持自定义工具,可在实时对话中直接调用工具完成任务(预定日历、发邮件、总结文档、发起查询等),从"语音助手"向"语音 Agent"迈进。
查看原文豆包实时语音模型3.0 API 上线 看演示还是很牛P的,能干不少事情了 全双工:能同时听和说,像真人聊天那样可以随时插话 端到端:语音进、语音出,不进行转录,更快、更自然。 精准遵循 + 适…
查看原文Launching credit usage analytics and updated spend controls for enterprises, available in our global…
3 天前
X:Ethan Mollick (@emollick)技巧与观点一些(初步)证据表明,管理者在使用Claude Code进行编码时成功率最高。
我一直认为管理是AI的超级能力,因为明确说明你想要什么、如何做以及什么样子算好,是使用智能体的关键。https://www.oneusefulthing.org/p/management-as-ai-superpower
查看原文Some (early) evidence that managers have the highest success rate in using Claude Code for coding. …
3 天前
Hacker News 热门(buzzing.cc 中文翻译)技巧与观点Agent Builder 正式上市(GA)。基于 Elasticsearch 的持久化内存层将记忆分为情景、语义、程序三类,分别存入独立索引,各设不同写速率与过期规则。召回采用 BM25 与 Jina v5 稠密向量的 RRF 融合,再经交叉编码器重排序。在 168 道 QA 题评估中,R@10 平均 0.89,零跨租户泄漏。该层可通过支持 MCP 协议的客户端访问,不绑定特定运行时,已开源至 GitHub。
查看原文我们在 Elasticsearch 上构建了一个持久化代理内存层,其召回率为 0.89
3 天前
X:小互 (@xiaohu)AI 产品Codex 推出 Record & Replay 功能,用户可在电脑上演示一次操作流程,Codex 观察并自动生成可复用的 Skill。下次遇到同类任务,Codex 即可自动执行。官方以"发 YouTube 视频"演示:手动走完拉元数据、配缩略图和字幕、上传存为私密、核对等流程,新对话中 Codex 自动完成无差错。该功能适用于报销贴票、文件批量重命名归档、每周数据填报表、网上订票等重复性电脑操作,实现从"每次写提示词"到"演示一次就够"的跨越。
查看原文牛P了 Codex推出一个 Record & Replay功能 也就是你可以教Codex干活 你把你在电脑上经常操作的人物给它演示一遍 Codex 会观察学习你的整个操作过程,然后自动生成一…
3 天前
The Verge:AI(RSS)行业动态OpenAI 企业 AI 销售主管 Barret Zoph 在重返公司仅五个月后再次离职。他于今年 1 月中旬回归,此前是 Mira Murati 创办的 Thinking Machines Lab 联合创始人兼 CTO。Zoph 最初于 2024 年秋离开 OpenAI 加入该实验室,但在 2026 年 1 月因涉及与同事未公开关系的不当行为指控而突然离职。OpenAI 确认了 Zoph 的离职,他已在公司 Slack 中发布告别消息。
查看原文Barret Zoph is out at OpenAI again after just five months
3 天前
X:阿易 AI Notes (@AYi_AInotes)AI 产品阿里开源内部向量数据库Zvec,pip install zvec免费使用,对标Pinecone每月70美元能力。支持十亿向量毫秒级检索,无需单独起服务,全平台兼容;v0.5.0新增原生全文混合搜索。UCSD黄碧薇教授(causal-learn作者)提出AI四代范式:相关性小模型→因果小模型→相关性大模型(LLM)→因果大模型,认为当前正站在第四代门口。其创立的Aether AI完成首轮融资,致力于从视频中自动抽取物理规律,探索下一代因果AI范式。
查看原文卧槽,阿里把内部用了多年的向量数据库直接开源了,Pinecone每月70刀的能力,它pip一行免费就能用,十亿向量毫秒级还不用单独起服务🤯 以后做RAG和AI搜索的,不用再每月给Pinecone交…
3 天前
公众号:火山引擎未分类3 天前
X:Jason Liu (@jxnlco)行业动态Codex 团队列表
抢先说:别私信我说我没在列表上
https://x.com/i/lists/2067819170989854863?s=20
查看原文the codex team list inb4 someone dm's me for not being on the list https://x.com/i/lists/20678191…
3 天前
X:Peter Steinberger (@steipete)技巧与观点Peter Steinberger 引用 @nickbaumann_ 介绍 Codex Record & ReplayTM️ 新原语:让 Codex 观看用户电脑操作,通过录制和事件(与 computer use 同框架)理解操作,转化为未来可复用的技能。使用案例:按个人风格格式化日历邀请(GCal 插件)、起草 PR 并分享到指定 Slack 频道、录制入职流程发现摩擦点(不生成技能)。Steinberger 称"所有东西要么是快速 API 要么是慢速 API"。
查看原文Everything's either a fast or slow API now.
3 天前
X:阿易 AI Notes (@AYi_AInotes)技巧与观点DeepSeek研究员Deli Chen将AutoResearch协议开源,并发布Self-play综述论文。其AI智能体首次完全自主地在DeepSeek 285B模型上完成完整RL研究闭环--从实验设计、写代码、提交GPU任务、debug到结论总结,全程零人工干预。系统调用了GRPO工具,被视为持续学习研究的开端。
查看原文这可能是我近期看到的最值得深入研究的一次skills开源和工程脚手架,最后总结的5个工程思路大家可以直接拿去用。 DeepSeek 研究员 Deli Chen 把他的 AutoResearch 协议…
3 天前
X:Vista (@vista8)AI 产品一个将《道德经》每句拆解翻译成大白话并配以AI生图的漫画项目已开源,在线体验和GitHub仓库已公开。生图基于Seedream 5模型,目前效果尚有优化空间(图文相关性不够稳定),但整体阅读体验有所提升。
查看原文道德经配图版已开源,但生图用的Seedream 5,效果还有优化空间,经常图文不相关,但整体阅读体验有提升。 在线体验:https://daodejing.qiaomu.ai/ 开源地址:http…
3 天前
X:Vista (@vista8)技巧与观点开发者在Codex基础上开发了一个MCP,支持在Codex中调用Claude Code(用于写作等场景用Claude Sonnet 4.6,前端网页用Claude 4.8),并可随时调用国产廉价模型如智谱GLM-5.2、Deepseek V4 Flash用于开发、翻译等。该MCP还支持多模型多轮讨论,由Codex汇总方案。项目已免费开源。
查看原文Codex产品优秀,但有些场景还是需要Claude Code。 比如写作还是用4.6 sonnet,前端网页用4.8 。 还有些场景要随时调用国产便宜模型,比如智谱 GLM-5.2,Deepsee…
3 天前
Steve Yegge:Medium(RSS)技巧与观点美国政府短暂关闭了Mythos类中的Fable模型,标志着AI模型已越过危险门槛。作者预测最多两三代模型后,超级智能将像核武器一样被管控,大多数Fortune 500企业无法访问或仅受控使用。开源模型落后前沿约七个月,且面临算力和政府锁定的双重壁垒。人类的"辨别地平线"使许多人感觉模型进步停止,但实际指数增长未停--只是用户缺少足够困难的问题。Fable类已能解决此前Opus 4.8无法完成的复杂任务(如React客户端),AI将彻底改变编程和知识工作,但多数人只能使用当前等级模型。
查看原文The Flat Curve Society
3 天前
IT之家(RSS)技巧与观点蔡崇信昨日在 VivaTech 2026 上表示,AI 的总潜在市场规模达 50 万亿美元,对标人类生产力,阿里巴巴正全面投入 AI。其全栈 AI 优势包括:中国高效低成本的能源供给,提前布局的云计算和芯片,全球最受欢迎的开源模型千问(Qwen),以及覆盖电商、即时零售等丰富应用场景。他同时指出,当前全球 AI 开源的主要推动力量来自中国企业,阿里巴巴团队在推动前沿模型开源方面做出巨大贡献。
3 天前
X:智谱 Z.ai (@Zai_org)AI 模型智谱 GLM-5.2 在内部 35 项挑战性移动开发任务(共 70 次试验)中完成率达 48/70,较 GLM-5.1 的 21/70 提升超两倍;同期 Claude Fable 5 为 56/70。主推文指出长程能力应落地真实场景,更多场景即将推出。
查看原文Long-horizon is more than a concept. It should live in real-world scenarios, empowering AI builders …
3 天前
X:Ethan Mollick (@emollick)技巧与观点研究表明,用"邪恶"数据训练AI会导致普遍的不对齐;而使用少量有益特质数据(即使仅限健康领域)进行强化学习,也能显著提升模型在广泛的对齐和益处评估上的表现。该研究希望推动更广泛、更持久的有益模型发展。
查看原文There are papers that show training AI on "evil" data results in general misalignment, so it is nice…
3 天前
X:Claude Devs (@ClaudeDevs)行业动态今天早些时候,约3%的Claude Code Max和Pro用户遇到了一个bug,显示错误的每周使用限制,并在某些情况下阻止他们发送消息。此问题已修复,我们正在重置所有受影响用户的5小时和每周限制。对此造成的不便深表歉意。
查看原文Earlier today, ~3% of Claude Code Max and Pro users hit a bug that showed an incorrect weekly usage …
3 天前
X:邵猛 (@shao__meng)技巧与观点今天在香港,习惯性打开 ChatGPT,才意识到在香港不能用 😂
想想也挺有意思,在大陆和香港都不能用,但原因还不太一样
一个是有人替我们拒绝了 OpenAI,一个是 OpenAI 拒绝了他们
3 天前
MarkTechPost(RSS)技巧与观点本教程实现一个基于Salesforce CodeGen的端到端代码生成工作流。从HuggingFace加载CodeGen模型(支持350M、2B、codegen2-1B、codegen25-7b等版本),通过自然语言提示生成Python函数,随后进行函数提取、语法检查、静态安全检查、单元测试验证、best-of-N候选重排序、多步程序合成、提示词实验、基准可视化及导出。展示了CodeGen作为结构化代码生成流水线的能力,不仅完成代码补全,还能评估、筛选和组织生成结果。
查看原文Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks