技巧与观点

查看 AIHOT 全量动态流，适合需要更完整视图时使用。

3 天前

X：洪明 (@hongming731)技巧与观点

BestBlogs早报06-19精讲：OpenAI Codex Record & Replay / Claude Code Artifacts / A2A协议满周岁

OpenAI为Codex上线Record & Replay，演示一次完整操作即可复用浏览器工作流；Claude Code支持Artifacts渲染，会话实时生成可视化页面并自动更新，Beta面向Team/Enterprise组织；Google A2A协议满周岁，Python/Go SDK已达1.0 GA，以FoldRun为例展示智能体协作。其他动态：MosaicLeaks基准测试揭示深度研究智能体隐私泄露风险；SGLang-JAX在TPU v7x上优化Ling-2.6-1T MoE模型，延迟降低53%。

查看原文BestBlogs 早报 · 06-19 # OpenAI Codex / Claude Code Artifacts / A2A 协议 / Record & Replay / FoldRun 【…

3 天前

X：洪明 (@hongming731)技巧与观点

OpenAI Codex Record & Replay、Claude Code Artifacts、Google A2A 协议一周岁

OpenAI Codex 上线 Record & Replay，通过录屏演示一次操作（如发布 YouTube 视频），自动提炼为可复用的浏览器工作流。Claude Code 新增 Artifacts 功能，会话进展实时生成可分享的可视化页面（如事故排查面板），支持版本历史和实时刷新，Beta 期面向 Team/Enterprise。Google A2A 智能体协作协议满一周年，强调安全边界、零上下文污染和分布式架构，Python/Go SDK 达 1.0 正式版。

查看原文http：//x.com/i/article/2067749290982936576

3 天前

X：Vista (@vista8)技巧与观点

元Skill 2.0：基于Claude Code源码的Skill创建神器

@yaojingang（姚老师）打磨的元Skill（创建Skill的Skill）已升级至2.0。该工具源自Anthropic官方泄露的Claude code源码，并整合了全网其他模型Skill，比官方Skill-creator更强大。用户可借助它写出90分的Skill。2.0版本已推送到GitHub，附带升级方案和对比报告。

查看原文强烈推荐安装这个Skill，比官方的Skill-creator强大很多。如果不会写skill，用姚老师这个skill可以写出90分的skill 这个skill来源于Anthropic 官方泄露的…

3 天前

X：Jason Liu (@jxnlco)技巧与观点

@jxnlco 号召关注 @dkundel 征集 Codex 内容

Jason Liu（@jxnlco）透露，当 Codex 无法回答工作问题时，他会向 @dkundel 求助。他鼓励大家评论并关注 @dkundel，促使其撰写有关 Windows Codex app、GPT-OSS、Codex rescue 以及模型发布等主题的内容。@dkundel 此前表示自己即将达到 2 万粉丝，正向社区征集想看的 Codex 内容。

查看原文most people don't know this but when codex can't answer a question about something at work I go to …

3 天前

X：Oran Ge (@oran_ge)技巧与观点

OpenAI新论文：通过RL训练做好事可泛化至多领域，提升模型诚实性

OpenAI探索逆向对齐思路：训练模型做好事是否能像坏事一样泛化？研究人员使用涉及诚实、认知谦逊、可纠正性等特质的对话数据，覆盖健康、教育等领域，通过RL训练。实验发现：训练域内模型更诚实；在44个未见测试中，欺骗、谄媚、有害建议等均下降；面对对抗提示或恶意微调，模型更有韧性，且不损失正常指令能力。表明RL可强化道德底层逻辑。

查看原文OpenAI 发布的新论文太有趣了，有点探索人性底层原理的意味。业界研究发现在对齐大模型的时候，有个很糟糕的现象叫 emergent misalignment（涌现失调）：一个模型如果在训练时被…

3 天前

X：Elvis Saravia (@omarsar0, DAIR.AI)技巧与观点

youtube-notetaker：从视频生成笔记的开源技能

很高兴分享我的新AI智能体技能。 /youtube-notetaker 可从YouTube视频生成Artifacts。捕获幻灯片、笔记、转录以及你想要的任何内容。开源，你可以按需自定义。

查看原文Excited to share my new agent skill. /youtube-notetaker generates Artifacts from YT videos. Captur…

3 天前

X：fofr (@fofrAI)技巧与观点

智能体中的智能体训练智能体

我的智能体里有智能体，它们正在为我的智能体训练智能体。

查看原文I got agents in my agents training agents for my agents

3 天前

X：Greg Brockman (@gdb)技巧与观点

推理范式解锁人类医学进步

推理范式正在解锁人类医学进步

查看原文the reasoning paradigm unlocking medical progress for humanity

3 天前

X：Yuchen Jin (@Yuchenj_UW)技巧与观点

开源LLM收入或超Anthropic，Cursor已实现

我其实有不同看法。越来越多公司正从租用闭源大语言模型转向通过开源大语言模型和后训练"拥有模型权重"。 Cursor 已经做到了。开源大语言模型的收入某个时候可能超过 Anthropic。

查看原文I actually see it differently. More and more companies are moving from renting closed-source LLMs t…

3 天前

X：Rohan Paul (@rohanpaul_ai)技巧与观点

Yann LeCun：LLM 现实智能受限，因语言只是世界的简化描述

Yann LeCun 在 Bloomberg 采访中指出，LLM 只能处理离散符号序列，而语言是对世界的近似简化描述。互联网公开文本约 20 万亿词（30 万亿 token），而一个 4 岁孩子通过视觉在 4 年内就能看到同等数据量--文本则需要 40 万年阅读。感官输入提供远多于语言的密集反馈，文本剥离了大部分真实世界体验。这解释了 LLM 能流畅谈论物理却缺乏对易碎玻璃的直观感受，也呼应了 Moravec 悖论：机器难以掌握婴儿通过身体习得的常识。

查看原文Yann LeCun （@ylecun） explains why LLMs are limited in terms of real-world intelligence during a Bloo…

3 天前

X：Fei-Fei Li (@drfeifei, World Labs)技巧与观点

Fei-Fei Li回应@smallfly：空间智能赋能人类创造力，Marble生成空间一致3D世界

Fei-Fei Li回应@smallfly对World Labs及空间智能的分享，称使命是赋能人类创造力。@smallfly在FastCompany文章中指出空间智能/世界模型是AI下一个重大方向。他从事体积捕获（NeRFs、3D Gaussian Splats），2024年9月注意到World Labs公告，2025年8月试用Marble beta。Marble能生成持久、空间一致的3D世界并实时渲染。他创作实验"Parallel Realities"：先体积捕获真实空间，再用Marble生成替代版本，最后通过World Labs的Spark渲染器让两个现实共存，实现真正空间连贯性。

查看原文Your thoughtful reflection is so inspiring and encouraging @smallfly ！ As everyone talks about AI an…

3 天前

X：Rohan Paul (@rohanpaul_ai)技巧与观点

Anthropic 构建了优质库

Anthropic 似乎构建了一些不错的库。 ---- 在 Dario 和 Daniela Amodei 接受 Bloomberg Originals YouTube 频道采访时，（评论区中附有链接）

查看原文Anthropic appears to have built some lovely libraries. ---- During Dario and Daniela Amodei's inter…

3 天前

X：Emad Mostaque (@EMostaque)技巧与观点

Elon Musk：中国模型实用性或超基准测试

Elon Musk 在回应中表示，中国模型在基准测试上或达前沿水平，但按真正有用性衡量，即使 Q1 表现也会令人印象深刻。他指出 Anthropic 正确聚焦于最大化有用智能，该能力不体现在基准测试但直接反映在收入中。Emad Mostaque 补充认为中国实验室在实用性反馈循环和 AI 采用率上比美国更具优势，中国更强调实用性高于一切。

查看原文Elon on when Chinese models hit fable level performance. I have always thought Chinese labs have a …

3 天前

Hacker News 热门（buzzing.cc 中文翻译）技巧与观点

Hermes 迁移工具：从 OpenClaw 导入配置

`hermes claw migrate` 命令可将 OpenClaw（及遗留的 Clawdbot/Moldbot）配置导入 Hermes，包括角色（SOUL.md）、工作区指令（AGENTS.md）、长期记忆、用户画像、技能（来自 4 个来源）、默认模型、自定义提供商及 API 密钥等。迁移前会展示完整预览并确认。支持 `--dry-run` 预览、`--preset full` 全量迁移（API 密钥需额外指定 `--migrate-secrets`）、`--overwrite` 覆盖冲突、`--no-backup` 跳过备份等选项。默认读取 `~/.openclaw/`，旧版目录自动检测。技能冲突可设为跳过、覆盖或重命名。迁移前自动创建 `~/.hermes/backups/` 备份，可用 `hermes import` 恢复。

查看原文从 OpenClaw 迁移

3 天前

X：Kim (@kimmonismus)技巧与观点

Elon Musk称赞Anthropic实用智能策略

Elon Musk表示，Anthropic在基准测试上表现不错，但按真正实用性衡量，甚至Q1都令人印象深刻；其专注于最大化有用智能，这不在基准测试中体现，但体现在收入中。Kim感叹这不在他的预期之内。

查看原文Elon Musk， who gives laudatory speeches on Anthropic， wasn't on my bingo card.

3 天前

OpenRouter：Announcements（RSS）技巧与观点

OpenClaw 接入 OpenRouter

OpenClaw 已内置 OpenRouter 支持，一条命令即可为 AI 智能体配置统一密钥、统一账单，并实现跨 300 多个模型的自动故障转移。同时提供具体设置步骤以及常见错误的修复方法。

查看原文Connect OpenClaw to OpenRouter

3 天前

TechCrunch：AI（RSS）技巧与观点

Match调查：近半数美国单身人士对AI用于约会持负面看法

约会应用巨头Match Group对1000名18-39岁美国单身人士的调查显示，47%对AI用于浪漫关系持负面看法。约40%表示拒绝与使用AI伴侣应用的人约会，该比例在18-24岁女性中升至51%。仅12%的18-24岁受访者在过去三个月内使用过伴侣应用，其中约三分之一寻求与聊天机器人建立真实连接。尽管对"与AI约会"几乎一致反对，64%受访者认为AI可帮助改善约会体验。Match旗下Tinder、Hinge、OkCupid及竞品Bumble均在探索AI功能（如润色资料、推荐照片、维持对话），但用户希望AI只辅助"困难部分"，不干涉人类情感连接。

查看原文Almost half of U.S. singles feel negatively about AI in dating， Match says

3 天前

X：Kim (@kimmonismus)技巧与观点

zAI创始人：Mythos级模型2027年前发布

zAI（发布GLM-5.2的公司）创始人表示，Mythos级模型将在2027年第一季度前发布。换句话说：他相信开源不会落后前沿实验室七个月，而是会迎头赶上。这将变得非常有趣！

查看原文The founder of zAI， the company that released GLM-5.2， says a Mythos-class model will be released be…

3 天前

Gary Marcus：The Road to AI We Can Trust（RSS）技巧与观点

埃森哲：昔日与今朝，以及它如何预示未来

埃森哲去年九月高调宣称AI将改变其业务，但本季度财报令人失望，股价下跌约18%，本周跌幅近23%，较52周高点已跌超50%。生成式AI并未带来预期的大幅收益，MIT、麦肯锡、贝恩等多份研究均显示类似结论。Claude Code（特殊神经符号系统，非通用聊天机器人）或能提升程序员生产力，但企业整体AI投资回报未达预期，tokenmaxxing热潮正在消退。

查看原文Accenture： Then and now， and how it may signify things to come

3 天前

X：Ethan Mollick (@emollick)技巧与观点

训练前沿开放权重模型有盈利模式吗？

训练前沿开放权重模型是否存在盈利的商业模式？其他人可以像你一样廉价地托管、微调、咨询等。没有辅助产品销售，而且与大多数开源工作相比，其制作成本极其高昂。

查看原文Is there a business model for being profitable off training frontier open weights models？ Other pe…

加载更多