技巧与观点

查看 AIHOT 全量动态流，适合需要更完整视图时使用。

5 天前

Gary Marcus：The Road to AI We Can Trust（RSS）技巧与观点

评论认为 OpenAI 正面临多重危机：缺乏护城河导致市场领先地位下滑；最大投资者微软持续疏远，近期甚至公开考虑将主要产品外包给中国；亏损速度远超预期，年亏损额以 8 倍增长。华盛顿方面可能打压 Anthropic，但也可能反而帮助其崛起，而 Elon Musk 成为另一个潜在的竞标者。

查看原文OpenAI's lead is dwindling fast

5 天前

X：Rohan Paul (@rohanpaul_ai)技巧与观点

OpenClaw趋势变化原因探讨

OpenClaw趋势发生了什么。是因为很多人说不需要在Google上搜索OpenClaw，因为他们已经有了OpenClaw吗？

查看原文Whats happening to OpenClaw trend. Is it because many people say there's no need to search for Open…

5 天前

X：Jason Liu (@jxnlco)技巧与观点

轻易答出在做什么？智能体用得不够

如果你能轻松回答"你在做什么"，那说明你的智能体用得还不够。

查看原文if you can easily answer 'what are you working on' you're not using agents enough.

6 天前

X：Rohan Paul (@rohanpaul_ai)技巧与观点

Microsoft 2026报告：新加坡AI采用领先全球

微软的2026年工作趋势指数显示新加坡劳动力在AI采用方面领先。 66%的新加坡AI用户表示他们现在能产出一年前无法完成的工作，而全球比例为58%。在前沿专业人士（微软对高级AI用户的称呼）中，这一比例升至82%。

查看原文Microsoft's 2026 Work Trend Index shows Singapore workforce ahead on AI adoption. 66% of Singapore …

6 天前

X：Jason Liu (@jxnlco)技巧与观点

一文分清Computer Use与Browser Use

对 computer use、browser use 和 chrome extension 感到困惑？这篇就是为你准备的读完后你会明白它们各自是什么、如何工作，以及 app shots 如何将它们串联起来

查看原文feeling confused about computer use， browser use， and the chrome extension？ this is for you by th…

6 天前

X：Jason Liu (@jxnlco)技巧与观点

"推文链接需补充正文"

"原文为URL，无法翻译（http：//x.com/i/article/2066964446086676480）"

查看原文http：//x.com/i/article/2066964446086676480

6 天前

X：Nathan Lambert (@natolambert)技巧与观点

GLM 5.2 开源Agent表现优于Gemini

很难精确衡量开源与闭源的差距等等，但我信任 @arena 团队，直接看 GLM 5.2 所处的位置就行。这是一个采用 MIT 许可证、即将开源权重的模型。到这一步，你甚至可以说它的智能体比 Gemini 还要好。这是实打实的成就。

查看原文It's hard to pinpoint open-closed gap and so-on， but I trust the @arena team and just look where GLM…

6 天前

X：MiniMax (@MiniMax_AI)技巧与观点

MiniMax M3 世界杯预测独中平局

MiniMax 的 M3 模型在卡塔尔 vs 瑞士的世界杯比赛中正确预测平局，成为五个模型和一位人类预测中唯一正确的选择。Kilo CLI 分析显示，该基准刻意排除博彩赔率，因此瑞士 64% 的市场赔率未被纳入。M3 依据双方相同的 WWDLW 记录、卡塔尔更高的原始评分以及瑞士更强的联赛水平做出判断。主推文同时提问"FWC-Bench when？"，暗示可能推出新基准测试。

查看原文happy world cup everyone ⚽️ FWC-Bench when？

6 天前

X：Nathan Lambert (@natolambert)技巧与观点

GLM-5.2 登顶 Design Arena，开源权重超越 Claude Fable 5

智谱（Zhipu AI）最新模型 GLM-5.2 在 Design Arena 上以 1360 Elo 跃居第一，超越已下架的 Claude Fable 5，并开源权重。此次排名上升 4 位、Elo 提升 27 分，创下该基准代码类别的历史最高分之一。AI 分析师 Nathan Lambert 评价称，中国科研团队用更少算力达到高水准，虽美国模型整体领先，但无法忽视中国实验室的进步。

查看原文Still hard to expect the unexpected with AI. It goes to show how skilled many of the scientists are …

6 天前

X：Ethan Mollick (@emollick)技巧与观点

GLM-5.2 Deep Think Max 对比 GPT-5.2

Ethan Mollick 将 7 个月前的 GPT-5.2 与新款 GLM-5.2 Deep Think Max 进行对比，用同一提示词要求生成可运行于 Twigl 的着色器（描绘哥特塔楼无限城市半淹于风暴海洋）。GLM-5.2 出现了若干错误。此前 Ethan 曾提前体验 GPT-5.2，并展示了 GPT-5.2 Pro 单次生成的该着色器版本。

查看原文Compare GPT-5.2 from 7 months ago with the new GLM-5.2 Deep Think Max's： "create a visually interest…

6 天前

OpenRouter：Announcements（RSS）技巧与观点

使用OpenRouter连接Claude Code

设置三个环境变量即可将Claude Code连至OpenRouter，无需本地代理或Docker。OpenRouter提供供应商故障转移、预算控制与用量监控，支持Anthropic Skin原生协议，保留Thinking、工具调用、流式输出。可为Opus（架构推理）、Sonnet（日常编码）、Haiku（快速转换）分别指定模型。Fast Mode最高2.5倍速度，仅限Claude Opus 4.6/4.7/4.8，需Claude Code v2.1.96+。团队场景：一个OpenRouter密钥统一计费、设置每密钥限额，活动仪表板查看会话成本。

查看原文How to Use Claude Code with OpenRouter

6 天前

X：Epoch AI (@EpochAIResearch)技巧与观点

超大规模企业AI自筹资金模式或终结

自筹资金的AI建设是否走向终结？超大规模企业的现金资本支出增速远超现金流入。按当前趋势，到今年年底，他们将无法完全依靠运营现金流来为AI基础设施建设提供资金。

查看原文The end of the self-funded AI buildout？ Hyperscaler cash capex is growing much faster than cash inf…

6 天前

X：MiniMax (@MiniMax_AI)技巧与观点

MiniMax M3 结合 Together Compute 实现真实 Agent 循环

MiniMax 展示了其 M3 模型在真实 Agent 循环中的应用，通过 Together Compute 提供完整模型栈：Parakeet 负责语音转文字（STT）、MiniMax Speech 2.8 负责语音合成、MiniMax M3 负责推理。Demo 为一个 Mac 顶栏应用，用户提问后 M3 读取屏幕指出薄弱环节，再通过指令直接编辑磁盘上的文件。切换 STT 至 Together AI 后，延迟从 546ms 降至 277ms。

查看原文nice example of M3 in a real agent loop， all served through @togethercompute

6 天前

Hacker News 热门（buzzing.cc 中文翻译）技巧与观点

Meta 解散工程部门引发热议

6月16日，一篇标题为"Why is Meta destroying its engineering organization？"的博客文章出现在 Hacker News，获得110个点赞。文章指出 Meta 正在解散其工程组织，引发业界广泛讨论。具体原因和后续影响尚未明确。

查看原文Meta为什么要解散其工程部门？

6 天前

X：SemiAnalysis (@SemiAnalysis_)技巧与观点

RL系统需匹配训练与生成吞吐量

RL系统注意差距：匹配训练器与生成器吞吐量 RL训练基础设施，GRPO， PipelineRL，异步RL，策略陈旧性， RL沙箱基础设施，CPU需求， TCO分析，思考机器修补

查看原文RL Systems Mind the Gap： Matching Trainer and Generator Throughput RL Training Infrastructure， GRPO…

6 天前

X：Ethan Mollick (@emollick)技巧与观点

防御Mythos级模型倒计时4-8个月

假设开源模型持续落后闭源约8-12个月（至少在编程方面），加强IT系统以防御Mythos级模型的倒计时现在为4-8个月。拥有今天公开可用且相对安全的防御性Mythos级模型很重要。

查看原文Assuming open models continue to lag about 8-12 months behind closed source （at least in coding）， th…

6 天前

X：OpenAI (@OpenAI)技巧与观点

OpenAI 评估团队谈模型评估重要性

我们来聊聊评估。我们一直在寻找更好的方法来衡量和预测模型进展，尤其是在基准测试逐渐饱和或被钻空子的时候。领导我们前沿评估团队的 @tejalpatwardhan 与 @andrewmayne 谈到了评估为何重要，以及接下来模型需要被评判的标准。

查看原文Let's talk about evals. We're always looking for better ways to measure and forecast model progress…

6 天前

X：Jason Liu (@jxnlco)技巧与观点

脑内AI图像生成：人类的新能力？

作者Jason Liu发现自己在脑海中就可以进行类似AI图像生成的体验，无需打开应用写提示词。他举例：看到咖啡店窗边的橙猫和牛角面包后，直接想象出暖光、浅景深、胶片颗粒等电影感画面，甚至"脑补"了猫戴贝雷帽。他猜测AI的Codex使用图像生成时可能也是类似的内部感受。

查看原文Does anyone else use Image Gen in their head？ I love using image generation whenever I have a weird…

6 天前

X：SemiAnalysis (@SemiAnalysis_)技巧与观点

OpenAI CFO称2026秋用Rubin训练引质疑

警报：OpenAI的首席财务官声称他们的下一次重大训练运行将在2026年秋季在Vera Rubin上进行，但这说不通。Rubin NVL72集群届时可能还不够稳定，软件栈也不足以支持真正的"重大训练运行"。Rubin或许已准备好用于生产推理和小规模训练实验，但无法在2026年秋季支持前沿规模的训练。

查看原文ALERT： OpenAI's CFO claims their next big training run will happen in Fall 2026 on Vera Rubin but th…

6 天前

TechCrunch：AI（RSS）技巧与观点

调查：60%美国消费者反感品牌消息中使用"AI"一词

WordPress VIP基于2000名受访者的调查显示，60%美国消费者认为品牌消息中出现"AI"会令人反感，86%不完全信任AI并仍想查看原始来源。42%表示缺乏明确归属的AI生成答案比航空公司费用、隐私政策和医疗账单更不可信。近四分之三受访者认为互联网比十年前更不人性化。33%将点击查看原始来源视为首要信任信号，80%认为网络信息应保持开放可访问。企业方面，60%受访企业称来自AI搜索引擎和答案平台的流量在过去一年增加，74%企业决策者将AI可发现性和归属列为主要或重要优先级。

查看原文Sixty percent of U.S. consumers say 'AI' in brand messaging is a turnoff， survey finds

加载更多