技巧与观点
查看 AIHOT 全量动态流,适合需要更完整视图时使用。
5 天前
Gary Marcus:The Road to AI We Can Trust(RSS)技巧与观点评论认为 OpenAI 正面临多重危机:缺乏护城河导致市场领先地位下滑;最大投资者微软持续疏远,近期甚至公开考虑将主要产品外包给中国;亏损速度远超预期,年亏损额以 8 倍增长。华盛顿方面可能打压 Anthropic,但也可能反而帮助其崛起,而 Elon Musk 成为另一个潜在的竞标者。
查看原文OpenAI's lead is dwindling fast
5 天前
X:Rohan Paul (@rohanpaul_ai)技巧与观点OpenClaw趋势发生了什么。
是因为很多人说不需要在Google上搜索OpenClaw,因为他们已经有了OpenClaw吗?
查看原文Whats happening to OpenClaw trend. Is it because many people say there's no need to search for Open…
查看原文if you can easily answer 'what are you working on' you're not using agents enough.
6 天前
X:Rohan Paul (@rohanpaul_ai)技巧与观点微软的2026年工作趋势指数显示新加坡劳动力在AI采用方面领先。
66%的新加坡AI用户表示他们现在能产出一年前无法完成的工作,而全球比例为58%。
在前沿专业人士(微软对高级AI用户的称呼)中,这一比例升至82%。
查看原文Microsoft's 2026 Work Trend Index shows Singapore workforce ahead on AI adoption. 66% of Singapore …
6 天前
X:Jason Liu (@jxnlco)技巧与观点对 computer use、browser use 和 chrome extension 感到困惑?
这篇就是为你准备的
读完后你会明白它们各自是什么、如何工作,以及 app shots 如何将它们串联起来
查看原文feeling confused about computer use, browser use, and the chrome extension? this is for you by th…
查看原文http://x.com/i/article/2066964446086676480
6 天前
X:Nathan Lambert (@natolambert)技巧与观点很难精确衡量开源与闭源的差距等等,但我信任 @arena 团队,直接看 GLM 5.2 所处的位置就行。这是一个采用 MIT 许可证、即将开源权重的模型。到这一步,你甚至可以说它的智能体比 Gemini 还要好。这是实打实的成就。
查看原文It's hard to pinpoint open-closed gap and so-on, but I trust the @arena team and just look where GLM…
6 天前
X:MiniMax (@MiniMax_AI)技巧与观点MiniMax 的 M3 模型在卡塔尔 vs 瑞士的世界杯比赛中正确预测平局,成为五个模型和一位人类预测中唯一正确的选择。Kilo CLI 分析显示,该基准刻意排除博彩赔率,因此瑞士 64% 的市场赔率未被纳入。M3 依据双方相同的 WWDLW 记录、卡塔尔更高的原始评分以及瑞士更强的联赛水平做出判断。主推文同时提问"FWC-Bench when?",暗示可能推出新基准测试。
查看原文happy world cup everyone ⚽️ FWC-Bench when?
6 天前
X:Nathan Lambert (@natolambert)技巧与观点智谱(Zhipu AI)最新模型 GLM-5.2 在 Design Arena 上以 1360 Elo 跃居第一,超越已下架的 Claude Fable 5,并开源权重。此次排名上升 4 位、Elo 提升 27 分,创下该基准代码类别的历史最高分之一。AI 分析师 Nathan Lambert 评价称,中国科研团队用更少算力达到高水准,虽美国模型整体领先,但无法忽视中国实验室的进步。
查看原文Still hard to expect the unexpected with AI. It goes to show how skilled many of the scientists are …
6 天前
X:Ethan Mollick (@emollick)技巧与观点Ethan Mollick 将 7 个月前的 GPT-5.2 与新款 GLM-5.2 Deep Think Max 进行对比,用同一提示词要求生成可运行于 Twigl 的着色器(描绘哥特塔楼无限城市半淹于风暴海洋)。GLM-5.2 出现了若干错误。此前 Ethan 曾提前体验 GPT-5.2,并展示了 GPT-5.2 Pro 单次生成的该着色器版本。
查看原文Compare GPT-5.2 from 7 months ago with the new GLM-5.2 Deep Think Max's: "create a visually interest…
6 天前
OpenRouter:Announcements(RSS)技巧与观点设置三个环境变量即可将Claude Code连至OpenRouter,无需本地代理或Docker。OpenRouter提供供应商故障转移、预算控制与用量监控,支持Anthropic Skin原生协议,保留Thinking、工具调用、流式输出。可为Opus(架构推理)、Sonnet(日常编码)、Haiku(快速转换)分别指定模型。Fast Mode最高2.5倍速度,仅限Claude Opus 4.6/4.7/4.8,需Claude Code v2.1.96+。团队场景:一个OpenRouter密钥统一计费、设置每密钥限额,活动仪表板查看会话成本。
查看原文How to Use Claude Code with OpenRouter
6 天前
X:Epoch AI (@EpochAIResearch)技巧与观点自筹资金的AI建设是否走向终结?
超大规模企业的现金资本支出增速远超现金流入。按当前趋势,到今年年底,他们将无法完全依靠运营现金流来为AI基础设施建设提供资金。
查看原文The end of the self-funded AI buildout? Hyperscaler cash capex is growing much faster than cash inf…
6 天前
X:MiniMax (@MiniMax_AI)技巧与观点MiniMax 展示了其 M3 模型在真实 Agent 循环中的应用,通过 Together Compute 提供完整模型栈:Parakeet 负责语音转文字(STT)、MiniMax Speech 2.8 负责语音合成、MiniMax M3 负责推理。Demo 为一个 Mac 顶栏应用,用户提问后 M3 读取屏幕指出薄弱环节,再通过指令直接编辑磁盘上的文件。切换 STT 至 Together AI 后,延迟从 546ms 降至 277ms。
查看原文nice example of M3 in a real agent loop, all served through @togethercompute
6 天前
Hacker News 热门(buzzing.cc 中文翻译)技巧与观点6月16日,一篇标题为"Why is Meta destroying its engineering organization?"的博客文章出现在 Hacker News,获得110个点赞。文章指出 Meta 正在解散其工程组织,引发业界广泛讨论。具体原因和后续影响尚未明确。
查看原文Meta为什么要解散其工程部门?
6 天前
X:SemiAnalysis (@SemiAnalysis_)技巧与观点RL系统 注意差距:匹配训练器与生成器吞吐量
RL训练基础设施,GRPO,
PipelineRL,异步RL,策略陈旧性,
RL沙箱基础设施,CPU需求,
TCO分析,思考机器修补
查看原文RL Systems Mind the Gap: Matching Trainer and Generator Throughput RL Training Infrastructure, GRPO…
6 天前
X:Ethan Mollick (@emollick)技巧与观点假设开源模型持续落后闭源约8-12个月(至少在编程方面),加强IT系统以防御Mythos级模型的倒计时现在为4-8个月。
拥有今天公开可用且相对安全的防御性Mythos级模型很重要。
查看原文Assuming open models continue to lag about 8-12 months behind closed source (at least in coding), th…
6 天前
X:OpenAI (@OpenAI)技巧与观点我们来聊聊评估。
我们一直在寻找更好的方法来衡量和预测模型进展,尤其是在基准测试逐渐饱和或被钻空子的时候。
领导我们前沿评估团队的 @tejalpatwardhan 与 @andrewmayne 谈到了评估为何重要,以及接下来模型需要被评判的标准。
查看原文Let's talk about evals. We're always looking for better ways to measure and forecast model progress…
6 天前
X:Jason Liu (@jxnlco)技巧与观点作者Jason Liu发现自己在脑海中就可以进行类似AI图像生成的体验,无需打开应用写提示词。他举例:看到咖啡店窗边的橙猫和牛角面包后,直接想象出暖光、浅景深、胶片颗粒等电影感画面,甚至"脑补"了猫戴贝雷帽。他猜测AI的Codex使用图像生成时可能也是类似的内部感受。
查看原文Does anyone else use Image Gen in their head? I love using image generation whenever I have a weird…
6 天前
X:SemiAnalysis (@SemiAnalysis_)技巧与观点警报:OpenAI的首席财务官声称他们的下一次重大训练运行将在2026年秋季在Vera Rubin上进行,但这说不通。Rubin NVL72集群届时可能还不够稳定,软件栈也不足以支持真正的"重大训练运行"。Rubin或许已准备好用于生产推理和小规模训练实验,但无法在2026年秋季支持前沿规模的训练。
查看原文ALERT: OpenAI's CFO claims their next big training run will happen in Fall 2026 on Vera Rubin but th…
6 天前
TechCrunch:AI(RSS)技巧与观点WordPress VIP基于2000名受访者的调查显示,60%美国消费者认为品牌消息中出现"AI"会令人反感,86%不完全信任AI并仍想查看原始来源。42%表示缺乏明确归属的AI生成答案比航空公司费用、隐私政策和医疗账单更不可信。近四分之三受访者认为互联网比十年前更不人性化。33%将点击查看原始来源视为首要信任信号,80%认为网络信息应保持开放可访问。企业方面,60%受访企业称来自AI搜索引擎和答案平台的流量在过去一年增加,74%企业决策者将AI可发现性和归属列为主要或重要优先级。
查看原文Sixty percent of U.S. consumers say 'AI' in brand messaging is a turnoff, survey finds