技巧与观点

查看 AIHOT 全量动态流,适合需要更完整视图时使用。

5 天前
Gary Marcus:The Road to AI We Can Trust(RSS)技巧与观点
评论认为 OpenAI 正面临多重危机:缺乏护城河导致市场领先地位下滑;最大投资者微软持续疏远,近期甚至公开考虑将主要产品外包给中国;亏损速度远超预期,年亏损额以 8 倍增长。华盛顿方面可能打压 Anthropic,但也可能反而帮助其崛起,而 Elon Musk 成为另一个潜在的竞标者。
查看原文OpenAI's lead is dwindling fast
5 天前
X:Rohan Paul (@rohanpaul_ai)技巧与观点
OpenClaw趋势发生了什么。 是因为很多人说不需要在Google上搜索OpenClaw,因为他们已经有了OpenClaw吗?
查看原文Whats happening to OpenClaw trend. Is it because many people say there's no need to search for Open…
5 天前
X:Jason Liu (@jxnlco)技巧与观点
如果你能轻松回答"你在做什么",那说明你的智能体用得还不够。
查看原文if you can easily answer 'what are you working on' you're not using agents enough.
6 天前
X:Rohan Paul (@rohanpaul_ai)技巧与观点
微软的2026年工作趋势指数显示新加坡劳动力在AI采用方面领先。 66%的新加坡AI用户表示他们现在能产出一年前无法完成的工作,而全球比例为58%。 在前沿专业人士(微软对高级AI用户的称呼)中,这一比例升至82%。
查看原文Microsoft's 2026 Work Trend Index shows Singapore workforce ahead on AI adoption. 66% of Singapore …
6 天前
X:Jason Liu (@jxnlco)技巧与观点
对 computer use、browser use 和 chrome extension 感到困惑? 这篇就是为你准备的 读完后你会明白它们各自是什么、如何工作,以及 app shots 如何将它们串联起来
查看原文feeling confused about computer use, browser use, and the chrome extension? this is for you by th…
6 天前
X:Jason Liu (@jxnlco)技巧与观点
"原文为URL,无法翻译(http://x.com/i/article/2066964446086676480)"
查看原文http://x.com/i/article/2066964446086676480
6 天前
X:Nathan Lambert (@natolambert)技巧与观点
很难精确衡量开源与闭源的差距等等,但我信任 @arena 团队,直接看 GLM 5.2 所处的位置就行。这是一个采用 MIT 许可证、即将开源权重的模型。到这一步,你甚至可以说它的智能体比 Gemini 还要好。这是实打实的成就。
查看原文It's hard to pinpoint open-closed gap and so-on, but I trust the @arena team and just look where GLM…
6 天前
X:MiniMax (@MiniMax_AI)技巧与观点
MiniMax 的 M3 模型在卡塔尔 vs 瑞士的世界杯比赛中正确预测平局,成为五个模型和一位人类预测中唯一正确的选择。Kilo CLI 分析显示,该基准刻意排除博彩赔率,因此瑞士 64% 的市场赔率未被纳入。M3 依据双方相同的 WWDLW 记录、卡塔尔更高的原始评分以及瑞士更强的联赛水平做出判断。主推文同时提问"FWC-Bench when?",暗示可能推出新基准测试。
查看原文happy world cup everyone ⚽️ FWC-Bench when?
6 天前
X:Nathan Lambert (@natolambert)技巧与观点
智谱(Zhipu AI)最新模型 GLM-5.2 在 Design Arena 上以 1360 Elo 跃居第一,超越已下架的 Claude Fable 5,并开源权重。此次排名上升 4 位、Elo 提升 27 分,创下该基准代码类别的历史最高分之一。AI 分析师 Nathan Lambert 评价称,中国科研团队用更少算力达到高水准,虽美国模型整体领先,但无法忽视中国实验室的进步。
查看原文Still hard to expect the unexpected with AI. It goes to show how skilled many of the scientists are …
6 天前
X:Ethan Mollick (@emollick)技巧与观点
Ethan Mollick 将 7 个月前的 GPT-5.2 与新款 GLM-5.2 Deep Think Max 进行对比,用同一提示词要求生成可运行于 Twigl 的着色器(描绘哥特塔楼无限城市半淹于风暴海洋)。GLM-5.2 出现了若干错误。此前 Ethan 曾提前体验 GPT-5.2,并展示了 GPT-5.2 Pro 单次生成的该着色器版本。
查看原文Compare GPT-5.2 from 7 months ago with the new GLM-5.2 Deep Think Max's: "create a visually interest…
6 天前
OpenRouter:Announcements(RSS)技巧与观点
设置三个环境变量即可将Claude Code连至OpenRouter,无需本地代理或Docker。OpenRouter提供供应商故障转移、预算控制与用量监控,支持Anthropic Skin原生协议,保留Thinking、工具调用、流式输出。可为Opus(架构推理)、Sonnet(日常编码)、Haiku(快速转换)分别指定模型。Fast Mode最高2.5倍速度,仅限Claude Opus 4.6/4.7/4.8,需Claude Code v2.1.96+。团队场景:一个OpenRouter密钥统一计费、设置每密钥限额,活动仪表板查看会话成本。
查看原文How to Use Claude Code with OpenRouter
6 天前
X:Epoch AI (@EpochAIResearch)技巧与观点
自筹资金的AI建设是否走向终结? 超大规模企业的现金资本支出增速远超现金流入。按当前趋势,到今年年底,他们将无法完全依靠运营现金流来为AI基础设施建设提供资金。
查看原文The end of the self-funded AI buildout? Hyperscaler cash capex is growing much faster than cash inf…
6 天前
X:MiniMax (@MiniMax_AI)技巧与观点
MiniMax 展示了其 M3 模型在真实 Agent 循环中的应用,通过 Together Compute 提供完整模型栈:Parakeet 负责语音转文字(STT)、MiniMax Speech 2.8 负责语音合成、MiniMax M3 负责推理。Demo 为一个 Mac 顶栏应用,用户提问后 M3 读取屏幕指出薄弱环节,再通过指令直接编辑磁盘上的文件。切换 STT 至 Together AI 后,延迟从 546ms 降至 277ms。
查看原文nice example of M3 in a real agent loop, all served through @togethercompute
6 天前
Hacker News 热门(buzzing.cc 中文翻译)技巧与观点
6月16日,一篇标题为"Why is Meta destroying its engineering organization?"的博客文章出现在 Hacker News,获得110个点赞。文章指出 Meta 正在解散其工程组织,引发业界广泛讨论。具体原因和后续影响尚未明确。
查看原文Meta为什么要解散其工程部门?
6 天前
X:SemiAnalysis (@SemiAnalysis_)技巧与观点
RL系统 注意差距:匹配训练器与生成器吞吐量 RL训练基础设施,GRPO, PipelineRL,异步RL,策略陈旧性, RL沙箱基础设施,CPU需求, TCO分析,思考机器修补
查看原文RL Systems Mind the Gap: Matching Trainer and Generator Throughput RL Training Infrastructure, GRPO…
6 天前
X:Ethan Mollick (@emollick)技巧与观点
假设开源模型持续落后闭源约8-12个月(至少在编程方面),加强IT系统以防御Mythos级模型的倒计时现在为4-8个月。 拥有今天公开可用且相对安全的防御性Mythos级模型很重要。
查看原文Assuming open models continue to lag about 8-12 months behind closed source (at least in coding), th…
6 天前
X:OpenAI (@OpenAI)技巧与观点
我们来聊聊评估。 我们一直在寻找更好的方法来衡量和预测模型进展,尤其是在基准测试逐渐饱和或被钻空子的时候。 领导我们前沿评估团队的 @tejalpatwardhan 与 @andrewmayne 谈到了评估为何重要,以及接下来模型需要被评判的标准。
查看原文Let's talk about evals. We're always looking for better ways to measure and forecast model progress…
6 天前
X:Jason Liu (@jxnlco)技巧与观点
作者Jason Liu发现自己在脑海中就可以进行类似AI图像生成的体验,无需打开应用写提示词。他举例:看到咖啡店窗边的橙猫和牛角面包后,直接想象出暖光、浅景深、胶片颗粒等电影感画面,甚至"脑补"了猫戴贝雷帽。他猜测AI的Codex使用图像生成时可能也是类似的内部感受。
查看原文Does anyone else use Image Gen in their head? I love using image generation whenever I have a weird…
6 天前
X:SemiAnalysis (@SemiAnalysis_)技巧与观点
警报:OpenAI的首席财务官声称他们的下一次重大训练运行将在2026年秋季在Vera Rubin上进行,但这说不通。Rubin NVL72集群届时可能还不够稳定,软件栈也不足以支持真正的"重大训练运行"。Rubin或许已准备好用于生产推理和小规模训练实验,但无法在2026年秋季支持前沿规模的训练。
查看原文ALERT: OpenAI's CFO claims their next big training run will happen in Fall 2026 on Vera Rubin but th…
6 天前
TechCrunch:AI(RSS)技巧与观点
WordPress VIP基于2000名受访者的调查显示,60%美国消费者认为品牌消息中出现"AI"会令人反感,86%不完全信任AI并仍想查看原始来源。42%表示缺乏明确归属的AI生成答案比航空公司费用、隐私政策和医疗账单更不可信。近四分之三受访者认为互联网比十年前更不人性化。33%将点击查看原始来源视为首要信任信号,80%认为网络信息应保持开放可访问。企业方面,60%受访企业称来自AI搜索引擎和答案平台的流量在过去一年增加,74%企业决策者将AI可发现性和归属列为主要或重要优先级。
查看原文Sixty percent of U.S. consumers say 'AI' in brand messaging is a turnoff, survey finds