全部 AI 动态

查看 AIHOT 全量动态流，适合需要更完整视图时使用。

4 天前

Hacker News 热门（buzzing.cc 中文翻译）技巧与观点

一位小型软件公司创始人基于自身业务和开源项目分享，本地 Qwen 27B/35-A3B 模型在特定场景下有实际价值，使用 RTX 6000 Pro 显卡运行，显卡成本已在头两三个月内收回。但本地模型量化后容易出现无限循环和模型幻觉，无法无人监督使用，作者认为不应过度吹捧替代云端 Opus，而是把它看作另一种工具。

查看原文

4 天前

X：Testing Catalog (@testingcatalog)AI 模型

Catnip 推出 MaineCoon：实时交互音视频 AI 模型

Catnip 发布 MaineCoon，一款 22B 参数的流式实时交互音频-视觉模型，可在屏幕上呈现活生生的 AI 角色。首帧生成不到 1 秒，推理速度达 47.5 FPS（单张 H100），比现有音视频模型快 7 倍。该模型支持无限时长交互，强调 AI 持续在场而非轮流回复，旨在将被动视频升级为实时 AI 存在感。

查看原文Catnip has introduced MaineCoon， a new real-time interactive audio-visual model that puts a live AI …

4 天前

X：小互 (@xiaohu)AI 产品

Apodex：面向深度研究的自进化重载求解器

Apodex专为解决无现成答案的硬问题设计。可同时派出最多150个子Agent并行探索，总步数超15，000步。在BrowseComp上超越GPT-5.5-pro，在DeepSearchQA上超越Claude-Opus-4.8和Kimi-K2.6。工作流程分深度研究、自我校验、撰写三阶段。内置三层自我验证机制（冲突审查员、事实检查员、草稿审查员）及独立全局验证器。由AgentOS负责调度、路由、事件流、检查点、成本记账、权限管理等底层事务，添加新应用只需插件代码，无需修改内核。

查看原文Apodex ：一个面向深度研究而打造的 Self-evolving heavy-duty solver 专门解决那种"没有现成答案、需要大量调研才能搞定"的硬问题可一次最多派出 150 个子 …

4 天前

IT之家（RSS）论文研究

英伟达GEAR实验室首次启用AutoResearch，机器人自学完成装显卡等高精度任务

英伟达GEAR实验室联合负责人Jim Fan于6月17日宣布，基于ENPIRE编码智能体框架，首次在物理世界中启用AutoResearch。团队为8个Codex智能体配备机器人、GPU和Token预算，设定目标高效完成任务。机器人自主学会寻找视觉线索、重置场景、练习技能、调整控制堆栈、在线阅读论文等，并通过物理世界API独立完成系扎带、整理钉子、插显卡等高精度任务。Jim Fan表示将开源该技术，使爱好者可居家托管自动运行机器人实验室。

查看原文英伟达机器人自学"装显卡"：把 AI 带到现实世界直接放养，还要开源

4 天前

X：Berry Xia (@berryxia)技巧与观点

Vivek Nair：AI让"假研究"更舒适

Vivek Nair的文章（520万阅读）指出，2026年AI让研究变成"看起来像在研究"而非真正研究。算法选论文、AI总结摘要、生成代码，使"SFT型"（监督微调）研究异常舒适，但判断力无法被替代。真正的原创研究是"RL型"：从目标出发推理。Vivek开出药方：自己选题、读原文、写下来、盯着失败看。大多数人阅读后继续刷下一条。

查看原文兄弟们，这样下去，我感觉自己真的也要废了啊！很多人都变成了一个"假思考"or "假忙碌"的状态！ 2026年最讽刺的事：你越依赖AI做研究，就越"看起来像在做研究"，却离真正做研究越来越远。 V…

4 天前

X：阿易 AI Notes (@AYi_AInotes)行业动态

Midjourney 成立医疗部门，推出超声波全身扫描舱

Midjourney 宣布成立 Midjourney Medical，进军医疗硬件领域，计划制造基于超声波和水耦合介质的全身扫描舱。该设备无需辐射或强磁场，配备 50 万个微型传感器阵列，60 秒内完成全身层析成像，理论速度比传统 MRI 快近 100 倍。公司还将在旧金山开设 Midjourney Spa，融合扫描、泡澡、桑拿、冷水浴，鼓励像按摩一样轻松完成定期扫描。目标全球部署 5 万台，每月 10 亿次扫描。Elon Musk 回复"Cool"。首家研究型 Spa 预计 2027 年底开业。

查看原文太不可思议了，Midjourney 做了十年的生成式 AI，今天转头宣布要造医疗硬件，而且上来就是超声 CT这种顶级医疗器械🤯 不是开玩笑，刚刚正式宣布成立 Midjourney Medical，…

4 天前

IT之家（RSS）行业动态

奔驰轴向磁通电机量产落地，首搭跑车 AMG GT 零百加速 2.1 秒

6月18日，奔驰宣布轴向磁通电机在柏林工厂启动大规模量产。生产过程包含98道工序，其中65道为奔驰首次应用、35道全球首创，开发超30项新技术并提交专利申请。装配中"婚礼"环节需在9000牛磁力下将定子固定于磁中心平面，公差小于0.1毫米。全新AMG GT高性能四门跑车为首款量产搭载该电机的纯电车型，零百加速2.1秒，峰值功率860千瓦，峰值扭矩2000牛·米。

查看原文

4 天前

X：Berry Xia (@berryxia)技巧与观点

Vivek Nair 爆文《How to Be Good at Research？》解读：真正的研究是 RL 型而非 SFT 型

Vivek Nair 文章批评多数人只"逆向工程"研究外表（SFT 型），而非自己选题（RL 型）。AI 信息流（推特、arXiv、群聊）系统性地制造共享想法，让人丧失判断力。他开药方：自己选题、读原文、写下来、盯着失败看。2026 年 AI 让 SFT 更舒适（AI 摘要、AI 设计实验），却削弱判断力锻炼。神经科学证明流畅解释易致假顿悟（2025 年 Nature Communications），且 AI 谄媚程度比人高近 50%（2026 年 3 月研究）。Karpathy 知识工作流以判断力为前提。文章强调研究复利需要本金--自己的问题。

查看原文http：//x.com/i/article/2067469942132490241

4 天前

X：Jason Liu (@jxnlco)技巧与观点

Jason Liu：AI生成标题卡片高品味

我其实很自豪这个标题卡片是AI生成的，但个人觉得它品味还算不错。

查看原文I'm actually so proud of the fact that this title card was AI-generated， but I personally feel like …

4 天前

X：卡兹克 (@Khazix0918)技巧与观点

卡兹克推荐10本AI时代必读好书：无一直接谈AI，底层能力决定使用水平

卡兹克分享10本对理解AI极有帮助的书，但无一直接关于AI技术。他强调决定AI使用水平的是底层能力，而非工具技巧。书单包括：凯文·凯利《失控》（1994年，核心概念"涌现"--大量简单个体协作产生复杂智能）；维纳《人有人的用处》（1950年控制论之父提出"反馈"是人机协作核心）；梅多斯《系统之美》（警惕"舍本逐末"--用AI替代思考导致能力存量流失）；罗斯林《事实》（用数据思考避免情绪化决策）；麦克卢汉《理解媒介》（1964年"媒介即信息"，反对用后视镜看AI）；以及塔勒布《反脆弱》等。

查看原文http：//x.com/i/article/2067474789187698688

4 天前

IT之家（RSS）行业动态

Transformer 核心作者 Noam Shazeer 加入 OpenAI

Transformer 核心作者 Noam Shazeer 宣布加入 OpenAI。2021 年他因谷歌拒绝发布其聊天机器人而离职创办 Character.AI；2024 年谷歌以约 27 亿美元技术许可协议将其请回，他担任 Gemini 技术负责人。此次离职后 OpenAI 与 xAI 均参与争抢。Shazeer 是《Attention Is All You Need》主要作者，发明了 Transformer 架构与混合专家模型，2026 年 2 月当选美国国家工程院院士。至此，Transformer 论文八位作者已全部离开谷歌。

查看原文Transformer 核心作者 Noam Shazeer 加入 OpenAI，谷歌 27 亿美元也没留住

4 天前

X：Greg Brockman (@gdb)AI 产品

Codex推iOS构建插件：浏览器预览与热重载

OpenAI 的 Codex 新增"Build iOS Apps"插件，可内嵌浏览器运行应用、打开 SwiftUI 预览、热重载编辑，全程无需离开 Codex，告别复制-粘贴-构建-截图的循环。Greg Brockman 称这是构建 iOS 应用更好方式。

查看原文a much better way to build iOS apps

4 天前

X：swyx (@swyx)技巧与观点

swyx 的 Midjourney 医疗产品发布现场笔记

swyx 记录 Midjourney 医疗产品发布，与会者将其比作初代 iPhone 和特斯拉发布。该产品旨在将医学成像质量提升 40-100 倍，实现"扫描器官像称体重"。Midjourney 仅以每年 1000 万美元研发预算支撑这一创新，质疑其他机构的研发效率。今年 MJ 另有 7 个副项目计划发布。Nature 论文及 biohub 播客佐证更好数据驱动更好科学。swyx 认为技术+使命足够强，监管等障碍会自行解决。

查看原文my notes from the @midjourney medical launch - @Scobleizer compared this to the original iPhone and…

4 天前

IT之家（RSS）AI 模型

阿里开源首个统一科学大模型 LOGOS，仅用 1/56 参数超越微软 NatureLM

6 月 18 日，阿里 ATH-Token Foundry 联合人大高瓴人工智能学院开源首个基于统一"科学语法"的多领域科学生成基础模型 LOGOS。LOGOS-1B 仅用 1B 参数量（1/56）在多个任务上超越微软 NatureLM（8×7B）。模型构建涵盖 7 类模态、共 44.87B tokens 的预训练语料，通过共享词表将蛋白质、小分子等异构对象编码为统一离散 token 序列，并发明"文字描述法"将 3D 空间接触模式语法化为离散 token。预训练与下游任务实现 form-objective alignment 消除 gap。模型权重、推理代码与技术报告已在 HuggingFace 和 GitHub 开源。

查看原文

4 天前

X：Yuchen Jin (@Yuchenj_UW)行业动态

Noam Shazeer出走OpenAI，Gemini前景蒙尘

两年前Google以27亿美元请回的AI传奇人物Noam Shazeer，现已离职加入OpenAI。多位DeepMind内部人士称Noam曾拯救Gemini，甚至有传说他仅修改几行训练代码就使模型质量瞬间跃升。尽管有这般贡献，Gemini的编程能力仍显落后。作者对Gemini的未来感到不确定，希望它能重返昔日辉煌，强调行业需要更多模型选择。

查看原文Noam's leaving Google makes Gemini's future feel uncertain. More than one DeepMind person has told …

4 天前

IT之家（RSS）行业动态

英国监管机构要求谷歌整改：限期6个月提高搜索算法透明度

英国竞争与市场管理局（CMA）依据2025年数字竞争框架，限期6个月要求谷歌全面整改搜索排名系统。所有自然搜索结果必须基于客观、非歧视的标准，AI概述功能也不得偏袒任何平台。CMA同时要求谷歌建立更透明的内部投诉处理流程，并允许用户将个人搜索数据安全迁移至第三方。谷歌需在3个月内完成数据可移植性架构。谷歌发言人回应称其排名系统已公平透明，但将配合监管。

查看原文英国监管机构要求谷歌整改：限期 6 个月提高搜索算法透明度

4 天前

X：Rohan Paul (@rohanpaul_ai)行业动态

路透社：Google Gemini 联合负责人 Noam Shazeer 离职加入 OpenAI

路透社消息，Google Gemini 联合负责人 Noam Shazeer 将离开 Google 加入 OpenAI。他是 Transformer 时代最重要的模型构建者之一。Google 曾于 2024 年支付 27 亿美元从 Character.AI 将其与团队带回，并让他负责 Gemini 项目。Shazeer 在推文中表示期待加入 OpenAI，并对 Google 团队表达感谢。OpenAI 因此获得了一位曾构建主要对话系统、熟悉 Google 规模基础设施、兼具创业公司与大公司架构经验的顶尖人才。

查看原文Reuters： Google's Gemini co-lead Noam Shazeer is leaving Google for OpenAI. Heis one of the Transfo…

4 天前

X：Berry Xia (@berryxia)技巧与观点

OpenAI靠Codex 5.6重置额度留用户

OpenAI 现在是新模型 GPT-5.6 迟迟不能及时发布。靠在 Codex 5.6 疯狂重置额度来做用户留存😄 不也是一个不错的办法，对于用户来说也挺好。毕竟叼毛 Claude 可不会给你这种甜果吃啊~

查看原文OpenAI 现在是新模型GPT-5.6 迟迟不能及时发布。靠在Codex 5.6 疯狂重置额度来做用户留存😄 不也是一个不错的办法，对于用户来说也挺好。毕竟叼毛Claude 可不会给你这种甜…

4 天前

IT之家（RSS）AI 产品

蔚来"Cedar S 雪松"智能系统 1.5.0 版本全量推送

蔚来6月18日官宣"Cedar S 雪松"智能系统1.5.0版本全量推送。ET9、全新ES8获超80项功能新增与优化，包括点到点全域领航辅助（城区新增潮汐车道识别、园区内部道路领航，高速可选仅导航/自动变道；城区领航换电无需预先学习）、NWM人机共驾、智能泊车偏左/居中/偏右选择、自动紧急避让AES识别锥桶等障碍物；新ES6等四款车型获超50项升级。座舱新增艺境桌面"日影时序""银河漫步"主题、行业首发充换电资源语音自由搜、杜比动态视频增强等。NOMI新增AI帽子九连拍及马年联动悬架。

查看原文蔚来"Cedar S 雪松"智能系统 1.5.0 版本全量推送，辅助驾驶、座舱、NOMI 三大升级

5 天前

IT之家（RSS）AI 产品

支持中文：Claude 语音模式酝酿升级，新图标暗示通话式 AI 交互

Anthropic 正升级 Claude 的语音模式，新增西班牙语、中文、日语、德语、葡萄牙语、俄语和乌克兰语等语言选项，打破仅支持英语的限制。语音交互引入两种模式：原有的免提模式支持连续对话，新增按下通话模式需按住按钮说话、松手发送语音消息。iOS 版 Claude 应用出现类似电话听筒的新图标，外界猜测可能为更接近通话的语音交互做准备。

查看原文

加载更多