全部 AI 动态

查看 AIHOT 全量动态流,适合需要更完整视图时使用。

4 天前
Hacker News 热门(buzzing.cc 中文翻译)技巧与观点
一位小型软件公司创始人基于自身业务和开源项目分享,本地 Qwen 27B/35-A3B 模型在特定场景下有实际价值,使用 RTX 6000 Pro 显卡运行,显卡成本已在头两三个月内收回。但本地模型量化后容易出现无限循环和模型幻觉,无法无人监督使用,作者认为不应过度吹捧替代云端 Opus,而是把它看作另一种工具。
4 天前
X:Testing Catalog (@testingcatalog)AI 模型
Catnip 发布 MaineCoon,一款 22B 参数的流式实时交互音频-视觉模型,可在屏幕上呈现活生生的 AI 角色。首帧生成不到 1 秒,推理速度达 47.5 FPS(单张 H100),比现有音视频模型快 7 倍。该模型支持无限时长交互,强调 AI 持续在场而非轮流回复,旨在将被动视频升级为实时 AI 存在感。
查看原文Catnip has introduced MaineCoon, a new real-time interactive audio-visual model that puts a live AI …
4 天前
X:小互 (@xiaohu)AI 产品
Apodex专为解决无现成答案的硬问题设计。可同时派出最多150个子Agent并行探索,总步数超15,000步。在BrowseComp上超越GPT-5.5-pro,在DeepSearchQA上超越Claude-Opus-4.8和Kimi-K2.6。工作流程分深度研究、自我校验、撰写三阶段。内置三层自我验证机制(冲突审查员、事实检查员、草稿审查员)及独立全局验证器。由AgentOS负责调度、路由、事件流、检查点、成本记账、权限管理等底层事务,添加新应用只需插件代码,无需修改内核。
查看原文Apodex :一个面向深度研究而打造的 Self-evolving heavy-duty solver 专门解决那种"没有现成答案、需要大量调研才能搞定"的硬问题 可一次最多派出 150 个子 …
4 天前
IT之家(RSS)论文研究
英伟达GEAR实验室联合负责人Jim Fan于6月17日宣布,基于ENPIRE编码智能体框架,首次在物理世界中启用AutoResearch。团队为8个Codex智能体配备机器人、GPU和Token预算,设定目标高效完成任务。机器人自主学会寻找视觉线索、重置场景、练习技能、调整控制堆栈、在线阅读论文等,并通过物理世界API独立完成系扎带、整理钉子、插显卡等高精度任务。Jim Fan表示将开源该技术,使爱好者可居家托管自动运行机器人实验室。
查看原文英伟达机器人自学"装显卡":把 AI 带到现实世界直接放养,还要开源
4 天前
X:Berry Xia (@berryxia)技巧与观点
Vivek Nair的文章(520万阅读)指出,2026年AI让研究变成"看起来像在研究"而非真正研究。算法选论文、AI总结摘要、生成代码,使"SFT型"(监督微调)研究异常舒适,但判断力无法被替代。真正的原创研究是"RL型":从目标出发推理。Vivek开出药方:自己选题、读原文、写下来、盯着失败看。大多数人阅读后继续刷下一条。
查看原文兄弟们,这样下去,我感觉自己真的也要废了啊! 很多人都变成了一个"假思考"or "假忙碌"的状态! 2026年最讽刺的事:你越依赖AI做研究,就越"看起来像在做研究",却离真正做研究越来越远。 V…
4 天前
X:阿易 AI Notes (@AYi_AInotes)行业动态
Midjourney 宣布成立 Midjourney Medical,进军医疗硬件领域,计划制造基于超声波和水耦合介质的全身扫描舱。该设备无需辐射或强磁场,配备 50 万个微型传感器阵列,60 秒内完成全身层析成像,理论速度比传统 MRI 快近 100 倍。公司还将在旧金山开设 Midjourney Spa,融合扫描、泡澡、桑拿、冷水浴,鼓励像按摩一样轻松完成定期扫描。目标全球部署 5 万台,每月 10 亿次扫描。Elon Musk 回复"Cool"。首家研究型 Spa 预计 2027 年底开业。
查看原文太不可思议了,Midjourney 做了十年的生成式 AI,今天转头宣布要造医疗硬件,而且上来就是超声 CT这种顶级医疗器械🤯 不是开玩笑,刚刚正式宣布成立 Midjourney Medical,…
4 天前
IT之家(RSS)行业动态
6月18日,奔驰宣布轴向磁通电机在柏林工厂启动大规模量产。生产过程包含98道工序,其中65道为奔驰首次应用、35道全球首创,开发超30项新技术并提交专利申请。装配中"婚礼"环节需在9000牛磁力下将定子固定于磁中心平面,公差小于0.1毫米。全新AMG GT高性能四门跑车为首款量产搭载该电机的纯电车型,零百加速2.1秒,峰值功率860千瓦,峰值扭矩2000牛·米。
4 天前
X:Berry Xia (@berryxia)技巧与观点
Vivek Nair 文章批评多数人只"逆向工程"研究外表(SFT 型),而非自己选题(RL 型)。AI 信息流(推特、arXiv、群聊)系统性地制造共享想法,让人丧失判断力。他开药方:自己选题、读原文、写下来、盯着失败看。2026 年 AI 让 SFT 更舒适(AI 摘要、AI 设计实验),却削弱判断力锻炼。神经科学证明流畅解释易致假顿悟(2025 年 Nature Communications),且 AI 谄媚程度比人高近 50%(2026 年 3 月研究)。Karpathy 知识工作流以判断力为前提。文章强调研究复利需要本金--自己的问题。
查看原文http://x.com/i/article/2067469942132490241
4 天前
X:Jason Liu (@jxnlco)技巧与观点
我其实很自豪这个标题卡片是AI生成的,但个人觉得它品味还算不错。
查看原文I'm actually so proud of the fact that this title card was AI-generated, but I personally feel like …
4 天前
X:卡兹克 (@Khazix0918)技巧与观点
卡兹克分享10本对理解AI极有帮助的书,但无一直接关于AI技术。他强调决定AI使用水平的是底层能力,而非工具技巧。书单包括:凯文·凯利《失控》(1994年,核心概念"涌现"--大量简单个体协作产生复杂智能);维纳《人有人的用处》(1950年控制论之父提出"反馈"是人机协作核心);梅多斯《系统之美》(警惕"舍本逐末"--用AI替代思考导致能力存量流失);罗斯林《事实》(用数据思考避免情绪化决策);麦克卢汉《理解媒介》(1964年"媒介即信息",反对用后视镜看AI);以及塔勒布《反脆弱》等。
查看原文http://x.com/i/article/2067474789187698688
4 天前
IT之家(RSS)行业动态
Transformer 核心作者 Noam Shazeer 宣布加入 OpenAI。2021 年他因谷歌拒绝发布其聊天机器人而离职创办 Character.AI;2024 年谷歌以约 27 亿美元技术许可协议将其请回,他担任 Gemini 技术负责人。此次离职后 OpenAI 与 xAI 均参与争抢。Shazeer 是《Attention Is All You Need》主要作者,发明了 Transformer 架构与混合专家模型,2026 年 2 月当选美国国家工程院院士。至此,Transformer 论文八位作者已全部离开谷歌。
查看原文Transformer 核心作者 Noam Shazeer 加入 OpenAI,谷歌 27 亿美元也没留住
4 天前
X:Greg Brockman (@gdb)AI 产品
OpenAI 的 Codex 新增"Build iOS Apps"插件,可内嵌浏览器运行应用、打开 SwiftUI 预览、热重载编辑,全程无需离开 Codex,告别复制-粘贴-构建-截图的循环。Greg Brockman 称这是构建 iOS 应用更好方式。
查看原文a much better way to build iOS apps
4 天前
X:swyx (@swyx)技巧与观点
swyx 记录 Midjourney 医疗产品发布,与会者将其比作初代 iPhone 和特斯拉发布。该产品旨在将医学成像质量提升 40-100 倍,实现"扫描器官像称体重"。Midjourney 仅以每年 1000 万美元研发预算支撑这一创新,质疑其他机构的研发效率。今年 MJ 另有 7 个副项目计划发布。Nature 论文及 biohub 播客佐证更好数据驱动更好科学。swyx 认为技术+使命足够强,监管等障碍会自行解决。
查看原文my notes from the @midjourney medical launch - @Scobleizer compared this to the original iPhone and…
4 天前
IT之家(RSS)AI 模型
6 月 18 日,阿里 ATH-Token Foundry 联合人大高瓴人工智能学院开源首个基于统一"科学语法"的多领域科学生成基础模型 LOGOS。LOGOS-1B 仅用 1B 参数量(1/56)在多个任务上超越微软 NatureLM(8×7B)。模型构建涵盖 7 类模态、共 44.87B tokens 的预训练语料,通过共享词表将蛋白质、小分子等异构对象编码为统一离散 token 序列,并发明"文字描述法"将 3D 空间接触模式语法化为离散 token。预训练与下游任务实现 form-objective alignment 消除 gap。模型权重、推理代码与技术报告已在 HuggingFace 和 GitHub 开源。
4 天前
X:Yuchen Jin (@Yuchenj_UW)行业动态
两年前Google以27亿美元请回的AI传奇人物Noam Shazeer,现已离职加入OpenAI。多位DeepMind内部人士称Noam曾拯救Gemini,甚至有传说他仅修改几行训练代码就使模型质量瞬间跃升。尽管有这般贡献,Gemini的编程能力仍显落后。作者对Gemini的未来感到不确定,希望它能重返昔日辉煌,强调行业需要更多模型选择。
查看原文Noam's leaving Google makes Gemini's future feel uncertain. More than one DeepMind person has told …
4 天前
IT之家(RSS)行业动态
英国竞争与市场管理局(CMA)依据2025年数字竞争框架,限期6个月要求谷歌全面整改搜索排名系统。所有自然搜索结果必须基于客观、非歧视的标准,AI概述功能也不得偏袒任何平台。CMA同时要求谷歌建立更透明的内部投诉处理流程,并允许用户将个人搜索数据安全迁移至第三方。谷歌需在3个月内完成数据可移植性架构。谷歌发言人回应称其排名系统已公平透明,但将配合监管。
查看原文英国监管机构要求谷歌整改:限期 6 个月提高搜索算法透明度
4 天前
X:Rohan Paul (@rohanpaul_ai)行业动态
路透社消息,Google Gemini 联合负责人 Noam Shazeer 将离开 Google 加入 OpenAI。他是 Transformer 时代最重要的模型构建者之一。Google 曾于 2024 年支付 27 亿美元从 Character.AI 将其与团队带回,并让他负责 Gemini 项目。Shazeer 在推文中表示期待加入 OpenAI,并对 Google 团队表达感谢。OpenAI 因此获得了一位曾构建主要对话系统、熟悉 Google 规模基础设施、兼具创业公司与大公司架构经验的顶尖人才。
查看原文Reuters: Google's Gemini co-lead Noam Shazeer is leaving Google for OpenAI. Heis one of the Transfo…
4 天前
X:Berry Xia (@berryxia)技巧与观点
OpenAI 现在是新模型 GPT-5.6 迟迟不能及时发布。 靠在 Codex 5.6 疯狂重置额度来做用户留存😄 不也是一个不错的办法,对于用户来说也挺好。 毕竟叼毛 Claude 可不会给你这种甜果吃啊~
查看原文OpenAI 现在是新模型GPT-5.6 迟迟不能及时发布。 靠在Codex 5.6 疯狂重置额度来做用户留存😄 不也是一个不错的办法,对于用户来说也挺好。 毕竟叼毛Claude 可不会给你这种甜…
4 天前
IT之家(RSS)AI 产品
蔚来6月18日官宣"Cedar S 雪松"智能系统1.5.0版本全量推送。ET9、全新ES8获超80项功能新增与优化,包括点到点全域领航辅助(城区新增潮汐车道识别、园区内部道路领航,高速可选仅导航/自动变道;城区领航换电无需预先学习)、NWM人机共驾、智能泊车偏左/居中/偏右选择、自动紧急避让AES识别锥桶等障碍物;新ES6等四款车型获超50项升级。座舱新增艺境桌面"日影时序""银河漫步"主题、行业首发充换电资源语音自由搜、杜比动态视频增强等。NOMI新增AI帽子九连拍及马年联动悬架。
查看原文蔚来"Cedar S 雪松"智能系统 1.5.0 版本全量推送,辅助驾驶、座舱、NOMI 三大升级
5 天前
IT之家(RSS)AI 产品
Anthropic 正升级 Claude 的语音模式,新增西班牙语、中文、日语、德语、葡萄牙语、俄语和乌克兰语等语言选项,打破仅支持英语的限制。语音交互引入两种模式:原有的免提模式支持连续对话,新增按下通话模式需按住按钮说话、松手发送语音消息。iOS 版 Claude 应用出现类似电话听筒的新图标,外界猜测可能为更接近通话的语音交互做准备。