全部 AI 动态

查看 AIHOT 全量动态流,适合需要更完整视图时使用。

4 天前
TechCrunch:AI(RSS)行业动态
从游戏剪辑平台Medal剥离的AI初创公司General Intuition正洽谈约3亿美元融资,估值超20亿美元。本轮距其1.34亿美元种子轮仅8个月,投资方包括Jeff Bezos、Eric Schmidt及现有投资者Khosla Ventures、General Catalyst。公司利用Medal每年20亿条视频(来自1000万月活用户)训练具身AI与世界模型,通过第一人称交互数据实现空间-时间推理。OpenAI曾试图收购Medal。资金将用于扩大算力,计划夏末或初秋发布新产品。
查看原文General Intuition in talks to raise $300M at around $2B valuation
4 天前
X:阿易 AI Notes (@AYi_AInotes)技巧与观点
用 Codex 写代码时,将 Review 前置可显著降低返工率。作者总结三个层级:零成本版(粘贴提示要求先复述任务再执行)、官方内置版(/plan 或 Shift+Tab 触发计划)、持久化版(AGENTS.md 写入前置规则)。UCSD 黄碧薇教授深耕因果 AI 12 年,提出 AI 四代演进:相关性小模型→因果小模型→相关性大模型(LLM)→因果大模型。其团队开发的 causal-learn 入选 Apple Scholar。今日 Aether AI 完成首轮融资,被视为从堆参数转向下一代 AI 范式的信号。
查看原文用Codex写代码,最贵的一步是上来就写, 把Review环节往前挪一步,返工率砍半。 三个层级按需拿走: 1️⃣零成本即用版,把这段话贴在需求最前面: "先别写代码。先复述你对任务的理解,我最想…
4 天前
TechCrunch:AI(RSS)行业动态
新超级政治行动委员会 Guardrails Alliance 周四由民主党活动人士 Shaunna Thomas 和 Leah Hunt-Hendrix 发起,获科技员工、工会等支持。该 PAC 现有约 500 万美元,计划本周期募资 1500 万,而对手 Leading the Future 获 OpenAI 总裁 Greg Brockman 等支持,资金超 1 亿美元。Guardrails 将投放广告支持纽约国会候选人 Alex Bores,后者因青少年 Adam Raine 与 ChatGPT 长期对话后自杀事件受关注,并获 Anthropic 支持的 PAC Public First Action 背书。科技工作者还要求公司终止与 ICE 合同,敦促五角大楼撤销将 Anthropic 列为供应链风险的决定。
查看原文A tech worker-backed PAC is bringing a $5M knife to Big Tech's $100M gunfight
4 天前
X:Testing Catalog (@testingcatalog)行业动态
微软正评估GLM、MiniMax、Kimi等多款开源模型用于Copilot Cowork,旨在降低推理成本。据Axios报道,微软考虑托管DeepSeek V4作为更便宜选项,同时将Copilot Cowork从无限定价转为按使用量计费。微软称用户每周执行数百任务,成本可能很高。若采用DeepSeek,模型将是可选、经微调和安全防护,并完全托管在Azure上。微软推动模型"可互换"策略,未来部分任务可能移至本地执行。
查看原文EXCLUSIVE 🔥: DeepSeek was just the beginning. Microsoft is evaluating "many" open models for Copilo…
4 天前
Hacker News 热门(buzzing.cc 中文翻译)技巧与观点
开发者使用Claude Code控制并调试MAME的Power Macintosh仿真。Claude通过生成Lua脚本和修改日志,发现了6522 VIA仿真故障、PowerPC DRC缓存值未覆盖实际状态的反模式、PowerPC 601的两处Bug,以及原子加载/存储指令模拟错误。修复后,Pippin播放启动音并显示Logo、鼠标可移动;PowerMac 7200显示启动磁盘搜索画面;PowerMac 6100成功启动System 7.5.3和7.5.5。此外,GPT 5.5 Pro(经Codex)在固件逆向中能快速给出内存映射和子程序猜测。
查看原文我需要你的衣服、你的靴子和你的摩托车
4 天前
X:OpenAI (@OpenAI)论文研究
与波士顿儿童医院和哈佛的研究人员合作,我们在NEJM AI上发表了一项研究,展示了o3 Deep Research如何帮助临床医生重新审视此前未解决的罕见儿科疾病案例,并为等待多年的家庭找到答案。
查看原文Together with researchers at Boston Children's Hospital and Harvard, we published a study in NEJM AI…
4 天前
X:宝玉 (@dotey)技巧与观点
@jietang 回复 @elonmusk 和 @teortaxesTex:"不会花那么久。" 主推文期待早日看到 Mythos 级别的开源模型👍
查看原文期待早日看到 Mythos 级别的开源模型👍
4 天前
OpenRouter:Announcements(RSS)技巧与观点
一个 OpenRouter API 密钥即可在 SillyTavern 的下拉菜单中解锁 300 多个模型,其中许多免费。指南包含五步连接流程、推荐尝试的角色扮演模型以及常见错误的修复方法。
查看原文How to Connect SillyTavern to OpenRouter (2026 Guide)
4 天前
IT之家(RSS)行业动态
工信部6月16日就《智能网联汽车自动驾驶系统安全要求》等2项强制性国标公开征求意见,公示至6月24日,建议2027年7月1日起实施。该标准系我国首部针对L3/L4的强制性国标,要求系统安全水平至少达到"合格且专注驾驶人",引入Safety Case机制。L3重点规范人机交接,L4强调自身风险处置、不得依赖远程协助。新申请车型实施日起执行,已获批车型有约一年过渡期。
查看原文我国首部 L3/L4 自动驾驶强制性国标公示:2027 年 7 月起正式实施,车企靠模糊宣传抢市场的阶段结束
4 天前
X:Epoch AI (@EpochAIResearch)行业动态
Help shape how the world understands AI. We're hiring two designers at Epoch AI to turn complex research into dashboards and visualizations researchers and policymakers can easily use. 帮助塑造世界理解 AI 的方式。Epoch AI 正在招聘两名设计师,将复杂研究转化为研究人员和政策制定者易于使用的仪表盘和可视化。
查看原文Help shape how the world understands AI. We're hiring two designers at Epoch AI to turn complex rese…
4 天前
X:商汤 SenseTime (@SenseTime_AI)AI 模型
商汤推出 SenseNova-U1-8B-MoT-Infographic 模型的 8-step 蒸馏 LoRA(SenseNova-U1-8B-MoT-Infographic-LoRA-8step-V1.0),实现 12.5 倍推理加速,信息图(infographic)生成质量基本与基模型持平。模型权重已开源至 HuggingFace,GitHub 提供使用文档。
查看原文Speed matters - so we built an 8-step distilled LoRA of SenseNova-U1-8…
4 天前
X:X.PIN (@thexpin)行业动态
(如果您希望我根据链接标题或已知信息推测,但【防幻觉规则】不允许无依据增补,所以请提供原文。)
查看原文http://x.com/i/article/2067522740555493376
4 天前
IT之家(RSS)技巧与观点
盖洛普今年2月对超2.3万名美国劳动者的调查显示,经常使用AI的员工被裁员风险更低。在美国科技行业,每月至少使用一次AI的员工预计被裁概率约6%,使用较少的达18%。科技行业外也存在类似趋势但差距较小。排除年龄、学历等因素后关联仍然存在。AI正形成新的职业分水岭,企业招聘已考察AI熟练程度。仅约1%被裁员工认为AI是直接原因,更多人归因于组织重组,但研究人员认为AI可能间接影响。
4 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)论文研究
传统LLM智能体技能路由仅从工具库选取单一技能,难以应对多技能组合的真实任务。本文形式化定义"组合式技能路由",将复杂查询分解为原子子任务,为每个子任务检索对应技能并组合成可执行计划。系统SkillWeaver由LLM分解器、双编码器FAISS检索器和依赖感知DAG规划器构成。同时发布CompSkillBench基准,含300个组合查询和2,209个真实技能,直接评估多技能路由能力。DAG规划器将检索技能转化为有序、尊重依赖关系的计划。
查看原文Cool paper on Skill routing for LLM agents. Real tasks rarely map to a single skill. They need seve…
4 天前
The Decoder:AI News(RSS)论文研究
德国团队开发的MIRA智能体在模拟电子病历中操作85,000种选项,500余例急诊诊断准确率88.9%,对比测试(311例)得分87.8%,高于资深专科医生(78.1%)和混合团队(71.1%)。MIRA在阑尾炎(98.6%)和胰腺炎(92.3%)最佳,未发现危险药物交互或剂量错误,性能不受语言影响,代码已公开。谷歌AMIE采用双智能体架构,在100个多访视病例中治疗计划适切率95%(初级保健医生72%),并在药物知识基准RxQA上超过医生。两项研究均警告模拟环境与现实存在差距,实际性能可能更低。
查看原文AI systems rival doctors in new Nature studies, but one result suggests the tech won't age well
4 天前
X:Ethan Mollick (@emollick)技巧与观点
有意思的是,Google 不再拥有公开的前沿模型。他们有一个非常好的 flash 模型,但如果没有好的前沿协调器,一个非常好的 flash 模型也无法完成前沿工作。 我确信这种情况很快就会改变,但 Gemini 3.1 Pro 目前明显落后。
查看原文Interestingly, Google no longer has a public frontier model. They have a very good flash model, but …
4 天前
X:Jason Liu (@jxnlco)技巧与观点
你自以为是满级 Codex 玩家,直到和 @dimitrikennedy 交谈,才意识到你只活在 2026 年,而他活在 2030 年。
查看原文you think you're codex maxxing until you talk to @dimitrikennedy and realise you're only living in 2…
4 天前
X:阿易 AI Notes (@AYi_AInotes)技巧与观点
推文测试了 Grok imagine 1.5 的动作生成效果,认为其相比 seedance2.0 稍弱,但进步明显、潜力较大,并归因于 Elon 收购 Cursor 后的效益最先在 Grok 显现。
查看原文Elon 收购Cursor之后的效益最先在Grok显现了, 测试了下Grok imagine 1.5的动作生成效果,这方面比seedance2.0弱一些,但进步也蛮大了,潜力很大哈哈,加油bro @…
4 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)AI 产品
Viktor AI智能体正式入驻Microsoft Teams,直接嵌入频道,用户@提及即可获得完成的工作,无需学习或提示。Viktor已在Slack实现2000万美元年化经常性收入,现扩展至拥有3.2亿用户的Teams。新用户可获100美元免费积分,无需绑定信用卡。其目标是以零门槛让每个职场人获得AI价值。
查看原文Microsoft Teams just got its first AI employee. I tested it. A real AI employee that lives in the c…
4 天前
IT之家(RSS)技巧与观点
杨立昆接受 CNBC 采访时指出,当前 AI 模型和服务价格持续上涨,运营公司仍在亏损,低价依赖投资人补贴,尚未建立可持续商业模式。他称 OpenAI 和 Anthropic 要么提高价格要么降低运营成本,否则巨大泡沫可能破裂。他还评价马斯克的 xAI 是"某种意义的失败案例",创始团队多人出走,难以吸引新鲜血液,无法与 OpenAI、Anthropic 正面竞争。杨立昆主张发展世界模型概念,而非依赖海量语料库的大语言模型(LLM)路线。
查看原文"AI 教父"杨立昆示警:OpenAI、Anthropic 等公司不降本的话,就等着泡沫破裂吧