技巧与观点

查看 AIHOT 全量动态流,适合需要更完整视图时使用。

2 天前
X:面壁智能 OpenBMB (@OpenBMB)技巧与观点
社区开发者基于 VoxCPM2 与 ComfyUI 构建了 VoiceGate,实现自动语音提取(ASR)、大语言模型翻译、多语言语音合成(支持 30 多种语言和 9 种方言,含语音克隆与音色设计)、时间戳对齐音频以及背景音分离混音。核心创新 VoiceBridge 插件首次在 ComfyUI 中引入 SRT 时间戳驱动的 TTS 对齐,实现字幕级精细控制,解决 AI 配音音视频不同步问题。应用包括中文视频转英/日/韩等多语言,以及全球视频转中文及方言。
查看原文A developer in our community recently built VoiceGate using VoxCPM2 + ComfyUI for cross-lingual vide…
2 天前
X:Kim (@kimmonismus)技巧与观点
EUV光刻机依赖德国ZEISS光学、ASML整机及台积电组装构成的工业生态系统,中国被禁多年。华为Ascend芯片在部分负载中达H100级60%-80%性能,但软件、内存和训练基建仍落后。近期路透社报道前ASML工程师助中国在深圳逆向建造EUV原型,美政府担忧中国已接触ASML敏感技术,ASML否认。若中国真正掌握EUV,虽不能立即量产,但可能缩短芯片追赶周期、加速华为路线图,削弱西方在AI竞赛中的关键瓶颈。
查看原文I think many people still underestimate the full implications of China potentially gaining access to…
2 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)技巧与观点
YT 视频 -> Artifacts 看看我如何使用新的 /youtube-notetaker 技能从 YT 视频生成 Artifacts。 捕获幻灯片、笔记、转录内容…… 快去试试 ↓
查看原文YT Videos -> Aritfacts Watch how I use my new /youtube-notetaker skill to generate artifacts fro…
2 天前
X:Berry Xia (@berryxia)技巧与观点
日本人整动漫不得不说有一套,没有AI的化做这个视频得多久呢?
2 天前
X:Berry Xia (@berryxia)技巧与观点
用户@justinleei分享从年初至今的智谱GLM使用体验:订阅GLM完成两个项目(1个商用上线),认为其多种文档格式解析综合能力优于竞品,与Claude Code体验无明显差距。期间算力紧缺时出现过降智,响应慢但结果可接受。近期使用的zcode比第三方agent更快。主推文@berryxia赞同此评价,认为智谱能力当前为国产模型第一档,甚至优于DeepSeek。
查看原文真的,同意刚哥的看法,不吹不黑。 当时很多人问我体感和实际体验吗,真的非常明显。 除了算力限速外,真的能力现在是国产模型中第一档了。 比DS都好使,就是这样。
2 天前
X:fofr (@fofrAI)技巧与观点
当智能体说它要手动操作时 👀
查看原文When an agent says it's going to do something manually 👀
2 天前
X:Berry Xia (@berryxia)技巧与观点
Berry Xia 发现 @MengkePM 是 Apple Swift 移动应用创新大赛指导老师,随即关注学习,并认为其文章同样适合 MCN 机构和 AI 市场部的同学阅读参考。
查看原文居然是Apple Swift 移动应用创新大赛指导老师,果断关注学习。 MCN机构、AI市场部的同学们都可以学习,不错的文章。
2 天前
X:Emad Mostaque (@EMostaque)技巧与观点
当AI成为法官、陪审团与行刑者时,法律会怎样?
查看原文What happens to the law when AI is the judge, jury & executioner
2 天前
IT之家(RSS)技巧与观点
6月17日,智谱开源新旗舰GLM-5.2,在FrontierSWE编程测试中得分74.4,超OpenAI GPT-5.5,仅落后Claude Opus 4.8约1个百分点。有网友提问中国大模型何时达到Anthropic Fable水平,马斯克回复可能2027年Q1。智谱联合创始人唐杰回应不需那么久。马斯克补充,跑分赶上相对容易,但以实用性衡量,2027年Q1达到已非常出色。Anthropic Fable 5于6月9日发布,可处理5000万行代码迁移等任务,发布数日后遭管制。
查看原文马斯克预测中国大模型 2027 年 Q1 追上 Anthropic Fable,智谱创始人唐杰回应"用不了那么久"
2 天前
公众号:卡尔的AI沃茨技巧与观点
Humanize PPT v0.9 是一款专为演讲场景设计的PPT Skill,核心通过AST(Audience, State, Transfer)逻辑重新编排大纲,将页面渲染外包给下游Skill。渲染前先输出4张真实预览页,并将图片、视频素材的占位与生成prompt写入大纲。新增质检环节自动修复常见渲染问题,并支持演讲模式:按S键在独立窗口显示演讲稿备注,按ESC键打开全局索引快速跳页。项目已开源至github.com/LearnPrompt/humanize-ppt,由卡尔 & yc星辰开发。
查看原文开源一个为演讲而生的PPT Skill,再不用跟观众大眼瞪小眼了
2 天前
Hacker News 热门(buzzing.cc 中文翻译)技巧与观点
RTK获得60k GitHub星标,宣称能"削减60-90%模型token用量,支付1/10的价格",但实际API账单并未同比例下降--它仅裁剪Bash原始输出,忽略文件读取、仓库上下文、系统提示词和模型内部推理token。公开issues指出终端输出会被静默截断或丢失,且AI智能体无法感知压缩,导致关键信息缺失。RTK从未公布任务成功率(如SWE-bench类基准),其节省量更像营销指标。从架构看,rtk引入脆弱的外部依赖,解析git、cargo、npm、grep等CLI工具的stdout/stderr格式,一旦工具更新格式便可能静默失败。本质上这是CLI原生可实现的feature,而非独立产品,将其放入生产agent关键路径存在高风险。
2 天前
X:fofr (@fofrAI)技巧与观点
设置一个编排器智能体,由它配置Gemini Managed Agents或modal cpu实例,在独立环境中启动子智能体。先执行深度研究任务,探索管理智能体团队的最佳实践(角色、技能、跨通信与规划),再将最佳推荐应用于各智能体。重复该循环(可逐步增加智能体数量)。之后给团队一个空代码仓库,挑战其构建产品、建立最佳实践,让智能体观察问题、提出修复建议并快速迭代,从而暴露竞争条件、完善规划方法。
查看原文How to make a team of co-ordinated AI agents: - set up your first preferred agent (it's your orches…
2 天前
X:cb_doge (@cb_doge)技巧与观点
突发:黄仁勋表示,人们关于AI犯的最大错误是将其视为威胁,而非放大人类潜力的工具。AI不会摧毁人类的工作,而是将重建美国工业,并创造一波新的建设者、技术人员、工程师和制造者。
查看原文BREAKING: Jensen Huang says the biggest mistake people make about AI is seeing it as a threat, inste…
2 天前
X:歸藏 (@op7418)技巧与观点
唐老师与马斯克就国内开源版本的Fable 5级别模型何时出现展开对话。马斯克认为需要较长周期,而唐老师回复"won't take that long",暗示时间可能早于预期。主推文据此判断,国内开源Fable 5级别模型不必等到2027年。
查看原文唐老师和马斯克关于国内开源版本的 Fable 5 级别模型会在什么时候出现的对话,看起来我们不需要等到 27 年了
2 天前
X:Greg Brockman (@gdb)技巧与观点
用户反馈,OpenAI 的 Codex 桌面应用能同时运行近 300 个子 agent,持续超过一天,且异常流畅,毫无卡顿。Greg Brockman 评价:"Codex app is very good"。
查看原文Codex app is very good
2 天前
X:宝玉 (@dotey)技巧与观点
baoyu-design skill 更新,支持在制作 PPT、动画视频或网站时调用 AI 生图技能配图,可配合 Codex 或 Claude Code 使用。生成 PPT 时自动在合适位置插入配图,并可导出为 PPTX 格式,支持二次编辑。此外,该 skill 可在本地生成动画视频并导出 mp4,采用声明式动画引擎 f(t),通过无头浏览器逐帧截图经 ffmpeg 合成,确保每帧精确无掉帧。项目已在 GitHub 开源(MIT),获 1.2K star。
查看原文baoyu-design skill 更新:可以在制作 PPT、动画视频或者网站时调用 AI 生图技能配图了,当然需要你本地 Agent 有配置画图 Skill。 如果是 Codex 可以直接调用内…
2 天前
IT之家(RSS)技巧与观点
Meta前首席AI科学家杨立昆受访时称,马斯克创办的xAI"某种程度上已经失败":难以招到顶尖AI人才,除马斯克外所有联合创始人已离职。xAI近日将数据中心出租给Anthropic等对手,杨立昆认为此举反映其弱势处境,需出租才能收回成本。他不看好xAI前景,认为其无法参与最前沿竞争。同时他称赞SpaceX"做得非常出色",并表示自己拥有一辆特斯拉,FSD并非真正完全自动驾驶,但确实有用。
查看原文"AI 教父"杨立昆锐评马斯克:xAI"失败"、SpaceX 出色、特斯拉 FSD 有用
2 天前
X:阿易 AI Notes (@AYi_AInotes)技巧与观点
Codex 上线 Record & Replay 新功能,解决用户写长 prompt 描述不清流程的痛点。用户在 macOS 上手动完成一次操作(如填写报销单、添加视频标签),AI 静默记录每一步,自动整理成可检查、可复用的 skill。下次执行时只需更换参数(如文件名、日期范围),其余步骤按既定规则自动完成。目前仅 macOS 可用,需开启 Computer Use 权限,详细指引见评论区。
查看原文以后教AI干活居然不用写长prompt了,Codex刚更的新功能,你手动走一遍流程,它自动整理成可复用的skill,这个官方视频手把手教你怎么操作,中英文字幕帮大家做好了! 我们大部分人用AI最大的…
3 天前
X:Ethan Mollick (@emollick)技巧与观点
一些(初步)证据表明,管理者在使用Claude Code进行编码时成功率最高。 我一直认为管理是AI的超级能力,因为明确说明你想要什么、如何做以及什么样子算好,是使用智能体的关键。https://www.oneusefulthing.org/p/management-as-ai-superpower
查看原文Some (early) evidence that managers have the highest success rate in using Claude Code for coding. …
3 天前
Hacker News 热门(buzzing.cc 中文翻译)技巧与观点
Agent Builder 正式上市(GA)。基于 Elasticsearch 的持久化内存层将记忆分为情景、语义、程序三类,分别存入独立索引,各设不同写速率与过期规则。召回采用 BM25 与 Jina v5 稠密向量的 RRF 融合,再经交叉编码器重排序。在 168 道 QA 题评估中,R@10 平均 0.89,零跨租户泄漏。该层可通过支持 MCP 协议的客户端访问,不绑定特定运行时,已开源至 GitHub。
查看原文我们在 Elasticsearch 上构建了一个持久化代理内存层,其召回率为 0.89