jixiaxue 知识库
2026-05-20

AI 日报 | 2026-05-20

AI 日报 | 2026-05-20

74 个来源 | 318 条新内容 | 10 条 AI 精选

Smart Recommendations

1. Claude Code v2.1.145 发布

Anthropic - Claude Code (GitHub Releases) | AI 公司产品更新 / Changelog

Claude Code v2.1.145 新增 claude agents --json 命令,可将当前 Claude 会话列表以 JSON 格式输出,便于脚本化操作(如 tmux-resurrect、状态栏、会话选择器)。同时为 claude_code.tool OTEL spans 新增 agent_idparent_agent_id 属性,修复了后台子 Agent span 的 trace 层级关系。

阅读原文

2. Claude Code v2.1.144 发布

Anthropic - Claude Code (GitHub Releases) | AI 公司产品更新 / Changelog

Claude Code v2.1.144 为后台会话新增 /resume 支持,通过 claude --bg 启动的会话现在会在列表中显示并标记 bg。同时新增后台子 Agent 完成通知中的耗时显示(如“Agent completed · 3h 2m 5s”),并改进了 /plugin 的浏览和发现功能。

阅读原文

3. Copilot 云端 Agent 支持一键修复失败的 GitHub Actions

编程助手 - GitHub Copilot (专属) | AI 工具/产品

GitHub Copilot Business 和 Enterprise 用户现在可以通过一键点击让 Copilot 云端 Agent 自动修复失败的 GitHub Actions 任务。只需在失败的 Actions 页面点击“Fix with Copilot”按钮,Agent 即可接管并修复问题,极大降低 CI/CD 维护成本。

阅读原文

4. GitHub Copilot 本地会话远程控制正式发布:从 VS Code 切换到手机继续工作

编程助手 - GitHub Blog (全站) | AI 工具/产品

GitHub Copilot 的远程控制功能现已正式发布,用户可以在 VS Code 或 CLI 中开始工作,然后在 github.com 或 GitHub Mobile 上无缝接续。这意味着开发者可以在 PC 上启动 AI 编程会话,随时从手机或其他设备继续,实现真正的跨设备工作流。

阅读原文

5. Andrej Karpathy 加入 Anthropic

技术写作 & 通识 - Daring Fireball (John Gruber) | 技术博客 / 开发者博客(Android Capacity 精选)

Andrej Karpathy 本人在 X 上宣布加入 Anthropic,表示未来几年 LLM 前沿研究将尤为关键,他将回归 R&D 工作,并表示将继续保持对教育事业的热情。Karpathy 是 AI 领域顶级研究者,曾联合创立 OpenAI,担任特斯拉 AI 总监。

阅读原文

6. 重要更新:Gemini CLI 过渡为 Antigravity CLI

RSSHub 补充路由 - Google AI | AI 公司官方博客

Google 宣布将社区版 Gemini CLI 统一迁移至 Antigravity CLI,这是一个以 Agent 为核心的新平台,支持复杂多 Agent 工作流。新工具基于 Go 语言,具有更快执行速度、异步处理和与 Antigravity 平台同步的统一架构,直接对标 Claude Code 和 Cursor 等 AI 编程工具。

阅读原文

7. LLM Agent EDIT 工具的替代方案

系统 & 底层 - antirez (Salvatore Sanfilippo) | 技术博客 / 开发者博客(Android Capacity 精选)

Redis 作者 antirez 在为 DS4 项目开发 Agent 时,发现现有 EDIT 工具强迫 LLM 重新输出旧版本代码再给新版本,造成 token 浪费。他探讨了更高效的替代方案,并提出用 CRC32 校验和作为折中方案,这是 LLM Agent 工具设计的重要技术细节讨论。

阅读原文

8. OpenAI 与 Dell 合作将 Codex 引入混合云和本地企业环境

OpenAI | AI 公司官方博客

OpenAI 与 Dell 宣布合作,将 Codex AI 编程 Agent 带入企业混合云和本地(on-premise)部署环境,帮助有数据合规需求的企业在私有基础设施上安全使用 AI 编程能力。这是 Codex 向企业市场的重要扩张,标志着 AI 编程 Agent 开始进入对数据安全有严格要求的大型企业。

阅读原文

9. Google I/O 2026 开发者主题演讲全部公告汇总

RSSHub 补充路由 - Google AI | AI 公司官方博客

Google 在 I/O 2026 发布会上宣布从辅助型 AI 向独立 Agent 的全面转型,推出 Gemini 3.5 系列和以 Agent 为核心的 Antigravity 开发平台。此外发布了 Android CLI 工具、Android Bench 评测排行榜和自动迁移 Agent,是 Google AI 开发生态的年度最重要更新。

阅读原文

10. 在 OpenClaw 中使用 Grok

xAI | AI 公司官方博客

xAI 宣布用户可通过 SuperGrok 或 X Premium 订阅在 OpenClaw 中使用 Grok。OpenClaw 是一个开源、本地优先的 AI Agent 和个人助手。此次集成让 Grok 可在本地 Agent 环境中发挥作用。

阅读原文

播客精选 Top 5

1. 英伟达 GEAR 研究员高深远:世界模型、自进化循环与 DreamDojo

中文播客 - 晚点聊 LateTalk | AI 从业者访谈 / 播客

晚点聊播客第 165 期,英伟达 GEAR 具身智能实验室研究员高深远深度解析世界模型全景:分类体系、解决问题、发展瓶颈与各公司技术路线。后半段聚焦 GEAR 实验室自研的 DreamDojo 和 DreamZero 世界动作模型,并探讨由世界模型、策略模型和 Agent 构成的自进化循环设计范式。内容密度极高,对关注 AI Agent 和具身智能底层架构的开发者有深度参考价值。

阅读原文

2. Ben Horowitz 谈 AI 基础设施、经济学与软件新规律

英文播客 - AI + a16z | AI 从业者访谈 / 播客

a16z 联创 Ben Horowitz 在 Fintech Connect 大会上,与 Alex Rampell 深度探讨 AI 如何重写软件竞争的基本规则,以及为何加密基础设施在 AI 主导的世界中将变得不可或缺。内容涵盖风险投资在 AI 时代的未来走向。

阅读原文

3. IBM 的 Oliver Dial:量子优势今年将实现

英文播客 - Eye on AI | AI 从业者访谈 / 播客

IBM 量子系统副总裁 Oliver Dial 在播客中介绍量子计算的真实现状:2023 年已实现量子应用,2026 年目标是量子优势,完整纠错机器预计 2029 年完成。Dial 对量子计算能力边界保持坦诚态度。

阅读原文

4. 下一场战争已经开始,西方尚未准备好——Latent Space 播客特刊

英文播客 - Latent Space Podcast | AI 从业者访谈 / 播客

Latent Space 播客特刊,嘉宾主持 Noah Smith 与 AI 无人机公司创始人 Yaroslav Azhnyuk 深度对谈两小时,覆盖无人机战争技术、战场战术和西方地缘政治应对。内容聚焦军事 AI 应用,非 AI 开发工具方向。

阅读原文

Blog 精选 Top 5

1. Claude Managed Agents 新功能:自托管沙箱与 MCP 隧道

Claude Blog | AI 公司官方博客

Anthropic 官方博客宣布 Claude Managed Agents 两项重要更新:支持自托管沙箱(降低安全隔离成本)和 MCP 隧道(简化 MCP 服务器连接)。这两项功能直接扩展了 Claude Agent 的部署灵活性,对企业级 Agent 部署和 MCP 生态开发者有直接价值。

阅读原文

2. Andrej Karpathy 加入 Anthropic

技术写作 & 通识 - Daring Fireball (John Gruber) | 技术博客 / 开发者博客(Android Capacity 精选)

Andrej Karpathy 本人在 X 上宣布加入 Anthropic,表示未来几年 LLM 前沿研究将尤为关键,他将回归 R&D 工作,并表示将继续保持对教育事业的热情。Karpathy 是 AI 领域顶级研究者,曾联合创立 OpenAI,担任特斯拉 AI 总监。

阅读原文

3. 重要更新:Gemini CLI 过渡为 Antigravity CLI

RSSHub 补充路由 - Google AI | AI 公司官方博客

Google 宣布将社区版 Gemini CLI 统一迁移至 Antigravity CLI,这是一个以 Agent 为核心的新平台,支持复杂多 Agent 工作流。新工具基于 Go 语言,具有更快执行速度、异步处理和与 Antigravity 平台同步的统一架构,直接对标 Claude Code 和 Cursor 等 AI 编程工具。

阅读原文

4. 使用 Claude Code:HTML 出人意料的高效性

Claude Blog | AI 公司官方博客

Anthropic 官方博客探讨了在 Claude Code 工作流中使用 HTML 的意外高效性。文章可能展示了用 HTML 来快速原型化、可视化或传递上下文的实用技巧。此为 Claude Code 官方使用心得分享,对日常使用 Claude Code 的开发者有直接参考价值。

阅读原文

5. LLM Agent EDIT 工具的替代方案

系统 & 底层 - antirez (Salvatore Sanfilippo) | 技术博客 / 开发者博客(Android Capacity 精选)

Redis 作者 antirez 在为 DS4 项目开发 Agent 时,发现现有 EDIT 工具强迫 LLM 重新输出旧版本代码再给新版本,造成 token 浪费。他探讨了更高效的替代方案,并提出用 CRC32 校验和作为折中方案,这是 LLM Agent 工具设计的重要技术细节讨论。

阅读原文

YC 主题

1. Show HN: Superlog (YC P26) —— 自动安装并修复 Bug 的可观测性工具

Hacker News | Y Combinator

YC P26 孵化的 Superlog 在 Hacker News 上展示,定位为“自安装、自修复”的 AI 驱动可观测性平台。这类工具结合了日志分析和自动 bug 修复,对全栈开发者有直接吸引力,是 AI 辅助运维的新方向。

阅读原文

2. Show HN: Forge——护栏机制让 8B 模型在 Agent 任务上从 53% 提升至 99%

Hacker News | Y Combinator

开源项目 Forge 展示了通过 Guardrails(护栏机制)大幅提升小型 LLM Agent 任务成功率的方法,让 8B 参数模型在 Agent 任务上达到接近 100% 的准确率。这对使用本地小模型构建 Agent 的开发者极具参考价值。

阅读原文

3. Copy Fail、Dirty Frag 和 Fragnesia Linux 内核漏洞披露

Hacker News | Y Combinator

Gentoo 发布安全公告,披露三个 Linux 内核漏洞:Copy Fail、Dirty Frag 和 Fragnesia。这些内核级安全漏洞对 Linux 服务器和开发环境有实际安全影响,建议相关系统尽快更新。

阅读原文

4. 去除 AI 水印工具

Hacker News | Y Combinator

一个 GitHub 开源项目,旨在去除 AI 生成内容中的水印。该工具出现在 Hacker News 上,引发了关于 AI 内容溯源与版权的讨论。对图像模型开发者和内容创作者有一定参考意义。

阅读原文

5. OpenAI 采用 Google SynthID 水印技术用于 AI 图像验证

Hacker News | Y Combinator

OpenAI 宣布采用 Google 的 SynthID 水印技术,用于标记和验证其模型生成的 AI 图像,并加入 C2PA 开放标准。这是 AI 内容溯源领域的重要进展,有助于区分 AI 生成内容与真实内容。

阅读原文

6. Mistral AI 收购 Emmi AI 以打造领先 AI 技术栈

Hacker News | Y Combinator

Mistral AI 宣布收购 Emmi AI,意在构建更完整的 AI 技术栈。这是 Mistral 在产品和技术整合方面的重要战略动作,可能影响其 API 和工具链生态。

阅读原文

a16z 主题

1. Ben Horowitz 谈 AI 基础设施、经济学与软件新规律

英文播客 - AI + a16z | AI 从业者访谈 / 播客

a16z 联创 Ben Horowitz 在 Fintech Connect 大会上,与 Alex Rampell 深度探讨 AI 如何重写软件竞争的基本规则,以及为何加密基础设施在 AI 主导的世界中将变得不可或缺。内容涵盖风险投资在 AI 时代的未来走向。

阅读原文

2. 国防是下一个万亿美元赛道吗?| a16z 美国活力峰会

泛访谈频道(混合内容,需按 AI 相关性评分过滤) - a16z | YouTube AI 频道

a16z 美国活力峰会视频,探讨国防领域是否会成为下一个万亿美元级别的投资赛道。内容聚焦于科技与国防的交叉,与 AI 编程工具相关性较低。

阅读原文

3. 创始人如何为执法和急救人员打造产品 | a16z Show

泛访谈频道(混合内容,需按 AI 相关性评分过滤) - a16z | YouTube AI 频道

a16z 节目探讨创业者如何为执法部门和急救人员构建科技产品,内容涉及政府采购、监管合规等创业挑战。该内容与 AI 开发工具关联性较低,属于泛创业访谈内容。

阅读原文

4. 需要 Series C 融资?打电话给 a16z

a16z (Substack) | AI 公司官方博客

a16z Substack 文章,从律师视角观察 AI 在企业中的实际采用情况,探讨 AI 落地的规律与现象。文章标题语带幽默,实际探讨创业公司与 a16z 合作的生态视角。

阅读原文

1. AI 公司官方博客

15 条

标题来源日期摘要
在 OpenClaw 中使用 GrokxAI05-22 08:00xAI 宣布用户可通过 SuperGrok 或 X Premium 订阅在 OpenClaw 中使用 Grok。OpenClaw 是一个开源、本地优先的 …
使用 Claude Code:HTML 出人意料的高效性Claude Blog05-20 08:00Anthropic 官方博客探讨了在 Claude Code 工作流中使用 HTML 的意外高效性。文章可能展示了用 HTML 来快速原型化、可视化或传递…
需要 Series C 融资?打电话给 a16za16z (Substack)05-19 22:00a16z Substack 文章,从律师视角观察 AI 在企业中的实际采用情况,探讨 AI 落地的规律与现象。文章标题语带幽默,实际探讨创业公司与 a16…
OpenAI 推进内容溯源,构建更安全透明的 AI 生态OpenAI05-19 18:45OpenAI 宣布推进 AI 内容溯源工作,整合 Content Credentials、SynthID 和一套验证工具,帮助用户识别和信任 AI 生成的…
[D] KPMG 与 Anthropic 战略联盟:在全球 27.6 万员工中全面集成 ClaudeAnthropic (新闻)05-19 08:00Anthropic 官方宣布与 KPMG 达成战略联盟,KPMG 将在其核心业务和全球逾 27.6 万名员工中全面集成 Claude。这是 Claude …
[D] 拓宽前沿 AI 的公共对话Anthropic (新闻)05-19 08:00Anthropic 官方博文,探讨如何拓宽社会各界对前沿 AI 的讨论参与。这与教皇参与 Anthropic 相关活动的背景相呼应,体现了 Anthrop…
Google I/O 2026 开发者主题演讲全部公告汇总RSSHub 补充路由 - Google AI05-19 08:00Google 在 I/O 2026 发布会上宣布从辅助型 AI 向独立 Agent 的全面转型,推出 Gemini 3.5 系列和以 Agent 为核心的…
更智能的 Google AI Edge Gallery:MCP 集成、通知与会话连续性RSSHub 补充路由 - Google AI05-19 08:00Google AI Edge Gallery 应用新增对 MCP(Model Context Protocol)的实验性支持,允许 Gemma 4 在 A…
LiteRT-LM:极速设备端 GenAI 推理框架RSSHub 补充路由 - Google AI05-19 08:00Google AI Edge 推出 LiteRT-LM,为跨平台移动端和边缘设备提供高度优化的 Gemma 4 推理基础设施,支持内存高效动态加载和多 T…
重要更新:Gemini CLI 过渡为 Antigravity CLIRSSHub 补充路由 - Google AI05-19 08:00Google 宣布将社区版 Gemini CLI 统一迁移至 Antigravity CLI,这是一个以 Agent 为核心的新平台,支持复杂多 Agen…
Google Cloud x NVIDIA 开发者社区一周年:10 万会员里程碑RSSHub 补充路由 - Google AI05-19 08:00Google Cloud 与 NVIDIA 开发者社区庆祝一周年,达到 10 万会员。社区提供 LLM 优化、GPU 加速等学习路径,聚焦 AI 基础设施…
Google Tensor ML SDK Beta 版与 LiteRT 集成RSSHub 补充路由 - Google AI05-19 08:00Google Tensor ML SDK 进入 Beta 阶段,允许开发者将高性能 ML 模型直接部署到 Google Pixel 10 设备的 TPU …
Claude Managed Agents 新功能:自托管沙箱与 MCP 隧道Claude Blog05-19 08:00Anthropic 官方博客宣布 Claude Managed Agents 两项重要更新:支持自托管沙箱(降低安全隔离成本)和 MCP 隧道(简化 MC…
DeepMind Co-Scientist 加速发现逆转细胞衰老的基因靶点Google DeepMind05-19 02:21Google DeepMind 分享了利用 AI Co-Scientist 协助生物学家发现新型细胞年轻化因子的研究成果,AI 成功识别出能逆转人类细胞衰…
OpenAI 与 Dell 合作将 Codex 引入混合云和本地企业环境OpenAI05-18 18:00OpenAI 与 Dell 宣布合作,将 Codex AI 编程 Agent 带入企业混合云和本地(on-premise)部署环境,帮助有数据合规需求的企…

2. 知名 AI 个人开发者/研究者

9 条

标题来源日期摘要
llm-gemini 0.32 发布Simon Willison05-20 07:46Simon Willison 发布 llm-gemini 0.32,新增对 Gemini 3.5 Flash 模型的支持。这是其 llm CLI 工具的 …
[D] Gemini 3.5 Flash:更贵,但 Google 计划将其用于所有产品Simon Willison05-20 06:40Simon Willison 分析 Google I/O 发布的 Gemini 3.5 Flash,该模型跳过预览阶段直接全面上线,Google 已将其部…
datasette-llm-accountant 0.1a4 发布Simon Willison05-20 04:45Simon Willison 发布 datasette-llm-accountant 0.1a4,修复了追踪链式响应的 bug。这是 datasette-…
llm-gemini 0.32a0 发布Simon Willison05-20 04:36Simon Willison 发布 llm-gemini 0.32a0 alpha 版,兼容 llm>=0.32a0 alpha,新增流式输出推理 tok…
datasette-llm 0.1a8 发布Simon Willison05-20 04:28Simon Willison 发布 datasette-llm 0.1a8,修复了 llm_prompt_context() hook 在链式响应中未…
[AINews] 如何进入前沿 AI 实验室(关于预训练方向)Latent Space (Newsletter)05-19 15:31Latent Space 在 Google I/O 前夕发布的 AI 日报,重点放大了一篇关于如何加入前沿 AI 实验室预训练团队的博客文章。适合希望深入…
[D] 五分钟回顾过去六个月 LLM 的重大进展Simon Willison05-19 09:09Simon Willison 在 PyCon US 2026 的五分钟闪电演讲幻灯片整理,配有详细注释,回顾过去半年 LLM 领域的关键进展。使用其自研的…
Simon Willison 的鸟类观察记录:灰翅鸥、褐鹈鹕、雪鹭、加拿大鹅Simon Willison05-18 22:51Simon Willison 在 iNaturalist 记录的自然观察帖,包含灰翅鸥、褐鹈鹕、雪鹭和加拿大鹅的照片。这是 Simon 个人 everyt…
下一场战争已经开始,西方尚未准备好——无人机 AI 创始人访谈Latent Space (Newsletter)05-18 21:45Latent Space Newsletter 特刊,乌克兰 AI 无人机公司 The Fourth Law 创始人 Yaroslav Azhnyuk 接…

3. 技术博客 / 开发者博客(Android Capacity 精选)

29 条

标题来源日期摘要
深入研究一个数学恒等式技术写作 & 通识 - John D. Cook05-20 07:37John D. Cook 博客探讨一个数学恒等式的成立条件,使用 Mathematica 绘图验证该恒等式在 x>1 且 y>1 时成立的原因。文章属于纯…
AI 太贵了AI & 技术评论 - Where’s Your Ed At05-19 23:48Ed Zitron 在其技术评论 newsletter 中深度分析 AI 成本问题,内容涉及对 NVIDIA、Anthropic 等公司的详细经济分析。文…
Andrej Karpathy 加入 Anthropic技术写作 & 通识 - Daring Fireball (John Gruber)05-19 23:42Andrej Karpathy 本人在 X 上宣布加入 Anthropic,表示未来几年 LLM 前沿研究将尤为关键,他将回归 R&D 工作,并表示将继续…
Wi-Wi:纳秒级无线时间同步协议技术写作 & 通识 - Jeff Geerling05-19 22:00Jeff Geerling 介绍在 NAB 展会上发现的 Wi-Wi STAMP 无线时间同步协议,该协议源自日本 NICT,可实现不到 5ns 精度的无…
近似 Markov 方程技术写作 & 通识 - John D. Cook05-19 20:09John D. Cook 的数学博客文章,探讨 Don Zagier 对 Markov 数的研究,通过等价方程 f(x)+f(y)=f(z) 对整数解 x…
书评:Adrian Tchaikovsky《可怕的世界:目的地》五星推荐技术写作 & 通识 - Terence Eden05-19 19:34Terence Eden 对 Adrian Tchaikovsky 三部曲科幻短篇集的书评,故事探讨在不同时空旅行中的孤独主题。与 AI 技术无关。
1998 年微软反垄断案回顾独立开发者 & 个人博客 - Dave Farquhar (dfarq)05-19 19:00回顾 1998 年 5 月美国司法部对微软提起的反垄断诉讼及其争议性。文章属于历史回顾,与当前 AI 开发工具无关。
开源项目最蠢的死法独立开发者 & 个人博客 - Andrew Nesbitt05-19 18:00Andrew Nesbitt 探讨开源项目走向消亡的各种愚蠢方式,以依赖关系和维护者退出为切入点。文章关注开源生态健康,对依赖开源工具的开发者有借鉴意义。
LLM Agent EDIT 工具的替代方案系统 & 底层 - antirez (Salvatore Sanfilippo)05-19 15:26Redis 作者 antirez 在为 DS4 项目开发 Agent 时,发现现有 EDIT 工具强迫 LLM 重新输出旧版本代码再给新版本,造成 tok…
Pluralistic:根本不存在「年龄验证」这回事技术写作 & 通识 - Cory Doctorow (Pluralistic)05-19 15:17Cory Doctorow 探讨年龄验证系统的可预见后果,批评「必须做点什么」的政策思维。文章同时涉及多个话题包括 Apple Store、版权、数据经纪…
【赞助】WorkOS:Agent 需要上下文,用 WorkOS Pipes 快速接入集成技术写作 & 通识 - Daring Fireball (John Gruber)05-19 09:27WorkOS Pipes 赞助内容,提供预构建的 GitHub、Slack、Salesforce、Google Drive 等服务连接器,帮助 Agent…
勾股定理加法:alpha-max plus beta-min 快速估算算法独立开发者 & 个人博客 - Entropic Thoughts05-19 06:00介绍了 alpha-max plus beta-min 算法,可以用心算快速估算 √(a²+b²) 的值,近似公式为 max(a, 0.9a + 0.5b…
CISA 管理员将 AWS GovCloud 密钥泄露到 GitHub安全 & 隐私 - Krebs on Security05-19 04:48一名 CISA(美国网络安全和基础设施安全局)承包商在公开的 GitHub 仓库中暴露了多个高权限 AWS GovCloud 账户凭证及大量内部系统信息。…
10Gb/s 以太网:为 10GBASE-T SFP+ 模块安装迷你散热片独立开发者 & 个人博客 - Giles Thomas05-19 03:15作者分享了为 MikroTik 10GBASE-T SFP+ 模块安装树莓派迷你散热片的实验经历,解决了模块过热问题。文章记录了散热片安装前后的温度对比数…
macOS 图标设计之殇:越做越糟的苹果图标独立开发者 & 个人博客 - Jim Nielsen05-19 03:00文章通过对比 Apple 历代 macOS 图标的演变,指出图标设计质量在逐步下降,把历代图标倒序排列看起来像是一个设计师越来越进步的作品集。这是一篇关于…
世纪 AI 审判以无声结局收场AI & 技术评论 - Gary Marcus05-19 02:30Gary Marcus 评论马斯克诉 OpenAI 案件以陪审团一致裁决支持 OpenAI 告终,指出这场“世纪级 AI 审判”结局令人失望,许多关于 O…
陪审团一致裁定驳回马斯克诉 Sam Altman 的索赔技术写作 & 通识 - Daring Fireball (John Gruber)05-19 01:53九人陪审团一致裁定马斯克未能在三年诉讼时效内提起对 OpenAI 和 Sam Altman 的诉讼。陪审团认定马斯克早在 2021 年就已知晓诉状中描述的…
「John Appleseed」:Tim Cook 时代的 Apple 遗产技术写作 & 通识 - Daring Fireball (John Gruber)05-19 01:34Om Malik 对 Apple CEO 交接(Tim Cook 到 John Ternus)的深度分析,回顾了 Tim Cook 执掌 Apple 14…
请定义「繁荣」:AI 浪潮真的提升了科技公司的销售额吗?技术写作 & 通识 - Daring Fireball (John Gruber)05-19 01:17John Gruber 质疑 NYT 文章关于 Apple「错过 AI 繁荣」的说法,指出实际上哪些科技公司的销售额被 AI 显著拉动了?通过分析 NVI…
Ted Turner 在前 CNN 中心楼上的小公寓技术写作 & 通识 - Daring Fireball (John Gruber)05-19 00:52John Gruber 分享了关于 Ted Turner 在亚特兰大 CNN 中心楼上维持小公寓的视频,并将其与迪士尼乐园消防站楼上的沃尔特·迪士尼公寓相…
现有利益相关者对未来有发言权:AI 是技术,不是产品技术写作 & 通识 - Daring Fireball (John Gruber)05-19 00:47John Gruber 延伸讨论他关于「AI 是技术,不是产品」的观点,回应 Steven Levy 关于 Apple 新 CEO 必须构建「杀手级 AI…
AI、「人类」与曼哈顿博士综合症技术写作 & 通识 - Daring Fireball (John Gruber)05-19 00:21通过核能产业的历史类比,探讨 AI 行业与公众沟通脱节的风险。作者指出,核能产业失败的教训在于缺乏人性化的公众信任建立,AI 行业若重蹈覆辙、仅用「人类」…
阿拉斯加永久基金:AI 数据中心「全民基本收入」的参考先例技术写作 & 通识 - Daring Fireball (John Gruber)05-18 23:34John Gruber 引用阿拉斯加永久基金(用石油收益向居民发放股息)作为参考,探讨 AI 数据中心是否可以建立类似机制向当地社区支付「数字红利」,回应…
AI 数据中心在美国跨党派民调中极度不受欢迎技术写作 & 通识 - Daring Fireball (John Gruber)05-18 22:59盖洛普民调显示,70% 的美国人反对在当地建设 AI 数据中心,其中近半数(48%)强烈反对,仅 25% 支持。值得注意的是,反对 AI 数据中心的比例(…
已经没人在乎调试奇偶标志位了系统 & 底层 - The Old New Thing (Raymond Chen)05-18 22:00Raymond Chen 的《The Old New Thing》博文,讲述 x86 奇偶标志位(parity flag)的调试问题自发布起就一直存在错误…
别叫自己软件工程师了,你现在是 AI 赋能工程师独立开发者 & 个人博客 - Ibrahim Diallo05-18 20:00独立开发者 Ibrahim Diallo 撰文探讨 AI 时代工程师身份认同的转变,认为当代程序员应重新定义自身角色为“AI 赋能工程师”。文章反思 AI…
Cyberrebate.com:互联网泡沫时代最糟糕的创业点子?独立开发者 & 个人博客 - Dave Farquhar (dfarq)05-18 19:00技术博主 Dave Farquhar 回顾互联网泡沫时代最荒唐的商业模式之一——Cyberrebate,探讨那个年代送出商品换流量的反常逻辑。内容属于科技…
FediMeteo、HAProxy 与高效利用 snac 线程的艺术独立开发者 & 个人博客 - IT Notes (Dragas)05-18 17:44技术博主 Dragas 分享 FediMeteo 项目使用 HAProxy 优化 snac(ActivityPub 服务器)线程资源的实践经验,探讨小型 …
Troy Hunt 周报第 504 期安全 & 隐私 - Troy Hunt05-18 11:46安全专家 Troy Hunt 第 504 期周报,讨论黑客勒索“付还是不付”的争议话题,并提及 Grafana 最近选择拒绝支付勒索并公开的案例。内容以网…

4. 新闻媒体

81 条

标题来源日期摘要
文学奖得主面临 AI 使用指控,这似乎成了新常态英文科技媒体(AI 频道) - Wired AI05-20 06:53英联邦短篇小说奖五位地区获奖者中,有三位被怀疑使用了 AI 聊天机器人。Wired 报道指出这种情况在文学创作领域正变得越来越普遍。此事件折射出 AI 生…
Demis Hassabis 称这可能是“奇点的山麓”,这是什么意思?英文科技媒体(AI 频道) - The Verge AI05-20 06:16Google DeepMind CEO Demis Hassabis 在 Google I/O 演讲结束时表示,我们正处于 AGI 潜力即将释放的“深刻时…
Google 在 I/O 2026 上宣布进军 AI 设计领域英文科技媒体(AI 频道) - TechCrunch AI05-20 05:33Google 在 I/O 2026 发布了面向 AI 设计领域的新工具,定位为面向教师、小企业主等各类用户的设计平台。TechCrunch 分析认为 AI…
Google I/O 2026:现在可以用语音和 Gmail 收件箱对话了英文科技媒体(AI 频道) - TechCrunch AI05-20 05:25Google 为 Gmail 引入对话式语音搜索功能,用户可向 Gemini 询问邮件中的具体信息。这是 Google 将 AI 深度整合到生产力工具的又…
Google 的未来是一个能做所有事的搜索框英文科技媒体(AI 频道) - The Verge AI05-20 05:24The Verge 评论 Google I/O 2026,认为 Google 不只想代替用户搜索,而是想通过一个搜索框替用户完成一切事务。文章分析了 Go…
如何使用 Google 新 AI Agent 突破标准搜索的局限英文科技媒体(AI 频道) - TechCrunch AI05-20 05:16Google 推出 AI 驱动的“信息 Agent”,可在后台监控特定话题并主动向用户推送更新提醒。TechCrunch 介绍了这些新 Agent 的使用…
从少年黑客到铁穹研究员,这位创始人融资 2800 万美元对抗 AI 网络钓鱼英文科技媒体(AI 频道) - TechCrunch AI05-20 05:08AI 邮件安全平台 Ocean 获得 2800 万美元融资,其 AI 通过深度分析每封邮件的上下文来检测欺诈和身份冒充。创始人有着从少年黑客到以色列铁穹系…
Google 的 AI 未来需要你的信任与个人数据英文科技媒体(AI 频道) - The Verge AI05-20 05:00The Verge 分析 Google I/O 2026 发布的 Gemini Spark 等新 AI 工具,指出 Google 的 AI 愿景高度依赖用…
Elon Musk 称 Sam Altman “窃取”了非营利组织,但庭审显示双方目标相似英文科技媒体(AI 频道) - TechCrunch AI05-20 04:11陪审团迅速驳回了 Elon Musk 对 OpenAI 其他创始人及微软的诉讼,TechCrunch 分析认为此案本就薄弱,部分原因是 Musk 拖延太久…
Google I/O 2026 全部公告:Gemini、搜索、智能眼镜英文科技媒体(AI 频道) - Wired AI05-20 04:00Wired 汇总 Google I/O 2026 的所有重要发布:Gemini 模型升级、搜索体验重塑、AI Agent 全面部署,以及今秋推出的新款智能…
Google 效仿 Meta,在 I/O 2026 发布音频智能眼镜英文科技媒体(AI 频道) - TechCrunch AI05-20 03:15Google 发布新款“音频眼镜”,用户可通过语音命令借助 Gemini 完成各类任务。产品将深度整合 Google 生态系统,定位类似 Meta Ray…
Meta 员工在裁员前争相使用福利英文科技媒体(AI 频道) - Wired AI05-20 03:00Meta 约 8000 名员工面临裁员,离职前纷纷兑换耳机补贴等员工福利。这是关于 AI 驱动裁员的人文侧面报道,属于行业观察类内容。
两款 AI 科学助手在药物再定向任务中取得成功英文科技媒体(AI 频道) - Ars Technica AI05-20 02:55Ars Technica 报道两款 AI 科学助手在药物再定向任务中表现良好,一款负责生成假设,另一款进一步完成数据分析。属于 AI for Scienc…
Google SynthID AI 水印技术被 OpenAI、Nvidia 等广泛采用英文科技媒体(AI 频道) - Ars Technica AI05-20 02:37Google 的 SynthID AI 水印技术正获得 OpenAI、Nvidia 等主要 AI 公司的采用,旨在帮助区分 AI 生成内容与真实内容。这是…
Gemini 3.5 Flash 速度或已足以让生成式 AI 真正实用英文科技媒体(AI 频道) - Ars Technica AI05-20 02:11Ars Technica 分析 Google I/O 发布的 Gemini 3.5 Flash,认为其速度和效率可能达到了 AI Agent 大规模应用的…
Gemini 将使用 Volvo 外置摄像头解读停车标志英文科技媒体(AI 频道) - The Verge AI05-20 02:00Google 与 Volvo 宣布合作,Gemini AI 将接入 EX60 SUV 的外置摄像头,帮助驾驶员理解周围环境和停车标志。这是 Gemini …
Google Genie 世界模型现可用 Street View 模拟真实街道英文科技媒体(AI 频道) - TechCrunch AI05-20 01:51Google DeepMind 将 Street View 与 Project Genie 整合,创建可交互的沉浸式世界模拟,支持机器人、游戏和旅行场景。…
凭借 Gemini 3.5 Flash,Google 将 AI 下一浪潮押注于 Agent 而…英文科技媒体(AI 频道) - TechCrunch AI05-20 01:51TechCrunch 分析 Google 通过 Gemini 3.5 Flash 将战略重心从聊天机器人转向自主 Agent 的布局。该模型能够自主执行复…
Google 欲与 Anthropic 的 Mythos 竞争英文科技媒体(AI 频道) - The Verge AI05-20 01:48Google 在 I/O 上宣布将 CodeMender(AI 代码安全 Agent)的 API 开放给更多外部专家测试,该工具去年 10 月首次亮相。G…
你所熟知的 Google 搜索已终结英文科技媒体(AI 频道) - TechCrunch AI05-20 01:46TechCrunch 报道 Google 将搜索从链接列表彻底转变为 AI 对话式体验,集成自主 Agent 和交互界面,这一转变可能进一步减少对出版商网…
Google 现在可以为你 vibe-code 一个 Android 应用英文科技媒体(AI 频道) - The Verge AI05-20 01:45Google AI Studio 现在支持直接构建原生 Android 应用,内置 Android 模拟器可实时预览效果。用户只需用自然语言描述应用创意,…
你愿意让机器人花你的钱吗?Google 正在押注这一点英文科技媒体(AI 频道) - The Verge AI05-20 01:45Google 在 I/O 上发布“Universal Cart”,一个跨零售商和 Google 产品(Gemini、YouTube、Gmail)的统一购物…
Google 搜索迎来史上最大变革英文科技媒体(AI 频道) - The Verge AI05-20 01:45Google Search 在 I/O 2026 进入 AI 进化新阶段:重新设计的搜索框整合了 AI Overviews 和 AI Mode,由新 Ge…
Gmail 即将开始与你对话英文科技媒体(AI 频道) - The Verge AI05-20 01:45Google 为 Gmail 推出 Gmail Live 功能,这是专为收件箱设计的 AI 语音模式,相当于 Gemini Live 的 Gmail 版本…
OpenAI 让检测 AI 生成图片变得更容易英文科技媒体(AI 频道) - TechCrunch AI05-20 01:45OpenAI 宣布两项新措施:加入开放的 C2PA 标准,并将 Google SynthID 水印技术整合到其产品中,以帮助检测 AI 生成图像。这是 A…
Google 发布 Android CLI,提升 AI Agent 编程能力英文科技媒体(AI 频道) - TechCrunch AI05-20 01:45Google 发布新的 Android CLI 工具,专为 Claude Code、OpenAI Codex 等 AI 编程 Agent 设计,让开发者和…
Google AI Studio 现在让任何人都能在几分钟内构建 Android 应用英文科技媒体(AI 频道) - TechCrunch AI05-20 01:45Google 推出基于 Web 的 AI 工具,可在几分钟内生成原生 Android 应用,这是 Google 在 AI 驱动软件开发领域的重要扩张。属于…
Google 新推出的 Universal Cart 要追踪你在互联网上的完整购物旅程英文科技媒体(AI 频道) - TechCrunch AI05-20 01:45Google 推出 Universal Cart,跨设备、多零售商的统一购物车,旨在覆盖用户完整的购物路径。这是 Google I/O 发布内容的媒体报道…
Google 在 I/O 2026 发布 Antigravity 2.0,带来更新的桌面应用和…英文科技媒体(AI 频道) - TechCrunch AI05-20 01:45Google 发布 Antigravity 2.0,配套更新了桌面应用和 CLI 工具,并推出售价 100 美元的 AI Ultra 计划(用量为 AI …
Google 在 I/O 2026 发布 Gemini Spark,一款集成 Gmail 的全…英文科技媒体(AI 频道) - TechCrunch AI05-20 01:45Google 发布 Gemini Spark,基于 Gemini 基础模型和 Google Antigravity Agent 框架构建的全天候个人 AI…
Google 为 Docs 和 Keep 新增语音提示功能英文科技媒体(AI 频道) - TechCrunch AI05-20 01:45Google Workspace 更新让用户可通过语音创建草稿、做笔记和搜索邮件。这是 Google 将 AI 语音交互整合到生产力套件的举措,与 AI …
Google Gemini Omni 将图像、音频和文本转化为视频——这只是开始英文科技媒体(AI 频道) - TechCrunch AI05-20 01:45Google 发布 Gemini Omni,一个跨文本、图像、音频和视频的多模态模型,可通过自然对话生成和编辑视频,首先推出 Omni Flash 版本。…
Google 在 I/O 2026 更新 Gemini 应用,挑战 ChatGPT 和 Claude英文科技媒体(AI 频道) - TechCrunch AI05-20 01:45Google 更新 Gemini 应用,意在将其打造为全能 AI 中枢而非单纯聊天机器人,直接与 ChatGPT 和 Claude 竞争。属于 Googl…
Google 搜索走向 Agent 化——不再需要你的参与英文科技媒体(AI 频道) - Wired AI05-20 01:45Wired 分析 Google 将搜索转变为高度个性化、自动化的 AI 体验,引入 vibe-coded 结果、超级组件和永不停歇的 AI Bot。文章探…
Google 让 Deepfake 自己变得轻而易举英文科技媒体(AI 频道) - Wired AI05-20 01:45Google 全面升级 AI 创作软件 Flow,引入新的视频模型和“Avatar”功能,可生成用户的自拍式 AI 视频。这是 Google 在 AI 视…
Demis Hassabis 认为 AI 裁员是愚蠢的英文科技媒体(AI 频道) - Wired AI05-20 01:45Google DeepMind CEO Demis Hassabis 接受 WIRED 采访表示,企业应利用 AI 带来的生产力提升去做更多事,而不是裁员…
Gemini Spark 是 Google 对 OpenClaw 全天候 AI Agent 的回应英文科技媒体(AI 频道) - Wired AI05-20 01:45Wired 报道 Google 的 Gemini Spark 全天候 AI Agent,设计用于自主完成购物、发送邮件等任务,并深度访问用户数据。这是 G…
Google 25 年来首次重新设计搜索框——为什么这比你想象的更重要英文科技媒体(AI 频道) - VentureBeat AI05-20 01:45VentureBeat 深度分析 Google 将搜索框从简单关键词输入转变为 AI 驱动对话界面的历史意义。文章认为这是计算机人机交互范式的根本性转变,…
OpenAI 联合创始人 Andrej Karpathy 加入 Anthropic 预训练团队英文科技媒体(AI 频道) - TechCrunch AI05-19 23:43Andrej Karpathy 宣布加入 Anthropic,负责预训练方向——即赋予 Claude 核心知识和能力的大规模训练工作。预训练也是最昂贵、计…
前 OpenAI 员工警告:xAI 安全记录不佳或影响 SpaceX IPO英文科技媒体(AI 频道) - Wired AI05-19 23:00前 OpenAI 员工联合成立 AI 监督新组织,警告 SpaceX 投资者需了解 xAI 的 AI 安全实践问题。他们认为在 SpaceX 上市前,投资…
电力公用事业巨型并购背后:数据中心才是核心英文科技媒体(AI 频道) - Ars Technica AI05-19 21:45NextEra 与 Dominion 的重大并购交易,其核心驱动力是数据中心对电力的巨大需求。Ars Technica 分析指出,此次并购可能导致消费者电…
太意外!教皇和 Anthropic 创始人,要联袂开发布会中文 AI 媒体 - 新智元05-19 19:00新智元报道称教皇与 Anthropic 创始人将共同举办发布会,这一罕见组合引发广泛关注。文章探讨 AI 伦理与宗教价值观交汇的背景下,Anthropic…
跨越落地鸿沟!清华长三院发布首个真实场景 AI 竞技场,实战谁是最佳?中文 AI 媒体 - 新智元05-19 19:00清华大学长三角研究院发布首个面向真实应用场景的 AI 竞技场,旨在评估各大模型在实战中的真实表现而非传统 Benchmark。该平台专注于弥合 AI 研究…
Tom Steyer 想拯救加州,又不想让亿万富翁离开英文科技媒体(AI 频道) - Wired AI05-19 18:30Wired 对加州州长候选人 Tom Steyer 的采访,他主张向超级富豪征税、监管 AI,同时保持硅谷的活力。文章涉及 AI 监管政策,但主要是政治议题。
抢先李飞飞!世界模型能多人联机玩 FPS 游戏了中文 AI 媒体 - 量子位05-19 15:05量子位报道称一款世界模型已实现支持多人联网 FPS 游戏的能力,在李飞飞相关研究之前发布。这标志着世界模型从单人游戏走向实时多人交互的重要进展。
编程新王 Composer 2.5 来了,逼近 Opus 4.7!成本仅为 1/10中文 AI 媒体 - 新智元05-19 15:05Cursor 发布 Composer 2.5,这是专为编程优化的 Agent 模型,性能据称接近 Claude Opus 4.7 级别,但成本仅为其 1/…
20 刀月费秒变 API!Hermes 一行命令就能用上 Claude、ChatGPT 订阅中文 AI 媒体 - 新智元05-19 15:05新智元介绍 Hermes 工具,声称可以一行命令将 Claude、ChatGPT 等订阅会员转换为可调用的 API 接口。该方案绕过官方 API 计费机制…
国产 GPU 开始造世界!国内首个全栈具身智能仿真平台发布中文 AI 媒体 - 量子位05-19 15:03量子位报道国内首个全栈具身智能仿真平台 MT Lambda 发布,基于国产 GPU 构建,面向机器人与具身 AI 训练。这是国内 AI 基础设施从芯片到仿…
Cursor 新模型 Composer 2.5 发布,1/10 成本达 Opus 4.7 级表现中文 AI 媒体 - 量子位05-19 14:07量子位报道 Cursor 发布 Composer 2.5 编程 Agent 模型,以 1/10 的成本实现接近 Claude Opus 4.7 的编程表现…
文远知行 L2++ 五冠王:自动驾驶领域新标杆中文 AI 媒体 - 量子位05-19 13:11量子位报道文远知行在 L2++ 智能驾驶赛道获得五项冠军,强调其技术实力。文章聚焦自动驾驶竞争格局,与 AI 编程开发工具无直接关联。
你的 AI Agent 越用越蠢?港中大、浙大戳破「记忆」的谎言中文 AI 媒体 - 新智元05-19 12:35香港中文大学与浙江大学联合研究揭示,AI Agent 的「记忆」机制存在根本性缺陷,导致长期使用后性能下降。研究分析了现有记忆方案的失效模式,对构建可靠 …
量子位 AIGC 2026 峰会参会指南中文 AI 媒体 - 量子位05-19 11:25量子位发布 AIGC 2026 峰会参会指南,活动将于 5 月 20 日举办。内容为活动通知,与技术内容无关。
Qwen 3.7 Max 预览版发布,文本视觉双双国产第一中文 AI 媒体 - 量子位05-19 10:46阿里 Qwen 发布最新 Qwen 3.7 Max 预览版,文本和视觉领域均声称国产第一。两代旗舰(Qwen3.7 和 Qwen3.5)并行迭代,即便前负…
百度无人车周订单破 35 万,李彦宏称开始单城盈利中文 AI 媒体 - 量子位05-19 09:52百度自动驾驶业务取得新里程碑,萝卜快跑周订单突破 35 万,已覆盖全球 27 座城市,李彦宏宣布部分城市已开始盈利。这标志着 Robotaxi 商业化进入…
马斯克为何输掉对 OpenAI 的诉讼英文科技媒体(AI 频道) - MIT Technology Review AI05-19 08:53MIT Technology Review 分析马斯克诉 OpenAI 案判决结果:陪审团一致裁定马斯克的诉讼因超过诉讼时效而被驳回,法官 Yvonne …
【赞助】大规模 AI 搜索的架构蓝图白皮书AI 专业媒体/Newsletter - TLDR AI05-19 08:00Algolia 赞助的 TLDR AI 广告,推广其 AI 搜索架构白皮书,涵盖混合检索、RAG prompt 设计和生产反模式等内容。这是付费广告内容。
Qwen 3.7 Preview 登陆 Arena 评测平台AI 专业媒体/Newsletter - TLDR AI05-19 08:00Qwen 3.7 预览版已上线 Arena 评测平台,其中 Qwen3.7 Max Preview 在文本 Arena 综合排名第 13,Qwen3.7 …
Cursor 发布 Composer 2.5 编程 Agent 模型AI 专业媒体/Newsletter - TLDR AI05-19 08:00Cursor 发布 Composer 2.5,这是经过针对性强化学习、合成数据和新型分布式训练技术训练的编程 Agent 模型。TLDR AI 提供了对该…
Anthropic 收购 SDK 自动化创业公司 StainlessAI 专业媒体/Newsletter - TLDR AI05-19 08:00Anthropic 收购开发者工具创业公司 Stainless,其 SDK 自动化平台曾被 OpenAI、Google、Cloudflare 等主流 AI…
LLM 权重内的政治审查是什么样的:Qwen 案例研究AI 专业媒体/Newsletter - TLDR AI05-19 08:00深度技术文章揭示 Qwen3.5-9B 的政治审查行为仅由一个可识别并可关闭的小型神经回路实现,事实性知识在预训练中已存在,审查是后期叠加的路由机制。这是…
Agent 评估:详细指南AI 专业媒体/Newsletter - TLDR AI05-19 08:00LLM 评估已从静态基准测试转向更动态的真实世界 Agent 系统。有效评估现在需要真实的测试环境,以便在复杂环境中长时间测试 Agent。随着 Agen…
AI Agent 安全峰会 | 旧金山(赞助)AI 专业媒体/Newsletter - TLDR AI05-19 08:00Zenity Labs 主办的 AI Agent 安全峰会将于 5 月 27 日在旧金山举行,邀请来自 Microsoft、Google 和 Amazon…
HRM-Text:基于 HRM 架构的 1B 文本生成模型AI 专业媒体/Newsletter - TLDR AI05-19 08:00HRM-Text 是一个基于 HRM 架构的 10 亿参数文本生成模型,训练所需算力比传统基础模型少 130-600 倍,数据量少 150-900 倍。0…
LM 预训练的泛化动态研究AI 专业媒体/Newsletter - TLDR AI05-19 08:00语言模型在预训练期间会在模式复制和自适应智能之间发生不可预测的切换,研究者称之为“模式跳变”。这种行为无法通过标准优化技术修正,研究者建议利用这些动态来更…
NVIDIA 首款面向 Agent 的 CPU Vera 抵达顶尖 AI 实验室AI 专业媒体/Newsletter - TLDR AI05-19 08:00NVIDIA 首批 Vera CPU 已抵达 Anthropic、OpenAI、SpaceXAI 和 Oracle,由 NVIDIA 副总裁亲自交付。Ve…
在生产环境中运行长周期 Agent(LangChain 网络研讨会)AI 专业媒体/Newsletter - TLDR AI05-19 08:00LangChain 主办网络研讨会,聚焦生产环境中长周期 Agent 的持久执行能力,包括如何在中断后恢复执行而无需重新开始。这是一个赞助内容,面向需要在…
Grok 推出跨平台 Skills 功能(Web/iOS/Android)AI 专业媒体/Newsletter - TLDR AI05-19 08:00xAI 为 Grok 推出了“Skills”功能,允许用户教会 Grok 特定函数,并在后续交互中持续记忆和使用。该功能已在 Web、iOS 和 Andr…
Manus 推出 Scheduled Tasks 2.0AI 专业媒体/Newsletter - TLDR AI05-19 08:00Manus 发布 Scheduled Tasks 2.0,增强了自动化能力,允许任务在带上下文的情况下运行,确保跨项目和应用的工作流连续性。新版本聚焦于让…
Lovable 推出可复用 Skills:将重复指令变为标准化规则AI 专业媒体/Newsletter - TLDR AI05-19 08:00Lovable 推出 Skills 功能,允许用户创建基于 Markdown 的可复用指令集,消除重复性解释。用户可将常用的构建规范、代码风格偏好封装为 …
TLDR 招聘高级 Applied AI 软件工程师(25-35万美元,全远程)AI 专业媒体/Newsletter - TLDR AI05-19 08:00TLDR Applied AI 团队正在招聘高级软件工程师,负责将公司内部流程代码化和自动化。团队规模小、节奏快,使用最新 AI 工具且无 token 预…
SandboxAQ 将药物发现模型接入 Claude,无需计算机博士学位英文科技媒体(AI 频道) - TechCrunch AI05-19 05:29SandboxAQ 将其量子化学药物发现模型集成到 Claude 平台,使科学家无需深厚计算背景即可使用。与 Chai Discovery 和 Isomo…
法律失败:不要用 AI 生成虚假引用来起诉 Facebook 用户英文科技媒体(AI 频道) - Ars Technica AI05-19 04:27一名男子因约会评价在 Facebook 群组受到负面评论,尝试用 AI 生成法律文件起诉用户,但 AI 产生了虚假引用导致诉讼失败。此案例再次警示 AI …
陪审团一致裁定:马斯克起诉 OpenAI 已超过诉讼时效英文科技媒体(AI 频道) - Ars Technica AI05-19 02:09马斯克诉 OpenAI 和 Sam Altman 案件以陪审团一致裁决支持 OpenAI 告终,法官随即采纳陪审团裁决作为最终判决。陪审团认定马斯克早在 …
马斯克输掉对 OpenAI 的里程碑式诉讼英文科技媒体(AI 频道) - Wired AI05-19 01:40九人陪审团仅用两小时即裁定支持 OpenAI,法官随即将其作为最终判决采纳。这是马斯克就 OpenAI 转型问题提起的重大法律诉讼,判决结果标志着 Ope…
本周 Google I/O 前瞻:期待什么英文科技媒体(AI 频道) - MIT Technology Review AI05-19 01:35MIT Technology Review 分析了 Google 在年度开发者大会 I/O 前夕的现状,指出 Google 目前在基础模型竞赛中处于第三位…
Anduril 与 Meta 合作打造军事智能眼镜的内幕英文科技媒体(AI 频道) - MIT Technology Review AI05-19 00:01防务科技公司 Anduril 与 Meta 合作开发军事增强现实头盔原型,愿景包括通过眼动追踪和语音命令发动无人机攻击。这是 Meta Ray-Ban 眼…
Import AI 457:AI 版震网病毒、Muon 优化器、正向对齐AI 专业媒体/Newsletter - Import AI (Jack Clark)05-18 21:31Jack Clark 的 Import AI 第 457 期,涵盖 AI 安全(AI Stuxnet 攻击场景)、Muon 优化器的研究进展以及 AI 对…
漏洞赏金平台被 AI 垃圾报告淹没英文科技媒体(AI 频道) - Ars Technica AI05-18 21:23Ars Technica 报道 AI 生成的低质量漏洞报告正在大量涌入企业漏洞赏金计划,给安全团队造成巨大审核负担。这一趋势表明 AI 辅助安全研究的滥用…
重塑主流PC,第三代英特尔酷睿开启全民AI轻薄本时代中文 AI 媒体 - 量子位05-18 21:16量子位报道第三代英特尔酷睿处理器发布,通过芯片级与系统级双重创新推动 AI PC 普及。新处理器面向主流笔记本市场,旨在将本地 AI 算力带入大众消费者手…
AI 水论文封一年署名连坐!arXiv 最严新规来了,陶哲轩附议中文 AI 媒体 - 量子位05-18 20:18量子位报道 arXiv 推出严厉新规,针对 AI 生成水论文的滥投行为实施封禁并追责共同作者。知名数学家陶哲轩对此表示支持,认为 AI 生成论文消耗学术审…
openJiuwen 社区开源发布 JiuwenSwarm,开启群体智能新范式中文 AI 媒体 - 量子位05-18 18:26量子位报道 openJiuwen 社区开源发布 JiuwenSwarm 群体智能框架,宣称底层范式从单 Agent 转向多 Agent 协作“养蜂”模式。…

5. Y Combinator

20 条

标题来源日期摘要
去除 AI 水印工具Hacker News05-20 06:30一个 GitHub 开源项目,旨在去除 AI 生成内容中的水印。该工具出现在 Hacker News 上,引发了关于 AI 内容溯源与版权的讨论。对图像模…
Tesla 锂精炼厂每天排放 23.1 万加仑污染废水Hacker News05-20 03:52报道揭示 Tesla 在德克萨斯州的锂精炼厂每天产生大量污染废水。此议题属于环保和制造业新闻,与 AI 开发工具无关。
ERA:从 Nature 论文到推动计算发现Hacker News05-20 03:34Google Research 博客介绍 ERA(经验性研究助手)项目,该系统已在 Nature 发表成果,现致力于加速计算科学发现。ERA 代表了 AI…
OpenAI 采用 Google SynthID 水印技术用于 AI 图像验证Hacker News05-20 03:34OpenAI 宣布采用 Google 的 SynthID 水印技术,用于标记和验证其模型生成的 AI 图像,并加入 C2PA 开放标准。这是 AI 内容溯…
Mistral AI 收购 Emmi AI 以打造领先 AI 技术栈Hacker News05-20 03:14Mistral AI 宣布收购 Emmi AI,意在构建更完整的 AI 技术栈。这是 Mistral 在产品和技术整合方面的重要战略动作,可能影响其 AP…
明尼苏达州成为首个禁止预测市场的州Hacker News05-20 03:13明尼苏达州立法禁止预测市场,成为美国首个采取此类行动的州。这是金融监管领域的政策新闻,与 AI 开发工具无关。
Disney 抹去了 FiveThirtyEightHacker News05-20 02:56Nate Silver 撰文讲述 Disney 如何彻底删除 FiveThirtyEight 品牌及其历史内容。属于媒体行业观察文章,与 AI 开发工具无关。
TTY 揭秘(2008年)Hacker News05-20 02:40一篇经典的 2008 年技术文章,深入解释 Unix/Linux 系统中 TTY 子系统的工作原理。该文在 Hacker News 重新引发关注,是理解终…
Show HN: Superlog (YC P26) —— 自动安装并修复 Bug 的可观测性工具Hacker News05-19 23:54YC P26 孵化的 Superlog 在 Hacker News 上展示,定位为“自安装、自修复”的 AI 驱动可观测性平台。这类工具结合了日志分析和自…
我建了一个几乎涵盖所有操作系统的虚拟博物馆Hacker News05-19 23:53一位开发者创建了虚拟操作系统博物馆,收录了几乎所有主流和经典操作系统的可交互展示。这是一个技术历史兴趣项目,在 Hacker News 获得关注,与 AI…
Copy Fail、Dirty Frag 和 Fragnesia Linux 内核漏洞披露Hacker News05-19 23:27Gentoo 发布安全公告,披露三个 Linux 内核漏洞:Copy Fail、Dirty Frag 和 Fragnesia。这些内核级安全漏洞对 Lin…
为何几乎所有人都是右撇子?新研究将其与直立行走联系起来Hacker News05-19 22:50牛津大学发布新研究,探讨人类为何绝大多数是右撇子,并将这一现象与人类学会直立行走的演化过程相关联。该研究为理解人类大脑偏侧化提供了新视角。
Show HN: Forge——护栏机制让 8B 模型在 Agent 任务上从 53% 提升至…Hacker News05-19 20:23开源项目 Forge 展示了通过 Guardrails(护栏机制)大幅提升小型 LLM Agent 任务成功率的方法,让 8B 参数模型在 Agent 任…
Apple 发布新无障碍功能及 Apple Intelligence 更新Hacker News05-19 20:04Apple 宣布新一批无障碍功能,并与 Apple Intelligence 进行了深度集成更新。此次更新扩展了 AI 在辅助功能领域的应用,改善了残障用…
Show HN: 草莓的高斯散射 3D 渲染Hacker News05-19 18:38HN 上展示的一个草莓 Gaussian Splatting 3D 场景效果演示,属于 3D 渲染技术展示。与 AI 编程开发工具无关。
河内的朴素啤酒杯与一个国家的记忆Hacker News05-19 01:45这是一篇关于越南河内 Bia Hoi(鲜啤酒)文化与越南历史记忆的长篇阅读文章,属于人文社科类内容,与 AI 开发工具无关。来自 Hacker News 推荐。
Lisp 在 Web 应用中的使用(2001年)Hacker News05-18 19:51Paul Graham 2001 年关于在 Web 应用中使用 Lisp 的历史文章,在 Hacker News 上重新引发讨论。内容属于编程语言历史话题…
银天鹅机械装置Hacker News05-18 19:00Hacker News 热门链接,介绍英国 Bowes 博物馆收藏的 18 世纪精密机械银天鹅自动机。内容属于机械艺术历史,与 AI 开发工具无关。
可证安全操作系统(PSOS)的理论基础(1979年)Hacker News05-18 17:40Hacker News 热门链接,SRI 1979 年经典论文,奠定了形式化验证操作系统安全性的理论基础。内容属于计算机安全历史文献,与当前 AI 开发工…
世界上最古老的两台印刷机Hacker News05-18 13:01Hacker News 热门链接,介绍比利时 Plantin-Moretus 博物馆收藏的世界现存最古老的两台活字印刷机。内容属于历史文化话题,与 AI …

6. AI 工具/产品

23 条

标题来源日期摘要
通过 Copilot 云 Agent 轻松应用代码审查建议编程助手 - GitHub Copilot (专属)05-20 06:28GitHub Copilot 将代码审查中的“实现建议”按钮重命名为“Fix with Copilot”,并新增 UI 对话框以更灵活地控制建议的应用方式…
OlmoEarth v1.1:更高效的模型系列框架/平台 - Hugging Face (博客)05-20 02:38Allen AI 发布 OlmoEarth v1.1,这是一个针对地球科学领域优化的更高效开源模型系列。发布在 Hugging Face 博客上,属于垂直…
Gemini 3.5 Flash 在 GitHub Copilot 中正式发布编程助手 - GitHub Copilot (专属)05-20 01:56Google 最新的 Gemini 3.5 Flash 模型现已在 GitHub Copilot 中全面上线。根据 GitHub 早期测试,Gemini …
Cline CLI v3.0.8 发布编程助手 - Cline (GitHub Releases)05-20 01:44Cline CLI v3.0.8 更新:修复 Telegram 连接器中重命名用户的 ID 追踪问题,改进插件配置界面中失败插件的显示,将创建会话 For…
Cline v3.84.0 发布编程助手 - Cline (GitHub Releases)05-20 01:17Cline v3.84.0 新增 SAP AI Core 对额外托管模型的支持,修复 MCP 服务器关闭时“重启服务器”按钮的行为,并移除 VS Code…
Gemini 3.5 Flash 登陆 Vercel AI Gateway框架/平台 - Vercel (含 AI SDK)05-19 15:00Vercel AI Gateway 现已支持 Gemini 3.5 Flash 模型,该模型相比前代 Flash 版本在编程能力和并行 Agent 执行方…
Hugging Face 推出 Ettin Reranker 系列模型框架/平台 - Hugging Face (博客)05-19 08:00Hugging Face 推出 Ettin Reranker 系列,这是专为 RAG 检索增强生成流水线设计的 Reranker 模型家族。Reranke…
Vercel 固定费率 CDN 开启限量 Beta 测试框架/平台 - Vercel (含 AI SDK)05-19 08:00Vercel 宣布固定费率 CDN 进入 Pro 团队的限量 Beta 阶段,以固定月费替代按使用量计费模式,覆盖 Edge Requests、Fast …
Copilot 云端 Agent 支持一键修复失败的 GitHub Actions编程助手 - GitHub Copilot (专属)05-19 06:29GitHub Copilot Business 和 Enterprise 用户现在可以通过一键点击让 Copilot 云端 Agent 自动修复失败的 G…
Copilot 云端 Agent 支持为简单任务选择快速低成本模型编程助手 - GitHub Copilot (专属)05-19 05:15GitHub Copilot 云端 Agent 现在支持为简单任务选择快速且具有成本效益的模型。用户在将任务委托给 Copilot 时,可以选择不同模型来…
GitHub Copilot 网页版支持在当前页面上下文中提问编程助手 - GitHub Copilot (专属)05-19 05:11GitHub Copilot 网页端的聊天窗口现在会自动在用户当前浏览的页面上下文中打开,减少切换上下文的需要。这一改进让开发者可以更快速地在 GitHu…
Vercel 支持 GitHub 合并提交状态整合框架/平台 - Vercel (含 AI SDK)05-19 04:42Vercel 推出 Consolidated Commit Status 功能,Monorepo 项目现在可以在 Pull Request 上显示单一整合…
Vercel 防火墙拦截流量免费,不计入账单框架/平台 - Vercel (含 AI SDK)05-19 04:00Vercel 宣布 Web Application Firewall(WAF)拒绝、挑战或限速的流量将不再计入 CDN 请求和快速数据传输费用。这意味着当…
Cline Nightly 版本:SDK 迁移与简化登录编程助手 - Cline (GitHub Releases)05-19 03:45Cline 发布 Nightly 构建版本,本次更新包含 SDK 迁移和简化登录流程的相关改进。这是一个开发中的预发布版本,供测试和早期体验使用。
GitHub Copilot 本地会话远程控制正式发布:从 VS Code 切换到手机继续工作编程助手 - GitHub Blog (全站)05-19 00:54GitHub Copilot 的远程控制功能现已正式发布,用户可以在 VS Code 或 CLI 中开始工作,然后在 github.com 或 GitHu…
通过 REST API 审计仓库的 Copilot 云端 Agent 配置编程助手 - GitHub Copilot (专属)05-19 00:43GitHub 发布新的 REST API(公开预览),允许用户以编程方式审计仓库的 Copilot 云端 Agent 配置,便于企业对大量仓库的 Copi…
Copilot Spaces API 正式发布编程助手 - GitHub Copilot (专属)05-19 00:07GitHub Copilot Spaces API 现已正式发布,开发者可通过 API 以编程方式创建、读取、更新和删除 Spaces,支持将 Space…
使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 实现机器人…框架/平台 - Hugging Face (博客)05-19 00:00NVIDIA 在 HuggingFace 博客分享了如何使用 LoRA/DoRA 对 Cosmos Predict 2.5 模型进行微调,专门针对机器人视…
PaddleOCR 3.5:使用 Transformers 后端运行 OCR 和文档解析框架/平台 - Hugging Face (博客)05-18 23:12PaddleOCR 3.5 版本支持使用 HuggingFace Transformers 作为推理后端,使开发者可以在统一的 Transformers …
开放 Agent 排行榜框架/平台 - Hugging Face (博客)05-18 22:12IBM Research 与 Hugging Face 联合发布开放 Agent 排行榜,对各类开源 LLM Agent 的能力进行标准化评测。该排行榜旨…
Copilot CLI 远程控制功能正式 GA,支持移动端、Web 和 VS Code编程助手 - GitHub Copilot (专属)05-18 21:00GitHub Copilot CLI 会话的远程控制功能正式全面可用(GA),支持 GitHub Mobile、github.com 和 VS Code。…
GPT-5.3-Codex 成为 Copilot Business 和 Enterprise …编程助手 - GitHub Copilot (专属)05-18 12:01GitHub 官方公告,GPT-5.3-Codex 正式替换 GPT-4.1 成为所有 Copilot Business 和 Enterprise 组织的…
Cline CLI v3.0.7 发布编程助手 - Cline (GitHub Releases)05-18 09:02Cline CLI 发布 v3.0.7,跳过启动时 ChatGPT OAuth 模型刷新以加快启动速度,并对齐 ChatGPT OAuth 模型目录与 C…

7. GitHub 开源项目 Releases(Atom Feed)

34 条

标题来源日期摘要
Ollama v0.30.0 发布候选版推理引擎 & 本地 AI - Ollama05-20 06:02Ollama v0.30.0 重大架构更新:直接支持 llama.cpp 而非在 GGML 基础上构建,并兼容 GGUF 文件格式。同时引入 MLX 加速…
Langflow v1.10.0.dev40 夜间版发布AI 框架 & 编排 - Langflow05-20 01:36Langflow 发布 v1.10.0.dev40 nightly 开发版本。Langflow 是可视化 LLM 应用编排框架,此为日常开发构建,无具体更…
Unsloth v0.1.41-beta:MTP 与 Studio 修复更新基座模型 / LLM - Unsloth05-19 22:49Unsloth v0.1.41-beta 发布,主要包含大量 Bug 修复、UI 和 UX 优化。支持通过一行 curl 命令在 macOS、Linux、…
Unsloth v0.1.405-beta:Qwen3.6 MTP 与 API 连接支持基座模型 / LLM - Unsloth05-19 22:29Unsloth v0.1.405-beta 发布重要更新:通过自动启用 MTP 实现约 2 倍 GGUF 推理加速,新增 API 调用支持,可连接 Qwe…
Langflow v1.10.0.dev39 夜间构建版AI 框架 & 编排 - Langflow05-19 22:04Langflow 发布夜间开发构建版本 v1.10.0.dev39,无详细 Changelog。
Langflow v1.10.0.dev38 夜间构建版AI 框架 & 编排 - Langflow05-19 21:22Langflow 发布夜间开发构建版本 v1.10.0.dev38,无详细 Changelog。
n8n v2.21.4 发布AI 框架 & 编排 - n8n05-19 20:10n8n 工作流自动化平台发布 v2.21.4,本次主要为 CI 修复,无详细更新日志。
n8n v2.22.0 发布AI 框架 & 编排 - n8n05-19 20:10n8n 工作流自动化平台发布 v2.22.0,主要修复 Bug,包括为 Switch 节点的 fallback 输出添加工作流构建器引导。
n8n v2.20.12 发布AI 框架 & 编排 - n8n05-19 19:05n8n 工作流自动化平台发布 v2.20.12,本次主要为 CI 修复,无详细更新日志。
Dify v1.14.2:安全修复、Agent 基础、工作流稳定性与部署更新AI 框架 & 编排 - Dify05-19 13:34Dify v1.14.2 是专注安全加固的补丁版本,强化了租户隔离,修复工作流和知识库可靠性问题,并为 Agent 功能打下基础架构。同时改进了可观测性和…
Jan v0.8.0 发布推理引擎 & 本地 AI - Jan05-19 12:28本地 AI 客户端 Jan 发布 v0.8.0 版本,无详细更新说明。Jan 是一款开源的本地 AI 运行工具,支持离线使用各类开源模型。
OpenAI Agents Python SDK v0.17.3 发布AI Agent 框架 - OpenAI Agents SDK05-19 09:27OpenAI Agents Python SDK 发布 v0.17.3,修复了沙箱命令中凭证泄露的安全问题,防止挂载点凭证被包含在沙箱执行命令中。这是一个…
browser-use v0.12.7 发布AI Agent 框架 - browser-use05-19 09:11browser-use 发布 v0.12.7,主要包含 CLI 的重大更新。browser-use 是一个让 AI Agent 能够控制浏览器的开源框架。
Pydantic AI v1.98.0 发布AI Agent 框架 - Pydantic AI05-19 09:08Pydantic AI v1.98.0 新增 OpenAI Responses 输入 token 计数功能(OpenAIResponsesModel.co…
llama.cpp b9222 构建版本发布推理引擎 & 本地 AI - llama.cpp05-19 08:31llama.cpp 发布 b9222 构建,新增 hexagon 后端对 TRI 算子的支持,持续推进高通 Hexagon DSP 硬件加速能力。
llama.cpp b9221 版本发布推理引擎 & 本地 AI - llama.cpp05-19 07:18llama.cpp 发布 b9221 版本,主要新增 ggml-hexagon PAD 操作的 HVX 内核支持,针对高通骁龙硬件加速进行了优化。这是 l…
LangChain langchain-tests 1.1.8 发布AI 框架 & 编排 - LangChain05-19 05:33LangChain 发布 langchain-tests 1.1.8 版本,这是一个热修复版本,主要修复了 langchain-core 的版本约束范围问…
llama.cpp b9219 版本发布推理引擎 & 本地 AI - llama.cpp05-19 03:26llama.cpp 发布 b9219 版本,主要移除了 HuggingFace 缓存迁移相关代码,进行了内部清理优化。这是日常维护性更新版本。
CrewAI 1.14.5 发布:弃用旧执行器并增强 Sandbox 工具AI Agent 框架 - CrewAI05-19 03:19CrewAI 发布 1.14.5 版本,废弃了 CrewAgentExecutor 并将默认 Agent 切换到 AgentExecutor,同时改进了 …
llama.cpp b9216 版本发布推理引擎 & 本地 AI - llama.cpp05-19 02:24llama.cpp 发布 b9216 版本,主要对 UI 进行了重构,包括模型存储、MCP 服务的优化,并将日志功能放在 VITE_DEBUG 开关后。这…
llama.cpp b9213 版本发布推理引擎 & 本地 AI - llama.cpp05-19 01:49llama.cpp 发布 b9213 版本,主要修复了预归一化 embedding mask 标志的初始化问题,这是一个针对模型兼容性的小补丁更新。
Ollama v0.30.0-rc20 候选版本发布推理引擎 & 本地 AI - Ollama05-19 00:55Ollama 发布 v0.30.0 的第 20 个候选版本,主要修复了 ROCm(AMD GPU)构建时的缓存命中失效问题。这是 v0.30.0 正式版发…
text-generation-webui v4.8 发布:重新设计的聊天输入框推理引擎 & 本地 AI - text-generation-webui05-19 00:53text-generation-webui 发布 v4.8 版本,主要更新是重新设计了聊天输入界面,包括更高的输入区域和改进的文件附件功能(回形针图标)。…
Ollama v0.30.0-rc19 候选版本发布推理引擎 & 本地 AI - Ollama05-18 22:57Ollama 发布 v0.30.0 的第 19 个候选版本,修复了一个文件缺失问题。这是 v0.30.0 正式版发布前的预发布版本。
Ollama v0.30.0-rc18 发布推理引擎 & 本地 AI - Ollama05-18 22:33Ollama 发布 v0.30.0-rc18 候选版本,本次更新为版本号提升,无详细变更说明。Ollama 是主流的本地 LLM 推理引擎,支持多种开源模…
n8n 2.20.11 发布AI 框架 & 编排 - n8n05-18 21:55n8n 工作流自动化平台发布 2.20.11 版本,修复 VM 求值器中空表达式解析为空字符串的 Bug。n8n 是广泛用于 AI Agent 编排的低代…
Unsloth v0.1.40-beta 发布基座模型 / LLM - Unsloth05-18 21:30Unsloth 发布 v0.1.40-beta 版本,修复 Studio/Chat 中 IME 输入法结束事件未触发时的标志位残留问题。Unsloth 是…
CrewAI 1.14.5a7 发布AI Agent 框架 - CrewAI05-18 21:13CrewAI 发布 1.14.5a7 版本,重要变更包括废弃 function_calling_llm 字段。CrewAI 是流行的多 Agent 协作框…
n8n 1.123.44 发布AI 框架 & 编排 - n8n05-18 19:43n8n 1.x 稳定版发布 1.123.44,重要修复包括 vm2、protobufjs、langsmith 等依赖的 11 个关键安全问题。对在生产环境…
llama.cpp b9209 发布推理引擎 & 本地 AI - llama.cpp05-18 17:26llama.cpp 发布 b9209 版本,包含 SYCL 后端 Q6_K MMVQ 点积的标量 SWAR 字节减法优化。llama.cpp 是最主流的本…
llama.cpp b9208 发布推理引擎 & 本地 AI - llama.cpp05-18 16:23llama.cpp 发布 b9208 版本,将小规模 f32 矩阵乘法路由到 oneMKL 而非 oneDNN 以提升 SYCL 后端性能。属于底层计算后…
Langflow v1.10.0.dev37 每晚构建版发布AI 框架 & 编排 - Langflow05-18 08:57Langflow 发布 v1.10.0.dev37 每晚开发版,无详细变更说明。Langflow 是基于 LangChain 的可视化 AI 工作流构建平…
llama.cpp b9204 发布推理引擎 & 本地 AI - llama.cpp05-18 08:44llama.cpp 发布 b9204 版本,新增对 SSM 卷积 d_conv=15 参数的支持。属于模型兼容性扩展更新。
llama.cpp b9203 发布推理引擎 & 本地 AI - llama.cpp05-18 08:20llama.cpp 发布 b9203 版本,修复 CMake 构建系统中 LLAMA_BUILD_UI 逻辑错误。属于构建系统 Bug 修复。

8. AI 公司产品更新 / Changelog

38 条

标题来源日期摘要
Claude Code v2.1.145 发布Anthropic - Claude Code (GitHub Releases)05-20 05:31Claude Code v2.1.145 新增 claude agents --json 命令,可将当前 Claude 会话列表以 JSON 格式输出…
Claude Code v2.1.144 发布Anthropic - Claude Code (GitHub Releases)05-20 04:38Claude Code v2.1.144 为后台会话新增 /resume 支持,通过 claude --bg 启动的会话现在会在列表中显示并标记 …
Amazon MWAA 现已支持 Apache Airflow 3.2Amazon - AWS What’s New05-20 04:00Amazon MWAA(托管 Apache Airflow 服务)现已支持 Airflow 3.2,带来数据感知调度和开发者生产力改进。这是 AWS 数据…
公开预览:使用 Azure App Configuration Scorecards 评估功能…Microsoft - Azure 服务更新(含 AI)05-20 01:15Azure App Configuration 新增 Scorecards 能力公开预览,提供基于遥测数据的特性标志变体性能视图,帮助团队在发布后无需手动…
正式发布:Azure NetApp Files 缓存卷Microsoft - Azure 服务更新(含 AI)05-20 01:00Azure NetApp Files 缓存卷功能正式上线,作为外部源卷的云端缓存,仅保存最活跃访问的数据。这是 Azure 存储基础设施更新,与 AI 开…
Amazon Inspector 现已在 AWS 亚太(台北)区域上线Amazon - AWS What’s New05-20 01:00AWS 宣布 Amazon Inspector 安全漏洞扫描服务现已在亚太(台北)区域上线,支持 EC2、容器镜像和 Lambda 函数的安全扫描。这是 …
Amazon ECS 引入服务部署暂停和继续控制Amazon - AWS What’s New05-20 01:00Amazon ECS 新增在部署关键阶段暂停和继续部署的能力,支持手动审批工作流、运营检查和集成测试等场景。这是 AWS 容器服务的实用功能更新,对 AI…
正式发布:Azure 虚拟网络更新——NSG 和路由表默认限制提升Microsoft - Azure 服务更新(含 AI)05-20 00:45Azure 虚拟网络提升了网络安全组(NSG)和路由表的默认平台限制,新上限分别为每个 NSG 2000 条安全规则、每条 NSG 规则 6000 个地址…
正式发布:Network Watcher 规则影响分析器Microsoft - Azure 服务更新(含 AI)05-20 00:45Azure Network Watcher 规则影响分析器正式上线,允许在应用 NSG 或安全管理规则更改之前,评估其对实时网络流量的潜在影响。这是 Az…
正式发布:Azure Storage Actions 模拟运行——执行前先验证Microsoft - Azure 服务更新(含 AI)05-20 00:00Azure Storage Actions 新增模拟运行功能,可在不修改任何数据的情况下全规模模拟任务执行效果。这帮助团队在真正执行数据管理任务前验证逻辑…
anthropic-sdk-python v0.103.1 发布Anthropic - anthropic-sdk-python05-19 23:43Anthropic Python SDK v0.103.1 修复了 SessionToolRunner 不拥有的工具调用被错误处理的 bug。这是 r…
anthropic-sdk-typescript v0.97.1 发布Anthropic - anthropic-sdk-typescript05-19 23:40Anthropic TypeScript SDK v0.97.1 修复了 SessionToolRunner 不拥有的工具调用被错误处理的 bug,与…
用 Amazon Nova Sonic 构建可扩展语音 Agent:多 Agent、工具调用与…Amazon - AWS Machine Learning Blog05-19 23:26本文介绍如何利用 Amazon Nova Sonic、Amazon Bedrock AgentCore 和 Strands BidiAgent 构建可扩展…
使用 Amazon Bedrock AgentCore Memory 为 Kiro CLI 扩…Amazon - AWS Machine Learning Blog05-19 23:23本文演示如何通过实现自定义 MCP 服务器将 Kiro CLI 与 Amazon Bedrock AgentCore Memory 集成,赋予 AI Ag…
Amazon SageMaker Feature Store 新功能加速 ML 特征流水线Amazon - AWS Machine Learning Blog05-19 23:20AWS 宣布 SageMaker Python SDK v3.8.0 新增三项功能,包括 Lake Formation 治理和 Iceberg 表属性支持…
在 Amazon Bedrock 上实现编程式工具调用Amazon - AWS Machine Learning Blog05-19 23:17本文介绍在 Amazon Bedrock 上实现编程式工具调用(PTC)的三种方案:ECS 上自托管 Docker 沙箱以获得最大控制权、使用 Bedro…
消除 LLM 冷启动:用 Azure Blob Storage 和 Run:AI Model …Microsoft - Azure SDK Blog05-19 23:00文章介绍利用 Run:AI Streamer 将模型权重从 Azure Blob Storage 直接流式加载到 GPU 显存,避免传统冷启动时先写磁盘再…
Amazon Managed Grafana 现支持双栈网络连接(IPv6 和 IPv4)Amazon - AWS What’s New05-19 23:00Amazon Managed Grafana 新增双栈网络支持,工作区可同时通过 IPv4 和 IPv6 通信,适用于 Grafana 10.4 及以上版…
Anthropic TypeScript SDK Bedrock 版 v0.29.2 发布Anthropic - anthropic-sdk-typescript05-19 15:09Anthropic TypeScript SDK Bedrock 子包发布 v0.29.2,修复了子包中 @types/node 版本对齐问题以解决 CI…
Anthropic TypeScript SDK Vertex 版 v0.16.1 发布Anthropic - anthropic-sdk-typescript05-19 15:09Anthropic TypeScript SDK Vertex 子包发布 v0.16.1,修复了子包中 @types/node 版本对齐问题以解决 CI …
Anthropic TypeScript SDK v0.97.0 发布Anthropic - anthropic-sdk-typescript05-19 15:09Anthropic TypeScript SDK 发布 v0.97.0,新增重要功能:在 CMA(Claude Managed Agents)中支持自托管…
Anthropic Python SDK v0.103.0 发布Anthropic - anthropic-sdk-python05-19 15:07Anthropic Python SDK 发布 v0.103.0,新增在 CMA(Claude Managed Agents)中支持自托管沙箱的功能,并提…
AWS 管理控制台区域选择器新增 Local Zones 显示Amazon - AWS What’s New05-19 05:50AWS 管理控制台的区域选择器现在将 AWS Local Zones 与常规区域统一展示,提供一体化导航体验。用户可在控制台顶部导航的 Local Zon…
AWS Glue zero-ETL 现已在亚太(孟买)区域上线Amazon - AWS What’s New05-19 05:10AWS Glue zero-ETL 集成现已在亚太(孟买)区域正式可用,帮助该地区客户简化数据管道、降低数据移动延迟,并加速分析和机器学习工作负载的数据洞察。
使用 Amazon Nova 2 进行内容审核的 Prompt 技巧Amazon - AWS Machine Learning Blog05-19 02:56本文介绍如何通过结构化和自由格式的 Prompt 方法,利用 Amazon Nova 2 Lite 进行内容审核,基于 MLCommons AILumin…
Amazon Lightsail CDN 现支持以仅 IPv6 实例作为源站Amazon - AWS What’s New05-19 02:49Amazon Lightsail CDN 分发现在支持将仅 IPv6 实例作为源站,使客户能够在节省成本的同时通过 CDN 向所有用户提供内容,包括不支持…
正式发布:Azure AKS 应用 Application Insights 自动插桩Microsoft - Azure 服务更新(含 AI)05-19 02:00Azure Monitor Application Insights 针对 Azure Kubernetes Service(AKS)的自动插桩功能现已正…
正式发布:Microsoft Marketplace SaaS 订阅自动激活Microsoft - Azure 服务更新(含 AI)05-19 02:00Microsoft Marketplace 现已支持 SaaS 解决方案的自动激活功能,购买完成后立即开始订阅和计费周期,无需手动激活步骤,加快了 Saa…
Amazon EVS 单环境支持主机数量翻倍至 32 台Amazon - AWS What’s New05-19 01:55Amazon Elastic VMware Service(EVS)现在每个环境最多支持 32 台 ESXi 主机,是此前 16 台限制的两倍。用户可以灵…
正式发布:Azure Front Door WebSocket 支持Microsoft - Azure 服务更新(含 AI)05-19 01:45Azure Front Door Standard 和 Premium 版本现已正式支持 WebSocket,默认启用无需额外配置。WebSocket 通…
Aderant 借助 Amazon Quick 转型云运营:搜索提速 90%Amazon - AWS Machine Learning Blog05-19 01:26Aderant 使用 Amazon Quick 的 AI 能力统一了六个供应商系统的搜索功能,并自动化了文档工作流,实现搜索速度提升 90%、文档处理加速…
AWS SAM CLI 支持 CloudFormation Language Extensio…Amazon - AWS What’s New05-19 00:31AWS SAM CLI 现在支持 AWS CloudFormation Language Extensions,允许开发者在 IaC 模板中减少重复代码,…
Amazon Redshift 支持 Iceberg 表 ALTER TABLE 及通过 Gl…Amazon - AWS What’s New05-19 00:25Amazon Redshift 现在支持通过 AWS Glue Data Catalog 挂载点直接写入 Apache Iceberg 表,并支持 ALT…
将 Atlassian Confluence Cloud 集成到 Amazon QuickAmazon - AWS Machine Learning Blog05-18 23:37本文介绍如何将 Confluence Cloud 与 Amazon Quick 集成,包括创建语义搜索知识库、设置 Actions 查询和管理 Confl…
在 Amazon Bedrock AgentCore 中构建基于代码的自定义评估器Amazon - AWS Machine Learning Blog05-18 23:07本文介绍如何在 Amazon Bedrock AgentCore 中实现四种基于 Lambda 的自定义代码评估器,用于金融市场智能 Agent 的评测。…
Amazon SageMaker Studio 支持通过弹性训练计划预留 GPU 算力Amazon - AWS What’s New05-18 23:00Amazon SageMaker Studio(包括 JupyterLab 和 Code Editor)现在支持通过 SageMaker Flexible…
AWS Secrets Manager Agent 新增预取和 IAM 角色承担功能Amazon - AWS What’s New05-18 15:00AWS Secrets Manager Agent 新增两项能力:启动时预取 secrets 以降低应用启动延迟、支持通过 IAM 角色承担来获取跨账号 …
Google GenAI Python SDK v2.4.0 发布Google - Google GenAI Python SDK05-18 08:05Google GenAI Python SDK 发布 v2.4.0,新增对 Agent 和 Environment API 的支持,并修复多轮对话中非文本…

9. AI 从业者访谈 / 播客

4 条

标题来源日期摘要
IBM 的 Oliver Dial:量子优势今年将实现英文播客 - Eye on AI05-20 03:26IBM 量子系统副总裁 Oliver Dial 在播客中介绍量子计算的真实现状:2023 年已实现量子应用,2026 年目标是量子优势,完整纠错机器预计 …
Ben Horowitz 谈 AI 基础设施、经济学与软件新规律英文播客 - AI + a16z05-19 18:00a16z 联创 Ben Horowitz 在 Fintech Connect 大会上,与 Alex Rampell 深度探讨 AI 如何重写软件竞争的基本…
下一场战争已经开始,西方尚未准备好——Latent Space 播客特刊英文播客 - Latent Space Podcast05-18 21:45Latent Space 播客特刊,嘉宾主持 Noah Smith 与 AI 无人机公司创始人 Yaroslav Azhnyuk 深度对谈两小时,覆盖无人…
英伟达 GEAR 研究员高深远:世界模型、自进化循环与 DreamDojo中文播客 - 晚点聊 LateTalk05-18 08:45晚点聊播客第 165 期,英伟达 GEAR 具身智能实验室研究员高深远深度解析世界模型全景:分类体系、解决问题、发展瓶颈与各公司技术路线。后半段聚焦 GE…

10. YouTube AI 频道

17 条

标题来源日期摘要
这些食物正在摧毁你的身体泛访谈频道(混合内容,需按 AI 相关性评分过滤) - The Diary of a CEO (Steven Bartlett)05-19 23:09The Diary of a CEO 频道健康类短视频,与 AI 或技术无关。
国防是下一个万亿美元赛道吗?| a16z 美国活力峰会泛访谈频道(混合内容,需按 AI 相关性评分过滤) - a16z05-19 22:30a16z 美国活力峰会视频,探讨国防领域是否会成为下一个万亿美元级别的投资赛道。内容聚焦于科技与国防的交叉,与 AI 编程工具相关性较低。
我们把 Facebook House 变成了一个增长黑客案例泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-19 22:0020VC 频道短视频,内容关于 Facebook House 增长策略案例,与 AI 技术无关。
从酒店出租车到劳斯莱斯泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-19 15:05Nikhil Kamath 频道短视频,内容与 AI 技术无关,属于生活娱乐类内容。
停止假装成别人泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-19 13:44Nikhil Kamath 频道励志类短视频,与 AI 技术无关。
从 Rampur 酒厂到 Radico 的品牌演变泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-19 13:19Nikhil Kamath 频道商业类短视频,介绍印度品牌 Radico 的发展历程,与 AI 无关。
为何大多数创始人太早放弃泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-19 13:0020VC 频道励志类短视频,讨论创业者坚持的重要性,与 AI 技术无关。
「我把赚的钱全部用来买地」泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-19 02:0020VC 频道发布的短视频内容,主题为个人财富管理和土地投资策略。与 AI 技术开发无关,属于泛访谈频道的非 AI 内容。
Anthropic 正在全面领先?Matthew Berman05-19 00:30Matthew Berman 发布的 YouTube Shorts 视频,探讨 Anthropic 在 AI 竞争中的强势表现。作为 AI 工具评测频道,…
为什么睡眠香氛品牌难以成为习惯泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-18 23:40Nikhil Kamath 频道发布的关于消费品习惯养成的短视频,讨论睡眠香氛品牌的营销挑战。与 AI 开发工具完全无关,属于泛访谈频道的非 AI 内容。
创始人如何为执法和急救人员打造产品 | a16z Show泛访谈频道(混合内容,需按 AI 相关性评分过滤) - a16z05-18 22:30a16z 节目探讨创业者如何为执法部门和急救人员构建科技产品,内容涉及政府采购、监管合规等创业挑战。该内容与 AI 开发工具关联性较低,属于泛创业访谈内容。
四季酒店里的独行加速器泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-18 22:1420VC 短视频内容,讲述一位独立运营加速器项目的创业故事。内容与 AI 开发工具无关,属于泛创业话题。
四季酒店独行加速器与 VC 风险 | Josh Browder 访谈泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-18 22:0320VC 对 Josh Browder 的长篇访谈,讨论加速器模式与 VC 生态的利弊。内容以创业融资话题为主,与 AI 开发工具关联度低。
Anarc 智能手表出了什么问题?泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-18 15:44Nikhil Kamath 频道短视频,分析 Anarc 智能手表产品失败的原因。内容属于消费电子产品评测,与 AI 开发工具完全无关。
糖科医生警告:悄悄摧毁你身体的“健康”食品泛访谈频道(混合内容,需按 AI 相关性评分过滤) - The Diary of a CEO (Steven Bartlett)05-18 15:00The Diary of a CEO 频道健康类视频,Dr David Unwin 讲解被误认为健康实则有害的食物。内容与 AI 开发工具完全无关,属于泛…
只有开得够多买电动车才划算泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-18 14:36Nikhil Kamath 频道短视频,分析电动车的经济账。内容与 AI 开发工具完全无关,属于消费决策话题。
Whoop 是最好的运动追踪器吗?泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-18 13:54Nikhil Kamath 频道短视频,评测 Whoop 运动追踪器。内容与 AI 开发工具完全无关,属于消费电子评测。

11. AI 研究

48 条

标题来源日期摘要
ESI-Bench:面向闭合感知-行动循环的具身空间智能基准HuggingFace 每日论文05-19 01:59提出了 ESI-Bench 基准,重新定义空间智能评估框架,将观察者视为主动行动者而非被动感知者。Agent 需要通过主动行动获取观察数据,揭示被遮挡的结…
PIXLRelight:通过内在条件实现可控单图重新打光HuggingFace 每日论文05-19 01:55提出 PIXLRelight,一种基于前向传播的单图可控重新打光方法,通过共享内在条件桥接物理渲染和学习图像合成。该方法避免了现有方法的误差累积问题,无需…
EgoExoMem:同步第一人称与第三人称视频的跨视角记忆推理HuggingFace 每日论文05-19 01:54提出 EgoExoMem 基准,首次针对同步第一人称(egocentric)和第三人称(exocentric)视频进行跨视角记忆推理评估,包含 2600 …
经典规划中学习通用策略的高效前瞻编码与抽象宽度HuggingFace 每日论文05-19 01:15研究改进了基于迭代宽度(IW)策略的广义规划方法,通过前瞻搜索让策略能跳跃多个状态转换,简化问题结构。结合 Graph Neural Network 方法…
GIM:通过跨认知领域集成任务评估 LLM 能力的新基准HuggingFace 每日论文05-19 01:09提出 Grounded Integration Measure(GIM)基准,包含 820 道原创题目,难度来自需要同时整合多个认知领域的复杂性,而非单纯…
SPIKE:面向开放世界游戏的低成本长周期 Agent 双控制器框架HuggingFace 每日论文05-19 00:43提出 SPIKE 框架,通过自适应双控制器架构解决开放世界游戏中长周期多模态 Agent 的 token 预算和延迟挑战。核心思路是在局部稳定阶段复用战略…
CATA:基于冲突规避任务算术的持续机器遗忘方法HuggingFace 每日论文05-19 00:21研究面向视觉语言模型(VLM)的持续机器遗忘问题,即在部署过程中响应序列化的内容删除请求。提出 CATA 方法,通过冲突规避的任务算术在连续遗忘过程中维持…
小批量 SGD 结合经典动量加速的完美并行化理论HuggingFace 每日论文05-19 00:18研究从理论层面揭示了经典动量(如 Polyak 重球法)在随机小批量优化中的效果,以往工作需要强噪声假设和超大批量才能分析,本研究在更宽松条件下证明了更好…
MA²P:面向复杂说服场景的元认知自主智能 Agent 框架HuggingFace 每日论文05-18 23:53提出 MA²P 框架,专为复杂说服对话场景设计,Agent 需要解读对方的潜在心理状态(信念、欲望)并制定针对性的说服策略。该研究对需要构建谈判、咨询或行…
自监督局部学习规则揭示高维数据的隐式层级结构HuggingFace 每日论文05-18 23:37研究探索了生物学上合理的神经网络局部学习规则,分析其如何从高维感知输入中学习抽象层级表示,绕过了反向传播的生物不可行性。在随机层级模型(RHM)数据集上验…
Key-Gram:面向具身操作的可扩展世界知识框架HuggingFace 每日论文05-18 23:37提出 Key-Gram 条件记忆框架,将语言知识与视觉计算分离,解决视觉语言行动策略中模态竞争问题。通过独立的语言知识扩展路径,无需更新视觉骨干网络即可扩…
向量 RAG 与 LLM 编译 Wiki 的预注册对比研究HuggingFace 每日论文05-18 22:41本文对两种 LLM 问答增强方式进行了预注册对比:单轮向量 RAG 系统与 LLM 编译的 Markdown Wiki。两套系统用同一模型回答跨越 24 …
可解释的程序化强化学习调度框架HuggingFace 每日论文05-18 22:19本文提出一种可解释的程序化强化学习(RL)框架用于作业调度问题,解决深度 RL 策略黑箱不透明问题。通过程序化策略表示,使人类决策者能够理解和信任 RL …
多机器人协作第一视角空间推理研究HuggingFace 每日论文05-18 22:04本文研究多机器人协作动态空间推理问题,通过多模态 LLM 整合多个机器人的同步第一视角视频进行空间、时序和协调推断。研究引入了 CoopSR 基准数据集,…
球谐函数最优传输:气候模型比较应用HuggingFace 每日论文05-18 21:36本文研究基于热核的球面流形上最优传输算法,建立热核代价收敛到最优传输代价的理论性质。主要应用场景为气候模型的比较,属于应用数学与计算几何交叉研究,与 AI…
基于 Koopman 算子模型预测控制的动态机器人折叠布料HuggingFace 每日论文05-18 21:21本文提出基于 Koopman 算子的高效模型预测控制方法,解决机器人动态折叠布料的难题。通过数据驱动方式建模布料动力学,实现快速运动下的精准轨迹规划。属于…
PH-Dreamer:基于 Port-Hamiltonian 生成动力学的物理驱动世界模型HuggingFace 每日论文05-18 20:20本文提出 PH-Dreamer,将 Port-Hamiltonian 物理结构嵌入循环状态空间世界模型,通过三种协同机制确保生成动力学遵循能量守恒和耗散原…
从数量到价值:面向端侧 RAG 的偏好对齐记忆构建HuggingFace 每日论文05-18 20:06本文提出 EPIC 系统,为端侧个人 AI Agent 在有限存储预算下构建与用户偏好对齐的记忆,解决设备端 RAG 的存储效率问题。研究聚焦隐私敏感场景…
高效长上下文生成的上下文记忆化技术HuggingFace 每日论文05-18 19:12本文针对 LLM 长前缀推理的两大问题(影响随距离衰减、注意力计算线性扩展)提出上下文记忆化方法,通过将前缀内化到模型参数中实现高效推理。该研究对提升 L…
仅用 RGB 相机的室内移动机器人主动三维场景图生成HuggingFace 每日论文05-18 18:37本文提出仅依赖 RGB 相机(无需 LiDAR 或 RGB-D)的主动三维场景图生成方法,支持移动机器人在室内场景主动选择最优视角进行实时建图。该工作降低…
成对偏好奖励与分组多样性增强的开放域生成方法HuggingFace 每日论文05-18 18:31本文提出结合成对偏好奖励与分组多样性增强的 RL 训练方法,解决开放域文本生成中的可验证性难题和多样性崩溃问题。该研究改进了 RLVR 在创意写作等开放域…
PPAI:面向协作边缘智能的个性化 LLM Agent 互操作系统HuggingFace 每日论文05-18 16:49本文提出 PPAI,首个支持边缘设备上个性化 LLM Agent 点对点协作的互操作系统,允许用户将超出本地能力的任务委托给远端更适合的 Agent。研究…
DocOS:面向 GUI Agent 的主动文档引导行动框架HuggingFace 每日论文05-18 16:36本文提出 DocOS,让 GUI Agent 主动利用程序文档(而非依赖预训练知识)来处理长尾任务,避免低效的试错探索。该工作为 GUI 自动化 Agen…
Föllmer 过程与去噪扩散概率模型的联系HuggingFace 每日论文05-18 16:31本文从理论角度分析 Föllmer 过程与 DDPM 反向 SDE 的深层联系,将 Föllmer 过程解释为反向 SDE 的增广时间压缩版本。属于扩散模…
零阶硬阈值方差缩减新见解:缓解梯度误差与扩张性矛盾HuggingFace 每日论文05-18 16:24本文针对零阶(ZO)梯度下的 L0 稀疏约束优化问题进行理论改进,解决现有 SZOHT 算法对随机方向数量限制的瓶颈。属于纯数学优化理论研究,与 AI 开…
TeleCom-Bench:LLM 距离工业电信应用还有多远?HuggingFace 每日论文05-18 16:14本文提出 TeleCom-Bench,首个面向工业电信场景的 LLM 评测框架,覆盖端到端工业流程和设备专有文档,填补现有电信 LLM 评测标准化的空缺。…
TinySAM 2:极致内存压缩的高效 SAM 2 视频追踪模型HuggingFace 每日论文05-18 16:05本文提出 TinySAM 2,通过极致内存压缩技术大幅降低 SAM 2(Segment Anything Model 2)的部署门槛,解决其多阶段图像编码…
面向可持续增长的电商搜索多价值感知检索框架HuggingFace 每日论文05-18 15:50本文针对大规模电商平台新商品冷启动问题,提出多价值感知检索框架(MVR),解决现有系统对热门商品的马太效应偏向。通过对齐训练目标与在线业务指标并量化商品增…
LivePI:更真实的 Agent 间接提示注入攻击基准测试HuggingFace 每日论文05-18 15:41本文提出 LivePI 基准,在真实生产工作流中评测 AI Agent 对间接提示注入(IPI)攻击的抵御能力,覆盖邮件、文件、网页、代码库等多种攻击渠道…
LLM 赋能贝叶斯优化:偏好引导的科学发现框架HuggingFace 每日论文05-18 15:30本文提出 LLM 引导的贝叶斯优化(LGBO),利用 LLM 先验知识解决贝叶斯优化冷启动慢和高维扩展性差的问题,加速科学实验优化。属于 AI for S…
SVFSearch:游戏垂直领域短视频帧搜索多模态知识密集型基准HuggingFace 每日论文05-18 15:03本文提出 SVFSearch,首个面向中国游戏垂直领域的短视频帧搜索开放基准,评测多模态 LLM 在视觉模糊、长尾领域知识密集场景下的检索推理能力。属于多…
BacktestBench:LLM 自动量化策略回测评测基准HuggingFace 每日论文05-18 14:52本文提出 BacktestBench,首个专门用于评测 LLM 在量化策略自动回测中能力的大规模基准,覆盖代码生成、工具调用和 Agent 规划等复杂交叉…
PanoWorld:一致性全屋全景合成的生成式空间世界模型HuggingFace 每日论文05-18 14:25本文提出 PanoWorld,基于平面图和风格参考自回归生成整栋房屋 VR 全景漫游,通过节点图空间世界模型解决跨视角几何和材质一致性问题。在 3D 场景…
伦理超速(EHV):面向 Agent 系统的可证确定性治理感知 JIT 编译器架构HuggingFace 每日论文05-18 14:15本文提出 EHV 架构,将 AI 治理策略执行点前移到 JIT 编译层实现运行时形式化验证,相比现有审计框架的 14-30 天延迟有显著改进。探索 AI …
LAST-RAG:文献锚定随机轨迹 RAG 用于知识条件退化模型选择HuggingFace 每日论文05-18 14:07本文提出 LAST-RAG,将 RAG 与随机过程退化模型选择结合,通过文献锚定机制在短观测窗口下选择物理一致性更强的退化模型。属于工业预测性维护的专业研…
KISS:科学仿真知识基础设施——地球科学 Agent 脚手架HuggingFace 每日论文05-18 12:57本文提出 KISS 知识基础设施,将专家知识外化为 Agent 可操作的建模算子、分阶段领域协议和诊断恢复机制,显著提升地球科学仿真中 AI Agent …
大规模扩散模型蒸馏的 MeanFlow 稳定化与增强HuggingFace 每日论文05-18 12:16本文针对 MeanFlow 扩散蒸馏方法的优化不稳定性和“均值寻求偏差”问题进行改进,使其可扩展到大规模工业扩散模型蒸馏。该研究有助于降低扩散图像模型的推…
记得越多,风险越大:带记忆 LLM Agent 的纵向安全风险HuggingFace 每日论文05-18 12:06本文研究带持久记忆的 LLM Agent 在长时间服务多个独立任务时的安全风险,发现早期任务积累的记忆会影响后续不相关任务的行为。这一发现对构建生产级 A…
通过微分独立性实现内容-风格识别HuggingFace 每日论文05-18 12:01本文研究多域观测数据中内容变量与风格变量的可识别性理论,在放宽独立性假设的条件下建立新的可识别性条件。属于生成模型理论研究,对域迁移和反事实生成有理论基础价值。
面向低活跃用户的不确定性校准推荐HuggingFace 每日论文05-18 11:11本文针对大规模短视频和直播平台,通过量化模型不确定性来平衡低活跃用户(LAU)的推荐可靠性与高活跃用户(HAU)的多样性。研究在真实工业推荐系统中有效降低…
自蒸馏在尖峰协方差模型谱收缩估计量中的最优性HuggingFace 每日论文05-18 10:56本文证明在尖峰协方差模型中,s 步自蒸馏在谱收缩估计量类别中达到最优性能,超越已有方法。属于机器学习理论研究,揭示自蒸馏技术的统计最优性基础,对理解知识蒸…
百万级 LLM 改写合成临床笔记质量的系统性评估HuggingFace 每日论文05-18 10:49本文在百万级规模上系统评估 LLM 生成合成临床文本的质量,从相似性、实用性和事实准确性三个维度进行综合评测。属于医疗 AI 数据合成专项研究,与通用 A…
LatentUMM:统一多模态模型的双潜空间对齐HuggingFace 每日论文05-18 10:35本文提出 LatentUMM,通过显式对齐潜空间中理解与生成的变换路径,解决统一多模态模型(UMM)中理解与生成功能不一致的问题。该工作有助于提升图像理解…
Memisis:医疗表格数据集的合成数据编排与评估工具HuggingFace 每日论文05-18 10:24本文介绍 Memisis,一个整合现有合成数据工具与 LLM 能力的医疗表格合成数据编排评估平台,从隐私、实用性和公平性三维度综合评估合成数据质量。属于医…
StatQAT:深度网络统计量化器优化HuggingFace 每日论文05-18 09:56本文提出 StatQAT,通过统计误差分析框架为均匀和浮点量化方案选择最优量化参数,适应训练和推理中多样化的数据分布。对部署低精度 LLM 推理的工程师有…
用于 Rectified Flow 的散度抑制耦合HuggingFace 每日论文05-18 09:34本文针对 Rectified Flow 的轨迹缠绕问题,识别出速度场非零散度是根因,并提出散度抑制耦合方案使轨迹趋于更直。有助于提升图像生成扩散模型蒸馏后…
EXG:基于经验图的自进化 AgentHuggingFace 每日论文05-18 08:50本文提出 EXG,通过经验图结构让 LLM Agent 在部署过程中将执行经验系统化转化为持续改进,突破现有 Agent 行为静态的局限。该研究为 Age…
非可交换面板数据的在线共形预测HuggingFace 每日论文05-18 08:02本文提出面向非可交换面板数据的在线共形预测框架,解决时序相关和单元异质性场景下分布无关不确定性量化的挑战。属于统计学习理论研究,与 AI 开发工具无直接关联。

Generated at 2026-05-20T00:38:46.842Z by RSS Daily AI Digest