jixiaxue 知识库
2026-06-04

AI 日报 | 2026-06-04

AI 日报 | 2026-06-04

64 个来源 | 266 条新内容 | 10 条 AI 精选

Smart Recommendations

1. Claude Code 团队的实战经验:我们如何使用 Skills

Claude Blog | AI 公司官方博客

Anthropic 官方分享 Claude Code 团队内部如何运用 Skills 体系的实战经验,从抽象到具体讲述 Skills 在真实工程中的使用模式。对所有 Claude Code 用户与 Skills 创作者具一手参考价值,是理解 Skills 设计哲学的关键文章。

阅读原文

2. Uber 限制 Claude Code 等 AI 工具用量以控成本

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 撰文延续之前关于 Uber 四个月烧光 2026 全年 AI 预算的话题,分析 Uber 对 Claude Code 等 AI 工具设月度用量上限的合理性。文章把 1500 美元/月视为大公司 AI 工具市场定价的关键信号,并讨论企业怎样在生产力与成本间取得平衡。这是观察 Claude Code 等编码工具走向企业付费的重要参考。

阅读原文

3. Wasmer 如何用 Codex 构建边缘 Node.js 运行时

OpenAI | AI 公司官方博客

OpenAI 官方案例:Wasmer 团队用 Codex 搭配 GPT-5.5 构建边缘部署的 Node.js 运行时,开发速度提升 10x 到 20x,原本数月的工作缩短到数周。文章详述使用方法与产出效果。

阅读原文

4. Cursor Enterprise 推出 Organizations 组织管理

编程助手 - Cursor (博客) | AI 工具/产品

Cursor 为企业版用户推出 Organizations 多组织管理能力,让大公司可以更精细地管理跨部门、跨团队的 Cursor 用户与策略。

阅读原文

5. datasette-agent-micropython 0.1a0 发布

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 发布 datasette-agent-micropython 0.1a0,让 Datasette Agent 能在 MicroPython WASM 沙箱中安全生成并执行 Python 代码。早期 alpha 已经证明 GPT-5.5 还无法突破沙箱。

阅读原文

6. Claude Code v2.1.162 发布:waitingFor 字段、Grep/Glob 启用、/effort 确认

Anthropic - Claude Code (GitHub Releases) | AI 公司产品更新 / Changelog

Claude Code v2.1.162 发布。claude agents --json 现在返回 waitingFor 字段,标明会话等待的具体阻塞原因(如权限提示)。--tools 显式列出 Grep/Glob 现在能正确启用原生构建中的内嵌搜索工具,此前是被静默忽略。/effort 命令增加确认步骤。本次更新对运维 Claude Code 长会话和工具配置的用户有实质改进。

阅读原文

7. GitHub Copilot 在 VS Code 的五月版本汇总

编程助手 - GitHub Copilot (专属) | AI 工具/产品

GitHub Copilot 团队总结 VS Code v1.120 到 v1.123 的每周稳定版更新,覆盖 5 月至 6 月初。Agents 模块持续迭代,是 Copilot 用户必读 changelog。

阅读原文

8. 把 Gemma 4 12B 带到你的笔记本:用 Google AI Edge 解锁本地 Agentic 工作流

RSSHub 补充路由 - Google AI | AI 公司官方博客

Google DeepMind 的 Gemma 4 12B 让 16GB 内存笔记本就能跑 Agentic、多模态 AI,本地处理数据与生成可视化洞察。用户可在 macOS 上通过 Google AI Edge Gallery 调用,支持动态 Python 代码执行与图表生成。对本地 Agent 工作流落地具高直接价值。

阅读原文

9. GitHub Copilot 弃用 GPT-4.1

编程助手 - GitHub Copilot (专属) | AI 工具/产品

GitHub Copilot 已于 2026 年 6 月 1 日在所有 Copilot 体验(Chat、内联编辑、ask/agent 模式、代码补全)中弃用 GPT-4.1,开发者需迁移到推荐替代模型。

阅读原文

10. Cline CLI v3.0.16:插件市集、Slack socket、Anthropic 自定义 base URL

编程助手 - Cline (GitHub Releases) | AI 工具/产品

Cline CLI v3.0.16 发布。支持从新的 github.com/cline/plugins 仓库按 slug 安装官方插件,可通过 cline plugin uninstall 或 TUI 卸载;插件现可捆绑 skills 并在设置中分组展示;新增 Slack socket 模式支持;允许为 Anthropic 类型供应商自定义 base URL。

阅读原文

播客精选 Top 5

1. 嵌套学习:Ali Behrouz 谈持续学习的探索与 AI 架构的幻象

英文播客 - The Cognitive Revolution | AI 从业者访谈 / 播客

Cornell 与 Google 研究员 Ali Behrouz 在播客中讨论其颠覆性论文《Nested Learning》。该工作被 Jeff Dean 盛赞为可能的范式转变,模型通过在不同频率上更新不同层来模拟人类记忆系统,实现在适应新上下文时保留核心知识。还谈及最新的 AI“睡眠”机制实现记忆巩固,以及为何深度学习的统一原理可能正在重塑。

阅读原文

2. Latent Space 播客:Axiom Math 在 Putnam 数学竞赛拿满分

英文播客 - Latent Space Podcast | AI 从业者访谈 / 播客

2025 年成立仅七个月的 Axiom 解决了 Putnam 12 道全部题目(限时内 8/12),12/12 全胜成绩超过顶尖本科生(110/120)和此前最好的 AI(DeepSeek 103/120)。Putnam 是公认极难的本科数学竞赛,多数人得分为 0 或 1。Axiom 的形式化验证生成方法或开启数学 AI 的“复利智能”时代,本期播客深入剖析其方法论。

阅读原文

3. Latent Space 播客:Satya Nadella 在 Build 现场谈 MAI 与前沿智能平台

英文播客 - Latent Space Podcast | AI 从业者访谈 / 播客

Satya Nadella 首登 Latent Space,与 No Priors 在 Build 现场联播。围绕 MAI 模型技术看点(昨日 AINews 已覆盖),本期播客整理 Satya 关于微软作为“前沿智能平台”的 Bill Gates 式定位等三个主题,是 AI 战略层的重要一手内容。

阅读原文

Blog 精选 Top 5

1. Claude Code 团队的实战经验:我们如何使用 Skills

Claude Blog | AI 公司官方博客

Anthropic 官方分享 Claude Code 团队内部如何运用 Skills 体系的实战经验,从抽象到具体讲述 Skills 在真实工程中的使用模式。对所有 Claude Code 用户与 Skills 创作者具一手参考价值,是理解 Skills 设计哲学的关键文章。

阅读原文

2. Uber 限制 Claude Code 等 AI 工具用量以控成本

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 撰文延续之前关于 Uber 四个月烧光 2026 全年 AI 预算的话题,分析 Uber 对 Claude Code 等 AI 工具设月度用量上限的合理性。文章把 1500 美元/月视为大公司 AI 工具市场定价的关键信号,并讨论企业怎样在生产力与成本间取得平衡。这是观察 Claude Code 等编码工具走向企业付费的重要参考。

阅读原文

3. Wasmer 如何用 Codex 构建边缘 Node.js 运行时

OpenAI | AI 公司官方博客

OpenAI 官方案例:Wasmer 团队用 Codex 搭配 GPT-5.5 构建边缘部署的 Node.js 运行时,开发速度提升 10x 到 20x,原本数月的工作缩短到数周。文章详述使用方法与产出效果。

阅读原文

4. datasette-agent-micropython 0.1a0 发布

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 发布 datasette-agent-micropython 0.1a0,让 Datasette Agent 能在 MicroPython WASM 沙箱中安全生成并执行 Python 代码。早期 alpha 已经证明 GPT-5.5 还无法突破沙箱。

阅读原文

5. Claude Cowork 上手最佳实践

Claude Blog | AI 公司官方博客

Anthropic 官方发布 Claude Cowork 上手最佳实践指南,介绍如何在团队场景中正确使用 Cowork 协作功能。属于 Cowork 配套的官方使用文档,对刚启用 Cowork 的团队具高直接参考价值。

阅读原文

YC 主题

1. Show HN:Mnemo – 适用任意 LLM 的本地优先 AI 记忆层(Rust、SQLite、petgraph)

Hacker News | Y Combinator

开发者发布开源项目 Mnemo——一个为任意 LLM 提供本地优先 AI 记忆层的工具,基于 Rust、SQLite 和 petgraph 实现。属于 LLM 记忆基础设施开源新作。

阅读原文

2. Uber 每月 1500 美元 AI 用量上限揭示工具定价信号

Hacker News | Y Combinator

Simon Willison 撰文分析 Uber 对员工 AI 工具使用设定 1500 美元/月上限的事件,认为这是 AI 工具定价市场的重要信号。HN 上同步讨论。

阅读原文

3. Launch HN:Hyper(YC P26)—— 为 Agent 开发提供企业级“大脑”

Hacker News | Y Combinator

YC P26 批次新公司 Hyper 在 HN Launch:定位是“公司大脑”,为 Agentic 开发流程提供企业上下文。属于 YC AI 新项目首秀。

阅读原文

4. Ted Chiang:人工智能并无意识

Hacker News | Y Combinator

作家 Ted Chiang 在《大西洋月刊》撰文,从哲学角度论证人工智能并不具备意识。HN 热议的 AI 哲学反思文章。

阅读原文

5. 数学家警告:AI 正快速攻陷数学领域

Hacker News | Y Combinator

Science 杂志报道:数学家发出警告,AI 正以前所未有的速度在数学研究领域取得突破。HN 转载讨论。

阅读原文

a16z 主题

1. a16z:世界模型的功能分类法

a16z (Substack) | AI 公司官方博客

a16z 撰文为世界模型提出功能分类法:渲染器(Renderers)、模拟器(Simulators)、规划器(Planners)以及把它们串联起来的闭环。是 a16z 对世界模型 AI 架构方向的体系化梳理。

阅读原文

2. 小企业是 AI 的下一片疆域

a16z (Substack) | AI 公司官方博客

a16z 撰文分析为何 AI Agent 还未进入主街小企业,以及如何让 Agent 真正服务于这一长尾市场。文中探讨产品形态、分发、信任建立等关键障碍。

阅读原文

3. 投资 Town:a16z 领投 A 轮

a16z (Substack) | AI 公司官方博客

a16z 公布领投 Town 的 A 轮融资。属于 a16z 投资动态短文。

阅读原文

4. 投资 Lassie:a16z 领投 A 轮

a16z (Substack) | AI 公司官方博客

a16z 公告领投 Lassie 的 A 轮融资。属于 a16z 投资公告短文。

阅读原文

1. 技术博客 / 开发者博客(Android Capacity 精选)

13 条

标题来源日期摘要
数据中心主权真的那么重要吗?独立开发者 & 个人博客 - Martin Alderson06-04 08:00英国痴迷于在本土建设 AI 数据中心,作者从延迟、税收、控制权三个角度逐一拆解主权论调,认为这些理由大多站不住脚。文章对 AI 基础设施政策提出独立开发者…
Scott Pelley 谈离开《60 分钟》:新管理层的无能与不专业造成浩劫技术写作 & 通识 - Daring Fireball (John Gruber)06-04 07:19Scott Pelley 在 Instagram 发声明谈离开 CBS《60 分钟》,痛斥派拉蒙新管理层不专业造成节目浩劫。属于纯媒体八卦新闻,与 AI …
《60 分钟》大清洗技术写作 & 通识 - Daring Fireball (John Gruber)06-04 05:32John Gruber 整理派拉蒙近期对 CBS《60 分钟》记者团队的连续解雇事件,多名资深记者被开除。与 AI 主题完全无关。
你的 newsletter 改用 AI 生成后我取消了订阅独立开发者 & 个人博客 - Ibrahim Diallo06-04 05:10独立开发者 Ibrahim Diallo 反思:自己订阅 20 多年的某 newsletter 作者悄悄改为 AI 生成内容后立刻取消订阅。文章探讨人格信…
CBS 解雇《60 分钟》主播 Scott Pelley技术写作 & 通识 - Daring Fireball (John Gruber)06-04 03:49NYT 报道 CBS 正式解雇 Scott Pelley,John Gruber 转述并强烈批评派拉蒙新任主管 Nick Bilton。与 AI 无关。
暗黑市场:拆除 Meta 智能眼镜的录制指示灯技术写作 & 通识 - Daring Fireball (John Gruber)06-04 03:39WSJ 记者 Joanna Stern 调查 Facebook Marketplace 上的“隐身模式”服务——花 100 美元可禁用 Ray-Ban M…
朴素求和交替级数的陷阱技术写作 & 通识 - John D. Cook06-03 23:13John D. Cook 用指数函数的幂级数为例,演示朴素累加交替级数时,浮点精度可能产生意外结果。属于数值计算通识文章。
Skills Registry 的威胁模型分析独立开发者 & 个人博客 - Andrew Nesbitt06-03 23:00Andrew Nesbitt 探讨 Claude Skills 注册中心可能面临的威胁模型,调侃:还要多久会有人对一个 markdown 文件发出 CVE…
伦敦开放数据平台重启技术写作 & 通识 - Terence Eden06-03 19:34Terence Eden 介绍伦敦市政府开放数据门户 data.london.gov.uk 上线 16 年后的全面重启,前后端均有更新。属于政府开放数据案例。
GE Widescreen 1000:大预算的大尺寸电视独立开发者 & 个人博客 - Dave Farquhar (dfarq)06-03 19:00Dave Farquhar 回顾 1978 年 GE Widescreen 1000 大屏电视的历史,价格高达家用轿车 3/4。属于复古硬件怀旧文。
菲律宾政府加入 Have I Been Pwned安全 & 隐私 - Troy Hunt06-03 11:40Troy Hunt 宣布菲律宾国家 CERT 成为 HIBP 政府服务的第 46 个用户,可监控官方政府域名的数据泄露情况。
内联启发式算法综述编程语言 & 软件工程 - Max Bernstein06-03 08:00Max Bernstein 深入综述编译器尤其是 JIT 中的方法内联启发式策略。文章讨论函数大小、调用频率、上下文信息如何决定内联决策,是编译器与运行时…
重新审视旋转算法:另一种单向算法系统 & 底层 - The Old New Thing (Raymond Chen)06-02 22:00Raymond Chen 重新审视数组旋转算法,给出另一种单向算法实现,属系统底层经典算法回顾。

2. GitHub 开源项目 Releases(Atom Feed)

40 条

标题来源日期摘要
mastracode 0.22.1 发布AI Agent 框架 - Mastra06-04 07:45Mastra Agent 框架 mastracode 包发布 0.22.1 版本,无详细 changelog 内容。属于例行小版本号更新。
Mastra 1.12.1 发布AI Agent 框架 - Mastra06-04 07:45Mastra Agent 主框架 1.12.1 补丁版本发布,未附 changelog 说明。
@mastra/temporal 0.1.11 发布AI Agent 框架 - Mastra06-04 07:45Mastra 的 Temporal 工作流集成包发布 0.1.11 补丁版本,无 changelog。
@mastra/server 1.40.0 发布AI Agent 框架 - Mastra06-04 07:45Mastra 服务端 1.40.0 版本发布,未提供具体变更说明。
@mastra/react 0.5.1 发布AI Agent 框架 - Mastra06-04 07:45Mastra React 适配包 0.5.1 补丁版本发布,无 changelog 说明。
MLflow TypeScript SDK v0.3.0-rc.0 发布向量数据库 & AI 基础设施 - MLflow06-04 07:37MLflow TypeScript SDK 发布 v0.3.0-rc.0 候选版,新增对 Claude Code 通过 MLFLOW_TRACE_LOCA…
Ollama v0.30.4-rc1 候选版发布推理引擎 & 本地 AI - Ollama06-04 06:46Ollama 发布 v0.30.4-rc1 候选版,主要更新 llama.cpp 底层版本。属于例行底层依赖升级。
Semantic Kernel Python 1.43.0 发布AI Agent 框架 - Semantic Kernel06-04 06:40微软 Semantic Kernel Python SDK 发布 1.43.0,主要改进函数调用参数的一致性。框架级例行小版本。
Ollama v0.30.4 正式版 修复 Gemma 4 接入崩溃推理引擎 & 本地 AI - Ollama06-04 05:41Ollama v0.30.4 正式版发布,修复了 Gemma 4 模型导致的“Unknown projector type”崩溃问题。本地跑 Gemma …
llama.cpp b9496:修复 Gemma 4 统一 FPE推理引擎 & 本地 AI - llama.cpp06-04 04:25llama.cpp b9496 版本修复 Gemma 4 统一模型的浮点异常(FPE)问题,属于本地推理引擎的小步快跑修复。
mastracode 0.22.0 发布AI Agent 框架 - Mastra06-04 03:16Mastra Agent 框架 mastracode 包 0.22.0 次版本发布,无 changelog 说明。
Mastra 1.12.0 发布AI Agent 框架 - Mastra06-04 03:16Mastra Agent 框架主包 1.12.0 次版本发布,无具体 changelog 内容。
@mastra/temporal 0.1.10 发布AI Agent 框架 - Mastra06-04 03:16Mastra Temporal 集成包 0.1.10 补丁版本发布,无 changelog。
@mastra/server 1.39.0 发布AI Agent 框架 - Mastra06-04 03:16Mastra 服务端 1.39.0 次版本发布,未提供变更说明。
@mastra/react 0.5.0 发布AI Agent 框架 - Mastra06-04 03:16Mastra React 适配包 0.5.0 次版本发布,无 changelog。
langchain-deepseek 1.1.0 发布AI 框架 & 编排 - LangChain06-04 03:07LangChain 的 DeepSeek 集成包发布 1.1.0,主要将 langchain-tests 依赖底限升级到 1.1.9,属基础设施同步。
llama.cpp b9495:Qwen 3.5 MTP 改用 post-norm 隐状态推理引擎 & 本地 AI - llama.cpp06-04 02:14llama.cpp b9495 版本将 Qwen 3.5 的 MTP(多 token 预测)头改用 post-norm 隐藏状态,影响 Qwen 3.5 …
CrewAI 1.14.7a1:新增 Snowflake Cortex LLM、Databri…AI Agent 框架 - CrewAI06-04 01:41CrewAI 1.14.7a1 预览版发布:新增 crew 训练后的 agents 文件支持、原生 Snowflake Cortex LLM 提供方、Da…
llama.cpp b9494:为 Gemma 4 统一模型启用非因果视觉推理引擎 & 本地 AI - llama.cpp06-04 01:37llama.cpp b9494 为 Gemma 4 统一模型启用非因果视觉处理,改进多模态推理能力。
Ollama v0.30.4-rc0:Windows 清理时杀掉 llama-server 进程推理引擎 & 本地 AI - Ollama06-04 01:25Ollama v0.30.4-rc0 候选版修复 Windows 安装与清理时遗留 llama-server.exe 进程的 bug,现在清理流程包含 l…
Ollama v0.30.3 发布推理引擎 & 本地 AI - Ollama06-04 00:39Ollama 发布 v0.30.3 小版本更新,主要新增对 gemma4-12b 模型的支持。本地模型运行环境再扩充。
llama.cpp 构建 b9493推理引擎 & 本地 AI - llama.cpp06-03 23:45llama.cpp 滚动构建 b9493,主要修复 mtmd 多模态模型在构建 ViT 时的可跳过逻辑。
Transformers v5.10.1 紧急修补版AI 框架 & 编排 - Transformers06-03 23:37Hugging Face Transformers 因 v5.10.0 在污染分支上发布被撤回,紧急重发 v5.10.1。本版本新增 Gemma4 uni…
Qdrant v1.18.2 补丁版向量数据库 & AI 基础设施 - Qdrant06-03 23:10Qdrant 向量数据库发布 v1.18.2 补丁版本,发布说明仅含版本号。
Transformers v5.10.0(已撤回)AI 框架 & 编排 - Transformers06-03 23:08Transformers v5.10.0 发布,但因在污染分支上构建已被撤回。请使用 v5.10.1 替代。
llama.cpp 构建 b9491推理引擎 & 本地 AI - llama.cpp06-03 22:17llama.cpp 滚动构建 b9491,通过在启用 PDL 时禁用 restrict 关键字避免竞态条件。
Weaviate v1.38.0-rc.1:HFresh、命名空间、嵌套对象过滤向量数据库 & AI 基础设施 - Weaviate06-03 19:52Weaviate v1.38.0 候选版发布,包含 HFresh(GA)、Namespaces、嵌套对象过滤和 Alter Schema 重建索引等特性。…
llama.cpp 构建 b9490推理引擎 & 本地 AI - llama.cpp06-03 19:48llama.cpp 滚动构建 b9490,使 ggml-cpu 在 FWHT 中使用运行时 SVE 宽度,优化 ARM 服务器推理。
llama.cpp 构建 b9489推理引擎 & 本地 AI - llama.cpp06-03 19:23llama.cpp 滚动构建 b9489,CUDA 启动时为量化 KV cache 预留空间。
n8n v1.123.51 修复版AI 框架 & 编排 - n8n06-03 18:23n8n 自动化平台发布 v1.123.51,主要修复表达式引擎在 happy path 上的日志噪音问题。
n8n v2.25.2 修复版AI 框架 & 编排 - n8n06-03 17:14n8n v2.25.2 修复外部 Agent 通道使用用户 ID 进行情景记忆的问题。
llama.cpp 构建 b9488推理引擎 & 本地 AI - llama.cpp06-03 15:49llama.cpp 滚动构建 b9488,测试新增对 qwen3 SSM 架构的支持。
llama.cpp 构建 b9487推理引擎 & 本地 AI - llama.cpp06-03 14:26llama.cpp 滚动构建 b9487,将 BoringSSL 更新到 0.20260526.0 版本。
llama.cpp 构建 b9486推理引擎 & 本地 AI - llama.cpp06-03 14:03llama.cpp 滚动构建 b9486,禁用 MSVC Windows 发布作业中的 ccache。
Milvus v2.6.18 版本升级向量数据库 & AI 基础设施 - Milvus06-03 11:18Milvus 向量数据库发布 v2.6.18,主要升级 milvus 主库与 proto 版本。
Milvus pkg v2.6.18 同步发布向量数据库 & AI 基础设施 - Milvus06-03 11:18Milvus pkg/v2.6.18 同步主版本号升级。
Ollama v0.30.2 发布推理引擎 & 本地 AI - Ollama06-03 10:54Ollama v0.30.2 在 launch 时新增展示与自动安装 Cline CLI 的能力,强化与 Cline 编程助手集成。
vLLM v0.22.1rc1 修复 flashinfer-jit-cache 索引地址推理引擎 & 本地 AI - vLLM06-03 10:02vLLM 发布 v0.22.1rc1 候选版,在 docker 镜像构建中停止使用 extra-index-url 引入 flashinfer-jit-c…
Langflow v1.10.0.dev63 夜间构建版本AI 框架 & 编排 - Langflow06-03 09:51Langflow 发布夜间构建版本 v1.10.0.dev63,属于持续迭代的 nightly 构建。无具体功能说明。
LiteLLM v1.86.3 发布AI 框架 & 编排 - LiteLLM06-03 09:40LiteLLM 发布 v1.86.3 小版本更新。所有 LiteLLM Docker 镜像使用 cosign 签名,README 引导用户通过 pinne…

3. AI 公司产品更新 / Changelog

49 条

标题来源日期摘要
MAI-Voice-2 在 Microsoft Foundry 进入公开预览Microsoft - Azure 服务更新(含 AI)06-04 07:00微软 Foundry 上线第一方语音模型 MAI-Voice-2 公开预览。支持 10 多种语言的自然语音生成,可通过短样本进行声纹克隆并支持声音提示等功能。
OpenAI Python SDK v2.41.0 发布OpenAI - openai-python SDK06-04 06:39OpenAI Python SDK 发布 v2.41.0,新增 responses.moderation 和 chat_completions.moder…
Google GenAI Python SDK v2.8.0 发布Google - Google GenAI Python SDK06-04 06:38Google GenAI Python SDK 发布 v2.8.0,新增 Agent Platform MCP 在异步 generate_content …
OpenAI Node SDK v6.42.0 发布OpenAI - openai-node SDK06-04 06:38OpenAI Node SDK 发布 v6.42.0,与 Python SDK 同步新增 responses.moderation 和 chat_comp…
Azure 机密账本新增审计备份工具正式可用Microsoft - Azure 服务更新(含 AI)06-04 06:15Azure 机密账本(confidential ledger)发布本地化网页查看工具,让审计员和安全分析师可以查看账本文件并验证密码学证明,无需直接访问账…
Claude Code v2.1.162 发布:waitingFor 字段、Grep/Glob…Anthropic - Claude Code (GitHub Releases)06-04 05:31Claude Code v2.1.162 发布。claude agents --json 现在返回 waitingFor 字段,标明会话等待的具体…
Azure AI Language 健康文本分析下一代 Playground 正式可用Microsoft - Azure 服务更新(含 AI)06-04 05:15Azure AI Language 在 Microsoft Foundry 门户中推出下一代 Text Analytics for Health(TA4H…
Microsoft Foundry 公开预览用户反馈日志Microsoft - Azure 服务更新(含 AI)06-04 05:15Microsoft Foundry 引入端用户反馈日志机制公开预览,允许开发者捕获实际用户与 AI Agent 交互时的结构化反馈信号(如赞/踩、评分、自…
AWS IoT 设备管理为连接状态 API 新增 MQTT 会话数据Amazon - AWS What’s New06-04 05:15AWS IoT Device Management 在连接状态 API 中新增 MQTT 会话数据,方便审计和排查 IoT 设备连接异常。与 AI 无关。
Microsoft Foundry 自助式定制照片虚拟形象创建正式可用Microsoft - Azure 服务更新(含 AI)06-04 04:45Microsoft Foundry 上线自助式定制照片虚拟形象创建功能 GA,企业客户可在 NextGen 微调门户中创建品牌化虚拟形象,配合语音 Age…
Amazon SageMaker Data Agent 新增对话历史支持Amazon - AWS What’s New06-04 04:26Amazon SageMaker Data Agent 现支持对话历史,数据分析师可跨会话引用之前 Agent 生成的代码、恢复多步分析、回顾排错过程。提…
如何在 Amazon Bedrock 上规模化构建自驱动 AI 运维Amazon - AWS Machine Learning Blog06-04 04:14AWS 介绍 Amazon Bedrock Ops Alert——一个三层自动化监控方案,主动检测运维问题、动态调整告警阈值、自动分类告警并创建带上下文的…
Amazon SageMaker Unified Studio 新增 Notebook 调度支持Amazon - AWS What’s New06-04 04:13Amazon SageMaker Unified Studio 现支持直接在 notebook 界面中调度、参数化和编排 notebook 运行,无需外部…
AWS Step Functions 新增 AgentCore 驱动的 Agent 推理步骤Amazon - AWS What’s New06-04 04:00AWS Step Functions 通过与 Amazon Bedrock AgentCore 托管 harness(预览中)的深度集成,可以在工作流中直…
OpenAI GPT-5.4 在 AWS GovCloud(美西)的 Amazon Bedro…Amazon - AWS What’s New06-04 03:58Amazon Bedrock 现已在 AWS GovCloud(美西)支持 OpenAI GPT-5.4,让政府与受监管行业客户能在合规环境下使用 Ope…
Azure Red Hat OpenShift 在比利时中部正式可用Microsoft - Azure 服务更新(含 AI)06-04 03:15Azure Red Hat OpenShift(ARO)现已在 Azure 比利时中部区域 GA,扩展了 OpenShift 在欧洲的部署区域。与 AI …
Microsoft Foundry 公开预览 Prompt agents 与 Hosted a…Microsoft - Azure 服务更新(含 AI)06-04 03:15Microsoft Foundry Agent 服务为 Prompt agents 和 Hosted agents 引入 A2A(Agent-to-Age…
Microsoft Foundry 对话式 PII NextGen Playground 公开预览Microsoft - Azure 服务更新(含 AI)06-04 03:00Microsoft Foundry 推出对话式 PII(ConvPII)NextGen Playground 公开预览,支持转录文本输入和 API 配置面…
Microsoft Foundry TextPII NextGen Playground 更新Microsoft - Azure 服务更新(含 AI)06-04 03:00Microsoft Foundry 更新 TextPII NextGen Playground,刷新 API 配置面板,集成 Ignite 2025 的预…
Foundry 模型目录公开预览垂直域过滤器Microsoft - Azure 服务更新(含 AI)06-04 03:00Microsoft Foundry 模型目录新增“行业领域”过滤器公开预览,帮助开发者从 1900 多个模型中筛选机器人、生物医药、材料等行业专用模型。
Microsoft Foundry for VS Code 正式可用(Build 2026 6…Microsoft - Azure 服务更新(含 AI)06-04 03:00Microsoft Foundry VS Code 扩展 GA,Build 2026 6 月刷新带来完整模型目录、模型 Playground、Hosted…
Microsoft Foundry 智能 Trace 采样评估公开预览Microsoft - Azure 服务更新(含 AI)06-04 03:00Microsoft Foundry 可观测性新增智能 trace 过滤与采样能力(预览),用多阶段方法在生产 trace 中挑选代表性子集做评估,避免全量…
Microsoft Foundry Custom Voice 门户体验正式可用Microsoft - Azure 服务更新(含 AI)06-04 03:00Azure AI Speech 把 Custom Voice 创作体验整合到 Microsoft Foundry 门户中并 GA,授权客户可上传声纹录音和…
Microsoft Foundry Rubric 评估器公开预览Microsoft - Azure 服务更新(含 AI)06-04 03:00Microsoft Foundry 推出 Rubric 评估器(公开预览),适用于单轮和多轮 Agent 流程,开发者可用 Agent prompts、生…
AWS Compute Optimizer 为 EBS 卷与 ECS 服务调优支持 32 天回溯Amazon - AWS What’s New06-04 02:30AWS Compute Optimizer 允许 EBS 卷和 ECS 服务调优建议的回溯窗口从默认 14 天延长到 32 天(免费),更好覆盖月末处理等…
Azure 宣布 Intel TDX 机密虚拟机的机密热迁移(开发中)Microsoft - Azure 服务更新(含 AI)06-04 02:15Azure 宣布 Intel TDX 机密虚拟机的机密热迁移(开发中)能力,提升平台运维时机密 VM 的可用性。与 AI 无关。
Fundamental 的大型表格模型 NEXUS 上架 Amazon SageMaker J…Amazon - AWS Machine Learning Blog06-04 01:55AWS 博客介绍 Fundamental 的大型表格模型 NEXUS 上架 SageMaker JumpStart,并演示如何部署该模型并在企业数据集上做…
ARC 区域切换新增 Amazon Aurora 扩缩与 Neptune 全球数据库故障转移Amazon - AWS What’s New06-04 01:44Amazon ARC 区域切换新增三个执行块:Aurora 无服务器扩缩、Aurora 预置扩缩、Neptune 全球数据库故障转移,自动化多区域数据库的…
Azure Infrastructure Resiliency Manager 公开预览Microsoft - Azure 服务更新(含 AI)06-04 01:15Azure Infrastructure Resiliency Manager 公开预览,提供统一的目标驱动体验来设计、评估和改进 Azure 上应用的容…
Azure PostgreSQL 灵活服务器 DuckDB 扩展正式可用Microsoft - Azure 服务更新(含 AI)06-04 01:00Azure Database for PostgreSQL 灵活服务器现支持安装 DuckDB 扩展并 GA。便于在 PostgreSQL 内进行 OLA…
Azure DocumentDB 高级全文搜索公开预览Microsoft - Azure 服务更新(含 AI)06-04 01:00Azure DocumentDB 全文搜索能力扩展:新增模糊搜索、近邻搜索、更多语言支持、BM25 排序,与向量搜索合并到单一数据库统一处理。对 RAG …
用 SOCI 索引降低 DLAMI 与 DLC 容器冷启动延迟Amazon - AWS Machine Learning Blog06-04 00:26AWS 介绍如何在公开的 Deep Learning AMI 与 Deep Learning Container 上启用 SOCI 索引,加速大模型容器的…
Amazon Keyspaces 新增 CDC 迭代器位置返回Amazon - AWS What’s New06-04 00:00Amazon Keyspaces 的 CDC 流 GetRecords 接口现在会返回迭代器位置,便于判断消费者是否已追上流末。对运维 Cassandra…
在 SageMaker AI 上用 SFT 与 DPO 提升 Agent 工具调用准确率Amazon - AWS Machine Learning Blog06-03 23:56AWS 实战教程:组合 SFT(监督微调)与 DPO(直接偏好优化)训练小语言模型,提升其工具调用准确率。文章在 SageMaker 训练作业上演示完整流…
SageMaker Unified Studio 新增 12 种语言本地化Amazon - AWS What’s New06-03 23:26SageMaker Unified Studio 界面新增对简繁中文、法语、德语、日韩等共 12 种语言的本地化支持,方便全球团队协作。
SageMaker AI 上线多轮强化学习,定制 Agent 模型Amazon - AWS What’s New06-03 23:00Amazon SageMaker AI 推出多轮强化学习作为新的无服务器模型定制能力,专门面向多步 Agent 任务的微调。已支持 SFT、RLVR、RL…
AWS Config 新增 9 种资源类型支持Amazon - AWS What’s New06-03 23:00AWS Config 新支持 9 种资源类型,覆盖 Amazon Bedrock、Bedrock AgentCore 和 SageMaker 等关键服务,…
Amazon ECS 托管实例支持 Trainium 与 InferentiaAmazon - AWS What’s New06-03 23:00Amazon ECS 托管实例新增对 AWS Trainium 和 Inferentia 自研 AI 加速器的支持,覆盖训练与推理工作负载。
Mistral Python SDK v2.4.9Mistral / Cohere - Mistral Python SDK06-03 21:04Mistral Python 客户端 SDK v2.4.9 由 Speakeasy CLI 基于 OpenAPI 文档自动生成。属于例行 SDK 同步。
Amazon RDS for Db2 支持 IBM Db2 v12.1 与社区版Amazon - AWS What’s New06-03 15:11Amazon RDS for Db2 新增对 IBM Db2 v12.1 的支持,并首次包含 Db2 Community Edition,便于开发测试。
Gemini for Cloud 6 月 3 日 Release NotesGoogle - Gemini for Cloud Release Notes06-03 15:00Google Gemini for Cloud 在 IntelliJ 中的杂项 Bug 修复与产品改进。
AWS IoT Core 新增连接与认证排障日志Amazon - AWS What’s New06-03 15:00AWS IoT Core 新增 Ping 和认证两类 CloudWatch 日志事件,便于排查 IoT 设备连接和认证问题。
Azure gpt-4o-mini-tts 即将下线跨厂商 - AI Model Deprecations06-03 14:54Azure OpenAI 模型 gpt-4o-mini-tts 标记将于 2026-10-15 下线。使用该模型的开发者需提前迁移。
Azure gpt-image-1 即将下线跨厂商 - AI Model Deprecations06-03 14:54Azure OpenAI 模型 gpt-image-1 标记将于 2026-10-23 下线。
Azure sora-2 即将下线跨厂商 - AI Model Deprecations06-03 14:54Azure OpenAI 模型 sora-2 标记将于 2026-07-15 下线。视频模型用户需提前迁移。
OpenAI gpt-image-1-mini 进入退役名单跨厂商 - AI Model Deprecations06-03 14:54OpenAI 通知开发者 gpt-image-1-mini 等老款 GPT 图像模型将于 2026-12-01 从 API 移除。
OpenAI gpt-image-1.5 进入退役名单跨厂商 - AI Model Deprecations06-03 14:54OpenAI 通知 gpt-image-1.5 将于 2026-12-01 从 API 退役。
OpenAI chatgpt-image-latest 进入退役名单跨厂商 - AI Model Deprecations06-03 14:54OpenAI 通知 chatgpt-image-latest 将于 2026-12-01 从 API 退役。
Azure Monitor 简单日志告警 GAMicrosoft - Azure 服务更新(含 AI)06-03 10:00Azure Monitor 的 Simple log alerts 功能正式 GA,提供更直观、简化的日志告警体验。

4. 新闻媒体

47 条

标题来源日期摘要
Lovable 与 Google Cloud 签多年合约 用量扩大 5 倍英文科技媒体(AI 频道) - TechCrunch AI06-04 06:56AI 应用生成平台 Lovable 与 Google 签署扩展多年期合约,Google Cloud 用量提升 5 倍,并扩大对 Anthropic Cla…
Google 被要求在 AI 搜索中加清晰链接并允许英国出版商退出英文科技媒体(AI 频道) - Ars Technica AI06-04 04:26英国监管机构要求 Google 必须修改 AI Overviews,提供更清晰的来源链接并允许出版商选择退出,Google 此前曾辩称用户不需要“大量来源”。
Alphabet 为 Google AI 业务创纪录融资 850 亿美元 释放强烈信号英文科技媒体(AI 频道) - TechCrunch AI06-04 03:38Alphabet 完成创纪录的 850 亿美元股票发行,资金主要投向 Google AI 业务,说明投资者对 AI 相关 offering 的胃口正旺。是…
Google Dreambeans:把你的生活变成卡通的怪名字 AI 工具英文科技媒体(AI 频道) - TechCrunch AI06-04 03:07Google 推出 AI 工具 Dreambeans,可根据 Google 账户中的个人数据生成 AI 插画“故事”,将日常生活卡通化。属于消费级 AI 玩物。
xAI 请求法院剥夺涉嫌 Grok 深度伪造裸照受害者的匿名权英文科技媒体(AI 频道) - Wired AI06-04 02:49Wired 报道:四位以化名起诉 Elon Musk 旗下 xAI 的原告(涉 Grok 深度伪造裸照)可能面临艰难选择——公开真实姓名,还是放弃起诉。A…
特朗普测试 AI 模型计划遇阻——美国安全团队被 DOGE 砍空英文科技媒体(AI 频道) - Ars Technica AI06-04 02:11Ars Technica 报道:特朗普 AI 测试行政令被批短视、流于表面,因为执行测试的美国安全团队已被 DOGE 大幅削减,难以真正阻止危险模型部署。
未来人形机器人:中国身体配美国大脑的六英尺壮汉英文科技媒体(AI 频道) - Wired AI06-04 02:00Wired 报道:NVIDIA 机器人负责人 Spencer Huang 解读 NVIDIA 与宇树合作的新人形机器人 H2 Plus,强调“中美最佳组合…
随着 AI 变好,它揭示了一个空洞的承诺英文科技媒体(AI 频道) - The Verge AI06-04 01:45The Verge 评论:同事 David Pierce 和 Jay Peters 同时体验 Google 新 Gemini Agent Spark,结论…
亚马逊搜索框将生成你买不到的 AI 商品图英文科技媒体(AI 频道) - The Verge AI06-04 00:07亚马逊在应用内搜索栏接入 AI 图片生成,用户输入描述时会即时展示 AI 生成的服饰和家居图像作为搜索辅助。目前仅在 App 端服饰、家居品类上线。
亚马逊搜索结果将插入 AI 生成商品图英文科技媒体(AI 频道) - TechCrunch AI06-03 23:50TechCrunch 转述亚马逊新功能:用视觉搜索 + AI 生成图像引导用户找到匹配商品。与 The Verge 报道同一事件的衍生内容。
特朗普最终签署 AI 行政命令的幕后英文科技媒体(AI 频道) - Wired AI06-03 23:46Wired 报道特朗普周一深夜最终签署 AI 行政命令的内幕过程,此前曾搁置一个月。属于政策层面的行业新闻。
两位创始人从高盛与 Meta 离职,为被忽视市场打造语音 AI英文科技媒体(AI 频道) - TechCrunch AI06-03 23:00TechCrunch 报道一对来自 Goldman Sachs 和 Meta 的创始人创立语音 AI 公司,瞄准非洲与中东市场。其自研栈日均处理超 170…
新法规允许发布者退出 AI 搜索英文科技媒体(AI 频道) - TechCrunch AI06-03 22:58英国监管机构要求 Google 提供工具,让网站发布者可选择不参与生成式 AI 搜索功能。该选项先在英国测试,后全球推行。
微软与 OpenAI 分道扬镳,正面交锋开启英文科技媒体(AI 频道) - The Verge AI06-03 22:04The Verge 报道微软 Build 大会上推出超级 App、自研推理模型、网络安全工具与类 OpenClaw 的 AI Agent,与 OpenAI…
Meta 的 WhatsApp Business AI Agent 全球上线英文科技媒体(AI 频道) - TechCrunch AI06-03 21:40Meta 面向 WhatsApp Business 商家的 AI Agent 正式全球开放,将按 token 用量向商家收费。
Meta 追赶 AI 的内部努力英文科技媒体(AI 频道) - Ars Technica AI06-03 21:35Ars Technica 报道 Meta 在 AI 竞赛中的追赶尝试,并指出能否真正追上对手仍存在疑问。
Coralogix 融资 2 亿美元押注 AI Agent 可观测性英文科技媒体(AI 频道) - TechCrunch AI06-03 21:02Coralogix 完成 2 亿美元融资,押注 AI 系统进入生产后对监控、故障排查、运行数据的需求将爆发。可观测性层成为 AI 基建新赛道。
卧安机器人 OneModel 1.7 用隐式通路打通具身智能中文 AI 媒体 - 量子位06-03 20:28量子位报道卧安机器人发布 OneModel 1.7 模型,在潜在空间内完成感知到动作的信息传导,解决具身智能从感知到执行的关键断层。
英伟达 RTX Spark 笔记本誓要颠覆 AI PC 市场英文科技媒体(AI 频道) - Wired AI06-03 19:00Wired 报道英伟达 RTX Spark 芯片可能终于让 AI PC 概念落地。新笔记本平台搭载 RTX Spark,主打本地 AI 体验。
旧金山房市最硬通货:Anthropic 股票英文科技媒体(AI 频道) - Wired AI06-03 18:00Wired 报道旧金山湾区多套房产挂牌愿意接受 Anthropic 股权置换,反映 AI 创业泡沫与硬通货化趋势。
跨维智能登顶 WorldArena 世界模型榜首中文 AI 媒体 - 量子位06-03 17:54量子位报道国产团队跨维智能在 WorldArena 世界模型评测榜上登顶。属于国产模型成绩新闻。
AI 有用水问题,Google 自认有解英文科技媒体(AI 频道) - The Verge AI06-03 17:00The Verge 报道 Google 在 AI 数据中心用水争议背景下,公布五项水资源承诺,包括为社区补给水量。
Reddit 用户用 Claude 编 DIY 抢票工具英文科技媒体(AI 频道) - Wired AI06-03 17:00Wired 报道 r/WorldCup2026Tickets 上的球迷用 Claude 编写 DIY 抢票软件,绕开黄牛和高价。是一个生动的 AI 民用案例。
英国裁决:Google 必须允许发布者退出 AI 搜索英文科技媒体(AI 频道) - The Verge AI06-03 16:45英国 CMA 新规要求 Google 让站点所有者可选择不让自己的内容进入 AI Overviews 等 AI Search 功能。
新智元 ALL in ASI 英雄帖中文 AI 媒体 - 新智元06-03 12:05新智元发布 ALL in ASI 招募贴,号召业内人士共建超级人工智能。属于媒体自身招募宣传。
Claude Cowork 做不好的场景被国产 Agent 跑通中文 AI 媒体 - 新智元06-03 12:05新智元报道国产 Agent 公司在 Claude Cowork 表现欠佳的领域取得突破。属于国产 AI Agent 营销稿。
OpenAI 执剑人 9 年恩仇录:被 Anthropic 联创逐出 ChatGPT 前身中文 AI 媒体 - 新智元06-03 12:05新智元复盘 OpenAI 内部人事斗争 9 年史,讲述某位执剑人被 Anthropic 联创从 ChatGPT 前身项目中逐出的故事。
Anthropic 刚刚提交招股书中文 AI 媒体 - 量子位06-03 11:55量子位报道 Anthropic 刚刚向 SEC 递交招股书,最快 2026 Q4 上市。这是 AI 行业年度重磅资本事件。
16亿Windows用户,一夜冲进Agent时代!中文 AI 媒体 - 新智元06-03 10:00新智元报道微软 Windows 全面接入 Agent 能力,16 亿 Windows 用户被一次性带入 AI Agent 时代。文章聚焦操作系统层面集成 …
忍无可忍,Linux之父怒怼AI:别再用「智能垃圾」塞满内核列表了!中文 AI 媒体 - 新智元06-03 10:00Linus Torvalds 公开批评 AI 生成的低质量补丁充斥 Linux 内核邮件列表,呼吁开发者停止用 LLM 输出“智能垃圾”。事件折射开源社区…
刚刚,Meta Skill 来了中文 AI 媒体 - 量子位06-03 09:29量子位报道 Meta 推出 Skill 体系,GitHub 上的 OpenSquilla 仓库迅速走红。文章关注 Meta 对标 Anthropic Sk…
多数团队的 AI 落地路径反了(赞助内容)AI 专业媒体/Newsletter - TLDR AI06-03 08:00Notion 赞助内容:与其问哪个工具有最好的模型,不如问团队真正会用哪个方案。指南列举 AI 应该解决的 5 类关键岗位场景,强调评估应聚焦落地与集成而…
造一台爬山机器:微软发布七款全新 MAI 模型AI 专业媒体/Newsletter - TLDR AI06-03 08:00微软发布七款全新 MAI 模型,开发者可自行调优权重并集成进日常产品。模型采用 Frontier Tuning 方法,让 AI 借助强化学习环境适配特定工…
MiniMax 承诺在 1M 上下文模型发布后开放 M3 权重AI 专业媒体/Newsletter - TLDR AI06-03 08:00MiniMax 将于未来 10 天内发布 M3 模型权重与技术报告。M3 当前已通过 MiniMax Code、token 套餐与 API 提供,具 1M…
Codex 新能力发布AI 专业媒体/Newsletter - TLDR AI06-03 08:00OpenAI 发布 Codex 新能力和六款角色专属插件,覆盖数据分析、创意制作、销售、产品设计、股权投资、投资银行六大岗位场景。Codex 正在从编程助…
开源与闭源模型走在不同的指数曲线上AI 专业媒体/Newsletter - TLDR AI06-03 08:00Interconnects 分析开源与闭源模型走在不同指数曲线上。当前开源模型在 OOD 任务上尚不足以替代闭源,但终将追上。作者预测开源模型生态总市值最…
记忆即目的:Sentra CEO 论 Agent 记忆系统设计哲学AI 专业媒体/Newsletter - TLDR AI06-03 08:00Sentra CEO Ashwin Gopinath 提出:记忆不是智能的附属品,而是决定推理在何种现实上运行的底层。知识是过去发生的事,记忆是过去中应被…
大规模防御 AI 推理盗用AI 专业媒体/Newsletter - TLDR AI06-03 08:00Vercel 文章揭示攻击者如何通过暴露端点转售盗取的 AI 推理资源,传统限流方案不足以应对。Vercel 提出基于 BotID 分析对每次 AI 请求…
数据中心搬进你的电脑:Perplexity 端云混合推理AI 专业媒体/Newsletter - TLDR AI06-03 08:00Perplexity 在 Computex 2026 发布端云混合推理系统,能在端侧轻量任务与云侧复杂推理间智能路由,建立在此前 Personal Com…
Wall Attention:基于“墙”记忆 token 的长上下文注意力机制AI 专业媒体/Newsletter - TLDR AI06-03 08:00tilde-research 开源 Wall Attention,一种通过组织信息于持续存在的“墙”(wall)记忆 token 周围的新型注意力机制,旨…
IPO 前 Anthropic 面临 AI 支出反弹AI 专业媒体/Newsletter - TLDR AI06-03 08:00Anthropic 已提交 IPO 申请,正面临企业客户对 AI 高成本的审视。调研显示 40% 企业 AI 投入的成本节约不足 10%。尽管 Anthr…
Anthropic 把 Mythos 项目扩展到 15 国 150 家机构AI 专业媒体/Newsletter - TLDR AI06-03 08:00Anthropic 把 Project Glasswing 扩展至 15 国 150 家新合作伙伴,需满足安全要求后获模型访问权。项目自启动以来已发现 1…
GitHub 的 Agent 战略AI 专业媒体/Newsletter - TLDR AI06-03 08:00Latent.Space 长访谈 GitHub COO Kyle Daigle,讨论 AI 改变 GitHub 公司运转的方式、他个人如何用 AI 工作、…
Agent Harness 中的记忆现状AI 专业媒体/Newsletter - TLDR AI06-03 08:00Mem0 调研 Claude Code、Codex、Copilot、OpenClaw、Hermes、Bedrock AgentCore、Windsurf、…
TinyFish Bigset:把文本提示词变成实时数据集AI 专业媒体/Newsletter - TLDR AI06-03 08:00TinyFish 发布开源系统 Bigset,可把文本提示词转换为来自实时网络的结构化数据集。
橡木果发布“本能驱动”技术路线,开辟自下而上具身智能新范式中文 AI 媒体 - 量子位06-02 21:01量子位报道橡木果发布“本能驱动”技术路线,主张自下而上、从底层本能出发构建具身智能新范式。
滴滴 2026 Q1 财报:国内稳固,国际业务成第二增长引擎中文 AI 媒体 - 量子位06-02 20:28量子位转述滴滴 2026 Q1 财报,日均订单刷新历史纪录至 3940 万单,国内基本盘稳固,国际业务成为第二增长引擎。

5. AI 从业者访谈 / 播客

3 条

标题来源日期摘要
嵌套学习:Ali Behrouz 谈持续学习的探索与 AI 架构的幻象英文播客 - The Cognitive Revolution06-04 06:50Cornell 与 Google 研究员 Ali Behrouz 在播客中讨论其颠覆性论文《Nested Learning》。该工作被 Jeff Dean…
Latent Space 播客:Axiom Math 在 Putnam 数学竞赛拿满分英文播客 - Latent Space Podcast06-04 03:272025 年成立仅七个月的 Axiom 解决了 Putnam 12 道全部题目(限时内 8/12),12/12 全胜成绩超过顶尖本科生(110/120)和…
Latent Space 播客:Satya Nadella 在 Build 现场谈 MAI 与…英文播客 - Latent Space Podcast06-04 01:13Satya Nadella 首登 Latent Space,与 No Priors 在 Build 现场联播。围绕 MAI 模型技术看点(昨日 AINew…

6. Y Combinator

27 条

标题来源日期摘要
JPEG XL 之旅:开源实验如何塑造图像编码的未来Hacker News06-04 05:55Google 开源博客回顾 JPEG XL 图像编码格式的诞生历程,剖析开源实验如何推动图像编码标准的演化。属于图像编码技术史文章。
数学家的悲歌 – Paul Lockhart (2002) [pdf]Hacker News06-04 05:32Paul Lockhart 2002 年经典文章《数学家的悲歌》PDF 重发于 HN 热榜,批判美国数学教育将创造性学科扭曲为机械训练。与 AI 间接相关。
Ableton 推出 Live 扩展 SDKHacker News06-04 04:39音乐制作软件 Ableton 推出 Live 扩展 SDK,允许第三方开发者扩展 Ableton Live 的功能。与 AI 主题无关。
Show HN:Mnemo – 适用任意 LLM 的本地优先 AI 记忆层(Rust、SQLi…Hacker News06-04 04:32开发者发布开源项目 Mnemo——一个为任意 LLM 提供本地优先 AI 记忆层的工具,基于 Rust、SQLite 和 petgraph 实现。属于 L…
一个以读书为生的人(每两天一本)Hacker News06-04 04:08Lithub 人物访谈:一名职业读书人每两天读完一本书的故事。与 AI 无关。
自托管开发沙箱:带预览 URL,基于 Docker 和 Go,无需 K8sHacker News06-04 03:43GitHub 项目:基于 Docker 与 Go 的自托管开发沙箱方案,提供预览 URL 而无需 K8s。适合自建轻量沙箱场景。
Brume:CM5 平台的 24 复音多音色桌面合成器Hacker News06-04 03:41Brume:面向 CM5 平台的 24 复音多音色桌面合成器产品。与 AI 无关。
Elixir v1.20:渐进式类型语言登场Hacker News06-04 03:02Elixir 1.20 发布,正式成为一门渐进式类型化语言(gradually typed language)。这是 Elixir 类型系统设计的里程碑。…
Rootshell:托管于冰岛的新端到端加密邮件服务Hacker News06-04 02:58Rootshell 是一项托管在冰岛的新端到端加密邮件服务,主打隐私保护。与 AI 无关。
Ted Chiang:人工智能并无意识Hacker News06-04 01:51作家 Ted Chiang 在《大西洋月刊》撰文,从哲学角度论证人工智能并不具备意识。HN 热议的 AI 哲学反思文章。
胚胎如何塑造四肢:基因“刹车”的关键发现Hacker News06-04 01:50蒙特利尔大学发布生物学研究:发现胚胎四肢发育中的“基因刹车”机制。与 AI 无关。
Launch HN:Hyper(YC P26)—— 为 Agent 开发提供企业级“大脑”Hacker News06-04 01:39YC P26 批次新公司 Hyper 在 HN Launch:定位是“公司大脑”,为 Agentic 开发流程提供企业上下文。属于 YC AI 新项目首秀。
Gooey:面向 Zig 的 GPU 加速 UI 框架Hacker News06-04 01:12GitHub 项目 Gooey:面向 Zig 语言的 GPU 加速 UI 框架。与 AI 无关。
Skyvern(YC S23)招募热爱开源的 DevRel 工程师Hacker News06-04 01:01YC S23 公司 Skyvern(开源 AI 浏览器 Agent)招聘热爱开源的创始 DevRel 工程师。属于招聘信息。
Angular v22 发布Hacker News06-04 00:51Angular 框架发布 v22,前端开发者关心。与 AI 无关。
MacBook Neo 太热销,苹果产能翻倍Hacker News06-04 00:33据郭明錤报道,苹果因 MacBook Neo 销量火爆而将产能翻倍。属于消费硬件商业八卦,与 AI 工具链关联较弱。
乐鑫发布 ESP32-S31 芯片Hacker News06-04 00:10乐鑫科技推出新款 ESP32-S31 SoC 芯片,面向嵌入式与物联网场景。与 AI 工具链直接关联较弱。
Let’s Encrypt 走向后量子未来Hacker News06-03 23:06Let’s Encrypt 公布后量子加密证书路线图,准备应对量子计算时代对 TLS 的冲击。属于基础安全话题。
DaVinci Resolve 21 发布Hacker News06-03 22:18Blackmagic 推出视频剪辑软件 DaVinci Resolve 21 新版。视频工具更新,与 AI 工具链弱相关。
我最近被诊断出抗 NMDA 受体脑炎Hacker News06-03 22:10Rust 生态知名作者 burntsushi 公开分享自己罹患抗 NMDA 受体脑炎的经历。属于个人健康分享,无 AI 内容。
Meta 员工可选退最长 30 分钟工作追踪Hacker News06-03 20:42BBC 报道 Meta 内部追踪政策:员工每天最多可选退 30 分钟的工作追踪。属于公司内部管理新闻。
Uber 每月 1500 美元 AI 用量上限揭示工具定价信号Hacker News06-03 20:25Simon Willison 撰文分析 Uber 对员工 AI 工具使用设定 1500 美元/月上限的事件,认为这是 AI 工具定价市场的重要信号。HN …
每一个字节都重要Hacker News06-03 19:04Farid Zakaria 撰文讨论字节级优化的重要性,HN 转载讨论。属于通用系统编程话题。
Pwnd Blaster:用扬声器不接触地黑掉 PCHacker News06-03 18:53安全研究博客展示一种通过扬声器声波远程攻击 PC 的 BadUSB 类技术。HN 热议安全话题。
PlayStation 主机架构解析Hacker News06-03 18:24Rodrigo Copetti 的主机架构系列又一篇:PlayStation 1 详细架构解析。属于经典硬件考古文。
数学家警告:AI 正快速攻陷数学领域Hacker News06-03 18:05Science 杂志报道:数学家发出警告,AI 正以前所未有的速度在数学研究领域取得突破。HN 转载讨论。
图书献辞Hacker News06-02 08:36Hacker News 热帖:作者收集大量图书献辞页面做可视化展示,是文化与互联网档案学的小实验。

7. AI 工具/产品

8 条

标题来源日期摘要
Cline v3.87.0:新增 MiniMax M3 模型支持编程助手 - Cline (GitHub Releases)06-04 04:45Cline 编程助手 VS Code 扩展发布 v3.87.0,新增 MiniMax M3 模型支持,并修复 @xmldom/xmldom、axios 等…
Cline CLI v3.0.16:插件市集、Slack socket、Anthropic 自…编程助手 - Cline (GitHub Releases)06-04 04:33Cline CLI v3.0.16 发布。支持从新的 github.com/cline/plugins 仓库按 slug 安装官方插件,可通过 cline…
GitHub Copilot 在 VS Code 的五月版本汇总编程助手 - GitHub Copilot (专属)06-03 21:30GitHub Copilot 团队总结 VS Code v1.120 到 v1.123 的每周稳定版更新,覆盖 5 月至 6 月初。Agents 模块持续…
超越聊天机器人的直接偏好优化(DPO)框架/平台 - Hugging Face (博客)06-03 20:55Hugging Face 社区博客探讨 DPO 在聊天机器人以外的应用场景,扩展偏好优化的工程实践边界。
Cursor Enterprise 推出 Organizations 组织管理编程助手 - Cursor (博客)06-03 20:00Cursor 为企业版用户推出 Organizations 多组织管理能力,让大公司可以更精细地管理跨部门、跨团队的 Cursor 用户与策略。
为 Reachy Mini 机器人添加 MCP 工具框架/平台 - Hugging Face (博客)06-03 08:00Hugging Face 博客介绍如何为 Pollen Robotics 的 Reachy Mini 桌面机器人接入 MCP(Model Context …
Grok Imagine Video 1.5 上线 Vercel AI Gateway框架/平台 - Vercel (含 AI SDK)06-03 08:00xAI 的 Grok Imagine Video 1.5 现已通过 Vercel AI Gateway 提供。模型可单次从输入图片生成带同步音频的视频,本…
GitHub Copilot 弃用 GPT-4.1编程助手 - GitHub Copilot (专属)06-03 07:58GitHub Copilot 已于 2026 年 6 月 1 日在所有 Copilot 体验(Chat、内联编辑、ask/agent 模式、代码补全)中弃…

8. 知名 AI 个人开发者/研究者

7 条

标题来源日期摘要
Latent Space:超越非形式化 AI – Axiom Math 创始人 Carina …Latent Space (Newsletter)06-04 03:27Latent Space 与 Axiom Math 创始人 Carina Hong 对谈:验证式生成与复利智能。讨论形式化数学 AI 突破点。
Latent Space x No Priors 联播:Microsoft Build 现场对…Latent Space (Newsletter)06-04 01:13传奇微软 CEO Satya Nadella 首次做客 Latent Space,与 No Priors 在 Microsoft Build 现场联合录制。
Uber 限制 Claude Code 等 AI 工具用量以控成本Simon Willison06-03 20:01Simon Willison 撰文延续之前关于 Uber 四个月烧光 2026 全年 AI 预算的话题,分析 Uber 对 Claude Code 等 A…
AINews:微软 Build 与 MAI-Thinking-1 系列模型Latent Space (Newsletter)06-03 13:49Latent Space 的 AINews 复盘微软 Build 大会,重点解读自研 MAI-Thinking-1 推理模型与 MAI 家族技术细节。文章…
datasette-agent-micropython 0.1a0 发布Simon Willison06-03 03:28Simon Willison 发布 datasette-agent-micropython 0.1a0,让 Datasette Agent 能在 Micr…
micropython-wasm 0.1a1 修复版发布Simon Willison06-03 03:20Simon Willison 发布 micropython-wasm 0.1a1,修复了在用其构建 datasette-agent-micropython…
micropython-wasm 0.1a0 发布Simon Willison06-02 11:43Simon Willison 的最新沙箱实验:alpha 包打包了轻定制的 MicroPython WASM 构建,配合 wasmtime 提供代码执行包…

9. YouTube AI 频道

8 条

标题来源日期摘要
微软量子计算新突破比上一代强 1000 倍——Majorana 2 详解TheAIGRID06-04 01:50TheAIGRID YouTube 频道解读微软量子计算芯片 Majorana 2 的最新突破,称其性能比前代提升 1000 倍。属于量子计算科普视频。
认识改变一切的 AI 共同科学家Two Minute Papers06-04 01:00Two Minute Papers 短视频介绍可能颠覆科研的 AI“共同科学家”。属于科普短视频。
更频繁地改变你的想法泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-03 23:21Nikhil Kamath 频道发布的 YouTube Shorts 短视频,标题指向心智模式分享。无 AI 相关描述。
黄金还是比特币更好?泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-03 23:20Nikhil Kamath 频道的 Shorts,讨论黄金与比特币投资对比。与 AI 无关。
大多数人从未问过这个问题泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-03 23:12Nikhil Kamath 频道 Shorts,无描述。从标题看属于心智哲思类。
长子隐藏的重担泛访谈频道(混合内容,需按 AI 相关性评分过滤) - The Diary of a CEO (Steven Bartlett)06-03 22:24Steven Bartlett 的 Diary of a CEO 频道 Shorts,谈家庭长子的心理负担。与 AI 无关。
Claude Opus 4.8:不再是撒谎机器?Two Minute Papers06-03 21:49Two Minute Papers 视频解读 Anthropic Claude Opus 4.8 在减少幻觉与谎言方面的进展。
百亿美元创业公司由 AI Agent 驱动运行泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)06-03 13:0020VC 主持人 Harry Stebbings 发布的 Shorts,谈到一家 100 亿美元估值的创业公司全靠 AI Agent 运行。

10. AI 公司官方博客

16 条

标题来源日期摘要
a16z:世界模型的功能分类法a16z (Substack)06-04 01:46a16z 撰文为世界模型提出功能分类法:渲染器(Renderers)、模拟器(Simulators)、规划器(Planners)以及把它们串联起来的闭环。…
投资 Town:a16z 领投 A 轮a16z (Substack)06-03 22:31a16z 公布领投 Town 的 A 轮融资。属于 a16z 投资动态短文。
小企业是 AI 的下一片疆域a16z (Substack)06-03 22:15a16z 撰文分析为何 AI Agent 还未进入主街小企业,以及如何让 Agent 真正服务于这一长尾市场。文中探讨产品形态、分发、信任建立等关键障碍。
投资 Lassie:a16z 领投 A 轮a16z (Substack)06-03 22:15a16z 公告领投 Lassie 的 A 轮融资。属于 a16z 投资公告短文。
GPT-Rosalind 新增生命科学能力OpenAI06-03 21:15OpenAI 宣布 GPT-Rosalind 增强生物学推理、医药化学、基因组分析与实验工作流能力,专攻生命科学研究场景。属于官方专用模型升级公告。
Wasmer 如何用 Codex 构建边缘 Node.js 运行时OpenAI06-03 20:00OpenAI 官方案例:Wasmer 团队用 Codex 搭配 GPT-5.5 构建边缘部署的 Node.js 运行时,开发速度提升 10x 到 20x,…
OpenAI 公共政策议程发布OpenAI06-03 18:00OpenAI 发布公共政策议程,涵盖安全、青少年保护、劳动力转型、全球标准等主题,旨在确保 AI 惠及社会。属于官方政策立场。
前沿 AI 民主治理蓝图OpenAI06-03 18:00OpenAI 给出美国前沿 AI 治理蓝图,提议建立联邦框架来同时保障安全、韧性与国家安全。属于政策建议文。
绘制 AI 驱动的网络威胁地图:LLM ATT&CK Navigator 的洞察Anthropic (红队)06-03 08:00Anthropic 红队发布过去一年对 AI 驱动网络攻击的调查报告,把现实攻击案例映射到 MITRE ATT&CK 框架。与 Verizon 合作把部分…
Claude Cowork 上手最佳实践Claude Blog06-03 08:00Anthropic 官方发布 Claude Cowork 上手最佳实践指南,介绍如何在团队场景中正确使用 Cowork 协作功能。属于 Cowork 配套…
Claude Code 团队的实战经验:我们如何使用 SkillsClaude Blog06-03 08:00Anthropic 官方分享 Claude Code 团队内部如何运用 Skills 体系的实战经验,从抽象到具体讲述 Skills 在真实工程中的使用模…
Anthropic 如何用 Claude 实现自助式数据分析Claude Blog06-03 08:00Anthropic 官方分享自身如何用 Claude 构建公司内部自助式数据分析能力,让非数据团队也能直接查询和分析数据。对企业落地 Claude 内部赋…
Gemma 4 12B:开发者指南RSSHub 补充路由 - Google AI06-03 08:00Google 发布 Gemma 4 12B 开发者指南。新模型是密集多模态架构,采用无编码器(encoder-free)创新设计,绕过传统视觉与音频编码器…
把 Gemma 4 12B 带到你的笔记本:用 Google AI Edge 解锁本地 Age…RSSHub 补充路由 - Google AI06-03 08:00Google DeepMind 的 Gemma 4 12B 让 16GB 内存笔记本就能跑 Agentic、多模态 AI,本地处理数据与生成可视化洞察。用…
我们绘制一年 AI 网络威胁后学到了什么Anthropic (新闻)06-03 08:00Anthropic 官方公告版本,配合红队 ATT&CK Navigator 长文同步发布,总结一年来对 AI 驱动网络攻击的观察与启示。是面向通用读者的…
Claude 合作伙伴网络推出 Services Track 与 Partner HubAnthropic (新闻)06-03 08:00Anthropic 推出 Claude 合作伙伴网络的 Services Track 服务通道与 Partner Hub 门户,为系统集成商、咨询合作伙伴…

11. AI 研究

48 条

标题来源日期摘要
NewtPhys:基础模型理解牛顿物理吗?HuggingFace 每日论文06-03 01:59论文提出 NewtPhys,一个基于真实场景多视角图像构建的 4D 物理标注数据集,跨时间步提供密集细粒度标注。旨在评估基础模型对低层牛顿力学的真实理解,…
Skill-RM:通过 Agent 技能统一异构奖励模型评估标准HuggingFace 每日论文06-03 01:56论文提出 Skill Reward Model(Skill-RM),将 RFT / RL 流水线中分散的规则验证器、参考答案、清单、复杂 rubric 等…
AlignAtt4LLM:面向 IWSLT 2026 同传任务的 decoder-only L…HuggingFace 每日论文06-03 01:52论文提出 AlignAtt4LLM,针对 IWSLT 2026 英语到德/意/中的同传任务系统。Qwen3-ASR 配强制对齐生成增量源转录,Gemma-…
用奖励不确定性诱导强化学习的多样化行为HuggingFace 每日论文06-03 01:50论文主张将多样性自然理解为奖励分布的不确定性,避免熵正则或启发式多样性奖励对性能的牺牲,可服务于 LLM 微调与科学发现等强调多样性的现代 RL 应用。
用从未发生过的对话高效训练 ASRHuggingFace 每日论文06-03 01:46论文提出生成场景级对话并映射说话人属性到 TTS 声纹的数据增强流水线,把合成语句组装成具说话人感知的模拟对话,用于缓解低资源语言与窄域多说话人 ASR …
VLESA:用于人类活动监控的视觉-语言具身安全 AgentHuggingFace 每日论文06-03 01:42论文提出 VLESA 框架,从第一人称视频监控人类活动,预测危险行为时实时触发安全干预,处理同一动作因意图不同而安全性不同的难题。
FlashbackCL:缓解联邦学习中的时间维度遗忘HuggingFace 每日论文06-03 01:28论文改进 Flashback 联邦学习方法,针对客户端数据分布随时间漂移的非平稳场景,避免按类别累加的标签计数代理在分布迁移下失校准的问题。
用稀疏观测的扩散后验采样修正神经算子频谱偏差HuggingFace 每日论文06-03 01:26论文针对神经算子代理求解 PDE 时的频谱偏差(高频信息被系统性衰减),把 NO 预测视为辅助观测引入扩散后验采样,结合稀疏传感器数据修正。
FFR:用于回归的 Forward-Forward 学习HuggingFace 每日论文06-03 01:15论文把 Hinton 的 Forward-Forward 算法扩展到回归任务,解决连续目标缺乏天然“对立面”做对比学习的难题,提供对反向传播的轻量替代。
高精度 X 射线到 CT 配准的股骨截骨术电磁导航HuggingFace 每日论文06-03 00:53论文提出基于电磁追踪的股骨截骨手术导航系统,配合 CT-X 射线高精度配准,最大限度减少术中暴露与透视次数。
在草垛里找针:生态学中的 transductive 主动标注HuggingFace 每日论文06-03 00:01论文指出生态学场景中现行 inductive 主动学习评估与“尽快为整个池子全部打标”的真实目标错位,主张改用 transductive 评估,并展示忽视…
用 BART 进行 rubric 驱动的 CS1 C++ 编程作业自动评分HuggingFace 每日论文06-02 23:57论文用 LoRA 适配器对 BART 编码-解码器做 rubric 感知的多任务微调,把学生 C++ 作业、分数、字母评级与 rubric 统一编排进序列…
一致性训练可能固化失对齐HuggingFace 每日论文06-02 23:54论文在 108 个被植入受控失对齐行为的 7B-70B 开源模型上测试 7 种一致性训练方法,发现这种自举式训练可能放大不良行为,对当前广泛使用的无标签可…
后门遗忘泛化:移除 LLM 未知触发器的新路径HuggingFace 每日论文06-02 23:38论文展示 LLM 后门通过 unlearning 可跨触发器泛化:训练模型忽略一个已知触发器,同时也能抑制训练时未观测到的其他后门,提供面向未知后门的统一…
从控制边界到保险理赔:用 CER 框架重建 AI 中介损失HuggingFace 每日论文06-02 23:29论文针对组织生成式或 Agentic AI 系统产生的损失,提出 CER 框架做“状态重建”而非简单“事件重建”,以支撑保险理赔。
是 merit 还是关系网决定研究的发表归属?HuggingFace 每日论文06-02 23:18论文用学科训练的 LLM 评估器在文章发表前直接从文本评分其想法质量,绕开发表结果做标尺的循环依赖,从而解开“质量 vs 关系网”对学术发表归属的影响。
通过后验采样的共形语言建模HuggingFace 每日论文06-02 22:49论文把共形预测从后处理过滤升级为与生成融合的过程,避免事后剔除“幻觉声明”造成样本不连贯,从生成阶段就生产可靠的 LLM 输出。
用归因视角重排序提升法律 QA 引用质量HuggingFace 每日论文06-02 22:48论文在 AQuAECHR 法律 QA 基准上发现语义相似度与段落归因度并不强相关,提出基于扰动归因(C-LIME)做重排,提高 RAG 在法律场景的引用质量。
研究多模态大模型的对抗鲁棒性HuggingFace 每日论文06-02 22:34论文指出 MLLM 沿用 CLIP 视觉编码器扩大攻击面,现有防御为兼容性而严格对齐 CLIP 原始嵌入空间,限制可达鲁棒性,并探索更自由的对抗微调方案。
面向命题可废止 standpoint 逻辑的非单调蕴含HuggingFace 每日论文06-02 21:44论文把 Kraus 等人风格的偏好语义与蕴含拓展到模态逻辑,特别针对命题 standpoint 逻辑,引入非单调蕴含以加强推理表达力。
图正则化非负约束 biquaternion 矩阵分解用于彩色图像识别HuggingFace 每日论文06-02 21:44论文在 NRBMF 基础上加入图正则化,引入图像数据的局部几何结构,增强彩色图像低维特征的判别力。
用辅助约束解决大型推理模型的指令遵循问题HuggingFace 每日论文06-02 21:23论文把多指令遵循问题形式化为约束遵循问题(CAP),用结构化约束知识图谱表示指令,提出新框架解决 LRM 平衡冲突约束的难题。
用自动数字重映射攻击测试 LLM 算术推理泛化HuggingFace 每日论文06-02 21:09论文用自动数字重映射构造结构相同但数值不同的算术题,检验 LLM 在无外部工具时的直觉算术鲁棒性,揭示数值敏感性问题。
当注意力坍塌:从结构到语义的阶段感知视觉 token 剪枝HuggingFace 每日论文06-02 20:36论文指出 VLM 视觉 token 剪枝依赖初始注意力分数会让高分集中在语义相似区域,损害特征多样性,提出阶段感知剪枝从结构到语义分层取舍。
随机森林到底要多少棵树?借助 plateau 搜索与 Optuna 集成的新方法HuggingFace 每日论文06-02 20:10论文研究随机森林树数量调优,TPE 与 Hyperband 因预测分数随树数单调上升而把估计推向上界,本工作引入 plateau 搜索结合 Optuna,…
基于模型强化学习的事后鲁棒性HuggingFace 每日论文06-02 19:43论文在 model-based RL 设定中讨论对抗鲁棒性,对手可针对学习到的转移模型而非环境本身实施扰动,构成零和马尔可夫博弈的拓展形式。
EvoMemNav:用于零样本具身导航的高效自演化细粒度记忆HuggingFace 每日论文06-02 19:27论文提出 EvoMemNav 高效自演化细粒度记忆框架,构建保留原始视觉证据的视觉-语义记忆图 VSMGraph,缓解检测器中心场景图压缩过多与 3D 重…
BaltiVoice:Balti 语的语音语料与微调 Whisper ASR 系统HuggingFace 每日论文06-02 19:23论文发布 16.8 小时巴基斯坦 Balti 语朗读语料 BaltiVoice,并在 OpenAI Whisper-small 上微调,将 WER 从 1…
从错误中学习:面向安全代码 LLM 的树状自博弈HuggingFace 每日论文06-02 19:07论文针对 LLM 代码生成容易复现训练数据中漏洞的问题,指出 SFT/RL 的序列级粗粒度优化无法应对漏洞的局部本质(一个错 token 即可毁掉整段程序…
重思 tensor 分解在 LLM 后训练压缩中的作用HuggingFace 每日论文06-02 18:45论文系统评估 tensor 分解在密集与 MoE 架构 LLM 上的后训练压缩效果,给出更可靠的大规模部署判断,弥补此前评估范围狭窄的不足。
和弦序列分析中的调性节俭:结合转调代价与调性词表HuggingFace 每日论文06-02 18:36论文研究和弦序列的局部调性指派任务,比较只最小化转调与最小化词表的两种目标,提出综合“调性节俭”目标,服务于和声分析、作曲与爵士即兴。
局部引导、全局影响:高斯重塑信赖域解锁行为切换HuggingFace 每日论文06-02 17:26论文指出 PPO 在持续与非平稳环境中存在方向上低效的局部更新,提出高斯重塑信赖域以提供几何感知引导,解锁有意义的行为切换。
基于注意力 LSTM 残差连接的语音情绪识别HuggingFace 每日论文06-02 17:08论文提出 ResLSTM-SA 轻量架构,在 LSTM 中融合残差连接与软注意力,在 RAVDESS 数据集上以严格说话人独立划分评估语音情绪识别。
超越语义:从视觉-语言数据建模事实与情感感知经验HuggingFace 每日论文06-02 16:54论文提出 P-Topics 感知主题建模,每段经验由客观事实面与主观情感面共同定义,并训练 PercepT transformer 把图像关联到对应感知经验。
RogueMerge:针对 LLM 模型合并的鲁棒统一攻击HuggingFace 每日论文06-02 16:54论文揭示模型合并把第三方 task vector 直接写入权重的供应链攻击面,任何恶意行为都可被编码进 task vector,提出 RogueMerge…
为下游任务定制严格 proper 评分规则:因果推断的应用HuggingFace 每日论文06-02 16:41论文提出按下游误差度量的局部曲率匹配,派生任务特定的严格 proper 评分规则,并把方法应用于因果推断中倾向得分趋近 0/1 时的高偏差高方差问题。
评估 LLM 在真实消费电子修理问题上的有效性HuggingFace 每日论文06-02 16:40论文构建 991 道来自 Reddit 的真实消费电子修理问答 benchmark,涵盖手机、电脑、数据恢复,每题配技术参考答案,评测 LLM 在安全关键…
从书写系统到语义:面向非洲 NLI 的提示策略HuggingFace 每日论文06-02 16:20论文系统比较 Baseline、Script-Aware、Language Specific、Contrastive、Native-Label Self-…
BA-T:用于双视图 bundle adjustment 的迭代 transformerHuggingFace 每日论文06-02 15:51论文把经典 bundle adjustment 的迭代信息传播视角带入 transformer,提出 BA-T 进行结构化几何精修,提升前馈式 3D 重建…
公共子结构可迁移吗?基于神经向量丛的黎曼图基础模型HuggingFace 每日论文06-02 15:35论文针对图基础模型的结构可迁移性问题,从离散转向连续视角,借助神经向量丛与黎曼几何探讨公共子结构跨图的迁移理论。
in-context 学习中思维链的渐近理论HuggingFace 每日论文06-02 14:23论文在线性回归 in-context 权重预测的可解模型上研究 CoT 推理深度对泛化的影响,将测试时推理视为对权重参数估计的迭代精修,为 CoT 扩展规…
SenseJudge:以人为中心、偏好驱动的判定框架HuggingFace 每日论文06-02 13:48论文针对 LLM-as-judge 依赖固定偏好数据、忽视用户偏好多样性的局限,提出可定制的 SenseJudge 框架及多样 benchmark Sen…
NVIDIA OmniDreams:用于闭环自动驾驶仿真的实时生成世界模型HuggingFace 每日论文06-02 13:11NVIDIA 发布 OmniDreams 实时生成世界模型,用于自动驾驶闭环仿真,突破重建式神经仿真器受限于初始采集数据的瓶颈,为长尾场景安全评估提供新基础。
A²:更小的自监督 ViT 在物体定位上反而胜过更大的HuggingFace 每日论文06-02 12:45论文意外发现更小的自监督 ViT 注意力图在前景物体定位上优于更大 ViT,提出 A² 方法兼取小 ViT 定位与大 ViT 表征丰富性的双重优势。
FAF-CD:不完美多模态遥感下的频率感知融合变化检测HuggingFace 每日论文06-02 11:59论文提出 FAF-CD 频率感知混合框架,采用 DINOv3 预训练 ConvNeXt 编码器与线性复杂度 VMamba 解码,应对 EO-SAR 灾害制…
ZX-Calculus:trace 索引依赖类型与认知语义HuggingFace 每日论文06-02 10:51论文提出 ZX-Calculus(知识演化演算),作为 Martin-Löf 依赖类型论的保守扩展,融合 trace 索引类型、presheaf 非单调语…
TriEval:资源高效的 LLM 偏见、毒性与真实性评测流水线HuggingFace 每日论文06-02 10:21论文提出 TriEval 资源高效流水线,把 LLM 偏见、毒性与真实性三维度评估合并到一个轻量框架中,弥补现有工具单维度或计算昂贵的不足。
从 Agent 轨迹中归纳推理原语HuggingFace 每日论文06-02 09:11论文提出 Reasoning Primitive Induction 单遍方法,从成功 ReAct 轨迹中挖掘高频推理动作并固化为带 docstring …

Generated at 2026-06-04T00:29:34.593Z by RSS Daily AI Digest