jixiaxue 知识库
2026-06-10

AI 日报 | 2026-06-10

AI 日报 | 2026-06-10

63 个来源 | 305 条新内容 | 10 条 AI 精选

Smart Recommendations

1. Anthropic 发布 Claude Fable 5 与 Claude Mythos 5

Anthropic (新闻) | AI 公司官方博客

Anthropic 官宣推出 Claude Fable 5 与 Claude Mythos 5 两款新模型。是重大产品发布。

阅读原文

2. Claude Managed Agents 新增定时运行与环境变量 Vault

Claude Blog | AI 公司官方博客

Claude Managed Agents 新增能力:按计划调度运行 Agent,并通过 vault 存储环境变量,强化生产 Agent 的可运维性。

阅读原文

3. Nextdoor 工程师如何用 Codex 无限构建

OpenAI | AI 公司官方博客

OpenAI 案例:Nextdoor 工程师用 Codex + GPT-5.5 复现难复现 bug、跨平台开发、聚焦产品成果。

阅读原文

4. 介绍 Gemma 4 12B:统一的无编码器多模态模型

Google DeepMind | AI 公司官方博客

Google DeepMind 发布 Gemma 4 12B:一种统一、无编码器(encoder-free)的多模态模型。无详细 description。

阅读原文

5. FrontierCode:衡量代码质量而非数量的新基准

Latent Space (Newsletter) | 知名 AI 个人开发者/研究者

Latent Space 发布 FrontierCode 基准,专注代码质量(mergeability)而非纯产出量,目标衡量编码 Agent 是否产出可合并的高质量代码。

阅读原文

6. 引用 Andrej Karpathy

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 引用 Karpathy 的观点:当软件像水龙头一样随取随用时 Jevon’s paradox 启动,自己对软件的需求反而暴涨——dashboard、可视化、单次性 app 都可以按需生成。

阅读原文

7. 在 AgentsView 中为模型设置自定义价格

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 分享 TIL:在 Wes McKinney 的 AgentsView 工具里手动给新发布的 Claude Fable 5 配置 token 价格,便于跨 coding agent 统计花费。

阅读原文

8. Gemini 3.5 Live Translate:流畅自然的语音翻译

Google DeepMind | AI 公司官方博客

Google DeepMind 公布 Gemini 3.5 Live Translate:在 Google AI Studio、Google Translate、Google Meet 中提供近实时、自然的口语翻译。

阅读原文

9. Codex 在 Notion 的工程实践:从规格到一次成型

OpenAI | AI 公司官方博客

OpenAI 官方博客介绍 Notion 如何使用 Codex 实现一次成型从规格到代码、构建 Web 端 AI Voice Input,并放大小团队工程产能。是 Codex 实战案例。

阅读原文

10. GitHub 对第三方编码 Agent 启用安全校验(GA)

编程助手 - GitHub Copilot (专属) | AI 工具/产品

GitHub Changelog 宣布对第三方编码 Agent(包括 Claude 与 OpenAI Codex)的安全校验正式 GA,仓库内运行的 Agent 行为将获得额外安全检查。

阅读原文

播客精选 Top 5

1. RAG 已死?从税法 AI 建设中学到的经验 - #769

英文播客 - TWIML AI | AI 从业者访谈 / 播客

TWIML AI 与 Sphere 工程负责人 Alex Bowcut 对谈:在百万 token 上下文窗口时代是否还需要 RAG,他用税法 AI 实战说明答案取决于应用场景。

阅读原文

Blog 精选 Top 5

1. Anthropic 发布 Claude Fable 5 与 Claude Mythos 5

Anthropic (新闻) | AI 公司官方博客

Anthropic 官宣推出 Claude Fable 5 与 Claude Mythos 5 两款新模型。是重大产品发布。

阅读原文

2. Claude Managed Agents 新增定时运行与环境变量 Vault

Claude Blog | AI 公司官方博客

Claude Managed Agents 新增能力:按计划调度运行 Agent,并通过 vault 存储环境变量,强化生产 Agent 的可运维性。

阅读原文

3. Nextdoor 工程师如何用 Codex 无限构建

OpenAI | AI 公司官方博客

OpenAI 案例:Nextdoor 工程师用 Codex + GPT-5.5 复现难复现 bug、跨平台开发、聚焦产品成果。

阅读原文

4. 介绍 Gemma 4 12B:统一的无编码器多模态模型

Google DeepMind | AI 公司官方博客

Google DeepMind 发布 Gemma 4 12B:一种统一、无编码器(encoder-free)的多模态模型。无详细 description。

阅读原文

5. FrontierCode:衡量代码质量而非数量的新基准

Latent Space (Newsletter) | 知名 AI 个人开发者/研究者

Latent Space 发布 FrontierCode 基准,专注代码质量(mergeability)而非纯产出量,目标衡量编码 Agent 是否产出可合并的高质量代码。

阅读原文

YC 主题

1. Grit:用 Agent 把 Git 用 Rust 重写

Hacker News | Y Combinator

GitButler 博客介绍 Grit 项目,尝试用 AI Agent 协作把 Git 用 Rust 重写。AI 改造经典工具的实验。

阅读原文

Hacker News | Y Combinator

arXiv 论文:研究 agent harness(运行框架)的设计如何影响 agent 在代码库中做搜索与定位的效果,挑战 RAG 是否仍必要。

阅读原文

3. iPhone 的最后一战?

Hacker News | Y Combinator

Stratechery 由 Ben Thompson 撰写的深度分析,探讨在 AI 时代 iPhone 是否面临核心地位的最后一战。WWDC 后的战略观察文。

阅读原文

4. 亚马逊大规模扁平化数据中心网络架构

Hacker News | Y Combinator

James Hamilton(前 AWS VP)撰文剖析亚马逊在数据中心规模上推动扁平化网络的工程实践,触及 AI 算力网络架构核心。

阅读原文

5. NPM v12 的破坏性变更预告

Hacker News | Y Combinator

GitHub Blog 预告 NPM v12 即将到来的 breaking changes,提醒开发者提前评估升级影响。

阅读原文

a16z 主题

1. 为何编码是 AI 第一个无可争议的应用场景 | a16z

泛访谈频道(混合内容,需按 AI 相关性评分过滤) - a16z | YouTube AI 频道

a16z 讨论为何 AI 编码是当前最先成立的 killer use case。

阅读原文

2. 月末不再是月末

a16z (Substack) | AI 公司官方博客

a16z Substack 文章:探讨现代 ERP 系统如何让财务月结流程从专门事件变成日常普通日子。

阅读原文

1. AI 公司产品更新 / Changelog

49 条

标题来源日期摘要
sdk: v0.104.1Anthropic - anthropic-sdk-typescript06-10 07:55Anthropic TypeScript SDK 0.104.1 修复版本:API 新增 frontier_llm 拒绝类别。属于小版本 bug fix。
v0.109.1Anthropic - anthropic-sdk-python06-10 07:55Anthropic Python SDK 0.109.1 同步修复:API 新增 frontier_llm 拒绝类别。和 TS SDK 配对发布的小补丁。
在 Amazon SageMaker AI 上用 NVIDIA Isaac Lab 扩展机器人…Amazon - AWS Machine Learning Blog06-10 04:07AWS 博客演示如何在 SageMaker HyperPod / Training Jobs 上用 NVIDIA Isaac Lab 训练 Unitree…
sdk: v0.104.0Anthropic - anthropic-sdk-typescript06-10 04:04Anthropic TypeScript SDK 0.104.0 新增 Managed Agents 部署和环境变量凭证支持。Managed Agents…
v0.109.0Anthropic - anthropic-sdk-python06-10 04:04Anthropic Python SDK 0.109.0 新增 Managed Agents 部署和环境变量凭证支持,与 TS SDK 同步。
Amazon SageMaker Unified Studio Notebooks 现支持 E…Amazon - AWS What’s New06-10 02:46AWS 公告:SageMaker Unified Studio Notebooks 新增 EMR Serverless + Spark Connect 运…
[已上线] PostgreSQL Hub for Azure Developers GAMicrosoft - Azure 服务更新(含 AI)06-10 02:45Azure 公告:面向开发者的 PostgreSQL Hub 正式上线,汇总 AI 与应用开发资源、样例 app 与学习路径。
v2.1.170Anthropic - Claude Code (GitHub Releases)06-10 01:23Claude Code v2.1.170:引入 Claude Fable 5(Mythos 等级、面向通用使用)的支持,并修复会话不保存 transcri…
Amazon S3 Access Grants 现已在 AWS 欧洲主权云(德国)区域可用Amazon - AWS What’s New06-10 01:14AWS 公告:S3 Access Grants 扩展至欧洲主权云德国区域,便于将 Entra ID / IAM 身份映射到 S3 数据集权限。
免手操作的 First Notice of Loss:用 Strands Agents 和 A…Amazon - AWS Machine Learning Blog06-10 00:43AWS 博客演示 FNOL 智能理赔系统:Strands Agents SDK 做领域推理,Bedrock AgentCore Browser Tool …
v0.108.0Anthropic - anthropic-sdk-python06-10 00:37Anthropic Python SDK 0.108.0:新增对 claude-mythos-5 和 claude-fable-5 模型的支持,并支持拒绝…
aws-sdk: v0.4.2Anthropic - anthropic-sdk-typescript06-10 00:37Anthropic AWS SDK 0.4.2 小修复:调整第三方 middleware 顺序。
foundry-sdk: v0.3.1Anthropic - anthropic-sdk-typescript06-10 00:37Anthropic Foundry SDK 0.3.1 小修复:调整第三方 middleware 顺序。
bedrock-sdk: v0.30.2Anthropic - anthropic-sdk-typescript06-10 00:36Anthropic Bedrock SDK 0.30.2 小修复:调整第三方 middleware 顺序。
vertex-sdk: v0.17.1Anthropic - anthropic-sdk-typescript06-10 00:36Anthropic Vertex SDK 0.17.1 小修复:调整第三方 middleware 顺序。
sdk: v0.103.0Anthropic - anthropic-sdk-typescript06-10 00:36Anthropic TypeScript SDK 0.103.0:新增对 claude-mythos-5 与 claude-fable-5 的支持,配合服…
用 Amazon Quick 与 New Relic 构建 Agent 化的事故 triage 助手Amazon - AWS Machine Learning Blog06-10 00:10AWS 博客演示用 Amazon Quick + New Relic MCP Server + Asana 构建事故 triage Agent:单条 pr…
AWS FinOps Agent 进入预览版Amazon - AWS What’s New06-09 23:28AWS 推出 FinOps Agent 预览版:回答成本问题、发现优化机会、自动调查异常并按计划执行 FinOps 工作流。
AWS Backup for EKS 上线欧洲主权云(德国)区域Amazon - AWS What’s New06-09 18:00AWS Backup 对 Amazon EKS 的支持扩展到 AWS 欧洲主权云(德国)区域,为该区域 EKS 集群提供策略化备份恢复能力。
Amazon EMR Serverless 支持 Spark Connect 交互式负载Amazon - AWS What’s New06-09 15:00Amazon EMR Serverless 现已支持 Spark Connect 交互式会话,开发者可在 SageMaker Unified Studio…
Gemini for Cloud 发布说明(2026-06-09)Google - Gemini for Cloud Release Notes06-09 15:00Gemini for Cloud 6 月 9 日 changelog:VS Code 插件的若干 bug 修复与轻量增强。
AWS Cost Explorer 接入 Amazon Q 智能成本解读Amazon - AWS What’s New06-09 11:00AWS Cost Explorer 新增「Analyze with Amazon Q」能力,一键由 Amazon Q Developer 解读成本趋势、识…
OpenAI Codex CLI 0.139.0 发布OpenAI - OpenAI Codex Changelog06-09 08:00OpenAI Codex CLI 0.139.0 版本发布。属于 Codex 命令行工具的新版本。
Claude Code v2.1.169:新增 —safe-mode 与 /cdAnthropic - Claude Code (GitHub Releases)06-09 05:57Claude Code v2.1.169 新增 —safe-mode 启动旗标与 CLAUDE_CODE_SAFE_MODE 环境变量,用于禁用所有自定…
AWS Compute Optimizer 新增 6 类资源闲置建议Amazon - AWS What’s New06-09 05:00AWS Compute Optimizer 现已识别 DynamoDB、ElastiCache、MemoryDB、DocumentDB、WorkSpace…
Amazon MSK Express Brokers 支持 Kafka Streams 自动建…Amazon - AWS What’s New06-09 03:36Amazon MSK Express Brokers 即日起支持 Kafka Streams 自动创建 topic,部署有状态流应用无需手工预创建或管理 …
Amazon DocumentDB 推出 5.0.1 引擎小版本Amazon - AWS What’s New06-09 02:59Amazon DocumentDB(MongoDB 兼容)发布 5.0.1 引擎小版本,新增 $rand、$pow 等聚合运算符及活跃连接监控指标。
Azure NCv6 系列 RTX PRO 6000 Blackwell GPU VM 正式可用Microsoft - Azure 服务更新(含 AI)06-09 02:15Azure 在东南亚与 West US 2 区域 GA 全新 NCv6 系列 VM,搭载 NVIDIA RTX PRO 6000 Blackwell GP…
Azure Premium SSD v2 磁盘正式支持非可用区虚拟机Microsoft - Azure 服务更新(含 AI)06-09 02:00Azure Premium SSD v2 磁盘现已在部分可用区区域支持非可用区、单实例虚拟机部署,客户无需选择可用区即可使用 Premium SSD v2。
Amazon CloudWatch Logs Insights 新增 23 个查询命令与函数Amazon - AWS What’s New06-09 01:50CloudWatch Logs Insights 查询语言扩展 23 个新命令与函数,增强日志解析、转换与分析能力。
AWS Savings Plans 购买分析器新增目标覆盖率分析Amazon - AWS What’s New06-09 01:16AWS 账单与成本管理中的 Savings Plans 购买分析器新增目标覆盖率分析能力,帮助按覆盖率规划购买。
Microsoft Foundry 智能体安全能力将转入 Microsoft Agent 36…Microsoft - Azure 服务更新(含 AI)06-09 01:15自 2026 年 7 月 1 日起,Microsoft Defender for Cloud 中的 Foundry 智能体安全能力将迁移到 Microso…
Azure Site Recovery 支持配备 NVMe 磁盘控制器的 Linux 虚拟机Microsoft - Azure 服务更新(含 AI)06-09 01:15Azure Site Recovery 现可对运行在 NVMe 第二代虚拟机系列(Da/Ea/Fa v6、Ebsv5/Ebdsv5 等)上的 Linux …
Azure PostgreSQL 数据库正式支持维护控制:改期/按需执行/查看下载Microsoft - Azure 服务更新(含 AI)06-09 01:15Azure Database for PostgreSQL 灵活服务器的维护控制能力正式发布,提供更细粒度的可见性和灵活度。
Amazon RDS 预览环境上线 PostgreSQL 19 Beta 1Amazon - AWS What’s New06-09 01:03Amazon RDS for PostgreSQL 19 Beta 1 现已在 RDS 数据库预览环境中可用,便于早期测试。
AWS Lambda 托管实例扩展到更多 AWS 区域Amazon - AWS What’s New06-09 01:00AWS Lambda Managed Instances (LMI) 已在除少数区域外的所有商业 AWS 区域可用。
AWS 应用迁移服务更名为 AWS Transform MGNAmazon - AWS What’s New06-09 01:00AWS Application Migration Service (MGN) 更名为 AWS Transform MGN,反映其作为 AWS Trans…
Amazon Aurora DSQL 支持带压缩的 JSONB 数据类型Amazon - AWS What’s New06-09 01:00Aurora DSQL 引入对 PostgreSQL JSONB 数据类型的支持(可选压缩),便于现有 JSONB 代码迁移。
AWS 推出 AI 驱动的成本异常调查Amazon - AWS What’s New06-09 00:41AWS Cost Anomaly Detection 集成 Amazon Q,使用 AI 自动分析成本异常的根因。
解锁欧洲 AI 灵活性:EU 数据处理与模型访问的跨区域推理指南Amazon - AWS Machine Learning Blog06-09 00:40讲解如何在欧盟数据合规约束下,通过 AWS 跨区域推理获取最新生成式 AI 模型与算力。
现在可以放心关上电脑:在 Amazon Bedrock AgentCore 上托管编码 AgentAmazon - AWS Machine Learning Blog06-09 00:35Bedrock AgentCore Runtime 为每个 Agent 会话提供独立 microVM、持久化工作区、安全工具网关与可观测性,可托管运行 C…
大规模决策:数学优化在直觉失灵处的价值Amazon - AWS Machine Learning Blog06-09 00:31AWS Innovation Center 介绍数学优化在更广 AI 蓝图中的定位,并分享与客户的成功案例。
Amazon Connect 为自助语音交互提供 AI Agent Trace 详情Amazon - AWS What’s New06-09 00:17Amazon Connect Customer 为自助语音交互提供 AI Agent 推理与响应过程的 trace,便于理解对话决策。
Azure Managed Redis 预览支持基于 Entra ID 的数据 RBACMicrosoft - Azure 服务更新(含 AI)06-09 00:15Azure Managed Redis 现支持通过 Microsoft Entra ID 配置数据访问 RBAC,摆脱共享密钥。
Amazon Quick ARN:跨账号迁移与命名空间权限Amazon - AWS Machine Learning Blog06-09 00:07介绍 Amazon Quick ARN 的结构与心智模型,帮助开发者理解 ARN 在跨账号迁移和命名空间权限中的含义。
无需麦克风:规模化评估 Amazon Nova Sonic 语音 AgentAmazon - AWS Machine Learning Blog06-08 23:57AWS 开源 Nova Sonic Test Harness,用于规模化调优语音 Agent 的系统 prompt、工具配置和评估流程。
Amazon Redshift 降低 Serverless 与 RG 实例的手动快照费用Amazon - AWS What’s New06-08 23:00Redshift Serverless 等推出新的增量手动快照计费模型,降低存储成本。
Amazon RDS for SQL Server 迁移成本评估在 AWS Transform 上线Amazon - AWS What’s New06-08 15:00AWS Transform 通过 AI Agent 提供本地 SQL Server 迁移到 RDS 的成本评估。
Gemini for Cloud 6 月 8 日更新:Gemini 3.5 Flash 正式可用Google - Gemini for Cloud Release Notes06-08 15:00Gemini 3.5 Flash 在 Gemini Code Assist (VS Code/IntelliJ) 中正式可用,可用于 Agent 模式、C…

2. 新闻媒体

70 条

标题来源日期摘要
我试用了 Siri AI,目前确实可用英文科技媒体(AI 频道) - The Verge AI06-10 07:43The Verge 实测新版 Siri AI,称其能从邮件或宣传单中一键把活动加入日历,是家长们最期待的功能。WWDC 2026 后首批可用体验。
Justin Ernest 如何在没有传统 VC 基金的情况下向热门初创公司投了近 4 亿美元英文科技媒体(AI 频道) - TechCrunch AI06-10 07:17Sabertooth VC 创始人 Justin Ernest 用 LP 私域网络代替正式募资,投资 Anthropic、Anduril、SpaceX 等…
GM:电动车 V2G 技术可帮助抵消 AI 的能耗压力英文科技媒体(AI 频道) - The Verge AI06-10 05:00通用汽车在旧金山宣布激活 V2G(车辆到电网)能力,向 AI 数据中心日益增长的电力需求提供储能缓冲。
嘿 Siri,这才是我想要的 AI英文科技媒体(AI 频道) - TechCrunch AI06-10 04:50TechCrunch 作者吐槽:想要一个真正贴心的 AI 助手,但又担心自己变成离不开它的人。WWDC 后的个人反思。
Anthropic Fable 5 可以一键生成奇趣视频游戏英文科技媒体(AI 频道) - TechCrunch AI06-10 04:37TechCrunch 报道:Anthropic 新发布的 Claude Fable 5 在 vibe coding 游戏生成上表现突出,能一键造出怪趣味十…
微软 AI 负责人指责 Anthropic 把 Claude 当作有意识的英文科技媒体(AI 频道) - The Verge AI06-10 04:24微软 AI CEO Mustafa Suleyman 在 Decoder 节目批评 Anthropic 在 Claude 的 constitution 中…
Anthropic 称这些话题对 Fable 5 太危险,禁止讨论英文科技媒体(AI 频道) - Ars Technica AI06-10 03:20Ars Technica 报道:Anthropic 新发布的 Fable 5 拒绝回答网络安全、生物与化学领域的敏感问题。前沿模型安全策略说明。
科技公司能学会爱上更便宜的 AI 模型吗?英文科技媒体(AI 频道) - TechCrunch AI06-10 02:56TechCrunch 分析:若同样的 AI 工作负载可由更便宜的模型完成而不损失质量,AI 经济学将发生根本转变。
WWDC 2026:Siri AI、iOS 27、Apple Intelligence 等全部要点英文科技媒体(AI 频道) - TechCrunch AI06-10 02:04TechCrunch 汇总 WWDC 2026 全部公告,主线是焕新的 Siri 助手以及大量 Apple Intelligence 能力。
Apple 拥抱 AI 照片编辑的幻想英文科技媒体(AI 频道) - The Verge AI06-10 00:13The Verge 评论 WWDC 2026:Apple 推出 AI 照片编辑能力,意味着公司不再坚持照片必须真实记录现实的立场。
FAANG 已死,现在是 MANGOS英文科技媒体(AI 频道) - TechCrunch AI06-10 00:09TechCrunch 玩梗:随着 SpaceX、Anthropic、OpenAI 都瞄准巨型 IPO,新的科技巨头组合可能称为 MANGOS。
微软 AI 负责人收回关于 AI 取代白领工作的言论英文科技媒体(AI 频道) - The Verge AI06-09 22:54The Verge:Mustafa Suleyman 在 Decoder 后澄清此前关于 AI 会自动化律师、会计、PM 工作的表述,改称 AI 是帮助完…
Apple 的 AI 承诺终于差不多兑现了英文科技媒体(AI 频道) - The Verge AI06-09 22:18The Verge:Apple 在 WWDC 公布大量 AI 能力,主要围绕新版 Siri AI,但更多在追赶友商。
Sandstone 融资 3000 万美元,把 AI 带给企业内部法务团队英文科技媒体(AI 频道) - TechCrunch AI06-09 21:47TechCrunch:Sandstone 完成 A 轮 3000 万美元融资,距 Sequoia 领投的种子轮仅六个月,专注 in-house 法务 AI。
内蒙跑通AI逆袭新解法中文 AI 媒体 - 量子位06-09 21:40量子位:探讨全行业 token 焦虑下,内蒙古通过新模式跑通 AI 算力供给的逆袭路径。
Apple 最好的 AI 创意看起来很像 vibe coding英文科技媒体(AI 频道) - The Verge AI06-09 21:34The Verge:Apple 在 WWDC 把多数 AI 功能补齐到行业平均,但 Shortcuts 结合 AI 用 Safari 标签做的自动化最像 …
理想智驾一号位创业,落户北京亦庄了中文 AI 媒体 - 量子位06-09 21:20量子位:原理想智能驾驶一号位创业的具身智能公司 10 天内跻身独角兽,落户北京亦庄。
Apple 声称 AI 在 Google 服务器上运行时仍保持隐私英文科技媒体(AI 频道) - Ars Technica AI06-09 21:05Ars Technica:Apple 解释部分 Apple Intelligence 模型在 Google 云上运行,但通过架构设计确保 Google 无…
Lovable 称已达 5 亿美元年化营收,每周新增 100 万个项目英文科技媒体(AI 频道) - TechCrunch AI06-09 21:00TechCrunch:vibe coding 平台 Lovable 宣布 ARR 突破 5 亿美元,用户在上面构建业务并替代内部软件。
Apple 的 AI 承诺能否兑现,关键在于隐私英文科技媒体(AI 频道) - The Verge AI06-09 20:55The Verge:WWDC 主旋律是 AI,Apple 把姗姗来迟包装为隐私领先,将私有云计算作为差异化卖点。
一个电动滑板车创始人如何融资 500 万美元造太空数据中心英文科技媒体(AI 频道) - TechCrunch AI06-09 20:00TechCrunch:Spin 创始人 Euwyn Poon 创办 Orbital,计划部署 1 万个太空数据中心。
300 美元跑通世界模型,比 NVIDIA 方案便宜 10 倍中文 AI 媒体 - 新智元06-09 19:00新智元报道一种以约 300 美元成本运行世界模型的方案,号称比 NVIDIA 同类方案便宜 10 倍。聚焦低成本世界模型部署路线。
国产 4B 端侧认知模型号称对标 GPT-5.4中文 AI 媒体 - 新智元06-09 19:00新智元报道一个 4B 参数级别的国产端侧认知模型,宣称性能可比肩 GPT-5.4,目标对接苹果端侧 AI 场景。
Alex Vindman 竞选参议员的政治访谈英文科技媒体(AI 频道) - Wired AI06-09 18:30Wired 的政治人物访谈,与 AI 完全无关。
在人机混合企业中学习领导力英文科技媒体(AI 频道) - MIT Technology Review AI06-09 18:20MIT Tech Review 分析 AI Agent 采用预计两年内增长 300%,企业领导层需思考人机混合劳动力的协同与治理挑战。
亚马逊员工呼吁西雅图暂停新建数据中心英文科技媒体(AI 频道) - The Verge AI06-09 18:00西雅图市议会本周表决是否对新建数据中心实施一年禁令,亚马逊员工成为该议案的强力支持者。反映 AI 算力扩张引发的社区争议。
你应该知道的 AI 五件事(SXSW London 演讲)英文科技媒体(AI 频道) - MIT Technology Review AI06-09 17:16MIT Tech Review 编辑在 SXSW London 演讲中梳理当前 AI 五大核心趋势,并引用 AI10 年度榜单的若干案例。属于趋势综述文。
AppLovin 创始人专访:低调硅谷 CEO 撑起最赚钱 AI 广告公司中文 AI 媒体 - 量子位06-09 17:12量子位刻画一位低调硅谷 CEO 管理最赚钱 AI 广告公司的成长故事,强调内向气质与商业成功的反差。
教育大模型公司亮相腾讯云 AI 产业大会中文 AI 媒体 - 量子位06-09 15:11量子位报道某教育大模型创业公司在腾讯云大会上的学习 Agent 方案介绍。属于公关稿。
国产 4B 端侧认知模型号称兑现 Karpathy 预言中文 AI 媒体 - 量子位06-09 12:17量子位报道一个 4B 参数端侧部署的国产「认知模型」,效果对标 GPT-5.4,呼应 Karpathy 对认知模型的预言。
小红书孵化 RED Skill:内容平台长出 GitHub 形态中文 AI 媒体 - 量子位06-09 12:07量子位报道小红书的 RED Skill 项目,定位类似平台内的 GitHub,预计 7 月全量上线。强调内容平台延伸出技能/Agent 生态。
国产通用大模型第一梯队迎来新选手中文 AI 媒体 - 量子位06-09 10:55量子位关注一家以「智能密度 × Token 价值」为卖点、不卷参数规模的国产大模型新选手进入第一梯队。
DeepSeek 招募土木工程师筹建 GW 级数据中心中文 AI 媒体 - 量子位06-09 10:39量子位披露 DeepSeek 开始招聘土木工程方向人才,准备自建 GW 级数据中心,对标 Musk、Microsoft 的大算力路线。
苹果稳扎稳打的 AI 战略开始看起来很聪明英文科技媒体(AI 频道) - TechCrunch AI06-09 09:56TechCrunch 评析 WWDC 后 Apple 慢节奏 AI 路线的合理性,认为「AI glow-up」让外界对苹果掉队的论调有所缓和。
腾讯统一企业 AI 入口的全栈智能体战略中文 AI 媒体 - 量子位06-09 09:24量子位报道腾讯希望以单一入口串起全栈智能体能力,给企业 AI 提供统一打开方式。属于厂商战略 PR。
清华提出多模态对抗:一件衣服骗过可见光与热成像检测器中文 AI 媒体 - 新智元06-09 09:00新智元介绍清华团队提出的多模态对抗方法,通过特制服装同时欺骗可见光和热成像目标检测器。属于学术研究报道。
OpenAI 秘密递表冲刺万亿 IPO,Altman 许诺人手一个 AGI中文 AI 媒体 - 新智元06-09 09:00新智元报道 OpenAI 已秘密提交 IPO 草案,估值有望冲击万亿,Sam Altman 重申 AGI 普及愿景。
Mercor 创始人指控 Sequoia 估值「双价」操作英文科技媒体(AI 频道) - TechCrunch AI06-09 08:45TechCrunch 报道 Mercor 创始人 Brendan Foody 公开指控 Sequoia 在估值上以「双价」方式售出同一批股权,是 AI 投…
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
瓶颈不再是模型,而是模型周围的工作流AI 专业媒体/Newsletter - TLDR AI06-09 08:00TLDR AI 摘录观点:当下 AI 应用的瓶颈已从模型本身移动到围绕模型的工作流设计与编排。
OpenAI 递表同时 Sam Altman 的 Worldcoin 公司传裁员英文科技媒体(AI 频道) - TechCrunch AI06-09 06:41TechCrunch 报道在 OpenAI 递交 IPO 之际,Sam Altman 旗下身份验证公司 Tools for Humanity 因营收挣扎正…
WWDC 后:苹果 2.5 亿和解后 AI 演示更接地气英文科技媒体(AI 频道) - TechCrunch AI06-09 06:39TechCrunch 评论 WWDC 2026 的 AI 演示在经历 2.5 亿美元虚假广告和解后显得更克制、更真实,比往年少了画饼成分。
OpenAI 紧随 Anthropic、SpaceX 秘密递交 IPO英文科技媒体(AI 频道) - Wired AI06-09 05:31Wired 报道 OpenAI 已秘密递交 IPO 文件,紧随 Anthropic 一周前的相同动作。
OpenAI 跟进 Anthropic 秘密递交 IPO英文科技媒体(AI 频道) - TechCrunch AI06-09 05:29TechCrunch 报道 OpenAI 秘密递交 IPO 文件,相距 Anthropic 同样动作仅一周,凸显两家 AI 巨头的资本市场赛跑。
WWDC 复盘:苹果在补课英文科技媒体(AI 频道) - TechCrunch AI06-09 05:15TechCrunch 评论 WWDC 主基调是修复与性能改进,AI 升级版 Siri 仅作为更广泛软件改进的一部分推出,整体节奏更像追赶。
苹果以更便宜 AI 吸引中小开发者英文科技媒体(AI 频道) - TechCrunch AI06-09 04:53TechCrunch 报道:Apple 为下载量低于 200 万的 App Store 开发者豁免云端 AI API 费用,押注便宜 AI 留住中小开发者。
Apple 发布更对话化的 Siri AI英文科技媒体(AI 频道) - Ars Technica AI06-09 03:30Ars Technica 报道 Apple 在 WWDC 推出新一代「Siri AI」,主打更自然的对话能力,配套秋季上线、双层 Google 驱动 AI…
Google NotebookLM 接入 Gemini 3.5 与 Antigravity英文科技媒体(AI 频道) - Ars Technica AI06-09 03:00Ars Technica 报道 NotebookLM 获得 Gemini 3.5 与 Antigravity 升级,目前仅限 AI Ultra 与企业账号可用。
Apple 让 iPhone 自动续写文本、照片与工作流英文科技媒体(AI 频道) - TechCrunch AI06-09 02:48TechCrunch 概览 Apple 在 Safari、Shortcuts、Password 等应用中新增的 AI 续写、续图与续流功能。
Apple 新版 Shortcuts:用提示词构建 AI 工作流英文科技媒体(AI 频道) - TechCrunch AI06-09 02:45TechCrunch 报道:新版 Shortcuts 获得 AI 升级,用户可用自然语言描述目标工作流并由 AI 生成完整 Shortcut。
Apple Image Playground 不再难用英文科技媒体(AI 频道) - TechCrunch AI06-09 02:38TechCrunch 评 Apple Image Playground 改版后在质量上显著提升,开始具备和主流图像生成器竞争的能力。
Microsoft 包再现凭据窃取恶意代码英文科技媒体(AI 频道) - Ars Technica AI06-09 02:34Ars Technica 报道:73 个 npm/Microsoft 包被植入凭据窃取恶意脚本,只要 AI Agent 打开包就会触发自复制 stealer。
Wired 解读:新 Siri AI 准备走向个性化英文科技媒体(AI 频道) - Wired AI06-09 02:17Wired 长文解读 WWDC 2026 的 Siri 改版:独立 App、Google Gemini 合作以及整体个性化路线。
英国押注十亿美元 AI 超算以摆脱对美国技术依赖英文科技媒体(AI 频道) - Wired AI06-09 01:44英国政府推出国家级基础设施计划,斥巨资建设本土 AI 超算并扶持国产芯片创业公司。
WIRED 报道后 Meta 从智能眼镜 App 中删除人脸识别系统英文科技媒体(AI 频道) - Wired AI06-09 01:31Meta AI 智能眼镜伴侣 App 最新版本已移除 WIRED 此前披露的人脸识别相关代码,Meta 未说明原因。
“聊天已死”:OpenAI 准备彻底改造 ChatGPT英文科技媒体(AI 频道) - Ars Technica AI06-08 21:51OpenAI 将在潜在 IPO 前把 ChatGPT 改造为通向高毛利产品的入口,重塑产品形态。
Import AI 460:奖励欺骗社会、Anthropic RSI 数据与 RL 四旋翼竞速AI 专业媒体/Newsletter - Import AI (Jack Clark)06-08 20:31Jack Clark 的 Import AI 第 460 期讨论奖励欺骗的社会影响、Anthropic RSI 数据与基于强化学习的四旋翼竞速。
气象与气候科学的 AI 革命其实并不革命英文科技媒体(AI 频道) - Ars Technica AI06-08 19:00Ars Technica 检视机器学习在气象气候领域的实际使用与局限。
妈妈网红把 AI 包装成比丈夫更好的”育儿伙伴”英文科技媒体(AI 频道) - Wired AI06-08 18:30Wired 报道一些母亲网红把 ChatGPT 当作”育儿合伙人”,并贩卖相关课程。

3. YouTube AI 频道

18 条

标题来源日期摘要
Anthropic 真的发布了…Matthew Berman06-10 07:02Matthew Berman YouTube 视频,谈论 Anthropic 当天发布的新模型 Claude Fable 5。无 description。
Mythos 正式发布Matthew Berman06-10 05:36Matthew Berman YouTube short:宣布 Anthropic Mythos(Claude Mythos 5)正式上线。
MYTHOS 上线啦!!!!Matthew Berman06-10 03:17Matthew Berman 视频:兴奋宣布 Anthropic Claude Mythos 5 上线,预告将做实测。
每次以为追上 AI 新闻…Matthew Berman06-09 23:38Matthew Berman YouTube short 段子:感叹 AI 新闻刷新速度太快。
仿制药、Ozempic 与拖住印度的恐惧 | WTF is Pharma? | 预告泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-09 23:00Nikhil Kamath 新节目预告:讨论印度仿制药产业、Ozempic 等话题。与 AI/技术无关。
餐厅成为新的娱乐中心泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-09 19:43Nikhil Kamath 的 YouTube Shorts 讨论餐厅作为新型娱乐空间的趋势。与 AI 内容无关。
Shahrukh Khan 与 Hyundai 的合作故事泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-09 13:42Nikhil Kamath Shorts 讲述印度明星 SRK 与 Hyundai 的合作。与 AI 无关。
宝莱坞需要原创剧本泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-09 13:38Nikhil Kamath Shorts 讨论宝莱坞剧本原创性,与 AI 无关。
Nebius 面临的最大威胁泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)06-09 13:00Harry Stebbings 在 20VC Shorts 中谈论 Nebius(AI 云算力公司)面临的最大威胁。属于 AI 投资观察。
Matthew Berman:只有最强的人在用这些 AI 工具Matthew Berman06-09 10:01Matthew Berman YouTube 视频,盘点高端用户在使用的 AI 工具组合。
Harry Stebbings 短片:AI 正在改变教育泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)06-09 02:06Harry Stebbings 20VC Shorts 讨论 AI 对教育的冲击,属观点短片。
每个印度人都玩过的游戏泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-08 23:35Nikhil Kamath 的 YouTube Shorts 关于印度本土游戏的话题。
“谁能与 NVIDIA 抗衡…”泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)06-08 22:5420VC Shorts 片段,讨论谁有能力挑战 NVIDIA 的地位。
Nebius 联合创始人谈 AI 基础设施泡沫与算力需求价格弹性泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)06-08 22:5220VC 对话 Nebius 联合创始人,讨论 AI 基础设施泡沫与算力需求的价格弹性。
为何编码是 AI 第一个无可争议的应用场景 | a16z泛访谈频道(混合内容,需按 AI 相关性评分过滤) - a16z06-08 22:30a16z 讨论为何 AI 编码是当前最先成立的 killer use case。
为什么我偏爱印度本土品牌 | Nikhil Kamath泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-08 21:53Nikhil Kamath 谈个人为何更偏爱印度本土消费品牌。
宝莱坞正在失去魔力吗?泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath06-08 21:42Nikhil Kamath Shorts 讨论宝莱坞影响力的衰退。
紧急辩论:中产之死!只有 1% 顶端能幸存!泛访谈频道(混合内容,需按 AI 相关性评分过滤) - The Diary of a CEO (Steven Bartlett)06-08 15:00Steven Bartlett 主持的关于中产消亡的紧急辩论,话题偏经济与社会。

4. Y Combinator

24 条

标题来源日期摘要
AI 误识别导致错误逮捕,男子寻求正义Hacker News06-10 06:37地方新闻:一名男子因 AI 面部识别误判被错误逮捕,正寻求法律救济。AI 司法风险案例。
再见软件黑客松,硬件黑客松万岁Hacker News06-10 06:35独立博客作者认为 AI 让软件 hackathon 失去意义,硬件 hackathon 才是新前沿。讨论 AI 对开发者活动的影响。
Exif SmugglingHacker News06-10 05:06GitHub POC 项目演示通过 EXIF 元数据偷渡数据/payload 的攻击手法。安全研究小工具。
某公司将给 ALPR 加入手机、AirPod、智能手表追踪Hacker News06-10 05:01404 Media 报道:一家公司将把蓝牙手机、AirPod、智能手表的 MAC 追踪能力集成进车牌识别系统(ALPR),引发隐私争议。
NPM v12 的破坏性变更预告Hacker News06-10 05:01GitHub Blog 预告 NPM v12 即将到来的 breaking changes,提醒开发者提前评估升级影响。
Grit:用 Agent 把 Git 用 Rust 重写Hacker News06-10 03:58GitButler 博客介绍 Grit 项目,尝试用 AI Agent 协作把 Git 用 Rust 重写。AI 改造经典工具的实验。
通过 Kolmogorov-Arnold Networks 实现 FPGA 上的超快机器学习Hacker News06-10 03:21独立研究博客介绍如何将 KAN(Kolmogorov-Arnold 网络)部署到 FPGA,获得超低延迟 ML 推理,适用于物理实验等场景。
Ask HN:你还在用 Vision Pro 吗?Hacker News06-10 02:47HN 讨论:Vision Pro 一年后还有多少人在用?社区分享真实使用感受。
认为 AI 能替代员工的 CEO,只是糟糕的 CEOHacker News06-10 02:45Techdirt 评论:那些声称 AI 可完全替代员工的 CEO 暴露了自身管理能力的缺失。
LD_DEBUG 环境变量 (2012)Hacker News06-10 01:29老博文介绍 Linux 动态链接器调试变量 LD_DEBUG 的用法,HN 重新翻出讨论。
Launch HN:Transload (YC P26) – 用 CCTV 测量货物尺寸Hacker News06-10 00:28YC P26 创业公司 Transload 的 HN 发布帖,用现有 CCTV 摄像头自动测量货物体积,用于物流装载优化。
Biff.core:Clojure web 应用的系统组合Hacker News06-10 00:12Biff 框架推出 core 模块:用 Clojure 进行系统组合(system composition)的 web 应用骨架。
FCC 想通过强制电信运营商核验所有客户身份杀死预付费匿名手机Hacker News06-09 23:21404 Media 报道:FCC 拟要求电信公司核验所有用户身份,等于终结匿名 burner phone。
Grep 就够了吗?Agent Harness 如何重塑 Agentic SearchHacker News06-09 21:27arXiv 论文:研究 agent harness(运行框架)的设计如何影响 agent 在代码库中做搜索与定位的效果,挑战 RAG 是否仍必要。
Emerge Career (YC S22) 招聘 Founding Growth MarketerHacker News06-09 20:01YC S22 公司 Emerge Career 招聘首位增长营销负责人。
Show HN:Gravity – 交互式太阳系模拟器,从牛顿到爱因斯坦Hacker News06-09 19:46HN Show:可在浏览器交互的太阳系模拟器,支持从牛顿力学切换到广义相对论视角。
测试用例缩减器:被低估的调试利器Hacker News06-09 19:27Laurie Tratt 撰文论述测试用例缩减器(test-case reducer)作为调试工具的价值,认为这类自动缩减失败用例的工具被广泛低估。属于软…
用 1993 年的方式做图形:复古 3D 编程Hacker News06-09 18:46独立博客记录复古风格 3D 图形渲染实践,复现 1993 年时代的画面风格。属于图形编程深度文。
iPhone 的最后一战?Hacker News06-09 18:08Stratechery 由 Ben Thompson 撰写的深度分析,探讨在 AI 时代 iPhone 是否面临核心地位的最后一战。WWDC 后的战略观察文。
亚马逊大规模扁平化数据中心网络架构Hacker News06-09 11:39James Hamilton(前 AWS VP)撰文剖析亚马逊在数据中心规模上推动扁平化网络的工程实践,触及 AI 算力网络架构核心。
Let’s Encrypt 禁止在美国制裁地区使用证书Hacker News06-09 06:32Let’s Encrypt 服务协议 v1.7 更新,明确禁止在美国制裁地区使用其签发证书。属于互联网基础设施合规变更。
巨星可能以宇宙最罕见爆炸方式自毁Hacker News06-09 05:00Phys.org 天文新闻:一颗巨星可能以宇宙中最罕见的爆炸方式自我毁灭。与 AI 无关。
关于电邮地址我们对自己撒的谎Hacker News06-08 22:24深度盘点开发者对电子邮件地址格式与解析的常见错误假设。
Blaise v0.10.0:原生后端、线程与增量编译Hacker News06-08 20:55Blaise 编程语言 v0.10.0 发布,新增原生后端、多线程支持和增量编译。

5. GitHub 开源项目 Releases(Atom Feed)

30 条

标题来源日期摘要
v1.11.0.dev0AI 框架 & 编排 - Langflow06-10 06:30Langflow 1.11.0.dev0 nightly 预发布版本,无具体改动说明。
langchain-perplexity==1.4.0AI 框架 & 编排 - LangChain06-10 05:22LangChain Perplexity 集成 1.4.0 发布。常规小版本,无突出特性。
langchain-openai==1.3.0AI 框架 & 编排 - LangChain06-10 04:40LangChain OpenAI 集成 1.3.0 发布,主要修复对 langchain-core 的最低版本依赖。
langchain-core==1.4.3AI 框架 & 编排 - LangChain06-10 04:32LangChain core 1.4.3 小版本发布,常规修复。
1.10.0AI 框架 & 编排 - Langflow06-10 03:59Langflow 1.10.0 正式版:新增允许用户为 flow 快照命名等改进。
1.14.7a4AI Agent 框架 - CrewAI06-10 03:58CrewAI 1.14.7a4 预发布:迁移 @listen/@router 运行时改读 FlowDefinition,新增可插拔默认 backend。
b9585推理引擎 & 本地 AI - llama.cpp06-10 02:16llama.cpp b9585:修复 Granite speech 模型推理在不使用 deepstack 时的 embedding scale 问题。
b9584推理引擎 & 本地 AI - llama.cpp06-10 01:08llama.cpp b9584:修复 Windows release CI 流程。
n8n@2.26.1AI 框架 & 编排 - n8n06-09 23:53n8n 2.26.1 小版本,无 changelog,疑似 CI 修复。
b9581推理引擎 & 本地 AI - llama.cpp06-09 21:45llama.cpp b9581:Vulkan 减少 iq1 在 mul_mm 中的共享内存使用。
b9580推理引擎 & 本地 AI - llama.cpp06-09 21:09llama.cpp b9580:Vulkan 在 matmul 与 Flash Attention 上新增 v_dot2_f32_f16 支持。
b9578推理引擎 & 本地 AI - llama.cpp06-09 20:42llama.cpp b9578:mtmd 重构视频子流程处理。
b9577推理引擎 & 本地 AI - llama.cpp06-09 20:11llama.cpp b9577:server 支持将 prompt 日志写入目录。
llama.cpp b9575:新增 GGML_OP_COL2IM_1D 算子推理引擎 & 本地 AI - llama.cpp06-09 19:43llama.cpp 最新构建版本 b9575,在 ggml 中新增 GGML_OP_COL2IM_1D 算子。属于底层算子层面的增量更新,主要面向推理引擎…
n8n 2.25.6 发布:编辑器与节点修复AI 框架 & 编排 - n8n06-09 18:53n8n 2.25.6 patch 版本,主要修复 markdown 编辑器复制选择文本等若干 bug。
n8n 2.26.0 发布:API 修复与多项改进AI 框架 & 编排 - n8n06-09 18:50n8n 2.26.0 次要版本,包含 API 创建工作流时强制脱敏底线等多项 bug fix 与改进。
llama.cpp b9574:server 不再无条件清空 slot推理引擎 & 本地 AI - llama.cpp06-09 17:11llama.cpp b9574 修复 server 在无统一 KV cache 情况下不再清空 slot 的问题。属增量构建。
llama.cpp b9573:修复 plamo2 注意力长度回归推理引擎 & 本地 AI - llama.cpp06-09 16:41llama.cpp b9573 修复 plamo2 模型的 attention_key/value_length 回归问题。
llama.cpp b9572:修复 rms_norm_back 原地别名 bug推理引擎 & 本地 AI - llama.cpp06-09 16:08llama.cpp b9572 修复 ggml-cpu 中 rms_norm_back 在 in-place aliasing 情况下输出错误的问题。
LiteLLM v1.88.1 发布AI 框架 & 编排 - LiteLLM06-09 13:54LiteLLM v1.88.1 patch 版本,包含镜像签名验证等运维改进。
CrewAI 1.14.7a3 预发布AI Agent 框架 - CrewAI06-09 09:56CrewAI 1.14.7a3 alpha 版本,包含 ask_for_human_input 暴露修复、aiohttp/docling 等依赖 CVE …
LiteLLM v1.84.6 发布AI 框架 & 编排 - LiteLLM06-09 09:55LiteLLM v1.84.6 stable patch 版本,含镜像签名等增量改进。
Langflow nightly v1.10.0.dev70AI 框架 & 编排 - Langflow06-09 08:57Langflow v1.10.0 dev70 夜间构建版本,无显著功能说明。
browser-use 0.13.0:Rust 重写 betaAI Agent 框架 - browser-use06-09 06:27browser-use 浏览器 Agent 框架推出 0.13.0 beta,整个核心用 Rust 重写,目标是提升性能与稳定性。
browser-use 0.13.0rc4 候选版本AI Agent 框架 - browser-use06-09 05:11browser-use 0.13.0rc4:升级 browser-use 与 browser-use-core 至 0.13.0rc4,为正式版做最后准备。
Ollama v0.30.7:支持 Hermes Desktop 桌面端推理引擎 & 本地 AI - Ollama06-09 04:18Ollama Launch 在 v0.30.7 中支持 Hermes Desktop——一个面向 Hermes Agent 的原生桌面界面,可与 Herm…
browser-use 0.13.0rc3 候选版本AI Agent 框架 - browser-use06-09 04:08browser-use 0.13.0rc3:去除 beta 测试中的 URL 子串断言。属候选小版本。
LangChain Core 1.4.2 发布AI 框架 & 编排 - LangChain06-09 02:19LangChain Core 发布 1.4.2 patch 版本,包含相对 1.4.1 的若干修复与微调。
n8n 1.123.54 发布AI 框架 & 编排 - n8n06-08 18:25n8n 1.123.54 主要修复 Insights 页面在某些 license 下显示付费墙等 bug。
Langflow v1.10.0.dev69 nightlyAI 框架 & 编排 - Langflow06-08 09:05Langflow 发布 1.10.0 系列 nightly 版本 dev69。

6. 技术博客 / 开发者博客(Android Capacity 精选)

32 条

标题来源日期摘要
2026 年 6 月:史上最大规模的 Patch Tuesday安全 & 隐私 - Krebs on Security06-10 06:07微软本月修复近 200 个安全漏洞,创 Patch Tuesday 记录,其中三十多个被列为 critical,至少 3 个已公开 exploit。Kre…
Apple OS 27:那些细节技术写作 & 通识 - Daring Fireball (John Gruber)06-10 05:29博主整理 WWDC26 现场截图中的小改进,认为不起眼但用心的细节最能体现 Apple 对工艺的执着。
The Talk Show 现场版:今晚在 WWDC 现场技术写作 & 通识 - Daring Fireball (John Gruber)06-10 02:53Gruber 邀请大家来 California Theater 看 The Talk Show WWDC 直播,也可通过 Vision Pro 立体串流观看。
Apple WWDC 2026 主题演讲技术写作 & 通识 - Daring Fireball (John Gruber)06-10 01:42WWDC 2026 主题演讲 YouTube 视频,约 76 分钟,含片尾彩蛋音乐 MV。
WWDC 后:苹果 2.5 亿和解后 AI 演示更接地气技术写作 & 通识 - Daring Fireball (John Gruber)06-10 01:38TechCrunch 评论 WWDC 2026 的 AI 演示在经历 2.5 亿美元虚假广告和解后显得更克制、更真实,比往年少了画饼成分。
Apple 推出 Siri AI技术写作 & 通识 - Daring Fireball (John Gruber)06-10 01:23Apple Newsroom 公告:新版 Siri 建立在 Apple Intelligence 之上,能基于个人上下文跨 message、email、p…
别再吃 Lady Gaga 的奥利奥技术写作 & 通识 - Experimental History06-10 00:58Experimental History 博文 The Great Switcheroo:探讨明星 endorsement 与产品偷换概念现象。
Apple WWDC 公布新版 Apple Intelligence 系统技术写作 & 通识 - Daring Fireball (John Gruber)06-10 00:50Apple Newsroom:新一代 Apple Foundation Models 与 Google Gemini 协作构建,端侧 + Private …
Active recall独立开发者 & 个人博客 - Herman06-09 22:50独立博主 Herman 探讨通过写作进行 active recall 来提升记忆力的方法。
那场所有人玩名牌互换的微软员工 party系统 & 底层 - The Old New Thing (Raymond Chen)06-09 22:00Raymond Chen 回忆早年微软公司 party 上所有人偷换名牌的趣事,连老板也参与。
Pluralistic:Naomi Kritzer 的《Obstetrix》(2026 年 6…技术写作 & 通识 - Cory Doctorow (Pluralistic)06-09 21:30Cory Doctorow 推荐 Naomi Kritzer 短篇《Obstetrix》,并附当日 misc 趣闻链接合集。
Incorruptible技术写作 & 通识 - Steve Blank06-09 21:00Steve Blank 推荐 Eric Ries 新书《Incorruptible》:揭示优秀公司为何变坏、伟大公司如何坚守。
Apple II 诞生日:1977 年 6 月 10 日独立开发者 & 个人博客 - Dave Farquhar (dfarq)06-09 19:00回顾 1977 年 6 月 10 日 Apple II 发布,这款最早的预装桌面计算机之一在 17 年间售出约 600 万台。属于历史怀旧科普文。
开源项目的多种治理形态独立开发者 & 个人博客 - Andrew Nesbitt06-09 18:00Andrew Nesbitt 撰文比较开源世界的多种治理结构,认为开源项目的治理形态比国家政府还要丰富多样。
WorkOS 发布 auth.md:Agent 注册的开放协议技术写作 & 通识 - Daring Fireball (John Gruber)06-09 12:23WorkOS 推出 auth.md:一种位于服务根目录的机器可读 Markdown 文件,让 AI Agent 动态发现 OAuth 资源元数据、scop…
John Gruber 复盘:Siri AI 扩展承诺与延迟技术写作 & 通识 - Daring Fireball (John Gruber)06-09 09:37John Gruber 引用 Bloomberg 报道,回顾 Apple 计划在 iOS 27 中开放 Siri 给第三方 AI 助手的承诺,并对兑现节奏…
Xe Iaso 调侃:「无解」的只在 C 语言里频发编程语言 & 软件工程 - Xe Iaso06-09 08:00Xe Iaso 借 OpenSSL CVE-2026-45447 PKCS7_verify use-after-free 漏洞,再次嘲讽 C 语言的内存安…
Entropic Thoughts:LLM 与「差一点就好」的代码独立开发者 & 个人博客 - Entropic Thoughts06-09 06:00作者新结论:顶级 LLM 处理简单任务时,输出代码比必要的复杂度高约 10%,而开发者过于轻易接受这种「眼前可用但隐含债务」的复杂度。
讽刺文:ppclp.ai 宣称生产力提升 100 倍独立开发者 & 个人博客 - Ibrahim Diallo06-09 03:50Ibrahim Diallo 以「曲别针公司转型成 AI-native 制造商」为引子,讽刺 AI 生产力提升 100 倍的营销话术与 OPI 指标。
Gary Marcus:整个 AI 产业靠疯狂数学撑着AI & 技术评论 - Gary Marcus06-09 02:37Gary Marcus 撰文质疑当前 AI 产业的估值与算力扩张数学,称行业陷入「幻想之地」。属于经典 Gary Marcus 反思文。
Dwarkesh Patel:样本效率的黑洞AI & 技术评论 - Dwarkesh Patel06-09 02:09Dwarkesh Patel 撰文将当下大模型能力比作星系,中心隐匿的「样本效率黑洞」即对庞大数据的依赖,正是支撑能力星座的本源。
AI 正在放缓AI & 技术评论 - Where’s Your Ed At06-08 23:37Ed Zitron 长文论述 AI 增长放缓的观点,配套付费 newsletter 推广。
Planescape: Torment 第 2 部:从桌面回顾技术写作 & 通识 - The Digital Antiquarian (filfre)06-08 23:36讲述龙与地下城在桌面与电脑游戏中的发展史第二部,聚焦《异域镇魂曲》。
重新审视数组旋转:超过三块的洗牌与其他小注记系统 & 底层 - The Old New Thing (Raymond Chen)06-08 22:00Raymond Chen 讨论将数组块洗牌推广到任意块数的算法细节。
Stanford Hacking for Defense 2026 – 经验分享展示技术写作 & 通识 - Steve Blank06-08 21:00Steve Blank 总结斯坦福 Hacking for Defense 第 11 届课程的成果展示与不对称战争背景。
域名中最多可以有多少个连续的连字符?技术写作 & 通识 - Terence Eden06-08 19:34看似简单的域名规范问题,作者一路深入 RFC 标准细节。
Eagle Computer: The rise and fall of an early P…独立开发者 & 个人博客 - Dave Farquhar (dfarq)06-08 19:00Eagle Computer: The rise and fall of an early PC clone
铸铁锅与大科技独立开发者 & 个人博客 - berthub.eu (Bert Hubert)06-08 19:00Bert Hubert 用十年使用铸铁锅的经验类比大科技公司的依赖与替代选择。
包管理器相关专利清单独立开发者 & 个人博客 - Andrew Nesbitt06-08 18:00整理与包管理器设计相关的专利及申请清单,并附先有技术注解。
Mux — Video for Developers技术写作 & 通识 - Daring Fireball (John Gruber)06-08 09:47Mux — Video for Developers
★ SwiftUI 只是让开发烂 App 变容易技术写作 & 通识 - Daring Fireball (John Gruber)06-08 09:30John Gruber 长文批评 Apple 用 SwiftUI 让开发好原生 App 比 AppKit/UIKit 时代更难。
Alberto Romero 谈苹果的 AI 投入技术写作 & 通识 - Daring Fireball (John Gruber)06-08 09:00Daring Fireball 引用 Alberto Romero 文章,讨论 Apple 在 AI 投入上的克制与硅谷主流观点差异。

7. 知名 AI 个人开发者/研究者

4 条

标题来源日期摘要
在 AgentsView 中为模型设置自定义价格Simon Willison06-10 05:35Simon Willison 分享 TIL:在 Wes McKinney 的 AgentsView 工具里手动给新发布的 Claude Fable 5 配…
引用 Andrej KarpathySimon Willison06-10 03:03Simon Willison 引用 Karpathy 的观点:当软件像水龙头一样随取随用时 Jevon’s paradox 启动,自己对软件的需求反而暴涨…
FrontierCode:衡量代码质量而非数量的新基准Latent Space (Newsletter)06-09 14:12Latent Space 发布 FrontierCode 基准,专注代码质量(mergeability)而非纯产出量,目标衡量编码 Agent 是否产出可…
Simon Willison:观察 WWDC 2026 的 Siri AISimon Willison06-09 07:58Simon Willison 在 2024 年 WWDC Apple Intelligence 翻车之后,对 2026 WWDC 的 Siri AI 发布…

8. AI 工具/产品

19 条

标题来源日期摘要
语音 Agent 能否处理双语客户?前沿 ASR 在代码切换语音上的基准测试框架/平台 - Hugging Face (博客)06-10 03:38ServiceNow AI 在 Hugging Face 博客发布 benchmark:评估前沿 ASR 模型在中英、西英等 code-switched …
v3.89.0编程助手 - Cline (GitHub Releases)06-10 03:19Cline v3.89.0 新增 Claude Fable 5 模型支持,修复 MiniMax M3 的 thinking 控制,并清理 Codex 模型列表。
sdk/sdk/v0.0.45编程助手 - Cline (GitHub Releases)06-10 03:04Cline SDK 主包 0.0.45 版本发布,无具体变更说明。
sdk/core/v0.0.45编程助手 - Cline (GitHub Releases)06-10 03:04Cline SDK core 0.0.45 子包发布,无变更细节。
sdk/agents/v0.0.45编程助手 - Cline (GitHub Releases)06-10 03:04Cline SDK agents 0.0.45 子包发布,无变更细节。
sdk/llms/v0.0.45编程助手 - Cline (GitHub Releases)06-10 03:04Cline SDK llms 0.0.45 子包发布,无变更细节。
sdk/shared/v0.0.45编程助手 - Cline (GitHub Releases)06-10 03:04Cline SDK shared 0.0.45 子包发布,无变更细节。
从一次性 prompt 到工作流:如何在 GitHub Copilot CLI 中使用 cus…编程助手 - GitHub Blog (全站)06-10 00:00GitHub Blog 教程:用 GitHub Copilot CLI 的 custom agents 把零散 prompt 变成可复用、可审查的工作流。
介绍 North Mini Code:Cohere 首款面向开发者的模型框架/平台 - Hugging Face (博客)06-09 23:56Cohere 在 Hugging Face 博客发布 North Mini Code——其首款面向开发者的代码模型。
Agent 串联两个 Hugging Face Space 构建 3D 巴黎画廊框架/平台 - Hugging Face (博客)06-09 18:46Hugging Face 博客演示 Agent 如何通过链式调用两个 Space 服务,自动构建一个 3D 巴黎画廊,展示 Spaces 与 agents…
GitHub 对第三方编码 Agent 启用安全校验(GA)编程助手 - GitHub Copilot (专属)06-09 15:12GitHub Changelog 宣布对第三方编码 Agent(包括 Claude 与 OpenAI Codex)的安全校验正式 GA,仓库内运行的 Ag…
Cline SDK v0.0.44 发布编程助手 - Cline (GitHub Releases)06-09 12:39Cline 编码 Agent 的 @cline/sdk 包发布 v0.0.44 版本。
Cline Core v0.0.44 发布编程助手 - Cline (GitHub Releases)06-09 12:39Cline 编码 Agent 的 @cline/core 包发布 v0.0.44 版本。
Cline LLMs v0.0.44 发布编程助手 - Cline (GitHub Releases)06-09 12:39Cline 的 @cline/llms 适配包发布 v0.0.44 版本。
Cline Shared v0.0.44 发布编程助手 - Cline (GitHub Releases)06-09 12:39Cline 的 @cline/shared 共享包发布 v0.0.44 版本。
把 GitHub CI 迁移到 Hugging Face Jobs框架/平台 - Hugging Face (博客)06-09 08:00Hugging Face 博客教程,介绍如何把 GitHub Actions CI 工作流迁移到 Hugging Face Jobs,强调 ML 任务的算…
Vercel CLI 支持域名搜索框架/平台 - Vercel (含 AI SDK)06-09 08:00Vercel Changelog:CLI 新增 vercel domains search 命令,可查询所有支持 TLD 的域名可用性与价格、过滤排序。
GitHub 新手指南:常见问题答疑编程助手 - GitHub Blog (全站)06-09 00:00GitHub 官方博客整理新手最常问的若干 GitHub 使用问题并提供答案。
DeepSeek 加入 Token 总量争夺,Anthropic 持续主导支出框架/平台 - Vercel (含 AI SDK)06-08 12:00Vercel AI Gateway 6 月数据显示 DeepSeek 在 token 总量上崛起,但 Anthropic 仍占据生产应用消费支出大头。

9. AI 从业者访谈 / 播客

1 条

标题来源日期摘要
RAG 已死?从税法 AI 建设中学到的经验 - #769英文播客 - TWIML AI06-10 03:25TWIML AI 与 Sphere 工程负责人 Alex Bowcut 对谈:在百万 token 上下文窗口时代是否还需要 RAG,他用税法 AI 实战说…

10. AI 公司官方博客

11 条

标题来源日期摘要
Gemini 3.5 Live Translate:流畅自然的语音翻译Google DeepMind06-09 23:16Google DeepMind 公布 Gemini 3.5 Live Translate:在 Google AI Studio、Google Transl…
介绍 Gemma 4 12B:统一的无编码器多模态模型Google DeepMind06-09 22:10Google DeepMind 发布 Gemma 4 12B:一种统一、无编码器(encoder-free)的多模态模型。无详细 description。
月末不再是月末a16z (Substack)06-09 22:04a16z Substack 文章:探讨现代 ERP 系统如何让财务月结流程从专门事件变成日常普通日子。
为欧洲机器人的未来提供动力Google DeepMind06-09 22:02Google DeepMind 宣布支持欧洲机器人产业生态的举措。无 description。
Nextdoor 工程师如何用 Codex 无限构建OpenAI06-09 20:00OpenAI 案例:Nextdoor 工程师用 Codex + GPT-5.5 复现难复现 bug、跨平台开发、聚焦产品成果。
Codex 在 Notion 的工程实践:从规格到一次成型OpenAI06-09 18:00OpenAI 官方博客介绍 Notion 如何使用 Codex 实现一次成型从规格到代码、构建 Web 端 AI Voice Input,并放大小团队工程…
Anthropic 发布 Claude Fable 5 与 Claude Mythos 5Anthropic (新闻)06-09 08:00Anthropic 官宣推出 Claude Fable 5 与 Claude Mythos 5 两款新模型。是重大产品发布。
Claude Managed Agents 新增定时运行与环境变量 VaultClaude Blog06-09 08:00Claude Managed Agents 新增能力:按计划调度运行 Agent,并通过 vault 存储环境变量,强化生产 Agent 的可运维性。
OpenAI 已向 SEC 秘密递交 S-1 草案OpenAI06-08 22:00OpenAI 官方确认已向 SEC 秘密递交 S-1 招股说明书草案,后续动作尚未确定。
衡量 AI 学习在塞拉利昂及更广地区的影响Google DeepMind06-08 21:04Google DeepMind 公布随机对照试验结果,显示 Gemini Guided Learning 在塞拉利昂等地能显著提升学习参与度与效果。
为所有人利益而建:OpenAI 的计划OpenAI06-08 09:30OpenAI 阐述其 AGI 愿景:聚焦访问、可用性、安全与共享繁荣。

11. AI 研究

47 条

标题来源日期摘要
面向视频世界模型的潜在空间记忆HuggingFace 每日论文06-09 01:59提出用潜在空间记忆替代视频世界模型中昂贵的 RGB 点云,提升 3D 空间一致性的同时降低计算成本。
PTL-Diffusion:流形感知的周期终态扩散模型HuggingFace 每日论文06-09 01:56对标准扩散模型的单一高斯终态分布提出替代方案,引入周期性终态法则与流形感知机制改进生成质量。
高效实验设计中的多臂老虎机:适应对照组、偏好与上下文漂移HuggingFace 每日论文06-09 01:53研究带个性化偏好向量的线性上下文随机多臂老虎机变体,用于面向用户群体的高效推荐实验。
通过动力学等距保持持续学习的可塑性HuggingFace 每日论文06-09 01:24针对深度网络持续学习中的可塑性丧失问题,将其与神经切线核 (NTK) 经验性关联并提出保持动力学等距的训练方案。
相关性不够:嵌入人类元数据用于个体因果发现HuggingFace 每日论文06-08 23:54针对生物医学语言模型出现的虚假相似度问题,提出嵌入人类元数据来辅助个体因果发现。
稀疏纵向数据下阿尔茨海默病的状态转移数字孪生建模HuggingFace 每日论文06-08 23:54针对阿尔茨海默病高度异质性和稀疏不规则的纵向数据,提出基于状态转移的数字孪生建模方法。
视觉提示与特征重建结合的双教师监督异常检测HuggingFace 每日论文06-08 23:52将视觉提示引入基于特征重建的异常检测,提出双教师监督框架以解决 MVTec 外更具挑战的数据集。
内置思考何时有益何时有害:指令遵循中的约束级误差迁移HuggingFace 每日论文06-08 23:45用 Qwen3 模型在 IFEval 上对比开关思考模式,分析推理模型在指令遵循上的约束级表现差异。
不止准确率:社区视角下的机器翻译HuggingFace 每日论文06-08 23:42调研非 AI 群体对机器翻译的关切,揭示技术进步与真实使用者需求之间的差距。
ATN3D:极稀疏场景下密度感知的 LiDAR-Radar 早期 3D 目标检测HuggingFace 每日论文06-08 23:32面向自动驾驶远距离检测的密度感知 LiDAR-Radar 早期融合 3D 目标检测方法。
AGENTSERVESIM:多轮 LLM Agent Serving 的硬件感知模拟器HuggingFace 每日论文06-08 23:20针对多轮 LLM Agent 工作负载,提出硬件感知的有状态调度模拟器以辅助 Serving 架构设计。
TUDSR:两次上采样扩散用于更高倍超分辨率HuggingFace 每日论文06-08 23:18针对扩散超分辨率方法在更高倍率下的局限,提出两次上采样扩散方案。
基于语料引导特征扩散的繁体中文家访 IEP 自动生成HuggingFace 每日论文06-08 23:13利用生成式 AI 从繁体中文家访记录自动撰写个性化教育计划 (IEP),缓解教师文档负担。
结合移动与社交媒体数据的可解释危机行为分析HuggingFace 每日论文06-08 22:16联合分析危机期间的移动模式与在线情绪话语,提出可解释模型刻画两者协同演化。
SwiftVR:单步生成式实时视频修复HuggingFace 每日论文06-08 22:07面向直播场景的实时视频修复,提出一步式扩散方案以满足严格的逐帧时延约束。
无需机器可读指南的 LLM 编排式中风护理合规检查HuggingFace 每日论文06-08 21:44用 LLM 编排在缺乏机器可解释指南的情形下做中风诊疗路径合规检查。
用合成数据做真实手稿的光学乐谱识别HuggingFace 每日论文06-08 21:38探讨端到端光学乐谱识别在真实手稿场景的落地差距,并用合成数据弥补。
H2HMem:人际交互中 Agent 的多模态记忆基准HuggingFace 每日论文06-08 21:17为会议助手、临床记录等人际交互场景中的 LLM Agent 提出多模态记忆评测基准。
TheoremBench:评估 LLM 形式数学定理证明的基准HuggingFace 每日论文06-08 20:57现有形式证明评测过度集中于竞赛风格题目,TheoremBench 提供更全面的 LLM 定理证明评估。
Guide Me Out:危机场景下 VLM 操作员通信评测框架HuggingFace 每日论文06-08 20:40面向危机响应中以空间为基础的语言引导通信,构建 VLM 操作员通信评测框架。
多重语义网络:跨语言创造性联想知识的多面表示HuggingFace 每日论文06-08 20:21提出多重语义网络来表达跨语言样本中的创造性联想知识,弥补传统单任务度量的不足。
用张量并行与完全分片数据并行扩展神经网络形式验证HuggingFace 每日论文06-08 19:56用 TP+FSDP 并行机制突破 GPU 显存瓶颈,扩大神经网络安全性形式验证规模。
经验造就技能:通过自演化技能记忆实现可泛化的医疗 Agent 推理HuggingFace 每日论文06-08 19:37面向交互式临床决策的医疗 Agent,引入自演化技能记忆机制提升经验复用能力。
用 LLM 上下文学习填补公众意见数据HuggingFace 每日论文06-08 19:25针对舆论调查的部分未响应问题,用 LLM 上下文学习填补缺失数据。
驯服感知抖动:用于可靠运动分类的不确定性感知 LiDAR 目标检测HuggingFace 每日论文06-08 19:24针对自动驾驶中静态物体被误判为动态的问题,提出不确定性感知 LiDAR 检测方案。
多跳知识组合受限于预训练曝光HuggingFace 每日论文06-08 19:05实验证明 LLM 隐式多跳推理的失败模式与预训练数据中的曝光程度直接相关。
Conan-embedding-v3:融合多模态专用模型的全模态嵌入HuggingFace 每日论文06-08 18:54Conan-embedding-v3 将单模态专用模型融合为全模态嵌入空间,覆盖文本、图像、视频、文档、音频。
一个模型、多个目标:电商对话系统的自适应多目标学习HuggingFace 每日论文06-08 18:01电商对话系统的多目标自适应学习,平衡画像理解、用户体验等多个目标。
EditSSC:用无条件扩散模型实现可编辑的语义占据场景HuggingFace 每日论文06-08 17:41用无条件扩散模型实现自动驾驶 3D 语义场景的可编辑生成,避免依赖 3D 专用架构。
看得更多、配得更准:双视图对应学习的多源特征融合HuggingFace 每日论文06-08 17:33针对双视图特征对应学习,提出多源特征融合区分内外点。
面向视频时序定位的时间感知推理优化HuggingFace 每日论文06-08 17:21针对 MLLM 视频时序定位中的推理路径质量问题提出强化学习优化方案。
亚高斯奖励下风险厌恶老虎机 Thompson 采样的渐近最优性HuggingFace 每日论文06-08 16:26证明无锚点非参 Thompson 采样在亚高斯奖励的风险厌恶老虎机问题上达到对数因子的最优 regret 下界。
预训练冻结仍会泄露:审计 EEG 基础模型的跨编码器属性迁移HuggingFace 每日论文06-08 16:24审计 EEG 基础模型在多种攻击端点下的隐私泄露,发现即便冻结后仍存在跨编码器属性迁移。
语义融合与上下文模板更新驱动的视觉-语言引导高光谱目标跟踪HuggingFace 每日论文06-08 16:05针对高光谱目标跟踪,提出由 VLM 引导的语义融合与上下文模板更新方法。
用 VLM 从第一视角视觉解码行人过街意图HuggingFace 每日论文06-08 15:39利用 VLM 从第一人称视角视频解码行人过街意图,用于交通安全预测。
揭示多模态 LLM 的隐私风险:任务特异性脆弱点与缓解挑战HuggingFace 每日论文06-08 15:19系统研究多模态 LLM 的隐私泄漏风险,分析任务特异性脆弱点与缓解挑战。
MAAM:保锚压缩与上下文校正的中文歧视语言检测HuggingFace 每日论文06-08 15:07针对中文歧视性语言隐式难判的特点,提出 MAAM 锚保留压缩与上下文校正机制。
上下文分裂分解攻击:利用工具型 LLM Agent 的工件来源缺口HuggingFace 每日论文06-08 14:29针对工具型 LLM Agent 的跨步状态留存,提出利用工件来源缺口的上下文分裂攻击,强调防御需跨步推理。
边缘约束下基于 P2 增强与量子启发轻量结构搜索的无人机小目标检测HuggingFace 每日论文06-08 14:27面向无人机机载计算约束,设计带 P2 增强和轻量结构搜索的小目标检测器。
数据增强 Bootstrap:通过近似不变性统一置信区间构造HuggingFace 每日论文06-08 13:39提出数据增强 Bootstrap (DAB) 框架,通过近似不变变换统一构造置信区间。
DynaCF:用动态反事实敏感度缓解奖励模型的捷径学习HuggingFace 每日论文06-08 13:24针对偏好奖励模型容易学习捷径线索的问题,提出动态反事实重加权框架 DynaCF。
结构化网格描述符可预测 ARC-AGI 任务内求解器成败HuggingFace 每日论文06-08 12:51研究 ARC-AGI 中间网格状态的结构属性能否预测符号求解器成败,验证条件互信息正向。
ChinaHeritaQA:中国世界遗产文化扎根视觉问答数据集HuggingFace 每日论文06-08 11:00面向中国 UNESCO 世界遗产的多模态 VQA 基准数据集,用于评测 VLM 的文化推理能力。
从风险函数到语言空间:Cox 监督的生存风险向 LLM 蒸馏HuggingFace 每日论文06-08 10:47把 Cox 比例风险模型估计的时间-事件风险蒸馏进生成式 LLM,提出基于文本的生存模型。
顺序很重要:用代理引导 LLM 演化揭示宏布局序列的隐藏影响HuggingFace 每日论文06-08 09:10用代理引导的 LLM 进化方法探索芯片宏布局序列对组合优化质量的影响。
合成但不真实:结构化电子病历生成建模的评估挑战HuggingFace 每日论文06-08 09:07指出合成医疗数据评估过度依赖统计相似度和预测性能,缺乏真实性度量。
FAME:用于异构时序预测的可预测性感知混合专家HuggingFace 每日论文06-08 08:47针对大规模零售与工业异构时序,提出可预测性感知的混合专家预测架构。

Generated at 2026-06-10T00:19:58.004Z by RSS Daily AI Digest