jixiaxue 知识库
2026-05-28

AI 日报 | 2026-05-28

AI 日报 | 2026-05-28

82 个来源 | 324 条新内容 | 10 条 AI 精选

Smart Recommendations

1. Claude Code v2.1.152

Anthropic - Claude Code (GitHub Releases) | AI 公司产品更新 / Changelog

Anthropic 发布 Claude Code v2.1.152。/code-review --fix 现在能在审查后自动把建议应用到工作树,覆盖代码复用、简化和效率三类建议;/simplify 已并入 /code-review --fix。Skills 和 slash 命令的 frontmatter 新增 disallowed-tools 字段,可在 Skill 激活时屏蔽特定工具。整体方向继续把 review/fix 双向闭环做厚,是 Claude Code 重度用户值得立即升级的一版。

阅读原文

2. 用 Codex 构建自我改进的报税 Agent

OpenAI | AI 公司官方博客

OpenAI、Thrive 和 Crete 联合发布案例:用 Codex 构建可自我改进的报税 Agent,自动化报税申报、提升准确率、加速整体工作流。文章拆解了 Codex 在结构化文档处理、规则推理和反馈学习上的工程实践。对评估「LLM Agent 接管垂直行业重复工作」具有参考价值,也是 OpenAI 持续把 Codex 推为企业 Agent 平台的旗舰案例之一。

阅读原文

3. CodeRabbit 如何用 Claude 构建 Agent 编排系统

Claude Blog | AI 公司官方博客

Anthropic Claude 博客分享 CodeRabbit 用 Claude 构建 Agent 编排系统的实战经验。CodeRabbit 是知名的 AI 代码审查产品,文章覆盖多 Agent 协同、上下文管理、提示与工具调度等核心架构选择。对正在构建 Agent 编排层或代码 Review 类产品的开发者来说是一手原始资料。

阅读原文

4. SQLite 仓库新增 AGENTS.md 文件

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 注意到 SQLite 仓库五天前加入了 AGENTS.md 文件,但目标读者并非 SQLite 自身的贡献者,而是把 AI Agent 指向 SQLite 代码库的人。AGENTS.md 中明确说明:SQLite 不接受外部 PR、贡献流程的特殊性等。这是一种值得借鉴的「面向 Agent」的仓库元信息表达方式,可以作为自己项目设计 AGENTS.md 的参考样板。

阅读原文

5. Simon Willison:Anthropic 与 OpenAI 已找到 PMF

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 评论 Anthropic 据称即将迎来首个盈利季度,以及企业 LLM 账单飙升的现象。他认为 OpenAI 与 Anthropic 通过编程类用例(Codex、Claude Code)真正找到了 product-market fit——付费意愿强、留存高、价值可量化。文章是对 LLM 商业模式拐点的一手观察,对判断 AI 编程工具市场走向有参考价值。

阅读原文

6. Microsoft Copilot Cowork 文件外泄漏洞

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 转述 PromptArmor 的研究:Microsoft Copilot Cowork 存在数据外泄漏洞,攻击者可诱导 Agent 把文件内容外传。Simon 强调,「防止 Agent 被诱导外泄数据」仍是 Agent 系统设计的最大难题。对所有正在做 Agent 产品的团队,这是一个高优先级的威胁模型样本,值得复盘自己的输出通道有没有类似 sink。

阅读原文

7. curl 团队承受的压力

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 转述 Daniel Stenberg 的文章:curl 团队正承受前所未有的压力——AI 辅助生成的(看起来可信的)安全漏洞报告速率,已经是 2024 年的 4-5 倍、2025 年的 2 倍。这意味着开源核心维护者花在「审伪」上的时间被严重侵占。对所有开源生态参与者,这是 AI 加速带来的负外部性的具体样本。

阅读原文

8. Faire 借助 Cursor Cloud Agents 将 PR 吞吐量翻倍

编程助手 - Cursor (博客) | AI 工具/产品

Cursor 官方案例:电商批发平台 Faire 引入 Cursor Cloud Agents 后,PR 吞吐量直接翻倍。案例展示了 Cloud Agent 在大型团队工程协作中的落地路径,是评估 Cloud Agents 商业价值的具体数据点。对正在评估「云端 Agent vs 本地 Agent」选型的团队是一份有价值的参考。

阅读原文

9. Ollama v0.30.0:架构改用 llama.cpp

推理引擎 & 本地 AI - Ollama | GitHub 开源项目 Releases(Atom Feed)

Ollama 发布 v0.30.0(rc28),架构层重大变更:直接基于 llama.cpp 而非原 GGML 实现,原生兼容 GGUF 格式,Apple Silicon 上引入 MLX 加速推理。这是 Ollama 历史上最大的底层重写之一,预发布阶段官方在征集反馈。本地 LLM / 端侧推理用户应关注模型兼容性和性能差异。

阅读原文

10. RAGFlow v0.25.6:Browser 组件

AI 框架 & 编排 - RAGFlow | GitHub 开源项目 Releases(Atom Feed)

RAGFlow v0.25.6 发布,Agent 新增 Browser 组件,让 AI 可以自主导航网页并与之交互(issue #14888)。RAGFlow 持续把「检索+Agent」编排栈做厚,Browser 组件补齐了 Agent 直连真实网络抓取的能力。对正在搭建带 Web 检索能力的 RAG/Agent 系统的开发者,可直接试用对比效果。

阅读原文

播客精选 Top 5

1. [Latent Space] ESMFold2:苦涩教训降临蛋白质

Latent Space (Newsletter) | 知名 AI 个人开发者/研究者

Latent Space Newsletter 发布与 BioHub 的 Alex Rives 对谈 ESMFold2,讨论数据集与归纳偏置、世界模型与可编程生物学。

阅读原文

2. Seeed Studio:开源具身 AI 机器人

英文播客 - NVIDIA AI Podcast | AI 从业者访谈 / 播客

NVIDIA AI Podcast 第 300 期,Seeed Studio CEO Eric Pan 和机器人负责人 Elaine Wu 讨论 NVIDIA Jetson 驱动的开源机械臂、OpenClaw agentic 框架和 NVIDIA Isaac Sim。

3. 他融资 7000 万美元用 AI 攻克一切疾病

英文播客 - Gradient Dissent (W&B) | AI 从业者访谈 / 播客

Samuel Rodriques 离开物理学界后创办 Edison Scientific,打造 AI 科学家 Kosmos 用于药物研发,讨论 AI 提出的失明疗法、肽类回避策略以及 20 年后人类科学家的角色。

阅读原文

4. 为 AI 时代更新职业建议 | Benjamin Todd

英文播客 - 80,000 Hours Podcast | AI 从业者访谈 / 播客

80,000 Hours 创始人 Benjamin Todd 讨论 AI 加速背景下的职业规划,部分研究者认为 AI 自动化 AI 研究的概率今年 10%、2028 年底 60%,可能彻底重塑各行各业。

阅读原文

5. 你的最大杠杆:为最大影响设计 AI 职业 | Ben Todd

英文播客 - The Cognitive Revolution | AI 从业者访谈 / 播客

Cognitive Revolution 与 80,000 Hours 联合创始人 Ben Todd 谈如何围绕 AI 时间线规划个人职业,讨论失控风险、加入前沿实验室利弊与 AI 福利等新兴议题。

阅读原文

Blog 精选 Top 5

1. 用 Codex 构建自我改进的报税 Agent

OpenAI | AI 公司官方博客

OpenAI、Thrive 和 Crete 联合发布案例:用 Codex 构建可自我改进的报税 Agent,自动化报税申报、提升准确率、加速整体工作流。文章拆解了 Codex 在结构化文档处理、规则推理和反馈学习上的工程实践。对评估「LLM Agent 接管垂直行业重复工作」具有参考价值,也是 OpenAI 持续把 Codex 推为企业 Agent 平台的旗舰案例之一。

阅读原文

2. CodeRabbit 如何用 Claude 构建 Agent 编排系统

Claude Blog | AI 公司官方博客

Anthropic Claude 博客分享 CodeRabbit 用 Claude 构建 Agent 编排系统的实战经验。CodeRabbit 是知名的 AI 代码审查产品,文章覆盖多 Agent 协同、上下文管理、提示与工具调度等核心架构选择。对正在构建 Agent 编排层或代码 Review 类产品的开发者来说是一手原始资料。

阅读原文

3. SQLite 仓库新增 AGENTS.md 文件

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 注意到 SQLite 仓库五天前加入了 AGENTS.md 文件,但目标读者并非 SQLite 自身的贡献者,而是把 AI Agent 指向 SQLite 代码库的人。AGENTS.md 中明确说明:SQLite 不接受外部 PR、贡献流程的特殊性等。这是一种值得借鉴的「面向 Agent」的仓库元信息表达方式,可以作为自己项目设计 AGENTS.md 的参考样板。

阅读原文

4. Simon Willison:Anthropic 与 OpenAI 已找到 PMF

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 评论 Anthropic 据称即将迎来首个盈利季度,以及企业 LLM 账单飙升的现象。他认为 OpenAI 与 Anthropic 通过编程类用例(Codex、Claude Code)真正找到了 product-market fit——付费意愿强、留存高、价值可量化。文章是对 LLM 商业模式拐点的一手观察,对判断 AI 编程工具市场走向有参考价值。

阅读原文

5. Claude Blog:AI Agent 的零信任

Claude Blog | AI 公司官方博客

Anthropic Claude 博客发表《Zero Trust for AI Agents》,讨论 AI Agent 安全的零信任架构。

阅读原文

YC 主题

1. Claude Code 作为日常工具:CLAUDE.md、Skills、Subagents、插件与 MCP

Hacker News | Y Combinator

HN 转载博客,作者分享 Claude Code 日常使用经验,涵盖 CLAUDE.md、Skills、Subagents、Plugins 和 MCP 用法。

阅读原文

2. Show HN:开源 AI 赛车竞赛框架

Hacker News | Y Combinator

Elodin Systems 在 HN 展示开源 AI Grand Prix 模拟竞赛框架,用于评测 AI 在赛车模拟环境下的表现。

阅读原文

3. Go:支持泛型方法

Hacker News | Y Combinator

HN 转 Go 语言官方 Issue #77273,讨论 Go 增加泛型方法的支持。

阅读原文

4. 交错增量(Interleaved Deltas)

Hacker News | Y Combinator

mmapped 博客技术文,讨论 interleaved deltas 数据结构/同步设计。HN 推送,无 description 上下文。

阅读原文

5. Pelica(YC P25)正在招聘

Hacker News | Y Combinator

Y Combinator P25 批次公司 Pelica 在招聘机器学习工程师,HN 头版职位帖。

阅读原文

a16z 主题

1. [a16z] 避免在黄砖路上死亡

a16z (Substack) | AI 公司官方博客

a16z Substack 文章,探讨应用层并未消亡,反驳“App 层已死”观点。

阅读原文

2. 处处皆合规:AI 企业最大机会就是最无聊的领域

a16z (Substack) | AI 公司官方博客

a16z 长文:AI 在企业市场最大、最被低估的机会是合规——一个看起来无聊但万亿美元规模的赛道。

阅读原文

1. AI 公司产品更新 / Changelog

36 条

标题来源日期摘要
Claude Code v2.1.152Anthropic - Claude Code (GitHub Releases)05-27 09:30Anthropic 发布 Claude Code v2.1.152。/code-review --fix 现在能在审查后自动把建议应用到工作树,覆盖代…
Anthropic TypeScript SDK v0.99.0Anthropic - anthropic-sdk-typescript05-27 09:04Anthropic 发布 anthropic-sdk-typescript v0.99.0,支持自定义文件大小上限(#1029)。
anthropic-sdk-typescript v0.98.1Anthropic - anthropic-sdk-typescript05-27 07:19Anthropic TypeScript SDK 0.98.1 修复了 skills.versions.create 上传时未保留目录前缀的 bug。
AgentCore Payments 技术深度解析与 Agent 商务创新Amazon - AWS Machine Learning Blog05-27 01:57Amazon Bedrock AgentCore Payments 进入预览,支持向付费外部服务的即时支付、稳定币微支付以及可配置花费护栏,便于 Agen…
用 Bedrock AgentCore 构建高扩展无服务器 LangGraph 多 Agent 系统Amazon - AWS Machine Learning Blog05-27 01:41AWS 教程:以 LangGraph 为编排核心,结合 Bedrock AgentCore Memory 与 Observability,构建无服务器、高…
用 Strands Agents + NVIDIA NIM + Bedrock AgentCo…Amazon - AWS Machine Learning Blog05-27 01:39AWS 教程:用 Strands Agents 编排、Bedrock AgentCore 提供运行时与可观测性、NVIDIA NIM 提供 GPU 推理,…
AgentWatch:用环境型 Agent 主动监控 AWSAmazon - AWS Machine Learning Blog05-27 01:22AgentWatch 每 15 分钟扫描 CloudWatch 指标/日志/告警,汇总后将报告推送 Slack,并支持自然语言查询,演示了三种 human…
从想法到 AI 应用:用 Strands 创建智能研究助手Amazon - AWS Machine Learning Blog05-27 00:28AWS 博文:用 Strands Agents 框架简化多 API 编排、对话状态管理与推理 Agent 开发,构建智能研究助手。
Azure 弃用:gpt-5-chat跨厂商 - AI Model Deprecations05-27 14:23Azure OpenAI 模型弃用公告:gpt-5-chat 将于 2026-06-29 弃用与停服。
Azure 弃用:gpt-5.1-chat跨厂商 - AI Model Deprecations05-27 14:23Azure OpenAI 模型弃用公告:gpt-5.1-chat 将于 2026-06-29 弃用与停服。
Azure 弃用:gpt-5.2-chat跨厂商 - AI Model Deprecations05-27 14:23Azure OpenAI 模型弃用公告:gpt-5.2-chat 将于 2026-06-29 弃用与停服。
Azure 弃用:gpt-5.3-chat跨厂商 - AI Model Deprecations05-27 14:23Azure OpenAI 模型弃用公告:gpt-5.3-chat 将于 2026-06-29 弃用与停服。
用 Amazon Bedrock 数据自动化处理金融文档Amazon - AWS Machine Learning Blog05-28 05:28AWS 博客介绍如何用 Amazon Bedrock Data Automation 从银行对账单、W-2 表格、1099-B 税表和供应商合同四类金融文…
用 Amazon Bedrock AgentCore 构建业务支持 AI AgentAmazon - AWS Machine Learning Blog05-28 04:06AWS Generative AI Innovation Center 与 Works Human Intelligence (WHI) 合作,用 Ama…
Verizon Connect:10 万用户级 Agentic AI 实践Amazon - AWS Machine Learning Blog05-28 04:01AWS 博客详解 Verizon Connect 如何用 agentic AI 把海量车队数据转化为可执行洞察、扩展至 10 万日活用户,分享架构决策、实…
AWS SMGS 用 AgentCore 构建对话式业务助手Amazon - AWS Machine Learning Blog05-28 02:51AWS 博客分享 SMGS 销售组织如何用 Amazon Bedrock AgentCore 构建 NarrateAI 商业智能助手,介绍双层架构(批处理…
用 Bedrock AgentCore 驱动 Agentic AI 销售Amazon - AWS Machine Learning Blog05-28 02:00AWS 博客分享 AWS Sales 组织部署 20+ 领域专用 Agent 的痛点,引入 AgentCore 编排来减少用户在系统间切换的认知负担。
Amazon Connect 用生成式 AI 自动评估自服务交互Amazon - AWS What’s New05-28 01:00Amazon Connect Customer 推出生成式 AI 自动评估自服务交互的能力,管理员可用自然语言定义评估表单,AI 给出评估理由和聚合洞察。
Mistral Python SDK v2.4.7Mistral / Cohere - Mistral Python SDK05-28 01:08Mistral 客户端 Python v2.4.7 由 Speakeasy CLI 基于 OpenAPI 文档自动生成发布。
为 Amazon Quick 构建企业级可观测性方案Amazon - AWS Machine Learning Blog05-27 00:09AWS 教程:为 Amazon Quick 平台搭建集中可观测性方案,让企业领导能看到谁在使用平台、用户是否满意,以及哪些能力最受欢迎。
Amazon Quick 把文档创建从小时缩短到分钟Amazon - AWS Machine Learning Blog05-26 23:59AWS 博文介绍 Amazon Quick 的文档与可视化创建能力,展示不同岗位如何用它节省工作时间。
SageMaker 笔记本支持 P5.4xl 实例Amazon - AWS What’s New05-28 04:30Amazon SageMaker Notebook Instances 现已正式支持 P5.4xl 实例(NVIDIA H100),相比上一代加速最高达 …
SageMaker 笔记本支持 P5en.48xl 实例Amazon - AWS What’s New05-28 04:30Amazon SageMaker Notebook Instances 正式支持 P5en.48xl 实例,搭载 8 张 H200 GPU(显存为 H10…
SageMaker HyperPod Slurm 集群支持最小容量Amazon - AWS What’s New05-27 23:06Amazon SageMaker HyperPod Slurm 集群现支持 MinCount,结合 continuous provisioning,可在部…
Amazon EC2 X8i 实例在更多区域上线Amazon - AWS What’s New05-27 05:58AWS X8i 实例(基于定制 Intel Xeon 6)现已在新加坡、悉尼、GovCloud(US-West) 上线,性能比上一代提升 43%,内存容量…
Amazon RDS Multi-AZ 复制支持 ENA ExpressAmazon - AWS What’s New05-27 03:00Amazon RDS Multi-AZ 实例的跨可用区复制流量开始使用 ENA Express,基于 SRD 协议提供最高 25 Gbps 单流带宽,降低…
Amazon EC2 R8i/R8i-flex 实例在 GovCloud(US-East) 上线Amazon - AWS What’s New05-27 00:00Amazon EC2 R8i 与 R8i-flex 实例(定制 Intel Xeon 6)在 AWS GovCloud(US-East) 区域上线,性价比…
Amazon EC2 M8i/M8i-flex 实例在 GovCloud(US-East) 上线Amazon - AWS What’s New05-27 00:00Amazon EC2 M8i 与 M8i-flex 实例在 AWS GovCloud(US-East) 上线,由定制 Intel Xeon 6 驱动,性价…
Amazon EMR 正式支持 Apache Spark 4.0.2Amazon - AWS What’s New05-28 04:17Amazon EMR 全部三种部署模式都已支持 Apache Spark 4.0.2,带来 ANSI SQL、VARIANT 类型、行/列级 FGAC、I…
Azure Marketplace 多方私有报价扩至 30 国Microsoft - Azure 服务更新(含 AI)05-28 01:45微软宣布 Microsoft Marketplace 中的多方私有报价(multiparty private offers)正式开放至欧洲 30 个国家,…
AWS Backup 增 OTP 验证强化多方审批Amazon - AWS What’s New05-27 18:00AWS Backup 对逻辑气隙金库的多方审批新增 OTP 验证,审批者必须输入发送至 IAM Identity Center 邮箱的 6 位验证码。
Azure 虚拟网络管理器与 Virtual WAN 集成公开预览Microsoft - Azure 服务更新(含 AI)05-27 02:00Azure Virtual Network Manager 与 Virtual WAN 集成进入公开预览,可将 Azure Virtual WAN hub…
Azure 虚拟网络流日志 Sentinel 连接器正式可用Microsoft - Azure 服务更新(含 AI)05-27 00:45Azure 虚拟网络流日志与 Microsoft Sentinel 的连接器正式可用,可将网络流量数据无缝导入安全运营工作流。
Amazon VPC IPAM 支持 IPAM 池分配标签Amazon - AWS What’s New05-26 21:00Amazon VPC IP Address Manager 支持对 IPAM 池中单个 IP 分配打标签,方便组织、治理和访问控制。
AWS Backup 的 GuardDuty 恶意软件防护支持 S3 持续备份Amazon - AWS What’s New05-26 18:00Amazon GuardDuty Malware Protection for AWS Backup 现支持 Amazon S3 持续备份,可在备份时间线…
AWS Glue 大型与内存优化 worker 登陆西班牙Amazon - AWS What’s New05-28 04:10AWS Glue 在欧洲(西班牙)区域上线 G.12X/G.16X 大型计算 worker 及 R.1X/R.2X/R.4X/R.8X 四款内存优化 wo…

2. AI 公司官方博客

11 条

标题来源日期摘要
用 Codex 构建自我改进的报税 AgentOpenAI05-27 15:00OpenAI、Thrive 和 Crete 联合发布案例:用 Codex 构建可自我改进的报税 Agent,自动化报税申报、提升准确率、加速整体工作流。文…
CodeRabbit 如何用 Claude 构建 Agent 编排系统Claude Blog05-27 08:00Anthropic Claude 博客分享 CodeRabbit 用 Claude 构建 Agent 编排系统的实战经验。CodeRabbit 是知名的 …
Claude Blog:AI Agent 的零信任Claude Blog05-27 08:00Anthropic Claude 博客发表《Zero Trust for AI Agents》,讨论 AI Agent 安全的零信任架构。
用 LLM 保护源代码Claude Blog05-27 08:00Anthropic Claude 博客发表《Using LLMs to secure source code》,讨论用 LLM 提升源码安全。
Anthropic 研究:社会科学中的编码 AgentAnthropic (研究)05-27 08:00Anthropic Research 发布经济研究文章《Coding agents in the social sciences》,探讨编码 Agent …
Cisco 与 OpenAI 用 Codex 重塑企业工程OpenAI05-27 19:00OpenAI 官方文章介绍 Cisco 与 OpenAI 联合用 Codex 推动 Cisco AI 原生开发,加速 AI Defense 工作并自动化缺…
Warp 押注 GPT-5.5 构建开源OpenAI05-27 08:00OpenAI 官方文章介绍 Warp 终端用 GPT-5.5 和 OpenAI 模型协调本地、云和开源开发工作流中的编码 Agent。
2026 选举信息与防护OpenAI05-27 08:00OpenAI 官方文章介绍 2026 全球大选前的信息可及性、网络防御者支持与 AI 透明度举措。
SilverTorch:把索引当模型——推荐系统检索新范式Meta AI / FAIR05-27 00:00Meta 工程博客介绍 SilverTorch:统一 UGC 检索组件的新架构,比 SOTA 吞吐量提升 23.7 倍,相比 CPU 方案计算成本效率提升…
[a16z] 避免在黄砖路上死亡a16z (Substack)05-27 22:01a16z Substack 文章,探讨应用层并未消亡,反驳“App 层已死”观点。
处处皆合规:AI 企业最大机会就是最无聊的领域a16z (Substack)05-26 22:03a16z 长文:AI 在企业市场最大、最被低估的机会是合规——一个看起来无聊但万亿美元规模的赛道。

3. 知名 AI 个人开发者/研究者

9 条

标题来源日期摘要
SQLite 仓库新增 AGENTS.md 文件Simon Willison05-28 07:44Simon Willison 注意到 SQLite 仓库五天前加入了 AGENTS.md 文件,但目标读者并非 SQLite 自身的贡献者,而是把 AI …
Simon Willison:Anthropic 与 OpenAI 已找到 PMFSimon Willison05-28 00:38Simon Willison 评论 Anthropic 据称即将迎来首个盈利季度,以及企业 LLM 账单飙升的现象。他认为 OpenAI 与 Anthro…
Microsoft Copilot Cowork 文件外泄漏洞Simon Willison05-26 23:36Simon Willison 转述 PromptArmor 的研究:Microsoft Copilot Cowork 存在数据外泄漏洞,攻击者可诱导 Ag…
curl 团队承受的压力Simon Willison05-27 07:48Simon Willison 转述 Daniel Stenberg 的文章:curl 团队正承受前所未有的压力——AI 辅助生成的(看起来可信的)安全漏洞…
Simon Willison 引语:Kyle FerranaSimon Willison05-27 14:41Simon Willison 转引 Kyle Ferrana 的 Star Trek 风格段子讽刺 AI Agent 不执行指令的现象(DATA 没升盾)。
引用 Paul Graham 谈 AI 邮件Simon Willison05-26 23:02Simon 引用 Paul Graham 推文:创始人发的邮件如今多是 AI 生成、硬冲突新闻体;一旦识破是 AI 写的,就难以继续读下去,感觉像被欺骗。
[Latent Space] ESMFold2:苦涩教训降临蛋白质Latent Space (Newsletter)05-28 01:46Latent Space Newsletter 发布与 BioHub 的 Alex Rives 对谈 ESMFold2,讨论数据集与归纳偏置、世界模型与可…
[AINews] Fireworks 与 Baseten 跻身 AI Infra 十角兽Latent Space (Newsletter)05-27 11:33Latent Space AINews 报道 Fireworks 和 Baseten 成为新的 AI Infra 十角兽(百亿美元估值),OpenRout…
引用 Corey Quinn 评 Anthropic 与教皇Simon Willison05-26 10:28Simon 引用 Corey Quinn 推文:让教皇把你产品的技术局限封圣成属灵专著,是他见过最厉害的厂商游说行为。讽刺 Anthropic 联合创始人…

4. AI 工具/产品

11 条

标题来源日期摘要
Faire 借助 Cursor Cloud Agents 将 PR 吞吐量翻倍编程助手 - Cursor (博客)05-26 20:00Cursor 官方案例:电商批发平台 Faire 引入 Cursor Cloud Agents 后,PR 吞吐量直接翻倍。案例展示了 Cloud Agen…
Copilot Memory 新增删除、范围控制并支持 Copilot CLI编程助手 - GitHub Copilot (专属)05-27 05:05GitHub Copilot Memory 公开预览版新增更精细的记忆删除控制、仓库级开关,并将记忆控制扩展到 Copilot CLI。
通过模型规则为组织指定 Copilot 模型编程助手 - GitHub Copilot (专属)05-27 03:47GitHub Copilot 企业管理员可通过 model rules 为不同组织指定可用模型,实现精细化模型治理。
Cline Nightly:SDK 迁移与简化登录编程助手 - Cline (GitHub Releases)05-28 06:21Cline 编程助手发布 nightly 构建,来自 dpc/sdk-migration-simpler-login 分支,提交 47f7b…,预览 SD…
ITBench-AA:前沿模型企业 IT Agent 任务低于 50%框架/平台 - Hugging Face (博客)05-28 01:20Artificial Analysis 和 IBM 联合发布 ITBench-AA,首个针对企业 IT 自动化任务的 agentic 基准,前沿模型得分均…
Reachy Mini 实现完全本地运行框架/平台 - Hugging Face (博客)05-27 08:00Hugging Face 在 Reachy Mini 桌面机器人上跑通完全本地化的语音对话流水线,无需云端依赖。展示了端侧 LLM + 语音模型在小型机器…
用 Hub Bucket 同步万亿参数:TRL 中的 Delta Weight Sync框架/平台 - Hugging Face (博客)05-27 08:00Hugging Face TRL 库通过 Hub Bucket 中的 delta weight sync 机制,将万亿参数模型的权重同步开销显著降低。面向…
Cline CLI v3.0.14编程助手 - Cline (GitHub Releases)05-28 03:11Cline 发布 CLI v3.0.14,修复 OTEL telemetry 变量打包问题,保证编译后 CLI 构建中遥测正确启用。
Midjourney 网页更新:语音改进应用产品 - Midjourney05-28 02:44Midjourney Updates 介绍网页端会话模式(文本+语音)改进:语音会话可访问 Image Prompts、Style References、…
Cline nightly 构建:SDK 迁移与简化登录编程助手 - Cline (GitHub Releases)05-27 05:47Cline 的 Nightly 构建,发布自 dpc/sdk-migration-simpler-login 分支,主要进行 SDK 迁移和登录流程简化的实验。
Vercel 重新设计部署列表框架/平台 - Vercel (含 AI SDK)05-27 08:00Vercel Dashboard 部署列表改版,采用更紧凑的布局,按环境分组显示状态,分支与 commit 信息更易扫读,移动端体验也得到改善。

5. GitHub 开源项目 Releases(Atom Feed)

61 条

标题来源日期摘要
Ollama v0.30.0:架构改用 llama.cpp推理引擎 & 本地 AI - Ollama05-28 01:50Ollama 发布 v0.30.0(rc28),架构层重大变更:直接基于 llama.cpp 而非原 GGML 实现,原生兼容 GGUF 格式,Apple…
RAGFlow v0.25.6:Browser 组件AI 框架 & 编排 - RAGFlow05-27 10:18RAGFlow v0.25.6 发布,Agent 新增 Browser 组件,让 AI 可以自主导航网页并与之交互(issue #14888)。RAGFl…
DSPy 3.3.0b1AI 框架 & 编排 - DSPy05-27 23:22Stanford NLP 发布 DSPy 3.3.0b1 测试版。
CrewAI 1.14.6a2 预发布版AI Agent 框架 - CrewAI05-28 07:49CrewAI 多 Agent 框架发布 1.14.6a2 预发布版本,增强 StdioTransport 防止环境变量泄漏、改进规划配置和观察处理,新增 …
vLLM v0.22.0rc2:修复早期 CUDA 初始化推理引擎 & 本地 AI - vLLM05-28 05:20vLLM 发布 v0.22.0rc2 候选版,修复 #43791 中早期 CUDA 初始化问题,cherry-pick 自主分支 commit 41688e2。
n8n@2.22.4-exp.0 实验版AI 框架 & 编排 - n8n05-28 01:38n8n 自动化平台发布 2.22.4-exp.0 实验版,编辑器中工作流卡片显示 MCP 访问开关(PR #30683)。
n8n@2.23.0AI 框架 & 编排 - n8n05-27 17:35n8n 发布 2.23.0 稳定版,包含 ai-builder 中默认 Switch 改为大小写不敏感等 bug 修复。
vLLM v0.22.0rc1:spec decode 修复推理引擎 & 本地 AI - vLLM05-27 15:37vLLM 发布 v0.22.0rc1 候选版,修复 MRV2 中 KV connector 在投机解码场景下的 bug(#43719)。
Mastra @mastra/spanner@1.0.0AI Agent 框架 - Mastra05-27 12:34Mastra 发布 @mastra/spanner@1.0.0 子包(Google Spanner 集成),首次稳定版。
Pydantic AI v1.103.0AI Agent 框架 - Pydantic AI05-27 10:37Pydantic AI 发布 v1.103.0,新增 McpServer 的 list_prompts 和 get_prompt 功能。
Weaviate v1.38.0-rc.0:HFresh、Namespaces 等向量数据库 & AI 基础设施 - Weaviate05-28 05:04Weaviate 向量数据库发布 1.38.0 候选版,包含 HFresh 正式发布、Namespaces 预览、嵌套对象过滤、Alter Schema …
Unsloth 大改版前的更新预告基座模型 / LLM - Unsloth05-26 22:47Unsloth v0.1.42-beta 增加 API 调用支持(图像生成/编辑、网页搜索、代码执行等),为下一波大改版前的过渡版本。
OpenAI Agents SDK v0.17.4AI Agent 框架 - OpenAI Agents SDK05-26 16:54OpenAI Agents SDK 0.17.4 增加对 Realtime 自定义语音对象的支持。
llama.cpp b9371 构建推理引擎 & 本地 AI - llama.cpp05-28 07:47llama.cpp 发布 b9371 构建,主要移除 ggml-webgpu 中的遗留常量,属于本地 LLM 推理引擎的日常迭代。
LiteLLM v1.86.2AI 框架 & 编排 - LiteLLM05-28 01:44LiteLLM 发布 v1.86.2,Docker 镜像由 cosign 签名验证,可通过固定 commit hash 验证镜像来源。
LiteLLM v1.84.3AI 框架 & 编排 - LiteLLM05-28 01:44LiteLLM 发布 v1.84.3 稳定版补丁,Docker 镜像由 cosign 签名。
n8n@2.22.4AI 框架 & 编排 - n8n05-27 17:35n8n 发布 2.22.4 patch,core 模块移除二进制数据重命名时的激进临时目录清理(#31165)。
LiteLLM v1.85.2AI 框架 & 编排 - LiteLLM05-27 16:20LiteLLM 发布 v1.85.2 稳定版,Docker 镜像由 cosign 签名。
LiteLLM v1.87.0-rc.2AI 框架 & 编排 - LiteLLM05-27 10:01LiteLLM 发布 v1.87.0-rc.2 候选版。
llama.cpp b9367 构建推理引擎 & 本地 AI - llama.cpp05-28 01:37llama.cpp 发布 b9367,Vulkan 后端引入 GL_NV_cooperative_matrix_decode_vector 加速 matm…
llama.cpp b9354 构建推理引擎 & 本地 AI - llama.cpp05-27 14:02llama.cpp 发布 b9354,convert 工具新增 MiniCPM5 tokenizer 支持(#23384)。
HuggingFace TRL v1.5.1AI 框架 & 编排 - TRL05-27 23:26HuggingFace 发布 TRL v1.5.1,对 trainer telemetry 添加显式类名白名单门控。
Mastra mastracode@0.21.1AI Agent 框架 - Mastra05-27 21:26Mastra Agent 框架发布 mastracode@0.21.1 子包。
Mastra mastra@1.10.2AI Agent 框架 - Mastra05-27 21:26Mastra 主包发布 1.10.2。
Mastra @mastra/temporal@0.1.8AI Agent 框架 - Mastra05-27 21:26Mastra 发布 @mastra/temporal 0.1.8 子包,集成 Temporal 工作流。
Mastra @mastra/server@1.37.1AI Agent 框架 - Mastra05-27 21:26Mastra 发布 @mastra/server@1.37.1 服务端子包。
n8n@2.21.8AI 框架 & 编排 - n8n05-27 15:14n8n 发布 2.21.8 patch 版本。
Mastra mastracode@0.21.0AI Agent 框架 - Mastra05-27 12:34Mastra 发布 mastracode@0.21.0 子包。
Mastra mastra@1.10.1AI Agent 框架 - Mastra05-27 12:34Mastra 发布 mastra@1.10.1 patch。
Mastra @mastra/temporal@0.1.7AI Agent 框架 - Mastra05-27 12:34Mastra 发布 @mastra/temporal@0.1.7 子包(Temporal 集成)。
Mastra @mastra/slack@1.3.0AI Agent 框架 - Mastra05-27 12:34Mastra 发布 @mastra/slack@1.3.0 子包(Slack 集成)。
Ollama v0.30.0-rc27推理引擎 & 本地 AI - Ollama05-27 08:17Ollama 发布 v0.30.0-rc27,CI 中处理 Windows CPU 构建路径 workaround。
Ollama v0.30.0-rc26 发布推理引擎 & 本地 AI - Ollama05-27 07:41Ollama v0.30.0-rc26 预发布版本,主要为合并 upstream/main 到 llama-runner-phase-0 分支,包含 im…
MLflow v3.13.0rc0:RBAC 重构与部署增强向量数据库 & AI 基础设施 - MLflow05-27 02:12MLflow 3.13.0rc0 大幅重构 RBAC,引入统一的 role_permissions 表、新管理 UI、统一权限 API,深化 Agent …
Weaviate v1.37.5:HFresh 任务优先级与降低分片锁向量数据库 & AI 基础设施 - Weaviate05-26 20:10Weaviate v1.37.5 新增 HFresh 任务优先级管理、降低分片锁定,并添加 release 脚本工具。
Dify v1.13.3 稳定性与正确性更新AI 框架 & 编排 - Dify05-26 14:25Dify 1.13.3 重点是工作流执行、流式与知识检索的稳定性与正确性修复;LLM、问题分类器、变量提取器节点的模型参数支持变量引用。
LiteLLM v1.86.1 发布AI 框架 & 编排 - LiteLLM05-26 12:09LiteLLM 1.86.1 发布,所有 Docker 镜像由 cosign 签名,可通过 release 列出的 pinned commit hash 校验。
browser-use 0.12.9 发布AI Agent 框架 - browser-use05-26 11:45browser-use 0.12.9 更新,主要为 judge LLM 调用传递 session id 等改进。
Milvus Go SDK v2.6.5:可空向量列与数组部分更新向量数据库 & AI 基础设施 - Milvus05-26 10:44Milvus Go SDK 2.6.5 新增 dense/binary/sparse/int8 向量列的 nullable 支持,并加入 ARRAY_AP…
langchain-perplexity 1.3.1AI 框架 & 编排 - LangChain05-28 04:45LangChain 发布 langchain-perplexity 1.3.1 patch 版本,对应 PR #37720 的小修复。
langchain-fireworks 1.4.2AI 框架 & 编排 - LangChain05-28 02:10LangChain 发布 langchain-fireworks 1.4.2 patch,对应 PR #37715。
Weaviate v1.37.6:核心稳定性修复向量数据库 & AI 基础设施 - Weaviate05-27 21:09Weaviate 发布 v1.37.6 patch,将 SSB memlimit 阈值从 80% 提升到 90% 等多个稳定性修复。
Weaviate v1.36.16:SSB 内存阈值与 hnsw 修复向量数据库 & AI 基础设施 - Weaviate05-27 16:30Weaviate 发布 v1.36.16,将 SSB memlimit 阈值由 80% 提升至 90%,修复 hnsw findnewentrypoint…
langchain-perplexity 1.3.0AI 框架 & 编排 - LangChain05-27 08:22LangChain 发布 langchain-perplexity 1.3.0(#37707)。
LocalAI v4.3.2 依赖更新推理引擎 & 本地 AI - LocalAI05-28 06:14LocalAI 本地推理平台发布 v4.3.2,主要为依赖升级(如 nats.go 1.50.0→1.52.0),由 dependabot 自动提交。
Langflow v1.9.5:starter 项目更新AI 框架 & 编排 - Langflow05-28 02:33Langflow 发布 v1.9.5,仅包含 starter 项目的更新。
llama.cpp b9370 构建推理引擎 & 本地 AI - llama.cpp05-28 02:25llama.cpp 发布 b9370 构建,hexagon 后端新增 MUL_MAT 和 MUL_MAT_ID 中 Q4_1 量化支持。
llama.cpp b9368 构建推理引擎 & 本地 AI - llama.cpp05-28 02:13llama.cpp 发布 b9368 构建,Vulkan 后端 MUL_MAT_VEC 在 F16/32 模式下每次迭代切换为 4K,性能优化。
llama.cpp b9369 构建推理引擎 & 本地 AI - llama.cpp05-28 01:42llama.cpp 发布 b9369,ggml-webgpu 修复了某些操作的工作组分发问题。
llama.cpp b9366 构建推理引擎 & 本地 AI - llama.cpp05-28 01:34llama.cpp 发布 b9366,Vulkan 后端为 f16→f16 添加 REPEAT 算子支持(PR #23298)。
llama.cpp b9365 构建推理引擎 & 本地 AI - llama.cpp05-28 01:06llama.cpp 发布 b9365,CI 中将 ARM 任务移至 self-hosted runner、暂禁 kleidiai mac release(…
Langflow 1.9.4 错误修复AI 框架 & 编排 - Langflow05-28 00:04Langflow 发布 v1.9.4,修复 agent 工具调用的模型处理并更新 IBM 模型集成。
llama.cpp b9360 构建推理引擎 & 本地 AI - llama.cpp05-27 21:15llama.cpp 发布 b9360,common 模块修复环境变量统一加 LLAMA_ARG_ 前缀(PR #23778)。
llama.cpp b9357 构建推理引擎 & 本地 AI - llama.cpp05-27 18:19llama.cpp 发布 b9357,Vulkan 避免在 AMD UMA 设备上优先选择 transfer queue(PR #22455)。
n8n@1.123.48AI 框架 & 编排 - n8n05-27 15:06n8n 发布 1.123.48 旧线 patch。
Mastra @mastra/voice-murf@0.12.1AI Agent 框架 - Mastra05-27 12:34Mastra 发布 @mastra/voice-murf@0.12.1 子包(Murf 语音集成)。
Langflow v1.10.0.dev48 nightlyAI 框架 & 编排 - Langflow05-27 08:59Langflow 发布 v1.10.0.dev48 nightly。
LangChain 1.3.2 版本发布AI 框架 & 编排 - LangChain05-27 02:18LangChain 升级到 1.3.2,要求 langgraph>=1.2.2,为常规维护版本。
LangGraph 1.2.2 版本发布AI 框架 & 编排 - LangGraph05-27 02:07LangGraph 版本号升至 1.2.2,常规依赖维护。
Langflow 1.9.4 修复 nightly-base 跳过设置AI 框架 & 编排 - Langflow05-26 23:39Langflow 1.9.4 修复 build-nightly-base 中 skipped 标志未正确设置导致始终跳过推送的问题。
Langflow nightly v1.10.0.dev47AI 框架 & 编排 - Langflow05-26 08:56Langflow 1.10.0 dev47 夜版构建。

6. 新闻媒体

81 条

标题来源日期摘要
Anthropic 如何在产品中遏制 Claude 行为边界AI 专业媒体/Newsletter - TLDR AI05-27 08:00Anthropic 工程文:Agent 是新形态软件但底层交互不新,应先在环境层做隔离再在模型层调行为。匹配隔离强度与用户监督能力,使用经过验证的组件。
开源包严重漏洞危及数百万 AI Agent英文科技媒体(AI 频道) - Ars Technica AI05-27 03:50Starlette(每周 3.25 亿下载)被发现”BadHost”严重漏洞,影响数百万 AI Agent。安全研究者 Ars Technica 报道。
Claude Cowork 首席工程师如何用 AIAI 专业媒体/Newsletter - TLDR AI05-27 08:00Felix Rieseberg 展示用 Claude Cowork 完成的实际任务:把 2D 平面图转 3D 楼层规划、把邮件挖掘成个人物品库、用连接应用…
DeepSWE:长程软件工程评测基准AI 专业媒体/Newsletter - TLDR AI05-27 08:00DeepSWE 推出长时段软件工程基准,覆盖 91 个仓库、5 种语言,且无模型预见过解。任务无污染、真实复杂、仓库多样、验证可靠,比 SWE-Bench…
法律 Agent 基准测试初步结果AI 专业媒体/Newsletter - TLDR AI05-27 08:00Harvey 在法律 Agent Benchmark 上以”全项通过”严标准测试前沿模型:Claude Opus 4.7 居首仅 7.1%,Sonnet …
Import AI 458:清算未来与一段奇点故事AI 专业媒体/Newsletter - Import AI (Jack Clark)05-26 20:32Jack Clark 的 Import AI 458 期,讨论年内的 AI 奇迹与未来清算,附一段奇点故事。
Claude Mythos 推翻 Erdős 80 年猜想中文 AI 媒体 - 新智元05-27 16:10新智元报道 Claude Mythos 在断网环境下解决了一个 80 年的 Erdős 猜想,比 OpenAI 同类成果更短更漂亮。
GPT-5.5 反杀 Claude 登顶,AI 编码旧榜失准?中文 AI 媒体 - 新智元05-27 18:30新智元报道 GPT-5.5 在编码相关榜单上超越 Claude 登顶,引发对传统 AI 编程基准是否仍准确的讨论。
Codex 自蒸馏玩法:复制粘贴消灭重复劳动中文 AI 媒体 - 量子位05-27 13:12量子位报道 OpenAI 员工亲授 Codex 自蒸馏玩法,只需一段提示词复制粘贴即可让 AI 消灭重复劳动。
DeepSeek 陈德里开发自动研究 Skill中文 AI 媒体 - 量子位05-27 09:14量子位报道 DeepSeek 陈德里开发自动研究 Skill,让 Agent 完成论文 99% 工作,人类只需动脑 2 小时。
微软 MAI-Image-2.5 登上 Arena 第 3AI 专业媒体/Newsletter - TLDR AI05-27 08:00微软 MAI-Image-2.5 在文生图 Arena 榜单排名第 3,在风格多样性、文字渲染和商业插画能力上较 MAI-Image-2 有明显提升。
用 NVIDIA CompileIQ 自动调优挖掘内核性能AI 专业媒体/Newsletter - TLDR AI05-27 08:00NVIDIA 集成进 CUDA 13.3 的 CompileIQ 通过 AI 演化算法自动调优 GPU 编译器配置,在已优化的 AI 推理/训练任务上仍可…
Native Multimodal Models 资源汇总仓库AI 专业媒体/Newsletter - TLDR AI05-27 08:00一个 GitHub 仓库整理从模块化拼装走向原生多模态建模的相关工作——把不同模态统一到同一 transformer 空间或联合主干内。
Anthropic 将在 Claude 中引入 AI Fluency 评分卡AI 专业媒体/Newsletter - TLDR AI05-27 08:00Anthropic 计划在 Claude 中加入 AI Fluency 评分卡,依据 11 项行为指标评估用户的 AI 使用能力。
OpenRouter 一年内估值翻倍至 13 亿美元英文科技媒体(AI 频道) - TechCrunch AI05-27 02:33OpenRouter 获得 CapitalG 领投的 1.13 亿美元 B 轮融资,6 个月内用量增长 5 倍,印证多模型 AI 未来已到。
AI Agent 将科技世界推入混沌:始末解析英文科技媒体(AI 频道) - Wired AI05-26 18:00Wired 长文回顾 Claude Code 和 OpenClaw 如何引爆了可能是计算机历史上最大的转型浪潮。
LWiAI 播客 #246:Gemini 3.5 + Omni、Musk 败诉、OpenAI …AI 专业媒体/Newsletter - Last Week in AI05-26 13:10Last Week in AI 第 246 期播客:Google 发布 Gemini 3.5 与 Gemini Spark Agent,Omni 把图像/…
SpaceX 的两个 AI 算力故事:仅一个有收入AI 专业媒体/Newsletter - TLDR AI05-27 08:00SpaceX 招股书呈现两个故事:一是地面数据中心扩张并与 Anthropic 签下 12.5 亿美元/月、至 2029 年 5 月的合同;二是太空 AI…
Claude Mythos 据称用简洁证明解决 OpenAI 的 Erdős 难题AI 专业媒体/Newsletter - TLDR AI05-27 08:00据报道 Claude Mythos 对 OpenAI 标志性的 Erdős 问题给出了一个 cute、simple 的证明,虽然比 OpenAI 的方案略…
Sundar Pichai 谈 AI、搜索未来与网络变迁英文科技媒体(AI 频道) - The Verge AI05-26 22:00Verge Decoder 播客:Google CEO Sundar Pichai 在 I/O 2026 后接受采访,谈 AI、搜索未来与网络生态。
5 秒完成 3D 场景编辑:VGGT-Edit 提速 120 倍中文 AI 媒体 - 量子位05-27 17:01量子位报道北大、港中文、上海 AI Lab 联合推出 VGGT-Edit,可 5 秒完成 3D 场景编辑,比上一代提速 120 倍且无需绕回 2D。
卡帕西Anthropic最新头衔:技术员工(MTS)中文 AI 媒体 - 量子位05-26 15:42量子位报道 Andrej Karpathy 在 Anthropic 的新头衔是 MTS(技术员工/Member of Technical Staff)。
Last Week in AI #341:马斯克败诉 OpenAI 等AI 专业媒体/Newsletter - Last Week in AI05-27 15:50Last Week in AI 周报第 341 期:马斯克对 OpenAI/Altman 的 1500 亿诉讼败诉、Google 在 I/O 2026 更…
Musk 的 xAI 警告员工限制与 Cursor 员工接触AI 专业媒体/Newsletter - TLDR AI05-27 08:00xAI 首席法务警告员工,与 Cursor 员工的交流仅限于技术合作所需。背景是收购交易已进行数周,担心员工不当混合业务影响并购。
Robinhood 让 AI Agent 替你交易股票英文科技媒体(AI 频道) - The Verge AI05-27 22:36The Verge 报道 Robinhood 开放交易平台给 AI Agent,用户可创建独立账户、设置预算让 Agent 自主买卖股票。
ElevenLabs 新音乐生成模型可中途换风格英文科技媒体(AI 频道) - TechCrunch AI05-27 22:14TechCrunch 报道 ElevenLabs 新音乐生成模型支持只重新生成歌曲某一段而不影响其他部分,并能跨曲风过渡。
前 Google/Apple 研究员创立 AI 反馈循环初创英文科技媒体(AI 频道) - Wired AI05-27 22:00Wired 报道前 Google 与 Apple 研究员成立 Trajectory,押注 vibe-coding 式的快速迭代周期让 AI 产品能持续学习。
1400 亿 Agent 入场,流量护城河要塌了中文 AI 媒体 - 量子位05-27 17:31量子位报道大厂押注 Agent 生态,新方向正在改变互联网“流量”作为护城河的逻辑。
实锤!GPT-5.5 降智,OpenAI 官方文档认了中文 AI 媒体 - 新智元05-27 16:10新智元报道用户反馈 GPT-5.5 性能下降,OpenAI 官方文档确认该模型存在“降智”问题。
用户拒绝 Google AI 搜索,DuckDuckGo 安装量上涨 30%英文科技媒体(AI 频道) - TechCrunch AI05-27 06:32Google 在 I/O 2026 用 AI agent 取代蓝色链接后引发反弹,DuckDuckGo 应用安装量飙升 30%,反映用户对强推 AI 搜索…
3D 打印人形机器人腿开启机器人实验自由英文科技媒体(AI 频道) - Ars Technica AI05-27 01:16Hugging Face 发布售价 2500 美元的双足机器人项目,3D 可打印腿部,面向开发者与研究者。
将DSA注意力引入多模态,快手Keye2.0开启强化推理新范式中文 AI 媒体 - 量子位05-26 18:17量子位报道快手 Keye 2.0 多模态模型,引入 DSA 注意力机制,开启强化推理的新范式。
AI 编程公司 Cognition 估值 250 亿融资 10 亿英文科技媒体(AI 频道) - TechCrunch AI05-28 00:00TechCrunch 报道 Devin 母公司 Cognition 完成 10 亿美元融资,pre-money 估值 250 亿美元,年化营收已达 4.9…
刚刚,国产AI自己造了AI,全球首例!中文 AI 媒体 - 量子位05-26 16:46量子位报道国产 AI 自动生成 AI 系统的首例,训练速度比英伟达 Megatron 快 10%。
留给人类数学家的悬赏不多了!谷歌DeepMind一口气解决9道埃尔德什问题中文 AI 媒体 - 量子位05-26 16:20量子位报道 Google DeepMind 一次性解决 9 道 Erdős 问题,其中包括卡了人类 56 年的数学难题。
Robinhood 现可让 AI Agent 交易股票英文科技媒体(AI 频道) - TechCrunch AI05-27 20:30TechCrunch 报道 Robinhood 允许 AI Agent 阅读用户组合、制定策略、用专用钱包预存余额下单。
重新思考 Agentic AI 时代的组织设计英文科技媒体(AI 频道) - MIT Technology Review AI05-26 22:54MIT TR:85% 的组织希望在 3 年内成为 agentic 企业,但 76% 表示当前流程与基础设施无法支撑,人、流程、工作流准备不足。
ClickHouse 年化营收三倍达 2.5 亿走向 IPO英文科技媒体(AI 频道) - TechCrunch AI05-27 21:04TechCrunch 报道列存数据库 ClickHouse 年化营收翻三倍达 2.5 亿美元,公司目标几年内上市。
你的 SEO 策略已落后于新搜索引擎英文科技媒体(AI 频道) - TechCrunch AI05-28 02:39TechCrunch Equity 播客讨论 Google I/O 后 AI 生成答案占据搜索前台,多数品牌对 AI 如何描述自己缺乏可见性,传统 SEO…
YouTube 将自动标注 AI 视频英文科技媒体(AI 频道) - Ars Technica AI05-28 01:36Ars Technica 报道 YouTube 即将开始自动给 AI 生成的视频打标签,但卡通、非写实或仅含少量 AI 内容的视频仍可能不被识别。
YouTube 将自动标注 AI 视频英文科技媒体(AI 频道) - TechCrunch AI05-27 21:00TechCrunch 报道 YouTube 不再仅依靠创作者自报,将自动给写实型 AI 视频打标签并提升标签可见性。
YouTube 把 AI 标签放在更显眼处英文科技媒体(AI 频道) - The Verge AI05-27 21:00The Verge 报道 YouTube 移动 Shorts 和长视频的 AI 披露位置以便用户看到,并将启动自动识别 AI 内容。
8.99 万元人形机器人来了:中国版 Figure中文 AI 媒体 - 新智元05-27 18:30新智元报道国产人形机器人价格打到 8.99 万元,对标 Figure 等海外公司,重塑价格门槛。
我是专业事实核查员:AI 出错比你以为的更频繁英文科技媒体(AI 频道) - Wired AI05-26 18:00Wired 事实核查员实测 AI 的事实核查能力,得出 AI 常错的结论。
Snowflake 与 AWS 签 60 亿美元 AI CPU 芯片协议英文科技媒体(AI 频道) - TechCrunch AI05-28 04:10TechCrunch 报道 Snowflake 与 Amazon 签订五年 60 亿美元大单采购 AI 用 CPU 芯片,Nvidia 再次被挑战。
Nvidia 押注 1500 亿美元投资台湾英文科技媒体(AI 频道) - Ars Technica AI05-28 03:59Ars Technica 报道黄仁勋宣布 Nvidia 每年投入 1500 亿美元,让台湾成为 AI 革命的“震中”,与川普政府推动美国本土 AI 中心战…
Remote 借 AI 让人均收入提升 50%英文科技媒体(AI 频道) - TechCrunch AI05-28 03:39TechCrunch 报道薪酬服务商 Remote 突破 3 亿美元 ARR、转正现金流,归功于 AI 应用带来的人均收入 50% 提升而非扩张人头。
Meta 推出 Instagram/Facebook/WhatsApp 订阅英文科技媒体(AI 频道) - TechCrunch AI05-28 02:00TechCrunch 报道 Meta 全球推出 Instagram、Facebook、WhatsApp 付费订阅,并在“Meta One”品牌下测试 AI…
华为“芯片女王”的挑战英文科技媒体(AI 频道) - Wired AI05-28 02:00Wired AI 报道华为如何应对摩尔定律终结,调整芯片生产可能复杂化美国芯片霸权。
AI 试图埋葬这位议员,反而让他出名英文科技媒体(AI 频道) - The Verge AI05-27 23:40The Verge 报道纽约 12 区民主党初选中,Anthropic 与 OpenAI 在 AI 监管立场上对议员候选人 Alex Bores 的攻击反…
中国越来越多留住顶尖 AI 人才英文科技媒体(AI 频道) - TechCrunch AI05-27 21:48TechCrunch 报道中国 AI 人才繁荣,北京越来越不愿放他们离开。
科技 CEO 似乎都在患“AI 精神病”英文科技媒体(AI 频道) - TechCrunch AI05-27 20:30TechCrunch 引用 Box CEO Aaron Levie 评论“CEO 特别易患 AI psychosis”,解释他们对 AI 生产力的近乎宗教信仰。
纽约时报内部的 AI 之争英文科技媒体(AI 频道) - The Verge AI05-27 20:00The Verge 报道纽约时报科技工会与出版社在 AI 监控员工绩效条款上的谈判博弈,新闻业 AI 使用规则成为劳资焦点。
教皇并非 AGI 信徒英文科技媒体(AI 频道) - The Verge AI05-27 20:00The Verge 报道教皇 Leo XIV 发布通谕《Magnifica Humanitas》,警告 AI 涉及人类权利、机会、地位与自由。
美国执法部门警告“反科技极端主义”兴起英文科技媒体(AI 频道) - Ars Technica AI05-27 18:30Ars Technica 报道美国执法部门警告随着 AI 仇恨情绪上升,一类新型“反科技极端主义”威胁正在形成。
OpenAI 招了 F1 级别车手搞公关中文 AI 媒体 - 量子位05-27 14:55量子位报道 OpenAI 从 Salesforce 挖来一位有 13 年市场经验且参与过 F1 的高管负责公关。
触觉具身机器人天使轮近亿中文 AI 媒体 - 量子位05-27 13:18量子位报道复旦系具身智能新公司天使轮融资近亿元,专注让机器人真正学会“触摸”。
教皇用 AI 写关于 AI 风险的通谕?英文科技媒体(AI 频道) - The Verge AI05-27 08:38The Verge 报道 LessWrong 用户 Linch Zhang 用 AI 检测器 Pangram 分析教皇 Leo XIV 通谕《Magnif…
中国扩大对民营 AI 人才的出境限制AI 专业媒体/Newsletter - TLDR AI05-27 08:00中国将出境限制扩展至民营 AI 公司的顶尖人才,包括创始人、研究员和高管,他们须经审批方可出境。此前限制仅针对国企和敏感行业。
梵蒂冈为何邀请 Anthropic 出席教皇 AI 通谕发布英文科技媒体(AI 频道) - Wired AI05-27 04:46Wired 报道:教皇利奥的首份通谕标志着教会与硅谷的史无前例联盟,Anthropic 联合创始人 Christopher Olah 出席发布会。
印度零工经济训练全球机器人?这家创业公司押注英文科技媒体(AI 频道) - TechCrunch AI05-27 00:00Human Archive 由 UC Berkeley 与斯坦福研究者创立,给印度零工工人佩戴带摄像头的帽子和传感器采集物理 AI 训练数据。
环球音乐与 TikTok 续签协议打击未授权 AI 音乐英文科技媒体(AI 频道) - TechCrunch AI05-26 22:55Universal Music Group 与 TikTok 续签协议,共同打击未经授权的 AI 生成音乐。
AI 正在接管世界上最被诅咒的工作英文科技媒体(AI 频道) - Wired AI05-26 18:00Wired 报道 AI 接管债务催收行业,未来你欠的账单可能由 AI 来催。
我用一周录下自己做家务赚钱:现在谁才是机器人?英文科技媒体(AI 频道) - Wired AI05-26 18:00Wired 记者亲历:把自己做家务的影像和动作数据卖给机器人训练公司,记录这一过程的复杂感受。
对 AI 抢工作恐慌的现实核查英文科技媒体(AI 频道) - MIT Technology Review AI05-26 17:00MIT TR 反思 Coinbase、Meta、Cisco 等近期裁员是否真是 AI 所致,提醒读者别急着辞职。
正视入门级岗位即将到来的危机英文科技媒体(AI 频道) - MIT Technology Review AI05-26 17:00MIT TR 指出虽总就业稳定,但入门级岗位(career first rung)正悄然弱化,AI 影响在表层数据下潜行。
FBI 探员解释如何轻易锁定未经同意发布 AI 色情的人英文科技媒体(AI 频道) - Ars Technica AI05-27 01:46Ars Technica 报道:FBI 通过 Instagram 上一条诡异的收藏帖追溯到一名销售 AI 色情图像的男子,他在自己头像里用了真照。
Startup Battlefield 200 申请今日截止英文科技媒体(AI 频道) - TechCrunch AI05-27 22:15TechCrunch Disrupt 2026 Startup Battlefield 200 申请今天截止,争夺 10 万美元无股权资金。
Bose 前睡眠负责人创立 SOND,融资 700 万英文科技媒体(AI 频道) - TechCrunch AI05-27 22:00TechCrunch 报道 SOND 推出 Dreambuds 闭环耳塞,可捕捉 12 项生理信号并实时辅助睡眠。
智能喂鸟器记录后院趣闻英文科技媒体(AI 频道) - The Verge AI05-27 22:00The Verge 评测 Coolfly Aura 智能喂鸟器,借助 AI 识别鸟类。
教皇利奥用托尔金教育科技大佬英文科技媒体(AI 频道) - Wired AI05-27 07:19Wired 报道教皇在关于 AI 的通谕中引用《指环王》,无意中讽刺了一直误读该作品的科技亿万富翁们。
教皇利奥十四首份通谕谈 AI 权力英文科技媒体(AI 频道) - Wired AI05-27 04:17教皇通谕《Magnifica Humanitas》批评技术权力高度集中在少数全球巨头手中,呼吁制衡。
没人愿意告诉我为何他们只听自己的 Suno 垃圾音英文科技媒体(AI 频道) - The Verge AI05-26 20:46Verge 观察 Suno 子版上的诡异趋势:用户只听自己生成的 AI 音乐,不再使用传统流媒体平台。
AI 战争已经到来英文科技媒体(AI 频道) - The Verge AI05-26 20:00Verge 长篇报道:联合国 CCW 会议讨论致命自主武器系统的现状,AI 战争已经从假设走向现实。
广告:WHOOP/Stripe/DoorDash 如何用 AI 倾听客户反馈AI 专业媒体/Newsletter - TLDR AI05-27 08:00Unwrap 的赞助内容,介绍其 AI + NLP 客户反馈智能平台被 Stripe、Southwest 等公司使用,支持自然语言查询、MCP 接入和实时告警。
广告:你的 API 延迟基准在骗你AI 专业媒体/Newsletter - TLDR AI05-27 08:00You.com 赞助稿,主张 P50 延迟无法反映真实性能,需结合召回率、grounding、重查询率和集成成本综合评估。
TechCrunch Disrupt 2026 早鸟票 3 天后截止英文科技媒体(AI 频道) - TechCrunch AI05-27 22:00TechCrunch Disrupt 2026 早鸟票最多省 410 美元,5 月 29 日截止。
新智元 ALL in ASI 英雄帖中文 AI 媒体 - 新智元05-27 12:53新智元发布招募帖呼吁人才加入 ASI 探索。
TLDR 招聘高级应用 AI 软件工程师(年薪 25-35 万美元,全远程)AI 专业媒体/Newsletter - TLDR AI05-27 08:00TLDR 应用 AI 团队招聘高级软件工程师,工作内容是把内部流程代码化、可复合编排,全远程,使用最新 AI 工具且 token 预算无限。
TechCrunch Disrupt 2026 早鸟票 5 月 29 日截止英文科技媒体(AI 频道) - TechCrunch AI05-26 22:00TechCrunch 提醒 Disrupt 2026 早鸟票将于 5 月 29 日截止,最高可省 410 美元。
测试:AI 会摧毁你的职业吗?英文科技媒体(AI 频道) - Wired AI05-26 18:00Wired 互动小测试,让读者评估自己的职业被 AI 取代的可能性。

7. Y Combinator

20 条

标题来源日期摘要
Claude Code 作为日常工具:CLAUDE.md、Skills、Subagents、插…Hacker News05-27 13:13HN 转载博客,作者分享 Claude Code 日常使用经验,涵盖 CLAUDE.md、Skills、Subagents、Plugins 和 MCP 用法。
Show HN:开源 AI 赛车竞赛框架Hacker News05-28 04:37Elodin Systems 在 HN 展示开源 AI Grand Prix 模拟竞赛框架,用于评测 AI 在赛车模拟环境下的表现。
Go:支持泛型方法Hacker News05-27 17:02HN 转 Go 语言官方 Issue #77273,讨论 Go 增加泛型方法的支持。
交错增量(Interleaved Deltas)Hacker News05-26 22:30mmapped 博客技术文,讨论 interleaved deltas 数据结构/同步设计。HN 推送,无 description 上下文。
Pelica(YC P25)正在招聘Hacker News05-28 06:52Y Combinator P25 批次公司 Pelica 在招聘机器学习工程师,HN 头版职位帖。
DuckDuckGo 因 Google AI Mode 反弹流量增 28%Hacker News05-28 00:28PCGamer 报道 Google 称用户喜爱 AI Mode 后的一周,DuckDuckGo 搜索访问量增加近 28%。
在越狱 Kindle 上跑 Rust 和 SlintHacker News05-28 03:51HN 文章分享在越狱后的 Kindle 上运行 Rust 程序与 Slint UI 框架的实践。
GitHub 服务事件:PR、Issues、Git 操作中断Hacker News05-27 20:15HN 转 GitHub Status 事件帖,涉及 PR、Issues、Git 操作和 API 的中断。
伊朗互联网流量在上升Hacker News05-28 06:24Cloudflare Radar 显示伊朗在 28 天内互联网流量增加,HN 讨论帖。
迷上 Meshtastic、MeshCore 与 Reticulum 等网格网络Hacker News05-28 03:52HN 转载博客,作者分享个人尝试 Meshtastic、MeshCore、Reticulum 等去中心化网格网络协议的体验。
关于 Labubu 与超真实Hacker News05-28 03:31HN 帖子,文化评论文章讨论 Labubu 等潮玩与鲍德里亚“超真实”概念的关系。
4K 分辨率玩 SimCity 3k(2025)Hacker News05-28 01:36HN 帖子分享如何在 4K 显示器上玩 SimCity 3000 老游戏。
Gemini、Gophers 和 Fingers:HTTPS 之外的网络Hacker News05-28 01:24HN 帖子探讨 Gemini、Gopher、Finger 等 HTTPS 之外的替代互联网协议。
加拿大向瑞典订购军用机队Hacker News05-28 00:53HN 转载《卫报》报道,加拿大转向瑞典 Saab GlobalEye 采购军机替代美国供应商。
压力扰乱海马体对重叠事件的整合Hacker News05-28 00:26Science Advances 论文,HN 转载,讨论压力如何破坏海马体对重叠事件的整合和记忆推理。
Last.fm 已独立Hacker News05-27 23:36HN 转载帖,Last.fm 音乐平台宣布脱离母公司独立运营。
私募股权买下美国的关键服务Hacker News05-27 20:00HN 转载文章,探讨美国关键服务被私募股权收购的现象。
Mini Micro 幻想电脑Hacker News05-27 17:56HN 转载 MiniScript 出品的 Mini Micro 幻想电脑(虚拟复古电脑)页面。
Pandoc 的新 Typst 模板Hacker News05-26 13:08HN 推送的技术博客:介绍为 Pandoc 制作的新 Typst 模板,方便排版。
给你的 MacBook 加热(2019)Hacker News05-28 04:42HN 转载一篇 2019 年博客,讨论如何给 MacBook 加热以解决某些低温问题,纯硬件话题。

8. YouTube AI 频道

15 条

标题来源日期摘要
Cursor 刚刚击败了所有人Matthew Berman05-27 00:40Matthew Berman 视频:分析 Cursor 在 AI 编程工具竞争中超越对手的最新动作。
Cerebras CEO 谈数据中心、Token 成本与对华出口泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-26 22:3020VC 长视频:Cerebras CEO 讨论数据中心未来、token 成本演进、内存瓶颈,以及美国公司是否应向中国出售技术。
终于来了好的基准(DeepSWE)Matthew Berman05-28 00:03Matthew Berman 视频介绍 DeepSWE 基准,作者认为这是少见的高质量软件工程评测基准。
无人谈论的 250 亿美元 AI 积压订单泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-26 22:4020VC short:揭示 250 亿美元的 AI 算力/数据中心积压订单。
Marc Rowan 谈私募市场与资本配置的未来泛访谈频道(混合内容,需按 AI 相关性评分过滤) - a16z05-27 22:00a16z YouTube 节目邀请 Marc Rowan 讨论私募市场和未来资本配置,主要为金融投资话题。
HR 即将被自动化泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-27 13:0020VC YouTube Short,主持人简短表态 HR 工作即将被自动化。
这些裁员并非 AI 造成泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-27 02:0020VC short 视频,讨论近期裁员潮的真实原因并非 AI。
Forward Deployed 工程师的问题泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings)05-26 13:0020VC short:讨论 Forward Deployed Engineer 模式的弊端。
二线城市的电影院泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-27 23:58Nikhil Kamath 的 YouTube Short,讨论印度二线城市影院话题。
国家评级如何影响经济泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-27 21:17Nikhil Kamath YouTube Short,讨论国家信用评级对经济的影响。
“我拒绝了 2 亿英镑!“泛访谈频道(混合内容,需按 AI 相关性评分过滤) - The Diary of a CEO (Steven Bartlett)05-27 02:00Steven Bartlett 主持的 The Diary of a CEO 短视频,内容为某嘉宾分享拒绝 2 亿英镑收购的经历,非 AI 主题。
如何与其他内容创作者合作?泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-26 23:28Nikhil Kamath short 视频,讨论内容创作者协作话题,与 AI 无关。
印度从社群到个体主义的转变泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-26 23:23Nikhil Kamath short 视频,讨论印度社会从社群文化转向个体主义。
Kishore Biyani 揭示印度下一波消费热潮的驱动力泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-26 23:21Nikhil Kamath short:印度零售大佬 Kishore Biyani 谈未来消费趋势,与 AI 无关。
板球比赛 RCB vs GT 第一资格赛泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath05-26 20:19Nikhil Kamath short:印度板球联赛话题,与 AI 无关。

9. 技术博客 / 开发者博客(Android Capacity 精选)

25 条

标题来源日期摘要
神秘 LLM Hy3 大幅领跑 OpenRouter 排行榜AI & 技术评论 - minimaxir (Max Woolf)05-26 23:30Max Woolf 分析 OpenRouter 排行榜上突然冲顶的神秘模型 Hy3,探究其为何如此火爆。
用上我自己的大脑独立开发者 & 个人博客 - Terrible Software05-27 20:38Terrible Software 博客作者反思 AI 如何扩展大脑而非替代思考,AI 真正危险在于悄然取代本该自己思考的部分。
2026 年的 CHAOSS 指标独立开发者 & 个人博客 - Andrew Nesbitt05-27 18:00Andrew Nesbitt 博客指出 CHAOSS 开源健康度指标是按“人速”贡献校准的,AI 编码时代需要重新审视。
你今天烧了多少 token?独立开发者 & 个人博客 - Ibrahim Diallo05-27 08:31Ibrahim Diallo 在博客回忆早年荒诞的“按周按人统计代码行数”的经理故事,类比今天“按 token 用量考核开发者”的荒谬。
SQLAlchemy 2 实战练习答案编程语言 & 软件工程 - Miguel Grinberg05-28 03:22Miguel Grinberg 发布《SQLAlchemy 2 In Practice》系列收尾文章,汇总书中所有练习的参考答案。
Pluralistic:AI 与一个没有移民的世界技术写作 & 通识 - Cory Doctorow (Pluralistic)05-27 15:57Cory Doctorow 在 Pluralistic 撰文,讨论用 AI 取代移民劳动力的“唯我论”逻辑陷阱。
商业蠢人的复仇AI & 技术评论 - Where’s Your Ed At05-27 00:47Ed Zitron 持续唱衰 AI 与 NVIDIA、Anthropic 等公司的高估值,本期为其 premium newsletter 推介。
如果有足够公司报告同样的事,泡沫就会破裂AI & 技术评论 - Gary Marcus05-26 21:35Gary Marcus 援引 Uber COO Andrew Macdonald 称未从增加的 AI 成本中看到对应的生产力提升,预示 AI 泡沫可能破裂。
Pluralistic:AI 泡沫与互联网泡沫并不一样技术写作 & 通识 - Cory Doctorow (Pluralistic)05-26 17:45Cory Doctorow 论证 AI 泡沫不同于互联网泡沫:没有人需要被强行喂网络,但 AI 正被强塞给员工。
Meta 标志与拟合 Besace 曲线技术写作 & 通识 - John D. Cook05-27 23:15John D. Cook 博客分析 Meta 标志的 Besace 曲线参数拟合,讨论隐式与参数化形式。
Windows Runtime IAsyncOperation 跨协程共享(一)系统 & 底层 - The Old New Thing (Raymond Chen)05-27 22:00Raymond Chen 在 The Old New Thing 介绍如何在多个协程间共享单个 Windows Runtime IAsyncOperati…
修补 iozone 使现代 macOS 磁盘基准测试更好技术写作 & 通识 - Jeff Geerling05-27 09:32Jeff Geerling 博客分享如何修补 iozone 让其在现代 macOS 下进行更可靠的磁盘基准测试。
Solvinity 决定的详细解读与影响独立开发者 & 个人博客 - berthub.eu (Bert Hubert)05-27 16:00Bert Hubert 荷兰语博客详细分析荷兰政府禁止 Kyndryl 收购 Solvinity 的决定与可能影响。
Chuwi Minibook X N150 + Linux 评测技术写作 & 通识 - Terence Eden05-27 19:34Terence Eden 评测 Chuwi Minibook X N150 小型笔电搭配 Linux 的旅行使用体验。
把远程命令输出复制到 macOS 剪贴板独立开发者 & 个人博客 - IT Notes (Dragas)05-26 17:00技术博客介绍 macOS pbcopy 命令的用法,把远程命令的输出直接管道到本地剪贴板。
AMD K6-2 在 1998 年 5 月 28 日发布独立开发者 & 个人博客 - Dave Farquhar (dfarq)05-27 19:00Dave Farquhar 回顾 AMD K6-2 处理器在 1998 年的发布历史。
比尔·盖茨的《Internet Tidal Wave》备忘录独立开发者 & 个人博客 - Dave Farquhar (dfarq)05-27 19:00Dave Farquhar 回顾 30 年前比尔·盖茨在微软发出的《Internet Tidal Wave》备忘录及其历史意义。
重新浮现旧帖独立开发者 & 个人博客 - Herman05-27 14:45Herman 在 bearblog 介绍如何把容易被错过的旧博客帖子重新浮出。
计算正态分布样本的期望极差技术写作 & 通识 - John D. Cook05-27 01:59John D. Cook 推导 n 个标准正态样本极差的期望值,给出以 σ 为单位的通用公式。
只有疯子才会用互联网技术写作 & 通识 - Experimental History05-27 00:02Experimental History 的杂谈文章:副标题 “hit me with your Honda”,对互联网使用文化的反思评论。
C#/JS 能多次 await WinRT 异步操作,为何 C++/WinRT 不行?系统 & 底层 - The Old New Thing (Raymond Chen)05-26 22:00Raymond Chen 解释 C++/WinRT 与 C#/JavaScript 在多次 await 同一 WinRT 异步操作上的哲学差异。
陪审团中 IQ 的预期差距技术写作 & 通识 - John D. Cook05-26 21:50John D. Cook 探讨 12 人陪审团中 IQ 差距的统计期望,回应 IQ 差距阻碍沟通的话题。
Tandy 计算机的兴衰独立开发者 & 个人博客 - Dave Farquhar (dfarq)05-26 19:00Dave Farquhar 回顾 Tandy 这一早期 PC 先驱在 1977 年起 12 年间的兴衰史。
大去人口化技术写作 & 通识 - Derek Thompson05-26 19:00The Atlantic Derek Thompson 长文:探讨全球生育率为何在每个国家下降。
Amber Alert 推送垃圾链接?独立开发者 & 个人博客 - Ibrahim Diallo05-26 11:25独立博客作者收到 Amber Alert 但链接指向疑似垃圾站点,推测可能是字符截断导致的失误。

10. AI 从业者访谈 / 播客

5 条

标题来源日期摘要
[Latent Space 播客] ESMFold2:苦涩教训降临蛋白质英文播客 - Latent Space Podcast05-28 01:46Latent Space 播客发布 Alex Rives(现 BioHub 科学负责人)对谈,详述 ESM-1 用语言模型对蛋白质序列做掩码预训练,意外学…
Seeed Studio:开源具身 AI 机器人英文播客 - NVIDIA AI Podcast05-27 23:45NVIDIA AI Podcast 第 300 期,Seeed Studio CEO Eric Pan 和机器人负责人 Elaine Wu 讨论 NVID…
他融资 7000 万美元用 AI 攻克一切疾病英文播客 - Gradient Dissent (W&B)05-27 07:46Samuel Rodriques 离开物理学界后创办 Edison Scientific,打造 AI 科学家 Kosmos 用于药物研发,讨论 AI 提出…
为 AI 时代更新职业建议 | Benjamin Todd英文播客 - 80,000 Hours Podcast05-26 23:4780,000 Hours 创始人 Benjamin Todd 讨论 AI 加速背景下的职业规划,部分研究者认为 AI 自动化 AI 研究的概率今年 10%…
你的最大杠杆:为最大影响设计 AI 职业 | Ben Todd英文播客 - The Cognitive Revolution05-26 18:55Cognitive Revolution 与 80,000 Hours 联合创始人 Ben Todd 谈如何围绕 AI 时间线规划个人职业,讨论失控风险、…

11. AI 研究

50 条

标题来源日期摘要
LocateAnything:基于并行框解码的快速高质量视觉-语言定位HuggingFace 每日论文05-27 01:59论文提出 LocateAnything 统一生成式视觉定位与检测框架,采用并行框解码替代逐 token 序列生成,提升 VLM 检测速度与质量。
MobileMoE:将 MoE 扩展到端侧HuggingFace 每日论文05-27 01:58论文提出 MobileMoE 端侧 MoE 语言模型家族(0.3-0.9B 激活,1.3-5.3B 总参),并给出端侧 MoE 缩放律,刷新端侧 LLM …
RAG 阅读中分离语义竞争与上下文长度HuggingFace 每日论文05-27 01:06论文提出 matched-control 协议,区分 RAG 失败的根因——上下文太长还是其他段落语义竞争——找出真正的 reader 失败原因。
符号查询还是语义检索?半结构化问答数据集与方法HuggingFace 每日论文05-26 23:22论文研究半结构化语料的问答:需精确过滤、聚合、结构属性穷举检索。提出结合符号+语义的混合方法。
ORCA:根因分析的端到端交互式 CopilotHuggingFace 每日论文05-26 21:41ORCA 是端到端因果分析 Copilot,编排多个 Agent 让领域专家可用,弥合因果方法复杂度与领域专家的鸿沟。
RLVR 数据集溯源:寻找更好训练数据的血缘追踪HuggingFace 每日论文05-26 20:57提出 ATLAS 框架对 RLVR 数据集做血缘追踪,将 145 万实例中 99.7% 归因到 20 个原子源,揭示当前 RLVR 数据集多为少数源的变体。
ContextGuard:LLM 上下文学习的结构化自我审计HuggingFace 每日论文05-26 18:45论文研究 LLM 在上下文丰富任务中的失败模式:常常沿主推理路径推进,却遗漏外围、持久或格式敏感的要求;提出 ContextGuard 进行结构化自我审计。
HTMLCure:把浏览器体验转化为交互式 HTML 的状态引导修复HuggingFace 每日论文05-26 18:22HTMLCure 在 LLM 生成的 HTML 页面上执行真实滚动、悬停、点击等交互来评估并修复其在交互状态下的问题。
SeDT:用 Sentence-Transformer 条件化 Decision-Transf…HuggingFace 每日论文05-26 18:00SeDT 针对 LLM 在多轮渐进任务中性能下降高达 39% 的可靠性失败,提出结构化对话状态条件化方法。
Once-For-All:训练一次随时选数据的多模态指令微调框架HuggingFace 每日论文05-26 17:31OFA 训练一次可复用的数据选择器,避免目标模型或候选池变化时重新计算筛选信号,提升 VLM 指令微调效率。
关注工具失败:医学 Agent 的协同工具增益HuggingFace 每日论文05-26 16:29论文研究医学 AI Agent 在工具不可靠时的安全使用,提出修复失败实例的协同机制。
有界路径上下文:LLM 知识图谱问答中可见路径历史的对照研究HuggingFace 每日论文05-26 15:29论文研究 LLM KGQA 中是否应在每次路由 prompt 中序列化完整路径,提出 Bounded Path Context (BPC) 解耦控制器符号…
Tail-Aware HiFloat4:Wan2.2 的 W4A4 训练后量化HuggingFace 每日论文05-26 15:04针对低比特文生视频量化挑战,在 Wan2.2 上做 W4A4 HiFloat4 量化,对边界模块保高精度并引入激活尾感知校准。
AGORA:LLM Agent 的免推理 Prompt 压缩适配器HuggingFace 每日论文05-26 14:29论文指出 token 级抽取式压缩器结构上不适合 LLM Agent,AGORA 通过观察-动作 retention 适配器实现免推理的高压缩率。
DEI:质量多样性搜索的演化推理多样性框架HuggingFace 每日论文05-26 23:00DEI 框架在分布式 Quality-Diversity 搜索中将异构 LLM 作为变异算子,利用各模型不同的创造性先验,比同构并行搜索更具行为新颖性。
当眼神出卖 AI:用社交目光一致性检测 AI 生成图像HuggingFace 每日论文05-27 01:50论文提出 Social Gaze Consistency,用人物间目光方向、头眼对齐、瞳孔位置的相互一致性来检测 AI 生成图像中的语义级伪迹。
SoftCap:扩散 Transformer 加速的软预算控制HuggingFace 每日论文05-26 22:24SoftCap 是无训练的 DiT 推理控制层,通过 Trajectory Drift 信号决定何时执行 Full step,替代固定调度或手调阈值。
语言模型跨语言泛化的体外研究HuggingFace 每日论文05-26 16:20论文构造程序化生成的双语言体外实验环境,独立改变词汇距离、少数语言占比、分词训练机制等变量,研究跨语言迁移。
迷宫与线绳:重新思考 LLM 顺序知识编辑中的正则化HuggingFace 每日论文05-26 16:07论文系统分析顺序知识编辑中正则化的必要性,证明 AlphaEdit 等方法的等价性并提出更简化方案。
OmniRetriever:以融合为教师的任意-任意 AVT 检索HuggingFace 每日论文05-26 15:26OmniRetriever 通过 fusion-as-teacher 蒸馏在 audio-video-text 三模态间训练统一检索嵌入,弥补 InfoN…
LATTE:用同伴锚定偏好轨迹做个性化 LLM 生成HuggingFace 每日论文05-26 14:50LATTE 提出潜空间轨迹跟踪方法做 LLM 个性化生成,分离用户稳定身份、近期漂移和物品内容。
ReCA:通过递归上下文分配的多镜头长视频外推HuggingFace 每日论文05-26 12:16ReCA 提出多镜头视频外推(MSVE)任务及递归上下文分配方法,弥合单镜头外推与多镜头叙事的差距。
面向逆问题的三元动力学感知扩散后验采样HuggingFace 每日论文05-26 10:27论文研究扩散后验采样中数据一致性、CFG、随机性三者的调度交互,提供优化策略替代启发式固定调度。
AnchorDiff:MM-DiT 的免训练锚定式概念定位HuggingFace 每日论文05-26 10:17AnchorDiff 在 MM-DiT 中以高置信度 anchor 为起点做图传播,解耦语义定位与结构精修,缓解视觉易混概念的注意力泄漏。
从博弈视角重思弱监督视频时序定位HuggingFace 每日论文05-26 09:54论文用博弈论视角重构弱监督视频时序定位任务,弥补现有方法在粗粒度跨模态学习和提案评分上的不足。
OmniGF:统一目光跟随的双分支视觉-语言框架HuggingFace 每日论文05-26 08:08OmniGF 用 VLM 双分支框架统一目光跟随任务,支持语义目标推理和多人并行推理,避免对同一场景的冗余计算。
用精度与延迟感知的用户激励让 AI 推理更绿色HuggingFace 每日论文05-27 01:19论文提出一种 AI 推理激励框架,结合用户对精度/延迟的估值与碳排放敏感度,权衡 QoE 与碳排放。
多样性中的可检测性:单次运行隐私审计的金丝雀样本设计HuggingFace 每日论文05-27 01:06论文研究单次训练运行的差分隐私审计中如何高效构造 canary 样本,以推导 DP 参数下界。
通过潜空间迭代精修的符号回归HuggingFace 每日论文05-27 00:25论文提出 Latent Equation Embedding,通过潜空间迭代摊销推理弥合神经符号回归的 amortization gap,使预测更接近真后验。
AI 集成进声音设计师工作流的调研HuggingFace 每日论文05-26 23:28论文对 76 位从业者问卷+ 20 位深度访谈,分析 AI 工具在声音设计工作流中的应用现状与开发者-用户需求差距。
对图像生成模型预训练数据的黑盒成员推断攻击HuggingFace 每日论文05-26 21:38论文研究扩散图像生成模型的成员推断攻击,提升从去噪能力推断训练数据归属的判别力。
面向抓取的物体位姿与形状估计:可行吗?HuggingFace 每日论文05-26 20:32论文评估当前物体位姿与形状估计方法(SAM3D、LRM、CRISP、Zero123 等)配合 antipodal grasp sampling 是否能超过…
PATE-TabTransGAN:基于 Transformer 学生判别器的差分隐私表格数据生成HuggingFace 每日论文05-26 18:16PATE-TabTransGAN 融合 PATE 与 Transformer-GAN 用于差分隐私表格数据合成,兼顾形式化隐私保障与列间依赖建模。
基于图像特征融合的联邦客户端遗忘HuggingFace 每日论文05-26 16:56论文提出 FCU 在联邦学习中实现客户端数据遗忘,缓解灾难性遗忘问题,平衡遗忘效果与泛化能力。
AI 评估可能带偏感知:解读学术写作时的上下文重要性HuggingFace 每日论文05-26 15:47论文用 Dimensions 期刊数据指出,忽视国家与领域差异的 AI 使用估算会把固有风格差异误判为 AI 生成,扭曲跨国跨领域分析。
Granuscore:无参考的文本粒度度量HuggingFace 每日论文05-26 14:59Granuscore 利用层次化嵌入空间的结构属性,给出无参考的文本粒度度量,可恢复语料中的层次序。
带弱约束的 2-ASP(Q) 程序:复杂度与高效实现HuggingFace 每日论文05-27 01:44论文研究带量词与弱约束的 ASP(Q) 程序的复杂度刻画,并给出高效实现,可表达 Delta_3^P 类优化问题。
用动态规划发现多级图像阈值的数量与取值HuggingFace 每日论文05-27 01:03论文用动态规划与改进的 MET 准则自动确定多级图像阈值的数量和位置,无需用户指定阈值数。
多元逻辑统一方法论:形式化推理的逻辑多元主义HuggingFace 每日论文05-27 00:25立场文:回顾 20 年浅嵌入非经典逻辑到高阶逻辑 HOL 的研究,主张在 LogiKEy 等统一元逻辑框架内推行对象级逻辑多元主义。
通过在线规划的约束贝叶斯实验设计HuggingFace 每日论文05-26 21:13论文将摊销策略离线预训练与在线规划结合,使贝叶斯实验设计能适应预算/成本/物理约束的动态变化。
DunbaaBERT:从牺牲到语义的乌尔都语 RoBERTaHuggingFace 每日论文05-26 20:28DunbaaBERT 是从零训练的乌尔都语 RoBERTa-base 模型家族,使用 32k/52k/96k Byte-BPE 词表,在 17GB 去重乌…
通过原型蒸馏的通用图异常检测HuggingFace 每日论文05-26 19:16ProMoS 是首个无监督的通用图异常检测方法,基于原型蒸馏,跨新图迁移且无需推理时支持样本。
Receipt Replay OOD:领域迁移下的屏幕翻拍检测基准HuggingFace 每日论文05-26 19:15Receipt Replay OOD 是小型领域外屏幕翻拍检测基准,针对身份证件/小票的拍屏攻击鲁棒性评估。
经阴道超声图像中剖宫产瘢痕缺损分割数据集与基准HuggingFace 每日论文05-26 17:45论文发布剖宫产瘢痕缺损(CSD)在经阴道超声图像上的分割数据集与基准,便于该医学问题的 AI 研究。
有限 Oracle 预算下的蛋白质设计自改进模仿与生物引导搜索HuggingFace 每日论文05-26 16:29SILO 在有限 Oracle 评测预算下做蛋白质序列优化,使用层次化编辑策略避免破坏功能关键残基。
对数增长控制的策略梯度样本复杂度HuggingFace 每日论文05-26 15:24论文分析对数增长控制(顶 Lyapunov 指数)下策略梯度的样本复杂度,揭示”尖点障碍”现象。
PIDM-DP:用 Dormand-Prince 积分的物理引导扩散用于混沌系统辨识HuggingFace 每日论文05-26 14:57PIDM-DP 把可微分的 5 阶 Dormand-Prince ODE 积分嵌入 DDPM 反向采样回路,用于从稀疏噪声观测重建混沌动力系统的连续轨迹。
PolyFusionAgent:聚合物属性预测与反向设计的多模态基础模型与自主 AI 助手HuggingFace 每日论文05-26 12:45PolyFusionAgent 是面向高分子材料发现的交互式框架,结合多模态聚合物基础模型与自主 AI 助手,缩短设计周期。
SIKA-GP:用稀疏诱导核加速高斯过程推断HuggingFace 每日论文05-26 11:49SIKA-GP 用基于二进制有序模板基的稀疏诱导核近似加速高斯过程推断,复杂度降至 O(log M)。
大规模平面场景的视觉度量测量比较研究HuggingFace 每日论文05-26 10:32论文比较 PTZ 摄像头下的几何单目测距、图像拼接+鸟瞰图变换、双目联合标定测距三种方法在水库监控场景的表现。

Generated at 2026-05-28T00:27:39.978Z by RSS Daily AI Digest