AI 日报 | 2026-05-28
82 个来源 | 324 条新内容 | 10 条 AI 精选
Smart Recommendations
1. Claude Code v2.1.152
Anthropic - Claude Code (GitHub Releases) | AI 公司产品更新 / Changelog
Anthropic 发布 Claude Code v2.1.152。/code-review --fix 现在能在审查后自动把建议应用到工作树,覆盖代码复用、简化和效率三类建议;/simplify 已并入 /code-review --fix。Skills 和 slash 命令的 frontmatter 新增 disallowed-tools 字段,可在 Skill 激活时屏蔽特定工具。整体方向继续把 review/fix 双向闭环做厚,是 Claude Code 重度用户值得立即升级的一版。
2. 用 Codex 构建自我改进的报税 Agent
OpenAI | AI 公司官方博客
OpenAI、Thrive 和 Crete 联合发布案例:用 Codex 构建可自我改进的报税 Agent,自动化报税申报、提升准确率、加速整体工作流。文章拆解了 Codex 在结构化文档处理、规则推理和反馈学习上的工程实践。对评估「LLM Agent 接管垂直行业重复工作」具有参考价值,也是 OpenAI 持续把 Codex 推为企业 Agent 平台的旗舰案例之一。
3. CodeRabbit 如何用 Claude 构建 Agent 编排系统
Claude Blog | AI 公司官方博客
Anthropic Claude 博客分享 CodeRabbit 用 Claude 构建 Agent 编排系统的实战经验。CodeRabbit 是知名的 AI 代码审查产品,文章覆盖多 Agent 协同、上下文管理、提示与工具调度等核心架构选择。对正在构建 Agent 编排层或代码 Review 类产品的开发者来说是一手原始资料。
4. SQLite 仓库新增 AGENTS.md 文件
Simon Willison | 知名 AI 个人开发者/研究者
Simon Willison 注意到 SQLite 仓库五天前加入了 AGENTS.md 文件,但目标读者并非 SQLite 自身的贡献者,而是把 AI Agent 指向 SQLite 代码库的人。AGENTS.md 中明确说明:SQLite 不接受外部 PR、贡献流程的特殊性等。这是一种值得借鉴的「面向 Agent」的仓库元信息表达方式,可以作为自己项目设计 AGENTS.md 的参考样板。
5. Simon Willison:Anthropic 与 OpenAI 已找到 PMF
Simon Willison | 知名 AI 个人开发者/研究者
Simon Willison 评论 Anthropic 据称即将迎来首个盈利季度,以及企业 LLM 账单飙升的现象。他认为 OpenAI 与 Anthropic 通过编程类用例(Codex、Claude Code)真正找到了 product-market fit——付费意愿强、留存高、价值可量化。文章是对 LLM 商业模式拐点的一手观察,对判断 AI 编程工具市场走向有参考价值。
6. Microsoft Copilot Cowork 文件外泄漏洞
Simon Willison | 知名 AI 个人开发者/研究者
Simon Willison 转述 PromptArmor 的研究:Microsoft Copilot Cowork 存在数据外泄漏洞,攻击者可诱导 Agent 把文件内容外传。Simon 强调,「防止 Agent 被诱导外泄数据」仍是 Agent 系统设计的最大难题。对所有正在做 Agent 产品的团队,这是一个高优先级的威胁模型样本,值得复盘自己的输出通道有没有类似 sink。
7. curl 团队承受的压力
Simon Willison | 知名 AI 个人开发者/研究者
Simon Willison 转述 Daniel Stenberg 的文章:curl 团队正承受前所未有的压力——AI 辅助生成的(看起来可信的)安全漏洞报告速率,已经是 2024 年的 4-5 倍、2025 年的 2 倍。这意味着开源核心维护者花在「审伪」上的时间被严重侵占。对所有开源生态参与者,这是 AI 加速带来的负外部性的具体样本。
8. Faire 借助 Cursor Cloud Agents 将 PR 吞吐量翻倍
编程助手 - Cursor (博客) | AI 工具/产品
Cursor 官方案例:电商批发平台 Faire 引入 Cursor Cloud Agents 后,PR 吞吐量直接翻倍。案例展示了 Cloud Agent 在大型团队工程协作中的落地路径,是评估 Cloud Agents 商业价值的具体数据点。对正在评估「云端 Agent vs 本地 Agent」选型的团队是一份有价值的参考。
9. Ollama v0.30.0:架构改用 llama.cpp
推理引擎 & 本地 AI - Ollama | GitHub 开源项目 Releases(Atom Feed)
Ollama 发布 v0.30.0(rc28),架构层重大变更:直接基于 llama.cpp 而非原 GGML 实现,原生兼容 GGUF 格式,Apple Silicon 上引入 MLX 加速推理。这是 Ollama 历史上最大的底层重写之一,预发布阶段官方在征集反馈。本地 LLM / 端侧推理用户应关注模型兼容性和性能差异。
10. RAGFlow v0.25.6:Browser 组件
AI 框架 & 编排 - RAGFlow | GitHub 开源项目 Releases(Atom Feed)
RAGFlow v0.25.6 发布,Agent 新增 Browser 组件,让 AI 可以自主导航网页并与之交互(issue #14888)。RAGFlow 持续把「检索+Agent」编排栈做厚,Browser 组件补齐了 Agent 直连真实网络抓取的能力。对正在搭建带 Web 检索能力的 RAG/Agent 系统的开发者,可直接试用对比效果。
播客精选 Top 5
1. [Latent Space] ESMFold2:苦涩教训降临蛋白质
Latent Space (Newsletter) | 知名 AI 个人开发者/研究者
Latent Space Newsletter 发布与 BioHub 的 Alex Rives 对谈 ESMFold2,讨论数据集与归纳偏置、世界模型与可编程生物学。
2. Seeed Studio:开源具身 AI 机器人
英文播客 - NVIDIA AI Podcast | AI 从业者访谈 / 播客
NVIDIA AI Podcast 第 300 期,Seeed Studio CEO Eric Pan 和机器人负责人 Elaine Wu 讨论 NVIDIA Jetson 驱动的开源机械臂、OpenClaw agentic 框架和 NVIDIA Isaac Sim。
3. 他融资 7000 万美元用 AI 攻克一切疾病
英文播客 - Gradient Dissent (W&B) | AI 从业者访谈 / 播客
Samuel Rodriques 离开物理学界后创办 Edison Scientific,打造 AI 科学家 Kosmos 用于药物研发,讨论 AI 提出的失明疗法、肽类回避策略以及 20 年后人类科学家的角色。
4. 为 AI 时代更新职业建议 | Benjamin Todd
英文播客 - 80,000 Hours Podcast | AI 从业者访谈 / 播客
80,000 Hours 创始人 Benjamin Todd 讨论 AI 加速背景下的职业规划,部分研究者认为 AI 自动化 AI 研究的概率今年 10%、2028 年底 60%,可能彻底重塑各行各业。
5. 你的最大杠杆:为最大影响设计 AI 职业 | Ben Todd
英文播客 - The Cognitive Revolution | AI 从业者访谈 / 播客
Cognitive Revolution 与 80,000 Hours 联合创始人 Ben Todd 谈如何围绕 AI 时间线规划个人职业,讨论失控风险、加入前沿实验室利弊与 AI 福利等新兴议题。
Blog 精选 Top 5
1. 用 Codex 构建自我改进的报税 Agent
OpenAI | AI 公司官方博客
OpenAI、Thrive 和 Crete 联合发布案例:用 Codex 构建可自我改进的报税 Agent,自动化报税申报、提升准确率、加速整体工作流。文章拆解了 Codex 在结构化文档处理、规则推理和反馈学习上的工程实践。对评估「LLM Agent 接管垂直行业重复工作」具有参考价值,也是 OpenAI 持续把 Codex 推为企业 Agent 平台的旗舰案例之一。
2. CodeRabbit 如何用 Claude 构建 Agent 编排系统
Claude Blog | AI 公司官方博客
Anthropic Claude 博客分享 CodeRabbit 用 Claude 构建 Agent 编排系统的实战经验。CodeRabbit 是知名的 AI 代码审查产品,文章覆盖多 Agent 协同、上下文管理、提示与工具调度等核心架构选择。对正在构建 Agent 编排层或代码 Review 类产品的开发者来说是一手原始资料。
3. SQLite 仓库新增 AGENTS.md 文件
Simon Willison | 知名 AI 个人开发者/研究者
Simon Willison 注意到 SQLite 仓库五天前加入了 AGENTS.md 文件,但目标读者并非 SQLite 自身的贡献者,而是把 AI Agent 指向 SQLite 代码库的人。AGENTS.md 中明确说明:SQLite 不接受外部 PR、贡献流程的特殊性等。这是一种值得借鉴的「面向 Agent」的仓库元信息表达方式,可以作为自己项目设计 AGENTS.md 的参考样板。
4. Simon Willison:Anthropic 与 OpenAI 已找到 PMF
Simon Willison | 知名 AI 个人开发者/研究者
Simon Willison 评论 Anthropic 据称即将迎来首个盈利季度,以及企业 LLM 账单飙升的现象。他认为 OpenAI 与 Anthropic 通过编程类用例(Codex、Claude Code)真正找到了 product-market fit——付费意愿强、留存高、价值可量化。文章是对 LLM 商业模式拐点的一手观察,对判断 AI 编程工具市场走向有参考价值。
5. Claude Blog:AI Agent 的零信任
Claude Blog | AI 公司官方博客
Anthropic Claude 博客发表《Zero Trust for AI Agents》,讨论 AI Agent 安全的零信任架构。
YC 主题
1. Claude Code 作为日常工具:CLAUDE.md、Skills、Subagents、插件与 MCP
Hacker News | Y Combinator
HN 转载博客,作者分享 Claude Code 日常使用经验,涵盖 CLAUDE.md、Skills、Subagents、Plugins 和 MCP 用法。
2. Show HN:开源 AI 赛车竞赛框架
Hacker News | Y Combinator
Elodin Systems 在 HN 展示开源 AI Grand Prix 模拟竞赛框架,用于评测 AI 在赛车模拟环境下的表现。
3. Go:支持泛型方法
Hacker News | Y Combinator
HN 转 Go 语言官方 Issue #77273,讨论 Go 增加泛型方法的支持。
4. 交错增量(Interleaved Deltas)
Hacker News | Y Combinator
mmapped 博客技术文,讨论 interleaved deltas 数据结构/同步设计。HN 推送,无 description 上下文。
5. Pelica(YC P25)正在招聘
Hacker News | Y Combinator
Y Combinator P25 批次公司 Pelica 在招聘机器学习工程师,HN 头版职位帖。
a16z 主题
1. [a16z] 避免在黄砖路上死亡
a16z (Substack) | AI 公司官方博客
a16z Substack 文章,探讨应用层并未消亡,反驳“App 层已死”观点。
2. 处处皆合规:AI 企业最大机会就是最无聊的领域
a16z (Substack) | AI 公司官方博客
a16z 长文:AI 在企业市场最大、最被低估的机会是合规——一个看起来无聊但万亿美元规模的赛道。
1. AI 公司产品更新 / Changelog
36 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| Claude Code v2.1.152 | Anthropic - Claude Code (GitHub Releases) | 05-27 09:30 | Anthropic 发布 Claude Code v2.1.152。/code-review --fix 现在能在审查后自动把建议应用到工作树,覆盖代… |
| Anthropic TypeScript SDK v0.99.0 | Anthropic - anthropic-sdk-typescript | 05-27 09:04 | Anthropic 发布 anthropic-sdk-typescript v0.99.0,支持自定义文件大小上限(#1029)。 |
| anthropic-sdk-typescript v0.98.1 | Anthropic - anthropic-sdk-typescript | 05-27 07:19 | Anthropic TypeScript SDK 0.98.1 修复了 skills.versions.create 上传时未保留目录前缀的 bug。 |
| AgentCore Payments 技术深度解析与 Agent 商务创新 | Amazon - AWS Machine Learning Blog | 05-27 01:57 | Amazon Bedrock AgentCore Payments 进入预览,支持向付费外部服务的即时支付、稳定币微支付以及可配置花费护栏,便于 Agen… |
| 用 Bedrock AgentCore 构建高扩展无服务器 LangGraph 多 Agent 系统 | Amazon - AWS Machine Learning Blog | 05-27 01:41 | AWS 教程:以 LangGraph 为编排核心,结合 Bedrock AgentCore Memory 与 Observability,构建无服务器、高… |
| 用 Strands Agents + NVIDIA NIM + Bedrock AgentCo… | Amazon - AWS Machine Learning Blog | 05-27 01:39 | AWS 教程:用 Strands Agents 编排、Bedrock AgentCore 提供运行时与可观测性、NVIDIA NIM 提供 GPU 推理,… |
| AgentWatch:用环境型 Agent 主动监控 AWS | Amazon - AWS Machine Learning Blog | 05-27 01:22 | AgentWatch 每 15 分钟扫描 CloudWatch 指标/日志/告警,汇总后将报告推送 Slack,并支持自然语言查询,演示了三种 human… |
| 从想法到 AI 应用:用 Strands 创建智能研究助手 | Amazon - AWS Machine Learning Blog | 05-27 00:28 | AWS 博文:用 Strands Agents 框架简化多 API 编排、对话状态管理与推理 Agent 开发,构建智能研究助手。 |
| Azure 弃用:gpt-5-chat | 跨厂商 - AI Model Deprecations | 05-27 14:23 | Azure OpenAI 模型弃用公告:gpt-5-chat 将于 2026-06-29 弃用与停服。 |
| Azure 弃用:gpt-5.1-chat | 跨厂商 - AI Model Deprecations | 05-27 14:23 | Azure OpenAI 模型弃用公告:gpt-5.1-chat 将于 2026-06-29 弃用与停服。 |
| Azure 弃用:gpt-5.2-chat | 跨厂商 - AI Model Deprecations | 05-27 14:23 | Azure OpenAI 模型弃用公告:gpt-5.2-chat 将于 2026-06-29 弃用与停服。 |
| Azure 弃用:gpt-5.3-chat | 跨厂商 - AI Model Deprecations | 05-27 14:23 | Azure OpenAI 模型弃用公告:gpt-5.3-chat 将于 2026-06-29 弃用与停服。 |
| 用 Amazon Bedrock 数据自动化处理金融文档 | Amazon - AWS Machine Learning Blog | 05-28 05:28 | AWS 博客介绍如何用 Amazon Bedrock Data Automation 从银行对账单、W-2 表格、1099-B 税表和供应商合同四类金融文… |
| 用 Amazon Bedrock AgentCore 构建业务支持 AI Agent | Amazon - AWS Machine Learning Blog | 05-28 04:06 | AWS Generative AI Innovation Center 与 Works Human Intelligence (WHI) 合作,用 Ama… |
| Verizon Connect:10 万用户级 Agentic AI 实践 | Amazon - AWS Machine Learning Blog | 05-28 04:01 | AWS 博客详解 Verizon Connect 如何用 agentic AI 把海量车队数据转化为可执行洞察、扩展至 10 万日活用户,分享架构决策、实… |
| AWS SMGS 用 AgentCore 构建对话式业务助手 | Amazon - AWS Machine Learning Blog | 05-28 02:51 | AWS 博客分享 SMGS 销售组织如何用 Amazon Bedrock AgentCore 构建 NarrateAI 商业智能助手,介绍双层架构(批处理… |
| 用 Bedrock AgentCore 驱动 Agentic AI 销售 | Amazon - AWS Machine Learning Blog | 05-28 02:00 | AWS 博客分享 AWS Sales 组织部署 20+ 领域专用 Agent 的痛点,引入 AgentCore 编排来减少用户在系统间切换的认知负担。 |
| Amazon Connect 用生成式 AI 自动评估自服务交互 | Amazon - AWS What’s New | 05-28 01:00 | Amazon Connect Customer 推出生成式 AI 自动评估自服务交互的能力,管理员可用自然语言定义评估表单,AI 给出评估理由和聚合洞察。 |
| Mistral Python SDK v2.4.7 | Mistral / Cohere - Mistral Python SDK | 05-28 01:08 | Mistral 客户端 Python v2.4.7 由 Speakeasy CLI 基于 OpenAPI 文档自动生成发布。 |
| 为 Amazon Quick 构建企业级可观测性方案 | Amazon - AWS Machine Learning Blog | 05-27 00:09 | AWS 教程:为 Amazon Quick 平台搭建集中可观测性方案,让企业领导能看到谁在使用平台、用户是否满意,以及哪些能力最受欢迎。 |
| Amazon Quick 把文档创建从小时缩短到分钟 | Amazon - AWS Machine Learning Blog | 05-26 23:59 | AWS 博文介绍 Amazon Quick 的文档与可视化创建能力,展示不同岗位如何用它节省工作时间。 |
| SageMaker 笔记本支持 P5.4xl 实例 | Amazon - AWS What’s New | 05-28 04:30 | Amazon SageMaker Notebook Instances 现已正式支持 P5.4xl 实例(NVIDIA H100),相比上一代加速最高达 … |
| SageMaker 笔记本支持 P5en.48xl 实例 | Amazon - AWS What’s New | 05-28 04:30 | Amazon SageMaker Notebook Instances 正式支持 P5en.48xl 实例,搭载 8 张 H200 GPU(显存为 H10… |
| SageMaker HyperPod Slurm 集群支持最小容量 | Amazon - AWS What’s New | 05-27 23:06 | Amazon SageMaker HyperPod Slurm 集群现支持 MinCount,结合 continuous provisioning,可在部… |
| Amazon EC2 X8i 实例在更多区域上线 | Amazon - AWS What’s New | 05-27 05:58 | AWS X8i 实例(基于定制 Intel Xeon 6)现已在新加坡、悉尼、GovCloud(US-West) 上线,性能比上一代提升 43%,内存容量… |
| Amazon RDS Multi-AZ 复制支持 ENA Express | Amazon - AWS What’s New | 05-27 03:00 | Amazon RDS Multi-AZ 实例的跨可用区复制流量开始使用 ENA Express,基于 SRD 协议提供最高 25 Gbps 单流带宽,降低… |
| Amazon EC2 R8i/R8i-flex 实例在 GovCloud(US-East) 上线 | Amazon - AWS What’s New | 05-27 00:00 | Amazon EC2 R8i 与 R8i-flex 实例(定制 Intel Xeon 6)在 AWS GovCloud(US-East) 区域上线,性价比… |
| Amazon EC2 M8i/M8i-flex 实例在 GovCloud(US-East) 上线 | Amazon - AWS What’s New | 05-27 00:00 | Amazon EC2 M8i 与 M8i-flex 实例在 AWS GovCloud(US-East) 上线,由定制 Intel Xeon 6 驱动,性价… |
| Amazon EMR 正式支持 Apache Spark 4.0.2 | Amazon - AWS What’s New | 05-28 04:17 | Amazon EMR 全部三种部署模式都已支持 Apache Spark 4.0.2,带来 ANSI SQL、VARIANT 类型、行/列级 FGAC、I… |
| Azure Marketplace 多方私有报价扩至 30 国 | Microsoft - Azure 服务更新(含 AI) | 05-28 01:45 | 微软宣布 Microsoft Marketplace 中的多方私有报价(multiparty private offers)正式开放至欧洲 30 个国家,… |
| AWS Backup 增 OTP 验证强化多方审批 | Amazon - AWS What’s New | 05-27 18:00 | AWS Backup 对逻辑气隙金库的多方审批新增 OTP 验证,审批者必须输入发送至 IAM Identity Center 邮箱的 6 位验证码。 |
| Azure 虚拟网络管理器与 Virtual WAN 集成公开预览 | Microsoft - Azure 服务更新(含 AI) | 05-27 02:00 | Azure Virtual Network Manager 与 Virtual WAN 集成进入公开预览,可将 Azure Virtual WAN hub… |
| Azure 虚拟网络流日志 Sentinel 连接器正式可用 | Microsoft - Azure 服务更新(含 AI) | 05-27 00:45 | Azure 虚拟网络流日志与 Microsoft Sentinel 的连接器正式可用,可将网络流量数据无缝导入安全运营工作流。 |
| Amazon VPC IPAM 支持 IPAM 池分配标签 | Amazon - AWS What’s New | 05-26 21:00 | Amazon VPC IP Address Manager 支持对 IPAM 池中单个 IP 分配打标签,方便组织、治理和访问控制。 |
| AWS Backup 的 GuardDuty 恶意软件防护支持 S3 持续备份 | Amazon - AWS What’s New | 05-26 18:00 | Amazon GuardDuty Malware Protection for AWS Backup 现支持 Amazon S3 持续备份,可在备份时间线… |
| AWS Glue 大型与内存优化 worker 登陆西班牙 | Amazon - AWS What’s New | 05-28 04:10 | AWS Glue 在欧洲(西班牙)区域上线 G.12X/G.16X 大型计算 worker 及 R.1X/R.2X/R.4X/R.8X 四款内存优化 wo… |
2. AI 公司官方博客
11 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| 用 Codex 构建自我改进的报税 Agent | OpenAI | 05-27 15:00 | OpenAI、Thrive 和 Crete 联合发布案例:用 Codex 构建可自我改进的报税 Agent,自动化报税申报、提升准确率、加速整体工作流。文… |
| CodeRabbit 如何用 Claude 构建 Agent 编排系统 | Claude Blog | 05-27 08:00 | Anthropic Claude 博客分享 CodeRabbit 用 Claude 构建 Agent 编排系统的实战经验。CodeRabbit 是知名的 … |
| Claude Blog:AI Agent 的零信任 | Claude Blog | 05-27 08:00 | Anthropic Claude 博客发表《Zero Trust for AI Agents》,讨论 AI Agent 安全的零信任架构。 |
| 用 LLM 保护源代码 | Claude Blog | 05-27 08:00 | Anthropic Claude 博客发表《Using LLMs to secure source code》,讨论用 LLM 提升源码安全。 |
| Anthropic 研究:社会科学中的编码 Agent | Anthropic (研究) | 05-27 08:00 | Anthropic Research 发布经济研究文章《Coding agents in the social sciences》,探讨编码 Agent … |
| Cisco 与 OpenAI 用 Codex 重塑企业工程 | OpenAI | 05-27 19:00 | OpenAI 官方文章介绍 Cisco 与 OpenAI 联合用 Codex 推动 Cisco AI 原生开发,加速 AI Defense 工作并自动化缺… |
| Warp 押注 GPT-5.5 构建开源 | OpenAI | 05-27 08:00 | OpenAI 官方文章介绍 Warp 终端用 GPT-5.5 和 OpenAI 模型协调本地、云和开源开发工作流中的编码 Agent。 |
| 2026 选举信息与防护 | OpenAI | 05-27 08:00 | OpenAI 官方文章介绍 2026 全球大选前的信息可及性、网络防御者支持与 AI 透明度举措。 |
| SilverTorch:把索引当模型——推荐系统检索新范式 | Meta AI / FAIR | 05-27 00:00 | Meta 工程博客介绍 SilverTorch:统一 UGC 检索组件的新架构,比 SOTA 吞吐量提升 23.7 倍,相比 CPU 方案计算成本效率提升… |
| [a16z] 避免在黄砖路上死亡 | a16z (Substack) | 05-27 22:01 | a16z Substack 文章,探讨应用层并未消亡,反驳“App 层已死”观点。 |
| 处处皆合规:AI 企业最大机会就是最无聊的领域 | a16z (Substack) | 05-26 22:03 | a16z 长文:AI 在企业市场最大、最被低估的机会是合规——一个看起来无聊但万亿美元规模的赛道。 |
3. 知名 AI 个人开发者/研究者
9 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| SQLite 仓库新增 AGENTS.md 文件 | Simon Willison | 05-28 07:44 | Simon Willison 注意到 SQLite 仓库五天前加入了 AGENTS.md 文件,但目标读者并非 SQLite 自身的贡献者,而是把 AI … |
| Simon Willison:Anthropic 与 OpenAI 已找到 PMF | Simon Willison | 05-28 00:38 | Simon Willison 评论 Anthropic 据称即将迎来首个盈利季度,以及企业 LLM 账单飙升的现象。他认为 OpenAI 与 Anthro… |
| Microsoft Copilot Cowork 文件外泄漏洞 | Simon Willison | 05-26 23:36 | Simon Willison 转述 PromptArmor 的研究:Microsoft Copilot Cowork 存在数据外泄漏洞,攻击者可诱导 Ag… |
| curl 团队承受的压力 | Simon Willison | 05-27 07:48 | Simon Willison 转述 Daniel Stenberg 的文章:curl 团队正承受前所未有的压力——AI 辅助生成的(看起来可信的)安全漏洞… |
| Simon Willison 引语:Kyle Ferrana | Simon Willison | 05-27 14:41 | Simon Willison 转引 Kyle Ferrana 的 Star Trek 风格段子讽刺 AI Agent 不执行指令的现象(DATA 没升盾)。 |
| 引用 Paul Graham 谈 AI 邮件 | Simon Willison | 05-26 23:02 | Simon 引用 Paul Graham 推文:创始人发的邮件如今多是 AI 生成、硬冲突新闻体;一旦识破是 AI 写的,就难以继续读下去,感觉像被欺骗。 |
| [Latent Space] ESMFold2:苦涩教训降临蛋白质 | Latent Space (Newsletter) | 05-28 01:46 | Latent Space Newsletter 发布与 BioHub 的 Alex Rives 对谈 ESMFold2,讨论数据集与归纳偏置、世界模型与可… |
| [AINews] Fireworks 与 Baseten 跻身 AI Infra 十角兽 | Latent Space (Newsletter) | 05-27 11:33 | Latent Space AINews 报道 Fireworks 和 Baseten 成为新的 AI Infra 十角兽(百亿美元估值),OpenRout… |
| 引用 Corey Quinn 评 Anthropic 与教皇 | Simon Willison | 05-26 10:28 | Simon 引用 Corey Quinn 推文:让教皇把你产品的技术局限封圣成属灵专著,是他见过最厉害的厂商游说行为。讽刺 Anthropic 联合创始人… |
4. AI 工具/产品
11 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| Faire 借助 Cursor Cloud Agents 将 PR 吞吐量翻倍 | 编程助手 - Cursor (博客) | 05-26 20:00 | Cursor 官方案例:电商批发平台 Faire 引入 Cursor Cloud Agents 后,PR 吞吐量直接翻倍。案例展示了 Cloud Agen… |
| Copilot Memory 新增删除、范围控制并支持 Copilot CLI | 编程助手 - GitHub Copilot (专属) | 05-27 05:05 | GitHub Copilot Memory 公开预览版新增更精细的记忆删除控制、仓库级开关,并将记忆控制扩展到 Copilot CLI。 |
| 通过模型规则为组织指定 Copilot 模型 | 编程助手 - GitHub Copilot (专属) | 05-27 03:47 | GitHub Copilot 企业管理员可通过 model rules 为不同组织指定可用模型,实现精细化模型治理。 |
| Cline Nightly:SDK 迁移与简化登录 | 编程助手 - Cline (GitHub Releases) | 05-28 06:21 | Cline 编程助手发布 nightly 构建,来自 dpc/sdk-migration-simpler-login 分支,提交 47f7b…,预览 SD… |
| ITBench-AA:前沿模型企业 IT Agent 任务低于 50% | 框架/平台 - Hugging Face (博客) | 05-28 01:20 | Artificial Analysis 和 IBM 联合发布 ITBench-AA,首个针对企业 IT 自动化任务的 agentic 基准,前沿模型得分均… |
| Reachy Mini 实现完全本地运行 | 框架/平台 - Hugging Face (博客) | 05-27 08:00 | Hugging Face 在 Reachy Mini 桌面机器人上跑通完全本地化的语音对话流水线,无需云端依赖。展示了端侧 LLM + 语音模型在小型机器… |
| 用 Hub Bucket 同步万亿参数:TRL 中的 Delta Weight Sync | 框架/平台 - Hugging Face (博客) | 05-27 08:00 | Hugging Face TRL 库通过 Hub Bucket 中的 delta weight sync 机制,将万亿参数模型的权重同步开销显著降低。面向… |
| Cline CLI v3.0.14 | 编程助手 - Cline (GitHub Releases) | 05-28 03:11 | Cline 发布 CLI v3.0.14,修复 OTEL telemetry 变量打包问题,保证编译后 CLI 构建中遥测正确启用。 |
| Midjourney 网页更新:语音改进 | 应用产品 - Midjourney | 05-28 02:44 | Midjourney Updates 介绍网页端会话模式(文本+语音)改进:语音会话可访问 Image Prompts、Style References、… |
| Cline nightly 构建:SDK 迁移与简化登录 | 编程助手 - Cline (GitHub Releases) | 05-27 05:47 | Cline 的 Nightly 构建,发布自 dpc/sdk-migration-simpler-login 分支,主要进行 SDK 迁移和登录流程简化的实验。 |
| Vercel 重新设计部署列表 | 框架/平台 - Vercel (含 AI SDK) | 05-27 08:00 | Vercel Dashboard 部署列表改版,采用更紧凑的布局,按环境分组显示状态,分支与 commit 信息更易扫读,移动端体验也得到改善。 |
5. GitHub 开源项目 Releases(Atom Feed)
61 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| Ollama v0.30.0:架构改用 llama.cpp | 推理引擎 & 本地 AI - Ollama | 05-28 01:50 | Ollama 发布 v0.30.0(rc28),架构层重大变更:直接基于 llama.cpp 而非原 GGML 实现,原生兼容 GGUF 格式,Apple… |
| RAGFlow v0.25.6:Browser 组件 | AI 框架 & 编排 - RAGFlow | 05-27 10:18 | RAGFlow v0.25.6 发布,Agent 新增 Browser 组件,让 AI 可以自主导航网页并与之交互(issue #14888)。RAGFl… |
| DSPy 3.3.0b1 | AI 框架 & 编排 - DSPy | 05-27 23:22 | Stanford NLP 发布 DSPy 3.3.0b1 测试版。 |
| CrewAI 1.14.6a2 预发布版 | AI Agent 框架 - CrewAI | 05-28 07:49 | CrewAI 多 Agent 框架发布 1.14.6a2 预发布版本,增强 StdioTransport 防止环境变量泄漏、改进规划配置和观察处理,新增 … |
| vLLM v0.22.0rc2:修复早期 CUDA 初始化 | 推理引擎 & 本地 AI - vLLM | 05-28 05:20 | vLLM 发布 v0.22.0rc2 候选版,修复 #43791 中早期 CUDA 初始化问题,cherry-pick 自主分支 commit 41688e2。 |
| n8n@2.22.4-exp.0 实验版 | AI 框架 & 编排 - n8n | 05-28 01:38 | n8n 自动化平台发布 2.22.4-exp.0 实验版,编辑器中工作流卡片显示 MCP 访问开关(PR #30683)。 |
| n8n@2.23.0 | AI 框架 & 编排 - n8n | 05-27 17:35 | n8n 发布 2.23.0 稳定版,包含 ai-builder 中默认 Switch 改为大小写不敏感等 bug 修复。 |
| vLLM v0.22.0rc1:spec decode 修复 | 推理引擎 & 本地 AI - vLLM | 05-27 15:37 | vLLM 发布 v0.22.0rc1 候选版,修复 MRV2 中 KV connector 在投机解码场景下的 bug(#43719)。 |
| Mastra @mastra/spanner@1.0.0 | AI Agent 框架 - Mastra | 05-27 12:34 | Mastra 发布 @mastra/spanner@1.0.0 子包(Google Spanner 集成),首次稳定版。 |
| Pydantic AI v1.103.0 | AI Agent 框架 - Pydantic AI | 05-27 10:37 | Pydantic AI 发布 v1.103.0,新增 McpServer 的 list_prompts 和 get_prompt 功能。 |
| Weaviate v1.38.0-rc.0:HFresh、Namespaces 等 | 向量数据库 & AI 基础设施 - Weaviate | 05-28 05:04 | Weaviate 向量数据库发布 1.38.0 候选版,包含 HFresh 正式发布、Namespaces 预览、嵌套对象过滤、Alter Schema … |
| Unsloth 大改版前的更新预告 | 基座模型 / LLM - Unsloth | 05-26 22:47 | Unsloth v0.1.42-beta 增加 API 调用支持(图像生成/编辑、网页搜索、代码执行等),为下一波大改版前的过渡版本。 |
| OpenAI Agents SDK v0.17.4 | AI Agent 框架 - OpenAI Agents SDK | 05-26 16:54 | OpenAI Agents SDK 0.17.4 增加对 Realtime 自定义语音对象的支持。 |
| llama.cpp b9371 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-28 07:47 | llama.cpp 发布 b9371 构建,主要移除 ggml-webgpu 中的遗留常量,属于本地 LLM 推理引擎的日常迭代。 |
| LiteLLM v1.86.2 | AI 框架 & 编排 - LiteLLM | 05-28 01:44 | LiteLLM 发布 v1.86.2,Docker 镜像由 cosign 签名验证,可通过固定 commit hash 验证镜像来源。 |
| LiteLLM v1.84.3 | AI 框架 & 编排 - LiteLLM | 05-28 01:44 | LiteLLM 发布 v1.84.3 稳定版补丁,Docker 镜像由 cosign 签名。 |
| n8n@2.22.4 | AI 框架 & 编排 - n8n | 05-27 17:35 | n8n 发布 2.22.4 patch,core 模块移除二进制数据重命名时的激进临时目录清理(#31165)。 |
| LiteLLM v1.85.2 | AI 框架 & 编排 - LiteLLM | 05-27 16:20 | LiteLLM 发布 v1.85.2 稳定版,Docker 镜像由 cosign 签名。 |
| LiteLLM v1.87.0-rc.2 | AI 框架 & 编排 - LiteLLM | 05-27 10:01 | LiteLLM 发布 v1.87.0-rc.2 候选版。 |
| llama.cpp b9367 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-28 01:37 | llama.cpp 发布 b9367,Vulkan 后端引入 GL_NV_cooperative_matrix_decode_vector 加速 matm… |
| llama.cpp b9354 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-27 14:02 | llama.cpp 发布 b9354,convert 工具新增 MiniCPM5 tokenizer 支持(#23384)。 |
| HuggingFace TRL v1.5.1 | AI 框架 & 编排 - TRL | 05-27 23:26 | HuggingFace 发布 TRL v1.5.1,对 trainer telemetry 添加显式类名白名单门控。 |
| Mastra mastracode@0.21.1 | AI Agent 框架 - Mastra | 05-27 21:26 | Mastra Agent 框架发布 mastracode@0.21.1 子包。 |
| Mastra mastra@1.10.2 | AI Agent 框架 - Mastra | 05-27 21:26 | Mastra 主包发布 1.10.2。 |
| Mastra @mastra/temporal@0.1.8 | AI Agent 框架 - Mastra | 05-27 21:26 | Mastra 发布 @mastra/temporal 0.1.8 子包,集成 Temporal 工作流。 |
| Mastra @mastra/server@1.37.1 | AI Agent 框架 - Mastra | 05-27 21:26 | Mastra 发布 @mastra/server@1.37.1 服务端子包。 |
| n8n@2.21.8 | AI 框架 & 编排 - n8n | 05-27 15:14 | n8n 发布 2.21.8 patch 版本。 |
| Mastra mastracode@0.21.0 | AI Agent 框架 - Mastra | 05-27 12:34 | Mastra 发布 mastracode@0.21.0 子包。 |
| Mastra mastra@1.10.1 | AI Agent 框架 - Mastra | 05-27 12:34 | Mastra 发布 mastra@1.10.1 patch。 |
| Mastra @mastra/temporal@0.1.7 | AI Agent 框架 - Mastra | 05-27 12:34 | Mastra 发布 @mastra/temporal@0.1.7 子包(Temporal 集成)。 |
| Mastra @mastra/slack@1.3.0 | AI Agent 框架 - Mastra | 05-27 12:34 | Mastra 发布 @mastra/slack@1.3.0 子包(Slack 集成)。 |
| Ollama v0.30.0-rc27 | 推理引擎 & 本地 AI - Ollama | 05-27 08:17 | Ollama 发布 v0.30.0-rc27,CI 中处理 Windows CPU 构建路径 workaround。 |
| Ollama v0.30.0-rc26 发布 | 推理引擎 & 本地 AI - Ollama | 05-27 07:41 | Ollama v0.30.0-rc26 预发布版本,主要为合并 upstream/main 到 llama-runner-phase-0 分支,包含 im… |
| MLflow v3.13.0rc0:RBAC 重构与部署增强 | 向量数据库 & AI 基础设施 - MLflow | 05-27 02:12 | MLflow 3.13.0rc0 大幅重构 RBAC,引入统一的 role_permissions 表、新管理 UI、统一权限 API,深化 Agent … |
| Weaviate v1.37.5:HFresh 任务优先级与降低分片锁 | 向量数据库 & AI 基础设施 - Weaviate | 05-26 20:10 | Weaviate v1.37.5 新增 HFresh 任务优先级管理、降低分片锁定,并添加 release 脚本工具。 |
| Dify v1.13.3 稳定性与正确性更新 | AI 框架 & 编排 - Dify | 05-26 14:25 | Dify 1.13.3 重点是工作流执行、流式与知识检索的稳定性与正确性修复;LLM、问题分类器、变量提取器节点的模型参数支持变量引用。 |
| LiteLLM v1.86.1 发布 | AI 框架 & 编排 - LiteLLM | 05-26 12:09 | LiteLLM 1.86.1 发布,所有 Docker 镜像由 cosign 签名,可通过 release 列出的 pinned commit hash 校验。 |
| browser-use 0.12.9 发布 | AI Agent 框架 - browser-use | 05-26 11:45 | browser-use 0.12.9 更新,主要为 judge LLM 调用传递 session id 等改进。 |
| Milvus Go SDK v2.6.5:可空向量列与数组部分更新 | 向量数据库 & AI 基础设施 - Milvus | 05-26 10:44 | Milvus Go SDK 2.6.5 新增 dense/binary/sparse/int8 向量列的 nullable 支持,并加入 ARRAY_AP… |
| langchain-perplexity 1.3.1 | AI 框架 & 编排 - LangChain | 05-28 04:45 | LangChain 发布 langchain-perplexity 1.3.1 patch 版本,对应 PR #37720 的小修复。 |
| langchain-fireworks 1.4.2 | AI 框架 & 编排 - LangChain | 05-28 02:10 | LangChain 发布 langchain-fireworks 1.4.2 patch,对应 PR #37715。 |
| Weaviate v1.37.6:核心稳定性修复 | 向量数据库 & AI 基础设施 - Weaviate | 05-27 21:09 | Weaviate 发布 v1.37.6 patch,将 SSB memlimit 阈值从 80% 提升到 90% 等多个稳定性修复。 |
| Weaviate v1.36.16:SSB 内存阈值与 hnsw 修复 | 向量数据库 & AI 基础设施 - Weaviate | 05-27 16:30 | Weaviate 发布 v1.36.16,将 SSB memlimit 阈值由 80% 提升至 90%,修复 hnsw findnewentrypoint… |
| langchain-perplexity 1.3.0 | AI 框架 & 编排 - LangChain | 05-27 08:22 | LangChain 发布 langchain-perplexity 1.3.0(#37707)。 |
| LocalAI v4.3.2 依赖更新 | 推理引擎 & 本地 AI - LocalAI | 05-28 06:14 | LocalAI 本地推理平台发布 v4.3.2,主要为依赖升级(如 nats.go 1.50.0→1.52.0),由 dependabot 自动提交。 |
| Langflow v1.9.5:starter 项目更新 | AI 框架 & 编排 - Langflow | 05-28 02:33 | Langflow 发布 v1.9.5,仅包含 starter 项目的更新。 |
| llama.cpp b9370 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-28 02:25 | llama.cpp 发布 b9370 构建,hexagon 后端新增 MUL_MAT 和 MUL_MAT_ID 中 Q4_1 量化支持。 |
| llama.cpp b9368 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-28 02:13 | llama.cpp 发布 b9368 构建,Vulkan 后端 MUL_MAT_VEC 在 F16/32 模式下每次迭代切换为 4K,性能优化。 |
| llama.cpp b9369 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-28 01:42 | llama.cpp 发布 b9369,ggml-webgpu 修复了某些操作的工作组分发问题。 |
| llama.cpp b9366 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-28 01:34 | llama.cpp 发布 b9366,Vulkan 后端为 f16→f16 添加 REPEAT 算子支持(PR #23298)。 |
| llama.cpp b9365 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-28 01:06 | llama.cpp 发布 b9365,CI 中将 ARM 任务移至 self-hosted runner、暂禁 kleidiai mac release(… |
| Langflow 1.9.4 错误修复 | AI 框架 & 编排 - Langflow | 05-28 00:04 | Langflow 发布 v1.9.4,修复 agent 工具调用的模型处理并更新 IBM 模型集成。 |
| llama.cpp b9360 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-27 21:15 | llama.cpp 发布 b9360,common 模块修复环境变量统一加 LLAMA_ARG_ 前缀(PR #23778)。 |
| llama.cpp b9357 构建 | 推理引擎 & 本地 AI - llama.cpp | 05-27 18:19 | llama.cpp 发布 b9357,Vulkan 避免在 AMD UMA 设备上优先选择 transfer queue(PR #22455)。 |
| n8n@1.123.48 | AI 框架 & 编排 - n8n | 05-27 15:06 | n8n 发布 1.123.48 旧线 patch。 |
| Mastra @mastra/voice-murf@0.12.1 | AI Agent 框架 - Mastra | 05-27 12:34 | Mastra 发布 @mastra/voice-murf@0.12.1 子包(Murf 语音集成)。 |
| Langflow v1.10.0.dev48 nightly | AI 框架 & 编排 - Langflow | 05-27 08:59 | Langflow 发布 v1.10.0.dev48 nightly。 |
| LangChain 1.3.2 版本发布 | AI 框架 & 编排 - LangChain | 05-27 02:18 | LangChain 升级到 1.3.2,要求 langgraph>=1.2.2,为常规维护版本。 |
| LangGraph 1.2.2 版本发布 | AI 框架 & 编排 - LangGraph | 05-27 02:07 | LangGraph 版本号升至 1.2.2,常规依赖维护。 |
| Langflow 1.9.4 修复 nightly-base 跳过设置 | AI 框架 & 编排 - Langflow | 05-26 23:39 | Langflow 1.9.4 修复 build-nightly-base 中 skipped 标志未正确设置导致始终跳过推送的问题。 |
| Langflow nightly v1.10.0.dev47 | AI 框架 & 编排 - Langflow | 05-26 08:56 | Langflow 1.10.0 dev47 夜版构建。 |
6. 新闻媒体
81 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| Anthropic 如何在产品中遏制 Claude 行为边界 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | Anthropic 工程文:Agent 是新形态软件但底层交互不新,应先在环境层做隔离再在模型层调行为。匹配隔离强度与用户监督能力,使用经过验证的组件。 |
| 开源包严重漏洞危及数百万 AI Agent | 英文科技媒体(AI 频道) - Ars Technica AI | 05-27 03:50 | Starlette(每周 3.25 亿下载)被发现”BadHost”严重漏洞,影响数百万 AI Agent。安全研究者 Ars Technica 报道。 |
| Claude Cowork 首席工程师如何用 AI | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | Felix Rieseberg 展示用 Claude Cowork 完成的实际任务:把 2D 平面图转 3D 楼层规划、把邮件挖掘成个人物品库、用连接应用… |
| DeepSWE:长程软件工程评测基准 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | DeepSWE 推出长时段软件工程基准,覆盖 91 个仓库、5 种语言,且无模型预见过解。任务无污染、真实复杂、仓库多样、验证可靠,比 SWE-Bench… |
| 法律 Agent 基准测试初步结果 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | Harvey 在法律 Agent Benchmark 上以”全项通过”严标准测试前沿模型:Claude Opus 4.7 居首仅 7.1%,Sonnet … |
| Import AI 458:清算未来与一段奇点故事 | AI 专业媒体/Newsletter - Import AI (Jack Clark) | 05-26 20:32 | Jack Clark 的 Import AI 458 期,讨论年内的 AI 奇迹与未来清算,附一段奇点故事。 |
| Claude Mythos 推翻 Erdős 80 年猜想 | 中文 AI 媒体 - 新智元 | 05-27 16:10 | 新智元报道 Claude Mythos 在断网环境下解决了一个 80 年的 Erdős 猜想,比 OpenAI 同类成果更短更漂亮。 |
| GPT-5.5 反杀 Claude 登顶,AI 编码旧榜失准? | 中文 AI 媒体 - 新智元 | 05-27 18:30 | 新智元报道 GPT-5.5 在编码相关榜单上超越 Claude 登顶,引发对传统 AI 编程基准是否仍准确的讨论。 |
| Codex 自蒸馏玩法:复制粘贴消灭重复劳动 | 中文 AI 媒体 - 量子位 | 05-27 13:12 | 量子位报道 OpenAI 员工亲授 Codex 自蒸馏玩法,只需一段提示词复制粘贴即可让 AI 消灭重复劳动。 |
| DeepSeek 陈德里开发自动研究 Skill | 中文 AI 媒体 - 量子位 | 05-27 09:14 | 量子位报道 DeepSeek 陈德里开发自动研究 Skill,让 Agent 完成论文 99% 工作,人类只需动脑 2 小时。 |
| 微软 MAI-Image-2.5 登上 Arena 第 3 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | 微软 MAI-Image-2.5 在文生图 Arena 榜单排名第 3,在风格多样性、文字渲染和商业插画能力上较 MAI-Image-2 有明显提升。 |
| 用 NVIDIA CompileIQ 自动调优挖掘内核性能 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | NVIDIA 集成进 CUDA 13.3 的 CompileIQ 通过 AI 演化算法自动调优 GPU 编译器配置,在已优化的 AI 推理/训练任务上仍可… |
| Native Multimodal Models 资源汇总仓库 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | 一个 GitHub 仓库整理从模块化拼装走向原生多模态建模的相关工作——把不同模态统一到同一 transformer 空间或联合主干内。 |
| Anthropic 将在 Claude 中引入 AI Fluency 评分卡 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | Anthropic 计划在 Claude 中加入 AI Fluency 评分卡,依据 11 项行为指标评估用户的 AI 使用能力。 |
| OpenRouter 一年内估值翻倍至 13 亿美元 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 02:33 | OpenRouter 获得 CapitalG 领投的 1.13 亿美元 B 轮融资,6 个月内用量增长 5 倍,印证多模型 AI 未来已到。 |
| AI Agent 将科技世界推入混沌:始末解析 | 英文科技媒体(AI 频道) - Wired AI | 05-26 18:00 | Wired 长文回顾 Claude Code 和 OpenClaw 如何引爆了可能是计算机历史上最大的转型浪潮。 |
| LWiAI 播客 #246:Gemini 3.5 + Omni、Musk 败诉、OpenAI … | AI 专业媒体/Newsletter - Last Week in AI | 05-26 13:10 | Last Week in AI 第 246 期播客:Google 发布 Gemini 3.5 与 Gemini Spark Agent,Omni 把图像/… |
| SpaceX 的两个 AI 算力故事:仅一个有收入 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | SpaceX 招股书呈现两个故事:一是地面数据中心扩张并与 Anthropic 签下 12.5 亿美元/月、至 2029 年 5 月的合同;二是太空 AI… |
| Claude Mythos 据称用简洁证明解决 OpenAI 的 Erdős 难题 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | 据报道 Claude Mythos 对 OpenAI 标志性的 Erdős 问题给出了一个 cute、simple 的证明,虽然比 OpenAI 的方案略… |
| Sundar Pichai 谈 AI、搜索未来与网络变迁 | 英文科技媒体(AI 频道) - The Verge AI | 05-26 22:00 | Verge Decoder 播客:Google CEO Sundar Pichai 在 I/O 2026 后接受采访,谈 AI、搜索未来与网络生态。 |
| 5 秒完成 3D 场景编辑:VGGT-Edit 提速 120 倍 | 中文 AI 媒体 - 量子位 | 05-27 17:01 | 量子位报道北大、港中文、上海 AI Lab 联合推出 VGGT-Edit,可 5 秒完成 3D 场景编辑,比上一代提速 120 倍且无需绕回 2D。 |
| 卡帕西Anthropic最新头衔:技术员工(MTS) | 中文 AI 媒体 - 量子位 | 05-26 15:42 | 量子位报道 Andrej Karpathy 在 Anthropic 的新头衔是 MTS(技术员工/Member of Technical Staff)。 |
| Last Week in AI #341:马斯克败诉 OpenAI 等 | AI 专业媒体/Newsletter - Last Week in AI | 05-27 15:50 | Last Week in AI 周报第 341 期:马斯克对 OpenAI/Altman 的 1500 亿诉讼败诉、Google 在 I/O 2026 更… |
| Musk 的 xAI 警告员工限制与 Cursor 员工接触 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | xAI 首席法务警告员工,与 Cursor 员工的交流仅限于技术合作所需。背景是收购交易已进行数周,担心员工不当混合业务影响并购。 |
| Robinhood 让 AI Agent 替你交易股票 | 英文科技媒体(AI 频道) - The Verge AI | 05-27 22:36 | The Verge 报道 Robinhood 开放交易平台给 AI Agent,用户可创建独立账户、设置预算让 Agent 自主买卖股票。 |
| ElevenLabs 新音乐生成模型可中途换风格 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 22:14 | TechCrunch 报道 ElevenLabs 新音乐生成模型支持只重新生成歌曲某一段而不影响其他部分,并能跨曲风过渡。 |
| 前 Google/Apple 研究员创立 AI 反馈循环初创 | 英文科技媒体(AI 频道) - Wired AI | 05-27 22:00 | Wired 报道前 Google 与 Apple 研究员成立 Trajectory,押注 vibe-coding 式的快速迭代周期让 AI 产品能持续学习。 |
| 1400 亿 Agent 入场,流量护城河要塌了 | 中文 AI 媒体 - 量子位 | 05-27 17:31 | 量子位报道大厂押注 Agent 生态,新方向正在改变互联网“流量”作为护城河的逻辑。 |
| 实锤!GPT-5.5 降智,OpenAI 官方文档认了 | 中文 AI 媒体 - 新智元 | 05-27 16:10 | 新智元报道用户反馈 GPT-5.5 性能下降,OpenAI 官方文档确认该模型存在“降智”问题。 |
| 用户拒绝 Google AI 搜索,DuckDuckGo 安装量上涨 30% | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 06:32 | Google 在 I/O 2026 用 AI agent 取代蓝色链接后引发反弹,DuckDuckGo 应用安装量飙升 30%,反映用户对强推 AI 搜索… |
| 3D 打印人形机器人腿开启机器人实验自由 | 英文科技媒体(AI 频道) - Ars Technica AI | 05-27 01:16 | Hugging Face 发布售价 2500 美元的双足机器人项目,3D 可打印腿部,面向开发者与研究者。 |
| 将DSA注意力引入多模态,快手Keye2.0开启强化推理新范式 | 中文 AI 媒体 - 量子位 | 05-26 18:17 | 量子位报道快手 Keye 2.0 多模态模型,引入 DSA 注意力机制,开启强化推理的新范式。 |
| AI 编程公司 Cognition 估值 250 亿融资 10 亿 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-28 00:00 | TechCrunch 报道 Devin 母公司 Cognition 完成 10 亿美元融资,pre-money 估值 250 亿美元,年化营收已达 4.9… |
| 刚刚,国产AI自己造了AI,全球首例! | 中文 AI 媒体 - 量子位 | 05-26 16:46 | 量子位报道国产 AI 自动生成 AI 系统的首例,训练速度比英伟达 Megatron 快 10%。 |
| 留给人类数学家的悬赏不多了!谷歌DeepMind一口气解决9道埃尔德什问题 | 中文 AI 媒体 - 量子位 | 05-26 16:20 | 量子位报道 Google DeepMind 一次性解决 9 道 Erdős 问题,其中包括卡了人类 56 年的数学难题。 |
| Robinhood 现可让 AI Agent 交易股票 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 20:30 | TechCrunch 报道 Robinhood 允许 AI Agent 阅读用户组合、制定策略、用专用钱包预存余额下单。 |
| 重新思考 Agentic AI 时代的组织设计 | 英文科技媒体(AI 频道) - MIT Technology Review AI | 05-26 22:54 | MIT TR:85% 的组织希望在 3 年内成为 agentic 企业,但 76% 表示当前流程与基础设施无法支撑,人、流程、工作流准备不足。 |
| ClickHouse 年化营收三倍达 2.5 亿走向 IPO | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 21:04 | TechCrunch 报道列存数据库 ClickHouse 年化营收翻三倍达 2.5 亿美元,公司目标几年内上市。 |
| 你的 SEO 策略已落后于新搜索引擎 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-28 02:39 | TechCrunch Equity 播客讨论 Google I/O 后 AI 生成答案占据搜索前台,多数品牌对 AI 如何描述自己缺乏可见性,传统 SEO… |
| YouTube 将自动标注 AI 视频 | 英文科技媒体(AI 频道) - Ars Technica AI | 05-28 01:36 | Ars Technica 报道 YouTube 即将开始自动给 AI 生成的视频打标签,但卡通、非写实或仅含少量 AI 内容的视频仍可能不被识别。 |
| YouTube 将自动标注 AI 视频 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 21:00 | TechCrunch 报道 YouTube 不再仅依靠创作者自报,将自动给写实型 AI 视频打标签并提升标签可见性。 |
| YouTube 把 AI 标签放在更显眼处 | 英文科技媒体(AI 频道) - The Verge AI | 05-27 21:00 | The Verge 报道 YouTube 移动 Shorts 和长视频的 AI 披露位置以便用户看到,并将启动自动识别 AI 内容。 |
| 8.99 万元人形机器人来了:中国版 Figure | 中文 AI 媒体 - 新智元 | 05-27 18:30 | 新智元报道国产人形机器人价格打到 8.99 万元,对标 Figure 等海外公司,重塑价格门槛。 |
| 我是专业事实核查员:AI 出错比你以为的更频繁 | 英文科技媒体(AI 频道) - Wired AI | 05-26 18:00 | Wired 事实核查员实测 AI 的事实核查能力,得出 AI 常错的结论。 |
| Snowflake 与 AWS 签 60 亿美元 AI CPU 芯片协议 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-28 04:10 | TechCrunch 报道 Snowflake 与 Amazon 签订五年 60 亿美元大单采购 AI 用 CPU 芯片,Nvidia 再次被挑战。 |
| Nvidia 押注 1500 亿美元投资台湾 | 英文科技媒体(AI 频道) - Ars Technica AI | 05-28 03:59 | Ars Technica 报道黄仁勋宣布 Nvidia 每年投入 1500 亿美元,让台湾成为 AI 革命的“震中”,与川普政府推动美国本土 AI 中心战… |
| Remote 借 AI 让人均收入提升 50% | 英文科技媒体(AI 频道) - TechCrunch AI | 05-28 03:39 | TechCrunch 报道薪酬服务商 Remote 突破 3 亿美元 ARR、转正现金流,归功于 AI 应用带来的人均收入 50% 提升而非扩张人头。 |
| Meta 推出 Instagram/Facebook/WhatsApp 订阅 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-28 02:00 | TechCrunch 报道 Meta 全球推出 Instagram、Facebook、WhatsApp 付费订阅,并在“Meta One”品牌下测试 AI… |
| 华为“芯片女王”的挑战 | 英文科技媒体(AI 频道) - Wired AI | 05-28 02:00 | Wired AI 报道华为如何应对摩尔定律终结,调整芯片生产可能复杂化美国芯片霸权。 |
| AI 试图埋葬这位议员,反而让他出名 | 英文科技媒体(AI 频道) - The Verge AI | 05-27 23:40 | The Verge 报道纽约 12 区民主党初选中,Anthropic 与 OpenAI 在 AI 监管立场上对议员候选人 Alex Bores 的攻击反… |
| 中国越来越多留住顶尖 AI 人才 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 21:48 | TechCrunch 报道中国 AI 人才繁荣,北京越来越不愿放他们离开。 |
| 科技 CEO 似乎都在患“AI 精神病” | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 20:30 | TechCrunch 引用 Box CEO Aaron Levie 评论“CEO 特别易患 AI psychosis”,解释他们对 AI 生产力的近乎宗教信仰。 |
| 纽约时报内部的 AI 之争 | 英文科技媒体(AI 频道) - The Verge AI | 05-27 20:00 | The Verge 报道纽约时报科技工会与出版社在 AI 监控员工绩效条款上的谈判博弈,新闻业 AI 使用规则成为劳资焦点。 |
| 教皇并非 AGI 信徒 | 英文科技媒体(AI 频道) - The Verge AI | 05-27 20:00 | The Verge 报道教皇 Leo XIV 发布通谕《Magnifica Humanitas》,警告 AI 涉及人类权利、机会、地位与自由。 |
| 美国执法部门警告“反科技极端主义”兴起 | 英文科技媒体(AI 频道) - Ars Technica AI | 05-27 18:30 | Ars Technica 报道美国执法部门警告随着 AI 仇恨情绪上升,一类新型“反科技极端主义”威胁正在形成。 |
| OpenAI 招了 F1 级别车手搞公关 | 中文 AI 媒体 - 量子位 | 05-27 14:55 | 量子位报道 OpenAI 从 Salesforce 挖来一位有 13 年市场经验且参与过 F1 的高管负责公关。 |
| 触觉具身机器人天使轮近亿 | 中文 AI 媒体 - 量子位 | 05-27 13:18 | 量子位报道复旦系具身智能新公司天使轮融资近亿元,专注让机器人真正学会“触摸”。 |
| 教皇用 AI 写关于 AI 风险的通谕? | 英文科技媒体(AI 频道) - The Verge AI | 05-27 08:38 | The Verge 报道 LessWrong 用户 Linch Zhang 用 AI 检测器 Pangram 分析教皇 Leo XIV 通谕《Magnif… |
| 中国扩大对民营 AI 人才的出境限制 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | 中国将出境限制扩展至民营 AI 公司的顶尖人才,包括创始人、研究员和高管,他们须经审批方可出境。此前限制仅针对国企和敏感行业。 |
| 梵蒂冈为何邀请 Anthropic 出席教皇 AI 通谕发布 | 英文科技媒体(AI 频道) - Wired AI | 05-27 04:46 | Wired 报道:教皇利奥的首份通谕标志着教会与硅谷的史无前例联盟,Anthropic 联合创始人 Christopher Olah 出席发布会。 |
| 印度零工经济训练全球机器人?这家创业公司押注 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 00:00 | Human Archive 由 UC Berkeley 与斯坦福研究者创立,给印度零工工人佩戴带摄像头的帽子和传感器采集物理 AI 训练数据。 |
| 环球音乐与 TikTok 续签协议打击未授权 AI 音乐 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-26 22:55 | Universal Music Group 与 TikTok 续签协议,共同打击未经授权的 AI 生成音乐。 |
| AI 正在接管世界上最被诅咒的工作 | 英文科技媒体(AI 频道) - Wired AI | 05-26 18:00 | Wired 报道 AI 接管债务催收行业,未来你欠的账单可能由 AI 来催。 |
| 我用一周录下自己做家务赚钱:现在谁才是机器人? | 英文科技媒体(AI 频道) - Wired AI | 05-26 18:00 | Wired 记者亲历:把自己做家务的影像和动作数据卖给机器人训练公司,记录这一过程的复杂感受。 |
| 对 AI 抢工作恐慌的现实核查 | 英文科技媒体(AI 频道) - MIT Technology Review AI | 05-26 17:00 | MIT TR 反思 Coinbase、Meta、Cisco 等近期裁员是否真是 AI 所致,提醒读者别急着辞职。 |
| 正视入门级岗位即将到来的危机 | 英文科技媒体(AI 频道) - MIT Technology Review AI | 05-26 17:00 | MIT TR 指出虽总就业稳定,但入门级岗位(career first rung)正悄然弱化,AI 影响在表层数据下潜行。 |
| FBI 探员解释如何轻易锁定未经同意发布 AI 色情的人 | 英文科技媒体(AI 频道) - Ars Technica AI | 05-27 01:46 | Ars Technica 报道:FBI 通过 Instagram 上一条诡异的收藏帖追溯到一名销售 AI 色情图像的男子,他在自己头像里用了真照。 |
| Startup Battlefield 200 申请今日截止 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 22:15 | TechCrunch Disrupt 2026 Startup Battlefield 200 申请今天截止,争夺 10 万美元无股权资金。 |
| Bose 前睡眠负责人创立 SOND,融资 700 万 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 22:00 | TechCrunch 报道 SOND 推出 Dreambuds 闭环耳塞,可捕捉 12 项生理信号并实时辅助睡眠。 |
| 智能喂鸟器记录后院趣闻 | 英文科技媒体(AI 频道) - The Verge AI | 05-27 22:00 | The Verge 评测 Coolfly Aura 智能喂鸟器,借助 AI 识别鸟类。 |
| 教皇利奥用托尔金教育科技大佬 | 英文科技媒体(AI 频道) - Wired AI | 05-27 07:19 | Wired 报道教皇在关于 AI 的通谕中引用《指环王》,无意中讽刺了一直误读该作品的科技亿万富翁们。 |
| 教皇利奥十四首份通谕谈 AI 权力 | 英文科技媒体(AI 频道) - Wired AI | 05-27 04:17 | 教皇通谕《Magnifica Humanitas》批评技术权力高度集中在少数全球巨头手中,呼吁制衡。 |
| 没人愿意告诉我为何他们只听自己的 Suno 垃圾音 | 英文科技媒体(AI 频道) - The Verge AI | 05-26 20:46 | Verge 观察 Suno 子版上的诡异趋势:用户只听自己生成的 AI 音乐,不再使用传统流媒体平台。 |
| AI 战争已经到来 | 英文科技媒体(AI 频道) - The Verge AI | 05-26 20:00 | Verge 长篇报道:联合国 CCW 会议讨论致命自主武器系统的现状,AI 战争已经从假设走向现实。 |
| 广告:WHOOP/Stripe/DoorDash 如何用 AI 倾听客户反馈 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | Unwrap 的赞助内容,介绍其 AI + NLP 客户反馈智能平台被 Stripe、Southwest 等公司使用,支持自然语言查询、MCP 接入和实时告警。 |
| 广告:你的 API 延迟基准在骗你 | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | You.com 赞助稿,主张 P50 延迟无法反映真实性能,需结合召回率、grounding、重查询率和集成成本综合评估。 |
| TechCrunch Disrupt 2026 早鸟票 3 天后截止 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-27 22:00 | TechCrunch Disrupt 2026 早鸟票最多省 410 美元,5 月 29 日截止。 |
| 新智元 ALL in ASI 英雄帖 | 中文 AI 媒体 - 新智元 | 05-27 12:53 | 新智元发布招募帖呼吁人才加入 ASI 探索。 |
| TLDR 招聘高级应用 AI 软件工程师(年薪 25-35 万美元,全远程) | AI 专业媒体/Newsletter - TLDR AI | 05-27 08:00 | TLDR 应用 AI 团队招聘高级软件工程师,工作内容是把内部流程代码化、可复合编排,全远程,使用最新 AI 工具且 token 预算无限。 |
| TechCrunch Disrupt 2026 早鸟票 5 月 29 日截止 | 英文科技媒体(AI 频道) - TechCrunch AI | 05-26 22:00 | TechCrunch 提醒 Disrupt 2026 早鸟票将于 5 月 29 日截止,最高可省 410 美元。 |
| 测试:AI 会摧毁你的职业吗? | 英文科技媒体(AI 频道) - Wired AI | 05-26 18:00 | Wired 互动小测试,让读者评估自己的职业被 AI 取代的可能性。 |
7. Y Combinator
20 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| Claude Code 作为日常工具:CLAUDE.md、Skills、Subagents、插… | Hacker News | 05-27 13:13 | HN 转载博客,作者分享 Claude Code 日常使用经验,涵盖 CLAUDE.md、Skills、Subagents、Plugins 和 MCP 用法。 |
| Show HN:开源 AI 赛车竞赛框架 | Hacker News | 05-28 04:37 | Elodin Systems 在 HN 展示开源 AI Grand Prix 模拟竞赛框架,用于评测 AI 在赛车模拟环境下的表现。 |
| Go:支持泛型方法 | Hacker News | 05-27 17:02 | HN 转 Go 语言官方 Issue #77273,讨论 Go 增加泛型方法的支持。 |
| 交错增量(Interleaved Deltas) | Hacker News | 05-26 22:30 | mmapped 博客技术文,讨论 interleaved deltas 数据结构/同步设计。HN 推送,无 description 上下文。 |
| Pelica(YC P25)正在招聘 | Hacker News | 05-28 06:52 | Y Combinator P25 批次公司 Pelica 在招聘机器学习工程师,HN 头版职位帖。 |
| DuckDuckGo 因 Google AI Mode 反弹流量增 28% | Hacker News | 05-28 00:28 | PCGamer 报道 Google 称用户喜爱 AI Mode 后的一周,DuckDuckGo 搜索访问量增加近 28%。 |
| 在越狱 Kindle 上跑 Rust 和 Slint | Hacker News | 05-28 03:51 | HN 文章分享在越狱后的 Kindle 上运行 Rust 程序与 Slint UI 框架的实践。 |
| GitHub 服务事件:PR、Issues、Git 操作中断 | Hacker News | 05-27 20:15 | HN 转 GitHub Status 事件帖,涉及 PR、Issues、Git 操作和 API 的中断。 |
| 伊朗互联网流量在上升 | Hacker News | 05-28 06:24 | Cloudflare Radar 显示伊朗在 28 天内互联网流量增加,HN 讨论帖。 |
| 迷上 Meshtastic、MeshCore 与 Reticulum 等网格网络 | Hacker News | 05-28 03:52 | HN 转载博客,作者分享个人尝试 Meshtastic、MeshCore、Reticulum 等去中心化网格网络协议的体验。 |
| 关于 Labubu 与超真实 | Hacker News | 05-28 03:31 | HN 帖子,文化评论文章讨论 Labubu 等潮玩与鲍德里亚“超真实”概念的关系。 |
| 4K 分辨率玩 SimCity 3k(2025) | Hacker News | 05-28 01:36 | HN 帖子分享如何在 4K 显示器上玩 SimCity 3000 老游戏。 |
| Gemini、Gophers 和 Fingers:HTTPS 之外的网络 | Hacker News | 05-28 01:24 | HN 帖子探讨 Gemini、Gopher、Finger 等 HTTPS 之外的替代互联网协议。 |
| 加拿大向瑞典订购军用机队 | Hacker News | 05-28 00:53 | HN 转载《卫报》报道,加拿大转向瑞典 Saab GlobalEye 采购军机替代美国供应商。 |
| 压力扰乱海马体对重叠事件的整合 | Hacker News | 05-28 00:26 | Science Advances 论文,HN 转载,讨论压力如何破坏海马体对重叠事件的整合和记忆推理。 |
| Last.fm 已独立 | Hacker News | 05-27 23:36 | HN 转载帖,Last.fm 音乐平台宣布脱离母公司独立运营。 |
| 私募股权买下美国的关键服务 | Hacker News | 05-27 20:00 | HN 转载文章,探讨美国关键服务被私募股权收购的现象。 |
| Mini Micro 幻想电脑 | Hacker News | 05-27 17:56 | HN 转载 MiniScript 出品的 Mini Micro 幻想电脑(虚拟复古电脑)页面。 |
| Pandoc 的新 Typst 模板 | Hacker News | 05-26 13:08 | HN 推送的技术博客:介绍为 Pandoc 制作的新 Typst 模板,方便排版。 |
| 给你的 MacBook 加热(2019) | Hacker News | 05-28 04:42 | HN 转载一篇 2019 年博客,讨论如何给 MacBook 加热以解决某些低温问题,纯硬件话题。 |
8. YouTube AI 频道
15 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| Cursor 刚刚击败了所有人 | Matthew Berman | 05-27 00:40 | Matthew Berman 视频:分析 Cursor 在 AI 编程工具竞争中超越对手的最新动作。 |
| Cerebras CEO 谈数据中心、Token 成本与对华出口 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings) | 05-26 22:30 | 20VC 长视频:Cerebras CEO 讨论数据中心未来、token 成本演进、内存瓶颈,以及美国公司是否应向中国出售技术。 |
| 终于来了好的基准(DeepSWE) | Matthew Berman | 05-28 00:03 | Matthew Berman 视频介绍 DeepSWE 基准,作者认为这是少见的高质量软件工程评测基准。 |
| 无人谈论的 250 亿美元 AI 积压订单 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings) | 05-26 22:40 | 20VC short:揭示 250 亿美元的 AI 算力/数据中心积压订单。 |
| Marc Rowan 谈私募市场与资本配置的未来 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - a16z | 05-27 22:00 | a16z YouTube 节目邀请 Marc Rowan 讨论私募市场和未来资本配置,主要为金融投资话题。 |
| HR 即将被自动化 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings) | 05-27 13:00 | 20VC YouTube Short,主持人简短表态 HR 工作即将被自动化。 |
| 这些裁员并非 AI 造成 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings) | 05-27 02:00 | 20VC short 视频,讨论近期裁员潮的真实原因并非 AI。 |
| Forward Deployed 工程师的问题 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - 20VC (Harry Stebbings) | 05-26 13:00 | 20VC short:讨论 Forward Deployed Engineer 模式的弊端。 |
| 二线城市的电影院 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath | 05-27 23:58 | Nikhil Kamath 的 YouTube Short,讨论印度二线城市影院话题。 |
| 国家评级如何影响经济 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath | 05-27 21:17 | Nikhil Kamath YouTube Short,讨论国家信用评级对经济的影响。 |
| “我拒绝了 2 亿英镑!“ | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - The Diary of a CEO (Steven Bartlett) | 05-27 02:00 | Steven Bartlett 主持的 The Diary of a CEO 短视频,内容为某嘉宾分享拒绝 2 亿英镑收购的经历,非 AI 主题。 |
| 如何与其他内容创作者合作? | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath | 05-26 23:28 | Nikhil Kamath short 视频,讨论内容创作者协作话题,与 AI 无关。 |
| 印度从社群到个体主义的转变 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath | 05-26 23:23 | Nikhil Kamath short 视频,讨论印度社会从社群文化转向个体主义。 |
| Kishore Biyani 揭示印度下一波消费热潮的驱动力 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath | 05-26 23:21 | Nikhil Kamath short:印度零售大佬 Kishore Biyani 谈未来消费趋势,与 AI 无关。 |
| 板球比赛 RCB vs GT 第一资格赛 | 泛访谈频道(混合内容,需按 AI 相关性评分过滤) - Nikhil Kamath | 05-26 20:19 | Nikhil Kamath short:印度板球联赛话题,与 AI 无关。 |
9. 技术博客 / 开发者博客(Android Capacity 精选)
25 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| 神秘 LLM Hy3 大幅领跑 OpenRouter 排行榜 | AI & 技术评论 - minimaxir (Max Woolf) | 05-26 23:30 | Max Woolf 分析 OpenRouter 排行榜上突然冲顶的神秘模型 Hy3,探究其为何如此火爆。 |
| 用上我自己的大脑 | 独立开发者 & 个人博客 - Terrible Software | 05-27 20:38 | Terrible Software 博客作者反思 AI 如何扩展大脑而非替代思考,AI 真正危险在于悄然取代本该自己思考的部分。 |
| 2026 年的 CHAOSS 指标 | 独立开发者 & 个人博客 - Andrew Nesbitt | 05-27 18:00 | Andrew Nesbitt 博客指出 CHAOSS 开源健康度指标是按“人速”贡献校准的,AI 编码时代需要重新审视。 |
| 你今天烧了多少 token? | 独立开发者 & 个人博客 - Ibrahim Diallo | 05-27 08:31 | Ibrahim Diallo 在博客回忆早年荒诞的“按周按人统计代码行数”的经理故事,类比今天“按 token 用量考核开发者”的荒谬。 |
| SQLAlchemy 2 实战练习答案 | 编程语言 & 软件工程 - Miguel Grinberg | 05-28 03:22 | Miguel Grinberg 发布《SQLAlchemy 2 In Practice》系列收尾文章,汇总书中所有练习的参考答案。 |
| Pluralistic:AI 与一个没有移民的世界 | 技术写作 & 通识 - Cory Doctorow (Pluralistic) | 05-27 15:57 | Cory Doctorow 在 Pluralistic 撰文,讨论用 AI 取代移民劳动力的“唯我论”逻辑陷阱。 |
| 商业蠢人的复仇 | AI & 技术评论 - Where’s Your Ed At | 05-27 00:47 | Ed Zitron 持续唱衰 AI 与 NVIDIA、Anthropic 等公司的高估值,本期为其 premium newsletter 推介。 |
| 如果有足够公司报告同样的事,泡沫就会破裂 | AI & 技术评论 - Gary Marcus | 05-26 21:35 | Gary Marcus 援引 Uber COO Andrew Macdonald 称未从增加的 AI 成本中看到对应的生产力提升,预示 AI 泡沫可能破裂。 |
| Pluralistic:AI 泡沫与互联网泡沫并不一样 | 技术写作 & 通识 - Cory Doctorow (Pluralistic) | 05-26 17:45 | Cory Doctorow 论证 AI 泡沫不同于互联网泡沫:没有人需要被强行喂网络,但 AI 正被强塞给员工。 |
| Meta 标志与拟合 Besace 曲线 | 技术写作 & 通识 - John D. Cook | 05-27 23:15 | John D. Cook 博客分析 Meta 标志的 Besace 曲线参数拟合,讨论隐式与参数化形式。 |
| Windows Runtime IAsyncOperation 跨协程共享(一) | 系统 & 底层 - The Old New Thing (Raymond Chen) | 05-27 22:00 | Raymond Chen 在 The Old New Thing 介绍如何在多个协程间共享单个 Windows Runtime IAsyncOperati… |
| 修补 iozone 使现代 macOS 磁盘基准测试更好 | 技术写作 & 通识 - Jeff Geerling | 05-27 09:32 | Jeff Geerling 博客分享如何修补 iozone 让其在现代 macOS 下进行更可靠的磁盘基准测试。 |
| Solvinity 决定的详细解读与影响 | 独立开发者 & 个人博客 - berthub.eu (Bert Hubert) | 05-27 16:00 | Bert Hubert 荷兰语博客详细分析荷兰政府禁止 Kyndryl 收购 Solvinity 的决定与可能影响。 |
| Chuwi Minibook X N150 + Linux 评测 | 技术写作 & 通识 - Terence Eden | 05-27 19:34 | Terence Eden 评测 Chuwi Minibook X N150 小型笔电搭配 Linux 的旅行使用体验。 |
| 把远程命令输出复制到 macOS 剪贴板 | 独立开发者 & 个人博客 - IT Notes (Dragas) | 05-26 17:00 | 技术博客介绍 macOS pbcopy 命令的用法,把远程命令的输出直接管道到本地剪贴板。 |
| AMD K6-2 在 1998 年 5 月 28 日发布 | 独立开发者 & 个人博客 - Dave Farquhar (dfarq) | 05-27 19:00 | Dave Farquhar 回顾 AMD K6-2 处理器在 1998 年的发布历史。 |
| 比尔·盖茨的《Internet Tidal Wave》备忘录 | 独立开发者 & 个人博客 - Dave Farquhar (dfarq) | 05-27 19:00 | Dave Farquhar 回顾 30 年前比尔·盖茨在微软发出的《Internet Tidal Wave》备忘录及其历史意义。 |
| 重新浮现旧帖 | 独立开发者 & 个人博客 - Herman | 05-27 14:45 | Herman 在 bearblog 介绍如何把容易被错过的旧博客帖子重新浮出。 |
| 计算正态分布样本的期望极差 | 技术写作 & 通识 - John D. Cook | 05-27 01:59 | John D. Cook 推导 n 个标准正态样本极差的期望值,给出以 σ 为单位的通用公式。 |
| 只有疯子才会用互联网 | 技术写作 & 通识 - Experimental History | 05-27 00:02 | Experimental History 的杂谈文章:副标题 “hit me with your Honda”,对互联网使用文化的反思评论。 |
| C#/JS 能多次 await WinRT 异步操作,为何 C++/WinRT 不行? | 系统 & 底层 - The Old New Thing (Raymond Chen) | 05-26 22:00 | Raymond Chen 解释 C++/WinRT 与 C#/JavaScript 在多次 await 同一 WinRT 异步操作上的哲学差异。 |
| 陪审团中 IQ 的预期差距 | 技术写作 & 通识 - John D. Cook | 05-26 21:50 | John D. Cook 探讨 12 人陪审团中 IQ 差距的统计期望,回应 IQ 差距阻碍沟通的话题。 |
| Tandy 计算机的兴衰 | 独立开发者 & 个人博客 - Dave Farquhar (dfarq) | 05-26 19:00 | Dave Farquhar 回顾 Tandy 这一早期 PC 先驱在 1977 年起 12 年间的兴衰史。 |
| 大去人口化 | 技术写作 & 通识 - Derek Thompson | 05-26 19:00 | The Atlantic Derek Thompson 长文:探讨全球生育率为何在每个国家下降。 |
| Amber Alert 推送垃圾链接? | 独立开发者 & 个人博客 - Ibrahim Diallo | 05-26 11:25 | 独立博客作者收到 Amber Alert 但链接指向疑似垃圾站点,推测可能是字符截断导致的失误。 |
10. AI 从业者访谈 / 播客
5 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| [Latent Space 播客] ESMFold2:苦涩教训降临蛋白质 | 英文播客 - Latent Space Podcast | 05-28 01:46 | Latent Space 播客发布 Alex Rives(现 BioHub 科学负责人)对谈,详述 ESM-1 用语言模型对蛋白质序列做掩码预训练,意外学… |
| Seeed Studio:开源具身 AI 机器人 | 英文播客 - NVIDIA AI Podcast | 05-27 23:45 | NVIDIA AI Podcast 第 300 期,Seeed Studio CEO Eric Pan 和机器人负责人 Elaine Wu 讨论 NVID… |
| 他融资 7000 万美元用 AI 攻克一切疾病 | 英文播客 - Gradient Dissent (W&B) | 05-27 07:46 | Samuel Rodriques 离开物理学界后创办 Edison Scientific,打造 AI 科学家 Kosmos 用于药物研发,讨论 AI 提出… |
| 为 AI 时代更新职业建议 | Benjamin Todd | 英文播客 - 80,000 Hours Podcast | 05-26 23:47 | 80,000 Hours 创始人 Benjamin Todd 讨论 AI 加速背景下的职业规划,部分研究者认为 AI 自动化 AI 研究的概率今年 10%… |
| 你的最大杠杆:为最大影响设计 AI 职业 | Ben Todd | 英文播客 - The Cognitive Revolution | 05-26 18:55 | Cognitive Revolution 与 80,000 Hours 联合创始人 Ben Todd 谈如何围绕 AI 时间线规划个人职业,讨论失控风险、… |
11. AI 研究
50 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| LocateAnything:基于并行框解码的快速高质量视觉-语言定位 | HuggingFace 每日论文 | 05-27 01:59 | 论文提出 LocateAnything 统一生成式视觉定位与检测框架,采用并行框解码替代逐 token 序列生成,提升 VLM 检测速度与质量。 |
| MobileMoE:将 MoE 扩展到端侧 | HuggingFace 每日论文 | 05-27 01:58 | 论文提出 MobileMoE 端侧 MoE 语言模型家族(0.3-0.9B 激活,1.3-5.3B 总参),并给出端侧 MoE 缩放律,刷新端侧 LLM … |
| RAG 阅读中分离语义竞争与上下文长度 | HuggingFace 每日论文 | 05-27 01:06 | 论文提出 matched-control 协议,区分 RAG 失败的根因——上下文太长还是其他段落语义竞争——找出真正的 reader 失败原因。 |
| 符号查询还是语义检索?半结构化问答数据集与方法 | HuggingFace 每日论文 | 05-26 23:22 | 论文研究半结构化语料的问答:需精确过滤、聚合、结构属性穷举检索。提出结合符号+语义的混合方法。 |
| ORCA:根因分析的端到端交互式 Copilot | HuggingFace 每日论文 | 05-26 21:41 | ORCA 是端到端因果分析 Copilot,编排多个 Agent 让领域专家可用,弥合因果方法复杂度与领域专家的鸿沟。 |
| RLVR 数据集溯源:寻找更好训练数据的血缘追踪 | HuggingFace 每日论文 | 05-26 20:57 | 提出 ATLAS 框架对 RLVR 数据集做血缘追踪,将 145 万实例中 99.7% 归因到 20 个原子源,揭示当前 RLVR 数据集多为少数源的变体。 |
| ContextGuard:LLM 上下文学习的结构化自我审计 | HuggingFace 每日论文 | 05-26 18:45 | 论文研究 LLM 在上下文丰富任务中的失败模式:常常沿主推理路径推进,却遗漏外围、持久或格式敏感的要求;提出 ContextGuard 进行结构化自我审计。 |
| HTMLCure:把浏览器体验转化为交互式 HTML 的状态引导修复 | HuggingFace 每日论文 | 05-26 18:22 | HTMLCure 在 LLM 生成的 HTML 页面上执行真实滚动、悬停、点击等交互来评估并修复其在交互状态下的问题。 |
| SeDT:用 Sentence-Transformer 条件化 Decision-Transf… | HuggingFace 每日论文 | 05-26 18:00 | SeDT 针对 LLM 在多轮渐进任务中性能下降高达 39% 的可靠性失败,提出结构化对话状态条件化方法。 |
| Once-For-All:训练一次随时选数据的多模态指令微调框架 | HuggingFace 每日论文 | 05-26 17:31 | OFA 训练一次可复用的数据选择器,避免目标模型或候选池变化时重新计算筛选信号,提升 VLM 指令微调效率。 |
| 关注工具失败:医学 Agent 的协同工具增益 | HuggingFace 每日论文 | 05-26 16:29 | 论文研究医学 AI Agent 在工具不可靠时的安全使用,提出修复失败实例的协同机制。 |
| 有界路径上下文:LLM 知识图谱问答中可见路径历史的对照研究 | HuggingFace 每日论文 | 05-26 15:29 | 论文研究 LLM KGQA 中是否应在每次路由 prompt 中序列化完整路径,提出 Bounded Path Context (BPC) 解耦控制器符号… |
| Tail-Aware HiFloat4:Wan2.2 的 W4A4 训练后量化 | HuggingFace 每日论文 | 05-26 15:04 | 针对低比特文生视频量化挑战,在 Wan2.2 上做 W4A4 HiFloat4 量化,对边界模块保高精度并引入激活尾感知校准。 |
| AGORA:LLM Agent 的免推理 Prompt 压缩适配器 | HuggingFace 每日论文 | 05-26 14:29 | 论文指出 token 级抽取式压缩器结构上不适合 LLM Agent,AGORA 通过观察-动作 retention 适配器实现免推理的高压缩率。 |
| DEI:质量多样性搜索的演化推理多样性框架 | HuggingFace 每日论文 | 05-26 23:00 | DEI 框架在分布式 Quality-Diversity 搜索中将异构 LLM 作为变异算子,利用各模型不同的创造性先验,比同构并行搜索更具行为新颖性。 |
| 当眼神出卖 AI:用社交目光一致性检测 AI 生成图像 | HuggingFace 每日论文 | 05-27 01:50 | 论文提出 Social Gaze Consistency,用人物间目光方向、头眼对齐、瞳孔位置的相互一致性来检测 AI 生成图像中的语义级伪迹。 |
| SoftCap:扩散 Transformer 加速的软预算控制 | HuggingFace 每日论文 | 05-26 22:24 | SoftCap 是无训练的 DiT 推理控制层,通过 Trajectory Drift 信号决定何时执行 Full step,替代固定调度或手调阈值。 |
| 语言模型跨语言泛化的体外研究 | HuggingFace 每日论文 | 05-26 16:20 | 论文构造程序化生成的双语言体外实验环境,独立改变词汇距离、少数语言占比、分词训练机制等变量,研究跨语言迁移。 |
| 迷宫与线绳:重新思考 LLM 顺序知识编辑中的正则化 | HuggingFace 每日论文 | 05-26 16:07 | 论文系统分析顺序知识编辑中正则化的必要性,证明 AlphaEdit 等方法的等价性并提出更简化方案。 |
| OmniRetriever:以融合为教师的任意-任意 AVT 检索 | HuggingFace 每日论文 | 05-26 15:26 | OmniRetriever 通过 fusion-as-teacher 蒸馏在 audio-video-text 三模态间训练统一检索嵌入,弥补 InfoN… |
| LATTE:用同伴锚定偏好轨迹做个性化 LLM 生成 | HuggingFace 每日论文 | 05-26 14:50 | LATTE 提出潜空间轨迹跟踪方法做 LLM 个性化生成,分离用户稳定身份、近期漂移和物品内容。 |
| ReCA:通过递归上下文分配的多镜头长视频外推 | HuggingFace 每日论文 | 05-26 12:16 | ReCA 提出多镜头视频外推(MSVE)任务及递归上下文分配方法,弥合单镜头外推与多镜头叙事的差距。 |
| 面向逆问题的三元动力学感知扩散后验采样 | HuggingFace 每日论文 | 05-26 10:27 | 论文研究扩散后验采样中数据一致性、CFG、随机性三者的调度交互,提供优化策略替代启发式固定调度。 |
| AnchorDiff:MM-DiT 的免训练锚定式概念定位 | HuggingFace 每日论文 | 05-26 10:17 | AnchorDiff 在 MM-DiT 中以高置信度 anchor 为起点做图传播,解耦语义定位与结构精修,缓解视觉易混概念的注意力泄漏。 |
| 从博弈视角重思弱监督视频时序定位 | HuggingFace 每日论文 | 05-26 09:54 | 论文用博弈论视角重构弱监督视频时序定位任务,弥补现有方法在粗粒度跨模态学习和提案评分上的不足。 |
| OmniGF:统一目光跟随的双分支视觉-语言框架 | HuggingFace 每日论文 | 05-26 08:08 | OmniGF 用 VLM 双分支框架统一目光跟随任务,支持语义目标推理和多人并行推理,避免对同一场景的冗余计算。 |
| 用精度与延迟感知的用户激励让 AI 推理更绿色 | HuggingFace 每日论文 | 05-27 01:19 | 论文提出一种 AI 推理激励框架,结合用户对精度/延迟的估值与碳排放敏感度,权衡 QoE 与碳排放。 |
| 多样性中的可检测性:单次运行隐私审计的金丝雀样本设计 | HuggingFace 每日论文 | 05-27 01:06 | 论文研究单次训练运行的差分隐私审计中如何高效构造 canary 样本,以推导 DP 参数下界。 |
| 通过潜空间迭代精修的符号回归 | HuggingFace 每日论文 | 05-27 00:25 | 论文提出 Latent Equation Embedding,通过潜空间迭代摊销推理弥合神经符号回归的 amortization gap,使预测更接近真后验。 |
| AI 集成进声音设计师工作流的调研 | HuggingFace 每日论文 | 05-26 23:28 | 论文对 76 位从业者问卷+ 20 位深度访谈,分析 AI 工具在声音设计工作流中的应用现状与开发者-用户需求差距。 |
| 对图像生成模型预训练数据的黑盒成员推断攻击 | HuggingFace 每日论文 | 05-26 21:38 | 论文研究扩散图像生成模型的成员推断攻击,提升从去噪能力推断训练数据归属的判别力。 |
| 面向抓取的物体位姿与形状估计:可行吗? | HuggingFace 每日论文 | 05-26 20:32 | 论文评估当前物体位姿与形状估计方法(SAM3D、LRM、CRISP、Zero123 等)配合 antipodal grasp sampling 是否能超过… |
| PATE-TabTransGAN:基于 Transformer 学生判别器的差分隐私表格数据生成 | HuggingFace 每日论文 | 05-26 18:16 | PATE-TabTransGAN 融合 PATE 与 Transformer-GAN 用于差分隐私表格数据合成,兼顾形式化隐私保障与列间依赖建模。 |
| 基于图像特征融合的联邦客户端遗忘 | HuggingFace 每日论文 | 05-26 16:56 | 论文提出 FCU 在联邦学习中实现客户端数据遗忘,缓解灾难性遗忘问题,平衡遗忘效果与泛化能力。 |
| AI 评估可能带偏感知:解读学术写作时的上下文重要性 | HuggingFace 每日论文 | 05-26 15:47 | 论文用 Dimensions 期刊数据指出,忽视国家与领域差异的 AI 使用估算会把固有风格差异误判为 AI 生成,扭曲跨国跨领域分析。 |
| Granuscore:无参考的文本粒度度量 | HuggingFace 每日论文 | 05-26 14:59 | Granuscore 利用层次化嵌入空间的结构属性,给出无参考的文本粒度度量,可恢复语料中的层次序。 |
| 带弱约束的 2-ASP(Q) 程序:复杂度与高效实现 | HuggingFace 每日论文 | 05-27 01:44 | 论文研究带量词与弱约束的 ASP(Q) 程序的复杂度刻画,并给出高效实现,可表达 Delta_3^P 类优化问题。 |
| 用动态规划发现多级图像阈值的数量与取值 | HuggingFace 每日论文 | 05-27 01:03 | 论文用动态规划与改进的 MET 准则自动确定多级图像阈值的数量和位置,无需用户指定阈值数。 |
| 多元逻辑统一方法论:形式化推理的逻辑多元主义 | HuggingFace 每日论文 | 05-27 00:25 | 立场文:回顾 20 年浅嵌入非经典逻辑到高阶逻辑 HOL 的研究,主张在 LogiKEy 等统一元逻辑框架内推行对象级逻辑多元主义。 |
| 通过在线规划的约束贝叶斯实验设计 | HuggingFace 每日论文 | 05-26 21:13 | 论文将摊销策略离线预训练与在线规划结合,使贝叶斯实验设计能适应预算/成本/物理约束的动态变化。 |
| DunbaaBERT:从牺牲到语义的乌尔都语 RoBERTa | HuggingFace 每日论文 | 05-26 20:28 | DunbaaBERT 是从零训练的乌尔都语 RoBERTa-base 模型家族,使用 32k/52k/96k Byte-BPE 词表,在 17GB 去重乌… |
| 通过原型蒸馏的通用图异常检测 | HuggingFace 每日论文 | 05-26 19:16 | ProMoS 是首个无监督的通用图异常检测方法,基于原型蒸馏,跨新图迁移且无需推理时支持样本。 |
| Receipt Replay OOD:领域迁移下的屏幕翻拍检测基准 | HuggingFace 每日论文 | 05-26 19:15 | Receipt Replay OOD 是小型领域外屏幕翻拍检测基准,针对身份证件/小票的拍屏攻击鲁棒性评估。 |
| 经阴道超声图像中剖宫产瘢痕缺损分割数据集与基准 | HuggingFace 每日论文 | 05-26 17:45 | 论文发布剖宫产瘢痕缺损(CSD)在经阴道超声图像上的分割数据集与基准,便于该医学问题的 AI 研究。 |
| 有限 Oracle 预算下的蛋白质设计自改进模仿与生物引导搜索 | HuggingFace 每日论文 | 05-26 16:29 | SILO 在有限 Oracle 评测预算下做蛋白质序列优化,使用层次化编辑策略避免破坏功能关键残基。 |
| 对数增长控制的策略梯度样本复杂度 | HuggingFace 每日论文 | 05-26 15:24 | 论文分析对数增长控制(顶 Lyapunov 指数)下策略梯度的样本复杂度,揭示”尖点障碍”现象。 |
| PIDM-DP:用 Dormand-Prince 积分的物理引导扩散用于混沌系统辨识 | HuggingFace 每日论文 | 05-26 14:57 | PIDM-DP 把可微分的 5 阶 Dormand-Prince ODE 积分嵌入 DDPM 反向采样回路,用于从稀疏噪声观测重建混沌动力系统的连续轨迹。 |
| PolyFusionAgent:聚合物属性预测与反向设计的多模态基础模型与自主 AI 助手 | HuggingFace 每日论文 | 05-26 12:45 | PolyFusionAgent 是面向高分子材料发现的交互式框架,结合多模态聚合物基础模型与自主 AI 助手,缩短设计周期。 |
| SIKA-GP:用稀疏诱导核加速高斯过程推断 | HuggingFace 每日论文 | 05-26 11:49 | SIKA-GP 用基于二进制有序模板基的稀疏诱导核近似加速高斯过程推断,复杂度降至 O(log M)。 |
| 大规模平面场景的视觉度量测量比较研究 | HuggingFace 每日论文 | 05-26 10:32 | 论文比较 PTZ 摄像头下的几何单目测距、图像拼接+鸟瞰图变换、双目联合标定测距三种方法在水库监控场景的表现。 |
Generated at 2026-05-28T00:27:39.978Z by RSS Daily AI Digest