AI 日报 | 2026-02-23

14 个来源 | 456 条新内容 | 10 条 AI 精选

Smart Recommendations

1. The Claude C Compiler: What It Reveals About the Future of Software

Simon Willison | 知名 AI 个人开发者/研究者

Simon Willison 分享了 Modular CEO Chris Lattner 对 Anthropic「用并行 Claude 构建 C 编译器」项目的深度分析。该项目基于最新的 Opus 4.6 模型，展示了 AI 在系统级编程中的潜力。Lattner 从编译器专家的视角解读了这一实验对软件开发未来的启示，认为 AI 编译器可能改变传统软件构建方式。这是理解 Claude Code 等 AI 编程工具发展方向的重要参考。

标题	来源	日期	摘要
问界通报广东惠州车辆起火事件：非车辆自身原因导致	中文 AI 媒体 - 36氪	02-23 14:24	问界汽车发布广东惠州车辆起火事件说明，经初步调查判断三电系统状态正常，事件非车辆自身原因导致。该事件与AI/科技领域无关。
花旗韩国宣布在芝加哥推出其全新的花旗韩国交易台	中文 AI 媒体 - 36氪	02-23 13:52	花旗韩国宣布在芝加哥推出全新交易台，拓展其全球交易业务布局。该消息属于金融行业动态，与AI技术无关。
2026年春节档票房破54亿	中文 AI 媒体 - 36氪	02-23 13:40	据猫眼专业版数据，2026年春节档总票房突破54亿元，《飞驰人生3》《惊蛰无声》《镖人：风起大漠》位列前三。该消息为影视娱乐行业动态。
微信马年春节数据报告：旅行、生活娱乐双双涨两成	中文 AI 媒体 - 36氪	02-23 13:35	微信发布2026春节数据报告，春节期间旅行和生活娱乐线下交易笔数同比涨幅均超20%，带’马’字的出行目的地热度高涨。该消息为互联网平台数据报告。
五粮液：公司近五年累计分红已超768亿元	中文 AI 媒体 - 36氪	02-23 13:30	五粮液表示近五年累计分红超768亿元，2024年度分红率提升至70%。该消息为白酒行业财经新闻，与AI无关。
智谱GLM-5技术全公开！完全适配华为等国产芯片，美国网友酸了	中文 AI 媒体 - 量子位	02-23 13:19	智谱发布 GLM-5 模型并全面公开技术细节，引入与 DeepSeek 同款的技术机制。GLM-5 完全适配华为等国产芯片，是国产大模型在基础设施自主化方…
和铂医药宣布就一款临床阶段抗体产品达成授权协议及股权合作	中文 AI 媒体 - 36氪	02-23 13:11	和铂医药与Solstice Oncology达成授权协议和股权合作，授予后者一款临床阶段候选产品在大中华区以外的独家开发及商业化权益，总对价超1.05亿美…
32倍压缩率下性能反超25个点！破解长文本压缩「翻车」难题 \| ICLR 2026	中文 AI 媒体 - 量子位	02-23 12:48	量子位报道 ICLR 2026 研究成果：在 32 倍压缩率下实现性能反超 25 个百分点，破解了长文本压缩场景下的性能「翻车」难题。这对 LLM 长上下…
今天全国铁路预计发送旅客1850万人次	中文 AI 媒体 - 36氪	02-23 12:44	36氪报道，大年初七春节假期进入尾声，全国铁路将迎返程最高峰。今日预计发送旅客 1850 万人次，计划加开旅客列车 2297 列。
三个和尚没水喝！OpenAI星际之门搁浅，一年过去压根没动工	中文 AI 媒体 - 量子位	02-23 12:41	量子位报道 OpenAI 的星际之门（Stargate）数据中心项目一年过去仍未动工，团队配置尚未完成。这一重大基础设施项目的搁浅可能影响 OpenAI …
虎鲸文娱发布春节文娱消费报告：线下演出同比增长27%，线上经典剧集纪录片成假期合家欢首选	中文 AI 媒体 - 36氪	02-23 12:18	虎鲸文娱集团发布春节文娱消费报告。旗下大麦娱乐和优酷数据显示，春节期间线下演出项目数同比增长 27%，线上经典剧集和纪录片成为合家欢首选。
机构：SK海力士有望在2026年实现创纪录的盈利	中文 AI 媒体 - 36氪	02-23 12:17	大信证券分析师预测 SK 海力士 2026 年营业利润将增至约 174 万亿韩圆。通用 DRAM 和 NAND 平均售价预计分别大涨 159% 和 91%…
飞猪：春节假期国内游单量创新高，酒店间夜量大增75%	中文 AI 媒体 - 36氪	02-23 11:55	飞猪数据显示春节假期国内游订单量创新高，门票订单量同比增长超 80%，酒店间夜量同比增长 75%。更长假期带动了节中出游需求的进一步释放。
德视佳：2月23日起短暂停牌待刊发内幕消息	中文 AI 媒体 - 36氪	02-23 11:52	德视佳 (01846.HK) 公告其股份自 2026 年 2 月 23 日起在港交所短暂停牌，以待刊发涉及非常重大收购事项的内幕消息。
三星SDI在锂金属电池领域取得突破未来或推出商业化解决方案	中文 AI 媒体 - 36氪	02-23 11:25	三星 SDI 与哥伦比亚大学合作开发了氟基凝胶聚合物电解质，有效抑制锂金属电池中的枝晶形成。锂金属电池能量密度比传统 NCA 锂离子电池高 1.6 倍以上…
港股新能源汽车股走强	中文 AI 媒体 - 36氪	02-23 11:01	2 月 23 日港股新能源汽车股走强。零跑汽车、理想汽车、蔚来和赛力斯均涨超 4%，小鹏汽车涨近 4%。
韩汽车数据研究所：韩国二三十岁人群新车购买率去年跌至十年最低	中文 AI 媒体 - 36氪	02-23 10:55	韩国 Carisyou 数据显示，2025 年韩国 20 和 30 多岁人群新车购买率跌至十年最低。分析认为经济负担加重和手机租车应用普及是主要原因。
支付宝“AI付”、蚂蚁阿福APP用户数双破亿	中文 AI 媒体 - 36氪	02-23 10:55	蚂蚁集团披露春节实战数据：支付宝「AI 付」用户数突破 1 亿，蚂蚁阿福 APP 总用户数也突破 1 亿大关。春节新增用户中 52% 来自三线及以下城市，…
商务部新闻发言人就美国最高法院公布关税诉讼案裁决结果答记者问	中文 AI 媒体 - 36氪	02-23 10:34	美国最高法院判定美国政府依据《国际紧急经济权力法》对贸易伙伴加征的对等关税和芬太尼关税等违法。商务部表示正在全面评估影响，敦促美方取消相关单边关税措施。
天合跟踪签约西班牙360MW项目	中文 AI 媒体 - 36氪	02-23 10:13	天合跟踪与西班牙 EPC 合作，将为两大光伏项目提供合计 360MW 智能跟踪系统解决方案。计划交付约 11000 套开拓者 1P 单排跟踪系统。
港股大模型概念股走弱，智谱跌超20%	中文 AI 媒体 - 36氪	02-23 10:12	港股大模型概念股走弱，智谱跌超 20%，MINIMAX 跌 13%。反映了市场对 AI 大模型概念股的短期情绪波动。
中指研究院：2025下半年百街商铺平均租金为24.05元/平方米/天环比下跌0.47%	中文 AI 媒体 - 36氪	02-23 09:51	中指研究院报告显示 2025 下半年百街商铺平均租金为 24.05 元/平方米/天，环比下跌 0.47%。优质购物中心冲击和餐饮增速放缓导致多数商业街经营承压。
现货白银日内涨近3%	中文 AI 媒体 - 36氪	02-23 09:28	现货白银日内涨近 3%，报 87 美元/盎司。
OpenAI神秘「波兰军团」曝光！奥特曼：没他们就没有OpenAI	中文 AI 媒体 - 新智元	02-23 09:14	新智元报道 OpenAI 内部神秘的「波兰军团」团队被曝光。Sam Altman 高度评价该团队，称没有他们就没有 OpenAI。揭示了波兰工程师群体在 …

标题	来源	日期	摘要
0.11.12	AI Agent 框架 - browser-use	02-23 12:37	browser-use AI Agent 浏览器自动化框架发布 0.11.12 版本，修复了 CDP（Chrome DevTools Protocol）连…
v1.8.0.dev59	AI 框架 & 编排 - Langflow	02-23 08:38	Langflow 发布 v1.8.0.dev59 开发版本。Langflow 是流行的可视化 AI 工作流编排工具，支持拖拽构建 LLM 应用管道。此次为…
b8132	推理引擎 & 本地 AI - llama.cpp	02-23 08:03	llama.cpp 发布 b8132 构建版本，改进了 CLI 对文本文件输入的支持。llama.cpp 是最广泛使用的本地 LLM 推理引擎，每次更新都…

标题	来源	日期	摘要
Insider amnesia	独立开发者 & 个人博客 - Sean Goedecke	02-23 08:00	Sean Goedecke 讨论了「内部人遗忘症」现象：外界对科技公司内部决策的猜测几乎总是错误的。例如，人们可能错误地将某个决策归咎于产品经理，而实际上…
Which web frameworks are most token-efficient f…	独立开发者 & 个人博客 - Martin Alderson	02-23 08:00	Martin Alderson 基准测试了 19 个 Web 框架在 AI 编程 Agent 场景下的 token 效率。测试发现精简框架比全功能框架最多…
How AI Labs Proliferate	独立开发者 & 个人博客 - Jim Nielsen	02-23 03:00	Jim Nielsen 的博客以 xkcd 标准漫画的风格讽刺 AI 实验室的增殖现象：每当有人认为现有 AI 实验室不可信而决定自己创建一个「负责任」的…

标题	来源	日期	摘要
The Claude C Compiler: What It Reveals About th…	Simon Willison	02-23 07:58	Simon Willison 分享了 Modular CEO Chris Lattner 对 Anthropic「用并行 Claude 构建 C 编译器」…
London Stock Exchange: Raspberry Pi Holdings plc	Simon Willison	02-23 07:54	Simon Willison 分享了 Raspberry Pi 在伦敦证券交易所的股价图表，显示其股票在周二出现大幅飙升。与 Raspberry Pi 发…

标题	来源	日期	摘要
Epistemic Traps: Rational Misalignment Driven b…	arXiv cs.AI	02-23 13:00	该论文提出了一个统一理论框架，解释LLM中谄媚(sycophancy)、幻觉(hallucination)和策略性欺骗等行为病理的产生和稳定性机制。研究认…
Ontology-Guided Neuro-Symbolic Inference: Groun…	arXiv cs.AI	02-23 13:00	该论文研究是否可以通过形式化领域本体增强语言模型的可靠性，使用数学领域的OpenMath本体结合RAG方法实现神经符号推理。属于LLM可靠性研究的学术探索。
The Token Games: Evaluating Language Model Reas…	arXiv cs.AI	02-23 13:00	该论文提出通过受16世纪策略游戏启发的Puzzle Duels方法来评估LLM的推理能力，旨在解决现有benchmark可能已被训练数据覆盖的问题。属于L…
El Agente Gr’afico: Structured Execution Graph…	arXiv cs.AI	02-23 13:00	该论文提出El Agente Grafico，一种基于结构化执行图的单Agent系统，用于协调LLM驱动的科学工作流中的异构计算工具。解决了当前Agent…
Alignment in Time: Peak-Aware Orchestration for…	arXiv cs.AI	02-23 13:00	该论文提出APEMO，一种针对长期Agent工作流的运行时调度层，通过时序-情感信号优化固定预算下的计算资源分配，而无需修改模型权重。属于AI Agent…
WorkflowPerturb: Calibrated Stress Tests for Ev…	arXiv cs.AI	02-23 13:00	该论文提出WorkflowPerturb基准，通过对标准工作流施加可控扰动来评估多Agent工作流的评估指标质量。解决了自动评估指标分数未经校准的问题。
Cross-Embodiment Offline Reinforcement Learning…	arXiv cs.AI	02-23 13:00	该论文将离线强化学习与跨形态学习相结合，聚合不同机器人平台的异构轨迹数据来学习通用控制策略，降低高质量示范数据的采集成本。属于机器人学习领域研究。
Neurosymbolic Language Reasoning as Satisfiabil…	arXiv cs.AI	02-23 13:00	该论文提出Logitext，一种神经符号语言，将文档表示为自然语言与逻辑约束的混合体，利用SMT求解器进行可验证推理。解决了现有方法仅限于完全可形式化任务…
SOMtime the World Ain$‘$t Fair: Violating Fairn…	arXiv cs.AI	02-23 13:00	该论文证明无监督表示中即使排除了敏感属性，年龄和收入等信息仍会作为主要潜在轴浮现。使用自组织映射(SOM)方法揭示了无监督学习中的公平性问题。
Diffusing to Coordinate: Efficient Online Multi…	arXiv cs.AI	02-23 13:00	该论文探索将扩散生成模型应用于在线多Agent强化学习(MARL)中，提升策略表达能力和多模态表示。属于多Agent协调的理论研究。
Trojans in Artificial Intelligence (TrojAI) Fin…	arXiv cs.AI	02-23 13:00	IARPA发布TrojAI项目最终报告，总结了多年来对AI模型中木马后门威胁的研究成果，包括检测和防御恶意嵌入AI模型的后门攻击方法。属于AI安全领域的综…
AI Hallucination from Students’ Perspective: A …	arXiv cs.AI	02-23 13:00	该论文从大学生视角研究LLM幻觉问题，调查学生如何体验、检测和理解LLM幻觉。属于AI素养与教育领域的定性研究。
Assessing LLM Response Quality in the Context o…	arXiv cs.AI	02-23 13:00	该论文评估LLM在技术助长的亲密伴侣暴力(TFA)场景中的响应质量，探讨LLM能否为受害者提供可靠的在线支持。属于LLM社会影响的应用研究。
Mind the Boundary: Stabilizing Gemini Enterpris…	arXiv cs.AI	02-23 13:00	该论文实现了一个基于Cloud Run的A2A Hub编排器，用于跨项目和账户稳定运行Gemini Enterprise Agent-to-Agent调用…
CodeScaler: Scaling Code LLM Training and Test-…	arXiv cs.AI	02-23 13:00	该论文提出CodeScaler，一种无需执行代码的奖励模型，用于扩展代码LLM的强化学习训练和测试时推理。解决了基于单元测试的RLVR方法受限于测试用例可…
Curriculum Learning for Efficient Chain-of-Thou…	arXiv cs.AI	02-23 13:00	该论文提出三阶段课程学习框架，通过结构感知掩码和GRPO将大模型的Chain-of-Thought推理能力蒸馏到小模型中。解决了教师推理过于冗长的问题。属…
IRPAPERS: A Visual Document Benchmark for Scien…	arXiv cs.AI	02-23 13:00	该论文提出IRPAPERS基准，评估基于图像的系统与传统文本检索系统在科学文献处理中的对比表现。探索多模态基础模型直接从文档图像进行检索和生成的能力。
Robust Pre-Training of Medical Vision-and-Langu…	arXiv cs.AI	02-23 13:00	该论文提出Robust-MMR方法，通过域不变的多模态掩码重建增强医学视觉-语言模型在不同成像设备和协议下的鲁棒性。属于医学AI领域的预训练研究。
DesignAsCode: Bridging Structural Editability a…	arXiv cs.AI	02-23 13:00	该论文提出DesignAsCode方法，将图形设计生成转化为代码形式，在高视觉保真度与精细结构可编辑性之间取得平衡。对AI辅助设计工具有潜在应用价值。
Agentic Unlearning: When LLM Agent Meets Machin…	arXiv cs.AI	02-23 13:00	该论文提出Agent式遗忘概念，解决在闭环交互Agent中同时从模型参数和持久记忆中移除指定信息的问题。弥补了现有遗忘方法仅针对参数的不足。
A Case Study of Selected PTQ Baselines for Reas…	arXiv cs.AI	02-23 13:00	该论文在华为昇腾NPU上评估了AWQ、GPTQ、SmoothQuant和FlatQuant四种训练后量化(PTQ)方法在DeepSeek-R1-Disti…
AsynDBT: Asynchronous Distributed Bilevel Tunin…	arXiv cs.AI	02-23 13:00	该论文提出AsynDBT方法，针对云端LLM API的使用场景，通过异步分布式双层调优提升In-Context Learning的效率，避免了手动调整pr…
EXACT: Explicit Attribute-Guided Decoding-Time …	arXiv cs.AI	02-23 13:00	该论文提出EXACT，一种基于显式属性引导的解码时个性化方法，使LLM能根据用户上下文动态调整输出，而非依赖静态的隐式偏好表示。
Can LLM Safety Be Ensured by Constraining Param…	arXiv cs.AI	02-23 13:00	该论文系统评估了四种安全区域识别方法在不同LLM家族上的效果，发现当前方法识别的安全区域可能并不如预期可靠。对LLM安全研究方法论有反思价值。
ScaleBITS: Scalable Bitwidth Search for Hardwar…	arXiv cs.AI	02-23 13:00	该论文提出ScaleBITS方法，通过硬件对齐的混合精度搜索将LLM平均精度降至4位以下，同时保持推理性能。解决了现有混合精度方案运行时开销高的问题。
MIDAS: Mosaic Input-Specific Differentiable Arc…	arXiv cs.AI	02-23 13:00	该论文提出MIDAS，通过自注意力机制实现动态、输入相关的架构参数计算，改进了传统DARTS的静态架构参数设计。属于神经架构搜索(NAS)的方法论研究。
UBio-MolFM: A Universal Molecular Foundation Mo…	arXiv cs.AI	02-23 13:00	该论文提出UBio-MolFM，一种面向生物系统的通用分子基础模型，旨在弥合量子力学精度与生物尺度之间的鸿沟。属于AI for Science(生命科学)…
”Everyone’s using it, but no one is allowed to …	arXiv cs.AI	02-23 13:00	该研究通过23名大学生的半结构化访谈，探索高校环境中影响学生使用生成式AI的制度和社会因素。发现截止日期、考试和评分压力促使学生在不确定规则的情况下仍使用AI。
Stop Saying “AI”	arXiv cs.AI	02-23 13:00	该论文呼吁学术界和产业界停止笼统使用AI一词，认为这个模糊的术语阻碍了对具体系统的有效批评和监管。属于AI术语学和政策讨论方面的观点论文。
Five Fatal Assumptions: Why T-Shirt Sizing Syst…	arXiv cs.AI	02-23 13:00	该论文分析了传统敏捷估算方法(尤其是T-Shirt尺码法)在AI/LLM项目中系统性失效的五个假设。对AI项目管理实践有一定参考意义。
GeneZip: Region-Aware Compression for Long Cont…	arXiv cs.AI	02-23 13:00	该论文提出GeneZip，一种区域感知的DNA压缩模型，利用基因组信息高度不均衡的生物学先验，实现对十亿级碱基对序列的高效建模。属于AI for Scie…
Detection and Classification of Cetacean Echolo…	arXiv cs.AI	02-23 13:00	该论文使用基于图像的目标检测方法和小波变换来检测和分类鲸类回声定位信号，解决了海洋生物声学分析中手动标注耗时的问题。属于AI在海洋生物学中的应用。
Inelastic Constitutive Kolmogorov-Arnold Networ…	arXiv cs.AI	02-23 13:00	该论文提出iCKANs(非弹性本构Kolmogorov-Arnold网络)，一种新型神经网络架构，可自动发现描述材料弹性和非弹性行为的符号化本构定律。属于…
Investigating Target Class Influence on Neural …	arXiv cs.AI	02-23 13:00	该论文研究目标类别对神经网络可压缩性的影响，旨在为能量自主的鸟类监测系统优化模型。属于边缘AI在生物多样性监测中的应用研究。
The 2025 AI Agent Index: Documenting Technical …	arXiv cs.AI	02-23 13:00	该论文发布2025年AI Agent指数，系统记录已部署的Agent式AI系统的来源、设计决策和安全特性。对了解AI Agent生态系统全貌有参考价值，涉…
QueryPlot: Generating Geological Evidence Layer…	arXiv cs.AI	02-23 13:00	该论文提出QueryPlot，通过自然语言查询结合大规模地质文本语料和地质地图数据生成矿产勘探证据层。属于AI在地球科学中的应用研究。
Deep Learning for Dermatology: An Innovative Fr…	arXiv cs.AI	02-23 13:00	该论文研究VGG16和DenseNet201在皮肤癌良恶性分类中的应用效果，属于医学AI在皮肤科诊断中的应用研究。
Mind the Style: Impact of Communication Style o…	arXiv cs.AI	02-23 13:00	该论文通过用户研究探索聊天机器人沟通风格对用户体验和任务成功率的影响，在2D导航任务中比较了两种不同沟通风格的聊天机器人。
Enhancing Scientific Literature Chatbots with R…	arXiv cs.AI	02-23 13:00	该论文评估了基于向量和知识图谱的RAG系统在科学文献聊天机器人中的表现，比较了结构化(图)和非结构化(向量)数据库在文献检索中的效果。
Financial time series augmentation using transf…	arXiv cs.AI	02-23 13:00	该论文使用基于Transformer的GAN架构进行金融时间序列数据增强，解决金融数据稀缺导致深度学习模型训练不足的问题。属于AI在金融领域的应用研究。

AI 日报 | 2026-02-23

AI 日报 | 2026-02-23

Smart Recommendations

1. The Claude C Compiler: What It Reveals About the Future of Software

2. Which web frameworks are most token-efficient for AI agents?

3. Batch Prompting Suppresses Overthinking Reasoning Under Constraint: How Batch Prompting Suppresses Overthinking in Reasoning Models

4. 0.11.12

5. b8132

6. v1.8.0.dev59

7. 智谱GLM-5技术全公开！完全适配华为等国产芯片，美国网友酸了

8. 32倍压缩率下性能反超25个点！破解长文本压缩「翻车」难题 | ICLR 2026

9. 支付宝“AI付”、蚂蚁阿福APP用户数双破亿

10. 三个和尚没水喝！OpenAI星际之门搁浅，一年过去压根没动工

Blog 精选 Top 5

1. The Claude C Compiler: What It Reveals About the Future of Software

2. Which web frameworks are most token-efficient for AI agents?

3. How AI Labs Proliferate

4. Insider amnesia

5. London Stock Exchange: Raspberry Pi Holdings plc

1. 新闻媒体

2. AI 研究 / arXiv 每日精选

3. GitHub 开源项目 Releases（Atom Feed）

4. 技术博客 / 开发者博客（Android Capacity 精选）

5. 知名 AI 个人开发者/研究者