AI 日报 | 2026-03-21
9 个来源 | 20 条新内容 | 5 条 AI 精选
Smart Recommendations
1. Midjourney V8 Alpha 开放 Relax 模式
应用产品 - Midjourney | AI 工具/产品
Midjourney V8 Alpha 版本现已支持 Relax 模式,面向 Standard/Pro/Mega 订阅用户开放,支持大部分命令(—hd 和 —q 4 不可同时使用除外)。这降低了 V8 的使用门槛,用户可在非高峰时段免费生成图片。
2. llama.cpp b8460 版本发布
推理引擎 & 本地 AI - llama.cpp | GitHub 开源项目 Releases(Atom Feed)
llama.cpp 发布 b8460 版本,修复了 common/parser 中导致生成提示词微妙损坏的严重 bug。这是本地 LLM 推理引擎的重要修复更新,使用 llama.cpp 的开发者建议尽快升级。
3. 新法庭文件揭示五角大楼曾告知 Anthropic 双方接近达成一致
英文科技媒体(AI 频道) - TechCrunch AI | 新闻媒体
Anthropic 向加州联邦法院提交两份宣誓声明,反驳五角大楼关于其构成“不可接受的国家安全风险“的说法,指出政府的指控基于技术误解,且部分问题在数月谈判中从未提出。文件显示双方在特朗普宣布终止合作前一周仍接近达成共识。
4. Insight-V++:面向多模态大语言模型的高级长链视觉推理
arXiv cs.CV | AI 研究 / arXiv 每日精选
提出统一多智能体视觉推理框架 Insight-V++,解决多模态大语言模型 (MLLM) 在长链推理中高质量数据稀缺和训练流程优化的问题。对提升 MLLM 视觉推理能力具有参考价值。
5. Q-Drift:扩散模型采样的量化感知漂移校正
arXiv cs.CV | AI 研究 / arXiv 每日精选
提出 Q-Drift 方法,在采样器端校正扩散模型训练后量化 (PTQ) 带来的误差累积问题。将量化噪声视为隐式随机扰动,推导出保持边缘分布的漂移调整。对部署大型扩散模型有实用价值。
YC 主题
暂无
a16z 主题
暂无
1. AI 工具/产品
1 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| Midjourney V8 Alpha 开放 Relax 模式 | 应用产品 - Midjourney | 03-21 08:27 | Midjourney V8 Alpha 版本现已支持 Relax 模式,面向 Standard/Pro/Mega 订阅用户开放,支持大部分命令(—hd … |
2. 新闻媒体
3 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| 新法庭文件揭示五角大楼曾告知 Anthropic 双方接近达成一致 | 英文科技媒体(AI 频道) - TechCrunch AI | 03-21 09:40 | Anthropic 向加州联邦法院提交两份宣誓声明,反驳五角大楼关于其构成“不可接受的国家安全风险“的说法,指出政府的指控基于技术误解,且部分问题在数月谈… |
| Anthropic 否认可在战时破坏 AI 工具 | 英文科技媒体(AI 频道) - Wired AI | 03-21 08:03 | 美国国防部指控 Anthropic 可能在战争期间操纵 AI 模型,Anthropic 高管回应称这在技术上不可能实现。这是 Anthropic 与五角大… |
| 对话越疆刘培超:春晚隐藏具身选手,却是百亿市值大玩家 | 中文 AI 媒体 - 量子位 | 03-21 10:42 | 量子位专访越疆科技创始人刘培超,该公司在具身智能领域已实现千万级收入,百亿市值。文章探讨了越疆在机器人和具身智能领域的商业化路径,以及已过追求明星公司阶段… |
3. GitHub 开源项目 Releases(Atom Feed)
6 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| Langflow v1.9.0.dev10 夜间构建版 | AI 框架 & 编排 - Langflow | 03-21 08:34 | Langflow 发布 v1.9.0.dev10 夜间开发版本。Langflow 是一个可视化 AI 工作流编排工具,此为常规 nightly 构建,无重… |
| llama.cpp b8460 版本发布 | 推理引擎 & 本地 AI - llama.cpp | 03-21 08:51 | llama.cpp 发布 b8460 版本,修复了 common/parser 中导致生成提示词微妙损坏的严重 bug。这是本地 LLM 推理引擎的重要修… |
| llama.cpp b8459 版本发布 | 推理引擎 & 本地 AI - llama.cpp | 03-21 08:23 | llama.cpp 发布 b8459 版本,主要改进 ggml-cpu 中为 tinyBLAS_PPC 累加器添加 always_inline 优化。属于… |
| LiteLLM v1.82.5 夜间构建版 | AI 框架 & 编排 - LiteLLM | 03-21 08:28 | LiteLLM 发布 v1.82.5 夜间版本,新增 UI 单元测试覆盖 10 个未测试组件。LiteLLM 是统一 LLM API 代理网关,本次主要为… |
| LiteLLM v1.82.3.dev.3 开发版 | AI 框架 & 编排 - LiteLLM | 03-21 08:17 | LiteLLM 发布 v1.82.3.dev.3 开发版,UI 中创建/编辑 Key 页面新增组织下拉选择功能。这是 LLM 网关管理界面的增量改进。 |
| ChromaDB v1.5.6.dev60 最新开发版 | 向量数据库 & AI 基础设施 - ChromaDB | 03-21 09:08 | ChromaDB 发布 v1.5.6.dev60 开发版本,提供 PIP 包和 Docker 镜像。ChromaDB 是开源向量数据库,本次为自动化 ni… |
4. AI 研究 / arXiv 每日精选
10 条
| 标题 | 来源 | 日期 | 摘要 |
|---|---|---|---|
| 基于 Vision Transformer 的胶囊内镜视频罕见病检测 | arXiv cs.CV | 03-21 12:00 | 使用 Google Vision Transformer (ViT) 对胶囊内镜视频进行 17 类标签的多标签分类,用于罕见消化道疾病检测。属于医学影像领… |
| S3T-Former:纯脉冲驱动的状态空间拓扑 Transformer 用于骨骼动作识别 | arXiv cs.CV | 03-21 12:00 | 提出 S3T-Former,一种基于脉冲神经网络 (SNN) 的节能 Transformer 架构,用于骨骼动作识别。保留了 SNN 的内在稀疏性,适用于… |
| DarkDriving:面向暗光环境自动驾驶的真实日夜对齐数据集 | arXiv cs.CV | 03-21 12:00 | 提出 DarkDriving 数据集,用于研究暗光条件下自动驾驶的视觉感知增强。与现有数据集不同,该数据集在真实道路场景中采集日夜对齐的图像对。 |
| SSP-SAM:结合语义-空间提示的 SAM 用于指代表达分割 | arXiv cs.CV | 03-21 12:00 | 提出 SSP-SAM 框架,通过集成语义-空间提示编码器增强 SAM 的自然语言理解能力,使其能直接用于指代表达分割任务。结合视觉和语言注意力适配器实现跨… |
| CytoSyn:病理学基础扩散模型技术报告 | arXiv cs.CV | 03-21 12:00 | 提出 CytoSyn,一个专为组织病理学设计的基础扩散模型。利用大量数字化病理切片和自监督基础特征提取器,支持从细胞分割到肿瘤亚型分类等下游应用。 |
| Action Draft and Verify:视觉-语言-动作模型的自验证框架 | arXiv cs.CV | 03-21 12:00 | 提出视觉-语言-动作 (VLA) 模型的自验证框架,结合扩散动作专家的高精度连续动作生成与自回归范式的鲁棒性优势,提升模型在分布外环境中的泛化能力。 |
| Q-Drift:扩散模型采样的量化感知漂移校正 | arXiv cs.CV | 03-21 12:00 | 提出 Q-Drift 方法,在采样器端校正扩散模型训练后量化 (PTQ) 带来的误差累积问题。将量化噪声视为隐式随机扰动,推导出保持边缘分布的漂移调整。对… |
| 仅训练阶段的异构图像-补丁-文本图监督推进小样本学习适配器 | arXiv cs.CV | 03-21 12:00 | 提出非对称仅训练框架改进基于适配器的 CLIP 微调(如 Tip-Adapter),引入细粒度补丁关系和文本结构对齐,且不增加推理成本。对 CLIP 小样… |
| Insight-V++:面向多模态大语言模型的高级长链视觉推理 | arXiv cs.CV | 03-21 12:00 | 提出统一多智能体视觉推理框架 Insight-V++,解决多模态大语言模型 (MLLM) 在长链推理中高质量数据稀缺和训练流程优化的问题。对提升 MLLM… |
| VLM-AutoDrive:面向安全关键自动驾驶事件的视觉-语言模型后训练 | arXiv cs.CV | 03-21 12:00 | 提出 VLM-AutoDrive 模块化后训练框架,解决通用多模态大语言模型在自动驾驶安全关键事件检测中的领域和时序不对齐问题。专注于碰撞和接近碰撞等稀有… |
Generated at 2026-03-21T05:02:06.968Z by RSS Daily AI Digest