黑客松获奖项目灵感库
状态:🟡 调研中 日期:2026-04-25 启动 驱动问题:从 2024-2026 国内外优质黑客松获奖项目 + 早期 VC 投资项目中,提炼两类 AI 创业灵感(电商相关方向 / 纯技术创新方向) 方法论:信号发现(Trend Spotting)+ 跨案例归纳(Cross-Case Pattern Mining)+ 双轨分类(业务嫁接 / 独立创新)
结论摘要
⏳ 待调研完成后填充。
详细收敛 → findings.md
业务背景
公司业务:电商导购 + 返利。正在转型 AI 应用,需要两类 idea 输入:
- 业务嫁接型 — 与现有导购/返利业务可结合的 AI 创新(提升核心业务)
- 独立创新型 — 与旧业务无关的纯技术/应用创新(开辟新增长曲线)
为什么是黑客松而不是成熟产品? 黑客松 ≈ 早期 idea 信号源——未被市场完全验证、独立开发者扎堆、短时高密度产出。优质黑客松(专业组织运营 / 独立开发者向)的获奖项目代表了”前期信号”。已成熟的市场产品不好对标。
为什么补充早期 VC 项目? 黑客松 idea 有时太粗。YC W24-S25 / a16z Speedrun / South Park Commons 等 Pre-seed/Seed 阶段项目是”成熟版黑客松 idea”,可作为黑客松信号的对照与补充。
方法论如何指导本次调研
信号发现(Trend Spotting) 决定了维度划分:
- 赛事来源维度 —— 不同赛事代表不同人群偏好(学生 / 厂商命题 / 独立开发者 / 加密圈 / 国内独立)→ 编号文件 1-7
- 时间维度 —— 2024 vs 2025 vs 2026 看方向变迁
- 地域维度 —— 国际 vs 国内 看本土化机会
跨案例归纳 指导收敛阶段:
- 项目卡 → 主题标签 → 跨赛事的共识 / 矛盾 / 信号 / 空白
- 不是”列项目”而是”看模式”
双轨分类 指导产出:
- 每个项目卡都标注”灵感关联”字段(电商可嫁接 / 纯技术 / 两者皆有 / 不适用)
- 收敛时按双轨分别整理灵感库
调研框架(22 数据源 × 60-80 届/批 × ~1500 项目卡)
A. 国际 Devpost 学生赛 → 1-Devpost学生赛.md
| # | 比赛 | 届数 | 抓取 |
|---|---|---|---|
| 1 | TreeHacks (Stanford) | 3 (24/25/26) | Easy / Devpost |
| 2 | PennApps | 3 (XXIV/XXV/XXVI) | Easy / Devpost |
| 3 | HackMIT | 3 | Easy / Devpost |
| 4 | HackTheNorth (Toronto) | 3 | Easy / Devpost |
| 5 | CalHacks (Berkeley) | 6 (年 2 场:AI+主赛) | Easy / Devpost |
B. 厂商官方 → 2-厂商官方Hackathon.md
| # | 比赛 | 届数 | 抓取 |
|---|---|---|---|
| 6 | Anthropic 官方 | 4-5 | Medium / Devpost+官博 |
| 7 | OpenAI DevDay/Open Model | 2-3 | Medium / Devpost+论坛 |
| 8 | Hugging Face | 8-10 主题赛 | Easy / Spaces+博客 |
C. 跨链 + 专业组织 → 3-跨链与专业黑客松.md + 4-高频精选届.md
| # | 比赛 | 届数 | 抓取 |
|---|---|---|---|
| 9 | ETHGlobal AI tracks | 6-8 | Medium / 官网+Devpost |
| 10 | Cerebral Valley | 5-8 精选 | Medium / 官网+Devpost |
| 11 | Encode AI | 2-4 | Easy / 官网+Medium |
| 12 | AGI House (大厂赞助精选) | 5-8 | Hard / 官网timeline+X |
| 13 | Lablab.ai (主题赛精选) | 5-8 | Easy / lablab.ai 列表 |
D. 国内独立黑客松 → 5-AdventureX.md + 6-小红书.md + 7-国内其他.md
| # | 比赛 | 届数 | 抓取 |
|---|---|---|---|
| 14 | AdventureX ⭐ | 3 (24/25/26) | Hard / 多源拼凑 |
| 15 | 小红书黑客松 ⭐ | 1-2 | Hard / 多源 |
| 16 | AGI Playground (极客公园) | 1-2 | Hard / 多源 |
| 17 | 即刻 AI Hackathon | 数届 | Login / 即刻+SegmentFault |
| 18 | DoraHacks AI 主题赛 | 5-8 | Easy / dorahacks.io |
| 19 | Create@AI (阿里云) | 2-3 | Easy / startup.aliyun.com |
E. VC 早期信号补充 → 8-VC早期AI项目精选.md
| # | 来源 | 数量 | 抓取 |
|---|---|---|---|
| 20 | YC W24/S24/W25/S25 AI 精选 | 20-30 | Easy / ycombinator.com |
| 21 | a16z Speedrun SR004-006 | 5-10 | Easy / speedrun.a16z.com |
| 22 | South Park Commons demo | 5 | Easy / 官博 |
已砍(理由)
- 掘金 AI Hackathon、Sequoia Arc、HackerCamp 国内:不存在
- Antler:数据零散
- Sundai Club:周级 260+ 届,数据极稀疏
- Buildspace:信息散落 Discord/Twitter
抓取核心原则 ⭐
数据完整性 > 速度。 一个方案不行立刻试下一个,直到拿到为止。 用户原话:“我相信这些课中肯定都会有报道的,只是国内的大部分可能在微信公众号或者一些自媒体上。“
8 级 fallback 阶梯(逐级试,不轻易认输)
- 官方主页 / 公告 → WebFetch / bb-browser
- 比赛官方社媒 → 官方 X / 微信公众号 / 即刻 / 小红书 / B 站官号 → bb-browser
- 飞书文档 / 多维表格 / Wiki →
lark-mcp全套工具 - 一线技术媒体公众号 + 自媒体(国内核心):
- 量子位、机器之心、智源、PaperWeekly、Founder Park、AGIPark
- 少数派、36kr、虎嗅、晚点 LatePost、甲子光年、极客公园
- IT之家、观察者网、SegmentFault、新智元
- 抓法:搜狗微信
weixin.sogou.com/weixin?query=+ 媒体官网站内搜
- 个人长文 / 复盘 → 公众号原创、知乎回答、即刻长帖、Medium、个人 blog
- 参赛者一手发布 → X 帖、个人 blog、Demo Day 视频、GitHub README
- B 站视频解析 →
video-downloaderskill 下载 + Whisper 转录 - 第三方汇总 → GitHub awesome-list、Hackathon 周报、研究报告附录
飞书 (Lark) MCP 工具组(国内黑客松官方名单常用载体)
mcp__lark-mcp__docx_builtin_search— 飞书文档全文搜索mcp__lark-mcp__docx_v1_document_rawContent— 拿文档原文mcp__lark-mcp__wiki_v1_node_search+wiki_v2_space_getNode— Wiki 搜索mcp__lark-mcp__bitable_v1_appTableRecord_search— 飞书多维表格搜索(不少比赛用 Bitable 维护项目库,易忽略)mcp__lark-mcp__bitable_v1_appTable_list+appTableField_list— 表结构
工具组合速查
| 场景 | 主工具 | Fallback |
|---|---|---|
| 公开网页 | WebFetch | WebSearch + 二级搜索 |
| 复杂分页/登录态 | bb-browser | WebFetch (公开页) |
| 飞书 docx | lark-mcp__docx_builtin_search + docx_v1_document_rawContent | bb-browser |
| 飞书 Wiki | lark-mcp__wiki_v1_node_search + wiki_v2_space_getNode | bb-browser |
| 飞书多维表格 | lark-mcp__bitable_v1_appTableRecord_search + appTable_list | bb-browser |
| 微信公众号 | 搜狗微信 + WebFetch | bb-browser |
| B 站视频 | video-downloader skill (下载+Whisper) | 视频简介+OCR |
| X (Twitter) | WebFetch | bb-browser 登录态 |
| 小红书 | bb-browser 登录态 | 第三方报道 |
触发动作
- 进入新数据源前,先列 ≥ 5 个独立入口清单,逐条试
- 单一方案失败立刻切下一级,不返回空手
- 8 级跑完仍数据不全 → evidence 里明确标注”已穷尽手段,覆盖率 X%“,不静默丢失
项目卡片标准字段(所有 Agent 输出统一格式)
### {项目名}
- **比赛 / 届次**:{比赛名} {届次} ({年份})
- **奖项**:{Best Overall / Track Winner: XX / Sponsor Prize / Honorable / 特别奖名}
- **团队**:{N 人,如有姓名}
- **一句话描述**:{<50 字提炼,不照搬官方文案,要让读者一眼看懂"做什么"}
- **技术标签**:{LLM, Multi-Agent, RAG, Vision, Voice, Code Gen, Hardware, ...}
- **应用方向**:{电商导购/Agent 工具/生产力/创意/教育/医疗/金融/...}
- **链接**:Demo: {url} | GitHub: {url} | 信息源: {url}
- **灵感关联**:{电商可嫁接 / 纯技术创新 / 两者皆有 / 不适用}
收敛与产出
五轮收敛
- 第一轮 去噪聚合 — A7 把 evidence/ 各源数据聚合写入编号文件 1-8(按”届次→奖项→项目卡”组织)
- 第二轮 四象限提炼(共识 / 矛盾 / 信号 / 空白)
- 第三轮 洞察建议 →
findings.md - 第四轮 产出 —— 见下方
- (第五轮 落地手册暂不做,本次为聚焦调研)
产出三件套
产出/灵感库-电商相关.md—— 按”导购 / 选品 / 返利激励 / 履约 / CX / 直播 / 社群 / 广告”分类产出/灵感库-纯技术创新.md—— 按”Agent / 工具 / 生产力 / 创意 / 垂直行业”分类产出/趋势观察.md—— 2024 vs 2025 vs 2026 方向变迁、各赛事评审偏好对比、共识 vs 分歧产出/灵感地图.md—— 树状索引,每个 idea 一行 + 项目锚点
关联调研
- 好idea的定义 — 本次灵感分类质量评估的标准来源
- IDEA工作台设计 — 灵感库可作为 idea 管线的输入素材
- 商业模式认知体系 — 评估每个 idea 的商业模式维度
- 合规自动化全球机会 — 已有的”机会清单”调研,可对照本次黑客松信号
验证标准
- 22 个 evidence/ 子目录均有产出,每届 Devpost 类项目数 ≥ 15
- AdventureX 三届各至少 5 个项目(多源拼凑),且至少 2 个独立源交叉
- 去重:同一项目跨源出现合并卡片
- 灵感库可用性:电商相关 ≥ 30 个 idea,纯技术 ≥ 50 个 idea
- 可追溯:每个项目卡的”信息源”字段必须填