by Jesseovo
last30days-cn 是一个 AI Agent 技能(Skill),能够自动搜索中国互联网 8 大主流平台最近 30 天的内容,综合分析后生成有据可查的研究报告。
# Add to your Claude Code skills
git clone https://github.com/Jesseovo/last30days-skill-cnGuides for using ai agents skills like last30days-skill-cn.
Last scanned: 5/24/2026
{
"issues": [],
"status": "PASSED",
"scannedAt": "2026-05-24T07:21:54.446Z",
"semgrepRan": false,
"npmAuditRan": true,
"pipAuditRan": false
}No comments yet. Be the first to share your thoughts!
你是一个深度研究助手,可运行于任何支持 Bash/Read/Write 工具的 AI Agent 平台(如 Cursor、Claude Code、OpenClaw、Gemini CLI 等)。你专注于搜索中国互联网平台上最近30天的内容,并生成综合性研究报告。
当用户的请求包含以下关键词时,触发此技能:
首次使用或用户询问「需要什么配置」时,可简要说明:
🎉 欢迎使用 last30days-cn v2.0!
📋 零配置即可使用 4 个免费数据源:
✅ B站(公开 API)
✅ 知乎(公开搜索)
✅ 百度(公开搜索 + Bing 兜底,建议配 API Key 更稳定)
✅ 今日头条(公开接口)
🕷️ 安装 Playwright 可解锁爬虫模式(无需 API Key):
pip install playwright && playwright install chromium
解锁平台:微博、小红书(XHR拦截)、抖音(XHR拦截)、B站(备用)、知乎(备用)
🔧 可选配置 API Key 以获得更稳定的数据(非必需):
1. WEIBO_ACCESS_TOKEN - 微博 API 模式
2. TIKHUB_API_KEY - 抖音 API 模式
3. WECHAT_API_KEY - 微信公众号搜索
4. BAIDU_API_KEY + BAIDU_SECRET_KEY - 百度高级搜索
⚠️ v2.1 变更说明:
- 已移除 ScrapeCreators 集成(官方不支持小红书端点)
- 百度公开搜索可能被安全验证拦截,自动降级到 Bing 国内版
- 小红书爬虫改用 XHR 响应拦截,不再依赖 DOM 选择器
配置文件位置: ~/.config/last30days-cn/.env
cd {{SKILL_DIR}}/scripts && python3 last30days.py "{{用户查询}}" --emit compact
可选参数:
--quick - 快速搜索(更少数据源)--deep - 深度搜索(更多数据源)--days N - 回溯天数(1-30,默认30)--search weibo,bilibili,zhihu - 指定搜索源搜索引擎返回来自以下平台的数据:
| 平台 | 模块 | 数据类型 | 需要配置 | |------|------|---------|---------| | 微博 | weibo.py | 动态/话题 | ✅ 爬虫模式无需配置;API 模式需 WEIBO_ACCESS_TOKEN | | 小红书 | xiaohongshu.py | 笔记/种草 | ✅ 爬虫模式无需配置(XHR拦截);MCP API 可选 | | B站 | bilibili.py | 视频/弹幕 | ✅ 无需(公开 API + 爬虫备用) | | 知乎 | zhihu.py | 问答/文章 | ✅ 无需(公开搜索 + 爬虫备用) | | 抖音 | douyin.py | 短视频 | ✅ 爬虫模式无需配置;API 模式需 TIKHUB_API_KEY | | 微信 | wechat.py | 公众号文章 | WECHAT_API_KEY(可选,搜狗搜索为备用) | | 百度 | baidu.py | 网页搜索 | ⚠️ 公开搜索可能被反爬拦截,自动 Bing 兜底;BAIDU_API_KEY(推荐) | | 头条 | toutiao.py | 资讯/热榜 | ✅ 无需(公开接口) |
根据搜索结果生成综合研究报告,需要:
# [主题] - 最近30天研究报告
## 核心发现
- 发现1(来源:微博@用户, B站视频)
- 发现2(来源:知乎回答, 小红书笔记)
## 平台观点分布
### 微博
- 热门讨论要点...
### 小红书
- 种草/评测趋势...
### B站
- 视频内容分析...
### 知乎
- 专业讨论要点...
## 趋势分析
- 上升趋势...
- 下降趋势...
## 推荐阅读
- 高质量来源链接列表
每个搜索结果有一个 0-100 的综合评分,基于:
🚀 30 天的研究,30 秒的结果。8 大平台。零过时信息。
last30days-cn 是一个 AI Agent 技能(Skill),能够自动搜索中国互联网 8 大主流平台最近 30 天的内容,综合分析后生成有据可查的研究报告。
🔗 本项目基于 mvanhorn/last30days-skill 进行深度本土化改造,完全面向中国用户和中文互联网平台。
🕷️ v2.0 集成 MediaCrawler 爬虫引擎思路,大幅减少 API Key 依赖。v2.1 修复百度/小红书反爬问题,XHR 拦截替代 DOM 解析,Bing 兜底搜索,已移除无效的 ScrapeCreators 小红书集成。
👤 作者 / Author: Jesse (@Jesseovo)
请务必仔细阅读以下内容。使用本项目即表示您同意以下所有条款。
💡 爬虫违法违规的案例频发,请务必合法合规使用。 参考:中国爬虫相关法律案例汇总
| 特性 | v1.0 | v2.0 |
|:---:|:---:|:---:|
| 免费可用平台数 | 4 个 | 7 个(安装 Playwright 后) |
| 需要 API Key 的平台 | 微博、小红书、抖音、微信 | 仅微信(其余可用爬虫替代) |
| 数据获取方式 | 仅 API + 公开接口 | API + 爬虫引擎 + 公开接口 |
| 安装难度 | 需配置多个 API Key | pip install playwright 即可 |
| marketplace.json | 缺少 owner 字段(Bug) | ✅ 已修复 |
| 平台 | 模块 | 数据获取方式 | 需要配置 |
|:---:|:---:|:---:|:---:|
| 🔴 微博 | weibo.py | API / 🕷️爬虫 / 公开接口 | ✅ 爬虫模式无需配置 |
| 📕 小红书 | xiaohongshu.py | API / 🕷️爬虫 / 公开接口 | ✅ 爬虫模式无需配置 |
| 📺 B站 | bilibili.py | 公开 API / 🕷️爬虫备用 | ✅ 无需配置 |
| 💬 知乎 | zhihu.py | 公开搜索 / 🕷️爬虫备用 | ✅ 无需配置 |
| 🎵 抖音 | douyin.py | API / 🕷️爬虫 / 公开接口 | ✅ 爬虫模式无需配置 |
| 💚 微信 | wechat.py | API / 搜狗搜索 | WECHAT_API_KEY(可选) |
| 🔵 百度 | baidu.py | 公开搜索 / API | ✅ 基础搜索无需配置 |
| 📰 头条 | toutiao.py | 公开接口 | ✅ 无需配置 |
🕷️ = 需要安装 Playwright(
pip install playwright && playwright install chromium)
将项目克隆到 Cursor 技能目录:
git clone https://github.com/Jesseovo/last30days-skill-cn.git
然后在 Cursor 中将 SKILL.md 添加为项目技能。
# 方式一:通过 Marketplace 安装(推荐)
claude install Jesseovo/last30days-skill-cn
# 方式二:手动安装
git clone https://github.com/Jesseovo/last30days-skill-cn.git ~/.claude/skills/last30days-cn
git clone https://github.com/Jesseovo/last30days-skill-cn.git ~/.agents/skills/last30days-cn
git clone https://github.com/Jesseovo/last30days-skill-cn.git
# 在 Gemini CLI 中作为扩展加载
任何支持 Bash / Read / Write 工具的 AI Agent 都可以使用本技能。
pip install jieba
pip install playwright
playwright install chromium
安装 Playwright 后,微博、小红书、抖音、B站(备用)、知乎(备用)均可无需 API Key 使用。
如果您希望使用 API 模式获取更稳定的数据,或需要使用微信公众号搜索:
mkdir -p ~/.config/last30days-cn
touch ~/.config/last30days-cn/.env
chmod 600 ~/.config/last30days-cn/.env
Windows(PowerShell)等价: 创建目录与空配置文件可用 New-Item -ItemType Directory -Force -Path "$env:USERPROFILE\.config\last30days-cn" 与 New-Item -ItemType File -Path "$env:USERPROFILE\.config\last30days-cn\.env" -Force。限制 .env 仅当前用户可读写可近似使用 icacls "$env:USERPROFILE\.config\last30days-cn\.env" /inheritance:r /grant:r "$($env:USERNAME):(R,W)"(与 Unix chmod 600 意图相近,权限模型不同)。
编辑 ~/.config/last30days-cn/.env,按需填入 API Key:
# ============================================
# last30days-cn v2.0 配置文件
# ============================================
# 📌 说明:所有 API Key 均为可选
# 安装 Playwright 后,大部分平台已可通过爬虫模式使用
# API Key 提供更稳定的数据获取方式
# ============================================
# 🔴 微博开放平台(可选,已有爬虫模式替代)
# 获取方式: https://open.weibo.com → 创建应用 → 获取 Access Token
WEIBO_ACCESS_TOKEN=
# 📕 小红书(可选,已有爬虫模式替代)
# 获取方式: https://scrapecreators.com → 注册 → 获取 API Key
SCRAPECREATORS_API_KEY=
# 💬 知乎 Cookie(可选,增强搜索质量)
# 获取方式: 浏览器登录知乎 → F12 → Network → 复制 Cookie 值
ZHIHU_COOKIE=
# 🎵 抖音(可选,已有爬虫模式替代)
# 获取方式: https://tikhub.io → 注册 → 获取 API Key
TIKHUB_API_KEY=
# 💚 微信公众号搜索(目前无爬虫替代,需 API Key 才能使用)
# 获取方式: 使用第三方微信搜索 API 服务商
WECHAT_API_KEY=
# 🔵 百度搜索 API(可选,公开搜索已可用)
# 获取方式: https://cloud.baidu.com → 搜索服务 → 创建应用
BAIDU_API_KEY=
BAIDU_SECRET_KEY=
python scripts/last30days.py --diagnose
将输出各平台的可用状态和爬虫引擎状态:
{
"weibo": true,
"xiaohongshu": false,
"bilibili": true,
"zhihu": true,
"douyin": true,
"wechat": false,
"baidu_api": false,
"toutiao": true,
"crawler_engine": {
"playwright_available": true,
"cached_logins": [],
"note": "安装 Playwright 后,微博/小红书/抖音/B站/知乎可无需 API Key 使用爬虫模式"
}
}
python scripts/last30days.py "AI编程助手" --emit compact
| 参数 | 说明 | 示例 |
|:---:|:---:|:---:|
| --emit | 输出模式 | compact / json / md / context / path |
| --quick | 快速搜索 | 更少数据源,更快速度 |
| --deep | 深度搜索 | 更多数据源,更全面 |
| --days N | 回溯天数 | --days 7(最近一周) |
| --search | 指定搜索源 | --search weibo,bilibili,zhihu |
| --diagnose | 诊断配置 | 显示各平台可用状态 |
| --timeout SECS | 全局超时秒数 | 覆盖默认全局超时 |
| --save-dir DIR | 自动保存原始输出目录 | 将原始输出写入指定目录 |
| --debug | 调试模式 | 输出详细日志 |
# 🔍 搜索 AI 相关话题
python scripts/last30days.py "最新AI工具" --emit compact
# ⚡ 快速搜索,仅 B站和知乎
python scripts/last30days.py "Python教程" --quick --search bilibili,zhihu
# 📊 深度搜索并保存结果
python scripts/last30days.py "新能源汽车" --deep --save-dir ~/Documents/research
# 📋 输出 JSON 格式(适合程序处理)
python scripts/last30days.py "ChatGPT替代品" --emit json
# 🗓️ 仅搜索最近 7 天
python scripts/last30days.py "热门话题" --days 7
v2.0 采用三级自动降级策略,确保最大可用性:
优先级 1: API 模式(如配置了 API Key)
↓ 失败或未配置
优先级 2: 爬虫模式(MediaCrawler,需要 Playwright)
↓ 失败或未安装
优先级 3: 公开接口(HTTP 直接请求,无需任何配置)
| 平台 | API 模式 | 爬虫模式 | 公开接口 |
|:---:|:---:|:---:|:---:|
| 微博 | WEIBO_ACCESS_TOKEN | ✅ Playwright | ✅ m.weibo.cn |
| 小红书 | MCP HTTP API(可选) | ✅ Playwright (XHR拦截) | ⚠️ 命中率低 |
| B站 | - | ✅ Playwright(备用) | ✅ 公开 API |
| 知乎 | ZHIHU_COOKIE(增强) | ✅ Playwright(备用) | ✅ 公开搜索 |
| 抖音 | TIKHUB_API_KEY | ✅ Playwright | ✅ 备用接口 |
| 微信 | WECHAT_API_KEY | - | ✅ 搜狗搜索 |
| 百度 | BAIDU_API_KEY | - | ⚠️ 公开搜索可能被拦截,Bing 兜底 |
| 头条 | - | - | ✅ 公开接口 |
last30days-skill-cn/
├── 📄 SKILL.md # Agent 技能定义文件
├── 📄 README.md # 项目说明(本文件)
├── 📄 LICENSE # MIT 许可证
├── 📄 requirements.txt # Python 依赖
├── 📁 scripts/
│ ├── 🐍 last30days.py # 主入口 CLI
│ └── 📁 lib/
│ ├── crawler_bridge.py # 🆕 MediaCrawler 爬虫桥接模块
│ ├── weibo.py # 微博搜索模块
│ ├── xiaohongshu.py # 小红书搜索模块
│ ├── bilibili.py # B站搜索模块
│ ├── zhihu.py # 知乎搜索模块
│ ├── douyin.py # 抖音搜索模块
│ ├── wechat.py # 微信公众号模块
│ ├── baidu.py # 百度搜索模块
│ ├── toutiao.py # 今日头条模块
│ ├── schema.py # 数据结构定义
│ ├── score.py # 评分系统
│ ├── normalize.py # 数据标准化
│ ├── dedupe.py # 去重
│ ├── render.py # 输出渲染
│ ├── relevance.py # 相关性计算
│ ├── query.py # 查询预处理
│ ├── query_type.py # 查询类型检测
│ ├── entity_extract.py # 实体抽取
│ ├── env.py # 环境配置管理
│ ├── cache.py # 缓存管理
│ ├── dates.py # 日期工具
│ ├── http.py # HTTP 客户端
│ ├── ui.py # 终端 UI
│ └── setup_wizard.py # 配置向导
├── 📁 fixtures/ # 示例数据
├── 📁 tests/ # 测试用例
└── 📁 hooks/ # Agent 钩子
每条搜索结果的综合评分(0-100)基于:
| 维度 | 权重 | 说明 | |:---:|:---:|:---| | 🎯 相关性 | 45% | 与查询主题的文本匹配度 | | 🕐 时效性 | 25% | 内容发布时间的新鲜程度 | | 🔥 互动度 | 30% | 各平台互动指标(见下表) |
| 平台 | 互动指标 | |:---:|:---| | 微博 | 转发 + 评论 + 点赞 | | 小红书 | 点赞 + 收藏 + 评论 + 分享 | | B站 | 播放 + 弹幕 + 评论 + 投币 + 收藏 | | 知乎 | 赞同 + 评论 + 收藏 | | 抖音 | 点赞 + 评论 + 分享 + 播放 | | 头条 | 评论 + 阅读 + 点赞 |
本项目基于 MIT License 发布。
🚀 30 days of research. 30 seconds of work. 8 platforms. Zero stale info.
last30days-cn is an AI Agent skill that automatically searches 8 major Chinese internet platforms for the last 30 days of content and generates well-cited research reports.
🔗 This project is a Chinese-localized fork of mvanhorn/last30days-skill, fully adapted for Chinese users and platforms.
🕷️ v2.0 integrates MediaCrawler crawler engine concepts, significantly reducing API key dependencies.
👤 Author: Jesse (@Jesseovo)
This project is for educational and research purposes only.