deep-research

Name: deep-research
Author: hoolulu

Verified

深度调研报告生成 Skill — 一条命令，十分钟出券商级深度调研报告 / Professional deep research report generation Skill · Supports 19 languages

490stars

53forks

HTML

Installation

# Add to your Claude Code skills
git clone https://github.com/hoolulu/deep-research

Getting Started

Guides for using ai agents skills like deep-research.

Caveman: Cut Claude Token Use by 65%
How agent-side prompt compression works, when to use it, and when not to.
What is an AI Skills Marketplace?
Definitions, how marketplaces work, and how to choose between them in 2026.
Getting Started with AI Skills

SKILL.md

Security ReportVerified

Last scanned: 6/14/2026

{
  "issues": [],
  "status": "PASSED",
  "scannedAt": "2026-06-14T08:16:25.167Z",
  "npmAuditRan": true,
  "pipAuditRan": true,
  "promptInjectionRan": true
}

README.md

Frequently Asked Questions

What is deep-research?

deep-research is an open-source ai agents skill for AI coding assistants such as Claude Code, Codex CLI, and ChatGPT, built by hoolulu. 深度调研报告生成 Skill — 一条命令，十分钟出券商级深度调研报告 / Professional deep research report generation Skill · Supports 19 languages. It has 490 GitHub stars.

Is deep-research safe to use?

Yes. deep-research passed SkillsLLM's automated security scan — a dependency vulnerability audit plus prompt-injection heuristics — with no high-severity issues. You can read the full report in the Security Report section on this page.

How do I install deep-research?

Clone the repository with "git clone https://github.com/hoolulu/deep-research" and add it to your Claude Code skills directory (see the Installation section above). deep-research ships a SKILL.md manifest, so compatible agents can discover and load it automatically.

What programming language is deep-research written in?

deep-research is primarily written in HTML. It is open-source under hoolulu on GitHub, so you can review or fork the full source.

Are there alternatives to deep-research?

Yes. SkillsLLM lists many other AI Agents skills you can browse and compare side by side. Open the AI Agents category from the badge at the top of this page, or use the Related Skills and comparison links further down to weigh deep-research against similar tools.

Agentic AI for Beginners

Build your first AI agent from scratch - tool use, ReAct pattern, memory, deployment

41 minBeginner

Comments (0)

to leave a comment.

No comments yet. Be the first to share your thoughts!

Related Skills

ECC

by affaan-m

The agent harness performance optimization system. Skills, instincts, memory, security, and research-first development for Claude Code, Codex, Opencode, Cursor and beyond.

235,006

cc-switch-web claude-code-hooks

name: deep-research description: "Professional deep research report generation — multi-agent collaboration with parallel chapter writing, automatic latest-data targeting, multilingual output, and built-in quality checks." version: 3.0.0 updated: 2026-06-08 risk: medium author: hoolulu repository: https://github.com/hoolulu/deep-research

deep-research

生成对标券商/第三方研究机构标准的深度调研报告。

架构：主 agent 调度 4 个子 agent Task（大纲/数据/预检/装配）+ 1 轮主控并行派发章节，中间数据走临时文件
数据源：在线模式 → CLI 内置引擎（Layer 0，如有）+ SearXNG（Layer 1） + sources.json 优质源搜索（Layer 2）并行 → 按质量触发免费源补强（Layer 3 兜底）→ Scrapling 批量抓取；离线模式 → 用户指定的本地文件（md/txt/pdf/docx）
安装：见下方「安装与配置」
输出：$TMPDIR/outline.json（临时，非最终报告）
最终报告：保存到 skill 目录下的 reports/
参考文件：RULES.md（硬约束/反模式）、TYPES.md（分类标准/编号规范）、profiles.json（三档模式参数，修改后重启软件即全局生效）
容错原则：调研不阻塞。所有脚本/命令调用必须有兜底路径。主路径失败 → 自动尝试替代方案（换 sys.executable/检查路径/直接 Python 实现）→ 三次失败后向用户报告具体问题。详见「容错原则」。

0. 支付级质量标准（所有 Task 共用，缺任何一项即降级）

#	标准	说明
1	结论先行	每章以 `> 引用格式` 核心判断开头
2	来源可追溯	每个数字标注（机构，年份）
3	反方视角	至少 1 处呈现争议或反对观点
4	三层深度	事实层 → 因果层 → 判断层
5	零套话	无"近年来""值得注意的是"等填充词
6	标题含判断	"格局：高度集中"✅ \| "行业概况"❌
7	可自包含	首章必须定义核心概念
8	无内部编号	正文无任何流程编号，标题自解释
9	时间戳正确	文件名和报告尾时间必须 `date` 命令获取
10	目录源自大纲	目录从 outline.json 的第一级章节生成，不从正文提取
11	强制目录	报告正文前必须包含 `## 目录` 标题及自动目录（TOC），列出所有章节标题
12	元数据完整	报告头部必须包含总字数、阅读时间、数据截至日期（精确到月）、报告生成具体时间（精确到秒）、调研模式、Skill版本六个字段，用 `·` 隔开。另起一行 `> 参考来源：{主要来源} 等 · 共引用 N 个来源`。报告末尾须附 `## 参考来源`（列出所有引用机构及链接）和 `## 免责声明`。版本号从本 skill 的 VERSION 文件读取。
13	篇幅达标	见项目根目录 `profiles.json`。所有模式限制以 `profiles.json` 为准，修改后重启软件即全局生效。
14	四段式结构	顺序固定为：报告标题 → 元数据块（含六字段 + 参考来源行） → `## 目录` → 正文各章 → 尾部（参考来源 + 免责声明）
15	编码洁净	所有中间文件（outline.json / data-pool.json / chapter-.md）必须使用 UTF-8 无 BOM* 编码写入，不得出现替换字符（\ufffd）或 GBK→UTF-8 Mojibake。子 agent 在写入前必须自行验证编码洁净，不得将编码问题遗留到主 agent
16	纯文本公式	报告中不得使用 LaTeX/math 公式语法（ $...$ 、`$$...$$`、`\[...\]` 等）。公式必须用纯文本或 Unicode 符号表达，确保复制到任何编辑器都不产生渲染问题

时间锚定规则

所有主题默认以 {CURRENT_YEAR} 为目标搜索最新数据。时间锚定模式在 Task 1 中由大纲 agent 按以下规则判定：

模式	符号	判定条件	target_year	验收
`latest`（默认）	⏳	所有主题的默认值，除非符合 relaxed 或 user_specified	`{CURRENT_YEAR}`	严格：≥50% 数据来自当年/前一年
`relaxed`（放宽）	🔓	指南/教程/概念类主题，或用户问历史/原理（"草书发展""起源""背景"）	`{CURRENT_YEAR}`	宽松：标记旧数据但不过滤
`user_specified`	📌	用户提问显式指定了年份/月份（"2025年""2026Q1""2020年至今"）	用户的指定年份	硬约束：>50% 匹配用户指定时间

{CURRENT_YEAR} 是动态变量，运行时通过 date +%Y 解析，无需手动修改。

1. 主 agent 调度流程

⚠️ CRITICAL — DO NOT SPEAK BEFORE LANGUAGE DETECTION

Your VERY FIRST action (before anything else) must be: detect language → set $LANG. Output NOTHING to the user until $LANG is set — no thinking aloud, no status messages. After language is detected, ALL output must be in $LANG. Period.

IMPORTANT: Clean the topic before detection — the user input may contain framework wrapper text (e.g. "请使用... skill 执行...用户输入如下："). Strip all wrapper text and pass ONLY the clean research topic. For example from "请使用...用户输入如下：Quantum computing market outlook -quick" extract only "Quantum computing market outlook".

你（主 agent）的完整流程：

══ Setup (必须先执行) ══

 → 创建一个带时间戳的临时目录作为 TMPDIR（例如 D:\TEMP\opencode\deep-research-YYYYMMDD-HHMMSS）
 → 同时确定 TOOLSDIR（本 skill 的 tools/ 目录）、PROMPTSDIR（本 skill 的 prompts/ 目录）、SKILLDIR（本 skill 的根目录）
 → 读取本 SKILL.md + RULES.md + TYPES.md

══ Step 0 — Language Detection (output nothing before detection) ══

 → Clean topic: strip wrapper text, keep only the user's actual research topic
 → Determine language: analyze the cleaned topic and pick the ISO 639-1 code:
   zh (Chinese), en (English), ja (Japanese), ko (Korean), ru (Russian),
   ar (Arabic), hi (Hindi), vi (Vietnamese), th (Thai), tr (Turkish),
   es (Spanish), fr (French), de (German), pt (Portuguese), it (Italian),
   nl (Dutch), sv (Swedish), pl (Polish), id (Indonesian)
   → If unsure, default to "en".
   → Do NOT output anything during this step.
 → Write language code: use `write` tool to create {TMPDIR}/language.txt with the ISO code
 → Set `$LANG` = language code from the step above
   → **从这一行开始，所有面向用户的输出必须使用 $LANG 语言（不在 $LANG 列表中时默认 en）。SKILL.md 的指令文本不论用什么语言写的，只是供你阅读的上下文；实际输出以 $LANG 为准——你是读到中文指令后意识上翻译成 $LANG 再输出。**
   → Announce detected language to the user (single line, in $LANG, e.g. "🌐 Language detected: en")

### 🔔 语言自查清单（每次输出前执行）

☐ {TMPDIR}/language.txt 的值 = 我的 $LANG？ ☐ 我正准备输出的这一句/这段，是 $LANG 吗？ ☐ todo 条目是 $LANG 吗？ ☐ 给用户的进度通知是 $LANG 吗？ ☐ 我是否在无意识中用了指令文件的语言（如中文）而非 $LANG？如果任一答案为"否"→ 立即改写为 $LANG 再输出。

**硬规则**：task() 派发子 agent 时，其 prompt 中的 `{LANG}` 必须是你检测到的语言代码。子 agent 输出的语言由你负责保证。

══ 主流程 ══

 1. ══ 离线模式判定（Step 0.5） ══
    → 你已经读取了用户原始输入。用自然语言理解判断用户关于数据来源的意图，不要用关键词匹配：
      - 用户是否提到了本地文件/目录/资料？
      - 用户是否明确要求不要联网？
      - 用户是否明确要求联网补充？
    → 判断逻辑：
      - 提到本地文件 +（未说联网 / 不联网）→ 离线模式，跳过搜索
      - 提到本地文件 + 说"联网补充" → 正常流程（搜+读本地）
      - 未提本地文件 → 正常流程
    → 离线模式 + 有路径 → {TMPDIR}/offline_mode.txt，`offline_mode=true`，向用户报告单行说明
    → 离线模式 + 无路径 → 回复用户询问路径，不继续
    → 正常模式 → `offline_mode=false`

   → **模式解析**：从清洗后的主题中提取调研模式
     - 主题末尾是 ` -quick` → `$DEPTH_MODE=quick`，去除该后缀
     - 主题末尾是 ` -deep` → `$DEPTH_MODE=deep`，去除该后缀
     - 无上述后缀 → `$DEPTH_MODE=standard`（默认）

 2. 记录任务开始时间到 {TMPDIR}/start_time.txt
 3. todowrite 创建进度条目（使用 $LANG 语言）
  4. ══ Task 1 — 分析主题 + 生成大纲 ══
     → 读取 {PROMPTSDIR}/task1_outline.md，替换 {TMPDIR} {TOOLSDIR} {LANG} {CURRENT_YEAR} {MODE}，注入 prompt
     → **只做变量替换，不添加语言、格式、报告结构等额外指令。语言已由 Step 0 判定为 $LANG 并在 prompt 中替换 {LANG}。**
     → 派发 task()，等待完成
     → 用 `read` 确认 {TMPDIR}/outline.json 存在
     → 从 outline.json 读取 title + chapter_count + depth_mode
    → todowrite 标记完成
    → 向用户报告进度（使用 $LANG 语言）
  6. ══ Task 2 — 数据收集 + 结构化数据池 ══
     → 读取 {PROMPTSDIR}/task2_data_collection.md
     → 替换标准变量 {TMPDIR} {TOOLSDIR} {LANG} {COUNTRY}
     → 如果 `offline_mode=true`，额外替换：
       {OFFLINE_MODE} → true
       {LOCAL_PATHS} → 读取 {TMPDIR}/offline_mode.txt 的内容（路径列表）
     → 如果 `offline_mode=false`，替换 {OFFLINE_MODE} → false，{LOCAL_PATHS} → 空字符串
     → 派发 task()，等待返回
    → 如失败（task 报错或 task2_manifest.json 不存在），**自动重试 1 次**，重新派发。第二次仍失败则向用户报告并终止
     → 读取 {TMPDIR}/task2_manifest.json，提取 source_count + fact_count + search_engine + fetch_method + engines + free_fallback + english_fallback + unique_domains
    → todowrite 标记完成
    → 向用户报告进度（使用 $LANG 语言）
     7. ══ Task 3 — 派发章节撰写 ══
     → 读取 {TMPDIR}/outline.json 获取 chapters 数组；读取 {TMPDIR}/data-pool.json
     → **读取 `profiles.json` 获取当前模式的 `max_chars`**，计算 `per_chapter_chars = max_chars ÷ chapters.length`
     → 从 data-pool.json 提取所有唯一 (src, yr) 组合，按首次出现顺序预分配引用编号 [1], [2], [3]...，写入 {TMPDIR}/citation_map.json
     → 读取 `{PROMPTSDIR}/task3_chapter_agent.md` 模板
     → **根据 $LANG 裁剪 prompt 中的多语言段落**：
       - prompt 中的 `[LANG_en]` 段落：仅当 $LANG=en 时保留，其他语言删除
       - prompt 中的 `[LANG_zh]` 段落：仅当 $LANG=zh 时保留，其他语言删除
       - 删除标记文本本身（`[LANG_en]` `[/LANG_en]` 占位符行）
       - 无标记的段落全部语言通用，保留
      → **撰写模式**：所有平台统一使用并行模式撰写章节
        - **章节 agent 不做任何工具调用**（不跑 prepare-chapter、validate、manifest、word-count），只写文件

      → **并行派发章节**：
       - 初始化空列表 task_ids = []
       - For N = 1 to chapters.length:
         - 读取 outline.chapters[N] 的 title、sections
         - 从 data-pool.json 中筛选该章 sub_questions 对应的事实条目
         - **将事实直接嵌入 prompt**：每条事实前标注预分配的 `[N]` 编号
         - 调用 task(run_in_background=true) 并行派出每章
         - 从 task 返回的元数据中提取 background_task_id（格式 bg_xxx），追加到 task_ids
         - todowrite 标记该章 in_progress
       - 将 task_ids 写入 {TMPDIR}/task3_bg_ids.json（持久化，防止主 agent 中断后丢失状态）
       - 向用户报告："已并行派出 {N} 章，等待全部完成..."（使用 $LANG 语言）
       - **结束 response，等待系统通知。仅当收到 [ALL BACKGROUND TASKS COMPLETE] 通知时，才继续到 Round 2。中间的单章完成通知忽略不处理。**
       - 然后进入 Round 2：

       **Round 2 — 收集结果 + 失败重写**：
       - 读取 {TMPDIR}/task3_bg_ids.json 获取所有 background_task_id
       - For 每个 bg_task_id in task_ids:
         - 调用 background_output(task_id=bg_task_id) 收集章节结果
       - 用 `read` 逐一确认 {TMPDIR}/chapters/chapter-{N}.md 是否存在且非空
       - 如果有章节缺失或内容为空：
         - 记录失败章节编号列表
         - **串行重写**：对每个失败章节逐一重新派发 task(run_in_background=false)，同步等待完成
         - 再次用 `read` 确认
       - todowrite 标记每章 completed
       - 向用户报告最终章节完成情况（使用 $LANG 语言）
     8. ══ Task 4 — 验证 + 装配 + QA（**主 agent 直接执行**） ══
     → **Step 0 — 清理残留**：删除 {SKILLDIR}/reports/ 目录下所有 0 字节文件（前次装配失败的空壳）；创建 {SKILLDIR}/reports/$LANG/ 子目录（如果不存在）
     → **Step 1 — 批量验证**：`python {TOOLSDIR}/dr_tools.py validate-all-chapters --chapters-dir {TMPDIR}/chapters/ --chapters {chapter_count}`，内部 ThreadPoolExecutor 并行验证所有章节。从输出 JSON 的 `failed_chapters` 中找到失败章节，逐个重新生成（重新派发章节 agent → 重新验证该章）。
     → **Step 1b — 章节深度均衡检查**：`python {TOOLSDIR}/dr_tools.py depth-balance --chapters-dir {TMPDIR}/chapters/ --chapters {chapter_count}`。如果某章行数 < 平均值的 50%，标记告警（not blocking，仅提示）。
     → Step 1 或 Step 2 失败时，**先删除本次已写入的产物**（报告文件、中间文件等），再重新执行对应步骤，避免残留文件干扰下次运行
     → **Step 2 — 装配**：`python {TOOLSDIR}/dr_tools.py assemble-report --outline {TMPDIR}/outline.json --chapters-dir {TMPDIR}/chapters/ --datapool {TMPDIR}/data-pool.json --mode {depth_mode} --target-year {target_year} --output {SKILLDIR}/reports/$LANG/ --lang $LANG`
    → **$REPORT 提取**：从装配输出中提取 `Report assembled: ...` 行中冒号后的第一个路径，设为 `$REPORT` 变量
     → **Step 2b — 可信评估(数据层)**：`python {TOOLSDIR}/dr_tools.py generate-confidence-section --datapool {TMPDIR}/data-pool.json --manifest {TMPDIR}/task2_manifest.json --report "$REPORT" --lang $LANG`
       从输出中解析 `CONFIDENCE:` 行获取 `conf_coverage`、`conf_total_facts`、`conf_high_pct`、`conf_medium_pct`、`conf_low_pct`、`conf_actual_pct`、`conf_est_pct`、`conf_fct_pct`、`conf_auth_pct`、`conf_data_limited`、`conf_controversies`、`conf_adequate_subq`、`conf_total_subq`、`conf_score` 共 14 个变量。
     → **Step 2c — 可信评估(LLM判断)**：使用上一步的 14 个统计变量 + 报告标题（从 outline.json 读取）在 LLM 上下文内直接生成定性评估意见。
        - 输出必须使用 $LANG 语言，2-4 句，纯定性判断，不重复逐项明细中的具体数字
        - **语气校准（重要）**：本工具是开源信息综合项目，非付费研究报告。评估意见应遵循以下原则：
          - **总分决定基调**：score≥75 → 正面肯定为主；50-74 → 中性平衡；<50 → 温和提醒
          - **不说"缺陷""不足""未能"等负面措辞** → 改为"可进一步关注的方面""仍有补充空间"
          - **不说"无法获取""受限于"** → 改为"部分高频量化指标因商业敏感性未纳入公开讨论范围"
          - **不自我贬低**：不出现"门槛高""可信度大打折扣"等损害报告公信力的表述
          - **正面收尾**：最后一句必须是肯定整体参考价值的结论
          - **定位准确**：强调"综合公开信息形成的参考判断"而非"严谨学术研究"
        - 写出到 `{TMPDIR}/llm_assessment.txt`
        - 用 `edit` 工具将评估意见插入到报告可信评估区的 `**{综合评级标签}**` 行之后（追加 "**{评估意见标签}**：\n\n{文本}"），然后用 `read` 确认插入正确
        - `{综合评级标签}` 和 `{评估意见标签}` 使用语言映射表中的翻译
     → **Step 3 — 数据受限处理**：读取 {TMPDIR}/task2_manifest.json 的 `data_limited` 字段。如果为 true，在报告标题后插入数据说明声明，**使用 $LANG 语言**。
    → **Step 4 — 引用处理**：`python {TOOLSDIR}/dr_tools.py convert-citations --datapool {TMPDIR}/data-pool.json "$REPORT" --lang $LANG`（从 data-pool 构建参考章节，验证正文 `[N]` 引用均有对应条目）
    → **Step 4b — 货币符号转义**：`python {TOOLSDIR}/dr_tools.py escape-currency "$REPORT"`（将 `$` 转义为 `\$`，避免被知乎/Obsidian/Typora 等渲染器错误解析为 LaTeX math mode）
      → **Step 5 — QA**：`python {TOOLSDIR}/dr_tools.py qa-report "$REPORT" --mode {depth_mode} --target-year {target_year} --lang $LANG`，解析 JSON 输出，从 `checks.word_count.count` 取字数，从 `checks.word_count.limit` 取上限
     → **Step 6 — 更新本地报告列表页**：`python {TOOLSDIR}/generate_pages.py --local`（刷新 reports-browser/index.html，将 reports/ 下所有报告打包为嵌入 JS 的可浏览页面）——需在 `{SKILLDIR}` 目录下执行，bash 命令须加 `workdir="{SKILLDIR}"` 参数
     → todowrite 标记完成
    → ⏱ **强制计算总耗时**（读取 start_time.txt + 当前时间算差值）
    → 从 outline.json + task2_manifest.json + qa-report 中提取数据，使用 $LANG 语言汇报最终结果。

      **语言自适应标签映射表**（以下所有 <词> 根据 $LANG 替换）：

      | 中文 | en | ja | ko | fr | de | es | 其余语言 |
      |------|----|----|----|----|----|----|---------|
      | 执行总结 | Execution Summary | 実行サマリー | 실행 요약 | Résumé exécutif | Zusammenfassung | Resumen ejecutivo | Execution Summary |
      | 阶段 | Stage | 段階 | 단계 | Phase | Phase | Fase | Stage |
      | 详情 | Detail | 詳細 | 세부 | Détail | Detail | Detalle | Detail |
      | 大纲/Plan | Plan | 概要 | 개요 | Plan | Plan | Plan | Plan |
      | 观点速览/Insight | Insight | 洞察 | 인사이트 | Aperçu | Einblick | Perspectiva | Insight |
      | 数据/Data | Data | データ | 데이터 | Données | Daten | Datos | Data |
      | 报告/Report | Report | レポート | 보고서 | Rapport | Bericht | Informe | Report |
      | 章 | ch | 章 | 장 | chap. | Kap. | cap. | ch |
      | 来源 | sources | ソース | 출처 | sources | Quellen | fuentes | sources |
      | 事实 | facts | 事実 | 사실 | faits | Fakten | datos | facts |
      | 独立域名 | domains | ドメイン | 도메인 | domaines | Domains | dominios | domains |
| 行 | lines | 行 | 줄 | lignes | Zeilen | líneas | lines |
| 字 | chars | 語 | 단어 | mots | Wörter | palabras | chars |
      | 分钟 | min | 分 | 분 | min | Min. | min | min |
      | 生成时间 | Generated | 生成時刻 | 생성 시간 | Généré le | Erzeugt | Generado | Generated |
      | 搜索 | Search | 検索 | 검색 | Recherche | Suche | Búsqueda | Search |
| 数据充足 | Adequate | 十分 | 충분 | Suffisantes | Ausreichend | Adecuado | Adequate |
| 数据受限 ⚠ | Limited ⚠ | 制限 ⚠ | 제한 ⚠ | Limitées ⚠ | Eingeschränkt ⚠ | Limitado ⚠ | Limited ⚠ |
| 可信评估 | Confidence | 信頼性評価 | 신뢰도 평가 | Évaluation de confiance | Vertrauensbewertung | Evaluación de confianza | Confidence |
| 覆盖充足/部分覆盖/覆盖不足 | Full/Partial/Limited coverage | 完全/部分/不足カバー | 충분/부분/부족 | Couverture complète/partielle/limitée | Vollständige/Teilweise/Eingeschränkte Abdeckung | Cobertura completa/parcial/limitada | Adequate/Partial/Limited |
| 统计 | Stats | 統計 | 통계 | Statistiques | Statistiken | Estadísticas | Stats |
| 综合评级 | Rating | 総合評価 | 종합 평가 | Note globale | Gesamtbewertung | Calificación general | Rating |
| 评估意见 | Assessment | 評価意見 | 평가 의견 | Avis d'évaluation | Bewertung | Opinión de evaluación | Assessment |
| 耗时 | Duration | 所要時間 | 소요 시간 | Durée | Dauer | Duración | Duration |
      | 免费源补强 | free fallback | 無料補強 | 무료 보강 | sources gratuites | kostenlose Quellen | fuentes gratuitas | free fallback |
      | 本地文件 | local files | ローカル | 로컬 파일 | fichiers locaux | lokale Dateien | archivos locales | local files |

      **搜索策略描述拼接规则**（使用映射表中的翻译）：

      ```
      IF offline_mode=true:
        <搜索词>：{offline_$LANG}
      ELSE:
        engines_names = engines 数组元素大写（["searxng"] → "SearXNG"）
        desc = engines_names
        IF free_fallback=true: desc += " (+{free_fallback_$LANG})"
        IF english_fallback=true: desc += " (+EN)"
        <搜索词>：{desc}
      ```

      **数据质量徽标规则**：

      ```
      IF data_limited=true: <质量词> = {limited_$LANG}
      ELSE: <质量词> = {adequate_$LANG}
      ```

      严格按以下结构输出：

      ```
      📊 **<执行总结词>**

      | <阶段词> | <详情词> |
      |:----|:------|
      | 📋 <Plan词> | {outline.title} · {outline.chapter_count} <章词> · {outline.depth_mode} |
      | 🎯 <Insight词> | {outline.chapters[0].description} |
       | 📡 <Data词> | {task2_manifest.source_count} <来源词> · {task2_manifest.unique_domains} <独立域名词> · {task2_manifest.fact_count} <事实词> · <搜索词>：{search_desc} · {task2_manifest.fetch_method} |
       | 📄 <Report词> | {REPORT} |
       | 🌐 <浏览器词/Report List> | {SKILLDIR}/reports-browser/index.html |
       | ✅ <可信评估词> | <覆盖_{coverage_summary}> · 高置信{conf_high_pct}% · 已公布{conf_actual_pct}% · {conf_score}/100 · {data_quality_badge} → {llm_verdict} |
       | 📊 <统计词> | {qa_report.line_count} <行词> · {qa_report.word_count} <字词> · <耗时词>⏱ {totalMin} <分钟词> · <生成时间词>：{gen_time} |
      ```

      其中：
      - `{outline.chapters[0].description}` = 从 outline.json 读取第 1 章（核心观点）的 description 字段，作为观点速览摘要
      - `{gen_time}` = 读取 {TMPDIR}/start_time.txt 中的任务开始时间，格式化为 `YYYY-MM-DD HH:mm:ss`
       - `{REPORT}` 仅输出最终报告路径（`{SKILLDIR}/reports/{LANG}/xxx.md`），不包含任何 TMPDIR 中间路径
      - `{search_desc}` = 按搜索策略拼接规则生成，所有中文词根据 $LANG 翻译
       - `{data_quality_badge}` = 按数据质量徽标规则生成
       - `<覆盖_{coverage_summary}>` = 从 `task2_manifest.coverage_summary` 读取（adequate/partial/insufficient），用语言映射表中"覆盖充足/部分覆盖/覆盖不足"行对应翻译替换
       - `{conf_high_pct}`、`{conf_actual_pct}`、`{conf_score}` = 从 Step 2b 的 `CONFIDENCE:` 行解析对应的字段
       - `{llm_verdict}` = 读取 Step 2c 写入的 `{TMPDIR}/llm_assessment.txt` 完整内容
    → todowrite 全部完成

**禁止**：主 agent 不得在 Task 调度之间自行执行搜索引擎调用或数据处理。搜索/抓取归 Task 2，大纲生成归 Task 1，章节撰写归 Task 3，装配验证归 Task 4。Task 间的 handoff 文件读取（outline.json、task2_manifest.json 等）不受此限。

---

## 2. Task 1 — 主题分析 + 大纲

**工具**：`task()` | **一次调用**
**prompt 文件**：`prompts/task1_outline.md`
**用法**：读取文件内容，替换 `{TMPDIR}` `{TOOLSDIR} {LANG} {CURRENT_YEAR}` 为实际值后注入 prompt。

**输出**：大纲 agent 直接用 `write` 工具创建 `{TMPDIR}/outline.json`。主 agent 通过 `read` 确认文件存在。

---

## 3. Task 2 — 数据收集 + 结构化数据池（unspecified-high）

**工具**：`task(category="unspecified-high", load_skills=[], ...)`
**prompt 文件**：`prompts/task2_data_collection.md`
**用法**：读取文件内容，替换 `{TMPDIR}` `{TOOLSDIR}` `{LANG}` `{COUNTRY}` `{OFFLINE_MODE}` `{LOCAL_PATHS}` 为实际值后注入 prompt。

**输出**：{TMPDIR}/data-pool.json + {TMPDIR}/task2_manifest.json（使用 `write` 工具创建）

**LANG→COUNTRY 映射**（用于替换 `{COUNTRY}`）：zh→CN, en→US, ru→RU, ja→JP, ko→KR, fr→FR, de→DE, es→ES, pt→PT, it→IT, nl→NL, sv→SE, pl→PL, id→ID, th→TH, tr→TR, vi→VN, ar→SA, hi→IN。未覆盖的语言用空字符串。

---

## 3. Task 3 — 章节撰写 & 章节 agent 指令模板

主 agent 在循环中为每章调用 `task()` 时，prompt 参数使用 `{PROMPTSDIR}/task3_chapter_agent.md` 模板。

**用法**：读取 `{PROMPTSDIR}/task3_chapter_agent.md`，替换以下变量：
- `[章节 title]` → 当前章的 title（从 outline.json chapters 数组读取）
- `[N]` → 当前章节编号（第 1 章为 1，第 2 章为 2...）
- `[total]` → chapters 数组总长度
- `[sections 列表]` → 当前章的 sections 数组（逗号分隔）
- `{per_chapter_chars}` → `profiles.json` 中当前模式的 `max_chars ÷ 总章数`（主 agent 一次性算好）
- `{min_paragraphs}` → `profiles.json` 中当前模式的 `min_paragraphs`
- `{调研模式}` → quick / standard / deep（当前调研模式）
- `{TMPDIR}` → 运行时临时目录
- `{TOOLSDIR}` → tools 目录

**输出**：{TMPDIR}/chapters/chapter-{N}.md（使用 `write` 工具创建）

---

## 4. Task 4 — 验证 + 装配 + QA（主 agent 直接执行）

装配、引用转换、QA 检查均由主 agent 通过 bash 命令直接执行 `{TOOLSDIR}/dr_tools.py` 完成：

1. `validate-all-chapters` → 批量结构验证（并行）
2. `assemble-report` → 生成报告
3. `generate-confidence-section` → 可信评估（从 data-pool + manifest 聚合生成）
4. `convert-citations` → 引用转换
5. `escape-currency` → 货币符号转义
4. `qa-report` → 质量检查

**清理**：装配完成后主 agent 执行 `Remove-Item -Recurse -Force "{TMPDIR}"` 清理临时文件。

---

## 6. 输出文件管理

### 路径优先级

最终报告保存路径按以下优先级判定：

1. **用户自定义路径** — 如果用户显式指定了输出目录（如 `D:\Reports\`），使用指定路径
2. **Skill 默认路径** — `{SKILLDIR}/reports/`（skill 根目录下的 reports/）

装配阶段（Step 3）根据实际使用的路径写入，文件名格式不变：`<主题>-YYYYMMDD-HHmmss.md`。

### QA 路径核验

Step 4 QA 必须确认报告文件的保存路径为上述两者之一，如果路径不属于默认目录且非用户指定目录，标记"路径异常"不通过。

### 日期锚定

文件名中的日期用当前年月日。

### 清理机制

Task 4 装配 + QA 通过后，内部已完成清理：

清理中间文件 {TMPDIR} 目录：Windows 用 Remove-Item -Recurse -Force "{TMPDIR}"，Linux 用 rm -rf {TMPDIR}
确认 tool-output/ 无残留


---

## 7. 工具依赖速查

| 工具 | 用途 | 免费？ | 国内源？ |
|:----|:-----|:-----:|:--------:|
| `websearch` | **主力**搜索引擎（CLI 内置 Exa，运行时探测） | ✅ 共享免费（Exa） | ❌ 国外引擎 |
| `searxng` | 搜索引擎（自定义 SearXNG，运行时探测） | ✅ 自建零费用 | ✅ 70+引擎含百度/搜狗 |
| 其他搜索引擎 | 不同 CLI 工具的内置搜索（运行时自动适配） | 取决于环境 | — |
| `scrapling_bulk_get/stealthy/fetch` | 全文抓取（MCP，依赖 opencode.json 注册） | ✅ | **✅ 推荐，国内源主力** |
| `webfetch` | 抓取回退（Scrapling 不可用时替代） | ✅ | ❌ 远端受限，国内源效果一般 |
| `bash` | date 时间戳 / 文件操作 | ✅ | — |
| `write` | 写文件 | ✅ | — |

搜索策略由 agent 在运行时根据工具集**自动适配**，不依赖预设的搜索引擎配置。

**搜索链路**：

Layer 0 — CLI 内置引擎探测（扫描可用工具集） │ ├─ 发现内置引擎 → 作为主力搜索，与后续层并行 └─ 未发现 → 跳过此层，不影响后续

Layer 1 — 大纲建议源（SearXNG site:定向搜索）+ Layer 2 — SearXNG 全网补充搜索并行 ↓ Layer 3 — sources.json 优质源搜索（并行） ↓ 搜索结果质量评估（Step 3 质量门） ├─ 达标 → 直接进入抓取 └─ 不达标 → Layer 4 免费源补强（A/B 类源 + 区域引擎） ↓ 全部 URL → 检测 Scrapling MCP 可用性 ├─ 🔧 可用 → Scrapling 批量抓取全文 → 数据池 └─ 🌐 不可用 → webfetch 逐个抓取全文（标注回退）→ 数据池


---

## 8. 安装与配置

### 前置条件

- Python 3.10+
- Scrapling（安装方式由 AI 根据官方文档和当前系统自动适配）
- Playwright（可选，用于 JS 渲染和反检测抓取）

### 注册 Scrapling MCP Server

Scrapling 通过 MCP（Model Context Protocol）与 AI agent 通信，需注册到 `opencode.json` 后才能被 agent 调用。

**推荐方式**：运行一次 `/research`，Task 2 在检测到 Scrapling 未注册时，会自动完成安装和注册。

**参考实现**：本项目提供了 `scrapling-mcp-server.py`（与本文件同目录），是一份标准 MCP Server 实现，覆盖了标准抓取、反检测抓取、JS 渲染抓取三种模式。AI 可根据本机环境参考此脚本，如有问题再参考 Scrapling 官方文档。

**手动注册格式**（在 `opencode.json` 的 `mcp` 中添加，供 AI 安装时参考）：
  ```json
  {
    "mcp": {
      "scrapling": {
        "type": "local",
        "command": ["<python-path>", "<mcp-server-script-path>"],
        "enabled": true
      }
    }
  }

注意：OpenCode 使用 "mcp" 键（数组格式 command），非 Claude Desktop 的 "mcpServers"

重启 OpenCode

MCP Server 在 OpenCode 启动时加载，注册后必须重启才能生效。

验证是否生效

运行 /research 调研时，Task 2 阶段如显示 🔧 Scrapling 抓取 则表示 MCP 工作正常。若显示 🌐 webfetch 抓取（Scrapling 已自动安装，重启后生效） 则表示 Scrapling 已自动安装，重启 OC 后下次生效。若显示 🌐 webfetch 抓取 则表示安装失败，需检查 Python 环境和网络连接。

抓取回退说明

若 Scrapling 抓取某 URL 失败（WAF/超时/JS 渲染需求），会自动回退到 webfetch 孤立抓取该 URL，不影响其他 URL 的 Scrapling 抓取。若 Scrapling MCP 完全不可用，则全部走 webfetch。调研不会阻塞。

9. 跨平台编码规范（Windows/macOS/Linux）

问题根因

Windows PowerShell 5.1 控制台编码为 CP936（GBK 中文编码），无法表示 18 种非英语语言：俄语西里尔字母、日语假名/汉字、韩语谚文、阿拉伯语、泰语、印地语天城文、越南语调号、以及德语 äöüß、法语 éèêç、西班牙语 ñ 等拉丁扩展字符——通过 shell 传参/pipe 时全部损坏。

macOS/Linux 的终端默认 UTF-8，无此问题。

硬性规则（所有 agent 必须遵守）

#	规则	正确做法	错误做法
1	非 ASCII 文本不进 shell argv/pipe	用 `write` 工具写文件 → Python `--file` 读取	Python 脚本 argv 传非 ASCII 文本 ❌
2	所有文件读写用 UTF-8	Python 统一 `encoding='utf-8-sig'`（BOM 容错）	依赖 shell 编码
3	写文件只用 `write` 工具	`write` 工具 → UTF-8 无 BOM	PowerShell `Set-Content -Encoding UTF8` ❌（会加 BOM）
4	Python stdout 显式设 UTF-8	`sys.stdout.reconfigure(encoding='utf-8')`	依赖系统默认编码
5	Python 子进程输出用 `--output` 文件	`python script.py --input file --output result`	shell 重定向 `> result.txt` ❌（CP936 编码输出）

一劳永逸方案：全链路编码安全架构

 ┌─ 数据来源 ──────────────────────────────────┐
 │ write 工具 / Python open(..., 'w', encoding) │ ← UTF-8 无 BOM
 └──────────────┬──────────────────────────────┘
                ▼
 ┌─ 中间文件 ──────────────────────────────────┐
 │ *.json / *.md : 全部 UTF-8（BOM 容错读取）     │ ← utf-8-sig 代码编
 └──────────────┬──────────────────────────────┘
                ▼
 ┌─ Python 处理 ───────────────────────────────┐
 │ 所有脚本入口设 `stdout.reconfigure('utf-8')` │ ← 输出安全
 │ 所有文件读用 `encoding='utf-8-sig'`         │ ← 输入安全
  │ Python 脚本统一用 `--input`/`--output` 参数   │ ← 完全绕过 shell
 └──────────────┬──────────────────────────────┘
                ▼
 ┌─ 最终输出 ──────────────────────────────────┐
 │ 报告文件 : UTF-8 无 BOM，任意语言均可正确显示    │
 └─────────────────────────────────────────────┘

当前防护状态

文件	防护措施	状态
`dr_tools.py`	入口 `stdout.reconfigure` + 所有读操作用 `utf-8-sig`	✅
`dr_check.py`	所有读操作用 `utf-8-sig`	✅
`dr_gen.py`	所有读操作用 `utf-8-sig`，写操作用 `utf-8`（无 BOM）	✅

Created by hoolulu · github.com/hoolulu/deep-research

deep-research Skill

深度调研报告生成 Skill — 一条命令，十分钟出券商级深度调研报告

多 Agent 自动搜索、抓取、撰写、质检——输入主题，输出可引用、可浏览、可导出的中文/多语言调研报告。

对标券商/第三方研究机构结构：结论先行、来源可追溯、反方视角、情景预测。支持 quick / standard / deep 三档模式，19 种语言随主题自动切换。

适合行业研究、趋势前瞻、竞品扫描、政策解读、技术专题、投研备忘——不是搜几条摘要，是交付一份能拿去用的报告。

当前版本： 查看更新

📂 浏览所有示例报告 → H33研报· 深度调研报告集可筛选、排序、按语言和类型浏览所有示例报告。

✨ 一分钟看懂

是全程以设定语言与你交互，并搜索目标语言的资料，不是简单的翻译输出。

一、为什么你需要这个

让 AI 帮你做调研，你大概率碰过这些坑：

搜索 + 总结 → 太浅，出来几条摘要，没有纵深
行业报告按份收费 $50–500+ → 太贵，个人用不起
海外工具 → 搜不到国内资源如：百度百科、知乎、199IT、艾瑞
AI 编数字 → 看起来合理，但找不到来源

这个 skill 走完 4 层流程才交报告。不是搜完就出，是析→搜验→写→验。

二、谁适合用

独立开发者、独立研究者、小团队。需要专业级调研能力，但不想依赖付费数据库或研究机构的人。

三、一次标准模式调研的输出

指标	数据（standard 模式示例）
报告长度	500-700 行 / 约 12,000-20,000 字（视语言浮动）
数据表	15-25 张，覆盖市场规模、竞争格局、技术参数等多个维度
分析段落	80-120 段（每段含结论 + 数据 + 因果 + 判断）
引用的独立机构	15-25 家（中国信通院、艾瑞咨询、国家统计局、百度百科、知乎、36氪、澎湃新闻等）
反方观点	3-8 处，每章至少呈现一个争议或反对角度
数据收集	~1-3 分钟
报告生成	~8-15 分钟
总耗时	~10-20 分钟

以上为 standard 模式典型范围，实际因主题复杂度、数据可获取性、搜索引擎响应等因素有所浮动。|

📖 精选报告展示

报告主题	话题标签
长江三角洲与珠江三角洲：中国两大经济引擎的地理比较	地理 · 经济
郑和下西洋：为什么中国在 15 世纪放弃了海洋？	历史 · 航海
玛雅文明崩溃之谜：干旱、战争还是生态超载？	历史 · 文明
2026年中国新能源汽车行业展望	汽车 · 产业
火星移民的工程现实：从 SpaceX 到 ISRU 到辐射防护	航天 · 科技

点击报告标题可在新窗口打开阅读。

四、成本

组件	费用
LLM（你已经在用的）	DeepSeek v4 Flash 基准：quick 约 10–15 万 token / < 0.2 元，standard 约 15–30 万 / < 0.4 元，deep 约 30–50 万 / < 0.7 元
SearXNG 搜索（作者部署）	已部署在 VPS，零费用，无限畅用
Scrapling 抓取	纯本地运行，零费用
国内源（百度百科/维基百科/知乎/36氪/澎湃/199IT/艾瑞/东方财富/国统局等）	直连零费用，不要代理
OpenCode 运行时	MIT 开源，零费用

以上估算基于 DeepSeek v4 Flash（$0.14/百万输入、$0.28/百万输出，来源：https://api-docs.deepseek.com/quick_start/pricing）。实际因缓存命中率与主题复杂度浮动。

五、工作逻辑

整个流程分 4 个阶段，按顺序自动执行：

① 分析大纲 — 分析主题，生成调研框架和搜索计划
         ↓
② 采集数据 — ╭─ 在线模式：五层搜索并行（CLI 内置引擎 → 建议源 → SearXNG → sources.json → 免费源）→ Scrapling 批量抓取 → 数据池
               ╰─ 离线模式：直接读取本地文件（PDF/DOCX/TXT/MD）→ 数据池
         ↓
③ 并行撰写 — 所有章节同时撰写，事实直接嵌入 prompt，不做工具调用
          ↓
④ 验收装配 — 批量 validate → assemble-report → convert-citations → escape-currency → qa-report

六、搜索链路与内置资源

搜索采用 五层优先级 策略，全部并行发出：

Layer 0 — CLI 内置引擎（如 OpenCode 的 Exa websearch，运行时自适应）
Layer 1 — 大纲建议源（按主题定向推荐，如 arctic-council.org）
Layer 2 — SearXNG（作者部署，70+ 引擎）
Layer 3 — sources.json（skill 内置 30+ 优质源，启动时健康检测）
Layer 4 — 免费源补强（A/B 类搜索兜底）

所有层的结果合并去重，由 Scrapling 统一抓取全文。免费源补强仅在 Layer 0-3 结果不足时触发（独立来源 < 8 或全部 URL 来自 ≤3 个域名）。

sources.json 覆盖学术（Semantic Scholar / arXiv / PubMed / Nature）、数据（World Bank / IMF / Our World in Data）、新闻（Reuters / BBC / Guardian）、中文（百度百科 / 知乎 / 36氪 / 澎湃 / 艾瑞 / 东方财富 / CSDN 等）30+ 个源，启动时自动健康检测，死源跳过。

七、报告独特亮点

维度	说明
多语言专业行文	自动检测主题语言，以 19 种语言直接撰写报告，非翻译模式
每个数字有来源	正文标注 `(N)` 可点击引用，文末附参考来源列表。找不到来源的数字不写
正反观点并存	每章呈现争议和反对观点，不回避矛盾
置信度分级	末章汇总表（高/中/低），什么可靠什么有争议一目了然
数据防坑机制	自动识别常见数据错误——单位搞混、数据造假、张冠李戴，不让有问题的数据混进报告
段落重于行数	每章 8-12 段正文为核心，表格和空行灌不了水

八、三种深度

命令	用途	最少章数	最少段落/章	参考字数（字符）	参考耗时
`/research 主题`	standard 默认	8	≥ 5	≈ 25,000	~10–15 min
`/research 主题 -quick`	快速洞察	5	≥ 4	≈ 15,000	~8–12 min
`/research 主题 -deep`	极致深度	10	≥ 6	≈ 45,000	~15–25 min

参数见 profiles.json，修改后重启生效。字数为去空格和 Markdown 语法的纯字符数。

九、安装

🧠 方式一：AI 傻瓜安装（推荐）

把下面这段提示词复制到 OpenCode 聊天框发送，AI 会自动完成一切：

请调研 https://github.com/hoolulu/deep-research 项目，按照文档要求依次完成：

1. 安装前置依赖（根据 Scrapling 官方文档和你的操作系统确定安装方式）
2. 注册 Scrapling MCP Server，确保重启 CLI 后正常使用
3. 注册 /research 和 /research-update 命令

每完成一步都确认结果，完成后读取 VERSION 确认版本号，并总结安装状态。

AI 会读取项目文档→理解系统类型→逐项安装→验证可用性。不需要手动执行任何命令。

🔧 方式二：非 OpenCode 用户（Claude Code / Codex CLI / Cursor 等）

把这段提示词粘贴到你的 AI 编码工具中：

请调研 https://github.com/hoolulu/deep-research 项目，自动安装前置依赖并改造适配当前 CLI 工具：

1. 安装 Python 和 Scrapling（参考 Scrapling 官方文档和系统确定方式）
2. 注册 Scrapling MCP Server，重启后生效
3. 根据当前工具的能力注册 /research 和 /research-update 的等价入口：
   - **Codex CLI** → 注册为 skill（skill 目录 `command/` 已含命令文件，注册后自动生效）
   - **Claude Code** → 注册为 slash command（Hook）
   - **Cursor** → 按平台机制适配（自定义命令 / Agent rules）
   - 其他工具先判断有无 skill/命令机制，再选最合适的方式
4. 将多 agent 链式架构（大纲 → 数据采集 → 并行撰写 → 装配QA）翻译为当前工具的等价实现
5. 若本机有多个 CLI 工具，只配置当前工具，不影响本机其他 CLI 工具。

每完成一步确认结果，完成后读取 VERSION 确认版本号并总结状态。

不同工具的适配点：多 agent 编排需映射到各自的原生机制（Claude Code 的 sub-agent、Codex CLI 的 agent/skill 模式、Cursor 的 agent 模式等），命令入口注册方式也不同（OpenCode/Codex CLI 使用 skill，Claude Code 使用 Hook/命令，Cursor 使用自定义指令）。搜索和抓取逻辑（python-scrapling + 搜索 API）可原样复用。

前置依赖

组件	在线模式	离线模式	获取方式
LLM 运行时（OpenCode / Claude Code / Codex CLI / Cursor 等）	✅ 必须	✅ 必须	选择你习惯的工具即可
Scrapling	✅ 必须	❌ 不需要	网页抓取用，离线模式不涉及
SearXNG（作者部署，70+ 引擎）	✅ 使用	❌ 不需要	内置默认端点，开箱即用

平台说明：OpenCode 原生支持多 agent 编排（Task 1-4 的多 agent 架构），无需额外插件。其他编程工具（Claude Code、Cursor、Codex CLI 等）有自己的原生多 agent 框架，可以直接适配本 skill 的工作流。离线模式下仅依赖 LLM 的文件读取能力，无需搜索/抓取组件。

十、使用方法

安装并重启 OpenCode 后，在聊天框输入：

命令	说明	参考耗时
`/research 你的主题`	standard 模式（在线搜索）	~10-15 min
`/research 你的主题 -quick`	quick 模式（在线搜索）	~8-12 min
`/research 你的主题 -deep`	deep 模式（在线搜索）	~15-25 min
`本地资料调研`	离线模式（读本地文件）	取决于文件大小
`/research-update`	检查更新	—

本地资料调研：具体指令词见 FAQ 第 2 节《如何使用本地资料生成报告？》。

发送后会发生什么

整个流程自动运行，你不需要做任何操作：

① 分析大纲 — 分析主题，生成调研框架和搜索计划（含 source_suggestions 定向源推荐）
② 采集数据 — 五层搜索并行（CLI内置引擎→建议源→SearXNG→sources.json→免费源）→ Scrapling 批量抓取 → 数据池提取 → 数据质检
③ 并行撰写 — 所有章节同时撰写，事实直接嵌入 prompt，不做额外工具调用
④ 装配验收 — 批量 validate → assemble-report → convert-citations → escape-currency → qa-report

以上累计 ~10-20 分钟。复杂主题可能延长，简单主题可能缩短。

输出文件

报告以 Markdown 格式保存到 skill 目录下的 reports/ 文件夹，文件名包含日期时间戳：

~/.opencode/skills/deep-research/reports/

可以用任何 Markdown 阅读器（Typora / Obsidian / VS Code 等）打开。

你也可以指定报告的存放路径，让 AI 帮你修改。

本地报告列表页：每次调研完成后，AI 自动刷新 reports-browser/index.html。直接用浏览器打开（支持 file:// 协议），所有报告以表格展示，支持搜索、按语言/深度筛选、排序，点击标题在弹窗中预览。

十一、FAQ

1. 搜索额度？怎么保证搜索不中断？

系统采用 五层搜索 + 质量触发补强 架构：

Layer 0 — CLI 内置引擎（新增）：运行时自动探测当前 CLI 工具的内置搜索引擎（如 OpenCode 的 websearch Exa）。如果可用，以此为主力搜索引