by Stars-OC
适用于 Claude Code / Agent 的论文写作 Skill (论文.SKILL)。涵盖论文内容、数据库ER图、整体流程图生成。针对本科论文进行aigc率降低、降重的优化,助力毕业设计高质量生成。
# Add to your Claude Code skills
git clone https://github.com/Stars-OC/thesis-creatorGuides for using ai agents skills like thesis-creator.
面向中国本科生的毕业论文全流程写作辅助系统。
[!IMPORTANT] 工作区隔离原则:AI 始终在用户项目目录下的
thesis-workspace/工作。所有产出文件都在用户工作区内。
| 触发语 | 执行动作 | |--------|----------| | 「帮我写论文,主题是…」 | 全流程(Step 0-9) | | 「帮我降重这段文字:…」 | 仅 Step 5 | | 「降低这段的 AIGC 率:…」 | 仅 Step 6:必须输出“处理前计划 → 改写文本 → 清单自检”,并按场景化重写、自然承接、轻冗余控制和高密度句拆解处理,不得只给改写结果 | | 「检测这段文字的 AIGC 率」 | AIGC 检测 | | 「帮我生成论文大纲」 | Step 0-3 | | 「初始化工作区」 | Step 0(工作区不存在直接初始化) | | 「继续」 | 仅在当前步骤的强制交互点、前置校验和质量门禁均已满足后继续流程 | | 「生成摘要」 | Step 4(仅摘要部分) | | 「生成图片」「生成图表」 | Step 8 | | 「导出 Word」「导出文档」 | Step 9 | | 「一键导出」 | Step 8+9 |
flowchart LR
A[Step 0: 初始化] --> B[Step 1-2: 准备]
B --> C[Step 3: 大纲]
C --> D[Step 3→4: 文献搜索与建池]
D --> E[Step 4: 撰写]
E --> F[Step 5-6: 降重]
F --> G[Step 7: 合并检测]
G --> H[Step 8: 图片生成]
H --> I[Step 9: 导出Word]
⚠️ 流程顺序:大纲确认 → 文献搜索与建池 → 正文写作 → 合并 → 图片生成 → 导出 Word 状态文件路径:
thesis-workspace/.thesis-status.json若文件不存在,status_manager.py会自动创建。推荐统一入口:
scripts/lifecycle.py(整合日志 + 状态管理)
[!IMPORTANT] 「继续」不是跳过按钮。 若当前流程仍存在强制交互点、前置校验或质量门禁未完成,则必须先完成对应动作,再允许进入下一步。
python scripts/lifecycle.py --workspace thesis-workspace/ --check-workspace,并检查 thesis-workspace/references/prompt/background.md 是否已补全;工作区必须通过脚本初始化并生成 thesis-workspace/.thesis-config.yaml、thesis-workspace/.thesis-status.json、thesis-workspace/logs/、thesis-workspace/scripts/charts/render.py、thesis-workspace/workspace/final/images/sources 与 thesis-workspace/workspace/references/images.yaml;未完成时只能提示用户编辑,禁止直接推进到 Step 1/3。ref_id 在终稿中重复出现,必须硬阻断并回退修正,禁止带重复引用进入 AIGC 检测;若 AIGC 检测未通过,必须回退到 Step 5/6 继续改写与审校,禁止进入 Step 8 图片生成或 Step 9 导出。.dot/.mmd/.puml → 渲染 PNG → 回填 [image_N] → 完整性验证”执行;使用 scripts/charts/manifest_builder.py、source_writer.py、render.py、markdown_updater.py、validate.py,最终已渲染 AI 图片不得残留 [image_N]。| 步骤 | 说明 | 详细文档 |
|------|------|----------|
| Step 0 | 工作区初始化 | workflows/step_0_init.md |
| Step 3 | 生成论文大纲 | workflows/step_3_outline.md |
| Step 4 | 分章节撰写 | workflows/step_4_writing.md |
| Step 6 | 审校润色 | workflows/step_6_review_polish.md |
| Step 7 | 合并与检测 | workflows/step_7_merge_detect.md |
| Step 8 | 图片生成与渲染(ER图默认读取 background.md,优先输出教科书风格 DOT,信息不足时尽量生成并 warning) | workflows/step_8_image.md |
| Step 9 | 文档导出 | workflows/step_9_export.md |
| 参考文献 | 文献池管理 | workflows/reference_workflow.md |
核心改进:文献池独立存放在
workspace/references/verified_references.yaml文献校验状态:verified_doi / verified_metadata_only / broken_doi_metadata_ok / missing_doi_unverified / invalid_reference规则说明:无 DOI 不等于假文献;允许通过元数据验证的真实文献继续进入文献池。
[image_1]、[image_2] 等格式workspace/references/images.yamlworkspace/references/images.yaml 必须采用结构化字段,至少包含 id、title、chapter、section、source、diagram_type、engine、purpose、fact_source、placement、status、description、source_file、output_file、render_status;可选 prompt_hint 用于指导大模型生成源码[image_N] 与 image-requirement 图片需求块,Step 8 再生成 images.yaml、准备源码文件、由大模型填写 .dot/.mmd/.puml、渲染 PNG 并回填 Markdown 图片引用source=user 和待补状态.puml);ER 图 → Graphviz DOT (.dot);架构图/模块图 → Mermaid (.mmd);用户截图 → user请生成一个用于毕业论文的PlantUML流程图,主题为“{{图表主题}}”。要求:
- 使用activity diagram
- 所有节点使用中文
- 起止节点使用“开始”“结束”
- 逻辑严谨,体现完整业务流或上下文流转机制
- 包含必要循环(如存在用户持续操作、重试或追问)
- 避免语法歧义(防止被解析为class diagram)
- 图结构简洁,不超过3层嵌套
- 判断分支连线必须明确标注 Y/N
- 全图只保留一个最终结束节点,所有分支和普通路径最终汇入该结束节点
- 适合论文插图展示
只输出PlantUML代码。
thesis-workspace/workspace/final/images/sources/ 对应 .puml/.dot/.mmd 文件,而不是在控制台直接输出完整图表源码;仅在用户明确要求“只输出代码”时,才直接返回源码文本。scripts/references/reference_merger.py)workspace/references/verified_references.yamlref_id 被正文使用一次,就必须标记为已占用,后续章节不得重复使用;Step 7 发现重复 ref_id 必须硬阻断yaml.safe_load() 读取详见 workflows/reference_workflow.md
thesis-workspace/
├── README.md # 工作区使用说明
├── .thesis-config.yaml # 配置文件
├── references/ # 参考资料(用户放入)
│ ├── templates/ # 学校模板
│ ├── examples/ # 范文
│ ├── guidelines/ # 规范
│ └── prompt/background.md # 论文背景(必填)
├── workspace/ # 论文产出
│ ├── outline.md # 大纲
│ ├── references/ # 参考文献池(独立)⭐
│ │ ├── verified_references.yaml # 已验证文献池
│ ├── cited_references.json # 引用记录(每章引用的ref_id)⭐
│ ├── drafts/ # 初稿(仅含临时引用编号,无参考文献列表)⭐
│ │ ├── 参考文献.md # 合并阶段生成的参考文献(独立MD文件,GB/T 7714格式)⭐
│ ├── final/ # 终稿
│ │ ├── 论文终稿.md # 终稿(引用编号已重排)
│ │ ├── 论文终稿.docx
│ │ └── images/ # 图片
│ └── reports/ # 报告
├── logs/ # 日志
└── .thesis-status.json # 状态
⭐ 标记为本次更新新增或变更的文件
| 问题 | 影响 | 处理 |
|------|------|------|
| 缺少规定动作章节 | 致命 | 自动补充 |
| 设计实现未分离 | 致命 | 强制拆分 |
| 章节顺序错误 | 致命 | 强制调整为:系统分析→系统设计→系统实现→系统测试→总结与展望 |
| 使用 LLM 上下文合并文档 | 致命 | 必须使用 merge_drafts.py 脚本 |
| 图表不足 | 严重 | 提示补充 |
| 数据库表数量不足 | 严重 | 检查 background.md 表定义,确保 ≥11 张表 |
| 未执行状态管理脚本 | 致命 | 每个 Step 必须通过 lifecycle.py 或 status_manager.py 记录状态,禁止大模型自行维护状态 |
| 日志未通过脚本记录 | 严重 | 所有流程日志必须通过 logger.py 输出,禁止大模型自行生成日志内容 |
| 文献链接 404 | 严重 | 合并前执行 reference_validator.py --check-404,404文献必须替换 |
| 图片文件缺失 | 严重 | Step 8 完成后检查 images/ 目录,所有占位符必须有对应 PNG 文件 |
| 参考文献虚构 | 严重 | DOI验证+重生成 |
| 参考文献数量超标 | 严重 | 按相关度截取 |
| 参考文献缺少中英文 | 严重 | 中文和英文文献都必须包含,缺少则触发补充搜索 |
| 参考文献 YAML 解析失败 | 严重 | reference_merger.py 必须使用安全 YAML 输出,特殊字符标题保存后仍可 yaml.safe_load() |
| 中文文献比例不足 | 严重 | 自动源不足时提示从 CNKI、万方、学校图书馆人工补充真实中文文献,禁止伪造 |
| 引用复用同一 ref_id | 严重 | 同一篇文献整篇仅允许引用一次,发现重复占用必须硬阻断并回流补池改写引用 |
| AI模板词超标 | 中等 | 按 Step 6 的 AIGC 标准流程处理:先做处理前计划,再按“场景化重写 → 结构重组 → 细节注入 → 自然承接与轻冗余 → 高密度句拆句解释 → 语言去模板化”改写,最后输出清单自检;禁止只做同义替换、删词式压缩或只给改写结果 |
| AIGC 降低缺少自检清单 | 严重 | 必须补齐处理前计划、改写文本、自检表;自检项出现“未通过”时继续局部修正,不得交付为最终版 |
| 章节内自建参考文献列表 | 中等 | 删除,合并阶段统一生成 |
| background.md 为空或未完善 | 致命 | 提示用户编辑 thesis-workspace/references/prompt/background.md,禁止控制台交互式输入 |
| ER 图事实源不一致 | 严重 | Step 8 的 ER 图默认读取 background.md,仅 ER 图受 thesis-workspace/.thesis-config.yaml 的 er_modeling 配置影响,优先输出教科书风格 DOT,且 DOT 输出不要显式使用 label= |
| 文件 | 说明 | 加载时机 |
|------|------|----------|
| prompts/writer_guidelines.md | 写作规范 | Step 4 |
| prompts/aigc_reducer_prompt.md | AIGC 表达质量优化与深度人工化流程,按场景化重写、自然承接、轻冗余控制和高密度句拆句解释执行 | Step 6 |
| prompts/humanizer_guidelines.md | 人工化改写细则与风险边界,约束自然过渡、轻冗余和拆句解释不得破坏学术语体 | Step 6 |
| prompts/reference_citation_prompt.md | 引用铁律 | Step 4 |
| workspace/references/verified_references.yaml | 文献池 | 必须加载 |
| 文件 | 说明 |
|------|------|
| scripts/references/reference_engine.py | 多源搜索 + DOI验证 |
| scripts/references/reference_merger.py | 文献合并去重 + 选出最相关 x 篇 |
| scripts/document_exporter.py | Word导出 + 图片插入 |
| scripts/merge_drafts.py | 章节合并 |
| scripts/aigc/detect.py | AIGC检测 |
| scripts/aigc/technical_detect.py | 技术论文 AIGC 检测 |
| scripts/charts/manifest_builder.py | 从正文 [image_N] 与 image-requirement 生成或更新 images.yaml |
| scripts/charts/source_writer.py | 根据 images.yaml 准备并校验 .mmd/.dot/.puml 源码文件 |
| scripts/charts/render.py | 按 Mermaid、Graphviz、PlantUML 渲染 PNG |
| scripts/charts/markdown_updater.py | 将已渲染图片回填为 Markdown 图片引用 |
| scripts/charts/validate.py | 校验源码、PNG、占位符和用户待补截图状态 |
致谢生成位于 Step 4(与摘要同阶段),输出文件为 workspace/drafts/致谢.md,由 merge_drafts.py 在合并阶段自动纳入终稿。
注意:致谢不计入七章正文结构,但属于论文交付的必备内容之一。
面向中国本科生的毕业论文全流程写作辅助系统
从选题到交稿,一句话搞定
论文创作 Agent 系统是一个基于 Claude Code 的毕业论文写作辅助工具。通过智能化的 10 步工作流,帮助本科生高效完成毕业论文创作,同时提供降重优化、AIGC 检测和文献真实性验证功能。
| 特性 | 说明 | | :---------------- | :----------------------------------- | | 🔄 全流程覆盖 | 从选题到交稿的端到端工作流 | | 📉 降重优化 | 句式重构、同义替换、段落重组 | | 🤖 AIGC 降低 | 场景化重写、自然承接、轻冗余控制和高密度句拆解,降低模板化与机械表达特征 | | 🔗 自然承接语 | 压缩模板化连接词,允许“具体来说、换句话说、放到实际使用里看”等解释型转场 | | 🪶 轻冗余控制 | 删除机械废话,保留少量“通常、往往、也会、在一定程度上”等缓冲词 | | 🧩 高密度句拆解 | 将职责、流程、目标塞在一句内的内容拆成主干、动作和解释层 | | 📚 成语适度使用 | 仅在非技术性总结或维护效果说明处少量使用,避免技术细节附近堆砌 | | 🔍 本地检测 | 轻量级 AIGC 检测工具,快速预估检测率 | | 📝 格式检查 | 自动检查论文结构规范性 | | 💬 智能讨论 | 三轮深入讨论充分理解论文需求 | | 🖼️ 图片生成 | 从图片需求清单生成 Mermaid、Graphviz、PlantUML 图表,并支持用户截图占位 | | 📄 图片插入 | Word 文档自动插入图片和图注 | | 📚 文献验证 | 三源学术搜索 + DOI 验证 + 虚构文献自动替换 ⭐ NEW | | ⚙️ 配置化 | YAML 配置文件,API Key / 日志 / 导出格式可配置 ⭐ NEW | | 📝 摘要生成 | 自动生成中英文摘要与关键词 ⭐ NEW | | 📊 文档导出 | 支持 Word/PDF 格式一键导出 |
检索增强生成(Retrieval-Augmented Generation,RAG)技术的出现,为解决上述问题提供了有效方案。RAG通过将检索系统与大模型结合,使模型能够基于特定知识库生成回答,显著提升了回答的准确性和可靠性。
从实践角度看,中小企业在部署AI知识库时面临诸多挑战。商业化的企业级知识管理产品往往价格昂贵、部署复杂,难以满足中小企业的实际需求。开源方案虽然成本较低,但技术门槛高、集成难度大
。因此,设计一个技术成熟、部署灵活、成本可控的AI知识库系统,对推动中小企业数字化转型具有重要的实践意义。
国内外研究现状
知识管理领域的研究始于20世纪90年代。Nonaka于1995年提出的SECI知识创造模型,系统阐述了隐性知识与显性知识的转化过程,为后续研究奠定了理论基础[3]。进入21世纪后,随着互联网技术的发展
,知识管理系统的研究重心逐渐从理论框架转向技术实现。
在知识表示与存储方面,知识图谱(Knowledge Graph)技术成为研究热点。2012年,Google正式发布知识图谱项目,将其应用于搜索引擎优化。此后,Facebook、Amazon、Microsoft等科技公司相继推
出类似产品。知识图谱通过结构化的方式表示实体及其关系,使机器能够"理解"知识语义,为智能问答提供了有力支撑[4]。学者们围绕知识图谱的构建方法、存储优化、推理机制等展开了深入研究。Bo
rdes等人提出的TransE模型开创了知识图谱嵌入学习的先河,后续的TransH、TransR等模型进一步提升了表示学习的效果[5]。
在智能问答方面,早期的研究主要基于关键词匹配和模板填充。随着深度学习技术的发展,基于神经网络的问答系统逐渐成为主流。2017年,Vaswani等人提出的Transformer架构引发了自然语言处理领
域的范式变革[6]。基于Transformer的预训练模型,如BERT、GPT系列,在问答任务上取得了突破性进展。2022年,ChatGPT的发布更是将智能问答推向了新的高度。
RAG技术的提出解决了大模型在专业领域应用中的知识局限性问题。Lewis等人于2020年首次系统阐述了RAG框架,通过引入外部知识库增强模型的生成能力[7]。此后,众多学者对RAG进行了改进和优化。
Karpukhin等人提出的DPR(Dense Passage Retrieval)方法,利用双塔编码器实现高效的语义检索[8]。Gao等人探索了RAG在医疗、法律等专业领域的应用,验证了其在垂直场景的有效性[9]。
纵观国内外研究现状,知识库系统的发展呈现出以下特点:
其一,技术架构从单一存储向多元融合演进。现代知识库系统不仅支持结构化数据和非结构化文档的统一管理,还融合了向量检索、图数据库等新技术,实现了多模态知识的高效组织。
其二,智能化程度不断提升。从早期的关键词搜索到语义检索,从简单的问答对匹配到大模型驱动的智能对话,知识库系统的交互方式日益智能化。
其三,部署模式趋于灵活。云原生架构、微服务设计的普及,使得知识库系统能够根据企业规模和需求灵活部署,降低了中小企业的使用门槛。
然而,现有研究和产品仍存在一定不足:部分商业产品价格高昂,中小企业难以承受;开源项目技术门槛较高,需要较强的研发能力;现有系统在知识图谱自动化构建、多源知识融合等方面的能力有待
提升。本研究将在现有技术基础上,设计一个适合中小企业部署的轻量级AI知识库系统
研究内容
本文围绕AI知识库系统的设计与实现展开研究,主要内容包括:
(1)系统架构设计。研究适合中小企业部署的系统架构,采用前后端分离、微服务设计思想,确保系统的可扩展性和可维护性。
(2)核心技术实现。深入研究RAG架构、向量检索、知识图谱等核心技术,设计合理的实现方案。
(3)功能模块开发。实现用户管理、知识库管理、智能问答、知识图谱、系统配置等功能模块,满足企业的实际业务需求。
(4)系统测试与优化。对系统进行功能测试和性能测试,验证系统的正确性和稳定性。
但实践层面,中小企业部署AI知识库并非一帆风顺。商业化产品动辄数十万,部署也颇为复杂;开源方案虽然免费,技术门槛却高不可攀,集成起来困难重重。这便是本研究的出发点:设计一个技术成熟、部 署灵活、成本可控的AI知识库系统,为中小企业数字化转型提供切实可行的路径。
国内外研究现状
知识管理研究起点可以追溯到20世纪90年代。Nonaka在1995年提出SECI模型,系统揭示了隐性知识与显性知识转化机制,后来者多有沿袭[3]。进入21世纪,互联网技术突飞猛进,研究重心也随之从理论框架 转向技术落地。
知识图谱的兴起是一个重要节点。2012年Google正式发布知识图谱项目后,Facebook、Amazon、Microsoft等科技巨头紧随其后。知识图谱用结构化方式表示实体及其关系,机器因此能够"理解"知识语义,智 能问答有了坚实根基[4]。围绕知识图谱的构建方法、存储优化、推理机制等,学者们展开了较为深入的研究。Bordes等人提出的TransE模型开创了知识图谱嵌入学习先河,后续的TransH、TransR等模型又将 表示学习效果推上新台阶[5]——这几篇论文在当时被引用得相当多。
智能问答的演进同样耐人寻味。早期方案依赖关键词匹配和模板填充,粗糙而僵化。深度学习入场后,基于神经网络问答系统逐渐成为主流。2017年是转折点——Vaswani等人提出的Transformer架构颠覆了自然 语言处理既有范式[6]。BERT、GPT等预训练模型相继涌现,问答任务取得长足进步。2022年ChatGPT发布,更是将智能问答推向公众视野中心。
RAG技术则在另一个维度上发力:它解决的是大模型在专业领域的知识短板。根据Lewis等人(2020)的阐述,RAG框架通过引入外部知识库来增强模型生成能力[7]。此后改进方案层出不穷:Karpukhin等人提 出DPR方法,用双塔编码器实现高效语义检索[8];Gao等人则在医疗、法律等领域验证了RAG实战价值[9]。
纵观研究现状,知识库系统演进呈现出几条清晰脉络。技术架构层面,从单一存储走向多元融合——现代知识库系统既能管理结构化数据,也能处理非结构化文档,向量检索、图数据库等技术引入让多模态知识 组织更加高效。智能化程度持续深化,交互方式也从关键词搜索升级为语义检索,从问答对匹配进化为大模型驱动智能对话。部署模式日趋灵活,云原生架构和微服务设计逐渐普及,中小企业可以根据自身规 模和需求灵活部署。
当然,现有研究和产品仍有短板。商业产品价格令人望而却步;开源项目对研发能力要求较高;知识图谱自动化构建、多源知识融合等能力也还有提升空间。本研究将在现有技术基础上,设计一个适合中小企 业部署的轻量级AI知识库系统。
研究内容
本文围绕AI知识库系统设计与实现展开研究,主要工作包括:
(1)系统架构设计。针对中小企业部署场景,采用前后端分离、微服务设计思想,兼顾可扩展性与可维护性。
(2)核心技术实现。围绕RAG架构、向量检索、知识图谱等关键技术,设计切实可行的实现方案。
(3)功能模块开发。完成用户管理、知识库管理、智能问答、知识图谱、系统配置等模块开发工作。
(4)系统测试与优化。开展功能测试和性能测试,验证系统正确性与稳定性。
| 策略 | 应用前后对比 | |------|------------| | 场景化重写 | 先判断段落功能,从真实使用场景切入,而不是只替换词语 | | 自然承接语 | 压缩「此外、综上所述」等模板连接,保留“具体来说、换句话说”等解释型转场 | | 轻冗余控制 | 保留少量“通常、往往、也会”等缓冲词,避免文本被压缩得过于生硬 | | 高密度句拆解 | 将职责、动作、目标集中的长句拆成主干句、动作说明和解释层 | | 条款结构保护 | 保留(1)(2)(3)等编号、标题和顺序,只改条款内部表达 | | 学术边界 | 不新增虚构接口、表结构、实验指标或参考文献,避免口语化和宣传化 |
📌 AIGC检测率对比
[!WARNING] 关于 AIGC 降低的客观认知
降低检测率的同时,文本可能会失去部分学术严谨性。
- 成语替换可能让学术表达显得稍显文学化
- 「的」字删除需谨慎处理,过长定语保留可读性
- 微瑕疵模拟不应影响核心论点的逻辑清晰
- 不同学科对成语接受度不同,请参考学科适配表
建议:将降重视为辅助工具,最终内容需人工审核确保学术质量。
┌─────────────────────────────────────────────────────────────┐
│ 论文创作工作流 │
├─────────────────────────────────────────────────────────────┤
│ Step 0: 初始化工作区 │
│ ↓ │
│ Step 1: 环境准备 → Step 1.5: 背景信息讨论 │
│ ↓ │
│ Step 2: 读取参考资料 → Step 3: 生成论文大纲 │
│ ↓ │
│ Step 4: 分章节撰写(含摘要生成)→ Step 5: 降重处理 │
│ ↓ │
│ Step 6: AIGC 人性化 → Step 7: 合并检测 │
│ ↓ │
│ Step 8: 图片生成与渲染 🖼️ │
│ ↓ │
│ Step 9: 文档导出(Word/PDF + 图片插入) │
└─────────────────────────────────────────────────────────────┘



# 自然语言安装
帮我安装下 skill,项目地址是:https://github.com/Stars-OC/thesis-creator.git
# 从 GitHub 安装
git clone https://github.com/Stars-OC/thesis-creator.git
将文件放入./claude-skills/skills/ 下
# 市场安装 (待进行)
使用 OpenSkills 包管理器安装:
# 安装 OpenSkills CLI(如未安装)
pip install openskills
# 或从 GitHub 安装
openskills install https://github.com/Stars-OC/thesis-creator.git
openskills sync
包含 Python 工具和依赖:
# 克隆仓库
git clone https://github.com/Stars-OC/thesis-creator.git
cd thesis-creator
# 安装 Python 依赖
.\scripts\install.ps1
# 创建虚拟环境
python -m venv .venv
# 激活虚拟环境
.\.venv\Scripts\Activate.ps1
# 安装依赖
pip install -r scripts\requirements.txt
1. 准备参考资料
references/
├── templates/ # 学校论文格式模板
├── examples/ # 优秀范文
├── guidelines/
No comments yet. Be the first to share your thoughts!