by liangdabiao
让小白都可以一键进行数据分析,搞互联网的,搞电商的,搞各种各样的,那么其实就会用到 互联网的数据分析, 例如互联网会关心 拉新,留存,促活,推荐,转化,A/B test, 用户分析 等等很多有用的数据分析。
# Add to your Claude Code skills
git clone https://github.com/liangdabiao/claude-data-analysis-ultra-mainGuides for using testing skills like claude-data-analysis-ultra-main.
No comments yet. Be the first to share your thoughts!
Top skills in this category by stars
基于 Claude Skill 架构的智能数据分析平台。提供两套完整的技能体系:
将数据集放入 data_storage/ 目录:
data_storage/
├── olist_orders_dataset.csv
├── olist_customers_dataset.csv
├── olist_order_items_dataset.csv
├── olist_order_reviews_dataset.csv
└── house.csv
❯ data_storage/ 是需要进行数据分析的文件, 请你先浏览一下,然后利用skill进行数据分析,尽可能深度洞察出情况
# 通过入口技能,一站式互联网分析
@internet-data-analysis 对 olist 电商数据进行全面分析
# 或直接使用专业技能
@ltv-predictor 进行客户生命周期价值分析
@content-analysis 分析用户评论情感
@funnel-analysis 分析转化漏斗
@growth-model-analyzer 制定增长策略
@ab-testing-analyzer 设计AB测试
@attribution-analysis-modeling 渠道归因分析
@data-exploration-visualization 探索性分析
# 直接使用 Skill
@data-explorer 分析 olist 电商数据
@visualization-specialist 创建销售可视化
@report-writer 生成分析报告
# 通过主 Skill (支持高级分析模式)
@data-analysis 对 olist数据进行 statistical 分析
重要功能:专为互联网业务场景设计的专业技能体系,提供针对电商、内容、增长等场景的深度分析能力。
| Skill | 核心能力 | 适用场景 | |-------|---------|----------| | internet-data-analysis | 入口协调技能 | 需要综合分析时使用 | | ltv-predictor | 客户生命周期价值预测 | 客户价值分层、获客成本优化 | | content-analysis | 文本内容分析 | 评论情感分析、主题挖掘 | | funnel-analysis | 转化漏斗分析 | 流失节点识别、转化率优化 | | growth-model-analyzer | 增长策略分析 | AARRR 框架、Uplift 建模 | | ab-testing-analyzer | A/B测试设计与分析 | 实验设计、统计检验 | | attribution-analysis-modeling | 渠道归因分析 | 营销渠道评估、预算优化 | | data-exploration-visualization | 数据探索与可视化 | 基础分析、数据概览 |
# 综合电商分析(入口技能自动协调)
@internet-data-analysis 对 olist 数据进行全面分析
# 专项分析 - 只做 LTV
@ltv-predictor 分析 olist 客户生命周期价值
# 专项分析 - 只做评论分析
@content-analysis 分析 olist 用户评论
# 专项分析 - 只做增长策略
@growth-model-analyzer 制定 olist 增长策略
重要功能:系统支持高级分析模式,用户可以指定详细的分析类型,控制分析的深度、范围和输出形式。
| Skill | 类型数量 | 可用类型 | |-------|---------|----------| | data-analysis | 4种 | exploratory, statistical, predictive, complete | | visualization-specialist | 6种 | all, trends, distribution, correlation, comparison, custom | | report-writer | 5种 | summary, complete, executive, technical, custom | | code-generator | 5种 | data-cleaning, statistical, visualization, machine-learning, custom |
用途:控制数据分析的深度
| 类型 | 英文 | 深度 | 分析内容 | 适用场景 | |------|------|------|----------|----------| | 探索性 | exploratory | ⭐ | 数据结构、描述性统计、质量检查、基础可视化 | 快速了解数据 | | 统计性 | statistical | ⭐⭐ | +假设检验、相关性分析、回归分析、异常值检测 | 需要深度统计 | | 预测性 | predictive | ⭐⭐⭐ | +特征工程、机器学习模型准备、客户分群 | 需要预测建模 | | 完整性 | complete | ⭐⭐⭐⭐ | 以上全部 + 综合报告、可视化仪表板 | 全面分析 |
使用示例:
# 快速了解数据结构
@data-analysis 分析 house.csv 类型=exploratory
# 需要统计检验
@data-analysis 分析 olist 数据 类型=statistical
# 需要预测分析
@data-analysis 分析 customer.csv 类型=predictive
# 完整分析
@data-analysis 分析 sales.csv 类型=complete
用途:控制图表的类型和用途
| 类型 | 英文 | 图表内容 | 适用场景 | |------|------|----------|----------| | 完整仪表板 | all | 综合仪表板、多图表组合 | 数据概览 | | 趋势分析 | trends | 折线图、移动平均、季节性分析 | 时间序列数据 | | 分布分析 | distribution | 直方图、密度图、箱线图 | 了解数据分布 | | 相关性分析 | correlation | 散点图、热力图、配对图 | 变量关系 | | 对比分析 | comparison | 分组条形图、堆叠图 | 多组对比 | | 自定义 | custom | 根据需求定制 | 特殊需求 |
使用示例:
# 创建销售趋势图
@visualization-specialist 创建 olist 销售趋势图 类型=trends
# 创建分布图
@visualization-specialist 分析价格分布 类型=distribution
# 创建相关性热力图
@visualization-specialist 分析变量相关 类型=correlation
用途:控制报告的形式和受众
| 类型 | 英文 | 内容特点 | 适用对象 | |------|------|----------|----------| | 简要 | summary | 关键发现、核心指标 | 快速查阅 | | 完整 | complete | 执行摘要、详细分析、可视化 | 全面了解 | | 高管 | executive | 战略摘要、关键指标、行动项 | 决策层 | | 技术 | technical | 方法论、统计细节、代码 | 技术团队 | | 自定义 | custom | 根据需求定制 | 特殊需求 |
使用示例:
# 生成简要报告
@report-writer 生成 olist 报告 类型=summary
# 生成高管报告
@report-writer 生成 olist 报告 类型=executive
# 生成技术报告
@report-writer 生成 olist 报告 类型=technical
用途:控制生成代码的类型
| 类型 | 英文 | 代码内容 | 适用场景 | |------|------|----------|----------| | 数据清洗 | data-cleaning | 缺失值处理、标准化、去重 | 数据预处理 | | 统计分析 | statistical | 描述统计、假设检验、相关分析 | 统计分析 | | 可视化 | visualization | Matplotlib/Seaborn/Plotly 图表 | 数据展示 | | 机器学习 | machine-learning | 特征工程、模型训练、评估 | 预测建模 | | 自定义 | custom | 根据需求定制 | 特殊需求 |
使用示例:
# 生成数据清洗代码
@code-generator 生成 python 数据清洗 代码类型=data-cleaning
# 生成统计代码
@code-generator 生成 r 统计分析 代码类型=statistical
# 生成可视化代码
@code-generator 生成 python 可视化 代码类型=visualization
# 生成机器学习代码
@code-generator 生成 python 预测模型 代码类型=machine-learning
项目包含两套完整的技能体系:
.claude/skills/
├── internet-data-analysis/ # 入口技能(协调者)
├── ab-testing-analyzer/ # AB测试分析
├── attribution-analysis-modeling/# 归因分析建模
├── content-analysis/ # 内容分析(NLP)
├── data-exploration-visualization/# 数据探索与可视化
├── funnel-analysis/ # 漏斗分析
├── growth-model-analyzer/ # 增长模型分析
└── ltv-predictor/ # LTV预测
| Skill | 核心功能 | 配套资源 | |-------|---------|---------| | internet-data-analysis | 统筹全部互联网分析技能 | SKILL.md | | ab-testing-analyzer | 实验设计、样本量计算、统计检验 | templates/ + guide/ + examples/ | | attribution-analysis-modeling | 首次/末次/线性/马尔可夫/Shapley值归因 | templates/ + guide/ + examples/ | | content-analysis | 情感分析、关键词提取、主题建模 | templates/ + guide/ + examples/ | | data-exploration-visualization | 数据概览、分布分析、可视化 | templates/ + guide/ + examples/ | | funnel-analysis | 漏斗分析、流失节点识别、转化优化 | templates/ + guide/ + examples/ | | growth-model-analyzer | AARRR框架、Uplift建模、增长策略 | templates/ + guide/ + examples/ | | ltv-predictor | RFM分群、LTV预测、价值分层 | templates/ + guide/ + examples/ |
.Claude/skills/
├── data-analysis/ # 主 Skill(协调者)
├── data-explorer/ # 数据分析
├── visualization-specialist/ # 数据可视化
├── report-writer/ # 报告生成
├── code-generator/ # 代码生成
├── hypothesis-generator # 假设生成
└── quality-assurance # 质量保证
入口 Skill,协调完整分析流程。
功能:
使用场景:
功能:
关键处理规则(必须遵守):
| 数据类型 | 正确处理方式 | |----------|--------------| | 订单金额 | 必须按 order_id 汇总 (price + freight_value),不能直接平均 order_items | | 评分 | 按 order_id 取平均值 | | 配送时间 | delivered_date - purchase_date |
使用场景:
功能:
使用场景:
功能:
使用场景:
功能:
使用场景:
功能:
使用场景:
功能:
使用场景:
1. quality-assurance: 数据质量验证
↓
2. data-explorer: 探索性数据分析 + 深度统计分析
↓
3. hypothesis-generator: 基于发现生成假设
↓
4. visualization-specialist: 创建可视化图表
↓
5. code-generator: 生成可重用代码
↓
6. report-writer: 生成完整分析报告
1. data-explorer: 快速 EDA
2. visualization-specialist: 关键可视化
3. report-writer: 简要报告
.
├── data_storage/ # 输入数据目录
├── analysis_reports/ # 分析报告输出
├── visualizations/ # 可视化图表输出
├── generated_code/ # 生成的代码输出
├── .claude/ # 原 Claude Agent 配置(保留)
├── .Claude/ # 通用数据分析 Skills 配置
│ └── skills/
│ ├── data-analysis/
│ ├── data-explorer/
│ ├── visualization-specialist/
│ ├── report-writer/
│ ├── code-generator/
│ ├── hypothesis-generator/
│ └── quality-assurance/
├── .claude/ # 互联网分析 Skills 配置(新增)
│ └── skills/
│ ├── internet-data-analysis/
│ ├── ab-testing-analyzer/
│ │ ├── templates/ # 报告模板
│ │ ├── guide/ # 操作指南
│ │ └── examples/ # 示例代码
│ ├── attribution-analysis-modeling/
│ │ ├── templates/
│ │ ├── guide/
│ │ └── examples/
│ ├── content-analysis/
│ │ ├── templates/
│ │ ├── guide/
│ │ └── examples/
│ ├── data-exploration-visualization/
│ │ ├── templates/
│ │ ├── guide/
│ │ └── examples/
│ ├── funnel-analysis/
│ │ ├── templates/
│ │ ├── guide/
│ │ └── examples/
│ ├── growth-model-analyzer/
│ │ ├── templates/
│ │ ├── guide/
│ │ └── examples/
│ └── ltv-predictor/
│ ├── templates/
│ ├── guide/
│ └── examples/
├── CLAUDE.md # 项目详细文档
└── README.md # 本文件
系统会自动检测环境,优先使用 Pandas(性能更好):
| 情况 | 推荐方式 | 原因 | |------|----------|------| | 数据量 > 10,000 行 | Pandas | 向量化操作,C底层优化 | | 数据量 < 10,000 行 | Pandas | 代码简洁易维护 | | 环境无 pandas | Pure Python | 降级兼容 |
自动检测代码:
try:
import pandas