AI 基础知识 - GPU 架构、CUDA 编程、大模型基础及AI Agent 相关知识。
# Add to your Claude Code skills
git clone https://github.com/ForceInjection/AI-fundamentalsGuides for using ai agents skills like AI-fundamentals.
Last scanned: 5/18/2026
{
"issues": [],
"status": "PASSED",
"scannedAt": "2026-05-18T08:03:40.180Z",
"semgrepRan": false,
"npmAuditRan": true,
"pipAuditRan": true
}本仓库是一个全面的人工智能基础设施(AI Infrastructure)学习资源集合,涵盖从硬件基础到高级应用的完整技术栈。内容包括 GPU 架构与编程、CUDA 开发、大语言模型、AI 系统设计、性能优化、企业级部署等核心领域,旨在为 AI 工程师、研究人员和技术爱好者提供系统性的学习路径和实践指导。
- 适用人群:AI 工程师、系统架构师、GPU 编程开发者、大模型应用开发者、技术研究人员。
- 技术栈:CUDA、GPU 架构、LLM、AI 系统、分布式计算、容器化部署、性能优化。
Star History:
涵盖单机基础计算芯片(GPU、TPU)设计原理,PCIe、NVLink 高速互连总线协议,GPUDirect 跨节点直通技术,以及 NVIDIA GB300 NVL72 等异构融合超级芯片的系统级架构与延迟金字塔模型。详细内容请访问:硬件架构与互连技术。
No comments yet. Be the first to share your thoughts!
构建高吞吐 AI 计算集群的完整运维体系,涵盖基于 Device Query、nvidia-smi 和 nvtop 的 GPU 状态监控,InfiniBand (IB) 网络架构与健康检查,以及 NCCL 分布式通信库的基准测试与多节点部署实战。详细内容请访问:AI 集群运维与通信。
基于 Kubernetes 的 AI 基础设施构建方案,涵盖 NVIDIA Container Toolkit 与 Device Plugin 底层机制、Kueue/HAMi 细粒度 GPU 资源切分与池化、LWS/llm-d 分布式推理调度,以及 JuiceFS、DeepSeek 3FS 等高性能分布式存储系统的架构实践。详细内容请访问:云原生 AI 平台。
解析 Kubernetes AI 场景核心组件,包括容器运行时 GPU 支持底层机制、设备插件源码分析、Kueue 调度整合,以及基于 LWS 的大模型分布式训练与推理架构。
提供异构算力环境下的 GPU 资源精细化管理方案,涵盖硬件级/内核态/用户态虚拟化机制、CUDA 流与 MPS 调度优化,并提供 HAMi 资源隔离与 Flex AI 的生产环境落地配置。
基础系列文档:
HAMi 专题:
代码实现与配置:
针对 AI 训练中海量小文件读取与跨节点共享的性能瓶颈,解析 JuiceFS 数据与元数据分离架构、DeepSeek 3FS 高性能设计及面向推理的 ICMS (KV Cache) 存储层机制。
系统级 AI 底层编程路径,剖析 GPU 并行架构、CUDA 线程/网格与流处理机制、SIMT 与 Tile-Based (TileLang) 编程模型对比,以及基于 DOCA 框架的数据处理单元 (DPU) 核心编程范式。
涵盖 NVIDIA 容器镜像构建、CUDA 线程块/网格与流并发机制、SIMT 与 Tile-Based 编程模型对比、TileLang 算子开发,以及 nvbandwidth 显存与 PCIe 带宽调优实战,并链接 200+ Tensor Core/CUDA Core 优化内核的进阶学习资源。详细内容请访问:GPU 编程基础。
开发环境配置:
核心编程范式:
Tile-Based 编程:
性能分析与调优:
进阶学习资源:
基于 DOCA 框架的数据处理单元 (DPU) 开发指南,解析架构组件与网络加速、零拷贝 DMA、控制平面卸载、压缩、NVMe 模拟及近数据处理等典型场景的编程实践。详细内容请访问:DPU 编程。
探索以自然语言驱动与 Agent 自主决策为核心的 Software 3.0 开发范式,包含 OpenSpec 规范驱动开发、Spring AI 企业级 Java 接入、LangGraph 有状态多智能体图计算模型,以及 Coze/n8n 无代码工作流编排技术。详细的深度探讨可参考 大模型编程指南。
软件工程正向以 Agent First 与自主推理为核心的 Software 3.0 时代演进。本节梳理驾驭工程 (Harness Engineering) 体系,并演示基于 OpenSpec 的“意图 -> Spec -> AI -> 代码 & 验证”新一代规范驱动开发工作流。
剖析 Java 生态 AI 开发技术栈,通过 Spring AI 工程框架实现企业级 Java 应用对 LLM 能力的接入,并演示基于 Spring AI 构建高效 LLM 代理的工程实践。
LangGraph 通过图计算模型解决 LLM 应用在循环逻辑与状态持久化上的瓶颈,提供状态机机制以支持多轮推理、自我反思的复杂 Agent 工作流构建(如 AI 客服系统 Notebook 实战)。
无代码/低代码(No-Code/Low-Code)AI 应用落地指南,包含 Coze 私有化部署配置、n8n 多智能体编排实践,以及 Dify、Ragflow 等主流开源编排平台的架构与商业许可对比。
基于 NJU 与 SJTU 课程资源的系统化学习路径,涵盖线性代数与概率论等数学基础、SVM 与 HMM 等核心算法数学原理(《统计学习方法》《PRML》),并提供心脏病预测与房价评估等项目驱动的代码实战。
结合特征工程、模型评估与超参数调优,系统讲解监督/无监督学习、集成学习、推荐系统与概率图模型,配套心脏病预测、鸢尾花分类与房价预测等项目完成从理论推导到工程化实战的完整闭环。
动手学机器学习 - 全面的机器学习学习资源库,包含理论讲解、代码实现和实战案例。
核心特色:
汇集 3Blue1Brown 线性代数可视化、MIT 18.06 线性代数课程、李航《统计学习方法》、周志华《机器学习》与 Bishop《PRML》等经典教材,以及 Andrew Ng Coursera 入门课程、Stanford CS229 进阶课程与 Kaggle 竞赛实战平台资源。
数学基础: