Projects

Multimodal RAG Agent: 多模态客服智能体

Published:

面向产品客服场景的多模态智能体系统,基于 RAG 检索增强生成,支持中英文双语、情感感知、幻觉抑制,处理 20 万字以上产品说明书。

Mini vLLM: 从零实现 LLM 推理引擎

Published:

系统性复现 vLLM 核心模块,包括 PagedAttention、Continuous Batching、KV Cache Manager 等,深入理解大模型推理系统底层原理。