📚
系列 05
模型部署与优化系列
掌握LLM生产环境部署与性能优化
8 期内容
全部集数
33
模型推理基础:vLLM与TensorRT-LLM
## 第一章:引言 - 大模型推理的性能瓶颈与破局之道...
146 分钟29106 字
34
模型量化技术:从GPTQ到GGUF
## 引言:大模型落地的最后一公里...
126 分钟25074 字
35
LoRA与QLoRA微调实战
## 引言:大模型时代的“平民化”微调之路...
121 分钟24180 字
36
模型压缩与剪枝
## 引言:大模型的“瘦身”时代...
120 分钟23934 字
37
服务化部署:Serving与API设计
## 引言:大模型落地的最后一公里...
122 分钟24309 字
38
边缘部署:移动端与嵌入式
## 引言:端侧AI的新纪元...
111 分钟22133 字
39
成本优化策略
## 引言:LLM时代的成本焦虑与破局之道...
135 分钟26837 字
40
监控与可观测性
## 引言:LLM时代的“黑盒”挑战与监控必要性...
129 分钟25789 字