AI Hot Tech每日 AI 技术热点

系统在线

返回系列列表

📚

系列 05

模型部署与优化系列

掌握LLM生产环境部署与性能优化

8 期内容

全部集数

模型推理基础：vLLM与TensorRT-LLM

## 第一章：引言 - 大模型推理的性能瓶颈与破局之道...

146 分钟29106 字

模型量化技术：从GPTQ到GGUF

## 引言：大模型落地的最后一公里...

126 分钟25074 字

LoRA与QLoRA微调实战

## 引言：大模型时代的“平民化”微调之路...

121 分钟24180 字

模型压缩与剪枝

## 引言：大模型的“瘦身”时代...

120 分钟23934 字

服务化部署：Serving与API设计

## 引言：大模型落地的最后一公里...

122 分钟24309 字

边缘部署：移动端与嵌入式

## 引言：端侧AI的新纪元...

111 分钟22133 字

成本优化策略

## 引言：LLM时代的成本焦虑与破局之道...

135 分钟26837 字

监控与可观测性

## 引言：LLM时代的“黑盒”挑战与监控必要性...

129 分钟25789 字

上一个系列

📚提示工程系列

下一个系列

多模态与前沿技术系列📚