码力全开 mlqk8.com
  • 首页
  • 技术分享
  • 赞助VIP
首页/AI/资源详情
AI金币 29.9浏览 0

51CTO (3)

发布 2026-05-17更新 2026-05-200 次浏览
简介

站点版块:一起分享 · 列表:sitemap replyreload += ',' + 2079115;1-1 课程内容介绍.mp4 1-2 LLM推理基础-预填充与解码阶段.mp4 1-3 LLM推理基础-推理阶段与KVCache的关系.mp4 1-4 LLM推理基础-生成KVCache过程推演.mp4 1-5 LLM推理基础-为何需要对KVCache优化.mp4 1-6…

站点版块:一起分享 · 列表:sitemap

replyreload += ',' + 2079115;1-1 课程内容介绍.mp4
1-2 LLM推理基础-预填充与解码阶段.mp4
1-3 LLM推理基础-推理阶段与KVCache的关系.mp4
1-4 LLM推理基础-生成KVCache过程推演.mp4
1-5 LLM推理基础-为何需要对KVCache优化.mp4
1-6 LLM推理基础-如何估算模型占用内存.mp4
1-7 LLM推理基础-GPU内部运算原理与推理机制的关系.mp4
1-8 LLM推理基础-列举LLM存储介质以及如何搬运参数.tle
1-9 LLM推理基础-优化思路-参数量化-运行时加速-IO优化.mp4
1-10 LLM推理基础-章节总结.mp4
1-11 LLM性能指标-内容介绍.mp4
1-12 LLM性能指标-推理评估指标全景图.mp4
1-13 LLM性能指标-首词生成时间.mp4
1-14 LLM性能指标-每词生成时间.mp4
1-15 LLM性能指标-端到端的请求时间.mp4
1-16 LLM性能指标-系统吞吐量TPS.mp4
1-17 LLM性能指标-业务指标SLO.mp4
1-18 LLM性能指标-评测过程与评测工具.mp4
1-19 LLM性能指标-章节总结.mp4
1-20 模型压缩-内容介绍.mp4
1-21 模型压缩-压缩策略-量化-剪枝-蒸馏.mp4
1-22 模型压缩-模型量化-参数存储空间的组成.mp4
1-23 模型压缩-模型量化前后使用的方法AWQ与GPTQ.mp4
1-24 模型压缩-AWQ针对PPL的实验结果.mp4
1-25 模型压缩-AWQ量化过程与实现-.mp4
1-26 模型压缩-GPTQ量化过程以及优化IO策略.mp4
1-27 模型压缩-GPTQ量化工具与实践.mp4
1-28 模型压缩-剪枝分类和过程详解.mp4
1-29 模型压缩-模型蒸馏分类和应用场景.mp4
1-30 模型压缩-章节总结.mp4
1-31 运行时加速方案-内容介绍.mp4
1-32 运行时加速方案-多头注意力机制原理与弊端.mp4
1-33 运行时加速方案-多头注意力计算过程与分析.mp4
1-34 运行时加速方案-MQA与GQA机制以及性能比较.mp4
1-35 运行时加速方案-GPU运算与数据传输分析.mp4
1-36 运行时加速方案-FlashAttention切块和算子.mp4
1-37 运行时加速方案-PagedAttention原理解析.mp4
1-38 运行时加速方案-持续批处理原理解析.mp4
1-39 运行时加速方案-核心推理框架选型.mp4
1-40 运行时加速方案-章节总结.mp4
1-41 推理部署实战指导与总结.mp4
01-vLLM推理实战.docx
2-1 vLLM产品介绍.mp4
2-2 vLLM分布式推理.mp4
2-3 显卡驱动安装与配置.mp4
2-4 Docker进行vLLM模型安装与部署.mp4
2-5 测试vLLM部署的大模型 .mp4
2-6 vLLM分布式部署思路.mp4
2-7 系统构建网络配置和框架安装.mp4
2-8 Head和Worker节点配置创建推理集群.mp4
2-9 测试vLLM分布式部署.mp4
02-量化实战-高级.docx
3-1 量化实战-量化目的与结果介绍.mp4
3-2 量化实战-思路与实战步骤讲解.mp4
3-3 量化实战-了解硬件架构量化工具.mp4
3-4 量化实战-安装WSL与Conda.mp4
3-5 TensorRT模型优化器安装与配置 .mp4
3-6 NVFP4量化格式.mp4
3-7 模型量化脚本解析与校准数据集.mp4
3-8 模型量化以及结果查看.mp4
3-9 测试量化之后模型查看返回结果.mp4
3-10 介绍EvalScope与Perf命令组成.mp4
3-11 使用EvalScope评测量化模型.mp4
3-12 介绍LLMCompressor量化工具.mp4
3-13 安装LLMCompressor .mp4
3-14 使用LLMCompressor对GPTQ-AWQ-NV.tle
3-15 针对两种量化工具比较四种量化结果.mp4
3-16 量化实战-课程总结.tle
《LLM推理优化与部署实战》课件.pptx
tle格式是加密的无法播放
下载地址:bb^*^dd
游客,如果您要查看本帖隐藏内容请回复

来源:论坛采集

获取资源

29.9金币
限时优惠会员免费
原价 299 金币
已售 0
开通会员每日免费下载,比单买更划算 →
i

支付成功后会自动显示下载资源云盘的链接!点击链接即可下载到本地。

加载支付组件…
[衡天云]爆款云服务器 低至12元/月
[衡天云]爆款云服务器 低至12元/月

相关资源

  • 黑马-2026最新版AI《天机学堂》项目实战
    金币 29.9 · 3 浏览
  • 深兰交大人工智能算法培训班4期|口碑好课|价值20000
    金币 29.9 · 1 浏览
  • 从0到1训练私有大模型 ,企业急迫需求,抢占市场先机|同步追更。。。~8
    金币 29.9 · 0 浏览
  • 尚硅谷 (2)
    金币 29.9 · 0 浏览
  • 零基础入门AI实战课,学习人工智能你也可以成为专家 IT教程吧
    金币 29.9 · 0 浏览
  • 2025 AI自动化大师课 从零构建企业级工作流N8N IT教程吧
    金币 29.9 · 0 浏览