热门搜索: 中考 高考 考试 开卷17
服务电话 024-23945002/96192
 

DEEPSEEK实战:从提示词到部署和实践

编号:
wx1203586565
销售价:
¥59.16
(市场价: ¥68.00)
赠送积分:
59
数量:
   
商品介绍

本书旨在提供一份全面、易懂的DeepSeek大模型实战内容,通过深入浅出的讲解,帮助读者快速掌握DeepSeek的核心技术和应用场景。本书不仅涵盖了DeepSeek的技术原理、架构设计和训练方法,还详细介绍了如何通过API调用、本地部署和云服务等方式将DeepSeek集成到实践项目中。此外,本书通过大量实例和案例分析,展示了DeepSeek在不同领域的应用实践,帮助读者更好地理解和应用这一强大的工具。本书图文并茂,理论翔实,案例丰富,适合从事DeepSeek开发的科研人员以及广大的开发者作为技术参考和培训资料,亦可作为高校本科生和研究生的教材。

目 录
第1章 DeepSeek初探 1
1.1 大模型的定义 2
1.2 从GPT到DeepSeek 3
1.2.1 GPT模型的发展脉络 4
1.2.2 DeepSeek模型的发展脉络 7
1.2.3 技术突破:从全球竞速到本土创新 10
1.2.4 应用生态的进化:从工具到生态伙伴 11
1.3 DeepSeek的核心能力和独特优势 12
1.3.1 核心能力 12
1.3.2 独特优势 14
1.4 DeepSeek的应用场景 16
1.4.1 智能客服 16
1.4.2 辅助办公 18
1.4.3 智能家居 20
1.4.4 医疗诊断 21
1.4.5 教育学习 22
1.4.6 金融投资 24
1.4.7 智能政务 24
1.5 DeepSeek带来的机遇 25
1.5.1 DeepSeek模型带给个人的机遇 26
1.5.2 DeepSeek带给中小企业的机遇 28
小结 30
第2章 DeepSeek的模型架构 32
2.1 DeepSeek-V3/R1模型的架构 33
2.2 混合专家 35
2.2.1 稠密MoE架构和稀疏MoE架构 36
2.2.2 DeepSeekMoE 37
2.2.3 无辅助损耗负载均衡 39
2.3 多头潜在注意力 41
2.3.1 键值缓存简介 41
2.3.2 RoPE简介 43
2.3.3 传统MHA的缓存机制的不足 46
2.3.4 低秩键值联合压缩的注意力机制 47
2.4 多Token预测 52
2.4.1 块级并行解码策略 53
2.4.2 Meta的MTP方法 53
2.4.3 DeepSeek的MTP方法 54
小结 56
第3章 DeepSeek的训练架构 57
3.1 DeepSeek的训练 58
3.1.1 基础技术 58
3.1.2 训练过程 61
3.2 DeepSeek在硬件层面的训练亮点 62
3.2.1 FP8混合精度训练 62
3.2.2 DualPipe算法 63
3.3 DeepSeek在算法层面的训练亮点 66
3.3.1 组相对策略优化 67
3.3.2 知识蒸馏 69
3.4 DeepSeek的数据优化手段 70
小结 72
第4章 高质量提示词 74
4.1 提示词概述 75
4.1.1 提示词的定义 75
4.1.2 提示词的种类 76
4.2 新手常见误区和陷阱 77
4.3 提示词的设计技巧 79
4.3.1 STAR法则:让问题更有条理 79
4.3.2 5W2H法则:全面提问的利器 80
4.3.3 CO-STAR框架:精准表达需求 82
4.3.4 CRISPE框架:激发创意和拓展深度 85
4.3.5 BROKE框架:目标导向和持续优化 86
4.3.6 借助大模型优化提示词 88
4.4 企业层面的提示词应用场景 92
4.4.1 传播策略制定 92
4.4.2 执行发展制定 93
4.4.3 品牌故事生成 94
4.4.4 产品定位 96
小结 97
第5章 面向个人的DeepSeek部署 98
5.1 DeepSeek的模型 99
5.1.1 DeepSeek模型的常见版本 99
5.1.2 DeepSeek模型的版本说明 100
5.1.3 DeepSeek模型的开源协议 101
5.2 硬件需求和配置建议 103
5.2.1 存储精度 103
5.2.2 显存占用估算 105
5.3 软件环境安装和配置 107
5.3.1 Ollama安装 107
5.3.2 使用Ollama部署DeepSeek模型 111
5.3.3 Ollama常用API 113
5.4 DeepSeek模型下载和部署 121
5.4.1 Hugging Face社区简介 121
5.4.2 模型下载 121
5.4.3 常见大模型文件类型 125
5.5 使用Web UI构建对话界面 126
5.5.1 Open-WebUI 126
5.5.2 Hollama 129
5.5.3 ChatBox 132
小结 133
第6章 面向企业的DeepSeek API调用 135
6.1 API调用的优势 136
6.2 常用DeepSeek API调用方式 137
6.2.1 DeepSeek官方开放平台 137
6.2.2 DMXAPI 144
小结 148
第7章 面向企业的DeepSeek云服务部署 149
7.1 本地部署与云服务部署的对比 150
7.1.1 本地部署的特点 150
7.1.2 云服务部署的特点 151
7.2 模型推理加速框架 152
7.2.1 推理加速框架的必要性 153
7.2.2 BladeLLM 153
7.2.3 SGLang 156
7.2.4 vLLM 159
7.3 常用DeepSeek云服务部署方式 164
7.3.1 阿里云 164
7.3.2 腾讯云 171
7.3.3 华为云 176
7.3.4 火山引擎 181
7.3.5 AutoDL 187
小结 198
第8章 DeepSeek模型训练 199
8.1 常用训练框架 200
8.1.1 Unsloth 200
8.1.2 TRL 201
8.2 DeepSeek模型的SFT训练 202
8.2.1 算力租用 202
8.2.2 模型下载和部署 204
8.2.3 数据预处理 207
8.2.4 模型训练 208
8.2.5 模型推理 210
8.3 DeepSeek模型的GRPO训练 212
8.3.1 加载模型 212
8.3.2 配置PEFT模型 213
8.3.3 数据集准备 213
8.3.4 模型训练 216
8.3.5 模型推理 217
小结 219
第9章 DeepSeek的RAG实战 220
9.1 用LangChain构建简单的RAG本地系统 221
9.1.1 RAG管道构建 221
9.1.2 向量数据库构建 223
9.1.3 Web页面启动 225
9.2 开源DeepSeek RAG应用案例 227
9.2.1 Local PDF Chat RAG 227
9.2.2 RAG Flow 231
小结 239?
第10章 DeepSeek的Agent实战 241
10.1 基于LlamaIndex项目构建简单的智能体应用 242
10.1.1 软件安装和模型下载 243
10.1.2 构建本地知识库 245
10.1.3 实现基于本地知识库的智能体问答 246
10.2 基于Swarm框架构建智能体应用 250
10.2.1 Swarm框架介绍 251
10.2.2 DeepSeek模型接入 253
10.2.3 调用外部工具 255
10.3 开源Agent应用框架 260
10.3.1 Browser Use 260
10.3.2 Camel 268
小结 279
参考文献 281

商品参数
基本信息
出版社 电子工业出版社
ISBN 9787121500312
条码 9787121500312
编者 张成文 著
译者 --
出版年月 2025-04-01 00:00:00.0
开本 其他
装帧 平装
页数 294
字数
版次 1
印次 1
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]