暂无商品咨询信息 [发表商品咨询]
本书系统讲解了大模型的技术体系与应用实践。全书在深入解析Transformer和GPT系列模型的核心原理的基础上,介绍了中国优秀大模型DeepSeek的基本情况,重点讲解Llama开源模型的训练调优及行业应用开发,并对文生图、文生视频乃至多模态等前沿技术进行了探讨。本书注重理论与实践相结合,通过精选开源项目案例,引导读者在代码实践中理解技术本质。本书适合人工智能相关专业学生参考,也可供对大模型开发感兴趣的技术人员及爱好者阅读学习。
第一章大语言模型基础知识
第一节LLM基础
一、LLM概述
二、大模型存在的问题
三、检索增强生成(RAG)
四、大模型的改进方法
第二节GPT模型介绍
一、GPT模型的发展历程
二、GPT模型的关键论文
三、GPT模型的结构可视化
第三节开源、工具和实战
第二章大语言模型的技术细节
第一节大语言模型的全局视图
第二节注意力机制
一、自注意力机制
二、多头注意力机制
第三节编码、嵌入和神经网络
一、位置编码
二、旋转位置编码
……
基本信息 | |
---|---|
出版社 | 化学工业出版社 |
ISBN | 9787122481931 |
条码 | 9787122481931 |
编者 | 袁重桥 编著 编 |
译者 | -- |
出版年月 | 2025-09-01 00:00:00.0 |
开本 | 16开 |
装帧 | 平装 |
页数 | 253 |
字数 | 301000 |
版次 | 1 |
印次 | 1 |
纸张 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]