暂无商品咨询信息 [发表商品咨询]
一本真正能让你动手训练大模型的实战指南,从原理到代码,从入门到精通!
在人工智能蓬勃发展的当下,大模型技术正引领着新一轮的技术变革。本书以Python语言为主要工具,采用理论与实践相结合的方式,全面、深入地阐述了人工智能大模型的构建与应用,旨在帮助读者系统理解大模型的技术原理,掌握其核心训练方法,从而在人工智能领域建立系统的技术认知体系。全书分为五个部分:第一部分从大模型的技术演进历程讲起,重点剖析Python语言在大模型开发中的核心作用;第二部分围绕模型架构设计、训练优化算法及分布式训练策略展开;第三部分深度解读Transformer等主流架构及其变体的实现原理;第四部分涵盖超参数调优、正则化技术、模型评估指标与优化策略;第五部分提供了大模型在自然语言处理、计算机视觉、语音识别等领域的高级应用案例。本书兼具通俗性与专业性,案例丰富且实操性强,既可作为人工智能初学者的系统入门指南,也可满足进阶学习者的技术提升需求。对研究人员与工程师而言,本书更是一部极具参考价值的技术手册。此外,本书还适合作为高校或培训机构的人工智能课程教材,助力人工智能专业人才培养。
邵可佳
美国北亚利桑那大学数据分析硕士,拥有十多年算法研发与工业落地经验,深耕机器人、人工智能、智能家居、金融风控、电商推荐、O2O智能调度等领域,具备跨行业的规模化算法实现能力。历任金融算法工程师、河狸家算法专家、墨迹天气资深算法架构师。现任雨根科技大数据事业部技术负责人,主持碳通量时空大模型的研发与工程化落地。
第一部分
大模型与Python开发基础
第1章
大模型的理论发展
1.1大模型的计算理论003
1.1.1大模型的发展历程003
1.1.2未来展望003
1.2大规模数据的表示与处理004
1.2.1大规模数据的表示004
1.2.2大规模数据的处理005
1.3大模型的算法创新008
1.3.1注意力机制与自注意力网络008
1.3.2动态路由与胶囊网络008
1.3.3记忆增强神经网络009
1.3.4生成对抗网络与无监督学习010
1.3.5稀疏性与可解释性算法010
1.4大模型的发展趋势011
1.4.1更大规模与更深层次的模型架构011
……
基本信息 | |
---|---|
出版社 | 北京大学出版社 |
ISBN | 9787301311639 |
条码 | 9787301311639 |
编者 | 邵可佳 著 |
译者 | -- |
出版年月 | 2025-06-01 00:00:00.0 |
开本 | 16开 |
装帧 | 平装 |
页数 | 364 |
字数 | 563000 |
版次 | 1 |
印次 | 1 |
纸张 | 一般胶版纸 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]