暂无商品咨询信息 [发表商品咨询]
想做好大模型应用,却只会简单写提示词?这本由GitHub Copilot(史上最成功的商业生成式AI产品之一)核心缔造者联合撰写的书将带你跳出浅层使用,真正吃透提示工程的科学逻辑。本书从大模型文本补全、词元机制、Transformer架构讲起,逐层拆解RLHF、对话模型、ChatML等核心内容,系统讲解提示词撰写、片段组装、上下文优化、RAG检索等关键技术。同时结合大量案例,手把手教你搭建对话智能体、编排复杂工作流,还分享离线与在线评估方案。无论是AI开发工程师、算法从业者,还是提示词设计师,都能从中学习专业的工程化思路,规避模型幻觉、输出异常等问题,打造稳定、高效的生产级大模型应用。
本书是大语言模型提示工程领域的权威指南,由两位行业专家撰写。全书以“LLM本质是文本补全引擎”为核心认知,构建“原理-方法-应用-评估”的完整体系:从Transformer架构、RLHF训练等底层逻辑切入,详解提示词设计、工程化组装、输出管控等核心方法,再延伸至对话智能体构建、复杂工作流编排与科学评估体系,融入GitHub Copilot等实战案例与工具实操方案,搭建起从理论到练等 的桥,助力读者驾驭LLM构建可靠的应用。
John Berryman是Arcturus Labs创始人,深耕大语言模型应用落地研发。他曾是GitHub Copilot早期核心研发工程师,主导产品对话交互、代码智能补全模块研发。他同时也是搜索领域专家,著有Relevant Search(Manning出版社)一书。<br /> Albert Ziegler是人工智能网络安全公司XBOW人工智能事业部的负责人。作为GitHub Copilot的创始工程师,他主导设计了其模型交互和提示工程系统。
目录<br />前言1<br />第1篇 基础篇<br />第1章 提示工程导论7<br />1.1 大语言模型的魔法8<br />1.2 语言模型的演进10<br />1.2.1 早期语言模型11<br />1.2.2 GPT模型的崛起13<br />1.3 提示工程16<br />1.4 本章小结18<br />第2章 理解大语言模型19<br />2.1 大语言模型的本质19<br />2.1.1 文本补全22<br />2.1.2 与人类思维的本质差异23<br />2.1.3 关键挑战24<br />2.2 大语言模型视角下的认知差异25<br />2.2.1 差异一:确定性分词27<br />2.2.2 差异二:逐字检查的局限27<br />2.2.3 差异三:文本认知特性28<br />2.2.4 词元数量30<br />2.3 词元生成机制31<br />2.3.1 自回归模型31<br />2.3.2 模式固化33<br />2.4 温度与概率分布34<br />2.5 Transformer架构38<br />2.6 本章小结43<br />第3章 从文本补全模型到对话模型44<br />3.1 RLHF45<br />3.1.1 训练RLHF模型45<br />3.1.2 诚实性保障48<br />3.1.3 个体偏差规避49<br />3.1.4 RLHF成本收益分析49<br />3.1.5 对齐税现象49<br />3.2 交互形态演进50<br />3.2.1 指令模型50<br />3.2.2 对话模型51<br />3.3 API生态演进53<br />3.3.1 对话补全API54<br />3.3.2 对话模式与文本补全模式的比较57<br />3.3.3 能力延伸58<br />3.4 提示工程的剧本创作观58<br />3.5 本章小结60<br />第4章 大语言模型应用设计61<br />4.1 循环结构剖析61<br />4.1.1 用户问题域特征63<br />4.1.2 用户问题转化提示词63<br />4.1.3 响应优化策略68<br />4.1.4 价值落地68<br />4.2 前馈传递过程69<br />4.2.1 前馈传递过程的构建70<br />4.2.2 循环机制的复杂性72<br />4.3 质量评估体系75<br />4.3.1 离线评估75<br />4.3.2 在线评估76<br />4.4 本章小结77<br />第2篇 技术篇<br />第5章 提示词内容设计81<br />5.1 内容来源82<br />5.2 静态内容83<br />5.2.1 问题的明确性83<br />5.2.2 少样本提示85<br />5.3 动态内容93<br />5.3.1 上下文识别94<br />5.3.2 RAG技术97<br />5.3.3 摘要技术107<br />5.4 本章小结111<br />第6章 提示词工程化组装112<br />6.1 理想提示词构成要素112<br />6.2 文档类型适配与优化选择115<br />6.2.1 咨询对话型116<br />6.2.2 分析报告型118<br />6.2.3 结构化文档119<br />6.3 文本处理与格式化规范123<br />6.3.1 独立性125<br />6.3.2 少样本示例格式化方法125<br />6.4 弹性文本片段126<br />6.5 提示词元素关联性127<br />6.5.1 位置与顺序127<br />6.5.2 内容重要性127<br />6.5.3 依赖关系128<br />6.6 整合提示词元素129<br />6.7 本章小结131<br />第7章 驾驭大语言模型133<br />7.1 输出格式精准管控133<br />7.1.1 引言134<br />7.1.2 起止边界识别135<br />7.1.3 小结137<br />7.2 Logprobs深度应用138<br />7.2.1 质量评估139<br />7.2.2 分类任务优化140<br />7.2.3 提示词异常检测142<br />7.3 模型选型143<br />7.4 本章小结149<br />第3篇 高级篇<br />第8章 对话智能体153<br />8.1 工具使用153<br />8.1.1 微调训练工具的使用154<br />8.1.2 工具定义指南162<br />8.2 推理能力164<br />8.2.1 思维链推理164<br />8.2.2 ReAct:迭代式推理与行动165<br />8.2.3 超越 ReAct 168<br />8.3 基于任务的交互上下文169<br />8.3.1 上下文信息的来源169<br />8.3.2 上下文的选择与编排171<br />8.4 构建对话智能体172<br />8.4.1 对话管理172<br />8.4.2 用户体验175<br />8.5 本章小结177<br />第9章 大语言模型应用工作流178<br />9.1 对话智能体的瓶颈179<br />9.2 基本工作流构建182<br />9.2.1 任务设计183<br />9.2.2 工作流编排189<br />9.2.3 落地与优化191<br />9.3 高级工作流创新194<br />9.3.1 智能体主导编排194<br />9.3.2 有状态任务智能体195<br />9.3.3 角色化委派196<br />9.4 本章小结197<br />第10章 大语言模型应用评估198<br />10.1 评估对象199<br />10.2 离线评估200<br />10.2.1 示例测试套件200<br />10.2.2 寻找测试示例202<br />10.2.3 解决方案评估204<br />10.2.4 SOMA 评估208<br />10.3 在线评估211<br />10.3.1 A/B 测试212<br />10.3.2 评估指标213<br />10.4 本章小结215<br />第11章 展望大语言模型的未来216<br />11.1 多模态融合216<br />11.1.1 交互范式升级217<br />11.1.2 智能能级跃升219<br />11.2 本章小结221
| 基本信息 | |
|---|---|
| 出版社 | 机械工业出版社 |
| ISBN | 9787111810117 |
| 条码 | 9787111810117 |
| 编者 | [美]约翰·贝里曼(John Berryman),[美]阿尔伯特·齐格勒(Albert Ziegler) 著 叶志远 王刚 译 |
| 译者 | 叶志远,王刚 |
| 出版年月 | 2026-06-01 00:00:00.0 |
| 开本 | 16开 |
| 装帧 | 平装 |
| 页数 | 224 |
| 字数 | 293 |
| 版次 | 1 |
| 印次 | 1 |
| 纸张 | |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]