热门搜索: 中考 高考 考试 开卷17
服务电话 024-23945002/96192
 

大模型驱动的云原生可观测性

编号:
wx1204429807
销售价:
¥113.50
(市场价: ¥129.00)
赠送积分:
114
数量:
   
商品介绍

(1)作者背景资深:AstrasX AI创始人,有15年研发与架构经验,是大模型驱动云原生可观测性领域的先行者。
(2)内容体系完整:从可观测性基础、大模型核心技术、融合创新机制到架构落地实践,循序渐进、层层深入,形成完整知识闭环。
(3)独创方法论:首次提出AI for Observability与AI of Observability双轨实践,构建基于知识的策略架构、Hybrid GraphRAG智能管道、7层智能可观测架构。
(4)实战案例真实:某AI平台智能日志分析(MTTD缩短70%+)与某证券公司Agent及智算可观测性建设两大完整企业级案例。
(5)技术覆盖前沿:深度解析OpenTelemetry、eBPF、RAG、知识图谱等关键技术,覆盖GPT/DeepSeek/Llama等国内外主流大模型选型与部署。
(6)读者覆盖面广:云原生架构师、SRE、AI工程师、AIOps从业者、技术管理者均可各取所需。

内容简介
这是一部系统讲解如何将大模型技术应用于云原生可观测性领域的实战指南。它为读者构建了智能可观测性的完整知识图谱,能为研发团队与技术决策者提供从方法论到工程落地的完整路径,从而将数据转化为洞察,将被动响应转化为主动决策。
全书共11章,分为四个部分。
第一部分(第1、2章):剖析云原生时代运维的根本挑战,首次提出将大模型作为应对这些挑战的新范式,涵盖可观测性基础知识、大模型核心特征与能力边界。
第二部分(第3~7章):深入解析大模型与可观测性的核心技术体系,包括大模型生态框架、应用部署工具链、云原生可观测三大支柱(日志/指标/追踪)、OpenTelemetry/eBPF关键技术,以及GPT/DeepSeek/Llama等国内外主流大模型的架构设计与最佳实践。
第三部分(第8、9章):详细阐述大模型与可观测性技术融合的机制和创新点,提供从数据处理到智能决策的完整技术路径。围绕OpenTelemetry剖析其在大模型可观测性中的演进,深度解析大模型与云原生架构的深度融合机制、与可观测性生态的交互模式,以及与AIOps的深度融合范式。
第四部分(第10、11章):聚焦工程化落地,系统回答“如何落地”。通过某AI平台智能日志分析与自然语言查询实践、某证券公司Agent及智算可观测性建设实践两大真实案例,详细展示从架构设计到实战部署的可借鉴、可复用、可扩展路径。

李 杰<br />(Luga Lee) <br />AstrasX AI创始人,资深架构师,拥有15年以上技术研发与架构经验。长期扎根技术一线,先后在多家知名企业担任架构师及首席架构师,专注于云原生架构与大模型工程化落地,在如何利用大模型构建智能可观测体系方面有丰富的实战经验。<br />微信公众号“架构驿站”(微信号:ArchHub)主理人。Jakarta EE Ambassador、Traefik Ambassador、TraefikLab中国社区创始人/主理人、云原生可观测性平台DeepFlow Champion。著有图书《云原生网关Traefik:入门、进阶与实战》。

目  录 Contents<br />推荐序一<br />推荐序二<br />前 言<br />第一部分 新范式——为什么<br />     可观测性需要大语<br />言模型<br />第1章 大语言模型驱动的云原生<br />可观测性技术背景 3<br />1.1 可观测性的基础知识 3<br />1.1.1 可观测性的基本定义与理论<br />基础 4<br />1.1.2 架构视角下的范式对比:传统<br />监控和可观测 7<br />1.1.3 可观测范式的典型应用场景与<br />架构适配 10<br />1.1.4 可观测性的核心价值与业务<br />影响 13<br />1.2 可观测性平台的支柱体系 14<br /><br />1.2.1 事件:离散状态变更的数据<br />基石 15<br />1.2.2 日志:事件记录与语义溯源 17<br />1.2.3 指标:量化评估与趋势分析 19<br />1.2.4 追踪:调用路径与因果追踪 21<br />1.2.5 上下文——跨域关联与语义<br />整合 23<br />1.3 可观测性架构的发展演进 25<br />1.3.1 阶段一:面向运维监控的<br />集中式日志和指标监控 25<br />1.3.2 阶段二:面向系统集成的<br />分布式链路请求追踪 27<br />1.3.3 阶段三:面向业务驱动的<br />全链路统一可观测性 28<br />1.4 本章小结 30<br />第2章 从模型到范式——大语言<br />模型基础 31<br />2.1 大语言模型概述 31<br />2.1.1 大语言模型的定义和核心<br />特征 31<br />2.1.2 与传统语言模型的区别 33<br />2.1.3 大语言模型的架构及工作<br />机制 34<br />2.2 大语言模型的发展历程和现实<br />格局 36<br />2.2.1 大语言模型的演进历程 36<br />2.2.2 大语言模型的现状 38<br />2.2.3 大语言模型展望 43<br />2.3 大语言模型的能力边界与挑战 49<br />2.3.1 理论局限性 50<br />2.3.2 技术瓶颈 53<br />2.3.3 伦理与社会风险 55<br />2.4 本章小结 56<br />第二部分 核心技术——当可观测性<br /> 遇上大语言模型<br />第3章 大语言模型的系统化能力与<br />工程化体系 59<br />3.1 大语言模型生态体系的构成<br />框架 59<br />3.1.1 生态体系简介 59<br />3.1.2 生态体系的构成要素 62<br />3.1.3 云原生下生态体系的核心<br />特征 67<br />3.2 大语言模型的架构与算力支撑<br />生态 72<br />3.2.1 模型架构生态 73<br />3.2.2 算力基座与硬件生态 96<br />3.2.3 数据训练与推理生态 109<br />3.3 本章小结 115<br />第4章 大语言模型应用部署生态 116<br />4.1 大语言模型的开发框架与库 116<br />4.1.1 大语言模型构建框架 116<br />4.1.2 模型训练库 124<br />4.1.3 专用模型构建框架 129<br />4.2 模型管理与微调工具 138<br />4.2.1 Lightning AI框架 139<br />4.2.2 MLflow框架 142<br />4.3 模型部署与服务化工具 146<br />4.3.1 TorchServe 146<br />4.3.2 TensorFlow Serving 150<br />4.4 本章小结 153<br />第5章 云原生可观测性技术原理<br />与体系标准 154<br />5.1 云原生可观测性的三大支柱技术<br />及原理 154<br />5.1.1 日志技术及原理 154<br />5.1.2 指标技术及原理 169<br />5.1.3 追踪技术及原理 180<br />5.2 云原生可观测性的关键技术 187<br />5.2.1 传统的Agent技术 187<br />5.2.2 SideCar技术 191<br />5.2.3 新一代的eBPF技术 197<br />5.3 云原生可观测性体系标准 203<br />5.3.1 可观测性体系标准的<br />架构 203<br />5.3.2 云原生可观测性体系标准的<br />核心要素 205<br />5.3.3 云原生可观测性体系标准的<br />核心原则 206<br />5.3.4 云原生可观测性体系标准的<br />实施框架 207<br />5.4 本章小结 208<br />第6章 国外主流大语言模型解析:<br />技术架构与应用实例 209<br />6.1 OpenAI的GPT系列 209<br />6.1.1 模型架构与特点 209<br />6.1.2 训练数据与方法 217<br />6.1.3 最佳实践 220<br />6.2 Google的AI系列 224<br />6.2.1 模型架构与特点 225<br />6.2.2 训练数据与方法 229<br />6.2.3 最佳实践 232<br />6.3 Meta的Llama系列 235<br />6.3.1 模型架构与特点 235<br />6.3.2 训练数据与方法 245<br />6.3.3 开源生态与应用案例 248<br />6.4 本章小结 253<br />第7章 国内主流大语言模型解析:DeepSeek的创新与实践 254<br />7.1 DeepSeek系列模型概述 254<br />7.1.1 DeepSeek模型矩阵与生态<br />贡献 254<br />7.1.2 DeepSeek-V3模型 259<br />7.1.3 DeepSeek-R1模型 262<br />7.2 DeepSeek模型训练 265<br />7.2.1 DeepSeek-V3的基础训练<br />过程 265<br />7.2.2 DeepSeek-R1的多阶段训练<br />流程 267<br />7.2.3 训练效率与成本控制策略 268<br />7.3 DeepSeek模型最佳实践 272<br />7.3.1 DeepSeek模型选型 272<br />7.3.2 DeepSeek模型部署优化 275<br />7.3.3 DeepSeek应用场景构建 281<br />7.4 本章小结 286<br />第三部分 融合与创新——如何<br />     构建一个大语言模型<br />     驱动的可观测性系统<br />第8章 OpenTelemetry在大语言<br />模型可观测性中的演进与<br />实践 289<br />8.1 OpenTelemetry概述 289<br />8.1.1 OpenTelemetry的前身与<br />使命 290<br />8.1.2 什么是OpenTelemetry 292<br />8.1.3 为什么选择OpenTelemetry 295<br />8.2 OpenTelemetry的核心架构设计<br />及实现原理 297<br />8.2.1 OpenTelemetry观测数据流<br />生命周期 297<br />8.2.2 OpenTelemetry的架构设计<br />理念 300<br />8.2.3 OpenTelemetry的技术<br />原理 314<br />8.3 OpenTelemetry在云原生与<br />大语言模型可观测性生态中的<br />应用 322<br />8.3.1 Kubernetes与OpenTelemetry:<br />从集群遥测到智能上下文<br />建模 322<br />8.3.2 服务网格与OpenTelemetry:<br />跨服务流量的全链路语义化<br />观测 324<br />8.3.3 云原生网关Traefik生态与OpenTelemetry:从流量入口<br />到Prompt生成的智能驱动 326<br />8.4 本章小结 329<br />第9章 融合之路——云原生可观测性与大语言模型的集成 330<br />9.1 大语言模型与云原生架构的深度<br />融合机制 330<br />9.1.1 云原生架构与大语言模型<br />应用的融合 330<br />9.1.2 服务网格与大语言模型的<br />协同 334<br />9.1.3 大语言模型驱动的云原生<br />开发工具链 339<br />9.2 大语言模型与可观测性生态的<br />交互模式 341<br />9.2.1 利用大语言模型增强分布式<br />追踪的语义理解能力 342<br />9.2.2 大语言模型赋能智能日志分析<br />与预测 345<br />9.2.3 多模态可观测性数据的语义<br />融合 349<br />9.3 大语言模型与AIOps的深度<br />范式融合 354<br />9.3.1 AIOps认知的范式迁移 355<br />9.3.2 范式融合的动因 357<br />9.3.3 范式融合的控制闭环 359<br />9.4 本章小结 360<br />第四部分 架构与落地——基于<br />     大语言模型的云原生<br />     可观测性架构设计与<br />应用实践<br />第10章 基于大语言模型的云原生<br />可观测性架构设计 363<br />10.1 大语言模型赋能云原生可观测性<br />架构的核心价值 363<br />10.1.1 提升可观测性架构的自动化<br />水平 363<br />10.1.2 提升可观测性架构的智能<br />洞察力 364<br />10.1.3 降低可观测性架构的运营<br />成本 365<br />10.2 架构设计理念与总体框架 367<br />10.2.1 核心理念与架构设计<br />原则 367<br />10.2.2 大语言模型赋能的核心能力<br />建设 372<br />10.2.3 基于大语言模型的可观测性<br />架构层级 378<br />10.3 架构的核心组件设计 381<br />10.3.1 数据收集与聚合:基于<br />知识的策略 381<br />10.3.2 数据处理与分析:大语言<br />模型驱动的智能管道 384<br />10.3.3 可视化与智能告警:语义<br />关联与因果推理驱动的<br />告警系统 390<br />10.4 本章小结 392<br />第11章 基于大语言模型的云原生<br />可观测性架构应用实践 393<br />11.1 某AI平台智能日志分析与自然<br />语言查询实践 393<br />11.1.1 业务背景与主要挑战 394<br />11.1.2 大语言模型赋能的关键<br />机制 396<br />11.1.3 实践路径与落地效果 402<br />11.2 某证券公司Agent及智算<br />可观测性建设实践 406<br />11.2.1 业务背景与建设动因 406<br />11.2.2 DeepFlow与大语言模型<br />赋能机制 408<br />11.2.3 业务实践与成效总结 415<br />11.3 本章小结 421<br />

商品参数
基本信息
出版社 机械工业出版社
ISBN 9787111808572
条码 9787111808572
编者 段嘉 李杰 著
译者 --
出版年月 2026-06-01 00:00:00.0
开本 16开
装帧 平装
页数 422
字数 606
版次 1
印次 1
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]