Skip to main content

目录

  • 基于基础模型构建人工智能应用程序的介绍
  • 理解基础模型
  • 评估方法
  • 评估人工智能系统
  • 提示词工程
  • 检索增强与智能体
  • 微调
  • 数据集工程
  • 推理优化
  • 人工智能工程架构与用户反馈

前言

书籍覆盖了调整基础模型以解决实际问题的端到端流程

构建应用程序有多种不同的方法。本书概述了各种解决方案,还提出了一些问题,你可以通过思考这些问题来评估哪种解决方案最符合你的需求。本书能帮助你解答的众多问题中,有一部分如下:

  • 我应该构建这个人工智能应用程序吗?
  • 我如何评估自己的应用程序?我可以使用人工智能来评估人工智能的输出吗?
  • 是什么导致了幻觉?我该如何检测和减轻幻觉?
  • 提示工程的最佳实践有哪些?
  • 为什么检索增强生成(RAG)有效?实施检索增强生成(RAG)有哪些策略?
  • 什么是智能体?如何构建和评估一个智能体?
  • 何时对模型进行微调?何时不对模型进行微调?
  • 我需要多少数据?如何验证数据质量?
  • 如何让我的模型更快、成本更低且更安全?
  • 我如何创建一个反馈循环来持续改进我的应用程序?

本书不涉及的内容

这本书并非教程。虽然书中提及了特定工具,并包含用于阐释某些概念的伪代码片段,但它并不教你如何使用某个工具。相反,它提供了一个选择工具的框架。书中有诸多关于不同解决方案之间权衡取舍的讨论,以及在评估某个解决方案时你应该提出的问题。当你想要使用某个工具时,通常很容易在网上找到相关教程。人工智能聊天机器人在帮助你上手热门工具方面也颇为出色。

这本书并非机器学习理论类书籍。它不会解释什么是神经网络,也不会讲解如何从零开始构建和训练模型。虽然书中会阐释许多与讨论直接相关的理论概念,但它本质上是一本实践类书籍,旨在帮助你开发成功的人工智能应用程序,以解决现实世界中的问题。

虽然无需机器学习专业知识也有可能构建基于基础模型的应用程序,但对机器学习和统计学有基本的了解可以帮助你构建更好的应用程序,并避免不必要的麻烦。阅读本书无需有机器学习方面的前置知识。不过,如果你了解以下概念,在构建人工智能应用程序时将更有效率:

  • 概率概念,如采样、确定性和分布。
  • 机器学习概念,如监督学习、自监督学习、对数似然、梯度下降、反向传播、损失函数和超参数调整。
  • 各种神经网络架构,包括前馈神经网络、循环神经网络和Transformer。
  • 诸如准确率、F1值、精确率、召回率、余弦相似度和交叉熵等指标。

本书代码仓库

github