{ "cells": [ { "cell_type": "markdown", "id": "53d03399", "metadata": { "origin_pos": 0 }, "source": [ "# 概率\n", ":label:`sec_prob`\n", "\n", "简单地说,机器学习就是做出预测。\n", "\n", "根据病人的临床病史,我们可能想预测他们在下一年心脏病发作的*概率*。\n", "在飞机喷气发动机的异常检测中,我们想要评估一组发动机读数为正常运行情况的概率有多大。\n", "在强化学习中,我们希望智能体(agent)能在一个环境中智能地行动。\n", "这意味着我们需要考虑在每种可行的行为下获得高奖励的概率。\n", "当我们建立推荐系统时,我们也需要考虑概率。\n", "例如,假设我们为一家大型在线书店工作,我们可能希望估计某些用户购买特定图书的概率。\n", "为此,我们需要使用概率学。\n", "有完整的课程、专业、论文、职业、甚至院系,都致力于概率学的工作。\n", "所以很自然地,我们在这部分的目标不是教授整个科目。\n", "相反,我们希望教给读者基础的概率知识,使读者能够开始构建第一个深度学习模型,\n", "以便读者可以开始自己探索它。\n", "\n", "现在让我们更认真地考虑第一个例子:根据照片区分猫和狗。\n", "这听起来可能很简单,但对于机器却可能是一个艰巨的挑战。\n", "首先,问题的难度可能取决于图像的分辨率。\n", "\n", "\n", ":width:`300px`\n", ":label:`fig_cat_dog`\n", "\n", "如 :numref:`fig_cat_dog`所示,虽然人类很容易以$160 \\times 160$像素的分辨率识别猫和狗,\n", "但它在$40\\times40$像素上变得具有挑战性,而且在$10 \\times 10$像素下几乎是不可能的。\n", "换句话说,我们在很远的距离(从而降低分辨率)区分猫和狗的能力可能会变为猜测。\n", "概率给了我们一种正式的途径来说明我们的确定性水平。\n", "如果我们完全肯定图像是一只猫,我们说标签$y$是\"猫\"的*概率*,表示为$P(y=$\"猫\"$)$等于$1$。\n", "如果我们没有证据表明$y=$“猫”或$y=$“狗”,那么我们可以说这两种可能性是相等的,\n", "即$P(y=$\"猫\"$)=P(y=$\"狗\"$)=0.5$。\n", "如果我们不十分确定图像描绘的是一只猫,我们可以将概率赋值为$0.5
\n",
"\n",
"\n"
],
"text/plain": [
"