本文是 Make Your First GAN With PyTorch 的附录 B，本书的介绍详见这篇文章。

当然，学习这么久的生成对抗网络（GAN），一定对 GAN 为啥能 “创造” 东西好奇，这篇文章我们就探讨一下这个问题。

GAN 到底学习的是什么呢?

这问题很好，但是答案并不是很明显。

下面我们在不涉及太多数学术语的情况下，给出 GAN 学习内容的直觉认识。

为了认识 GAN 学习什么，让我们从 GAN 不学习什么开始探讨。

1. GAN 不记忆训练数据

GAN 并不记忆训练数据的任何例子。

对于构成脸部的训练数据而言，这意味着生成器并不记忆诸如眼睛、耳朵、嘴唇或鼻子等部分。

生成器并不能直接看到训练数据，它利用鉴别器的后向传播误差进行学习，而鉴别器只能对某个图像是否真实进行分类。

所以，GAN 学习的是训练数据中不同元素出现的 可能性（likelihood）。

2. 一个简单的例子

下面是 8 张图片构成的小数据集，图片本身仅有 3×3 个像素，而且每个像素仅能有两个取值（这里是蓝色和白色）。
简单数据集示例
如果我们，作为人类，来画与数据集类似的图像，我们可能直觉地在中间和左上角画出蓝色像素；同时，大家也可能在左下角画出蓝色像素。

这种直觉背后是什么呢？

直觉的背后，是关于哪个像素是蓝色的 可能性（likely）。

下面从直觉转移到简单的数学计算，我们统计一下每个蓝色像素的数量。

下面图片中左侧的网格给出了这些数量。

在这里插入图片描述

可以很容易地将上图左侧的计数转换为 可能性（likelihood） 或 概率（prob- ability），正如上图右侧的网格。

这个网格类似于 概率分布（probability distribution），显示的是一个 3×3 图像中蓝色像素分布的 可能性（likelihood）。

如果我们是一个生成器，在确定某个像素是否是蓝色的之前，我们需要先看一下这些概率。

比如，

下图给出了使用这个方法创建的 24 个不同的图像：

在这里插入图片描述

看起来这些图像就像来自于训练集中一样。

从概率分布中创建图像的要点，并不是从训练数据中拷贝图像或其某个部分；而是要创造 可能性（likelihoods） 与训练数据一致的图像。

下面是将计数转换为概率并生成图像的代码：

https://github.com/makeyourownneuralnetwork/gan/blob/master/Appendix_B_generate.ipynb

上面简化的例子，仅考虑了独立像素的可能性。但这实际上对诸如 MNIST 数字或 CelebA 脸部等更真实的图像，效果并不好。

考虑脸部照片的一个微笑。如果代表嘴唇的一些像素是红色的，那附近的像素同样也应该是红色的。我们不能让附近的像素是不同的颜色（比如紫色）的来代表不同的微笑，这会看起来很混乱和不真实。
这意味着生成器神经网络学习某个特定的颜色，是和周边的像素有关系的。举例而言，如果某个生成器产生一个红色像素作为脸部的嘴唇，完成学习的网络权重将同样倾向于把临近像素置为红色。

下面的图片使用了一个简化的生成器网络来展示这个过程：

简化的生成器示意图

可以看到，某个较强的权重 $w_1$ 激活了中间层的一个节点，之后这个节点的信号继续被较强的权重 $w_2$ 产生红色的像素。而被权重 $w_1$ 激活的节点，同样也允许较强的权重 $w_3$ 来对画出红色像素周边的皮肤色彩。
使用这种方法，权重联合起来可以画出红色像素作为嘴唇，同样画出非红色的像素作为嘴唇周边的脸部。