[人工智能] 学习记录（四）生成对抗网络的详细介绍

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 学习记录（四）生成对抗网络的详细介绍 -> 正文阅读

[人工智能]学习记录（四）生成对抗网络的详细介绍

学习记录（四）Theory behind GAN

Generator:

x：an image（a high-dimensional vector）
目标是找到这个distribution.

在GAN之前，找一个Model去Maximum Likelihood Estimation：

Given a data distribution P_data(x)
找到一个 distribution P_G(x；θ)
找到一个θ使得 P_G(x；θ) 接近 P_data(x).
从 P_data(x) 中采样得到 {x^`，x²，…，x^m}
对每个x计算P_G(xⁱ；θ)
将他们相乘得到：

在这里插入图片描述
找到θ^*使得likelihood最大。

Maximum Likelihood Estimation = Minimize KL Divergence.

A generator G is a network. 这个 network 定义了一个概率分布P_G.

在这里插入图片描述
Div 是 P_G 和 P_data 之间的 divergence.

Discriminator:

从 P_G 和 P_data 里面sample。
从 P_data 里面sample：

在这里插入图片描述

从 P_G 里面sample：

在这里插入图片描述

区分这两个：

在这里插入图片描述
找到使 P_G 和 P_data 之间差别最小的Generator。

在这里插入图片描述
找到使 Discriminator 能最好的区分(large divergence) 的 Discriminator。即V最大，V是使D得分高，G得分低的函数。

下面证明V函数：
在这里插入图片描述

给定G，找到一个D^*来最大化V。
对该式子进行化简积分：

在这里插入图片描述

给定x，转换为找到一个D使得下面式子取得最大值：（即积分里的每一项都分开算，其中D(x)可以取不同的函数）

在这里插入图片描述
经过一系列的不算复杂的数学运算后得到：

将其带入V可得：

在这里插入图片描述

经过一系列也不太复杂的变换后可得：

在这里插入图片描述

综上所述，将maxV带入可得：

在这里插入图片描述

对于不同的G有不同的V，对应有不同的D使得其对应的V最大，在所有的D里面找到一个D使得V最大化。如图所示，G₃中的D使得V最小。故G^*=G₃.（对上面这个式子的解释）

在这里插入图片描述
图中的红点所对应的高即为 P_G 和 P_data 之间的divergence。即：

在这里插入图片描述

其中的Div即为红点对应的高，即maxV(G，D).

对于GAN，maxV(G，D)对应的discriminator网络的训练，argmin对应的就是generator的训练。
故训练过程总结如下：

初始化generator和discriminator
在每个迭代周期：
step 1：固定generator G，更新discriminator D.
step 2：固定discriminator D，更新generator G.

Algorithm 实现：
在不同的G时分别进行maxV，得到最好的D，再固定这个D，进行Gradient Descent 来获得最好的G。

在这里插入图片描述
不停的更换G，去寻找最小的divergence（即红点对应的高，P_G 和 P_data 之间的divergence）

在实际计算中，对于maxV的计算：

在这里插入图片描述
把每个采样得到的x带入，然后取最大值。

再次回顾总的算法：

首先是 discriminator 的训练：
在这里插入图片描述

在训练generator时，由于第一项跟generator无关，故可以不考虑它。

在这里插入图片描述
由于log(1-D(x))一开始是0，不太好，故将其翻转：

在这里插入图片描述

将上式变换为：

在这里插入图片描述

上面那个叫做Minimac GAN(MMGAN)，下面这个叫做Non-saturating GAN(NSGAN).

完结撒花????? 吃饭去啦啦啦啦

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-07-31 16:38:15 更:2021-07-31 16:41:07

360图书馆购物三丰科技阅读网日历万年历 2026年1日历

-2026/1/8 1:30:56-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码