首页  思维导图  详情



 



CNN-MNIST

2018-09-17 11:06:17   35  举报





AI智能生成

MNIST手写数据集训练卷积神经网络的过程，包括数据的导入，网络的设计，参数的优化等。

CNN

MNIST

tensorflow

深度学习

模板推荐

作者其他创作

大纲/内容

步骤简述

1.数据集的下载

2.确定好输入数据的格式（矩阵）

3.构建神经网络

conv-->pooling-->conv-->pooling-->平坦化-->全连接-->dropout-->全连接

4.使用softmax分类和交叉熵计算出loss，然后用梯度下降反向传播来优化参数

5.神经网络的输出结果与标签真实值进行比较，计算出准确率

6.设置超参数，将训练数据集的train和label传到占位符输入到神经网络去训练 再用测试集的train和label去检测准确率

设置x,y占位符, x-->train, y-->label，要注意占位符设置的类型是float32

# x = [-1, 28 * 28] # y = [-1, 10], one_hot 编码

改变输入图片x的形状

input_x_images = tf.reshape(input_x, [-1, 28, 28, 1]) # x = [-1, 28, 28, 1], 2维矩阵

开始构建神经网络： 构建卷积层 conv，使用 tf.layers.conv2d 这个方法

参数： <ol><li>inputs=input_x_images, # 输入形状 [28, 28, 1] </li><li>filters=32,                       # 32 个过滤器，输出的深度 (depth) 是 32 </li><li>kernel_size=[5, 5],          # 过滤器在二维的大小是(5 * 5) </li><li>strides=1,                       # 步长是 1 </li><li>padding='same',            # same 表示输出的大小不变，因此需要在外围补零 2 圈 </li><li>activation=tf.nn.relu      # 激活函数是 Relu </li></ol>

构建池化层，使用 tf.layers.max_pooling2d

参数 <ol><li>inputs=conv_shape   # 输入形状是卷积后的矩阵 </li><li>kernel_size=(2, 2)      # 亚采用矩阵的大小 </li><li>strides=(2, 2)             # 步幅 </li></ol>

卷积池化2~3层后，进行平坦化，将二维矩阵摊平成零位矩阵（直接使用 tf.reshape 改变它的形状）

tf.reshape(x, [-1, ??]) # 将 x reshape 成 [-1, ??]的矩阵

平坦化后，进行全连接，使用 tf.layers.dense

参数 <ol><li>inputs=pooding_shape,   # 上一层的输出矩阵 </li><li>units=1024,                      # 卷积完后的神经元个数 </li><li>activation=tf.nn.relu        # 使用的激活函数 </li></ol>

全连接后抛弃一部分连接，使用tf.layers.dropout

dropout = tf.layers.dropout(inputs=dense, rate=0.5) # rate = 0.5 每个循环，随机给50%的神经元带上面具，让他们不能连接

再进行一次全连接，输出10个神经元，对应one_hot编码~

logits = tf.layers.dense(x, 10)

以上就是全部的神经网络，接下来要对网络输出的结果与label真实值进行对比预测

softmax函数和交叉熵函数，我们可以使用tensorflow封装好的函数 ——tf.losses.sparse_softmax_cross_entropy(labels=y, logit=y_)

softmax的意义：比如神经网络最终输出的是[2, 4.0, 6.5....]，softmax函数会把他们转成对应的概率值[0.1, 0.15, 0.23....],概率全部相加等于1。

交叉熵函数（cross_entropy）通过交叉熵，能够计算出一个 loss 值，这个loss值越小证明预测出来的值准确率越高

优化器optimize，这是十分重要的一个东西，它将上面计算好的loss值，通过梯度下降进 行求导反向传播，从而改变W权重的参数，也就是所谓的“调参”，不断优化网络的参数， 这里我们使用梯度下降的一个进化版，AdamOptimizer（动量梯度下降）

tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss) # learing_rate 学习率，minmize 要优化的对象是以减小的方向进行优化

比较预测值和实际标签label的匹配程度，求平均值时 候要转成tf.float64，求百分比，使用的函数右边所示

<ol><li>predict = tf.argmax(y_, 1) </li><li>correct_values = tf.argmax(label, 1) </li><li>correct_prediction = tf.equal(predict, correct_values) </li><li>accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float64))  </li></ol>

创建Session，启动神经网络！！！~

注意：启动前要激活所有的变量，使用 init = tf.global_variables_initializer() sess.run(init)

设置超参数，Epoch，minibatch

Epochs=20 batch_size=128 for epoch in range(Epochs):       for ites in range(input_size / batch_size):             batch_x, batch_y_ = mnist.train.next_batch(batch_size) # input_size 就是输入的数据集大小，意思是要经过ites次遍历才能跑完一次完整的数据集（epoch） # 每一次迭代都将更新一次权重参数 # mnist.train.next_batch是mnist数据集自带的，返回的是匹配的图片和标签

将数据集读写进神经网络！！！之前的占位符就是为了这个用的！！!

batch_x, batch_y_ = mnist.train.next_batch(batch_size) # 读取训练数据集，上面一步有解释 loss_val, acc_val, _ = sess.run([loss, accuracy, train_op],                                                 feed_dict={x: batch_data, y: batch_labels}) # 这里的 train_op 就是优化器，虽然没有赋值进去，但是一定要用 run 启动它！！！不然没办法进行梯度下降反向传播！

1.每隔一个batch_size就打印一次训练集的准确率和loss值 2.每隔一个batch就打印一次测试集的准确率和loss值，输入数据的方式和上一步相同

mnist数据集下载

# 下载并载入 MNIST 手写数字库 (55000 * 28 * 28) 55000张训练图像 # mnist = [-1, 28 *28]， -1表示输入图片的张数

详细步骤