让卷积神经网络用统计学得出的数据集来学习

zhaipro · Jan 27, 2019 · f20b79d · f20b79d
1 parent 448290c
commit f20b79d
Show file tree

Hide file tree

Showing 2 changed files with 67 additions and 1 deletion.
diff --git a/mlearn.py b/mlearn.py
@@ -61,7 +61,7 @@ def main():
                         validation_data=(test_x, test_y),
                         callbacks=[reduce_lr])
     savefig(history, start=10)
-    model.save('model.h5')
+    model.save('model.h5', include_optimizer=False)
 
 
 def load_data_v2():

diff --git a/mlearn_for_image.py b/mlearn_for_image.py
@@ -0,0 +1,66 @@
+# coding: utf-8
+import cv2
+import numpy as np
+from keras import models
+from keras import layers
+from keras import optimizers
+from keras.applications import VGG16
+from keras.callbacks import ReduceLROnPlateau
+from keras.preprocessing.image import ImageDataGenerator
+
+
+def load_data():
+    # 这是统计学专家提供的训练集
+    data = np.load('captcha.npz')
+    train_x, train_y = data['images'], data['labels']
+    train_x = train_x / 255.0
+    # 由于是统计得来的信息，所以在此给定可信度
+    sample_weight = train_y.max(axis=1) / np.sqrt(train_y.sum(axis=1))
+    sample_weight /= sample_weight.mean()
+    train_y = train_y.argmax(axis=1)
+
+    # 这是人工提供的验证集
+    data = np.load('captcha.test.npz')
+    test_x, test_y = data['images'], data['labels']
+    # resize
+    n = test_x.shape[0]
+    new_test_x = np.empty((n, 67, 67, 3), dtype=np.uint8)
+    for idx in range(n):
+        new_test_x[idx] = cv2.resize(test_x[idx], (67, 67))
+    test_x = new_test_x / 255.0
+    return (train_x, train_y, sample_weight), (test_x, test_y)
+
+
+def main():
+    (train_x, train_y, sample_weight), (test_x, test_y) = load_data()
+    datagen = ImageDataGenerator(horizontal_flip=True,
+                                 vertical_flip=True)
+    train_generator = datagen.flow(train_x, train_y, sample_weight=sample_weight)
+    _, h, w, c = train_x.shape
+    base = VGG16(weights='imagenet', include_top=False, input_shape=(h, w, c))
+    for layer in base.layers[:-4]:
+        layer.trainable = False
+    model = models.Sequential([
+        base,
+        layers.Conv2D(64, (3, 3), activation='relu', padding='same'),
+        layers.GlobalAveragePooling2D(),
+        layers.Dense(64, activation='relu'),
+        layers.Dropout(0.20),
+        layers.Dense(80, activation='softmax')
+    ])
+    model.compile(optimizer=optimizers.RMSprop(lr=1e-5),
+                  loss='sparse_categorical_crossentropy',
+                  metrics=['accuracy'])
+    model.summary()
+    reduce_lr = ReduceLROnPlateau(verbose=1)
+    model.fit_generator(train_generator, epochs=400,
+                        steps_per_epoch=100,
+                        validation_data=(test_x[:800], test_y[:800]),
+                        callbacks=[reduce_lr])
+    result = model.evaluate(test_x, test_y)
+    print(result)
+    model.save('12306.image.model.h5', include_optimizer=False)
+
+
+if __name__ == '__main__':
+    main()