Skip to content
宅教授 edited this page Feb 21, 2019 · 29 revisions

Welcome to the easy12306 wiki!

  1. 中文识别
  2. 图片识别

整体的设计思路

  1. 借用百度提供的光学字符识别功能,来教我的文字识别器——卷积神经网络。
  2. 让文字识别器来教我的图片分类器——统计学专家,看,这张验证码中有打字机哦,这张里也有...
  3. 让图片分类器反过来教我的文字识别器,看,这张噪声满满的文字图表示的一定就是这以下八种图片中的某一种。
  4. 让统计学专家来教我的卷积神经网络识别图片,从而可以面对前所未见的图片。

中文识别在测试集上的效果

texts

它把路灯当成漏斗了…

偷偷的问:标题中我说是测试集,实际上,我说错了,对吧。

如何?

2

~$ python3 main.py 2.jpg 2> /dev/null
电子秤
风铃        # 要找的是以上两样东西
0 0 电子秤  # 第一行第一列就是电子秤
0 1 绿豆
0 2 蒸笼
0 3 蒸笼
1 0 风铃
1 1 电子秤
1 2 网球拍
1 3 网球拍

识别前所未见的图片

8

~$ python3 mlearn_for_image.py 8.jpg
[0.8991613]  # 可信度
[0]          # 0 表示的就是打字机

具体的编号:https://gist.github.com/zhaipro/97d46ff244f66d17961a5f1ef17b6d8f

尚未认证的思路

关于文字识别的一些思路如下:

  1. 先识别第一个名词,从而知道其长度,从而得出第二个词的所在位置,…
  2. 在训练集中增加一种新的"名词图":空白无字。
  3. 还是说,直接定义空白好呢。
  4. 更新学习手段,让其能直接识别有噪音的文字图。
  5. 让文字识别器一次运行就能识别多标签。
  6. 让识别器一次运行就能得出完整的答案。

其余的兴趣

  1. Keras官方博客中提到的REST API

灵感来源

  1. 相似图片搜索的原理
  2. JohannesBuchner/imagehash
  3. jhfjhfj1/autokeras
Clone this wiki locally