问题描述与管道

  • 图片文字识别(Application Example: Photo OCR)的问题描述
  • 图片文字识别流程图

图片文字识别问题描述

图像文字识别应用所作的事是,从一张给定的图片中识别文字。这比从一份扫描文档中识别文字要复杂的多。

图片文字识别流程图

为了完成这样的工作,需要采取如下步骤:

  1. 文字侦测(Text detection)——将图片上的文字与其他环境对象分离开来
  2. 字符切分(Character segmentation)——将文字分割成一个个单一的字符
  3. 字符分类(Character classification)——确定每一个字符是什么

可以用任务流程图来表达这个问题,每一项任务可以由一个单独的功能来负责解决: