Coding/Image

KakaoBrain Pororo OCR

linguana 2021. 6. 23. 16:22

Pororo ocr model skim-thru 분석 결과임
Detection model: CRAFT
Recognition model:
 (1) Feature extraction: VGG or ResNet
 (2) Sequence modeling: BiLSTM or None
 (3) Prediction: CTC or Attention (Transformer under work # TODO)

 

Documentation: https://kakaobrain.github.io/pororo/miscs/ocr.html

Recognition model github: https://github.com/kakaobrain/pororo/blob/7d05a75e8062b00e6b65364b8ec6c52b6293ab07/pororo/models/brainOCR/model.py#L18