linguana

고정 헤더 영역

글 제목

메뉴 레이어

linguana

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 분류 전체보기 (133)
    • 일상다반사 (5)
    • Coding (122)
      • Image (52)
      • Sound (11)
      • 잡동사니 (21)

검색 레이어

linguana

검색 영역

컨텐츠 검색

Coding/Image

  • YOLOR (YOLO Representation)

    2021.07.07 by linguana

  • word image generator

    2021.07.04 by linguana

  • cv2 Perspective Transformation

    2021.06.29 by linguana

  • KakaoBrain Pororo OCR

    2021.06.23 by linguana

  • Custom Text Image Generator

    2021.06.22 by linguana

  • PIL rotate

    2021.06.22 by linguana

  • FCN (Fully Convolutional Network)

    2021.06.16 by linguana

  • CTPN

    2021.06.15 by linguana

YOLOR (YOLO Representation)

초 록: (볼드체, 밑줄, 글자색은 역자가 임의적으로 반영하였음) 사람들은 시각, 청각, 촉각과 더불어 과거 경험을 통해 세상을 "이해"한다. 인간의 경험은 일반적인 학습(우리는 이것을 명시적 지식이라고 부르겠다)을 통해 얻어지거나, 무의식적으로 얻어진다(우리는 이것을 암묵적 지식이라고 부르겠다). 이렇게 일반적인 학습 혹은 무의식적으로 얻어진 경험은 인코딩1되어 뇌에 저장될 것이다. 인간은 이 풍부한 경험을 거대한 데이터베이스로 사용하여 자료를 효과적으로 처리할 수 있다 - 심지어 그것을 이전에 보지 않았을 때도 말이다. 본 논문에서 우리는 - 인간의 뇌가 일반적인 학습과 더불어 무의식적 학습으로부터 지식을 학습할 수 있는 것과 같이 - 암묵적 지식과 명시적 지식을 함께 인코딩하는 통합된 신경망을 제시..

Coding/Image 2021. 7. 7. 17:46

word image generator

# ibm text generator https://github.com/IBM/tensorflow-hangul-recognition/blob/master/tools/hangul-image-generator.py # 국립국어원 학습자용 단어 목록 엑셀파일 https://www.korean.go.kr/front/etcData/etcDataView.do?mn_id=46&etc_seq=71 import os import io import glob import pandas as pd from PIL import Image, ImageFont, ImageDraw IMAGE_WIDTH = 300 IMAGE_HEIGHT = 75 words_file = "/content/drive/MyDrive/ICDAR2019_Kor..

Coding/Image 2021. 7. 4. 18:40

cv2 Perspective Transformation

이 글은 [3]의 번역본입니다. OpenCV의 getPerspective를 활용한 4개 꼭짓점 시점 변형(4 Points Perspective Transform) 예시 발행일: 2014년 8월 25일 1. 들어가며 pyimagesearch 독자들로부터 많은 이메일을 받았는데, 거기서 나온 질문 덕에 내가 매일매일 사용하는 라이브러리나 패키지를 충분히 설명하고 있지 않다는 것을 알게 되었다. 그래서 오늘의 포스팅은 cv2.getPerspectiveTransform에 대해서 다루려고 한다. 오늘 다룰 내용은 여러분의 프로젝트에 용이하게 사용될 것 같다. ※ 이 예제의 환경은 Python2.7/Python3.4+, OpenCV 2.4X/OpenCV3.0+이다. 버전 잘 확인하길 바란다. 2. 본 문 2.1. ..

Coding/Image 2021. 6. 29. 18:02

KakaoBrain Pororo OCR

Pororo ocr model skim-thru 분석 결과임 Detection model: CRAFT Recognition model: (1) Feature extraction: VGG or ResNet (2) Sequence modeling: BiLSTM or None (3) Prediction: CTC or Attention (Transformer under work # TODO) Documentation: https://kakaobrain.github.io/pororo/miscs/ocr.html Recognition model github: https://github.com/kakaobrain/pororo/blob/7d05a75e8062b00e6b65364b8ec6c52b6293ab07/pororo..

Coding/Image 2021. 6. 23. 16:22

Custom Text Image Generator

만약 내가 self-made 합성된 텍스트 이미지 generator가 필요했다면... [8] 을 들어가서 get_generator() 함수를 확인해보면 essential_generators.DocumentGenerator() 을 핵심적인 요소로 사용하는 것을 알 수 있다. [9] 에서 sentence()를 통해 문장을 출력 및 생성한다. 이 API가 한글을 지원하는지 확실하지 않다. (문제 발생!!) 선택지 1> 저수준으로 작성된 ibm text generator 를 응용하여 사용 선택지 2> Synthtext data generator 깃헙 사용 가능성 1. 저수준으로 작성되어 있는 ibm text generator를 활용한다. 사용할 원본 코드는 [10] 에서 확인해보자. 원본 코드는 글자 수준으로 ..

Coding/Image 2021. 6. 22. 16:50

PIL rotate

PIL의 rotate 함수에 대해서 알아보자. 1. 예시... 예시를 보자! For intuition, let's quickly take a look at a 간단하게 돌려본 결과: (1) 이미지 열고 (2) 이미지 크기 조정 좀 해주고 (너무 컸음) (3) 10도 만큼 회전해줌. 2. 기능 설명 (어디 쓰는 물건이고?) 주 의: PIL의 rotate는 중앙을 기준으로 반시계방향으로 돌린다. arguments 설명: (1) resample: 회전하고 나서 채우는 전략 NEAREST(default), BILINEAR, BICUBIC 있음. (2) expand: 0이면 원본 이미지 크기 유지하는데, 0 이외의 값이면 (int 참 값) 돌리고 난 다음의 크기로 채워줌 (3) center: None이면 이미지 ..

Coding/Image 2021. 6. 22. 14:35

FCN (Fully Convolutional Network)

Reference [1] 16 FCN - YouTube (포스텍 명강의, 한국어로 쉽고 명쾌한 설명, CAE와 FCN의 비교를 통해 중요한 요소 3가지 알 수 있음: (1) 모든 레이어가 합성곱 (2) down-sampling + up-sampling 구조 (3) skip connection) [2] [1612.03144] Feature Pyramid Networks for Object Detection (arxiv.org) (FPN 오리지널 논문) [3] semantic segmentation의 목적과 대표 알고리즘 FCN의 원리 by bskyvision (한국어로 작성되어 있음, 내용은 FCN [4] Image segmentation with a U-Net-like architecture (keras..

Coding/Image 2021. 6. 16. 16:36

CTPN

[1] opconty/pytorch_ctpn: This is a pytorch implementation of CTPN(Detecting Text in Natural Image with Connectionist Text Proposal Network). You may want to finetune from: https://drive.google.com/open?id=1JHhI4sEIXfs5gDa1I9AgJBY477HTzAd0 (github.com) [2] xiaomaxiao/keras_ocr: 用keras实现OCR定位、识别 (github.com)

Coding/Image 2021. 6. 15. 14:33

추가 정보

인기글

최신글

페이징

이전
1 2 3 4 ··· 7
다음
TISTORY
linguana © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바