about 이미지나 화면의 문자를 읽어 텍스트로 변환해주는 광학 문자 인식(OCR, Optical Character Recognition)을 파이썬에서 사용하기 쉽게 해주는 도구이다. 테서랙트는 오픈소스 OCR 엔진 으로 유명하며 2005년 HP에 의해 오픈소스화 되었으며, 2006년 이후 Google에 의해 개발되고 있다. 공식 홈페이지는 https://github.com/tesseract-ocr/tesseract 이다. 패키지에는 OCR 엔진(libesseract) 및 CLI가 포함되어 있다. Tesseract 4는 라인 인식에 중점을 둔 새로운 신경망 기반 OCR 엔진(LSTM)을 추가했다. 인공지능을 추가한 것이다. Tesseract 3 등 하위 버전과의 호환을 위해 OCR 레거시 엔진 모드(—o..
Preview 플라스크는 세션관리 및 암호화를 위해 app.secret_key가 필수적으로 필요하다. 프로젝트 진행 후 코드 공유를 위해 깃헙(github.com)에 코드를 올릴 때 민감정보 노출을 막기 위해 .gitignore 설정이 필요하다. 이를 위해 xml로 키를 관리하는 방법과 .gitignore 파일 설정 방법을 정리한다. keys.xml xml파일은 데이터를 키(key)와 값(value)로 구분하여 구조화하여 전달하기 위해 만들어진 문서 형식이다. 메모장으로 열 수 있고 쉽게 편집, 열람이 가능하다. 파일의 첫 줄에 xml 파일임을 알린다. 사용할 키와 값을 입력한다. 여기서는 플라스크의 secret_key와 SQL DB 접속 패스워드를 예시로 한다. PassWord Flask+Secret+..
Preview 플라스크는 파이썬에서 소규모 웹 서버를 구동할 수 있게 하는 웹 어플리케이션 프레임워크이다. 스케일에 상관없이 대규모 서버를 구성할 수도 있으며 Jinja와 Werkzeug를 포함한다. 갤러리 구현을 위해 사진 파일은 웹에서 크롤링한 데이터를 사용했으며 html, css, js, python을 사용했다. Flask 설치 #Flask 설치 pip install flask 시작하기 from flask import Flask, render_template, url_for app = Flask(__name__) app.config['IMG_FOLDER'] = os.path.join('static', 'images') #이미지 파일의 경로 지정 @app.route('/') def index(): r..
환경 날짜 : 2019.07.23 OS : Ubuntu 18.04 LTS(Windows Subsystem Linux) GPU : NVIDIA Geforce 1060 TensorFlow : 1.80 WSL 윈도우 탐색기에서 Filesystem 접근 경로 C:\Users\{유저이름}\AppData\Local\Packages\CanonicalGroupLimited.UbuntuonWindows_79rhkp1fndgsc\LocalState\rootfs python과 pip 설치하기 $ sudo apt-get install python-pip python-dev # for Python 2.7 $ sudo apt-get install python3-pip python3-dev # for Python 3.n 텐서플로우..
PyQt모듈을 사용하여 GUI모델을 구현하면서 time 모듈의 time.sleep() 메서드가 GUI환경에서 작은(?)문제를 일으킨다는 것을 발견했다. sleep()메서드가 실행되는 동안 다른 어떠한 버튼도 조작할 수 없고 강제로 하려고 하면 프로그램이 응답없음과 함께 튕겨버리는 문제까지 발생했다. 단순히 1, 2초 대기시간을 주고 다시 메서드를 돌리려는데 뭐가 문제인가? time.sleep를 사용하면 GUI쓰레드를 멈추게하기 때문이다. 검색하던 중에 PyQt용 QTimer가 따로 존재하는 것을 발견했다. QTimer QEventLoop() 선언 1 2 3 4 5 6 from PyQt5 import QtCore def reset(self): loop = QEventLoop() QTimer.singleSh..