Optical Character Recognition(OCR)-Tesseract

OFFICIAL DOCUMENTATION

PLATFORM

HOW TO

WINDOWS

download binaries for windows

LINUX

Tesseract is included in most Linux distributions. ("sudo apt install tesseract-ocr")

FILE -> PROJECT INTERPRETER -> install pytesseract package

import pytesseract

While you're working with pytesseract, your src image should be in RBG format not BGR.

EACH CHARACTER

import cv2
import pytesseract


img = cv2.imread("1.png")
imgRGB = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
print(pytesseract.image_to_string(imgRGB))
cv2.imshow("Output", imgRGB)


cv2.waitKey(0)

EACH WORD

import cv2
import pytesseract

img = cv2.imread("1.png")
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
hImg, wImg, _ = img.shape
listOfPoints = pytesseract.image_to_boxes(img)

for b in listOfPoints.splitlines():
    b = b.split(' ')
    print(b)
    x,y,w,h = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(img, (x, hImg-y), (w, hImg-h), (0,0,255), 3)
    cv2.putText(img, b[0], (x, hImg-y+25), cv2.FONT_HERSHEY_COMPLEX, 1, (50,50,255), 2)

cv2.imshow("Output", img)
cv2.waitKey(0)

PreviousFace Detection (Cascade Method)NextOPENCV PROJECTS

Last updated 5 years ago

Was this helpful?