圖片如何轉換成文字 ?
在電腦科學中,可使用名為「光學字元辨識」的技術。
(Optical Character Recognition , 簡稱 OCR)
在 Python 中 OCR 的使用非常簡單,只要約莫 5 ~ 6 行程式碼:
from PIL import Image
import pytesseract
img_name = './image.png'
img = Image.open(img_name)
text = pytesseract.image_to_string(img, lang='eng')
print(text)
總體來說三個動作 :
1. 導入模組
2. 讀取圖片
3. 呼叫模組的 image_to_string 函式
回傳的 text 字串,即是辨識出來的結果 !
不過,光有上面的程式碼還不能順利的執行,還需要 :
• 安裝軟體 : Tesseract
• Python 套件 : Pillow、pytesseract
(若有非英文文字的辨識需求,還需要安裝相對應的語言包)
以上的步驟雖然簡單,但初次接觸肯定毫無頭緒 !
所以我整合了一份安裝文件與使用教程,
三大作業系統 : Windows、MacOS、Linux 也有一併紀錄。
雖然我們不會 AI ,但還是可以用 AI !

