昔から tesseract というオープンソースのOCRエンジンが有名です。Pythonからは pytesseract で使えます。ここではより新しい EasyOCR と、Mac限定ですがmacOSのOCRエンジンを使う方法を解説します。 EasyOCR EasyOCR はたいへん優れたOCRエンジンです。Apple Silicon もサポートされています。コマンドラインでも使えます。 pip install easyocr でインストールできます。 import easyocr reader = easyocr.Reader(['en']) # en, ja, ... result = reader.readtext('filename.png', detail=0) print(" ".join(result)) 初回実行時にモデル(パラメータのファイル)がダウンロードされます: Do