draw_ocr_infos
-
説明:画像上に OCR 結果を描画します。
-
パラメータ
- img (
np.ndarray
):描画する画像。 - texts (
List[str]
):検出された文字列のリスト。 - polygons (
D.Polygons
):検出された文字の境界を示す多角形リスト。 - colors (
tuple
):描画する色の RGB 値。指定されていない場合、各文字に基づいて固定のロジックで一意の色が生成されます。 - concat_axis (
int
):元の画像と注釈付き画像を結合する軸。デフォルトは 1(水平)。 - thicknesses (
int
):多角形を描く太さ。デフォルトは 2。 - font_path (
str
):使用するフォントファイルのパス。指定されていない場合、デフォルトのフォント「NotoSansMonoCJKtc-VF.ttf」が使用されます。
- img (
-
戻り値
- np.ndarray:元の画像と注釈付き画像が結合された画像。
-
例
import docsaidkit as D
img = D.imread('lena.png')
texts = ['Hello!', 'Test!']
polygons = [
D.Polygon([(20, 20), (100, 20), (80, 80), (20, 40)]),
D.Polygon([(100, 200), (20, 200), (40, 140), (100, 180)])
]
ocr_img = D.draw_ocr_infos(img, texts, polygons, concat_axis=1, thicknesses=2)