設定 - OCR

次の設定は、設定- & gt; TBox - >OCR で確認できます。

EngineName

説明

OCRに使用するエンジンを定義します。

Tesseract

Tesseract

CharSet

説明

認識に使用する文字セットを示します。これは、限られた文字数しか表示できないコントロールの分析に特に関連します。IPv4アドレスしか表示できないコントロールの場合、文字セットを例えば「0123456789」に制限できます。日付管理も同様です。

0-9

a-z

A-Z

<>-+*#~!.:,I'"/\

ConfigFile

説明

Tesseractのオプション設定ファイルへのパス。このファイルは、例えばユーザー辞書の指定に使用できます。

%TRICENTIS_ALLUSERS_APPDATA%\OCR

DumpImage

説明

この設定を有効にすると、解析された画像の結果が \OCR に保存されます。%TRICENTIS_ALLUSERS_APPDATA%この設定はデバッグ目的のみに使用されます。

Off(0)

Flip

説明

認識前に画像をミラーリングするかどうかを示します。

Off(0)

Language

説明

認識に使用する言語を示します。言語コードは、tessdataディレクトリにあるトレーニングファイルの略語によって決定されます(下記参照)。使用したトレーニングファイルには、認識用のサンプルが含まれているため、認識率には非常に重要です。正しく認識されない個々の文字、例えば下線が引かれているöなどは、以下に説明するように学習させることができます。トレーニング成功後、新しいトレーニングファイルの略称をここに入力することができます。

エンジン

MonochromBrightnessFactor

説明

この設定は、画像を白黒画像に変換するときに必要です。UseMonochrom の設定も有効にする必要があります。これは、カラーピクセルを結果の画像で黒いピクセルにするには、どの程度暗くする必要があるかを示します。一定の明るさを超える値を持つピクセルはすべて、結果の画像で白いピクセルとして表示されます。値が小さいほど大幅に暗くしなければ、ピクセルは黒と認識されません。この設定は、(明るいが)邪魔になる背景を除去し、 Tesseract に純粋な白黒画像を送るために使用します。

0.7

RemoveLineBreaks

説明

この設定を1に設定すると、認識されたテキストから改行(CRLF)が削除されます。

On(1)

Rotation

説明

分析前に画像を回転させる角度を示します。例えば、90という値を入力すると、読み込まれたテキストが90度回転して画面に表示されます。

0

ScaleFactor

説明

認識前に画像を拡大する倍率を示します。浮動小数点数の入力も可能です。

3

SegmentationMode

説明

どの SegmentationMode を使用するかを示します。SegmentationMode は、解析対象の画像における文字の処理方法を定義します。デフォルトでは 7 に設定されています。これは、1行しかないテキストの認識が最適化されることを意味します(ボタンなどのコントロールのラベルはほとんどこれに当てはまります)。

Tesseract では以下の SegmentationModes を利用可能です。

OsdOnly= 0

AutmaticSegmentationWithOsd = 1

AutomaticSegmentationWithoutOsd=3

SingleColumnVariableTextSize = 4

UniformTextBlockVertical = 5

UniformTextBlock = 6

SingleLine = 7

SingleWord = 8

SingleWorldInCircle = 9

SingleCharacter = 10

Single Line(7)

SetCharSpacing

説明

この値が0より大きい場合、文字の間隔を指定値に設定しようと試みます。ピクセル単位の新しい値は、新しい文字間隔に等しくなります。この設定を機能させるには、アイコンも、フレームやラインなどの追加グラフィック要素もない画像のみを送る必要があります。ここでは MonochromBrightnessFactor 設定も、どのピクセル(黒いピクセル)が文字の一部かを認識するために使用されます。

-1

UseInversion

説明

分析前に画像を反転します(色値はその逆の値に変換されます)。よって黒は白になります(逆の場合も同様)。

Off(0)

UseMonochrom

説明

分析前に画像を白黒に変換するかどうかを示します。

On(1)

Textract

DumpImage

説明

これが有効な場合、解析された画像は \OCR の下に結果と共に保存されます。%TRICENTIS_ALLUSERS_APPDATA%この設定はデバッグ専用です。

Off(0)