PDF モジュール

標準サブセット内の Engines->;Pdf フォルダには、 PDF Engine 3.0 の特定のタスクを実行するためのモジュールが含まれています。

PDF 1:1 Compare
Check PDF for Broken Links
Barcode Reader
Extract Links

PDF 1:1 Compare

PDF 1:1 Compare モジュールを使用すると、2つのPDFファイルを比較できます。

PDF Engine 3.0 は、2つのファイルを視覚的に比較します。

2つのファイルの類似度が一定のパーセンテージ以上であれば、テストケースは成功します。
2つのファイルの類似度が期待値以下の場合、テストケースは失敗します。

モジュールには以下のModuleAttributesがあります。

ModuleAttribute	説明
参照ファイル	ファイル名および拡張子を含む、最初のPDFファイルへのフルパス。
Reference File Password	最初のPDFファイルを開くためのパスワード。
Target File(s)	参照ファイルと比較するファイルを指定します。単一のターゲットファイルと比較するには、以下のいずれかの方法を選択します。テストステップ値フィールドの隣にあるファイルセレクタを使用してファイルを選択する。 PDFファイルのフルパスを入力する。（例: C:\MyPDFs\file1.pdf）複数のターゲットファイルと比較するには、以下のいずれかの方法を選択します。テストステップ値フィールドの隣にあるファイルセレクタを使用してファイルを選択する。すべてのターゲットファイルを含むフォルダへのパスを入力する。（例: C:\MyPDFs）それぞれのターゲットファイルのフルパスをセミコロン（;）で区切って入力する。（例: C:\MyPDFs\file1.pdf;C:\MyPDF\file2）
Target File Password(s)	ターゲットファイルを復号するためのパスワード。複数のパスワードを指定する場合は、セミコロン（;）で区切って入力します。さらに、以下のことに注意してください。パスワードの数は、ターゲットファイルとして指定したPDFファイルの数と一致しなければなりません。ターゲットファイルとしてフォルダパスを指定した場合、指定したフォルダ内のすべてのPDFファイルに同じパスワードが適用されます。
精度 [%]	2つのファイルの最小類似度をパーセントで指定します。
Comparison Type	実行する比較のタイプを指定します。 Full Text Content: ページ上のテキスト位置に関係なく、ファイル内のすべてのテキストコンテンツを一度に比較します。比較に使われるのは整形式テキストだけであり、OCRによるテキスト認識はサポートされていませんのでご注意ください。 Page by Page Text: ファイル内のすべてのテキストコンテンツを、ページごとに対応するページ同士で比較します。 Page by Page Image（デフォルト）: ファイルの視覚的なコンテンツを、ページごとに対応するページ同士で比較します。加えて、Toscaに空白文字を無視するよう指示することもできます。これを行うには「 Ignore whitespace in text-only comparison 」の設定を使用してください。
Excluded Pages	必要に応じて、比較から除外したいページを指定します。ページ範囲を指定するには、ハイフン（-）を使用します。複数のページあるいはページ範囲を指定するには、セミコロン（;）を使用します。
除外領域	オプションで、比較から除外したいPDFファイルの領域を指定します。以下のModuleAttributesは各除外領域に適用されます。 Area to Exclude > Dimensions: 除外領域に対応する座標が含まれます。これらのディメンションを取得する方法については、 see "比較対象から領域を除外する" 。 Area to Exclude > Page(s): 除外領域が含まれるページを指定します。ページ範囲を指定するには、ハイフン（-）を使用します。複数のページまたはページ範囲を指定するには、セミコロン（;）を使用します。
除外テキスト	オプションで、比較から除外したいテキストのパターンを指定します。必要に応じて、正規表現を使用して、一意のパターンを指定することができます。正規表現の検証には Regular Expressions 101 の使用を推奨します。以下のModuleAttributesは、各除外パターンに適用されます。 Pattern to Exclude > Pattern: 除外するテキストパターンが含まれます。このパターン内で特殊文字を通常の文字として使用する場合は、それらをエスケープする必要があります。詳細と例については、 see "比較からテキストパターンを除外する" 。 Pattern to Exclude > Use Regex: 除外するパターンに正規表現が含まれているかどうかを指定します。

この例では、 ReferencePDF.pdf ファイルのテキスト内容を、 Target_A.pdf ファイルと Target_B.pdf ファイルと比較しています。

ファイルは少なくとも 90 パーセント以上類似しているはずです。

ページ2とページ5から8を比較から除外します。

2つのPDFファイルを比較

比較結果は、ファイルが指定した最小類似度を持たないことを示します。

その結果、テストケースは失敗します。

PDF比較の失敗

この例では、 2つのPDFファイル間のテキストのみを比較し、100%の類似性を期待しています。さらに、3つの異なるテキストパターンを比較から除外します。

「 Good morning, 」および「 Good afternoon, 」という文。
A から Zまでのいずれかの文字が続く、「 Your assigned category is: 」という文。
任意の文字と数字の組み合わせが続き、キャリッジリターンで改行される、「 Your assigned token is: 」という文。
「 Tricentis 」という単語。

CheckPDF for Broken Links

Check PDF for Broken Links モジュールを使用すると、PDFファイル内のリンクがクライアントエラー応答（400～499）あるいはサーバーエラー応答（500～599）を返すかどうかチェックできます。インスタンスとして、これは、文書内のリンク切れの有無を確認するのに役立ちます。

モジュールには以下のModuleAttributesがあります。

ModuleAttribute	説明
PDFファイル	確認することを希望のPDFファイルへの完全なパス。例: C:\MyReports\YearlyReport.pdf
エラーを無視	テストで無視したいエラーコード。たとえば、 403 を入力すると「Forbidden」応答を返すすべてのリンクを無視することができます。

ModuleAttribute

説明

PDFファイル

確認することを希望のPDFファイルへの完全なパス。

例: C:\MyReports\YearlyReport.pdf

エラーを無視

テストで無視したいエラーコード。

たとえば、 403 を入力すると「Forbidden」応答を返すすべてのリンクを無視することができます。

このテストケース例は、 C:\TestPDF.pdf にあるPDFファイルにリンク切れがないか調べます。403 エラーを除くすべてのエラータイプをチェックします。

例 - エラー応答のチェック

ウィンドウが見つかると、このウェブページ内のすべてのリンクのエラー応答を検証します：

Tricentis Toscaのリンク検証例

Barcode Reader

Barcode Reader モジュールを使用すると、PDFファイル内の以下のバーコードおよびQRコードの値を検証したりバッファしたりすることができます。

バーコード用: Code39 Code93 Code128 EAN-8,EAN-13 UPC-A, UPC-E, ITF, Industrial2of5 Inverted2of5 IATA, Add2 Add5 Matrix2of5 Datalogic2of5 Codabar, BCD Matrix
QRコード用：QR, Micro QR, Data Matrix, PDF417, Aztec.

モジュールには、以下のモジュール属性があります。

ModuleAttribute	説明
PDFファイル	PDFファイルへの絶対パス。
バーコード - タイプ	スキャンしたいバーコードの種類を指定します。 All: サポートされているバーコードをすべてチェックします。このオプションは追加処理を必要とし、パフォーマンスに影響を与える可能性があります。 Barcode: バーコードのみをチェックします。 QR: QRコードのみをチェックします。
バーコード - ページ	オプションで、バーコードまたはQRコードをチェックするページを指定します。これを空白のままにすると、Tricentis Toscaはすべてのページをチェックします。
バーコード - インデックス	オプションで、バーコードまたはQRコードのインデックスを指定すると、一致するものを絞り込むことができます。以下の値のいずれかを入力します。ファイル内の <n>番目のバーコードまたはQRコードを示す番号。正の整数を入力してください。 first: ファイル内の最初のバーコードまたはQRコードを指定します。 last: ファイル内の最後のバーコードまたはQRコードを指定します。
バーコード - 値	実行したいアクションを指定します。アクションモード Buffer を使用して、コードの値をバッファに書き込み、テストで再利用できるようにします。アクションモード Verify を使用して、コードが期待される値であるかどうかを検証します。I

この例では、 C: ドライブにある MyPDFCodes.pdf というPDFドキュメント内の3番目のQRコードを検証します。期待値は 2FH8VB6PL です。

QRコードの検証例

Extract Links

Extract Linksモジュールを使用すると、任意のPDF内のリンクを抽出してバッファに格納し、配列として扱うことができます。バッファされたリンクは、後のテストステップで使用できます。Toscaは自動的にすべてのリンクを見つけるため、PDFをスキャンする必要はありません。

モジュールには、以下のモジュール属性があります。

ModuleAttribute	説明
PDF File	ファイル名および拡張子を含む、PDFのフルパスを入力します。
Indexes	必要に応じて、バッファに格納したいリンクのインデックス位置を指定します。インデックス番号は1から始まります。たとえば「 1-3;5 」と指定すると、1番目、2番目、3番目、および5番目のリンクがバッファに格納されます。すべてのリンクをバッファするには、このフィールドを空白のままにしてください。
Links	PDFから抽出されたリンクを格納するバッファの名前を入力します。

ModuleAttribute

説明

PDF File

ファイル名および拡張子を含む、PDFのフルパスを入力します。

Indexes

必要に応じて、バッファに格納したいリンクのインデックス位置を指定します。インデックス番号は1から始まります。たとえば「 1-3;5 」と指定すると、1番目、2番目、3番目、および5番目のリンクがバッファに格納されます。

すべてのリンクをバッファするには、このフィールドを空白のままにしてください。

Links

PDFから抽出されたリンクを格納するバッファの名前を入力します。

この例では、PDFからリンクを抽出して、後のテストステップで使用するためにバッファします。

C:\Documents\Invoices\2024 にある Invoice_08008.pdf という PDFファイルからリンクを抽出します。
すべてのリンクをバッファに保存するため、「 Indexes 」フィールドは空白のままにします。
バッファの名前を Order Summary Link とし、アクションモードに Buffer を選択して、将来のテストステップ用にこの特定のリンクを保存します。

PDFからリンクを抽出する