PDF モジュール

標準サブセット内の Engines->;Pdf フォルダには、 PDF Engine 3.0 の特定のタスクを実行するためのモジュールが含まれています。

PDF 1:1 Compare

PDF 1:1 Compare モジュールを使用すると、2つのPDFファイルを比較できます。

PDF Engine 3.0 は、2つのファイルを視覚的に比較します。

  • 2つのファイルの類似度が一定のパーセンテージ以上であれば、テストケースは成功します。

  • 2つのファイルの類似度が期待値以下の場合、テストケースは失敗します。

モジュールには以下のModuleAttributesがあります。

ModuleAttribute

説明

参照ファイル

ファイル名および拡張子を含む、最初のPDFファイルへのフルパス。

Reference File Password

最初のPDFファイルを開くためのパスワード。

Target File(s)

参照ファイルと比較するファイルを指定します。

単一のターゲットファイルと比較するには、以下のいずれかの方法を選択します。

  • テストステップ値フィールドの隣にあるファイルセレクタ を使用してファイルを選択する。

  • PDFファイルのフルパスを入力する。(例: C:\MyPDFs\file1.pdf

複数のターゲットファイルと比較するには、以下のいずれかの方法を選択します。

  • テストステップ値フィールドの隣にあるファイルセレクタ を使用してファイルを選択する。

  • すべてのターゲットファイルを含むフォルダへのパスを入力する。(例: C:\MyPDFs

  • それぞれのターゲットファイルのフルパスをセミコロン(;)で区切って入力する。(例: C:\MyPDFs\file1.pdf;C:\MyPDF\file2

Target File Password(s)

ターゲットファイルを復号するためのパスワード。複数のパスワードを指定する場合は、セミコロン(;)で区切って入力します。

さらに、以下のことに注意してください。

  • パスワードの数は、ターゲットファイルとして指定したPDFファイルの数と一致しなければなりません。

  • ターゲットファイルとしてフォルダパスを指定した場合、指定したフォルダ内のすべてのPDFファイルに同じパスワードが適用されます。

精度 [%]

2つのファイルの最小類似度をパーセントで指定します。

Comparison Type

実行する比較のタイプを指定します。

  • Full Text Content: ページ上のテキスト位置に関係なく、ファイル内のすべてのテキストコンテンツを一度に比較します。比較に使われるのは整形式テキストだけであり、OCRによるテキスト認識はサポートされていませんのでご注意ください。

  • Page by Page Text: ファイル内のすべてのテキストコンテンツを、ページごとに対応するページ同士で比較します。

  • Page by Page Image(デフォルト): ファイルの視覚的なコンテンツを、ページごとに対応するページ同士で比較します。

加えて、Toscaに空白文字を無視するよう指示することもできます。これを行うには「 Ignore whitespace in text-only comparison 」の設定を使用してください。

Excluded Pages

必要に応じて、比較から除外したいページを指定します。

ページ範囲を指定するには、ハイフン(-)を使用します。複数のページあるいはページ範囲を指定するには、セミコロン(;)を使用します。

除外領域

オプションで、比較から除外したいPDFファイルの領域を指定します。以下のModuleAttributesは各除外領域に適用されます。

  • Area to Exclude > Dimensions: 除外領域に対応する座標が含まれます。これらのディメンションを取得する方法については、 see "比較対象から領域を除外する"

  • Area to Exclude > Page(s): 除外領域が含まれるページを指定します。ページ範囲を指定するには、ハイフン(-)を使用します。複数のページまたはページ範囲を指定するには、セミコロン(;)を使用します。

除外テキスト

オプションで、比較から除外したいテキストのパターンを指定します。必要に応じて、正規表現を使用して、一意のパターンを指定することができます。正規表現の検証には Regular Expressions 101 の使用を推奨します。

以下のModuleAttributesは、各除外パターンに適用されます。

  • Pattern to Exclude > Pattern: 除外するテキストパターンが含まれます。このパターン内で特殊文字を通常の文字として使用する場合は、それらをエスケープする必要があります。詳細と例については、 see "比較からテキストパターンを除外する"

  • Pattern to Exclude > Use Regex: 除外するパターン正規表現が含まれているかどうかを指定します。

この例では、 ReferencePDF.pdf ファイルのテキスト内容を、 Target_A.pdf ファイルと Target_B.pdf ファイルと比較 しています。

ファイルは少なくとも 90 パーセント以上類似しているはずです。

ページ2とページ5から8を比較から除外します。

2つのPDFファイルを比較

比較結果は、ファイルが指定した最小類似度を持たないことを示します。

その結果、テストケースは失敗します。

PDF比較の失敗

この例では、 2つのPDFファイル間のテキストのみを比較し 、100%の類似性を期待しています。さらに、3つの異なるテキストパターンを比較から除外します。

  • Good morning, 」および「 Good afternoon, 」という文。

  • A から Zまでのいずれかの文字が続く、「 Your assigned category is: 」という文。

  • 任意の文字と数字の組み合わせが続き、キャリッジリターンで改行される、「 Your assigned token is: 」という文。

  • Tricentis 」という単語。

CheckPDF for Broken Links

Check PDF for Broken Links モジュールを使用すると、PDFファイル内のリンクがクライアントエラー応答(400~499)あるいはサーバーエラー応答(500~599)を返すかどうかチェックできます。インスタンスとして、これは、文書内のリンク切れの有無を確認するのに役立ちます。

モジュールには以下のModuleAttributesがあります。

ModuleAttribute

説明

PDFファイル

確認することを希望のPDFファイルへの完全なパス。

例: C:\MyReports\YearlyReport.pdf

エラーを無視

テストで無視したいエラーコード。

たとえば、 403 を入力すると「Forbidden」応答を返すすべてのリンクを無視することができます。

このテストケース例は、 C:\TestPDF.pdf にあるPDFファイルにリンク切れがないか調べます。403 エラーを除くすべてのエラータイプをチェックします。

例 - エラー応答のチェック

ウィンドウが見つかると、このウェブページ内のすべてのリンクのエラー応答を検証します:

Tricentis Toscaのリンク検証例

Barcode Reader

Barcode Reader モジュールを使用すると、PDFファイル内の以下のバーコードおよびQRコードの値を検証したりバッファしたりすることができます。

  • バーコード用: Code39 Code93 Code128 EAN-8,EAN-13 UPC-A, UPC-E, ITF, Industrial2of5 Inverted2of5 IATA, Add2 Add5 Matrix2of5 Datalogic2of5 Codabar, BCD Matrix

  • QRコード用:QR, Micro QR, Data Matrix, PDF417, Aztec.

モジュールには、以下のモジュール属性があります。

ModuleAttribute

説明

PDFファイル

PDFファイルへの絶対パス。

バーコード - タイプ

スキャンしたいバーコードの種類を指定します。

  • All: サポートされているバーコードをすべてチェックします。このオプションは追加処理を必要とし、パフォーマンスに影響を与える可能性があります。

  • Barcode: バーコードのみをチェックします。

  • QR: QRコードのみをチェックします。

バーコード - ページ

オプションで、バーコードまたはQRコードをチェックするページを指定します。これを空白のままにすると、Tricentis Toscaはすべてのページをチェックします。

バーコード - インデックス

オプションで、バーコードまたはQRコードのインデックスを指定すると、一致するものを絞り込むことができます。

以下の値のいずれかを入力します。

  • ファイル内の <n>番目のバーコードまたはQRコードを示す番号。正の整数を入力してください。

  • first: ファイル内の最初のバーコードまたはQRコードを指定します。

  • last: ファイル内の最後のバーコードまたはQRコードを指定します。

バーコード - 値

実行したいアクションを指定します。

  • アクションモード Buffer を使用して、コードの値をバッファに書き込み、テストで再利用できるようにします。

  • アクションモード Verify を使用して、コードが期待される値であるかどうかを検証します。I

この例では、 C: ドライブにある MyPDFCodes.pdf というPDFドキュメント内の3番目のQRコードを検証します。期待値は 2FH8VB6PL です。

QRコードの検証例

Extract Links

Extract Linksモジュールを使用すると、任意のPDF内のリンクを抽出してバッファに格納し、配列として扱うことができます。バッファされたリンクは、後のテストステップで使用できます。Toscaは自動的にすべてのリンクを見つけるため、PDFをスキャンする必要はありません。

モジュールには、以下のモジュール属性があります。

ModuleAttribute

説明

PDF File

ファイル名および拡張子を含む、PDFのフルパスを入力します。

Indexes

必要に応じて、バッファに格納したいリンクのインデックス位置を指定します。インデックス番号は1から始まります。たとえば「 1-3;5 」と指定すると、1番目、2番目、3番目、および5番目のリンクがバッファに格納されます。

すべてのリンクをバッファするには、このフィールドを空白のままにしてください。

Links

PDFから抽出されたリンクを格納するバッファの名前を入力します。

この例では、PDFからリンクを抽出して、後のテストステップで使用するためにバッファします。

  • C:\Documents\Invoices\2024 にある Invoice_08008.pdf という PDFファイルからリンクを抽出します。

  • すべてのリンクをバッファに保存するため、「 Indexes 」フィールドは空白のままにします。

  • バッファの名前を Order Summary Link とし、アクションモードに Buffer を選択して、将来のテストステップ用にこの特定のリンクを保存します。

PDFからリンクを抽出する