Controls für PDF-Dateien erstellen

Mit der PDF Engine 3.0 können Sie testen, ob der Inhalt einer PDF-Datei Ihren Erwartungen entspricht.

Dieses Kapitel erklärt, wie Sie Controls für Ihre PDF-Datei erstellen können. Sie können dann die PDF-Controls bearbeiten, als Modul speichern und Tests auf der Grundlage des PDF-Moduls erstellen.

Arten von Controls

Sie können die folgenden Arten von Controls erstellen:

  • Textbereiche

  • Bildbereiche

  • Tabellenbereiche

Möglichkeiten zur Erstellung von Controls

Sie können ein Control auf eine der folgenden Arten erstellen:

  • Geben Sie einen Bereich anhand seiner absoluten Position an, d. h. seiner Position in Ihrer PDF-Datei.

  • Geben Sie einen Bereich mit seiner relativen Position an, d. h. seiner Position in Bezug auf ein Ankerelement in Ihrer PDF-Datei.

    Dies ist nützlich, wenn PDF-Elemente immer an der gleichen Stelle relativ zueinander erscheinen, aber ihre Position auf der Seite nicht sicher vorhergesagt werden kann. Zum Beispiel, wenn Sie mehrere Rechnungen prüfen möchten. Die Rechnungen folgen dem gleichen Grundformat, aber die tatsächliche Lage einiger Felder, wie z. B. „Nettopreis“ und „Bruttopreis“, ist in jeder Datei unterschiedlich.

Einen Bereich mit seiner absoluten Position angeben

Um ein Control durch Angabe eines Bereichs auf der Grundlage seiner absoluten Position zu erstellen, führen Sie die folgenden Schritte aus:

  1. Öffnen Sie den PDF Scan.

  2. Wählen Sie im Fenster PDF Scan aus, was Sie steuern möchten:

    • Um Text auszuwählen, klicken Sie auf die Menüschaltfläche  Text.

    • Um ein Bild auszuwählen, klicken Sie auf die Menüschaltfläche  Image.

    • Um eine Tabelle auszuwählen, klicken Sie auf die Menüschaltfläche  Table.

  3. Geben Sie in der PDF View den Control-Bereich an, den Sie mit der Maus steuern möchten.

    Der PDF Scan wandelt den angegebenen Bereich in ein Modulattribut um und zeigt ihn in der Controls View auf der rechten Seite an.

  4. Verwenden Sie die Content View, um die Genauigkeit der aufgezeichneten Bereiche zu überprüfen.

    Stellen Sie bei der Text- und Table-Auswahl sicher, dass in der jeweiligen Vorschau keine Zeichen, z. B. Leerzeichen, fehlen. Wenn der in der Vorschau angezeigte Text nicht mit dem Originaltext übereinstimmt, können Sie als alternative Erkennungsmethode die Option Force optical recognition wählen.

Bereiche in der PDF-Ansicht angeben

  1. Führen Sie für den Control-Typ Table die folgenden zusätzlichen Aktionen aus:

    1. Öffnen Sie die Content View, indem Sie auf die Menüschaltfläche  Show Content Preview klicken.

    2. Geben Sie bei Bedarf die Anzahl der Zeilen- bzw. Spaltenüberschriften an.

    3. Passen Sie bei Bedarf die Zellenränder mit den Schiebereglern Adjust columns und Adjust rows an. Die Struktur der Tabelle in der Content View muss mit der der ursprünglichen Tabelle im PDF-Dokument übereinstimmen.

Tabellenzellenränder mit den Schiebereglern der Content View anpassen

Sich wiederholende Bereiche angeben

Wenn ein Element Ihrer PDF-Datei auf allen Seiten des Dokuments im gleichen Bereich erscheint, können Sie optional sich wiederholende Bereiche erstellen. Zum Beispiel, wenn Sie überprüfen möchten, ob der gleiche Bereich auf allen Seiten einen bestimmten Text enthält.

Um einen sich wiederholenden Bereich zu erstellen, führen Sie die folgenden Schritte aus:

  1. Geben Sie in der PDF View den Bereich an, den Sie mit der Maus in einen sich wiederholenden Bereich umwandeln möchten.

  2. Klicken Sie mit der rechten Maustaste auf den Bereich und wählen Sie im Kontextmenü Repetitive Area.

Wenn Sie ein Modul mit einem oder mehreren sich wiederholenden Bereichen erstellen, wird auch ein zusätzliches Modulattribut Repetitive Area Exclusions generiert. Auf diese Weise können Sie verhindern, dass diese Bereiche auf bestimmten Seiten ausgeführt werden. In Testschritten, die das Modul verwenden, können Sie Folgendes tun:

  1. Wählen Sie Odd numbered pages aus dem Wertebereich des Modulattributs, um alle ungerade nummerierten Seiten auszuschließen.

  2. Wählen Sie Even numbered pages aus dem Wertebereich des Modulattributs, um alle gerade nummerierten Seiten auszuschließen.

  3. Geben Sie im Modulattribut die auszuschließenden Seiten als Wert an. Verwenden Sie dazu die folgende Syntax: <n>;<n-n>; ....

    Beispiel: Der Wert 1; 3-6; 9 schließt die Seiten 1, 3, 4, 5, 6 und 9 aus.

Einen Bereich mit seiner relativen Position angeben

Sie können ein Control auf der Grundlage seiner Position relativ zu einem anderen Seitenelement erstellen. Dazu müssen Sie die folgenden Elemente definieren:

  • Das Anker-Control. Dies ist das Seitenelement, mit dem Sie die Position des Ziel-Controls festlegen.

  • Das Ziel-Control. Dies ist das Element, das Sie steuern möchten. Sie definieren es durch seine relative Position zum Anker-Control.

Während der Tests identifiziert die PDF Engine 3.0 das Anker-Control, indem sie das PDF-Dokument nach dem von Ihnen definierten Text oder Bild durchsucht. Sobald sie den Anker ausfindig macht, berechnet sie die Position des Ziels in Bezug auf den Anker. Nachdem Sie Ihr PDF-Modul gespeichert haben, können Sie den Genauigkeitsgrad angeben, mit dem die PDF Engine 3.0 Anker-Controls im Dokument findet.

Beachten Sie die folgenden Anforderungen:

  • Ziel und Anker müssen sich auf derselben Seite befinden.

  • Das Anker-Control muss im PDF-Dokument eindeutig identifizierbar sein.

  • Sie können keine Tabelle oder einen sich wiederholenden Bereich als Anker-Control verwenden.

Um einen Bereich anhand seiner relativen Position zu spezifizieren, führen Sie die folgenden Schritte aus:

  1. Öffnen Sie den PDF Scan.

  2. Geben Sie mindestens zwei Bereiche auf derselben Seite durch ihre absolute Position an.

  3. Klicken Sie in der PDF View mit der rechten Maustaste auf das Control, das Sie als Anker verwenden möchten, und wählen Sie eine der folgenden Optionen im Kontextmenü:

    • Um es als Textanker zu verwenden, wählen Sie Use as Text Anchor for...

    • Um es als Bildanker zu verwenden, wählen Sie Use as Image Anchor for...

  4. Wählen Sie den Namen des Ziel-Controls aus der Liste des Kontextmenüs aus.

Der PDF Scan zeigt einen Pfeil, der vom Anker zum Ziel zeigt.

Sobald Sie einen Bereich in ein Anker-Control umgewandelt haben, können Sie ihn nicht mehr in einen gewöhnlichen Bereich zurückverwandeln.

Book Title als Anker-Control für Book Authors verwenden

Anker-Control bearbeiten

Wenn Sie einen Bereich in ein Anker-Control umgewandelt haben, klicken Sie mit der rechten Maustaste darauf, um es zu bearbeiten. Das sich öffnende Kontextmenü bietet Ihnen die folgenden Optionen:

  • Um den Typ des Anker-Controls zu ändern, wählen Sie Text Anchor oder Image Anchor.

  • Um ein Ziel-Control zum Anker-Control hinzuzufügen, wählen Sie Add/Remove target controls und wählen Sie das Ziel-Control aus, das Sie hinzufügen möchten.

  • Um ein Ziel-Control vom Anker-Control zu entfernen, wählen Sie Add/Remove target controls und wählen Sie das Ziel-Control aus, das Sie entfernen möchten.

Anker-Control eindeutig identifizierbar machen

Ein vorhandener Anker kann nicht eindeutig identifizierbar werden, wenn Sie eine der folgenden Aktionen durchführen:

Die Controls View hebt nicht eindeutig identifizierbare Anker-Controls in Orange hervor.

Um ein Anker-Control wieder eindeutig identifizierbar zu machen, zeichnen Sie es neu. Die PDF Engine 3.0 berechnet die Positionen ihrer Ziel-Controls relativ zur neuen Position des Anker-Controls.

Zusätzliche Optionen

Zusätzlich bietet das Menü des PDF Scan die folgenden Optionen:

Option

Beschreibung

Zoom

Ändern Sie die Zoomstufe der PDF View.

 Zoom Fit

Vergrößern Sie die aufgezeichnete PDF-Datei, sodass sie in die PDF View passt.

Show scanned areas

Zeigen oder verbergen Sie die aufgezeichneten Bereiche in der PDF View.

Select Document Language

Wählen Sie die Sprache der aufgezeichneten PDF-Datei aus. Der PDF Scan verwendet diese Sprache für die optische Zeichenerkennung (OCR).