ABBYY Recognition Server

Lösungsbeschreibung: so funktioniert Recognition Server

Die server-basierte OCR-Lösung ABBYY Recognition Server ist optimal für die Umwandlung von großen Dokumentenmengen in digitale Formate. Die Verarbeitung kann im Hintergrund nach vordefinierten Workflows komplett automatisch und ohne Bedienung durch einen Nutzer ablaufen.

Workflow

Ein Workflow ist die Festlegung des Verarbeitungsverlaufs von Dokumenten, die konvertiert werden sollen. In einzelnen Workflows wird definiert, wie und wann Dokumente in die Softwarelösung importiert, und mit welchen Parametern sie verarbeitet werden. Auch die Ausgabeformate (mehrere Exportformate gleichzeitig sind möglich, auch XML), Speicherorte sowie die Metadaten-Struktur (optional) werden hier benannt. Ein Workflow wird einmalig bestimmt, danach läuft die Applikation selbständig. Bis zu 32 parallel laufende Workflows können gleichzeitig genutzt werden.

 

Dokumentenkonvertierung in Recognition Server: Schritte der Verarbeitung

 

Die Dokumentenkonvertierung in Recognition Server lässt sich in fünf logische Schritte einteilen:

1. Scannen / Import

Der Dokumenteneingang kann über eine integrierte Scanstation oder einen vordefinierten Hot Folder (zu vordefinierten Zeiten oder kontinuierlich) erfolgen. Jeder Hot Folder wird nur einem einzigen Workflow zugeteilt.

2. Texterkennung (Recognition)

Die eigentliche automatische Umwandlung der Dokumentenbilder in bearbeitbaren Text mittels komplexer OCR-Algorithmen.

3. Verifizierung (Verification)

Die Kontrolle und Korrektur der Ergebnisse. Diese Funktion ist optional.

4. Indexierung (Indexing)

Das Anreichern mit Metadaten. Diese Funktion ist optional.

5. Export

Die automatische Ablage der Dokumente an zuvor definierten Speicherorten.

Nur die Bedienung eines Scanners und die optionalen Schritte ‚Verifizierung‘ und ‚Indexierung‘ erfordern die Intervention durch einen Nutzer. Auch hier lassen sich einige der Schritte durch Skripte zusätzlich automatisieren, so dass der Einsatz von Personal minimiert wird.

Aufbau und Arbeitsweise

Die Lösung besteht aus mehreren Komponenten, die auf einem oder mehreren PCs in einem LAN-Netzwerk installiert werden können.

Architektur von Recognition Server

 

Die wichtigsten Bestandteile sind:

  • Server Manager – die zentrale Administrationsinstanz, die die Warteschlange der zu verarbeitenden Dokumente überwacht und die Tasks auf die einzelnen Stationen verteilt
  • Processing Station – führt die eigentliche Texterkennung und die Dokumentenkonvertierung durch
  • Scanstation – eine Client-Station für das Stapelscannen und die Bildvorverarbeitung
  • Verifizierungsstation – eine Client-Station zur Kontrolle und Korrektur des umgewandelten Textes
  • Indexierungsstation – eine Client-Station zur Dokumentenindexierung und Klassifizierung
  • Schnittstelle zu Google Search Appliance™ (GSA™) – eine Komponente, über die Google Search Appliance mithilfe von ABBYY Recognition Server Inhalte aus Dokumentenbildern erfassen und bei der Stichwortsuche abrufen kann
  • Schnittstelle zu Microsoft® Search Systems (iFilter) – eine Komponente, über Microsoft® Search Systems und Windows Search ABBYY Recognition Server zur Extraktion von Inhalten aus Dokumentenbildern nutzen kann
  • Remote Administration Console – eine Client-Konsole zur Konfiguration, Verwaltung und Überwachung von Recognition Server

 

Administration

Recognition Server wird über eine auf Microsoft Management Console (MMC) basierende Oberfläche verwaltet. Über diese Console kann der Administrator das System konfigurieren und die Operationen überwachen: Er kann Workflows einstellen, Lizenzen und Nutzerrechte verwalten, Stationen und Warteschlangen steuern und Logdaten einsehen.

Mit Funktionen zur Priorisierung und zeitgesteuerten Verarbeitung kann der Administrator festlegen, in welcher Reihenfolge die Dokumente verarbeitet werden und so vorhandene Hardware-Ressourcen effizient nutzen, indem die OCR nachts oder am Wochenenden durchgeführt wird.

Integration

ABBYY Recognition Server bietet eine API-Schnittstelle (Application Programming Interface) zur Integration mit anderen Anwendungen. Die API kann genutzt werden, um Bilddateien und Verarbeitungsparameter an Recognition Server zu übergeben, oder um Benachrichtigungen über abgeschlossene Aufträge und fertige Ausgabedateien in anderen Applikationen abzulegen.

 

Weitere Informationen zu den Funktionen vom ABBYY Recognition Server

 

Quelle: http://www.abbyy.de/recognition-server/so-funktioniert-recognition-server/