|
OCR und Management
Die Lösung zum Strukturieren, Indizieren und Konvertieren von gescannten Dokumenten
IRISPdf 6 Server ist eine fortschrittliche, produktive Texterkennungslösung (OCR), die große Volumen von gescannten (digitalisierten) Dokumenten in elektronische Daten konvertieren kann. Dabei stellt es für alle Dokumenten-Management-Systeme die passenden Formate bereit. Ideal in öffentlichen Einrichtungen und Unternehmen!
IRISPdf 6 Server
Sehr hohe Genauigkeit der Texterkennung
Ausgabe auch im XML-Format
Die neue Version IRISPdf 6 Server ist für den professionellen Einsatz zum Erstellen strukturierter Volltext-Indices für Dokumente konzipiert. Besonders öffentliche Einrichtungen und große Unternehmen wollen ihre in Papierform vorliegenden Informationen in editierbare elektronische Schriftstücke konvertieren. Nur so können sie ihr Wissen effizient verwalten, verteilen – und letztlich effektiver arbeiten.
IRISPdf 6 Server ist eine Stand-alone-Anwendung. Sie erstellt einen Suchindex für Dokumente, die in einem Bildformat vorliegen, und konvertiert sie auf Wunsch in editierbare Dokumente. IRISPdf 6 Server lässt sich auf drei verschiedene Arten einsetzen:
- Als SDK (Software Development Kit): IRISPdf 6 Server lässt sich als verstecktes OCR-Modul in Dokumenten-Workflow-Anwendungen integrieren. Es steht darin als Funktionsaufruf zur Verfügung.
- Als Stapelverarbeitungs-OCR: IRISPdf 6 Server bearbeitet den gesamten Inhalt eines ausgewählten Ordners. Das heißt: Alle gescannten Bilder, die in einem bestimmten Ordner abgelegt sind, werden von IRISPdf 6 Server in durchsuchbare Dokumente umgewandelt.
- Als Verzeichnis-Überwachung: IRISPdf 6 Server hält in festgelegten Ordnern Ausschau nach neuen Dateien und bearbeitet diese sofort. Das heißt: Was auch immer auf den Scanner gelegt wird, wird vom IRISPdf 6 Server sofort abgeholt und konvertiert.
Neben bereits bekannten OCR-Funktionalitäten bietet die Software jetzt weiterentwickelte Bildverbesserungs-Funktionen und eine Strichcode-Erkennung (Barcode).
Darüber hinaus kann IRISPdf 6 Server basierend auf einer Vorlage verschiedene Dateiformate in einem einzigen Bearbeitungsschritt erzeugen. Probleme dokumentiert IRISPdf 6 Server in einer Protokolldatei und macht so eine nachträgliche Korrektur möglich.
Merkmale von IRISPdf 6 Server
- Neue Erkennungs- und Formatierungstechnologie: Die Benutzeroberfläche der Software wurde komplett überarbeitet: Alle Optionen sind nun im Explorer-Design zu sechs Funktions-gruppen zusammengefasst. IRISPdf 6 Server erkennt alle wichtigen Strichcodes und eignet sich zur Separation und/oder Umbenennen von Dokumenten. Bei der Aufteilung der Dokumente helfen zwei neue Optionen, die sich an leeren Seiten oder Strichcodes orientieren.
- Ausgehend von einer Vorlagendatei lassen sich in einem Schritt mehrere Ausgabedateien in unterschiedlichen Formaten wie PDF, RTF, TXT und XML erzeugen. Das bearbeitete Dokument lässt sich zudem in verschiedenen Bildformaten wie TIFF, JPEG und BMP speichern. Für die Benennung der Ausgabedateien stehen jetzt mehrere Optionen zur Wahl: Beibehaltung des Originalnamens, Verwendung der Ordnerbezeichnung, Benutzung eines Barcode oder einer festen Zeichenkette mit inkrementellem Zähler.
- IRISPdf 6 Server unterstützt sämtliche europäischen Sprachen, darunter die zentraleuropäischen und baltischen Sprachen, Griechisch und Kyrillisch (Russisch). Dieser Basis lassen sich mit dem Asien-Add-On-Modul vier asiatische Sprachen hinzufügen: Japanisch, Koreanisch, traditionelles und vereinfachtes Chinesisch. Auch für die Erkennung von Hebräisch steht eine Erweiterung zur Verfügung. Insgesamt werden 126 Sprachen unterstützt. Exakte mehrsprachige Erkennung im gleichen Dokument.
- Die Struktur des Eingangsverzeichnisses kann für den Ausgabeordner übernommen werden. So lassen sich mit einem Klick alle archivierten Bilddateien innerhalb einer Verzeichnisstruktur transformieren. Ein Assistent hilft zudem bei der Deklaration der zu überwachenden Ordner. Darin neu angelegte Dateien werden automatisch bearbeitet.
- IRISPdf 6 Server bietet nun auch XML als Ausgabeformat. Es kann detaillierte Informationen über den erkannten Text und die Position jedes Zeichens enthalten. Auch die Berichtsdatei liegt nun im XML-Format vor, so dass sie sich leicht in ein Dokumenten-Management-System einbinden lässt. Die Datei kann detaillierte Informationen wie die Position einzelner Zeichen, den Grad der Erkennungs-genauigkeit für jeden Buchstaben und mehr enthalten.
- Der aus dem OCR-Prozess resultierende Text wird mit dem Vorlagenbild zu einer PDF-Abbilddatei verknüpft, die sich nach Zeichenfolgen durchsuchen lässt. Gefundene Stellen werden darin farbig markiert. Das generierte PDF kann nun auch eingebettete Schriftarten verwenden. Beim Erstellen von PDF-Abbildern besteht die Möglichkeit, die Bildauflösung zu verringern und die JPEG-Kompression zu ändern – unabhängig davon, ob das PDF-Dokument Textdateien enthält.
- Erkennung von Barcodes und Steuerung der Dokumentenverarbeitung durch Barcode
Mehr Vorteile von IRISPdf 6 Server:
- XML-Index kann erstellt werden
- Erkennung von Barcodes und leeren Seiten
- Konvertierung von Bilddateien in voll durchsuchbare Dateien im Format PDF, TXT, HTML, XML
- Unterstützung von bis zu 126 Sprachen, darunter (optional) asiatische Sprachen (Chinesisch, Japanisch, Koreanisch), Hebräisch und Arabisch
- Stapelverarbeitung: Conversion von mehreren Dateien auf einmal
- Verzeichnis-Überwachung: Konvertierung aller Bilddateien, die in ein bestimmtes Verzeichnis gespeichert werden
- API zur Integration von OCR in andere Anwendungen
- JPEG2000-Komprimierung
- Neue Formatierungsmöglichkeiten: Hintergrundbilder, farblich markierter Text, Hintergrundfarbe, Papiergröße etc. werden ohne Formatierungsverlust beibehalten
- Noch mehr Ausgabeformate: .doc-Dateien, WordML, PDFs mit Text über Bildern, PDFs mit JPEG2000, HTML und JPEG2000-Bilder
- DualstreamImages werden unterstützt
- E-mail-Benachrichtigung, sobald der Prozess angehalten wird: Wenn ein Bild in Ausnahmefällen nicht in Text umgewandelt werden kann, versucht IRISPdf das Originalbild zu konservieren. In beiden Fällen wird an den Administrator eine Benachrichtigung gesendet.
|