u

Sprachen

u

Security

u

Büro

u

Grafik, DTP

u

Internet

u

Marketing, Geo

u

Multimedia

u

Tools

u

Wissenschaft
abitz.com Multilingual Software

Texterkennungssoftware

 Service  |  Neu  |  Partner  |  TopTen  |  AGB  |  WARENKORB  |  Angebote  |  Sprachenliste  |  Sitemap  |   Support   |  

      
Produktsuche:
Newsletter-Abo

Texterkennungs- software, OCR

ABBYY FineReader 9.0 Corporate Edition

ABBYY FineReader 9.0 Professional

ABBYY FineReader XIX

ABBYY PDF Transformer 2.0

ABBYY Scan To Office

Barcodescanner

CardIris 4

CardScan 800

IRIS Powerscan

IRIScan 2 mobiler Einzugsscanner

IRISCard 4 Visitenkartenscanner Asian Edition

IRISCard Corporate 4 Visitenkartenscanner (3 Lizenzen)

IRISCard mini 4 Visitenkartenscanner

IRISCard Pro 4 Visitenkartenscanner

IRISPdf 7 Server

Keyscan Tastatur-Scanner

OmniPage 16 OCR-Software

PaperPort 11

PaperPort Strobe XP 100 Scanner

Readiris 11 für MAC

Readiris Pro 11

Readiris Pro 11 Corporate Edition

ReadIris Pro 11 Middle East

Syscan DocketPort 465 Mobiler Einzugsscanner

Syscan DocketPort 485 A4 Duplex Scanner

TextBridge Pro 11

 
Einzigartig

Erste Omnifont OCR zur Texterkennung von Frakturschrift und alten europäischen Sprachen

ABBYY FineReader XIX ist eine spezielle Version der vielfach ausgezeichneten OCR Software FineReader für die Erkennung und Digitalisierung von Texten, die zwischen 1800 und 1938 in Frakturschrift gedruckt wurden. ABBYY FineReader XIX ist die erste Omnifont OCR Software am Markt zur Texterkennung von Fraktur und "gotischer Schrift".

ABBYY FineReader XIX

Digitalisierung alter Texte

Bis heute haben die Besonderheiten von Texten, die in Fraktur und anderen alten Schriftarten gedruckt waren, die automatische Erfassung und Digitalisierung dieser Texte durch Computer erschwert, wenn nicht gar unmöglich erscheinen lassen.

Anspruchsvolle Wörterbücher und Sprachmodelle, die für die Analyse und Verifizierung der Texte verwendet werden können, gab es bis jetzt noch nicht. Computersysteme, die diese Texte lesen konnten, mussten erst viele Stunden trainiert werden, um Schriftarten, Buchstaben und Zeichen zu erkennen, die heute gar nicht mehr verwendet werden.

Gebrochene Schriften (Fraktur) entstanden erstmals im 12. Jahrhundert und entwickelten sich im Laufe der Jahrhunderte in vielen verschiedenen Variationen weiter. Die Frakturschrift, vorherrschend in Deutschland, wurde durch Kaiser Maximilian eingeführt und hat sich schnell in vielen Teilen Europas etabliert. Die Besonderheiten dieser Schrift beinhalten das verlängerte “s” und Ligaturen oder zusammenhängende Buchstaben bei bestimmten Kombinationen. Die Erscheinungshäufigkeit dieser Eigenart ist entscheidend für das Verständnis von Frakturschrift, wenn man Erkennungstechnologien für Texte, die in der Zeit zwischen 1800 und 1938 gedruckt wurden, entwickeln möchte.

Die ABBYY Lösung: Erste Omnifont OCR für Frakturschrift

ABBYY FineReader XIX ist die erste Omni-Font OCR (Texterkennung) für Fraktur und somit eine Lösung für Anwender, die alte Texte mit wenig Aufwand scannen und in Computertext umwandeln möchten. Dies wurde durch Kombination einer besonders intelligenten Erkennungs-Technologie und ausführlichen linguistischen Studien erreicht:

OCR-Systeme analysieren Texte und stellen Hypothesen darüber auf, welcher Buchstabe oder welches Wort durch ein Bild dargestellt werden. Diese Hypothesen werden daraufhin im Kontext analysiert und durch den Einsatz anspruchsvoller OCR-Wörterbücher, die aus Sprachmodellen bestehen, verifiziert. Diese Sprachmodelle sind komplexe Datenbanken, die das Vokabular einer Sprache beschreiben. Moderne OCR-Systeme verfügen jedoch über keine Sprachmodelle für ältere Schriftarten oder Schreibweisen. Nach der ABBYY-eigenen Entwicklung von Modellen für fünf europäische Sprachen speziell für diese Zeit können auch derartige Texte nun verarbeitet werden.

Dabei wurden 10 verschiedene Wörterbücher und mehr als 105 Bücher, die zwischen 1808 und 1930 veröffentlicht wurden, analysiert. Linguisten überprüften Wortstämme, identifizierten Wörter, die bei der Entwicklung der Sprache nicht weitergeführt wurden, und bestimmten die korrekten Paradigmen, um die Sprachmodelle mit der entsprechenden Grammatik jener Zeit abzugleichen. Mehr als 500.000 Einträge wurden zusätzlich manuell mit bestehenden Wörterbüchern von FineReader verglichen. Grammatikalische Paradigmen und Wortentwicklungen wurden berücksichtigt, um 159 historische Grammatik-Paradigmen, die in den heutigen Sprachmodellen fehlen, hinzuzufügen. Diese Sprachmodelle wurden dann zusammengestellt und an Dokumenten in Frakturschrift getestet.

Um Fraktur zu erkennen, haben die Entwicklungsteams von ABBYY spezielle Klassifizierer oder Alphabete erstellt, die Frakturzeichen erkennen können. Das bedeutet, dass für jedes Zeichen durchschnittlich 2.500 Variationen hinterlegt, ein neues Muster-Alphabet angelegt und 31.000 Seiten aus verschiedenen Quellen gesammelt und getestet wurden. Mit einer Vielzahl von Beispieltexten bekam die Erkennungs-Engine die Feinabstimmung, um die Besonderheiten des Fraktur-Alphabets wie Ligaturen oder zusammenhängende Buchstaben zu erlernen. Das neue Alphabet wurde dann dem herkömmlichen FineReader System mit einer entsprechenden Oberfläche hinzugefügt und nochmals ausgiebig getestet.

Die wichtigsten Merkmale und Funktionen

ABBYY FineReader XIX basiert auf der OCR Software ABBYY FineReader Corporate Edition. Diese verfügt über eine benutzerfreundliche Oberfläche mit einem Scan&Read Assistenten, der Anwender durch den Prozess des Scannens und der Umwandlung eines Dokuments führt. Einmal umgewandelt, kann der Text einfach bearbeitet und in vielen gängigen Dateiformaten wie Microsoft Word, TXT und durchsuchbaren PDF-Dateien gespeichert werden. Auch das Layout wird übernommen, so dass Spalten, die Position von Bildern und Tabellen wie im Original erscheinen.

Neben den Basisfunktionen von FineReader ist FineReader XIX auch in der Lage, alte Texte mit kunstvollen Schriftarten zu erkennen. Dazu gehören Texte mit schmückenden Ornamenten und romanischen Buchstaben wie das verlängerte „s“, die in frühen englischen und französischen Texten verwandt wurden. FineReader XIX unterstützt folgende Arten von Frakturschrift:

  • Sprachen: Deutsch, Englisch, Französisch, Italienisch und Spanisch
  • Schriftarten: Fraktur, Schwabacher und viele Texturschriften (Gotische Schriften)
  • Ausgabe-/Speicherformate: PDF, MS Word (.DOC), MS Excel (.XLS), WordPro, WordPerfect, RTF, HTML, DBF, CSV, TXT und MS Word, XML
  • Oberflächensprachen: FineReader XIX ist ein internationales Programm und unterstützt 17 Oberflächensprachen: Deutsch, Englisch, Französisch, Italienisch, Spanisch, Portugiesisch, Niederländisch, Schwedisch, Russisch, Polnisch, Tschechisch, Slowakisch, Ungarisch, Bulgarisch, Ukrainisch, Estnisch und Litauisch.

Lizenzierung

Sie erweben eine Lizenz für Finereader XIX, die Sie dazu berechtigt, wahlweise bis zu 2.500, 10.000 bzw. 25.000 Seiten in Fraktur o.ä. ohne zeitliche Beschränkung zu digitalisieren. Ist die gewählte Seitenanzahl erreicht, d.h. ab Seite 10.001 bzw. 25.001, können Sie die Lizenz erneuern (gilt nicht für Lizenzen mit einem Anfangsvolumen von 2.500 Seiten). Die Erneuerung einer Lizenz liegt natürlich unter dem Preis der Erstlizenz. Alle Lizenzen sind mit einem USB-Hardlock geschützt, welcher im Preis enthalten ist. Nach Ablauf der Lizenz steht Ihnen die Erkennung von Fraktur nicht mehr zur Verfügung. Moderne lateinische Schriften, Druck, Schreibmaschine usw. werden weiterhin erkannt.

 

FineReader 9.0 Professional: OCR für 177 Sprachen

Fraktur-Font: TrueType-Schriften Altdeutsch und Sütterlin

Resümee:

Erste Omnifont OCR zur Erkennung von Frakturschrift, gotischer Schrift, Schwabacher und alten europäischen Sprachen.

System:

PC Pentium mit Windows 98/Me/NT 4.0 ab SP6/2000/XP/2003; 64 MB RAM (32 MB für Win 98/Me); 230 MB freier Festplattenspeicher; 100% TWAIN-kompatibler Scanner, Digitalkamera oder Faxmodem; Videokarte und Monitor (min. Auflösung 800x600)

 

 

Menge Artikel-Nr Artikel-Name Bruttopreis Warenkorb
280334 FineReader XIX Fraktur-OCR, 2.500 Seiten
Lizenz für bis zu 2.500 Seiten in Fraktur und unbegrenzte Anzahl in moderner lateinischer Schrift.
Versandfertig in der Regel innerhalb 3-5 Tagen
398.00 EUR
Preise inklusive Mehrwertsteuer, zuzüglich Versandkosten. Klicken Sie hier für mehr Informationen.
280330 FineReader XIX Fraktur-OCR, 10.000 Seiten
Versandfertig in der Regel innerhalb 3-5 Tagen
1055.60 EUR
Preise inklusive Mehrwertsteuer, zuzüglich Versandkosten. Klicken Sie hier für mehr Informationen.
280332 FineReader XIX Fraktur-OCR, 10.000 Seiten, Erneuerung einer bestehenden Lizenz
Lizenz zur Digitalisierung weiterer 10.000 Seiten. Die Software selbst ist nicht enthalten!
Versandfertig in der Regel innerhalb 3-5 Tagen
638.00 EUR
Preise inklusive Mehrwertsteuer, zuzüglich Versandkosten. Klicken Sie hier für mehr Informationen.
280331 FineReader XIX Fraktur-OCR, 25.000 Seiten
Versandfertig in der Regel innerhalb 3-5 Tagen
1738.84 EUR
Preise inklusive Mehrwertsteuer, zuzüglich Versandkosten. Klicken Sie hier für mehr Informationen.
280333 FineReader XIX Fraktur-OCR, 25.000 Seiten, Erneuerung einer bestehenden Lizenz
Lizenz zur Digitalisierung weiterer 25.000 Seiten. Die Software selbst ist nicht enthalten!
Versandfertig in der Regel innerhalb 3-5 Tagen
1042.84 EUR
Preise inklusive Mehrwertsteuer, zuzüglich Versandkosten. Klicken Sie hier für mehr Informationen.

 

 Service  |  Neu  |  Partner  |  TopTen  |  AGB  |  WARENKORB  |  Angebote  |  Sprachenliste  |  Sitemap  |   Support   |  

abitz.com GmbH,   Wipperstr. 12, 12055 Berlin, Tel.: 030 684 72 90, Fax: 030 685 70 61, abitz@abitz.com ; Impressum
Alle Preise inkl. ges. Mwst zzgl. Versand.

Alle Warenzeichen und Produktnamen sowie Teile der Produktbeschreibungen sind Eigentum der jeweiligen Hersteller.
© 2001-2008 abitz.com GmbH. Alle Rechte weltweit vorbehalten. Vorangegangene Preislisten sind nichtig. Fehler, Irrtümer und Änderungen vorbehalten.

u

Sprachen

u

Security

u

Büro

u

Grafik, DTP

u

Internet

u

Marketing, Geo

u

Multimedia

u

Tools

u

Wissenschaft