Antwort schreiben 
OCR - Jap. gedruckten Text auf PC übertragen
Verfasser Nachricht
yakka


Beiträge: 582
Beitrag #11
RE: Jap. gedruckten Text auf PC übertragen?
Erkannten Text (den Du jetzt nicht lesen kannst, weil Du ein westliches System benutzt) als Unicode.txt abspeichern, dann mit Word o.ä. als codierten Text öffnen - und voila.
Oder Applocale vom Microsoft benutzen, dann kannst Du auch (andere) japanische Programme auf dem PC laufen lassen - vorausgesetzt, Du benutzt XP.
06.12.06 22:17
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
fedora


Beiträge: 2
Beitrag #12
RE: Jap. gedruckten Text auf PC übertragen?
danke für die Hilfe ^_________^
08.12.06 17:36
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
(@?@)
Gast

 
Beitrag #13
RE: Jap. gedruckten Text auf PC übertragen?
Alter Faden; ständig aktuelles Thema: OCR für Japanisch.
Ich suche ein Programm für nicht- (bestenfalls halb-)professionelle Ansprüche. Soll heißen, ich habe höchste Ansprüche an die Qualität, kann aber keine 1000Euro dafür berappenhoho Einen humaneren Betrag würde ich aber bezahlen für ein Programm, das

-eine geringe Fehlerquote aufweist
-mehrseitige Dokumente verarbeiten kann
-das Layout mit übernimmt
-auch Chinesisch (vereinfacht und traditionell) versteht

Am liebsten wäre mir ein Programm für OSX, Windows oder Linux könnte ich mir allerdings auch in einer virtuellen Maschine installieren.

Bislang behelfe ich mir mit SmartOCR Lite Edition (für Windows) ( http://ocr.rossa.cc/ ), das ist Freewaregrins, kann aber immer nur einzelne Bilder konvertierenzunge und die Fehlerquote ist doch recht hoch.traurig
08.06.10 09:42
Diese Nachricht in einer Antwort zitieren
tc1970


Beiträge: 216
Beitrag #14
RE: Jap. gedruckten Text auf PC übertragen?
Omnipage 17 soll japanische und chinesische Texte verstehen können.
(Omnipage 16 hatte das noch nicht.)

Bei pearl.de gibt es die Standardversion für 50 Euro und die Professional Version für 100 Euro.
08.06.10 11:56
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Gast
Gast

 
Beitrag #15
RE: Jap. gedruckten Text auf PC übertragen?
Wenn Dir damit geholfen ist, schick mir doch die Scans. Ich versuche es mal mit meiner ReadIris Pro 10 Version.
08.06.10 21:21
Diese Nachricht in einer Antwort zitieren
samidare


Beiträge: 39
Beitrag #16
RE: Jap. gedruckten Text auf PC übertragen?
Sorry, das Angebot kam von mir.
08.06.10 21:23
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
(@;@)
Gast

 
Beitrag #17
RE: Jap. gedruckten Text auf PC übertragen?
Danke für das Angebot, aber dann käme ich ja alle 2-3 Wochen mit Texten angekleckert. cool Mit Hilfe zur Selbsthilfe ist mir daher mehr geholfen, ich werde mir mal Testversionen der genannten Programme ansehen. Wer sich noch berufen fühlt, Erfahrungsberichte zu dem ein oder anderen Programm zu verfassen, sei hiermit herzlich ermuntert sie hier niederzuschreiben!
09.06.10 09:52
Diese Nachricht in einer Antwort zitieren
Nora
Gründerin

Beiträge: 2.095
Beitrag #18
RE: Jap. gedruckten Text auf PC übertragen?
Der alte Faden sei noch mal aus der Versenkung geholt. KanjiOCR läßt sich mit meinem Betriebssystem scheinbar nicht vereinbaren.
Samidare, kannst Du mir sagen, wie Deine Erfahrungen mit ReadIris sind? Über Omnipage wurde im Forum ja schon einmal ganz kurz geredet - haben da noch andere Erfahrungen gemacht? Sind vielleicht japanische Erkennungsprogramme wie E-Typist besser? Die neuen Abby-Versionen unterstützen jetzt auch Japanisch und Chinesisch - hat das mal jemand ausprobiert? Oder gibt es ganz andere Empfehlungen?
(Dieser Beitrag wurde zuletzt bearbeitet: 22.07.10 07:33 von Nora.)
22.07.10 07:16
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
samidare


Beiträge: 39
Beitrag #19
RE: OCR - Jap. gedruckten Text auf PC übertragen
Ich habe 2006 zwei Programme verglichen:
1. ReadIris für westliches Windows mit Asian Add On (nutze ich heute noch) und
2. 読んde!!ココ von AIsoft für japanisches Win XP.

Readiris
------------
Ich habe damals "Readiris Pro 10 Asian" über die Belgische Niederlassung für ca. 180 Euro gekauft (Download und Lizenzschlüssel per E-Mail). Auf http://www.irislink.com findet man mehr Details

Das Asian Add on erweitert die Software um 4 zusätzliche asiatische Sprachen für die Erkennung: Japanisch, Traditionelles Chinesisch, Vereinfachtes Chinesisch und Koreanisch.
Man konnte damals die Version 11 dort auch als Demo runterladen und ausprobieren. Ich habe in Version 11 gegenüber Version 10 in der japanischen Zeichenerkennung allerdings keinerlei Verbesserung in Qualität oder Geschwindigkeit erlebt. Bis heute bekomme ich keine Antwort auf meine Frage, was sich dort die letzte Zeit verbessert hat. Die aktuelle Version ist das "Asian OCR Add-on for IRISPowerscan™ 9"

Yonde
---------
Ich verwendete die Yonde-Version 13, die sich bis heute offensichtlich nicht erweitert hat.

Test
------
Ich habe einen kurzen Test durchgeführt. Bei diesem Test habe ich die gleichen 4 Textseiten mit insgesamt 2.750 Zeichen mit jeweils gleichen Parametern eingescannt und mit einem Text-Diff-Programm verglichen.
Als Scanner verwende ich den Epson Perfection 4990, der für eine Buch-Doppelseite einlesen ca. 14 Sekunden brauchte und für die Doppelseite Erkennung mit ReadIris ca. 0,5 Sekunden mit einem 3,2 GHz-PC.

Ergebnis:
Beide Programme ermöglichen relativ zügiges Wandeln von japanischen Textseiten - z.B. aus einem Buch - in verschiedene Formate, z.B. plain Text oder MS Word. Dabei traten deutlich unterschiedliche Fehlerraten auf.
ReadIris: 36 Fehler
Yonde: 8 Fehler
Allerdings hat sich Yonde manchmal ziemlich deutlich vertan, z.B. hat es ま zu einem 虻 gemacht (siehe pdf unten, rechts sind 8 von den roten Markierungen die yonde-Fehler, leider nicht anders markiert). Das alles ist bei nur einem Test noch nicht sehr aussagekräftig, zeigt aber doch eine Tendenz.

Das Arbeiten mit ReadIris ist zügig, es erkennt Textblöcke und Text-Layout, wobei mich immer nur der reine Text interessiert. Grafiken werden richtig ausgeblendet, Seitenzahlen leider nicht. Ich wünschte mir eigentlich einen fixen Rahmen immer gleicher Größe, in dem ReadIris ausschließlich Texterkennung durchführt. Gibts aber nicht.
Wenn man alle erkannten Rahmen geprüft hat, sind 45 Sekunden für 100 Doppelseiten zwar beeindruckend, aber die Fehler...
Es gibt auch eine Texterkennung auf Fotos, die ich auf Wunsch gerne mal ausprobieren kann.

Ich kenne keine OCR-Software, die nicht deutliche Nacharbeiten erfordert. Im März diesen Jahres habe ich bei Yodobashi nach der besten und neuesten Software gefragt und es war Yonde Version 13. Scheinbar ist das kein Markt in Japan.


Angehängte Datei(en)
.pdf  Yonde-Readiris-Scanvergleich.pdf (Größe: 100,33 KB / Downloads: 450)
(Dieser Beitrag wurde zuletzt bearbeitet: 25.07.10 23:49 von samidare.)
22.07.10 19:10
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Nora
Gründerin

Beiträge: 2.095
Beitrag #20
RE: OCR - Jap. gedruckten Text auf PC übertragen
Lieber Samidare,

vielen herzlichen Dank für diesen ausführlichen Bericht! Das hilft mir schon sehr viel weiter. Dieses WE habe ich außerdem die Möglichkeit, bei einem Sensei das Programm "E-Typist" auszuprobieren. Ich werde dann hier ebenfalls sagen, wie gut das ging.
24.07.10 06:25
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
OCR - Jap. gedruckten Text auf PC übertragen
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
japanisch Speach to Text Phil. 6 2.597 22.11.18 07:27
Letzter Beitrag: Phil.
Japanischer Text unleserlich yamaneko 4 10.320 25.03.11 11:27
Letzter Beitrag: a
aus Romaji Text wird Kana Text Anonymer User 6 5.113 27.03.05 16:41
Letzter Beitrag: Anonymer User
Audio to Text / Stimme in Text umwandeln zongoku 11 9.738 18.03.05 11:27
Letzter Beitrag: zongoku
Header bei HTML Dateien mit jap/chin Text SweetEden 1 2.381 10.08.04 13:09
Letzter Beitrag: eolb