Antwort schreiben 
Rikaichan's Pate fuer die Deutsche Datei
Verfasser Nachricht
zongoku unangemeldet
Gast

 
Beitrag #1
Rikaichan's Pate fuer die Deutsche Datei
Weiss jemand, wer Pate stand und steht fuer das Deutsche-Japanische Woerterbuch von Rikaichan?
Und wie heisst dessen Webseite, oder gibt es einen Link dahin?

Danke.
16.07.14 00:52
Diese Nachricht in einer Antwort zitieren
frostschutz
Technik

Beiträge: 1.780
Beitrag #2
RE: Rikaichan's Pate fuer die Deutsche Datei
Das basiert auf JMDict, steht zumindest so wenn man das Wörterbuch auf addons mozilla aufruft und dann in Versionsinformationen schaut.

Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
16.07.14 11:49
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
zongoku unangemeldet
Gast

 
Beitrag #3
RE: Rikaichan's Pate fuer die Deutsche Datei
Danke schoen.

JMdict also kommt es von Jim Breen.
17.07.14 15:10
Diese Nachricht in einer Antwort zitieren
zongoku unangemeldet
Gast

 
Beitrag #4
RE: Rikaichan's Pate fuer die Deutsche Datei
Rikaichan.
http://www.polarcloud.com/rikaichan/

Es gibt verschiedene Woerterbuecher mit Rikaichan.
So auch japanisch-Deutsch.
http://www.polarcloud.com/getrcx/?g=de

Rikaichan kann man mit Firefox runterladen, aber dann wird es sofort als Addon in Firefox integriert.
Laedt man es zB. mit Opera runter, so kann man es in seinen Download Archiv deponieren.
Die Datei, welche die Daten enthaelt ist eine .xpi Datei.
Laut Wiki ist dies eine gepackte Datei. Also in etwa die einer .zip Datei.

Nun kann man diese Datei anklicken und sie wird in Firefox integriert.
Man kann aber diese auch mit einem anderen Programm oeffnen bzw. entpacken.
Ich hab es mit Zipeg auf dem Mac probiert.

Entpackt kommen da einige Dateien zum Vorschein. So auch die Datei, welche die Daten enthaelt.
dict.sqlite
Erklaerung zu sqlite und womoeglich auch interessant fuer Linux-User.
http://de.wikipedia.org/wiki/SQLite

Ich hab die Datei umbenannt in zB. .htm oder .html

Die Deutschen Begriffe sieht man, jedoch wird aus den Kanji, Buchstabensalat.
Mich wuerde diese Datei als Kanji-Kana und Uebersetzung interessieren.
Aber ein umlernen von anderen Systemen, da ist mir jetzt schon der Kopf zugewachsen.

Die japanisch-Deutsche Version, beinhaltet auch einige Englische Uebersetzungen, aber man wird verschont mit Russisch und so.

Kann da jmd, was damit anfangen?
Oder daraus eine Unicode Datei herstellen?

Danke.
17.07.14 16:15
Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 1.388
Beitrag #5
RE: Rikaichan's Pate fuer die Deutsche Datei
(17.07.14 16:15)zongoku unangemeldet schrieb:  Kann da jmd, was damit anfangen?
Oder daraus eine Unicode Datei herstellen?

Hallo Zongoku,

ich habe den Inhalt der sqlite-Datei mal in eine Textdatei in UTF8-Kodierung extrahiert. Du findest sie hier (~ 20 MB).
Das Zeichen '|' dient als Delimeter der einzelnen Spalten. Allerdings ist manchmal auch in der Spalte der Übersetzung Japanisch zu finden.
Ich hoffe, du kannst damit trotzdem etwas anfangen.
17.07.14 16:46
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
zongoku unangemeldet
Gast

 
Beitrag #6
RE: Rikaichan's Pate fuer die Deutsche Datei
Wow, vielen herzlichen Dank, vdrummer,

Das ist enorm.
Ja sicher, damit kann ich was anfangen. Auch wenn es, wie du sagst, einiges in einer anderen Spalte zu finden ist. Oder ein Eintrag ist doppelt zu sehen. Dann kann das einiges bedeuten, dass der Begriff noch mit anderen Kanji geschrieben werden kann.

Und nun kann es weitergehen.
MIt einem Programm wie zB. macHacha, kann man uebergrosse Dateien, splitten. Dh. dass man diese Dateien in kleinere Formate unterteilen kann. Jedenfalls beim Mac funktioniert es.

Zuerst versuche ich die Datei ohne Datenverlust abzuspeichern.
Damit meine ich, wenn ich die Datei wieder oeffne, die Kanji immer noch vorhanden sind und kein Buchstabensalat angezeigt wird.

Abspeichern ist moeglich.
Neu laden von .txt sind die Kanji verschwunden.
Versuche die Datei mit Word ueber die .url zu laden, da hab ich das Gefuehl, als ob Word sich aufhaengt.
Jedenfalls dauert der Ladevorgang eine Ewigkeit.

20 MB ist ja auch eine ganze Menge Material. Ist dies die Ganze Datei?

Abspeichern mit .txt ok.
Dann diesen Anhaengsel in .html umbenennen.
Dann die Datei mit Firefox.app wieder oeffnen und die Kanji sind vorhanden.
Abermals abspeichern unter .html als Ganze Webseite und man kann die Datei mit Opera auch oeffnen.
Nur die Formattierung geht bei der Prozedur verloren.

Ein einheitliches Zeichen fuer Wagenruecklauf oder Ende des Datensatzes und Beginn des neuen Datensatzes ist hier nicht zu sehen.

Aber jetzt kann der Laie, der Student sich doch einiges ansehen und gegebenfalls, sich einige Dateien zusammenstellen. ZB fuer geraeuschwoerter. Der Link im A-Z ist nicht mehr aktuell. Die Seite gibt es nicht mehr.

Mit der Suche nach diesem Begriff, kann dann einjeder sich die Daten zusammensuchen.
on-mim

Ich habe deine Datei mit .csv gespeichert. Und dann mit Excel aufgemacht.
Bei 232.388 Zeilen wurde Excel ploetzlich unterbrochen. Die Formattierung des Textes ist vorhanden, die Kanji dagegen sind verschwunden. Ich hab dann nachgesehen was eigentlich passiert ist.
Ich nehme an, dass Excel ein End-of-file nicht gefunden hat.
Daher die Unterbrechung.

------
Ich speichere mal meine bisherige Arbeit und Untersuchung ab. Beim Experimentieren, koennte sich mein Firefox doch auch mal aufhaengen.
Dann waer alles fuer die Katz.

Ich hab aber bis jetzt schon einiges erfahren koennen. Es gibt noch viele Begriffe, die ich noch in keinem anderen Woerterbuch finden konnte. Das will schon was heissen.
Es gibt auch Webseiten wie goo oder Alc, welche verschiedene Begriffe nicht haben.

Die wwwjdic Webseite aus Australien ist womoeglich offline.
Es gibt eine Alternative dazu.
http://wwwjdic.biz/cgi-bin/wwwjdic?1E

Weblio 窃盗癖 wandelt diese Kanji sofort in die neuere Variante um.
窃盜癖|せっとうへき|(n,iK) (f) Kleptomanie

Da sieht man wie unterschiedlich doch verschiedene Woerterbuecher arbeiten.
Ich hatte lediglich folgende Begriffe dazu.

1 KLEPTOMANIE byootekisettoo // krimi 病的窃盗
2 KLEPTOMANIE dorobookonsei // krimi 泥棒根性
3 KLEPTOMANIE kaginote // krimi
4 KLEPTOMANIE tekuse // krimi 手癖
5 KLEPTOMANIE tenaga // krimi 手長
6 KLEPTOMANIE tooheki // med + 盗癖

Die Begriffe 窃盗癖 und 窃盜癖 hatte ich nicht. Bei fast einer Million, Da will schon was heissen.

Und ich frag mich dann doch eins, ob manche Woerterbuecher nicht einige Fehler haben?
泥棒根性,どろぼうこんじょう,diebische (f) Veranlagung
17.07.14 19:13
Diese Nachricht in einer Antwort zitieren
...
Gast

 
Beitrag #7
RE: Rikaichan's Pate fuer die Deutsche Datei
Die deutschen Übersetzungen im JMDict kommen ja von Wadoku. Inwiefern es da noch eine Eigenbearbeitung gibt, bzw. wie aktuell die Daten sind, kann ich nicht sagen. Aber ich hätte ja gleich JMDict oder die Wadokudaten als Ausgangsbasis genommen, anstatt noch über Zwischenformate (wadoku->jmdict->rikaichan->csv->excel->...) hin- und herzukonvertieren.
17.07.14 19:37
Diese Nachricht in einer Antwort zitieren
zongoku unangemeldet
Gast

 
Beitrag #8
RE: Rikaichan's Pate fuer die Deutsche Datei
Die Wadokujt Daten sind heutzutage so formatiert, die lassen sich nach dem entpacken nicht mal mehr oeffnen. Es wurden womoeglich Programme benutzt, die ich nicht kenne.
Und mit .xml komme ich auch nicht klar.

Es war ein Versuch wert denke ich.
Ein anderes Verfahren um die Daten so zu sehen, wie sie vdrummer sie hier bereitgestellt hat, waere kleinere Teile zu markieren, kopieren und diese ueber die E-Mail sich selber zuschicken.
Das geht auch. Nur darf die Mail keine 20 MB haben, denn sonst geht Firefox zu Bruch.

Und ich denke dass damit einige hier im Forum sehen, wie man Daten manipulieren kann.
Oder wie man sich behelfen kann, wenn ein oder das andere Problem auftaucht.

Na wer sagt es denn! Ja die Verschickung mit der Mail funktioniert ohne Formatierverlust und ohne Kanji-Verlust.

Die Datei ist jedoch nicht nur eine wadoku Datei. Denn sie enthaelt auch Englische Uebersetzungen.
Aber man kann unbesorgt sein.
Alles brauch ich ja sowieso nicht. Und am Ende sieht die Datei nicht mehr nach Japanisch aus. Denn sie wird, wie meine Datei sein, als pure Romaji Datei.
Von den vielen Zusaetzlichen Informationen wie (adv, adj, v1 etc) werde ich keines uebernehmen.

Ich hab die Datei in 8 Teilen an mich verschickt.
-----------------

Was kann ich damit tun?
Es gibt nun viel zu tun. So kann ich die Daten nicht stehen lassen.
Ob die Community hier interessiert, was damit geschehen wird?
17.07.14 20:10
Diese Nachricht in einer Antwort zitieren
zongoku unangemeldet
Gast

 
Beitrag #9
RE: Rikaichan's Pate fuer die Deutsche Datei
@vdrummer und alle anderen, die an der Datei interessiert sind.
Ich habe eine Zip Datei erstellt, diese koennt ihr runterladen und entpacken.
Ich hab es hinbekommen, die Datei in .html umzuwandeln. Diese Riesengrosse Datei ist nun in 8 Teilen abgelegt.


hier
Und die ichi-Dan und go-Dan Verben aus der edict Datei findet man
hier

Die Admins, koennen diese Dateien in ihr Repertoire uebernehmen, wenn sie das wollen.
Ich hab nichts dagegen. Denn eines ist sicher. Ich weiss nicht wie lange ich das in meiner Dropbox haben werde. Und was mich noch mehr beunruhigt, ist die Tatsache dass viele Webseiten mit Jim Breens Daten vom Internet verschwinden.

Warum dies geschieht, weiss ich aber auch nicht.
18.07.14 02:08
Diese Nachricht in einer Antwort zitieren
zongoku unangemeldet
Gast

 
Beitrag #10
RE: Rikaichan's Pate fuer die Deutsche Datei
Ich habe den ersten Teil von 8 aufgearbeitet.
Und zwar mit Word. In diesem allein, gibt es ca 65.000 +/- Deutsche Uebersetzungen.
Diese Datei ist enorm. Ich denke dass es in etwa 650.000 Deutsche und Englische Uebersetzungen gibt.

Klevere Koepfe, koennen aus diesem Material nun eigene Abfrage Datenbanken erstellen.
Rikaichan arbeitet ja nur von japanisch --> hin zu Deutsch. Mit dem Deutschen Begriff, sucht Rikaichan ja nicht.

Es hat keinen Sinn zusaetzlich die Wadokujt Datei oder eine Edict Datei einfliessen u lassen, da diese Datei beide bereits umfasst.

Noch groessere Dateien gibt es wohl im Internet. Aber all diese basieren auf der Englischen Uebersetzung.
Die wwwjdic Datei mit ihren Beispielsaetzen waere noch zu erwaehnen. Oder Alc und Goo.
Oder jene von Weblio.

http://www.weblio.jp/
oder von ejje
http://ejje.weblio.jp/ 9.750.000 Uebersetzungen. Tendenz steigend.


Diese lassen sich meines Wissens nicht runterladen.
Und sie haben keine Funktion wie jene von Rikaichan oder ich hab die noch nicht gefunden.

Die Funktion mit Doppelklick auf einen Begriff, dass sich dieser in die Suchmaske selber kopiert, haben sie auch noch nicht. Wadokujt hat es mitlerweile integriert.
Wer sich noch einige Fachbegriffe ansehen will, kann sich mal bei wadokukeizai umsehen.
Zum Augenblick dieses Beitrages sind dort jetzt ca. 35.000 Begriffe eingebaut.
http://www.wadokukeizai.de/

Ich wuensche viel Spass mit all dem Material.

zongoku.
19.07.14 05:27
Diese Nachricht in einer Antwort zitieren
Rikaichan's Pate fuer die Deutsche Datei
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
Deutsche Website/App zum Kanji und Vokabeln lernen Robinchen 3 2.606 01.07.16 09:04
Letzter Beitrag: Mayavulkan
Rikaichan + Anki Shino 4 3.414 29.05.16 19:55
Letzter Beitrag: Nia
Rikaichan Names Dicitionary Abkürzungen afi 2 1.746 01.06.15 13:54
Letzter Beitrag: junti
WaDoku + Kanji-Browsing fuer Sharp Zaurus und PC muffelwild 9 7.757 09.03.12 11:20
Letzter Beitrag: Sagasu
Rikaichan und Firefox-Update gojira 2 2.088 06.11.10 10:27
Letzter Beitrag: gojira