Antwort schreiben 
Problem mit kanjidic bzw. kdfilt.exe
Verfasser Nachricht
Anonymer User
Unregistriert

 
Beitrag #1
Problem mit kanjidic bzw. kdfilt.exe
Hallo,

ich benutze auf meinem PDA das "Mini Japanese Dictionary for Pocket PC" von Mike Johnson. Wer dieses Programm kennt, weiss, dass es die Funktion bietet, Kanji aus einem Wörterbuch wie dem Wadokujiten zu suchen und diese dann auszuwählen und sich Informationen wie Strichzahl, Nelson-Nummer etc. anzeigen zu lassen. Dafür nutzt es die Datei "kanjidic" von der Monash-Seite. Dort gibt es auch das Tool "kdfilt.exe". Damit kann man angeblich Indexeinträge aus dem kanjidic löschen, was sehr praktisch wäre, da ich die Nummern eines Kanji z.B. im Morohashi nicht unbedingt brauche, und das Ganze beim Nachschlagen von Komposita auf dem PDA-Bildschirm schnell unübersichtlich wird.

Wenn ich nun kdfilt in der Kommandozeile von XP mit den entsprechenden Parametern ausführe, hat das kanjidic danach eine Größe von 0KB und ist leer. kratz
Habe es jetzt wirklich zig-mal versucht und komme nicht weiter. Kann es sein, dass kdfilt unter XP nicht funktioniert, oder liegt das Problem auf meiner Seite und ich habe was übersehen?

Schon mal danke für Eure Mühe,
Stephan
11.02.06 05:44
Diese Nachricht in einer Antwort zitieren
frostschutz
Technik

Beiträge: 1.643
Beitrag #2
RE: Problem mit kanjidic bzw. kdfilt.exe
Hallo,

ich kenn das kdfilt.exe Programm leider nicht, kann dir da also nicht weiterhelfen. Aber das kanjidic ist eine stinknormale Textdatei - jedes Kanji eine Zeile, die einzelnen Einträge durch Leerzeichen getrennt. Am Anfang der Zeile steht das Kanji, gefolgt von einem Leerzeichen, danach kommen in beliebiger Reihenfolge die Zusatzeinträge (z.B. "IN393" für Hadamitzky-Nummer 393), wieder gefolgt von Leerzeichen, usw.

Du könntest die kanjidic-Datei in einem Texteditor mit einer brauchbaren Suchen&Ersetzen Funktion (Regexp-Funktion oder vergleichbares) laden und damit alle unerwünschten Einträge entfernen.

Ob durch fehlende Einträge die Anzeige dann übersichtlicher wird, hängt allerdings auch von dem anzeigenden Programm ab.

Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
(Dieser Beitrag wurde zuletzt bearbeitet: 11.02.06 10:53 von frostschutz.)
11.02.06 10:53
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Anonymer User
Unregistriert

 
Beitrag #3
RE: Problem mit kanjidic bzw. kdfilt.exe
Hallo frostschutz,

erstmal danke für die schnelle Antwort.

Ich weiß. dass das kanjidic eine EUC-Textdatei ist, die man also mit Word oder Excel öffnen kann. Wenn ich aber in einem der Programme z.B. sage :"Ersetze alle Wörter, die mit M anfangen, mit nichts" (um die Morohashi-Nummern zu entfernen), dann werden ja auch alle Wörterbucheinträge, die mit M beginnen (also z.B. "Maus", Mond", etc.), gelöscht. Das bringt mich also nicht weiter.
Und "zu Fuß" 3550 Einträge zu editieren, ist mir auch ein wenig zu mühsam.

Nachdem ich mir jetzt etwas Wissen über regexp-editoren angelesen habe, glaube ich, dass ich dafür -"informatisch" gesehen- den Allerwertesten etwas zu weit unten habe.
Wenn Du aber eine Seite mit einem Tutorial dazu kennst, das man auch verstehen kann, wenn man keiner höheren Sprache mächtig ist, nehme ich das gerne nochmal in Angriff. Vielleicht kann das Ergebnis ja auch noch jemand anderes brauchen.

Auf alle Fälle schon mal danke,
Stephan
12.02.06 02:08
Diese Nachricht in einer Antwort zitieren
frostschutz
Technik

Beiträge: 1.643
Beitrag #4
RE: Problem mit kanjidic bzw. kdfilt.exe
Zitat:Wenn ich aber in einem der Programme z.B. sage :"Ersetze alle Wörter, die mit M anfangen, mit nichts" (um die Morohashi-Nummern zu entfernen), dann werden ja auch alle Wörterbucheinträge, die mit M beginnen (also z.B. "Maus", Mond", etc.), gelöscht. Das bringt mich also nicht weiter.

Ja, die Bedingung musst du schon etwas genauer formulieren, z.B. alles was mit M anfängt und dann von mindestens einer bis beliebig vielen Ziffern (0-9) gefolgt wird. Bei Perl-Regexp wäre der Ausdruck dafür z.B. "M[0-9]+".

Wenn du mir sagst, welches Kanjidic du genau verwendest (direkter Download-Link?) und welche Einträge davon du rausgeschnitten haben möchtest (M, IN, usw.), kann ich dir das gerne machen. Ist für mich eine Sache von 10 Minuten (1:50 Minuten downloaden, 10 Sekunden rausschneiden, 8 Minuten mailen/hochladen).

Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
12.02.06 02:38
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Mokujin


Beiträge: 6
Beitrag #5
RE: Problem mit kanjidic bzw. kdfilt.exe
So,
jetzt habe ich mich als ordentlicher User erstmal registriert.
Also das ursprüngliche File habe ich von folgender Adresse:

http://ftp.funet.fi/pub/culture/japan/mi...idic_de.gz

Ich habe jetzt auch schon mal ein bisschen mit "Regex Power" rumgespielt, kriege es aber nicht geregelt, wenn dann irgendwo die Indizes mit Buchstaben und Zahlen abwechselnd angegeben werden und dann an jeder Stelle beides oder ein Punkt stehen können und dann auch noch der String im gleichen Index eine unterschiedliche Länge haben kann...aua!
Ich wäre Dir wirklich extrem dankbar, wenn Du die 10 Minuten von Deiner Lebenszeit abzwacken könntest...

Laut dieser Page

http://www.csse.monash.edu.au/~jwb/kanjidic.html

hätte ich gerne raus:
U;C;G;H;F;P;K;L;Q;MN;MP;E;Y.
Oder andersrum: Ich brauche nur die Nummer im Nelson, das Radikal nach Nelson, die Strichzahl, die Nummer im Spahn/Hadamitzky und natürlich die Lesungen und Übersetzungen.

Wenn Du allerdings keine Zeit für sowas hast, setze ich mich in den ja glücklicherweise bevorstehenden Semesterferien mal ein, zwei Tage dran, dann sollte es mit etwas Handarbeit auch so hinhauen..
12.02.06 06:21
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
frostschutz
Technik

Beiträge: 1.643
Beitrag #6
RE: Problem mit kanjidic bzw. kdfilt.exe
Hmmm, etwa so?

http://rapidshare.de/files/13088680/kanj...de.gz.html

(Auf Free/Download klicken)

Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
12.02.06 12:28
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Mokujin


Beiträge: 6
Beitrag #7
RE: Problem mit kanjidic bzw. kdfilt.exe
Genau so!
Sweeeet!!!hoho
Musste es nur noch von Unicode in EUC und Umlaute und ß umwandeln und schon hat´s gepasst. Es sind zwar immer noch ein paar kryptische Zahlen drin, aber bei weitem nicht mehr der ganze Wust.
Danke, danke, danke! grins
12.02.06 18:21
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Problem mit kanjidic bzw. kdfilt.exe
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
Kanji-Anzeige unvollständig - Font-Problem? afi 29 5.618 07.10.14 22:11
Letzter Beitrag: Hellstorm
Rikaisan-Problem e4zaezh 0 789 14.02.13 20:06
Letzter Beitrag: e4zaezh
Sehr seltsames Problem mit Tastatur; nur Vokale killermlichschnitte 4 1.742 02.09.08 03:47
Letzter Beitrag: killermlichschnitte
PROBLEM: japanische Schrift zerstört mein Notebook Anonymer User 8 2.395 12.03.06 12:54
Letzter Beitrag: shakkuri
Microsoft IME Problem - Katakana Shortcut Christof 7 3.304 18.11.05 19:06
Letzter Beitrag: shijin