Antwort schreiben 
Suche Konversionstabellen Kanji -> Hanzi
Verfasser Nachricht
harerod


Beiträge: 693
Beitrag #1
Suche Konversionstabellen Kanji -> Hanzi
Heute kamen Schrauben an, welche ein netter Mensch für mich in China verpackt hat. Der Aufkleber auf dem Tütchen enthält mehr als zur Hälfte Schriftzeichen, die ein Japanischstudent lesen kann. Die Bezeichnung enthält das Hanzi Kurzzeichen 头 für 頭. Damit ist alles klar - selbstschneidende 6-Kant Inbusschrauben. Witzig auch der Zähler für Schrauben - Reiskorn 粒.
Dieser Aufkleber hat mich dazu gebracht, das Thema Transliteration von Kanji nach vereinfachten Hanzi anzuschauen. Wichtig ist die Richtung, denn rückwärts von vereinfacht nach traditionell ist nicht eindeutig. [2]

Das ganze Thema ist spannend. Am Anfang hatte ich gehofft, dass die Vereinfachung immer einzelne Grapheme (電話 -> 电话) betrifft und eindeutig ist. 头 ist leider schon das erste Gegenbeispiel.

Ich sehe hier mit relativ wenig Zusatzaufwand einen echten Mehrwert, da ich auch beruflich öfters chinesische Unterlagen auf den Tisch bekomme.

Ich möchte nun meine Kanjisammlung um ein weiteres Feld ergänzen - traditionelle/vereinfachte chinesische Varianten des Kanji. Hierfür suche ich nun eine Konversionstabelle Kanji -> Hanzi.

Eine erste Suche hat Online-Konverter gefunden, z.B. [4]. Hier würde mich interessieren, welche Datenbank der Autor benutzt, habe ihn aber noch nicht angeschrieben (bisserl dürftiges Impressum, aber Email-Funktion vorhanden).
Die gewünschten Informationen sind auch in Jack Halperns Kodansha Kanji Dictionary (KKD2013) enthalten. Ich könnte sie dort herauskratzen, wäre ein schöner Zeitvertreib für die nächsten Monate.


[1] https://de.wikipedia.org/wiki/Kurzzeichen

[2] https://cjki.org/c2c/c2cbasis.htm

[3] https://www.cjk.org/data/chinese/nlp/chi...onversion/

[4] https://www.khngai.com/chinese/tools/convert.php

Tja, ich habe zwischenzeitlich mal den Autor von [4] angeschrieben und weiter gesucht nach "kanji to hanzi conversion table".
Das gab viele interessante Treffer. Volltreffer für meinen Zweck: im Quelltext von
https://github.com/afoster8/character-converter.git
findet sich auch eine Tabelle, mit dem Copyright-Vermerk:

This copyright notice appears at the top of the kanji mapping table.

----------------------------------------------------------------------------------------
This resource is a Chinese character mapping table of Japanese (Kanji), Traditional
Chinese (TC) and Simplified Chinese (SC).

- Data format
Kanji[TAB]TC[TAB]SC

For more details, please refer to the following paper. Also, if you use this resource,
please cite this paper.

Chenhui Chu, Toshiaki Nakazawa and Sadao Kurohashi:
Chinese Characters Mapping Table of Japanese, Traditional Chinese and Simplified Chinese
In Proceedings of the Eighth Conference on International Language Resources and Evaluation
(LREC2012), pp.2149-2152, Istanbul, Turkey, (2012.5).

Contact: chu@nlp.ist.i.kyoto-u.ac.jp
----------------------------------------------------------------------------------------


Einfacher Test von "kanji_mapping_table.txt":
話 話 话

Das sollte erstmal reichen, für meinen sehr limitierten Fokus.
Der automatische Eintrag in meine Anki-Datenbank würde dann laufen:
- sqLite/Anki Datenbank öffnen
- erste Spalte auf "Kanji print" matchen
- zweite Spalte unter TC eintragen
- dritte Spalte unter SC eintragen


Insgesamt ist das Thema SC/TC Hanzi/Kanji sehr umfangreich. Ein bisserl Beifang Unicode/SCTC:
https://www.unicode.org/reports/tr38/index.html#SCTC


.txt  kanji_mapping_table_2.txt (Größe: 91 KB / Downloads: 8)


Angehängte Datei(en) Thumbnail(s)
   
(Dieser Beitrag wurde zuletzt bearbeitet: 05.06.25 23:28 von harerod.)
05.06.25 22:31
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
harerod


Beiträge: 693
Beitrag #2
RE: Suche Konversionstabellen Kanji -> Hanzi
Ich schrieb gestern in meiner Unwissenheit: "Das ganze Thema ist spannend. Am Anfang hatte ich gehofft, dass die Vereinfachung immer einzelne Grapheme (電話 -> 电话) betrifft und eindeutig ist. 头 ist leider schon das erste Gegenbeispiel."

Gerade läuft mir dieses wunderschöne Zeichen über den Weg:
議 -> SC: 议
義 -> SC: 义
言 -> wird als Graphem als Strich und Haken abgekürzt.
Genau solche Regelmäßigkeiten suche ich.

Ich habe jetzt die gezeigte "kanji_mapping_table.txt" im Notepad++ offen und trage während des täglichen Lernens von Hand die TC/SC Zeichen in mein Anki-Deck ("Kanji Briefmarkensammlung") ein. Ist vielleicht garnicht so schlecht, dadurch sehe ich jeden Tag 30..50 Mappings und bekomme ein Gefühl für die Thematik.

Bei der Volltextsuche springt der Editor zum nächsten Treffer und unterlegt alle Treffer farbig. Dadurch sehe ich sofort, ob ein Zeichen in Kanji SC TC gleich ist, sprich den selben Unicode-Punkt haben. Wichtig bei kleinen Detailunterschieden, die der Font vielleicht nicht auflöst oder die ich schlicht übersehe.
(Dieser Beitrag wurde zuletzt bearbeitet: 06.06.25 13:47 von harerod.)
06.06.25 13:28
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Suche Konversionstabellen Kanji -> Hanzi
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
森 und andere Kanji aus drei gleichen Radikalen Haruto 28 5.283 22.08.24 18:37
Letzter Beitrag: Kikunosuke
Wilde Kanji harerod 9 3.115 27.05.24 20:58
Letzter Beitrag: harerod
das Bild meines Neffen mit Kanji, die ich nicht kenne yamaneko 4 1.233 23.01.24 21:53
Letzter Beitrag: Nia
Datum eines (alten?) Kanji auf Grabstein - Erledigt rantanplan 5 2.081 05.09.22 10:56
Letzter Beitrag: cat
Pitchaccent: (zusammengesetzte) Wörter mit 3 Kanji und mehr 梨ノ木 20 12.196 05.12.20 22:44
Letzter Beitrag: cat