Heute kamen Schrauben an, welche ein netter Mensch für mich in China verpackt hat. Der Aufkleber auf dem Tütchen enthält mehr als zur Hälfte Schriftzeichen, die ein Japanischstudent lesen kann. Die Bezeichnung enthält das Hanzi Kurzzeichen 头 für 頭. Damit ist alles klar - selbstschneidende 6-Kant Inbusschrauben. Witzig auch der Zähler für Schrauben - Reiskorn 粒.
Dieser Aufkleber hat mich dazu gebracht, das Thema Transliteration von Kanji nach vereinfachten Hanzi anzuschauen. Wichtig ist die Richtung, denn rückwärts von vereinfacht nach traditionell ist nicht eindeutig. [2]
Das ganze Thema ist spannend. Am Anfang hatte ich gehofft, dass die Vereinfachung immer einzelne Grapheme (電話 -> 电话) betrifft und eindeutig ist. 头 ist leider schon das erste Gegenbeispiel.
Ich sehe hier mit relativ wenig Zusatzaufwand einen echten Mehrwert, da ich auch beruflich öfters chinesische Unterlagen auf den Tisch bekomme.
Ich möchte nun meine Kanjisammlung um ein weiteres Feld ergänzen - traditionelle/vereinfachte chinesische Varianten des Kanji.
Hierfür suche ich nun eine Konversionstabelle Kanji -> Hanzi.
Eine erste Suche hat Online-Konverter gefunden, z.B. [4]. Hier würde mich interessieren, welche Datenbank der Autor benutzt, habe ihn aber noch nicht angeschrieben (bisserl dürftiges Impressum, aber Email-Funktion vorhanden).
Die gewünschten Informationen sind auch in Jack Halperns Kodansha Kanji Dictionary (KKD2013) enthalten. Ich könnte sie dort herauskratzen, wäre ein schöner Zeitvertreib für die nächsten Monate.
[1]
https://de.wikipedia.org/wiki/Kurzzeichen
[2]
https://cjki.org/c2c/c2cbasis.htm
[3]
https://www.cjk.org/data/chinese/nlp/chi...onversion/
[4]
https://www.khngai.com/chinese/tools/convert.php
Tja, ich habe zwischenzeitlich mal den Autor von [4] angeschrieben und weiter gesucht nach "kanji to hanzi conversion table".
Das gab viele interessante Treffer. Volltreffer für meinen Zweck: im Quelltext von
https://github.com/afoster8/character-converter.git
findet sich auch eine Tabelle, mit dem Copyright-Vermerk:
This copyright notice appears at the top of the kanji mapping table.
----------------------------------------------------------------------------------------
This resource is a Chinese character mapping table of Japanese (Kanji), Traditional
Chinese (TC) and Simplified Chinese (SC).
- Data format
Kanji[TAB]TC[TAB]SC
For more details, please refer to the following paper. Also, if you use this resource,
please cite this paper.
Chenhui Chu, Toshiaki Nakazawa and Sadao Kurohashi:
Chinese Characters Mapping Table of Japanese, Traditional Chinese and Simplified Chinese
In Proceedings of the Eighth Conference on International Language Resources and Evaluation
(LREC2012), pp.2149-2152, Istanbul, Turkey, (2012.5).
Contact: chu@nlp.ist.i.kyoto-u.ac.jp
----------------------------------------------------------------------------------------
Einfacher Test von "kanji_mapping_table.txt":
話 話 话
Das sollte erstmal reichen, für meinen sehr limitierten Fokus.
Der automatische Eintrag in meine Anki-Datenbank würde dann laufen:
- sqLite/Anki Datenbank öffnen
- erste Spalte auf "Kanji print" matchen
- zweite Spalte unter TC eintragen
- dritte Spalte unter SC eintragen
Insgesamt ist das Thema SC/TC Hanzi/Kanji sehr umfangreich. Ein bisserl Beifang Unicode/SCTC:
https://www.unicode.org/reports/tr38/index.html#SCTC
kanji_mapping_table_2.txt (Größe: 91 KB / Downloads: 8)