Unicode 5.1 – Ideographic Variation Database

Hellstorm · 06.04.08 19:55

Hallo,

ich wollte mal auf Unicode 5.1 aufmerksam machen. Ist gestern herausgekommen und bietet folgende Neuigkeit:

Sagen wir mal, wir haben einen Ort, der sich noch mit einem alten Radikal, wie z.B. 辶 statt 辶 oder mit dem alten von 礻, geschrieben wird. Jetzt wollen wir das im Computer tippen, und was haben wir vorher gemacht? Wir haben einfach das Zeichen genommen, aber folgendes Problem gehabt: Es war das neue Radikal. Es bestand keine wirkliche Möglichkeit, anzugeben, daß man das alte Radikal haben wollte.

Lösung jetzt:

A major feature of Unicode 5.1.0 is the enabling of ideographic variation sequences. These sequences allow standardized representation of glyphic variants needed for Japanese, Chinese, and Korean text. The first registered collection, from Adobe Systems, is now available at http://www.unicode.org/ivd/.

Man geht also auf die Webseite, lädt sich die pdf runter, guckt in der Tabelle nach dem Zeichen, von der man eine andere Variante haben will, fügt dann das Zeichen ich glaube hinter dem Ursprungszeichen ein.

Sagen wir mal, wir wollen das alte Radikal bei 道, das hat den Codepunkt U+9053. Dann gucken wir in der Liste, sehen bei U+9053 die alte Version, sehen, daß wir U+E0101 hinter das Zeichen packen müssen und erhalten das alte Zeichen: 道

Das ganze klappt jetzt natürlich noch nicht (zumindest nicht bei mir unter Linux), weil das die Software erst unterstützen muß und dann wohl auch die Schriftarten, aber wenn das mal klappen sollte, finde ich das richtig klasse.

MichaelR · 14.05.08 21:26

Oh je, noch eine Sprache mehr mit denormalisierter Zeichendarstellung in Unicode... ich habe mich bisher immer damit getröstet daß das höchsten bei Georgisch und Tamilisch auftaucht. Wenn das unsere Endnutzer rauskriegen und auf korrekter Schreibweise ihrere Namen bestehen kann man keine Datenbankabfrage mehr machen ohne Normalisierung. Mir graust es jetzt schon davor das den Entwicklern beizubringen.

Möglicherweise verwandte Themen...
Thema:	Verfasser	Antworten:	Ansichten:	Letzter Beitrag
Ich suche ein Prg Unicode mit Romaji,	Phil.	27	12.811	19.10.18 07:24 Letzter Beitrag: Phil.
FileMAker 7 ist unicode	FreiHerr	3	3.395	18.08.04 20:53 Letzter Beitrag: Otaka-san
HTML / Radikale / Unicode	Koorineko	16	10.600	20.05.04 22:48 Letzter Beitrag: Koorineko
Codierung: Unicode JIS ShiftJIS	Jarek	5	5.340	02.10.03 12:30 Letzter Beitrag: Holger Kühn

Unicode 5.1 – Ideographic Variation Database
Verfasser	Nachricht