Antwort schreiben 
Unicode 5.1 – Ideographic Variation Database
Verfasser Nachricht
Hellstorm
Moderator

Beiträge: 3.897
Beitrag #1
Unicode 5.1 – Ideographic Variation Database
Hallo,

ich wollte mal auf Unicode 5.1 aufmerksam machen. Ist gestern herausgekommen und bietet folgende Neuigkeit:

Sagen wir mal, wir haben einen Ort, der sich noch mit einem alten Radikal, wie z.B. 辶 statt 辶 oder mit dem alten von 礻, geschrieben wird. Jetzt wollen wir das im Computer tippen, und was haben wir vorher gemacht? Wir haben einfach das Zeichen genommen, aber folgendes Problem gehabt: Es war das neue Radikal. Es bestand keine wirkliche Möglichkeit, anzugeben, daß man das alte Radikal haben wollte.

Lösung jetzt:

A major feature of Unicode 5.1.0 is the enabling of ideographic variation sequences. These sequences allow standardized representation of glyphic variants needed for Japanese, Chinese, and Korean text. The first registered collection, from Adobe Systems, is now available at http://www.unicode.org/ivd/.


Man geht also auf die Webseite, lädt sich die pdf runter, guckt in der Tabelle nach dem Zeichen, von der man eine andere Variante haben will, fügt dann das Zeichen ich glaube hinter dem Ursprungszeichen ein.

Sagen wir mal, wir wollen das alte Radikal bei 道, das hat den Codepunkt U+9053. Dann gucken wir in der Liste, sehen bei U+9053 die alte Version, sehen, daß wir U+E0101 hinter das Zeichen packen müssen und erhalten das alte Zeichen: 道

Das ganze klappt jetzt natürlich noch nicht (zumindest nicht bei mir unter Linux), weil das die Software erst unterstützen muß und dann wohl auch die Schriftarten, aber wenn das mal klappen sollte, finde ich das richtig klasse.

やられてなくてもやり返す!八つ当たりだ!
06.04.08 19:55
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
MichaelR


Beiträge: 146
Beitrag #2
RE: Unicode 5.1 – Ideographic Variation Database
Oh je, noch eine Sprache mehr mit denormalisierter Zeichendarstellung in Unicode... ich habe mich bisher immer damit getröstet daß das höchsten bei Georgisch und Tamilisch auftaucht. Wenn das unsere Endnutzer rauskriegen und auf korrekter Schreibweise ihrere Namen bestehen kann man keine Datenbankabfrage mehr machen ohne Normalisierung. Mir graust es jetzt schon davor das den Entwicklern beizubringen.

~物理学者が出来ない事はない~
14.05.08 21:26
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Unicode 5.1 – Ideographic Variation Database
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
FileMAker 7 ist unicode FreiHerr 3 1.360 18.08.04 20:53
Letzter Beitrag: Otaka-san
HTML / Radikale / Unicode Koorineko 16 3.992 20.05.04 22:48
Letzter Beitrag: Koorineko
Codierung: Unicode JIS ShiftJIS Jarek 5 2.684 02.10.03 12:30
Letzter Beitrag: Holger Kühn