Antwort schreiben 
Ich suche ein Prg Unicode mit Romaji,
Verfasser Nachricht
Phil.


Beiträge: 350
Beitrag #1
Ich suche ein Prg Unicode mit Romaji,
Jeder hat seine Vorstellungen, wie ein Programm ablaufem mag.
Und nicht jeder arbeitet mit dem gleichen Prg wie der andere.
Ich zB arbeite mit einem altem MS-DOS Programm und Clipper Sommer87 und DBase III+.
JAVAbokuwadoku hat dieses in Java umprogrammiert und man kann es hier runterladen.
Thread-Japanisch-lernen-wie-Französich?pid=144226#pid144226

Es wurde nach der vielen Externen Unterprogramm Methode geschaffen.
Meines arbeitet mit einem ganzen Programm, in welchem sich diverse Unterprogramme und Funktionen befinden.
Und viele Abfragen, laufen ueber das gleiche Unterprogramm und verwenden auch die gleichen Funktionen, jedoch mit IF-THEN, Abfragen ist das moeglich.

Nun gut.
Ich suche ein Programm, oder eine App, mit der ich einen Japanischen Text, so konvertieren kann, dass er am Ende
Die Kanji in Unicode-Hex umwandelt, und alle anderen Hiragana und Katakana in Romaji umwandelt.

Ich habe eins, was alles in Unicode-Hex umwandeln kann,
und ein anderes was aus den Kanji alles in Romaji umwandeln kann.

Aber da mein Mutterprogramm, keine Kanji verwenden kann, benoetige ich diese App.

愛ということばは、いつから人間の社会に発生したものでしょう。
愛という言葉をもつようになった時期に、人類はともかく一つの飛躍をとげたと思います。なぜなら、
人間のほかの生きものは、愛の感覚によって行動しても、
愛という言葉の表象によってまとめられた愛の観念はもっていませんから。


Das saehe dann in etwa so aus mit Kanji.

愛 toiukotobaha, itsukara 人間 no 社会 ni 発生 shitamonodeshoo.
愛 toiu 言葉 o motsuyooninatta 時期 ni, 人類 hatomokaku 一つ no 飛躍 o togetato 思 imasu. nazenara,
人間 nohokano 生 kimonoha, 愛 no 感覚 niyotte 行動 shitemo,
愛 toiu 言葉 no 表象 niyottematomerareta 愛 no 観念 hamotteimasenkara.

Und mit Unicode Hex, wuerde das so aussehen.

U+611B toiukotobaha, itsukara U+4EBA U+9593 no U+793E U+4F1A ni U+767A U+751F shitamonodeshoo.
U+611B toiu U+8A00 U+8449 o motsuyooninatta U+6642 U+671F ni, U+4EBA U+985E hatomokaku U+4E00 U+3064 no U+98DB U+8E8D o togetato U+601D imasu. nazenara,
U+4EBA U+9593 nohokano U+751F kimonoha, U+611B no U+611F U+899A niyotte U+884C U+52D5 shitemo,
U+611B toiu U+8A00 U+8449 no U+8868 U+8C61 niyottematomerareta U+611B no U+89B3 U+5FF5 hamotteimasenkara.

Endresultat waere dies.
611B toiukotobaha, itsukara 4EBA 9593 no 793E 4F1A ni 767A 751F shitamonodeshoo.
611B toiu 8A00 8449 o motsuyooninatta 6642 671F ni, 4EBA 985E hatomokaku 4E00 3064 no 98DB 8E8D o togetato 601D imasu. nazenara,
4EBA 9593 nohokano 751F kimonoha, 611B no 611F 899A niyotte 884C 52D5 shitemo,
611B toiu 8A00 8449 no 8868 8C61 niyottematomerareta 611B no 89B3 5FF5 hamotteimasenkara.

Habe gesehen dass die Satzzeichen in Romaji umgewandelt werden muessen, da diese auch Codes entwickeln.
Das waer das Ziel.

So, um aber dorthin zu kommen, muss man eins beachten,
Die Hiragana und Katakana haben verschiedene Schreibweisen, mit dem langen o, ô
Und daher muss man drauf achten, zuerst die Silben der Silbenschrifte, mit den laengeren Silben, zuerst konvertieren,
Es sind welche mit 4 Romaji Zeichen. しょう shoo
Dann die mit 3 Romaji Zeichen きょ、kyo
Dann die mit 2 Romaji Zeichen, き、ki
Und zum Schluss die mit 1 Romaji Zeichen. あいうえお、a,i,u,e,o

Hat man sich einmal geirrt, geht das ins Auge.

Wer hat so etwas in Java?
Danke.

Datenbank mit 1.2 Mio. Datensaetzen. wadoku-4.jar = Prg.
Japanisch Suche mit Kleinbuchstaben, Deutschsuche mit erstem Buchstaben Gross geschrieben. Alles in Romaji, ausser Kanji.
https://www.japanisch-netzwerk.de/attachment.php?aid=1313
(Dieser Beitrag wurde zuletzt bearbeitet: 08.10.18 22:25 von Phil..)
14.07.18 00:46
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 350
Beitrag #2
RE: Ich suche ein Prg Unicode mit Romaji,
Ich wusste nicht, dass es so viele Kombinationen gibt.
In Katakana gibt es viel mehr Kombinationen als in Hiragana.

Code:
Die Liste ist nicht komplett, vielleicht spaeter stell ich sie hier rein.
Wenn sich ueberhaupt jemand dafuer interessiert?

Einige habe ich umgewandelt aus vi eben bui gemacht, da im Hiragana kein vi existiert.
Wie man sehen kann, gibt es Unicodes mit einem Buchstaben hintenan.
Das sind Kombinationen mit dem kleinen tsu っ Diese darf man auch nicht vergessen.

Mit diesem Link, lassen sich die Originaldaten wieder herstellen.
https://r12a.github.io/app-conversion/

Datenbank mit 1.2 Mio. Datensaetzen. wadoku-4.jar = Prg.
Japanisch Suche mit Kleinbuchstaben, Deutschsuche mit erstem Buchstaben Gross geschrieben. Alles in Romaji, ausser Kanji.
https://www.japanisch-netzwerk.de/attachment.php?aid=1313
(Dieser Beitrag wurde zuletzt bearbeitet: 11.10.18 00:40 von Phil..)
09.10.18 05:39
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 350
Beitrag #3
RE: Ich suche ein Prg Unicode mit Romaji,
Womoeglich wird mancher denken, wozu das Ganze?
Nun ich bin nicht so fleissig wie ihr denkt.
Und ich denke, dass ein PC, doch etwas von der Arbeit abnehmen sollte.
Also warum soll er das denn nicht tun.

Beim folgenden Link zB, gibt es diverse Beispielsaetze, welche Kanji und Kana beinhalten.
Um nun jedes einzelne herauszupicken und durch den oben genannten Konverter zu schleusen, was eine Imense Arbeit darstellt,
da denke ich, dass der PC mir dabei behilflich sein sollte.

Ich benoetige die Kanji in Hex-Code. Und die Hiragana und Katakana in Romaji.
Sicher kann ich die schon lesen. Aber hin und herspringen zwischen 2 Welten, um nur einige Daten aufzunehmen, und diese per Hand, einzeln in Romaji zu konvertieren, ist doch Nonsens.

https://collocation.hyogen.info/word/%E6%89%8B/wo
Spaeter kann das dann noch ausgebaut werden und mit der Zeit, lernt man sicherlich dazu.

Datenbank mit 1.2 Mio. Datensaetzen. wadoku-4.jar = Prg.
Japanisch Suche mit Kleinbuchstaben, Deutschsuche mit erstem Buchstaben Gross geschrieben. Alles in Romaji, ausser Kanji.
https://www.japanisch-netzwerk.de/attachment.php?aid=1313
09.10.18 08:41
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Dorrit


Beiträge: 800
Beitrag #4
RE: Ich suche ein Prg Unicode mit Romaji,
(09.10.18 05:39)Phil. schrieb:  Einige habe ich umgewandelt aus vi eben bui gemacht, da im Hiragana kein vi existiert.

Meinst du ヴィ?

ゔぃ
09.10.18 14:19
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 350
Beitrag #5
RE: Ich suche ein Prg Unicode mit Romaji,
Richtig und wie spricht man ein u mit b und i aus?
Mir ist so eine schreibweise in all den WB noch nicht widerfahren.

Datenbank mit 1.2 Mio. Datensaetzen. wadoku-4.jar = Prg.
Japanisch Suche mit Kleinbuchstaben, Deutschsuche mit erstem Buchstaben Gross geschrieben. Alles in Romaji, ausser Kanji.
https://www.japanisch-netzwerk.de/attachment.php?aid=1313
(Dieser Beitrag wurde zuletzt bearbeitet: 09.10.18 18:20 von Phil..)
09.10.18 18:20
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Dorrit


Beiträge: 800
Beitrag #6
RE: Ich suche ein Prg Unicode mit Romaji,
Das ist sicherlich auch keine normale Schreibweise. Ich hatte es nur geschrieben, weil du meintest, dass es das in Hiragana nicht gibt als Zeichen.
Zumindest hatte ich dich so verstanden.

Im Wadoku stehen die Wörter ja auch in Hiragana, da kann man das manchmal sehen.
ヴィオラ → ゔぃおら
09.10.18 18:53
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 350
Beitrag #7
RE: Ich suche ein Prg Unicode mit Romaji,
Wuerde viola sein.
Ich meine, wie soll man etwas finden, wenn man nicht mal weiss, wie es mit Hiragana oder Katakana geschrieben wird?
Und so oft kommen diese Schreibweisen auch nicht vor.
Bei viola hab ich im Moment fast 120 Eintraege.
Ich habe diese Silben mit uebernommen, weil sie so oft, in einem Dokument, stecken und diese so schwer aufzufinden sind.

In vielen WB, wird biora angegeben.
Im Deutschen gibt es auch allerlei, wo man nicht weiss, ob es gross oder kleingeschrieben wird.
Und ob der Artikel, der, die, oder das ist.
Begriffe sucht man auch nicht in einem WB mit "der Mann", sondern begnuegt sich einfach mit dem Begriff "Mann".

Doch auch ich kann oft nicht davon absehen. Manchmal ist auch ein versteckter Sinn, im Artikel selbst. Aber das sind dann wohl die Nuancen der Deutschen Sprache. So wie die Japaner ihre Nuancen in den Partikeln haben.

Vorerst halte ich diese Silben mal so, spaeter kann sich das ja auch noch verbessern.
Als naechsten Schritt, wird dann vielleicht etwas eingebaut, wo die meisten Begriffe und Saetze dann so in etwa aussehen, wie das hier geschriebene. Mit Leerzeichen.

Etwas ist aber schon mal sicher, diese Prozedur, ist im Moment nur fuer mich wichtig.
In der Datenbank sind zwischen den Begriffen und Partikeln etc, Leerzeichen eingebaut.
Wie sonst, weiss man, wo ein Anfang oder ein Ende, eines Begriffes ist.

Das Aufarbeiten in eine Datenbank, mit diesen "Hand Beispielen" ergab ueber 31.000 Datensaetze.
Die Zeit, bis die in einer Datei waren, mit HEX-Code, dauerte nur ca. 5 Minuten.
Es ist und wird sicherlich noch spannend werden.

Zitat:Im Wadoku stehen die Wörter ja auch in Hiragana, da kann man das manchmal sehen.
ヴィオラ → ゔぃおら
Nun das ist so eine Sache, die ich selber nicht so gerne mag.
Ein Begriff, der mit Hiragana, Katakana, mit Kanji, mit Kanji und Kana, geschrieben wird kann verwirrend sein.
Und es ist dann wie in Anki, dass man die richtige Schreibweise eingeben muss, um was zu finden.

Diese U's mit dem Punkt, sind keine gewoehnlichen Zeichen.
Mir ist es als ob man hier mit dem U ein B verschmelzt und daraus ein neuer Ausdruck, phonetisch werden sollte.
Dabei haben die Japaner schon allerlei Schwierigkeiten ein "L" auszusprechen. Das sind Zungenbrecher mit Schluckauf.

Datenbank mit 1.2 Mio. Datensaetzen. wadoku-4.jar = Prg.
Japanisch Suche mit Kleinbuchstaben, Deutschsuche mit erstem Buchstaben Gross geschrieben. Alles in Romaji, ausser Kanji.
https://www.japanisch-netzwerk.de/attachment.php?aid=1313
(Dieser Beitrag wurde zuletzt bearbeitet: 09.10.18 19:34 von Phil..)
09.10.18 19:27
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 350
Beitrag #8
RE: Ich suche ein Prg Unicode mit Romaji,
Es ist vollbracht.
Einige Stunden von 2 Tagen.

Aber es hat noch einige kleine Maengel,
Dauer ca. 8 Minuten fuer 37.000 Datensaetze.
Aus:
手を解き去りぬ,
手を振つた,
手を挙げて,
手を上げて,
手をもがいて,
手を休めて,
手を除くと,
手を引込てしまった,
手を入れて出来上った,
手をかけ,
手を切る,
手をあてて, 

Kam folgendes heraus. Kanji sind deshalb sichtbar, weil sie mit dem Konverter wieder in ihre alte Form gebracht wurden.
手 - O - 解 KI 去 RI NU .
手 - O - 振 TSU TA .
手 - O - 挙 GE TE .
手 - O - 上 GE TE .
手 - O - MO GA I TE .
手 - O - 休 ME TE .
手 - O - 除 KU TO .
手 - O - 引 込 TE SHI MA ** TA .
手 - O - 入 RE TE 出 来 上 ** TA .
手 - O - KA KE .
手 - O - 切 RU .
手 - O - A TE TE .

Datenbank mit 1.2 Mio. Datensaetzen. wadoku-4.jar = Prg.
Japanisch Suche mit Kleinbuchstaben, Deutschsuche mit erstem Buchstaben Gross geschrieben. Alles in Romaji, ausser Kanji.
https://www.japanisch-netzwerk.de/attachment.php?aid=1313
11.10.18 01:05
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 350
Beitrag #9
RE: Ich suche ein Prg Unicode mit Romaji,
Mir ist folgendes Aufgefallen und ich finde das sehr komisch.

手をぎゅっと握った
bei diesem Text ist etwas zwischen ぎ ゅ passiert.
Obwohl ich eine Funktion habe, welche zuerst die laengeren Varianten findet und ersetzt,
Findet er diesen Eintrag nicht und ersetzt ihn nicht mit "gyu" sondern mit "gi yu"

alle anderen ぎゅ、werden richtig konvertiert.

Datenbank mit 1.2 Mio. Datensaetzen. wadoku-4.jar = Prg.
Japanisch Suche mit Kleinbuchstaben, Deutschsuche mit erstem Buchstaben Gross geschrieben. Alles in Romaji, ausser Kanji.
https://www.japanisch-netzwerk.de/attachment.php?aid=1313
(Dieser Beitrag wurde zuletzt bearbeitet: 11.10.18 07:34 von Phil..)
11.10.18 07:33
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 350
Beitrag #10
RE: Ich suche ein Prg Unicode mit Romaji,
Das war der erste Versucht.
Einen zweiten habe ich begonnen,
Uebrigens, koennte es sein, dass ich hier wieder alles. loesche.

Der naechste Versuch, geht ueber folgende Stufen.
Erstellen der Datei mit Feldern.
Importieren von Daten
Ausfiltern der Kanji und diese in ihre Felder legen.
Ausfiltern der Kana.
Dann erst diese Konvertieren,
Womoeglich ohne Leerzeichen. Mit Platzhalter wo die Kanji standen.
Und dann sehen wir weiter.

Datenbank mit 1.2 Mio. Datensaetzen. wadoku-4.jar = Prg.
Japanisch Suche mit Kleinbuchstaben, Deutschsuche mit erstem Buchstaben Gross geschrieben. Alles in Romaji, ausser Kanji.
https://www.japanisch-netzwerk.de/attachment.php?aid=1313
11.10.18 11:07
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Ich suche ein Prg Unicode mit Romaji,
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
Eingabe per Romaji Lilith 19 5.897 29.10.17 17:32
Letzter Beitrag: torquato
Suche nach Problemlösung für DNS Unlocker Horstlee 1 788 15.01.16 14:42
Letzter Beitrag: Alaerys
Suche nach der Schriftart JFJ 8 1.446 28.07.15 20:21
Letzter Beitrag: 客人
Unicode 5.1 – Ideographic Variation Database Hellstorm 1 1.086 14.05.08 20:26
Letzter Beitrag: MichaelR
Kokugo Jiten (von goo.ne.jp) in der Firefox-Suche Ma-kun 3 1.735 30.04.07 15:13
Letzter Beitrag: schef