Antwort schreiben 
Vokabelgenerator
Verfasser Nachricht
ズリアン


Beiträge: 5
Beitrag #1
Vokabelgenerator
Hallo allerseits,

beim Lernen bin ich zufälligerweise auf die Idee gekommen, dass es praktisch wäre wenn es einen Vokabelgenerator gibt, welcher Texte analysiert und dabei eine Liste erstellt, welche ich in Dokumente einfügen kann, umso auf das nachschlagen vieler Wörter zu verzichten. Ich habe einen für chinesisch gefunden, wurde aber sonst nicht fündig. http://www.purpleculture.net/vocabulary-list-generator/

Danke im Voraus hoho
06.01.16 14:10
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Mayavulkan


Beiträge: 521
Beitrag #2
RE: Vokabelgenerator
(06.01.16 14:10)ズリアン schrieb:  Hallo allerseits,

beim Lernen bin ich zufälligerweise auf die Idee gekommen, dass es praktisch wäre wenn es einen Vokabelgenerator gibt, welcher Texte analysiert und dabei eine Liste erstellt, welche ich in Dokumente einfügen kann, umso auf das nachschlagen vieler Wörter zu verzichten. Ich habe einen für chinesisch gefunden, wurde aber sonst nicht fündig. http://www.purpleculture.net/vocabulary-list-generator/

Danke im Voraus hoho
Interessante Frage. Für eine Sprache mit einer umfangreichen Grammatik und vier Schriftsystemen, die durchaus in herzlich vielen Kombinationen für das gleiche Wort verwendet werden stelle ich mir das freilich nicht so einfach vor. Chinesisch ist für die Aufgabe natürlich geradezu prädestiniert.

Schön wäre es aber durchaus.
06.01.16 14:37
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
ズリアン


Beiträge: 5
Beitrag #3
RE: Vokabelgenerator
ich habe mir das so ähnlich wie bei Rikaichan vorgestellt. Nur, dass die Wörter nicht einzeln angewählt werden. Ob damit 100-prozentige Genauigkeit gegeben ist, ist natürlich wieder eine andere Frage. Auch bei jisho gibt es die Möglichkeit mehr als nur ein Wort einzufügen und dann kann man die Wörter seperat anwählen.

Vielleicht hat sogar jemand einen Script geschrieben, welcher auf diese Seiten zugreift und den Input verarbeitet und schön ausgibt.^^
06.01.16 14:46
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
frostschutz
Technik

Beiträge: 1.648
Beitrag #4
RE: Vokabelgenerator
rikaichan hat ein Export-Feature mit dem per rikaichan nachgeschlagene Vokabeln in eine Textdatei geworfen und von dort aus dann weiterverarbeitet werden können.

Auswählen muss man die Wörter trotzdem noch selbst...

Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
06.01.16 16:26
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
DeJa


Beiträge: 133
Beitrag #5
RE: Vokabelgenerator
Das ganze wäre sicherlich sehr interessant.

Vom Programm her gäbe es allerdings das Problem, dass nicht eindeutig ist, wo ein Wort aufhört und das nächste anfängt. Mal ganz abgesehen von der recht komplexen Grammatik.

Kanji raussuchen lassen, wäre hingegen gut möglich.

Bei ganzen Vokabeln müsste man das Gefundene immer mit Wortlisten vergleichen. Und dabei denke ich wird die Fehlerquote dann doch zu hoch liegen.
Selbst der chinesische Vokabelgenerator macht bei uneindeutigen Wörtern immer wieder Fehler.
06.01.16 18:55
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 993
Beitrag #6
RE: Vokabelgenerator
EDIT: Jetzt wo ich den Thread noch mal lese, fällt mir auf, dass der Fokus hier ja wirklich auf dem automatischen Finden einer Übersetzung liegt... Wer sich für morphologische Analyse interessiert, oder sich selbst so einen Generator bauen will, kann hoffentlich trotzdem etwas mit meinem Beitrag anfangen.

Solche Programme, die Texte analysieren (und dann zum Beispiel Wortarten zuordnen und die Struktur des Satzes bestimmen) heißen Parser. Für das Japanische gibt es da zum Beispiel die Programme chasen und mecab. Ich selbst nutze Letzteres.

mecab nimmt einen Text als Eingabe und liefert u.a. Lesung, Wortart und Grundform der Wörter dieses Textes.

Das sieht dann zum Beispiel so aus (das Programm hat keine grafische Oberfläche):
Code:
$ mecab nihongo.txt
形態素 名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ
解析 名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
大好き 名詞,形容動詞語幹,*,*,*,*,大好き,ダイスキ,ダイスキ
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
EOS
Hier sieht man zum Beispiel die Wortart (zweites von links), die Lesung (erstes von rechts) und die Grundform (drittes von rechts).

Nur die Aussprache:
Code:
$ mecab -Oyomi nihongo.txt
ケイタイソカイセキガダイスキデス

Nur die einzelnen Wörter:
Code:
$ mecab -Owakati nihongo.txt
形態素 解析 が 大好き です

Mecab bietet außerdem die Möglichkeit, mehrere Lesarten der selben Eingabe anzuzeigen.
(Dieser Beitrag wurde zuletzt bearbeitet: 06.01.16 21:43 von vdrummer.)
06.01.16 19:58
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
ズリアン


Beiträge: 5
Beitrag #7
RE: Vokabelgenerator
danke für den interessanten Beitrag!
07.01.16 17:17
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 993
Beitrag #8
RE: Vokabelgenerator
Freut mich, dass dir mein Beitrag gefallen hat, obwohl ich ja gar nichts zum Problem der Übersetzung beisteuern konnte.

Hier noch mal ein Beispiel zu meinem letzten Punkt im letzten Beitrag:
vdrummer schrieb:Mecab bietet außerdem die Möglichkeit, mehrere Lesarten der selben Eingabe anzuzeigen.

Schauen wir uns mal folgenden Satz an: するなっていってるでしょ (Ich hab dir doch gesagt, du sollst das nicht machen). Das Spannende an diesem Satz ist, dass なって hier nichts mit なる zu tun hat, sondern eine Kombination aus dem "negativen Imperativ" von する und って als umgangssprachliche Variante von と ist.

Mit -N 5 teile ich mecab mit, dass ich nicht nur die von Programm berechnete beste Analyse, sondern die besten 5 sehen möchte.

Code:
echo "するなって言ってるでしょ" | mecab -Owakati -N 5
する なっ て 言っ てる でしょ 
する なっ て 言っ てる でしょ 
する なっ て 言っ てる でしょ 
する なっ て 言っ てる でしょ 
する な って 言っ てる でしょ

Erst nach dem fünften Versuch erkennt das Programm, dass das な nicht zum Verb なる gehört.
07.01.16 20:26
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Wasabi


Beiträge: 90
Beitrag #9
RE: Vokabelgenerator
Da gibt es auch noch den Japanese Reading Tutor
http://language.tiu.ac.jp/index_e.html
07.01.16 21:33
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
DeJa


Beiträge: 133
Beitrag #10
RE: Vokabelgenerator
Es gibt auch noch das "Text Glossing" vom WWWJDIC.

Das ist aber auf Englisch und findet meiner Meinung nach nicht ganz so viele Wörter wie MeCab. Der Vorteil liegt aber darin, dass man die Bedeutung direkt dazu bekommt.
08.01.16 02:01
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Vokabelgenerator
Antwort schreiben