Antwort schreiben 
Wo finde ich downloadbare Vokabellisten?
Verfasser Nachricht
vdrummer


Beiträge: 1.506
Beitrag #21
RE: Wo finde ich downloadbare Vokabellisten?
Ich verstehe immer noch nicht ganz, was genau dein Ziel ist und wie du mit Disambiguierung umgehen willst.
Wenn ich das richtig verstehe, willst du eine Vokabelliste Japanisch <--> Deutsch, also in beide Richtungen nutzbar und ohne Kanji?

Wie gehst du mit sowas wie
選択 せんたく Auswahl
洗濯 せんたく Wäsche
um?
Ist dann sowohl "Auswahl" als auch "Wäsche" eine korrekte Antwort auf せんたく?

Bezüglich Senses kann ich verstehen, dass die am Anfang erstmal nervig sind, aber letztendlich sind das ja alles Bedeutungen von dem Wort (genau so wie Lesungen bei Kanji). Willst du also die Senses nach Häufigkeit sortieren?

Leider funktioniert sowas tatsächlich meist nach Wörtern und nicht nach Senses. Das einzige Beispiel, wo man nach Subeigenschaften klassifiziert, das mir gerade einfällt sind Lesungen bei Kanji. Da werden manchmal seltenere Lesungen erst in spätern Schuljahren unterrichtet.

Ein ähnliches Problem wie mit "überflüssigen" Senses hat man übrigens mit der deutschen Übersetzung: Für 食べる findet man bei Wadoku zum Beispiel "essen; speisen; zu sich nehmen; fressen; probieren.", wobei für eine Vokabelliste "essen" an sich ja schon ausreichend wäre.
18.06.25 10:32
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Kokujou


Beiträge: 129
Beitrag #22
RE: Wo finde ich downloadbare Vokabellisten?
(18.06.25 10:32)vdrummer schrieb:  Ich verstehe immer noch nicht ganz, was genau dein Ziel ist und wie du mit Disambiguierung umgehen willst.
...

Ja genau. Vor allem weil es ohnehin auch mit Kanji genug Duplikate gibt. Was per se schon hart genug zu verkraften ist.
Ich meine wenn du sprichst ist es doch genauso. Wenn man Japanisch lernen will helfen dir die Kanji beim sprechen mit Japanern wenig. Der schreibt dir doch nicht extra auf ob er Wäsche oder Auswahl meint. Du nunmal wissen dass "sentaku" sowohl "Wäsche" als auch "Auswahl" bedeuten kann.

Also hätte ich diese Tabelle designt hätte ich es so gemacht:
Du hast einen Entry der auf Kanji + Romaji einzigartig ist.
Dann hast du mehrere Sense Elemente, die wirklich Bedeutungen darstellen, die nichts miteinander zutun haben.
Dann sollte man in dem Sense einzelne Übersetzungs-Zeilen haben die ausschließlich Synonym sein dürfen. Essen. Fressen. Dinieren.
Diese Übersetzungen sollten jeweils mit der Sprache markiert sein.

In JMDict hast du mehrere Sense Elemente PRO Sprache. Was völliger Schwachsinn ist, weil die Bedeutung von "Sense" ist doch gerade eine universelle sprachneutrale "Bedeutung". Und dann hast du zusätzliche Flags wie "slang" oder "Computersprache" nur auf der englischen Übersetzung und du kannst im Grunde das ganze Wörterbuch vergessen.

Slang-Sprache ist hochsensibel, ein Großteil der geflaggten Wörter, Internetsprache, Slangsprache "Frauen-spezifische Sprache" (ja, das gibt es offenbar!). Wenn so etwas überhaupt in einen Vokabeltrainier gehört, darf das nur in spezifischen Lektionen abgefragt werden und darf nicht mit Hochsprache vermischt werden.

Ich will diese Ambiguität folgendermaßen umsetzen:
Du kriegst ein japanisches Wort angezeigt mit Kanji und Hiragana und Romaji. Dann lade ich mir aus meiner Datenbank alle Wörter mit dieser Kombination, sowie alle Bedeutungen. Dann vergleiche ich mit einem Sprachmodell die Ähnlichkeit zwischen der Nutzereingabe und den Auswahlmöglichkeiten. Wenn etwas über einen bestimmten Schwellwert kommt, hat der Nutzer bestanden. Für unklare Antworten, die z.B. relativ hoch, aber nicht ganz über den Schwellwert kommen, lasse ich anzeigen "meintest du vielleicht...?", das muss natürlich alles feinjustiert werden, aber so lassen sich Rechtschreibfehler gut erkennen und das Erlebnis wird flüssiger. Man muss nur aufpassen dass auf "warm" nicht "kalt" geantwortet werden kann, was ja themenähnlich aber halt nicht Synonym ist.

Jetzt füge ich noch folgendes hinzu. Wenn ein Nutzer die App benutzt, dann werden für jeden Übersetzungsversuch Einträge angelegt. Angenommen also ein Nutzer übersetzt "kumo" immer als "Wolke" und wählt dann einen Quiz-Modus für schwere oder unbekannte Worte. Dann sehe ich "okay, Wolke hat er schon oft richtig gehabt, das kennt er, aber die anderen eben nicht", dann bewerte ich sie als Falsch. vielleicht auch mit einem speziellen Ergebnisbildschirm. "Richtig, aber gesucht war..."
23.06.25 19:57
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Kokujou


Beiträge: 129
Beitrag #23
RE: Wo finde ich downloadbare Vokabellisten?
Ich hab jetzt mal einen letzten verzweifelten Versuch gestartet. Ich habe gehofft, dass man vielleicht sagen könnte, dass die Senses über ihren Index korrelieren. also dass der 1. Sense beim englischen Wort auch der 1. Sense beim deutschen Wort ist. Dem ist nicht so :/ nichtmal die indizes korrelieren in vielen Fällen.

Also im Grunde ist für das JMdict im Deutschen 90% seines Inhalts Ausschuss. Und das meine ich so extrem wie es klingt. Denn es geht nicht nur um Wortmarkierungen. Das <sense> Element hat ja auch Kanji und Reading Restrictions - die sind auch weg! Keine Referenzen, keine Wort-Typen, keine POS, nichts.

Ich muss mich also wohl oder übel wieder an den Wadoku Dump halten, der diese Dinge zu haben scheint, allerdings dann ohne konkrete JLPT-Level-Referenz, die muss ich nach wie vor über die nicht existente Uniqueness ziwschen Kanji und Reading hinzufügen, was eine Menge falsch-positiv ergebnisse erzeugen wird. Leider. Aber andererseits wissen wir ja auch, dass schon die aktuelle Liste der JLPT über die JMDict Entry ID eine Menge falsch positive Ergebnisse erzeugt, weil sie nicht an den Sense gebunden ist. Also "are" als "männliches Geschlechtsorgan" (mein Lieblingsbeispiel), ist sicher nicht JLPT5
24.06.25 12:18
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Wo finde ich downloadbare Vokabellisten?
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
Wo am besten gute Vokabellisten bekommen? Raikou 6 2.656 11.10.21 18:45
Letzter Beitrag: AwesomeSepp
nach Themen sortierte JLPT-Vokabellisten kanji_illustrator 3 3.019 26.01.17 20:44
Letzter Beitrag: senar
Wo finde ich die Hiragana Schreibweise ? Anonymer User 4 3.401 08.02.06 21:41
Letzter Beitrag: zongoku