Antwort schreiben 
Kanji-Sonderlesungen Woerterbuch
Verfasser Nachricht
Shino
Ex-Mod

Beiträge: 2.330
Beitrag #11
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
Es hat schon geklappt, Nora. Zongoku machts ganz still und unauffällig zwinker

Schau mal in seine Signatur...

人生に迷うときもあるけど笑っていれば大丈夫
30.10.10 08:37
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
zongoku
Inaktiv

Beiträge: 2.973
Beitrag #12
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
@Nora, @Shino,

Ja es klappt wunderbar.
Heute kommt kein Update. Vielleicht morgen.
Es sind zur Zeit schon 165 Seiten an Material.
Und es werden womoeglich ueber 500 Seiten werden. Ich meine ausgedruckt.
Ai was haben die Autoren uns nicht alles verheimlicht.
Oder womoeglich wussten selbst sie nicht um die Vielfalt der Sonderlesungen.
Verschleissungen etc.

Ich habe auch feststellen koennen, dass in meiner Datei enorm viel drin ist.
Auch Rikaichan hat sogar mit 2 Woerterbuecher nicht alle Datensaetze drin.
Und sehr viele Woerter stehen gar nicht im Deutschen Woerterbuch drin.
Die werde ich nach und nach per Hand aus meiner Datei uebertragen.

Ich bin froh, dass meine Arbeit an der Datei, jetzt Fruechte traegt.
Und dass meine Zeit nicht vertroedelt ward. Dennoch wird die Datei niemals dem Edict gerecht werden. Eben da es gar keine Kanji und Kana enthaelt.

Ich hoffe, aber dass dieses Resultat der Sonderlesungen, einigen helfen koennte.

Ob gut oder schlecht, die vielen Vermerke von (schriftsprach.) etc, sind verwirrend.
Ich weiss auch nicht was diese bedeuten. Ob ich die rausoperieren soll?

Ich danke aber dem Team, dass ich die Daten hochladen darf.
Ich habe auch gelernt, dass Word unnoetige Formatierungen macht. Und deshalb die Datei manchmal ins Unermessliche waechst.

Sollte sie mal die 3MB uebersteigen, wird sie wieder als .zip Datei hochgeladen.
Viel Spass, denjenigen, die mit der Datei arbeiten.
02.11.10 23:36
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Shino
Ex-Mod

Beiträge: 2.330
Beitrag #13
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
Hallo Zongoku,

ich verstehe allerdings nicht, weshalb du weiterhin Beiträge bis an die Grenze mit den Daten füllst, die du doch ohnehin schon in der Datei zum Download anbietest? Oder sind das Fehler, die du korrigiert hast (das könntest du auch besser im Dokument selbst farblich markieren - fände ich übersichtlicher)?

Meine persönliche Meinung zu der Datei (KB-Angaben beziehen sich auf die vorige Version deiner Datei).

Leider lässt sich das Dokument, so wie es jetzt vorliegt, immer noch nicht gut in andere Formate oder Programme exportieren.

Überhaupt bläht Word - und hier besonders ältere Word-Versionen - die Datenmenge durch versteckte Formatierungen etc. ungemein auf. Mal ein paar Beispiele. Alle Konvertierungen habe ich immer mit der Originaldatei (.doc) durchgeführt.

Word 2003 (aktuelle Datei)
  • Deine Datei hat aktuell ungefähr 2 MB.
  • Versteckte Formatierungen, Steuerzeichen und Meta-Informationen machen die Datei bedeutend größer, als sie sein müsste.
  • Weiterverarbeitung mit anderen, geeigneteren Programmen ist aufgrund der Datenstruktur und Formatierungen kaum sinnvoll möglich, daher sehr zeitaufwendig
  • U. A. und vor Allem Filtern und Sortieren der Daten ist nicht möglich
  • Nicht jeder hat ein teures Microsoft-Produkt auf seinem Privatrechner
Word 2003 ohne Meta-Informationen
  • Deine Datei, befreit von Metainfos: 1,6 MB (400 KB weniger!)
  • Alle vorgenannten Nachteile von Word bleiben bestehen
Word 2007
  • Das docx-Datenformat von Word 2007+ ist gegenüber dem alten doc-Format deutlich optmiert
  • Nach der Konvertierung nach Word 2007 kommt deine Datei nur noch auf 455 KB
  • Dennoch: Alle weiteren vorgenannten Nachteile bleiben bestehen
OpenOffice 3.2: Writer
  • Konvertiert man die Doc-Datei nach OpenOffice-Writer (.odt), kommt man nur noch auf knapp 140 KB (!)
  • Konvertiert man von MS-Word 2007 nach ODT kommt man immer noch auf ca. 450 KB
  • OpenOffice ist frei erhältlich und kann von jedem eingesetzt werden
  • Allerdings: Großer Download, für manche User nicht möglich
  • Aber auch der Writer ist ein Textverarbeitungsprogramm und daher für die Bereitstellung von Datensammlungen nur bedingt geeignet (siehe unter Word)
Txt-Dateiformat
  • Konvertiert nach TXT kommt deine Datei auf ca. 280 KB
  • Von den meisten unnützen Formatierungen befreit
  • Ich würde mal sagen, dass nahezu jedes allgemein eingesetzte OS mit diesem Dateiformat umgehen kann.
  • Auch mit diesem Format sind z. B. Auswertungen, Filteroperationen, Sortieren etc. sowie ein Datenexport in dieser Form, wie die Daten jetzt vorliegen, nicht möglich (keine csv-Datei)
  • Mit entsprechend aufbereiteten Daten (komma-, Tab- oder sonstwie separiert), ist es faktisch eine CSV-Datei, deren Daten man leicht in andere Programme importieren kann.
  • Bei Überschreiten einer gewissen Dateigröße kann unter Windows nicht mehr mit dem Standard-Editor bzw. Notepad gearbeitet werden. Es gibt aber Programme auf dem Share- und Freewaremarkt, die auch mit größeren Datenmengen umgehen können.
Nach wie vor halte ich eine CSV-Datei, die Tabellenkalkulationsprogramme Excel bzw. Calc (auch Google Text & Tabellen bzw. ähnliche Angebote anderer Anbieter) oder besser noch richtige Datenbankanwendungen wie z. B. Access bzw. Base oder entsprechende WebApplikationen für die geeigneteren Programme, um solche Datenmengen zur Verfügung zu stellen.

Z. B. google Text & Tabellen hätte noch einen Vorteil: Du könntest in Echtzeit mit Interessierten chatten und direkt darüber sprechen, was man verbessern könnte oder sogar zusammen daran arbeiten.

人生に迷うときもあるけど笑っていれば大丈夫
(Dieser Beitrag wurde zuletzt bearbeitet: 05.11.10 02:54 von Shino.)
05.11.10 00:37
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
zongoku
Inaktiv

Beiträge: 2.973
Beitrag #14
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
Hallo Shino,

Die Datei variert, wie ich sie neu umbilde.
Ich weiss dass du ein Experte in Sachen Informatik bist. Ich bin es leider nicht.
Auch wenn man mit Word arbeitet, benoetigt man viel Zeit um es einigermassen gut bedienen zu koennen.

Woran hat es gelegen, dass jetzt mehr Daten drin sind als sonst?
Nun mein Basic Programm hatte einen Fehler und deshalb wurden nicht alle Daten zu einem Beispiel herausgegeben. Jetzt geht es schon viel besser.

So in etwa sind fast all diese Beispiele aus meiner Datei.
Nur da wo ((***)) steht, hab ich doch etwas abgekuerzt.


Aber ich verstehe nicht, was nun noch immer nicht funktioniert?
Was verstehst du ueber eine besondere Formatierung?

Ich hab die Datei und deren Inhalt so ausgewaehlt dass man ein Kanji direkt anspringen kann. und das mit dem zB. 人 dann suche man mit .人
Man setzt ein Punkt vor das Kanji.


4e01 = .丁 = <CHOO, hinoto, TEI (DETCHI,TEN)>
[1)丁稚 でっち Lehrjunge; Laufjunge; Lehrling
丁稚奉公 でっちぼうこう Lehre; Lehrlingszeit

2) 拉丁語 ラテンご (Sprache) Lateinisch;
拉丁語 らてんご (Sprache) Lateinisch;
拉丁 ラテン (Sprache) Latein; lateinische Sprache; Romanisches; Südländisches; ]

Das 4e01 steht fuer Unicode. Nach dieser Reihenfolge ist das aufgelistet.
Die ON-kun Lesungen und die Sonderlesungen sind in einem Feld.
<..........>
Die Sonderlesungen sind in diesem Feld untergebracht in Klammern.
(........)
Die ON-Lesungen die nur ein Buchstabe haben, wie o i a e u gibt es zu Hauf in der Datei, da diese auch in normalen Woertern vorkommen.
Also habe ich diese einzeln in () Klammer stehen.

(a),(i),(o),(u),(e).

So auch die Doppel (oo). Ich sagte ja dass mein System kein ô oder Tilde auf dem o verarbeiten kann. Deshalb wird die Datei doch nicht schlechter wenn dieses Mankum nicht existiert.

Und als naechstes Feld sind alle Beispiele zwischen diesen Zeichen.
[.........]

Die Aufzaehlungen 1) 2) 3) etc. entsprechen der Auflistung der Sonderlesungen wie hier.
(DETCHI,TEN)

DETCHI = 1)


[1)丁稚 でっち Lehrjunge; Laufjunge; Lehrling
丁稚奉公 でっちぼうこう Lehre; Lehrlingszeit


TEN = 2)


2) 拉丁語 ラテンご (Sprache) Lateinisch;
拉丁語 らてんご (Sprache) Lateinisch;
拉丁 ラテン (Sprache) Latein; lateinische Sprache; Romanisches; Südländisches; ]

Und solche Zeichen lassen sich doch leicht manipulieren.


Also wenn man eine einzelne Zeile machen wollte, aendert man ^p[ mit [
Und dann steht alles in einer Zeile.



Frage: Hat es einen Sinn, nach Sonderlesungen zu suchen?

Was will der Mensch denn noch haben?
(Dieser Beitrag wurde zuletzt bearbeitet: 05.11.10 01:03 von zongoku.)
05.11.10 01:01
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Shino
Ex-Mod

Beiträge: 2.330
Beitrag #15
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
Es ist ja nur meine Meinung und ich bin keineswegs ein Experte (ich weiß gar nicht, wie du darauf kommst). Ich weiß, dass das viel Arbeit ist und ich will auch anerkennen, dass du dir viele Gedanken gemacht hast, die Daten in deinem Dokument zu strukturieren auffindbar zu machen. Die Idee mit dem vorgesetzten Punkt zum Anspringen eines Kanjis für die Suche ist wirklich gut.

In der Hauptsache ging es mir im vorigen Post aber darum, dass ich immer noch nicht verstehe, weshalb die Daten (oder momentan Teile, soweit es ein Beitrag zulässt...) unbedingt im Thread stehen müssen (siehe Beitrag 3 und 15 und... Wir hatten dich ja darum gebeten, die Daten nicht in Forumsbeiträgen sondern als Download zur Verfügung zu stellen - letzteres hast du ja auch getan, ersteres nicht) und dass andere Programme effizienter sind und kleinere Dateien produzieren, als MS-Word (MS-Word 2003: 2MB, MS-Word 2007: 455KB, txt/csv: 280kb, OpenOffice Writer: 140KB...). Ich hatte gehofft, dass du mit den Infos bezüglich der Dateigrößen vielleicht etwas hättest anfangen können - wenn nicht, vergiss es einfach.

Google Text & Tabellen ist übrigens aufgrund der Größenbeschränkungen leider doch keine Alternative für deine immense Datensammlung.

人生に迷うときもあるけど笑っていれば大丈夫
(Dieser Beitrag wurde zuletzt bearbeitet: 05.11.10 03:09 von Shino.)
05.11.10 01:25
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
yamaneko


Beiträge: 2.749
Beitrag #16
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
Die Liste ist für mich, weil mich interessiert, was der zongoku so alles finden kann mit dem WDW, was Rikaichan nicht anzeigt.Mit Downloaden und Entzippen kenne ich mich nicht aus. Aber Kopieren und Suchen kann ich und Rōmaji haben schon berühmte Japanologen in ihren Büchern verwendet.
Vielleicht schauen auch andere die Liste an.
Die Kommentare zu den Listen haben ich weder von Zongoku noch von Shino gelesen.
yamanekogähn

(Dieser Beitrag wurde zuletzt bearbeitet: 05.11.10 05:56 von yamaneko.)
05.11.10 05:54
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Nora


Beiträge: 2.091
Beitrag #17
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
Hallo noch einmal!

Ich denke, die Dateigröße ist kein Problem oder? Wir können hier einfach die Größe Hochschrauben - so viel Platz ist auf dem Server ganz bestimmt. Problematisch sind nur die langen Posts, das finde ich auch. Yamaneko habe ich per Mail schon geantwortet, aber ich mache es hier noch einmal, damit andere es auch lesen können:

Zitat:Wußtest Du, daß man mit einem Word-Dokument (er kann einfach ein Word-Dokument hochladen, wir haben genug Platz) ganz genau wie auf einer Internetseite suchen und kopieren kann? Ich glaube, daß damit unser Problem gut gelöst ist und Zongoku damit auch nicht die Freude am Forum verdorben wird. Wenn Du mit dem Herunterladen Schwierigkeiten haben solltest, kann ich Dir die Liste noch einmal per E-Mail zuschicken.
05.11.10 08:00
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
yamada


Beiträge: 957
Beitrag #18
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
Zitat:4f1a(1) 42 von unten: 詩的会合 してきがいごう Geschlossene Gesellschaft
Wahrscheinlich musst du 会合 mit 会社 verwechselt haben.
私的会合:private Versammlung oder 詩的会合:dichterische Versammlung (?)
05.11.10 10:13
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Shino
Ex-Mod

Beiträge: 2.330
Beitrag #19
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
(05.11.10 10:11)zongoku schrieb:  @Shino,
Nun ist wieder viel gesprochen worden und ich weiss noch immer nicht, wie du dir den Datensatz vorstellst. Kannst mir ja mal ein Beispiel geben, an Hand des 4e01 Kanji .丁
Hi Zongoku, vielen Dank für dein Einlenken. Ich habe noch mal nachgedacht: Da ich der einzige bin, der sich das wünscht, musst du dir die Arbeit nicht machen - es wäre wirklich ein ordentlicher Mehraufwand, der sich nur lohnen würde, wenn es auch entsprechend genutzt würde.

Wenn ich es brauchen sollte, werde ich mir die Daten selbst so aufbereiten, wie ich sie haben möchte. Ich sehe deine Datei nun eher als eine Art Nachschlagewerk, ein Spezial-Lexikon an - nur mit dem tatsächlich vorhandenen Vorteil der Durchsuchbarkeit. Sie ist also gut so, wie sie ist. Lass sie einfach so. Es tut mir leid, für so viel Aufregung gesorgt zu haben.

人生に迷うときもあるけど笑っていれば大丈夫
(Dieser Beitrag wurde zuletzt bearbeitet: 05.11.10 11:33 von Shino.)
05.11.10 11:31
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Shino
Ex-Mod

Beiträge: 2.330
Beitrag #20
RE: Projekt Sonderlesungen der Kanji auf Basis von Nanori 名乗り
Ok, um ehrlich zu sein, interessiert mich weder Formatierung noch irgendwelche weiteren Informationen. Ich bräuchte im Großen und Ganzen nur 3 Spalten, z. B. "Vokabel (Kanji/Kana)", "Lesung (Hiragana)" und "Bedeutung", die durch ein Zeichen, das ansonsten nirgends in der Datei Verwendung findet, getrennt werden. CSV bedeutet übrigens comma separated values ("durch Komma getrennte Werte" - weitere Infos) - da aber das Komma oft schon für Felder mit mehreren Angaben verwendet wird (z. B. bei den Bedeutungen), muss man sich für ein anderes Zeichen, wie z. B. den Tabstopp entscheiden. Der Vorteil von auf diese Art angebotenen Daten ist, dass sie leicht z. B. nach Excel importiert werden können und dann auch gleich ohne größeren Aufwand in Spalten und Zeilen geordnet werden.

Einzellesungen von Kanji und Informationen wie Unicode interessieren mich persönlich weniger, da ich nicht so lerne (immer nur im Zusammenhang mit Vokabeln).

Um die Daten weiter strukturieren zu können, könnte man auch noch weitere "Ordnungs"-Spalten einfügen, die die einzelnen Vokabeln kategorisieren, z. B. nach "Yojijukugo", Schuljahr/Schwierigkeitsgrad oder einzelne Bedeutungsbereiche, wie Tier- und Pflanzenwelt, Körper etc. pp, das ist aber für meine Belange nicht notwendig.

Das, was ich mir wünsche, wäre tatsächlich eher einfach eine Liste und im Grunde genommen ein ganz anderes Projekt, außerdem hätte sie den einzigen Zweck, die Daten in anderen Programmen weiter zu verwenden, daher wäre sie weder schön noch leicht lesbar.

Es ist halt die Frage, was man mit dem Material machen will bzw. aus welchem Grund man sie zur Verfügung stellt - daraus resultiert dann auch die Form. Ich habe einfach vollkommen andere Anforderungen an eine solche Sammlung und denke, ich habe dein Projekt einfach falsch verstanden.

Daher ist deine Datei so gut, wie sie ist. Du könntest z. B. in deine Datei noch weitere Erläuterungen hinzufügen, die in einer Liste, wie ich sie mir wünsche, nur stören würden.

人生に迷うときもあるけど笑っていれば大丈夫
(Dieser Beitrag wurde zuletzt bearbeitet: 05.11.10 17:05 von Shino.)
05.11.10 15:52
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Kanji-Sonderlesungen Woerterbuch
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
3te Lesung der Kanji fuer Namen (Nanori) zongoku 37 9.614 30.10.10 04:53
Letzter Beitrag: yamaneko
Kanji Regeln zongoku 2 2.468 14.07.10 10:38
Letzter Beitrag: zongoku
Kanji von konde iru Moonshroom 7 2.472 04.08.08 19:24
Letzter Beitrag: Moonshroom
Aussergewoehnliche Kanji. zongoku 1 1.612 27.05.07 00:42
Letzter Beitrag: yamada
Aru mit Kanji? Aikou 5 2.526 28.08.03 03:12
Letzter Beitrag: nanashi