Antwort schreiben 
新年号
Verfasser Nachricht
vdrummer


Beiträge: 1.388
Beitrag #21
RE: 新年号
So, mein Reiwa-Distanz-Projekt ist nun endlich zum Ende gekommen. Die Distanz ist definiert als Differenz der Indizes der Zeichen 令 und 和. Ein paar Beispiele:
令和 → 1
令1和 → 2
令12345和 → 6

Nach diesem Maß beträgt die Distanz im Original-Text 10 (stimmt nicht ganz; siehe edit). Von insgesamt 6181 gefundenen 令和-Paaren haben 20 eine Distanz < 10. Diese sind nachfolgend aufgeführt (der Name hinter der Zahl ist der Dateiname der entsprechenden Datei aus der ich die Textstelle habe):

Code:
2 keiryaku_nijusen
2 sakoku
3 kokubyaku_story
3 nagasakino_insho
5 haru_7
5 inochigake
6 06mariyusu
6 izawa_ranken
6 sakoku
6 showa_yugekitai
7 kojieni_torawareta
7 kokyo_shichijunen
7 mimizuno_tawagoto
7 nobuko
7 shinsho_taikoki04
8 atarashii_ushio
8 bunmeishijono_ichi_shinkigen
8 sonjo_senryakushi
9 berurinno_kotansai
9 kushu_sosokyoku

Die beiden Fälle mit der kleinsten Distanz stelle ich hier kurz mal vor:

keiryaku_nijusen schrieb:重大な命
×年も押詰《おしつま》った十二月の或日《あるひ》[...]

Hier war ein Zeilenumbruch dazwischen, den mein Programm allerdings nicht als Zeichen gewertet hat. Dieser Fall ist also etwas fragwürdig, da dieses 重大な命令 ja qquasi nur eine Überschrift ist.

sakoku schrieb:この問題は秀吉の追放に役立つ筈でもあった。

Hier haben wir es mit einem Kompositum 津法令+緩和 zu tun.

Zum Vergleich der Original-Text:
万葉集 schrieb:初春の月にして、気淑く風ぎ、梅は鏡前の粉を披き、蘭は珮後の香を薫す

EDIT: Mir fällt gerade auf, dass das natürlich nicht der Original 万葉集-Text ist rot
Hier der Original-Orginaltext mit Distanz 6:
万葉集 schrieb:天平二年正月十三日 萃于師老之宅、申宴会成、于時、初春月、気淑風、梅披鏡前之粉、蘭薫珮後之香

Schaut man sich die Verteilung der Distanzen an, sieht man, dass die meisten Instanzen tatsächlich zwischen 5 und 10 liegen. Eine Instanz mit Distanz 10 zu finden war also gar nicht so unwahrscheinlich zwinker

[Bild: hist_50.png?dl=1]

[Bild: hist_10k.png?dl=1]

Ich habe die Top 20 inkl. der relevanten Textstellen mal hochgeladen:
https://www.dropbox.com/s/8gr1mxa3kowoow...0.txt?dl=1

Falls Interesse besteht, lade ich auch gerne die kompletten Daten hoch.



PS: Satzgrenzen habe ich erstmal ignoriert, d.h, dem Programm ist es egal, ob die Kanji in einem Satz vorkommen oder nicht. Das erklärt auch, warum Distanzen in der Größenordnung 10.000 vorkommen.
(Dieser Beitrag wurde zuletzt bearbeitet: 10.04.19 22:20 von vdrummer.)
10.04.19 22:06
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Firithfenion


Beiträge: 1.727
Beitrag #22
RE: 新年号
Danke vdrummer für deine Bemühungen. Es ist also so wie ich vermutet habe. Die Kombination dieser beiden Kanji in einem Satz ist also keineswegs so exotisch, das man das jetzt eindeutig diesem Manjoushuu zuordnen könnte. Wenn die das selber sagen, wird es auch so stimmen, aber worauf ich hinaus wollte und was ja durch deine Tests auch bestätigt wurde, ist das diese Kanjikombination auch aus allen möglichen anderen Quellen hätte stammen können. Z.b. Harry Potter auf japanisch oder so.

Anders dürfte es schon aussehen wenn so ein 元号 aus... sagen wir mal 4 Kanji bestehen würde (die sich nicht berühren, also kein Wort bilden, aber in der korrekten Reihenfolge vorkommen müssen. Hier könnte es schon eher möglich sein eine Quelle zu identifiziern wenn wir mal annehmen das der Verfasser die Quelle nicht nennen will.

Truth sounds like hate to those who hate truth
11.04.19 16:32
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Hellstorm


Beiträge: 3.925
Beitrag #23
RE: 新年号
vdrummer, hast du dafür ein schönes Jupyter Notebook? grins

やられてなくてもやり返す!八つ当たりだ!
12.04.19 10:00
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 1.388
Beitrag #24
RE: 新年号
(12.04.19 10:00)Hellstorm schrieb:  vdrummer, hast du dafür ein schönes Jupyter Notebook? grins

Leider nein. Wie so oft bei mir war das eine Kombination aus Unix-Tools, Python und R. Ich kann aber gerne den Code zur Verfügung stellen, wenn gewünscht.
12.04.19 11:12
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Hellstorm


Beiträge: 3.925
Beitrag #25
RE: 新年号
Schade, Jupyter notebook ist ja für solche „Data Science“-Sachen sehr schön zum Weiterverteilen grins

やられてなくてもやり返す!八つ当たりだ!
12.04.19 12:38
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
新年号
Antwort schreiben