(23.12.17 10:53)moustique schrieb: Und was ist TSV?
Ich hatte noch gar nicht hier drauf geantwortet. Das will ich jetzt mal nachholen.
TSV steht für "Tab Seperated Values", also Werte, die durch Tabs getrennt sind. Wenn man sich das als Datenbank vorstellt, steht pro Zeile ein Datensatz und die einzelnen Felder sind durch Tabs getrennt. Ein Beispiel kommt weiter unten.
Eigentlich sollten solche Dateien die Endung "tsv" haben, aber in der Praxis heißen sie oft einfach "txt".
Zitat:In Unix also machbar. In Mac und Windows?
Mit Mac müsste das genau so wie mit Linux funktionieren. Es gibt ein paar Feinheiten, in denen sich die beiden unterscheiden, aber das Grundlegende sollte auch mit Mac klappen. Ich beschreibe mal, wie das funktioniert.
Stell dir vor, du hast eine Datei, die wie folgt aussieht:
Code:
食べる v1 たべる taberu
書く v5 かく kaku
見る v1 みる miru
確認する vS かくにんする kakunin-suru
探す v5 さがす sagasu
Zwischen den Einträgen steht ein Tab. Stell dir vor, du willst nur die Kanji-Darstellung, die Klasse des Verbs und die Rōmaji-Schreibweise haben. Dann kannst du (unter Mac / Linux) wie folgt vorgehen:
Im Terminal foldendes eingeben:
Nach "-f" steht, welche Felder man behalten möchte. Die Felder fangen bei 1 an. Man kann "a-b" oder "a,b" schreiben und die beiden miteinander vermischen.
Hinter der "4" steht ein Leerzeichen (das ist wichtig). Wenn du das geschrieben hast, ziehst du die Datei, die du filtern möchtest aus dem Finder in das Terminal. Das sieht dann vielleicht so aus:
Code:
cut -f 1-2,4 /Users/meinbenuzername/datei.txt
Dahinter kannst du noch ein ">" schreiben und danach den Namen der Datei, in der das Ergebnis (= die gefilterten Spalten) gespeichert werden soll:
Code:
cut -f 1-2,4 /Users/meinbenuzername/datei.txt > ergebnis.txt
Jetzt ist der Befehl komplett und du kannst Enter drücken.
In "ergebnis.txt" sollte jetzt folgendes drin stehen:
Code:
食べる v1 taberu
書く v5 kaku
見る v1 miru
確認する vS kakunin-suru
探す v5 sagasu
Die Einträge sind wieder durch Tabs getrennt.
Edit:
Die Zieldatei wird standardmäßig in dein Home-Verzeichnis gespeichert. Wenn du das nicht willst, kannst du mit
In einen anderen Ordner wechseln. Wie unter DOS, nur dass Unix / Linux Wert auf Groß- und Kleinschreibung legt.