 Info zu datasets/NDK

Updated:
Ren Locher, 24.5.00
Monika Ferster, 4.5.01

Dieses Directory enthlt Datenstze im ASCII-Format, welche fr die bungen
in NDK 4-6 gebraucht wurden bzw. werden. Datenstze fr NDK 3 sind in
datasets/NDK-old zu finden. 

*.txt-Files sind reine Text-Dateien (KEINE Word-Dateien), welche den
Datensatz beschreiben. Zu jedem .dat File sollte ein .txt File existieren.
Die Maske fr die Eingabe kann mit dem folgenden Befehl in der shell
aufgerufen werden. 
do-do, ev. ../do-doc	Ein Beispiel-shell-skript, welches *.txt  kreiiert.
Vergleiche auch das README in /u/sfs/datasets

Dataframes, welche in den Uebungen mit "d." beginnen, sind (in der Regel)
ohne dieses Prfix abgespeichert. (Die Ausnahmen werden spter noch bereinigt.) 

S-PLUS-Datenstze, welche mit S-PLUS mitgeliefert werden, sind nicht als
ASCII-Dateien im Verzeichnis Rohdaten abgelegt, ebenso Datenstze, die nur
aus wenigen Beobachtungen bestehen (--> bitte selber eintippen).

Die ASCII-Dateien kann man in S-PLUS folgendermassen einlesen:

1. mit der Funktion read.table()  ( oder evtl. mit scan() )
   Syntax: (siehe unbedingt auch noch das Help-File von read.table)

	read.table("DateiName", header=T, sep="\t")

	wobei:	"DateiName" : Name der ASCII-Datei (in Anfhrungszeichen)
		header=T    : falls in der ersten Zeile der ASCII-Datei die
			      Variablennamen stehen, setzt man header=T, 
			      sonst header=F
		sep="\t"    : wie sind die einzelnen Felder in den Zeilen 
			      getrennt?  
			      "\t" : Tabulator
			      " "  : Leerzeichen (Default)
			      ":"  : Doppelpunkt
			      ";"  : Semikolon
   Beispiel:
	initiative <- read.table("initiat.dat", header=T, sep="\t")

2. mit dem Men File/Import...  (nur in der Windows-Version ab 3.3)

Beachte:   1. S-PLUS-Objekte sind binre Files (d.h. nicht 'entzifferbar')
--------   2. S-PLUS-Objekte sind systemabhngig, d.h. nicht direkt von
	      Windows auf Unix-Rechner transportierbar.
              Man muss den 'Umweg' ber ASCII-Dateien machen (z.B. mit den 
	      Funktionen dump() und restore(), siehe entsprechende
	      Help-Files oder Manuals)
	   3. Objekte drfen in S-PLUS beliebig lange Namen haben.
	      In Windows werden aber Namen mit mehr als 8 Zeichen durch
	      eine Nummer abgekrzt. 
	   4. Mit read.table werden als Data.frames eingelesen. Weitere
	      Attribute bzw. andere Datenobjekte mssen von Hand bearbeitet
	      werden (z.B. Vektoren, Zeitreihen, Matrizen, Zahlen als
	      Faktoren).  





