Summary of '*.txt' files in /users/u1/staff/sfs/datasets ------- Ripley-PRNN-README: | Pattern Recognition and Neural Networks by B.D. Ripley | | This collection contains datasets used in the book Pattern Recognition and accident: | accident | frequency | Kategoriale Daten, Kontingenztafeln, Poisson | | " .tex" | -------------------------------------------------------------------------------- | Daten-Beispiel aus | "NDK 1992, J.Lindsey, Categorical Data", p.3 | Häufigkeit von Unfällen (z.B. bis zum Alter von 20 Jahren) | für verschiedene Personen. | | auch in NDK-Uebungen | | | | | -------------------------------------------------------------------------------- | ?? / 8 | read.table("/u/sfs/ueb/datasets/accident.dat",head=T,row=paste(0:6))) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | aids: | aids | Logarithmische Transformation, Regression | Medizin | 4/ SS92/3 | R/94 | | -------------------------------------------------------------------------------- | Das Total der gemeldeten Aidsfaelle in der CH in | dreimonatigen Abstaenden von 1983-1994 | Quartal, | KUMULATIVE Anzahl gemeldeter Faelle | Neue Faelle | Neue Faelle Maenner | Neue Faelle Frauen | korrigierte Version vom April 94, | Aufteilung nach Geschlecht | | | Man beachte auch aids2.dat, welches 1.Variable = Zeit (richtig !) | 2.Variable = kumul.Faelle | enthaelt | | Im "Ueb-Datensaetze" Ordner ist die Aufsplittung nach Geschlecht enthalten | -------------------------------------------------------------------------------- | 4/44 | -- nicht mehr SAS kompatibel ! --- | | -> aids.S | ~~~~~~ Fuer Einlesen, erzeugen von aids2.dat und einen Plot | -------------------------------------------------------------------------------- | DK/Bulletin des Bundesamtes fuer Gesundheitswesen/Nr16/ | 30.4.90 und Fax vom 28.4.94 | Ausschnitt davon in unserm "Ueb-Datensaetze" Ordner | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | die neuesten Daten sind erhaeltlich beim: | Bundesamt fuer Gesundheitswesen, Postfach 2644, 3001 Bern | | -------------------------------------------------------------------------------- | V.Gelpke, M.Huerzeler | 30.4.92 V.Gelpke, 3.5.94/MH | airline: | airline | time series, trend, regression | | R-SS200-1 | "rg.airline.tex" | -------------------------------------------------------------------------------- | Der Datensatz airline enthält die monatliche Anzahl | abfliegende Flugpassagiere in den USA für die Jahre | 1949-1960. | | | | -------------------------------------------------------------------------------- | | airline <- | scan.url("http://stat.ethz.ch/Teaching/Datasets/airline.dat") | library(ts); airline <- ts(airline,start=c(1949,1),freq=12) | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | alpha: | alpha-Teilchen | Poisson-Verteilung | Umwelt | WS95 | | -------------------------------------------------------------------------------- | Rutherford und Geiger haben die Emission der | $\alpha$-Teilchen einer radioaktiven Substanz gemessen. | In der Tabelle bezeichnet $k$ die Anzahl der | $\alpha$-Teilchen, die in der Zeiteinheit ($=7.5s$) | beobachtet wurden; $z_k$ gibt an, wie oft | $k=0,\, 1,\ldots,\,14$ $\alpha$-Teilchen beobachtet | wurden (total 2612 Zerfälle). | | SPEZ. EIG. : | | -------------------------------------------------------------------------------- | 2/15 | read.table("/u/sfs/datasets/alpha.dat", header=T) | | -------------------------------------------------------------------------------- | E. Weber 1980. "Grundriss der biologischen | Statistik", p.137 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | Oct/95/ARu anscombe-modif: | anscombe-modif | regression | | VERW.(VORL./J.-S.) : | Ueb.aufgabe : | -------------------------------------------------------------------------------- | | | Modifikation der urspruenglichen 4 Anscombe- Regressionsdatensätze, | um `ganz exakt' dasselbe zu geben. | | Geholt von | http://stork.ukc.ac.uk/IMS/statistics/people/J.M.Bremner/anscombe.html | | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/anscombe-modif.dat",header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | Anscombe, F. J. (1973). Graphs in statistical analysis; | The American Statistician, 27, 17-21. | | Bassett, E. E., Bremner, J. M., Jolliffe, I.T., Jones, B., | Morgan, B. J. T., and North, P. M. (1986). | Edward Arnold. | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 9.6.1999/M.Maechler anscombe: | anscombe | regression | | R-SS94-1 | " .tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/anscombe.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | antille-may-ex: | Antille/El May Example | robust regression, outlier | -- | -- | " .tex" | -------------------------------------------------------------------------------- | Künstliche Daten (!!) | ~~~~~~~~~~ | 1 Ausreisser in 12 Beobachtungen; | trotzdem brechen LMS und LTS (& mmreg) zusammen. | | M. Maechler hat dies aus | | Y.Dodge "Thoughts on Real Data and Statistics", on p.97 in | @Book{HinHF92, | author = {H. Hinterberger and J. French}, | title = {Proceedings of the Sixth International Working | Conference on Scientific and Statistical Database Management}, | publisher = ETH, | year = 1992 | } | where the data is cited from | @inproceedings{AntGM92, | author = {Gerard Antille and May, H. El}, | title = {The Use of Slices in the {LMS} and the Method of Density Slices: | {F}oundation and Comparison}, | year = 1992, | editor = {Yadolah Dodge and Joe Whittaker}, | Proc.\ 10th Symp.\ Computat.\ Statist., Neuchatel}, | 10}, | ISBN = {3-7908-0634-X (Physica). 0-387-91429-3 (Springer)}, | publisher = {Physica-Verlag}, | keywords = {Regression; Classification; Least median of squares}, | pages = {441--445}, | volume = 1, | } | | 1 Hebel-Ausreisser; Punkte nicht in allgemeiner Lage. | | -------------------------------------------------------------------------------- | 2 / 12 | read.table("/u/sfs/ueb/datasets/antille-may-ex.dat",head=T) | -------------------------------------------------------------------------------- | / | | s. oben | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | USERS : | Jan.1996 / M.Maechler apfel: | | | | | " .tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | asbest: | Asbest | Poisson-Verteilung | Umwelt | WS95 | | -------------------------------------------------------------------------------- | Um die Asbest-Konzentration zu messen, werden unter | anderem Asbestfasern auf einem Filter ausgezählt. | Dieser Teilaspekt wurde untersucht, indem Asbest in | Wasser gelöst und gleichmässig über den Filter gesprüht | wurde. Dann wurden 23 Proben von Filterstückchen mit | einem Durchmesser von 3 $mm$ genommen und die sich | darauf befindenden Asbestfasern unter dem | Elektronenmikroskop ausgezählt. | | | | -------------------------------------------------------------------------------- | 1/23 | read.table("/u/sfs/datasets/asbest.dat", header=F) | | -------------------------------------------------------------------------------- | J. Rice 1995 p.247 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | Oct/95/ARu asphalt: | Asphalt | multiple regression | Technik, Strassenbau | R/SS80-, R/SS82-, R/SS84-, R/SS86-34, R/SS88-36,... StMeth,chemIng | | -------------------------------------------------------------------------------- | Verschiedene Versuchsreihen zur Abnutzung des Asphaltes | in Funktion verschiedener Eigenschaften. | | "rate of rutting" = change of rut depth in inches/million | wheel passes ["rut":= 'Wagenspur", ausgefahrenes Geleise] | viscosity of asphalt | percentage of asphalt in surface course | percentage of asphalt in base course | '0/1' indicator for two sets of runs. | 10* percentage of fines in surface course | percentage of voids in surface course | | y & x1 werden logarithmiert; | Cp, stepwise regression | | -------------------------------------------------------------------------------- | 7/31 | read.table("...") | -------------------------------------------------------------------------------- | DtA/ Daniel & Wood 1980, 6.5, p.95 ff. | ?D/ Gorman, J.W. and Toman, R.J. (1966). | "Selection of Variables ..", Technometrics 8, 27-51. | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | -------------------------------------------------------------------------------- | .. | 30.8.88/Ruckstuhl; 11.96/M.Mächler astro: | astro Daten | statistischen test | | WS98 | | -------------------------------------------------------------------------------- | | | SPEZ. EIG. : | | -------------------------------------------------------------------------------- | 2/15 | read.table("/u/sfs/datasets/astro.dat", header=T) | | -------------------------------------------------------------------------------- | * / LITERATUR : | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Datensatz fuer Serie 2 der Vorlesung Statistische | Methoden (WS98) | | | -------------------------------------------------------------------------------- | | Nov/98/CSa | | ausbeute-chem: | Ausbeute bei chem. Versuch | 2^n-Design,n-way layout, WW | Chemie | NDK 92, SM 93/94 etc | /u/sfs/ueb/fortgeschrittene/aufgaben/va.ausbeute-chem.tex | -------------------------------------------------------------------------------- | | | Zufuhr (Liter/Min) | Katalysator (in %) | Ruehrgeschwindigkeit (Umdrehungen pro Min.) | Temperatur (C) | Konzenmtration (in %) | Ausbeute | | Die Variablen Zufuhr,...,Konz kommen auf 2 Stufen vor, weshalb sie gerade | mit L und H codiert sind. | | | | -------------------------------------------------------------------------------- | 6/32 | read.table("/u/sfs/ueb/datasets/ausbeute-chem.dat") | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Maechler (S | M.Huerzeler, Jan.93 auto89: | Auto89 | lineare Regression, Histogramme | Technik | 4/SS89 | | -------------------------------------------------------------------------------- | Automarke/Modell, | Benzinverbrauch pro 100km (L/100km),Leistung (kW), | Leergewicht (kg) und Hubraum (ccm). Die Daten wurden | 1989 fuer jene Automodelle erhoben, die in der Schweiz | zugelassen sind. | | | | -------------------------------------------------------------------------------- | 5/67 | INFILE | INPUT | | | -------------------------------------------------------------------------------- | / Auto 6.3.1989 Beilage des Tagesanzeigers | (Im Ordner ueber die Datensaetze abgelegt) | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 1.April 89 / A. Ruckstuhl autoabgase: | Autoabgase | Regression | Chemie, Technik | 4/SS92-3 | | -------------------------------------------------------------------------------- | Emissionen bei der Benzinverbrennung im Verbrennungsmotor. | Es werden die Abgase HC, CO und NOX bei Motoren | desselben Typs gemessen (in gram/mile). | | | | | -------------------------------------------------------------------------------- | 4/46 | INFILE | INPUT | | | -------------------------------------------------------------------------------- | /D.Moore, G.McCabe 1989 | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | V. Gelpke | 29.4.92 V.Gelpke baby: | baby | logistische regression, GLM | Medizin, Neonatologie | NDK 92/93, Statist.Methoden (WS 93/94 -- 96/97) | "/u/sfs/ueb/fortgeschrittene/aufgaben/lg.baby.tex" | -------------------------------------------------------------------------------- | | | Überleben von Frühgeborenen mit sehr kleinem Geburtsgewicht. | Es handelt sich um eine retrospektive Studie (Hibbard, 1986) von 247 Babies. | | | | -------------------------------------------------------------------------------- | 6 / 248 | read.table("/u/sfs/ueb/datasets/baby.dat") | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | Daten stammen vom damaligen NDK-Dozent Alan Welsh. | Obige Quelle (Hibbard, 1986) ist mir weiter nicht bekannt. | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Martin Maechler | 05.Jan 98 / MM bacterial.clumps: | bacterial clumps in milk | Poisson-Verteilung | Umwelt | WS95 | | -------------------------------------------------------------------------------- | Beim Testen von Milch auf bakteriologische | Verunreinigungen wird $0.01 ml$ Milch über eine | Glasfläche von $1 cm^2$ verteilt. Nachdem diese | Fläche in 400 Quadrätchen unterteilt wurde, sind die | Bakterienkolonien unter dem Mikroskop ausgezählt worden. | Es scheint naheliegend, dass diese Anzahlen genähert | Poisson verteilt sind. | | Poisson-Verteilung eher ungeeignet | | -------------------------------------------------------------------------------- | 2/12 | read.table("/u/sfs/datasets/bacterial.clumps.dat", header=T) | | -------------------------------------------------------------------------------- | J. Rice 1995 p.313 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | Oct/95/ARu bakteria: | TIME COUNT | 20 47 | 40 62 | 60 73 | 90 103 | 120 220 | 180 537 | 240 1580 | 300 4500 | 360 9200 | 420 12800 bakterien: | Bakterien | simple regression | Biologie | R/SS80-, R/SS82-, R/SS84-, R/SS86-, R/SS88- | | -------------------------------------------------------------------------------- | Bakterien wurden waehrend einer gewissen Zeit einer | Roentgenstrahlung ausgesetzt und die ueberlebenden | Bakterien gezaehlt. | | transformation | | -------------------------------------------------------------------------------- | 2/15 | INFILE 'Bakterien.dat'; | INPUT n; | | -------------------------------------------------------------------------------- | /Chatterjee & Price 1977 p.23 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 30.8.88/Ruckstuhl banknoten: | banknoten | Multivariat; Diskriminanzanalyse | Alltag; Wirtschaft | NDK-I/1991-92 | " .tex" | -------------------------------------------------------------------------------- | Riedwyl's Banknoten Daten | 100 gefälschte, 100 echte | | | Ein paar 'Ausreisser' | | -------------------------------------------------------------------------------- | 7/200 | read.table("/u/sfs/ueb/datasets/banknoten.dat", header = T) | | | -------------------------------------------------------------------------------- | / | | Riedwyl, ... ? ... | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | (dieses File wurde erst 1995 erstellt...) | | | -------------------------------------------------------------------------------- | Riedwyl, M.Mächler | Jan.92 / Nov.1995 barometerdruck: | barometerdruck | einfache lineare regression | physik, umwelt | 10/Fr-99 | "/u/sfs/ueb/einfuehrung/aufgaben/rg.barometerdruck.tex" | -------------------------------------------------------------------------------- | barometerdruck in verschiedenen höhenlagen, | gemessen auf meereshöhe und 12 erhebungen in frankreich | | | | -------------------------------------------------------------------------------- | row.names, ort, hoehe, druck, logdruck/13 | read.table("/u/sfs/ueb/datasets/barometerdruck.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | lineare regression und | * verwandtes. birkhäuser(1997) | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | grischott | 05. Feb 99/thg berliner: | berliner | Varianzanalyse, ANOVA | Lebensmittel | NDK 4 -- Varianzanlyse I, Beisp. 1.2; H.Roth, 1997 | "/u/sfs/ueb/..../... .tex" | -------------------------------------------------------------------------------- | | | | | | 1 Beobachtung ist ein "Ausreisser" | | -------------------------------------------------------------------------------- | 2 / 24 | read.table("/u/sfs/ueb/datasets/berliner.dat") | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | M.Maechler | 12.Jun 97 / biopol: | biopol | deskriptive Statistik, Gruppenvergleiche | Oekologie | EDA, diverse Serien und Jahre | "/u/sfs/ueb/einfuehrung/aufgaben/ad.biopol.tex" | "/u/sfs/ueb/einfuehrung/aufgaben/ad.biopolstreud.tex" | "/u/sfs/ueb/einfuehrung/aufgaben/as.biopoltest.tex" | "/u/sfs/ueb/einfuehrung/aufgaben/as.biopolvertrauensint.tex" | -------------------------------------------------------------------------------- | Abbau von Zellulosefaeden im Boden zur Beschreibung | der bodenbiologischen Aktivitaet. Detaillierte Beschreibung siehe oben | angegebene Uebunsaufgaben | | | | | -------------------------------------------------------------------------------- | 7/141 | read.table("/u/sfs/ueb/datasets/biopol.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | stammt aus der Diplomarbeit von Katharina Truninger | * an der Abteilung Xb (Umweltnaturwissenschaften) | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | rbr | 10.Dec 99 / R. Brun bitumen: | bitumen | gepaarten Stichproben | Technik (Strassenbau) | NDK94/95 | | -------------------------------------------------------------------------------- | Der Datensatz enth"alt die Brechpunkte f"ur sechs | verschiedene Bindemittel gemessen mit der manuellen | (Variable man) bzw. automatischen (Variable aut) | Methode und die Differenzen (Variable diff). | | read.table("/u/sfs/ueb/datasets/bitumen.dat", header = T) | | -------------------------------------------------------------------------------- | Daten von O.~Neubauer, EMPA D"ubendorf, | Kursbesucher NDK 93/94) | | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Prisca wird das noch ergänzen. | | | -------------------------------------------------------------------------------- | | bj04: | BJ04 | timeserie | Chemie | | | -------------------------------------------------------------------------------- | 226 Ablesungen in Minutenabstaenden der Temperatur | eines chemischen Prozesses. | | | | -------------------------------------------------------------------------------- | 1/226 | INFILE 'BJ04.dat'; | INPUT temp; | | | -------------------------------------------------------------------------------- | D / Box, Jenkins 1970 | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Nicht original Box-Jenkins Datensatz Serie C. | /100. | | | -------------------------------------------------------------------------------- | | 10.9.87/Schleiffer | bj05: | BJ05 | timeserie | Chemie | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | 226 Ablesungen in Stundenabstaenden der Viscositaet eines | chemischen Prozesses. | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | 1/310 | INFILE 'BJ05.dat'; | INPUT visc; | | -------------------------------------------------------------------------------- | D / Box,Jenkins 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Original Box,Jenkins Datensatz Serie D. | | | -------------------------------------------------------------------------------- | USERS : | 10.9.87/Schleiffer bj07: | BJ07 | timeserie | Chemie | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | Ertraege aus einem "batch chemical process". | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | 1/70 | INFILE 'BJ07.dat'; | INPUT yield; | | -------------------------------------------------------------------------------- | D / Box,Jenkins 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | | -------------------------------------------------------------------------------- | Nicht original Box,Jenkins Datensatz Serie F. | /10. | | -------------------------------------------------------------------------------- | USERS : | 10.9.87/Schleiffer bj10: | BJ10 | timeserie | Simulation | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | Simulierte dynamische Daten mit zwei Inputs. | | SPEZ. EIG. : | | | ------------------------------------------------------------------------------- | 1/64 | INFILE 'BJ10.dat'; | INPUT y; | | | -------------------------------------------------------------------------------- | D / Box,Jenkins 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Nicht original Box,Jenkins Datensatz Serie K. | /100. | | | -------------------------------------------------------------------------------- | USERS : | 10.9.87/Schleiffer bj11: | BJ11 | timeserie | Wirtschaft | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | Pilot Schema Daten. | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | 2/312 | INFILE 'BJ11.dat'; | INPUT x e; | | -------------------------------------------------------------------------------- | D / Box,Jenkins 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Nicht original Box,Jenkins Datensatz Serie L. | ( +111)/100, | ( +23)/10. | | | -------------------------------------------------------------------------------- | USERS : | 10.9.87/Schleiffer | bj12: | BJ12 | timeserie | Wirtschaft | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | Verkaufsdaten mit fuehrendem Indikator. | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | 2/150 | INFILE 'BJ12.dat'; | INPUT ind sales; | | -------------------------------------------------------------------------------- | D / Box,Jenkins 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Nicht original Box,Jenkins Datensatz Serie M. | /100. | | | -------------------------------------------------------------------------------- | USERS : | 10.9.87/Schleiffer blei: | Blei | univariate | Geologie | 4/SS84-2 | | -------------------------------------------------------------------------------- | Konzentration von Blei in Granit, gemessen an verschiedenen | Orten in Kanada. | | transformation | | -------------------------------------------------------------------------------- | 1/31 | INPUT konz; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | USERS : | 26.8.87/schleiffer body.brain: | body.brain | | Kategoriale Daten, Kontingenztafeln, GLM, Generalized Linear Models | EDA/94-SS | " .tex" | -------------------------------------------------------------------------------- | | | Körper- und Hirn-gewicht für 25 "Tier"arten (inkl. Mensch). | war in | NDK-Uebungen 4 aus "NDK 1992, J.Lindsey, Categorical Data"s | | Ausführlichere Daten (verschiedene Varianten) und Beschreibungen : | | --> NDK/animals.doc | | | | | -------------------------------------------------------------------------------- | 2 / 25 | read.table("/u/sfs/ueb/datasets/body.brain.dat", header= T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | V. Gelpke | bohnen: | | | | | | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | | | | | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | bovine: | bovine | | Wirkungsflächen | | | -------------------------------------------------------------------------------- | demo-rg-bovine in | /u/sfs/ueb/ChemieIngenieure/demo-aufgaben/ | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | | -------------------------------------------------------------------------------- | Response Surface Methodology | (Wiley 1995), Ex. 6.2 (p.223) | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | bremsweg: | Bremsweg | regression | Physik | R/SS80,82,84,86,88-7, 4/SS84-2 | | ------------------------------------------------------------------------------- | 63 Messungen des Bremsweges (in feet) eines Autos bei ver- | schiedenen Geschwindigkeiten (in miles/hour). | | transformation, varianzstabilisierende Trafo mit y=av+bv^2 | | ------------------------------------------------------------------------------- | 2/63 | INFILE 'Bremsweg.dat'; | INPUT v y; | LABEL v = "Geschwindigkeit" | y = " Bremsweg"; | | -------------------------------------------------------------------------------- | /Exekiel & Fox 1959 p.40 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | - polynomial y=av+bv^2 | - einfach z:=y/v=a+bv | | -------------------------------------------------------------------------------- | | 16.9.87/schleiffer | calcium: | calcium.dat | Nichtlineare Regression | Physik | NDK 5/1997-99, Nachpruefung, Aufgabe 2 | "/u/sfs/ueb/ndk/aufgaben/reg-calcium.tex" | -------------------------------------------------------------------------------- | | Die Zielvariable {\tt cal} des Data-Frames {\tt calcium} enthält die | Kalziumaufnahme von Zellen in einer radioaktiven Kalziumlösung als Funktion | der Zeit (erklärende Variable {\tt time}). | | | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | R. Invernizzi | Jun. 1998 calories: | calories | ANOVA , Boxplot , Histogram , Median , Transformation | Lebensmitteltechnologie | E in Statistik, H.R. Roth Ws 96/97 | "ad.calories.tex" | -------------------------------------------------------------------------------- | Results of a survey of 40 food items claiming to be | "lite," "reduced-calorie," "low-calorie," "diet," "low-fat," "no-fat," or | "health" foods. Each food is classified based on its | distribution as either nationally advertised, regionally distributed, or | locally prepared. | | The researchers measured the caloric content of each food by bomb | calorimetry, and converted these readings into an estimate of total | metabolizable energy (the type of energy the calories on a food label | are supposed to reflect). Finally, they calculated the percentage | difference between the measured calories and the labeled calories for each | item and per gram. | | "Let the buyer beware" is a phrase that comes to | mind when buying a used car, not when buying food. However, | Allison, Heshka, Sepulveda, and Heymsfield (1993) think that | this phrase should apply to purchasing "diet" and "health" | foods as well. They purchased 40 such food items in | Manhattan, New York and compared the caloric content of each to the | calories listed on the label. They discovered that some labels on food | packages understated the calorie content by more than 85%. | | Examination of the data shows that the distribution of percentage | difference per gram is symmetric, but information is missing for all of the | "locally prepared" foods. This variable cannot be used for a full | investigation of the relationship between distribution area and | underreporting of calories. The distribution of percentage difference per | Median=0 | is appropriate to determine whether there is an overall underreporting of | calories on food labels. | | Boxplots suggest that national products are not systematically under | reporting caloric content, regional products are somewhat under reporting, | and local products are most prone to under reporting. There is | also an increase in the variability as the classification changes from | local to regional and national. | One-way ANOVA can be used to address the relationship between distribution | area and underreporting of calories. Because of the skewness and non-constant | variance, the data should be transformed first. First, eliminate the | negative differences in the data set by adding 100 to each number before | transforming it. A reciprocal transformation (1/(100+percentage difference | per item) results in an approximately normally distributed variable. A | one-way ANOVA with this transformed difference as the dependent variable | shows a significant difference in underreporting among the different | distribution area categories. | | | | | | | -------------------------------------------------------------------------------- | 4 * 40 | Kind of food | Percentage difference between measured calories | and labeled calories per gram | (100% x (measured-labeled)/labeled) | Percentage difference between measured | calories and labeled calories per item | N if nationally advertised, R if | regionally distributed, L if locally prepared | read.table("/u/sfs/ueb/datasets/calories.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | /Allison, D., Heshka, S., Sepulveda, D., and | * Heymsfield, S. (1993), | "Counting Calories -Caveat Emptor," | JAMA, v. 270, pp. 1454-1456. | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | catheter: | catheter | regression, collinearity | | R-SS200-3 + NDK | "rg.catheter.tex" + NDK | -------------------------------------------------------------------------------- | Es handelt sich um Daten aus der Medizin. Die Variable x1 | bezeichnet die Grösse eines Patienten (in cm), x2 das | Gewicht (in kg) und y die optimale Länge eines Katheters | (in cm), der für eine Herzoperation verwendet wird. Man | möchte gerne die Katheter-Länge aus den Patienten-Daten | schätzen. | | | | -------------------------------------------------------------------------------- | | catheter <- | scan.url("http://stat.ethz.ch/Teaching/Datasets/catheter.dat") | | -------------------------------------------------------------------------------- | Math. Stat. and Data Analysis (2nd Ed) | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | cereal: | Cereal | anova,regression | Landwirtschafr, Bio | S/WS90, S/WS91, S/WS92-7, S/WS93-7 | "/u/sfs/ueb/va/a.cereal.tex" | -------------------------------------------------------------------------------- | Je 6 Messungen von Thiamin-Gehalten (mg/g) | f"ur 4 verschiedene Getreidearten | Devore, Exc. 10 / 8. thiamin in microgram/g" | | | | -------------------------------------------------------------------------------- | 2/24 (4 Gruppen `a 6) | read.table("/u/sfs/ueb/datasets/cereal.dat", header = T) | | | | -------------------------------------------------------------------------------- | Jay L. Devore (1988). | Probability and Statistics | for Engineering and the Sciences (2nd Ed.) | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Stammt von W. Stahel | | | -------------------------------------------------------------------------------- | M.Maechler | 4.Jan.93 cheddar-cheese: | Cheddar | Regression, Ausreisser, Modellreduktion | Lebensmittelingenieure | WS96/97 Abt VII H.R.Roth | "rg.cheese.tex" | -------------------------------------------------------------------------------- | Geschmacksbeurteilung von Cheddar Kaese. | 3 chemische Parameter wurden erhoben. | | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/cheddar-cheese.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Markus Huerzeler | Oct.96 | chicago: | chicago | regression | | Statistische Methoden WS98/99 | | ------------------------------------------------------------------------------- | 33 Reisezeiten mit öffentlichen Verkehrsmittel in Chicago | | | | | ------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | - einfach z:=y/v=a+bv | | -------------------------------------------------------------------------------- | | 8.12.98 Christian Sangiorgio | chol: | Cholesterol | normality, outliers | medicine | VERW.(VORL./J.-S.) : | " .tex" | -------------------------------------------------------------------------------- | KURZE BESCHREIBUNG : | Cholesterol measurements for 66 adult males as given in du Toit, | Steyn and Stumpf (1986, table 1.2). | For illustrative purposes, a mild "outlier" is | created by multiplying the largest value by 1.1 | | mild outlier | | -------------------------------------------------------------------------------- | 1/ | scan("/u/sfs/ueb/datasets/chol.dat") | | -------------------------------------------------------------------------------- | / | | Sucharita Ghosh (199x) "A new graphical tool to detect non-normality" | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | USERS : | Nov.1995/ M. Maechler christenings: | Christenings | | Soziologie | | | -------------------------------------------------------------------------------- | Anzahl Taufen von Maedchen und Knaben in London von | 1629-1758. | | | | | -------------------------------------------------------------------------------- | 5/130 | INFILE 'Christenings.dat'; | INPUT year males females mCorr fCor; | LABEL mCorr = 'males corrected' | fCorr = 'females corrected'; | | | -------------------------------------------------------------------------------- | D / Heberden | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Historischer Datensatz( Arbuthnot). | | | -------------------------------------------------------------------------------- | | 15.4.88/Schleiffer cortex: | cortex | lineare Regression, Wilcoxon Test | Psychologie | S/WS98-9 | "/u/sfs/ueb/fortgeschrittene/aufgaben/cortex.tex" | -------------------------------------------------------------------------------- | KURZE BESCHREIBUNG :Untersuchung, inwiefern Erfahrung biologische | Veränderungen in Gehirn des Menschen bewirkt. Experiment auf Ratten | 12 Paare (jeweils drei experimente möglich) | | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/cortex.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Sangiorgio | 6.1.1999/Sangiorgio | | | crab: | Kodiak Island king crab survey data | graphical data analysis | | S-Kurs August 92 | | -------------------------------------------------------------------------------- | king crab data for the years 1973-1986, | different datasets (see "crab/README" and "crab/readme"). | ~~~~~~~~~~~~~~~~~~ | The dataset has been analysed by 15 groups of statisticians and | presented in 1990 at the Meeting of ASA (Section on Statistical Graphics). | | | | | -------------------------------------------------------------------------------- | | INFILE | INPUT | | | -------------------------------------------------------------------------------- | 15 vA / American Statistical Association, 1990 Proceedings | of the Section on Statistical Graphics | (CS privat, oder ev. ETH HB) | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 12.8.92/ Caterina Savi crabs: | crabs | discriminant analysis | Biologie, Zoologie, Umwelt | VERW.(VORL./J.-S.) : | " .tex" | -------------------------------------------------------------------------------- | KURZE BESCHREIBUNG : | | Leptograpsus crabs | | Data from Campbell & Mahon (1974) on the morphology of rock crabs of genus | Leptograpsus. There are 50 specimens of each sex of each of two colour | forms. | | Data file crabs.dat has rows | | * sp `species' -- coded B (blue form) or O (orange form) | * sex -- coded M or F | * index -- within each group of 50 | * FL -- frontal lip of carapace (mm) | * RW -- rear width of carapace (mm) | * CL -- length along the midline of carapace (mm) | * CW -- maximum width of carapace (mm) | * BD -- body depth (mm) | | SPEZ. EIG. : | | -------------------------------------------------------------------------------- | ?? / 200 | read.table("/u/sfs/ueb/datasets/crabs.dat", header = T) | | -------------------------------------------------------------------------------- | / | Brian D. Ripley (1996). Pattern Recognition and Neural Networks. | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | USERS : | Jan.1996 / M. Maechler darwin: | Selbst- und Fremdbefruchtung | stem-and-leaf | Biologie, Genetik | eda SS 94 | "/u/sfs/ueb/eda/ad.darwin.tex" | -------------------------------------------------------------------------------- | | Die Daten sind aus einer Studie von Charles Darwin über die Fremd- | und Selbstbefruchtung. 15 Paare von Setzlingen mit demselben Alter, je einer | durch Selbst- und einer durch Fremdbefruchtung produziert, wurden | gezüchtet. Beide Teile je eines Paares hatten nahezu gleiche Bedingungen. Das | Ziel bestand darin zu sehen, ob die fremdbefruchteten Pflanzen mehr | Lebenskraft besitzen als die Selbstbefruchteten. Es wurden die Höhen (in | inches) jeder Pflanze nach einer fixen Zeitspanne gemessen. | | | -------------------------------------------------------------------------------- | 15/2 | read.table("/u/sfs/ueb/datasets/darwin.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | /Small data sets D.J. Hand et. al, Chapman & Hall | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 6.4.94 V.Gelpke delinq: | delinq | Kriminalitaet, Boy-Scouts, Soziologie | Kategoriale Daten, Kontingenztafeln, Loglineare Modelle | NDK/1992, S/92-13 | "/u/maechler/Vorl/StatMeth/Ueb/delinq.tex" | -------------------------------------------------------------------------------- | Daten-Beispiel aus "NDK 1992, J.Lindsey, Categorical Data", | auch in NDK-Uebungen | 3-weg Kontingenztafel (3 x 2 x 2) | SS = Socio-Economic Status (Sozialer Status) | BS = Boy Scout (Pfadfinder) | D = 'delinquent' (kriminell) | freq = corresponding frequency | | | -------------------------------------------------------------------------------- | 4 / 1214 | read.table("/u/sfs/ueb/datasets/delinq.dat", header = T) | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | distrib: | X | 7 | 6 | 4 | 6 | 7 | 7 | 5 | 8 | 6 | 4 | 8 | 5 | 5 | 5 | 6 | 8 | 4 | 6 | 4 | 4 | 6 | 5 | 5 | 8 | 4 | 4 | 8 | 7 | 4 | 5 | 5 | 7 | 4 | 4 | 9 | 11 | 6 | 5 | 7 | 3 | 4 | 9 | 7 | 9 | 8 | 6 | 12 | 7 | 6 | 6 | 1 | 2 | 1 | 2 | 6 | 6 | 2 | 9 | 3 | 7 | 6 | 7 | 7 | 8 | 9 | 3 | 5 | 5 | 7 | 3 | 8 | 6 | 11 | 4 | 5 | 6 | 4 | 4 | 10 | 6 | 6 | 6 | 6 | 9 | 11 | 4 | 6 | 3 | 4 | 4 | 5 | 5 | 5 | 7 | 9 | 6 | 7 | 7 | 8 | 6 | 8 | 7 | 7 | 5 | 9 | 5 | 4 | 6 | 3 | 9 | 4 | 3 | 7 | 6 | 6 | 8 | 9 | 3 | 5 | 11 | 4 | 7 | 7 | 10 | 1 | 9 | 9 | 12 | 7 | 3 | 6 | 10 | 4 | 6 | 7 | 7 | 9 | 7 | 9 | 7 | 6 | 4 | 3 | 17 | 7 | 6 | 7 | 1 | 5 | 5 | 8 | 5 | 14 | 5 | 3 | 5 | 8 | 9 | 6 | 0 | 4 | 9 | 5 | 3 | 6 | 9 | 4 | 5 | 12 | 6 | 5 | 6 | 5 | 9 | 4 | 4 | 7 | 9 | 8 | 2 | 4 | 6 | 5 | 9 | 12 | 3 | 11 | 9 | 8 | 5 | 6 | 5 | 6 | 6 | 7 | 7 | 7 | 4 | 7 | 4 | 8 | 6 | 4 | 4 | 7 | 7 | 10 | 5 | 7 | 4 | 8 | 8 | 9 | 8 | 2 | 5 | 2 | 4 | 6 | 5 | 4 | 3 | 8 | 6 | 5 | 3 | 4 | 4 | 6 | 4 | 5 | 2 | 4 | 7 | 7 | 4 | 10 | 6 | 7 | 4 | 4 | 5 | 7 | 5 | 9 | 5 | 10 | 8 | 6 | 2 | 6 | 4 | 4 | 4 | 7 | 1 | 4 | 6 | 5 | 5 | 6 | 4 | 12 | 9 | 6 | 10 | 4 | 6 | 4 | 12 | 5 | 6 | 5 | 8 | 9 | 5 | 12 | 3 | 9 | 3 | 5 | 6 | 8 | 3 | 7 | 6 | 8 | 5 | 10 | 6 | 8 | 4 | 6 | 4 | 5 | 6 | 5 | 8 | 8 | 4 | 3 | 7 | 5 | 5 | 5 | 6 | 10 | 11 | 6 | 7 | 8 | 6 | 3 | 4 | 6 | 6 | 5 | 10 | 4 | 5 | 2 | 12 | 7 | 7 | 3 | 4 | 8 | 5 | 5 | 4 | 8 | 13 | 4 | 6 | 8 | 4 | 7 | 4 | 9 | 3 | 3 | 5 | 4 | 7 | 11 | 3 | 8 | 10 | 7 | 7 | 5 | 10 | 4 | 7 | 6 | 8 | 11 | 4 | 4 | 5 | 4 | 11 | 12 | 8 | 10 | 8 | 9 | 9 | 7 | 4 | 6 | 2 | 7 | 7 | 5 | 6 | 1 | 6 | 5 | 6 | 6 | 4 | 12 | 2 | 13 | 4 | 5 | 7 | 12 | 7 | 4 | 7 | 8 | 5 | 6 | 7 | 4 | 6 | 3 | 7 duenger-sorte: | | VA,2 way anova | Landwirtschaft | NDK/92, S/92-9 | "/u/maechler/Vorl/StatMeth/Ueb/va.duenger-sorte.tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | | Einlesen mit S-plus:read.table("/u/sfs/ueb/datasets/duenger-sorte.dat",header=T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 18.1.93, M. Maechler engadiner: | engadiner | Zeitreihen, gepaarte zwei-stichproben, Changepoint | Sport, Fitness, "Langlaeufer leben laenger" | F.Hampel "Math.IV, Abt. XB", SS9 | "/u/sfs/ueb/eda/ad.engadiner.tex" | -------------------------------------------------------------------------------- | Siegerzeiten am Engadiner Ski-Marathon [Langlauf], | fuer Frauen und Maenner. | | Die Frauen "holen" auf. | 1991 musste der Lauf abgesagt werden infolge Tauwetters. | | -------------------------------------------------------------------------------- | 2 / 25 | read.table("/u/sfs/ueb/datasets/engadiner.dat") | INFILE | INPUT | | -------------------------------------------------------------------------------- | D/Zeitungsausschnitt in unserm "Ueb-Datensaetze" Ordner | mit Namen (+..) der Siegerinnen und Sieger | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Sonja Ketterer | event: | event | | Kategoriale Daten, Kontingenztafeln, Poisson | | " .tex" | -------------------------------------------------------------------------------- | Daten-Beispiel aus "NDK 1992, J.Lindsey, Categorical Data", auch in NDK-Uebungen | | | | | | | -------------------------------------------------------------------------------- | ?? / 19 | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | farm: | Farm | multiple regression | Wirtschaft | R/SS80,82,84,86,88 | | -------------------------------------------------------------------------------- | Einkommen von 20 amerikanischen Farmern in Abhaengigkeit | von der Anzahl Kuehe und der Ackerflaeche. | | eine Variable verdeckt die andere | | -------------------------------------------------------------------------------- | 3/20 | INFILE 'Farm.dat'; | INPUT I C A; | LABEL I = "income" | C = "cows" | A = "acres"; | | -------------------------------------------------------------------------------- | /Ezekiel & Fox 1959 p.158 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 30.8.88/Ruckstuhl ferkel: | Ferkel | correlation | Chemie | 4/SS87-2 | | -------------------------------------------------------------------------------- | Auswirkungen eines Diaetfutters auf die Sterblichkeit durch | die Oedemkrankheit bei Ferkeln. | | transformation | | -------------------------------------------------------------------------------- | 4/6 | INFILE 'Ferkel.dat'; | INPUT tage total gesto proz; | LABEL tage='# Tage mit Diaet' | total='totale # Ferkel' | gesto='# gestorbene Ferkel' | proz='Anteil gestorbener Ferkel in %'; | | -------------------------------------------------------------------------------- | / | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer fibre: | fibre | Contingency table , Chi square test | Lebensmittel, Medizin | Lebensmitteling./96/97 V.Gelpke | "/u/sfs/ueb/einfuehrung/aufgaben/as.faser.tex" | -------------------------------------------------------------------------------- | | | A manufacturer was considering marketing crackers high in a certain kind of | edible fiber as a dieting aid. Dieters would consume some crackers before | a meal, filling their stomachs so that they would feel less hungry and eat | less. A laboratory studied whether people would in fact eat less in this | way. Overweight female subjects ate crackers with different types of fiber | (bran fiber, gum fiber, both, and a control cracker) and were then allowed | to eat as much as they wished from a prepared menu. The amount of food they | consumed and their weight were monitored, along with any side effects they | reported. Unfortunately, some subjects developed uncomfortable bloating and | gastric upset from some of the fiber crackers. A contingency table of | "Cracker" versus "Bloat" shows the relationship between the four different | types of cracker and the four levels of severity of bloating as reported by | the subjects. | | Was ist fibre.small.dat ?? [mit S / R erzeugt ?] | | | | | -------------------------------------------------------------------------------- | 5/48 | read.table("/u/sfs/ueb/datasets/fibre.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | http://lib.stat.cmu.edu/DASL/Datafiles/Fiber.html | This data is distributed with the software package, | Data Desk. | Data Description, Inc. (1993). "Data Desk". | Data Description, Inc. | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | V.Gelpke | 9.1.97 fischfang: | Fischfang | 1-group test | Wirtschaft | 4/SS86-11 | | -------------------------------------------------------------------------------- | Vergleich der Fischfangmethoden Pipe und Brush. In 16 ver- | schiedenen Zeitperioden, auf 4 Jahre verteilt, wurden die | durchschnittlichen Fischfangquoten pro Tag aufgezeichnet. | | Differenzen = 0-mean Sti. | | -------------------------------------------------------------------------------- | 2/16 | INPUT pipe brush; | | -------------------------------------------------------------------------------- | ?? / | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer flavor.color: | flavor.color.dat | Binomialvert | food sensory | Lebensmitteling WS 96/97 | " aw.flavor.color.tex" | -------------------------------------------------------------------------------- | Die Fähigkeit den Geschmack von Joghurt zu erkennen, | wenn die Farbe absolut nicht zum Geschmack passt. | red:apple-juice | raspberry | coffee | Citrus | Im file sind die Anzahl Richtig "geratenen" Geschmäcker | aufgeführt. (<=4) | | | -------------------------------------------------------------------------------- | 1 | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | /Sensory response To food, a sensory workshop, 1977, | * Genser, Moskowitz et.al | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Ist nicht binomialverteilt, obwohl das zu erwarten wäre | | | -------------------------------------------------------------------------------- | V.Gelpke | 11.11.96 flugunfaelle: | Flugunfaelle | simple regression | Wirtschaft | R/SS86-2 | | -------------------------------------------------------------------------------- | Beziehung zwischen der Anzahl Unfaelle und dem Anteil | am Total der Fluege von 9 Fluggesellschaften. | | transformation | | -------------------------------------------------------------------------------- | 2/9 | INFILE Flugunfaelle.dat'; | INPUT Unfaelle Anteil; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 30.8.88/Schleiffer fluss: | Fluss | regression | Umwelt | 4/SS84-4,4/SS85-6,4/SS87-2, R/SS80,82,84,86,88-1,90-1,92-1 | | -------------------------------------------------------------------------------- | Fuer den Fluss Kootenai (USA/Canada) wurden in den Jahren 1931-43 | an zwei Orten (Newgate, British Columbia und Libby, Montana) | jeweils die im Januar durchfliessende Wassermengen pro Sekunde | (in [100 cfs] = [100 ft^3] = 2.8317 [m^3]) gemessen. | | leverage point | | -------------------------------------------------------------------------------- | 2/13 | INPUT libby newgate; | | -------------------------------------------------------------------------------- | /Ezekiel & Fox 1959 p.58 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer foehren: | | | | | " .tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | forbes: | forbes | regression | | R-SS94-1 | " .tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/forbes.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | futterwiesen: | futterwiesen | Varianzanalyse, hierarchisches Modell | Agronomie | Statistik II (Agro) | "/u/sfs/ueb/fortgeschrittene/aufgaben/va.futterwiesen.tex" | -------------------------------------------------------------------------------- | In Rahmen einer Studie zum Vergleich von Futterwiesen | wurden von zwei Wiesentypen (Faktor {\tt TYP}) | zufällig je drei Wiesen (Faktor {\tt WIESE}) ausgewählt. Auf jeder | Wiese wurde an fünf zufällig ausgewählten Parzellen der Futterertrag | | $ TYPES Wiesentyp | $ PRAIRIE Wiese | $ RENDEMENT Ertrag | | | | | | -------------------------------------------------------------------------------- | 3 / 30 | read.table("/u/sfs/ueb/datasets/futterwiesen.dat", header = T) | | | | -------------------------------------------------------------------------------- | Dagnelie, Pierre (1970) Theorie et methodes | statistiques. Applications agronomiques p.205ff. (Buch in Agrobib)/ D,vA,K | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | rbr | 11.Aug 00 / Roland Brun gaenseleber: | gaenseleber | faktorielles Design | Lebensmitteltechnologie | Statistik II (Agro) | "/u/sfs/ueb/fortgeschrittene/aufgaben/rg.gaenseleber.tex" | -------------------------------------------------------------------------------- | Entwicklung eines Verfahrens zur Produktion von foie | gras de canard. Bei der Sterilisierung von Gänseleber entstehen unerwünschte | Fettverluste. Um diese Verluste minimal halten zu können, wird die | Abhängigkeit des Fettverlustes von verschiedenen Einflussfaktoren | untersucht (faktorielles Design). Genauere Angaben siehe Literatur. Die | | Nummer der Wiederholung | Index | Geometrie des Sterilisators (Blockfaktor) | Anzahl Konservendosen im Sterilisator | Geometrische Form der Konservendosen | Wassertemperatur vor Beginn der Sterilisierung | Wasservolumen im Sterilisator | Dauer der Sterilisationsphase | Dauer der Abkuehlungsphase | Mastregime | Mastdauer | Fettverlust in Gramm | | | | | -------------------------------------------------------------------------------- | 12 / 24 | read.table("/u/sfs/ueb/datasets/gaenseleber.dat", header = T) | | | | -------------------------------------------------------------------------------- | Schimmerling Paul et al. (1998) Pratique des plans | d'exp\'eriences. p.285ff / D, vA,K (Kopie bei Puma) | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | rbr | 11.Aug 00 / Roland Brun gas: | gas | regression | Statistische Methoden (WS 98/99) | VERW.(VORL./J.-S.) : | | -------------------------------------------------------------------------------- | in gas.dat gibt es Angabe zur Differenz zwischen | Aussen- und Innentemperatur (in C) und dem Gasverbrauch (in kWh) von 15 mit | Gas geheizten Häusern | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | | | -------------------------------------------------------------------------------- | | -------------------------------------------------------------------------------- | | | -------------------------------------------------------------------------------- | USERS : | 25.11.98/ Ch. Sangiorgio | | gasfeuerung: | Gasfeuerung | timeserie | Chemie | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | Gasfeuerungsdaten gemessen alle 9 Sekunden. | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | 2/296 | INFILE 'Gasfeuerung.dat'; | INPUT x y; | LABEL x = '0.6-0.04*(Gaszufluss in ft^3/min)' | y = 'CO2 im Gasausfluss'; | | -------------------------------------------------------------------------------- | D / Box,Jenkins 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Nicht original Box,Jenkins Datensatz Serie J. | /10. | | | -------------------------------------------------------------------------------- | USERS : | 10.9.87/Schleiffer | | gemsen: | gemsen | deskriptive Statistik, Gruppenvergleiche, Korrelation | Oekologie | EDA, diverse Serien und Jahre | "/u/sfs/ueb/einfuehrung/aufgaben/ad.gemsen.tex" | "/u/sfs/ueb/einfuehrung/aufgaben/ad.gemsen2.tex" | "/u/sfs/ueb/einfuehrung/aufgaben/aw.gemsen[123].tex" | +weitere Varianten | -------------------------------------------------------------------------------- | Studie zur Untersuchung der Konstiution von | Gemsen. Variablen haben folgende Bedeutung | Abschussjahr | Geschlecht des erlegten Tieres | Alter des erlegten Tieres | Altersgruppe | Gewicht des erlegten Tieres in kg ? | Kruckenlange (Laenge des Hornes) in mm ? | Gebietscode 0=Untersuchungsgebiet (Jagdbanngebiet) 1=Referenzgebiet | | weitere Erlaeuterungen siehe in Uebungsaufgaben und Musterloesungen. | | | | -------------------------------------------------------------------------------- | 7/1353 | read.table("/u/sfs/ueb/datasets/gemsen.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | stammt aus einer Semesterarbeit von Carola Tschanen | * an der Abteilung Xa Biologie. (urspruenglich Quelle Berner | * Jagdinspektorat bzw. Buero WildARK/ | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | rbr | 10.Dec 99 / R. Brun geysir: | Geysir | lin. Regression | Geologie | 4/SS92-1 | | -------------------------------------------------------------------------------- | Eruption des Geysirs Old Faithful im Yellowstone National | Park vom 1.8.-8.8 1978.Es wurden die Ausbruchsdauer und die | Zeitspanne zwischen zwei Ausbruechen (beides in Minuten) | gemessen. 1.Var.=Tag, 2.Var=Zeitspanne, | 3.Var=Eruptionsdauer | | | | -------------------------------------------------------------------------------- | 3/107 | INFILE | INPUT | | | -------------------------------------------------------------------------------- | /Weisberg, 1985 | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 13. April 92 glauxmaritima: | glauxmaritima | poisson, negativ binomial, chi^2-test | oekologie | 10/SS98-4 | "/u/sfs/ueb/einfuehrung/aufgaben/as.evans.tex" | -------------------------------------------------------------------------------- | "glaux maritima", gezählt in 500 aneinandergrenzenden | quadrätlein | | | | | | -------------------------------------------------------------------------------- | 1/14 | read.table("/u/sfs/ueb/datasets/glauxmaritima.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | D/John. A. Rice, 1995 | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Grischott | 15.Apr 98 /Grischott groessen: | Groessen | correlation,regression | Biologie | 4/SS82-2,4/SS83-2,4/SS84-3,4/SS86-2,4/SS87-2 | | -------------------------------------------------------------------------------- | Die Koerpergroessen von 20-jaehrigen und ihren Eltern wur- | den gemessen. Die mittlere Elterngroesse und das Geschlecht | der Kinder werden mit einbezogen. | | groupings | | -------------------------------------------------------------------------------- | 5/230 | INPUT sex child mother father average; | LABEL sex='8=weiblich, 9=maennlich'; | LABEL average='mittlere Elterngroesse'; | | -------------------------------------------------------------------------------- | / Francis Galton (1885). | "Regression towards mediocrity" (??) | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer | hadi-simonoff: | Hadi-Simonoff | Robust Regression; outliers | -- (kuenstliche Daten) | VERW.(VORL./J.-S.) : | " .tex" | -------------------------------------------------------------------------------- | KURZE BESCHREIBUNG : | Ein künstliches Datenbeispiel; y = x1 + x2 + E; E ~ N(0,1) | (x1, x2 ~ U[0,15] mit Korrelation ~ .5 | y = x1 + x2 + 4 (exakt); für x1,x2 ~= 15 ~= max(x_i) | | | Beobachtungen 1-3 sind "Ausreisser" (an der Grenze) | | -------------------------------------------------------------------------------- | 3/25 | read.table("/u/sfs/ueb/datasets/hadi-simonoff.dat") | | -------------------------------------------------------------------------------- | / | | S. 1269 | D, vA / | @Article{HadAS93, | Author = {Hadi, Ali S. and Simonoff, Jeffrey S.}, | Title = {Procedures for the Identification of Multiple Outliers in | Linear Models}, | Year = 1993, | Journal = JASA, | Volume = 88, | Pages = {1264--1272} | } | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | Data kindly provided through e-mail from Jeff Simonoff to MM. | | -------------------------------------------------------------------------------- | USERS : | 17.Oct.1995, Martin Mächler holz-saege: | Schnittleistung von Saegen | lateinisches Quadrat, analysis of variance | Forstwirtschaft | NDK 92, S/93-10, S/94-10 | "/u/sfs/ueb/ndk/Varianzanalyse/holz-saege.tex" UND | "/u/sfs/ueb/fortgeschrittene/aufgaben/va.holz-saege.tex" | "/u/sfs/ueb/fortgeschrittene/aufgaben/va.holz-s-noComp.tex" | -------------------------------------------------------------------------------- | Untersuchung von Schnittleistungen bei Saegen. Es | werden alle Saegen an 6 Holzarten geprueft; dazu | werden 6 Arbeitergruppen eingesetzt. Der Versuch wird | im lateinischen Quadrat durchgefuehrt. | | | | -------------------------------------------------------------------------------- | 4/36 | read.table("/u/sfs/ueb/datasets/holz-saege.dat") | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Maechler | M.Huerzeler , Jan.93 horskick: | horskick | | Kategoriale Daten, Kontingenztafeln, Poisson | | " .tex" | -------------------------------------------------------------------------------- | Daten-Beispiel aus "NDK 1992, J.Lindsey, Categorical Data", auch in NDK-Uebungen | | | | | | | -------------------------------------------------------------------------------- | ?? / 7 | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | ibmkurse1: | IBMKurse1 | timeserie | Wirtschaft | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | Taegliche IBM-Boersenabschlusskurse zwischen 29.6.59 und | 30.6.60. | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | 1/255 | INFILE 'IBMKurse1.dat'; | INPUT kurs; | | -------------------------------------------------------------------------------- | D / Box,Jenkins 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Nicht original Box,Jenkins Datensatz Serie B'. | /100. | | | -------------------------------------------------------------------------------- | USERS : | 10.9.87/Schleiffer ibmkurse2: | IBMKurse2 | timeseries | Wirtschaft | | | -------------------------------------------------------------------------------- | Taegliche IBM-Boersenkurse zwischen17.5.61 und 2.11.62 | | | | | -------------------------------------------------------------------------------- | 1/369 | INFILE 'IBMKurse2.dat'; | INPUT kurs; | | | -------------------------------------------------------------------------------- | D /Box, Jenkins 1970 | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | nicht original Box,Jenkins Datensatz Serie B. | /100. | | | -------------------------------------------------------------------------------- | | 10.9.87/Schleiffer job: | job | Kategoriale Daten, Kontingenztafeln, GLM, Generalized Linear Models | Soziologie | NDK/1992 | " .tex" | -------------------------------------------------------------------------------- | NDK-Uebungen 4 aus "NDK 1992, J.Lindsey, Categorical Data"s | | Hier als Kontingenztafel. | | Dasselbe als "Poisson Data.frame" | | | | | -------------------------------------------------------------------------------- | 4 x 4 Tafel; N = 901 | read.table("/u/sfs/ueb/datasets/job.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | job2: | job2 | Kategoriale Daten, Kontingenztafeln, GLM, Generalized Linear Models | Soziologie | NDK/1992 | " .tex" | -------------------------------------------------------------------------------- | NDK-Uebungen 4 aus "NDK 1992, J.Lindsey, Categorical Data"s | | Hier als "Poisson Data Frame" | | Dasselbe als Kontingenztafel | | | | | -------------------------------------------------------------------------------- | 3 / 16 (16 = 4 x 4 Tafel; N = 901) | read.table("/u/sfs/ueb/datasets/income.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | jobsat: | Job Satisfaction | Log-linear model; logicistic; contingency table; GLM; GLIM | Soziologie | VERW.(VORL./J.-S.) : | " .tex" | -------------------------------------------------------------------------------- | KURZE BESCHREIBUNG : | | Zufriedenheit mit Anstellung (y/n) in einer sehr grossen Firma der USA, | aufgeteilt nach Region, Geschlecht, Alter & Hautfarbe | 7 2 3 2 | | --> job.dat|doc | | | SPEZ. EIG. : | | -------------------------------------------------------------------------------- | DIM.(VAR./FAELLE) : | d.jsa_ read.table("/u/sfs/ueb/datasets/jobsat.dat") | d.js _ read.table("/u/sfs/ueb/datasets/jobsat2.dat",head=T) | glm(cbind(N.y, N.n) ~ .^2, data = d.js, family = binomial) | | Viel mehr noch in /u/stahel/ndk/unterlagen/f.S | | ------------------------------------------------------------------------------- | / | | D / Fowlkes et al, JASA 83 (1988), 611 / | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | W. Stahel (hat's eingetippt!) | M. Mächler, 18.Okt.1995 kaese: | kaese | paarweiser t-Test | Lebensmittelingenieure | 96 H.R.Roth | " ad.kaese.tex" | -------------------------------------------------------------------------------- | Vergleich der Bitterness von 2 cheddar cheese mit 2 | unterschiedlichen Milch-Koagulations-Enzymen durch | 1="not bitter" | 9="extremley bitter" | Prüfer | Behandlung A | Behandlung B | | | | | -------------------------------------------------------------------------------- | 3*20 | read.table("/u/sfs/ueb/datasets/kaese.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | L.M. Poste,Laboratory methods for sensory analysis of food | vA | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | kartoffeln: | kartoffeln | Varianzanalyse, Blockversuch | Agronomie | Statistik II (Agro) | "/u/sfs/ueb/fortgeschrittene/aufgaben/va.kartoffeln.tex" | -------------------------------------------------------------------------------- | Zur Untersuchung des Einflusses verschiedener Fungizide | auf den Ertrag von Kartoffeln wurde ein Experiment mit vier verschiedenen | Fungizidbehandlungen (Fungizid 1-4) sowie einer Kontrollbehandlung | (Kontrolle) in vier Blöcken durchgeführt. | | Prueffaktor | Blockfaktor | Kartoffelertrag in t/ha | | | | | -------------------------------------------------------------------------------- | 3 / 20 | read.table("/u/sfs/ueb/datasets/kartoffeln.dat", header = T) | | | | -------------------------------------------------------------------------------- | Droesbeke, Jean-Jacques et al. (editeurs) (1997) Plans | d'exp\'eriences. Applications \`a l'entreprise. p.39ff / D,vA,K (Kopie bei Puma) | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | rbr | 11.Aug 00 / Roland Brun klaerschlamm: | Klaerschlamm | robuste Masse, Boxplots,Ausreisser | Umwelt | EDA SS94 | " .tex" | -------------------------------------------------------------------------------- | In einem Ringversuch für 21 Laboratorien bestimmte | jedes Labor den Kupfergehalt für je eine Probe aus 9 | verschiedenen Klärschlämmen. | | | | -------------------------------------------------------------------------------- | 9/21 | read.table("/u/sfs/ueb/datasets/klaerschlamm.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | /Soil monitoring by Schulin et. al Birkhäuser | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 6.4.94 V. Gelpke kohlenstoff: | Kohlenstoff | univariate | Geologie | 4/SS83-2 | | -------------------------------------------------------------------------------- | Messungen vom Kohlenstoffgehalt (in %) aus verschiedenen | Bohrproben. | | | | -------------------------------------------------------------------------------- | 1/20 | INPUT kgehalt; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer konsumausgaben: | Konsumausgaben | simple regression | Wirtschaft | R/SS80,82,84,86-38 | | -------------------------------------------------------------------------------- | Milton Friedman hat die vierteljaehrlichen Konsumausgaben | in den USA in den Jahren 1952-56 in Abhaengigkeit der | Geldmenge analysiert. | | autocorrelation | | -------------------------------------------------------------------------------- | 4/20 | INFILE 'Konsumausgaben.dat'; | INPUT Jahr Quartal Konsumausgabe Geldmenge; | | -------------------------------------------------------------------------------- | /Chatterjee, S.D. & Price, B. (1977), p.124 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 30.8.88/Ruckstuhl konzentration: | Konzentration | timeserie | Chemie | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | Konzentrationen eines chemischen Prozesses, welche alle 2 | Stunden abgelesen wurden. | | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | 1/197 | INFILE 'Konzentration.dat'; | INPUT konz; | | -------------------------------------------------------------------------------- | D / Box, Jenkings 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | original Box,Jenkins Datensatz Serie A | | | -------------------------------------------------------------------------------- | USERS : | 10.9.87/ch.s kopf: | Kopf | correlation,contingency | Biologie | 4/SS82-11,4/SS83-12,4/SS84-8 | | -------------------------------------------------------------------------------- | Messungen von Koerpergroesse und Kopfumfang bei 15-jaehri- | gen. Die Messungen sind in Gruppen eingeteilt. | Die Variabeln geben als nur "Gruppen-Nummer" an. | | | -------------------------------------------------------------------------------- | 3/134 | INPUT idnr koerper kopf; | LABEL idnr='Identifikations-Nummer'; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer korrelation: | korrelation | regression, korrelierte Fehler, Versuchsplanung | Regression | Regression (Künsch) SS 2000 | | -------------------------------------------------------------------------------- | In korrelation.dat sind drei künstlich erzeugte | Versuchsanordnungen, zum Vergleich zweier Gruppen gegeben. | Mit den drei Anordnungen sollen die Unterschiede der | Varianz des geschätzten beta untersucht werden, wobei | beta je mit gewöhnlicher kleinste Quadrate Methode, | Korrelation ignoriert, gewöhnlicher kleinste Quadrate | Methode, Korrelation beachtet und mit | verallgemeinerter kleinste Quadrate Methode geschätzt | wird. | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | | | -------------------------------------------------------------------------------- | - | -------------------------------------------------------------------------------- | Regression SS 00, Serie 4, Aufgabe 3. | | -------------------------------------------------------------------------------- | USERS : | 22.05.00/ I. Flückiger | kt: | Kantone | Regression, Kategoriale Daten | Bevoelkerung, Sozialstatistik, Schweiz | S/93 | " .tex" | -------------------------------------------------------------------------------- | KURZE BESCHREIBUNG : | Verschiedene Daten --- nach Schweizer KANTONEN --- | Daten laut "Statististisches Jahrbuch der Schweiz, 1989" | Verlag NZZ, Bundesamt f"ur Statistik | | S.21, Mittlere Wohnbevoelkerung 1987 | S.278 [T 14.19] Ärzte,... 1986 (!) | Gemäss Mitgliderstatistik der Verbindung Schweiz.Ärzte | Inkl. Spitalärzte, beamtete und angestellte | OHNE Assistenzärzte, nicht mehr berufstätige | | AerzteQ = Anzahl Ärzte pro 100'000 Einwohner | ApoQ = Anzahl Apotheken pro 100'000 Einwohner | | S. 72 | | VBe.75 = Anz. Vollbeschäftigte, 1975 | VBe.85 = Anz. Vollbeschäftigte, 1985 | S.I.85 = Anteil [ % ] an V.Beschäftigten im Sektor I | (Landwirtschaft) | | Grosse / Kleine Kantone | log - Transformation oder Gewichtung | -------------------------------------------------------------------------------- | ?? / 29 | read.table("/u/sfs/ueb/datasets/kt.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | Martin Mächler | 1992,1993,1994 kuchen: | kuchen | Varianzanalyse, faktorieller Versuch | Lebensmittelingenieure | WS96/97 Abt VII H.R.Roth | "va-kuchen.tex" | -------------------------------------------------------------------------------- | Qualitätsbeurteilung von Kuchen. 5 verschiedene | Faktoren wurden je auf einem oberen und unteren Niveau | eingestellt. | Wasserbeigabe, Mischdauer, Temperatur, | Oel, Mixer) | | | | -------------------------------------------------------------------------------- | 5/32 | read.table("/u/sfs/ueb/datasets/kuchen.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Markus Huerzeler | Jan.97 | kuckuck: | Kuckuck | test,anova | Biologie | 4/SS82-2,4/SS83-11,4/SS86-10,4/SS87-10 | | -------------------------------------------------------------------------------- | Laengen von Kuckuckseiern (in mm) von drei verschiedenen | Sorten von Voegeln. | | | | -------------------------------------------------------------------------------- | 3/15,14,16 | INPUT sorte1 sorte2 sorte3; --- kuckuck-SAS.dat -- | read.table("...../kuckuck.dat", header = T) | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | Maechler lawinentote: | Lawinentote in der Schweiz | poisson, zeitreihe | oekologie | Umwelt/2000 SS | "/u/sfs/ueb/einfuehrung/aufgaben/ad.lawinentote.tex" | -------------------------------------------------------------------------------- | Anzahl Lawinentote pro Winter in der Schweiz | (1936/37 - 1998/99), getrennt nach drei Kategorien: | im Freien, auf Verkehrswegen, in Gebäuden | | | | | | | -------------------------------------------------------------------------------- | 4/63 | read.table("/u/sfs/ueb/datasets/lawinentote.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Grischott | 15.4.98/Grischott licht: | Licht | univariate | Physik | 4/SS87-1 | | -------------------------------------------------------------------------------- | 9 Messungen von Michelson zur Bestimmung der Lichtgeschwin- | digkeit in Luft (in km/s). | | | | -------------------------------------------------------------------------------- | 1/9 | INPUT geschw; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer lichtmichels: | Licht | univariate, selfsimilar, longrange dependent | Physik | | | -------------------------------------------------------------------------------- | 70 Messungen von Michelson zur Bestimmung der | Lichtgeschwindigkeit in Luft (in km/s) - 299000 | | | | -------------------------------------------------------------------------------- | 1/70 | INPUT geschw; | | -------------------------------------------------------------------------------- | ? / Dissertationen (SfS ETH) von HP.Graf und Jan Beran | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 10.12.96/Maechler lichtnewcomb: | lichtnewcomb | univariate Zeitreihe | Physik | 4/SS92-1 | | -------------------------------------------------------------------------------- | 66 Messungen von Newcomb zur Bestimmung der Lichtgeschwin- | digkeit (Juli-Sept 1882) | 7400m; Potomac River bis Washington Monument und | zurueck. | (gemessene Zeit [Sek])*10^9-24800 | 2 Ausreisser ,spezielle Codierung | | -------------------------------------------------------------------------------- | 1/66 | | | -------------------------------------------------------------------------------- | D/ Moore & McCabe (1989). Introduction to the Practice | of Statistics; Freeman. | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 10. April 92 / V. Gelpke lightness.apples: | Helligkeit von äpfeln | Tabellen, Varianzanalyse | Lebensmitteltechnologie | H.R. Roth 96/97 | "ad.lightness.apples.tex" | -------------------------------------------------------------------------------- | Die HElligkeit von Äpfeln wurde in Abhängigkeit der | Temperatur TEMP und der Lagerdauer (TIME) gemessen, 1. geschätzt | durch Beobachter LIGHTNES, zweitens wurde Messungen des rot-grün-Spektrums | (A) und des (blau-gelb-Spektrums). | | | | | | | -------------------------------------------------------------------------------- | 7*16 | read.table("/u/sfs/ueb/datasets/lightness.apples.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | longley: | Longley | multiple regression | Wirtschaft | 9/SS84-10 | | ------------------------------------------------------------------------------- | Studie ueber den Wirtschaftszustand in den USA, mit dem | Beschaeftigungsgrad als abhaengige Variable. | | Kollinearitaet | | ------------------------------------------------------------------------------- | 7/16 | INFILE 'longly.dat'; | INPUT employed priceInd socProd unempl army noninPop year; | | | -------------------------------------------------------------------------------- | D / S-Manual | tA/ Belsley et al. | K / Daniel & Wood (1980), p.396 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | S-System-Datensatz | | | -------------------------------------------------------------------------------- | 1.88/Stahel | | 24.8.87/schleiffer lyso: | Lyso daten | Statistischer Test | | WS98 | | -------------------------------------------------------------------------------- | | SPEZ. EIG. : | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/datasets/lyso.dat", header=T) | | -------------------------------------------------------------------------------- | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN :Datensatz nutzlich fuer Serie 2 der Vorlesung | Statistische Methoden WS98 | | | -------------------------------------------------------------------------------- | | Nov/98/CSa | mackerel: | Mackerel data | Regression, GAM, Additive Modelle | Oekologie, Umwelt | NDK 2000/2001 | Nichtparam.Regression, Serie 3 | -------------------------------------------------------------------------------- | | | Die Daten sind aus dem Buch | Bowman & Azzalini (1997). Applied Smoothing ... [s.unten] | bzw. dem zugehörigen "sm" package. | Die Source der R Version ist in /usr/local/app/R/R_local/src/sm/data/ | | | > These data record the abundance of mackerel eggs off the coast of | > north-western Europe, from a multi-country survey in 1992. | > | > The variables are: | egg density | latitude of sampling position | longitude of sampling position | bottom depth | surface temperature | salinity | > | | | | | -------------------------------------------------------------------------------- | 6 / 279 | read.table("/u/sfs/ueb/datasets/mackerel.dat", header = TRUE) | bzw. library(sm) ; provide.data(mackerel) | | | | -------------------------------------------------------------------------------- | / | | {BowAA97, | author = {Adrian W. Bowman and Adelchi Azzalini}, | title = {Applied Smoothing Techniques for Data Analysis. The | Kernel Approach with S-Plus Illustrations}, | publisher = {Oxford University Press}, | year = 1997, | address = {NY} | } | | Background to the survey and the data are provided by | > Watson et al. (1992), Priede and Watson (1993) and | > Priede et al (1995). Borchers et al (1997) describe an analysis | > of the data. | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Monika Ferster, Martin Maechler | 9.1.2001/ M.Mächler mast: | | | | | " .tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | med-blut: | Medik.Blutdruck | 1-way anova, t-test, Kruskal-Wallis | medecine | NDK 92, S/WS92-8 | va.med-blut.tex | -------------------------------------------------------------------------------- | Vergleich von 4 Medikamenten zur | Erh"ohung (nicht Senkung !) des Blutdruckes | Erh"ohung des systolischen Blutdruckes nach Einnahme des Medi | | 1 & 2 = Standard Medikamente | 3 & 4 sind neu, evt. "besser" | | | | -------------------------------------------------------------------------------- | 2/59 | read.table("/u/sfs/ueb/datasets/med-blut.dat") | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | ? | M.Maechler, Jan.93 milben: | adult female red mites | Poisson-Verteilung | Umwelt | WS95 | | -------------------------------------------------------------------------------- | Von 6 Apfelbäumen in einem Obstgarten, der behandelt | wurde, wurden je 25 Blätter "repräsentativ" | ausgewählt. Auf jedem Blatt wurde dann die Anzahl | erwachsener weiblichen roten Milben (red mites) | bestimmt. Intuitive würden wir davon ausgehen, dass | die Situation für ein Poissson-Modell zu inhomogen ist. | | Poisson-Verteilung ungeeignet, Negativ | Binomial-Verteilung geeigneter | | -------------------------------------------------------------------------------- | 2/8 | read.table("/u/sfs/datasets/milben.dat", header=T) | | -------------------------------------------------------------------------------- | J. Rice 1995 p.279 (Bliss and Fisher, 1953) | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | Nov/95/ARu milchbakt: | ANZAHL HAEUFIGKEIT | 0 56 | 1 104 | 2 80 | 3 62 | 4 42 | 5 27 | 6 9 | 7 9 | 8 8 | 9 3 milchprotein: | milchprotein | Systemanalyse | | Chem. Ing. (5.Sem.) - Math. und Systems-methoden | "rg-milchprotein.tex" in | /u/sfs/ueb/ChemieIngenieure/aufgaben | -------------------------------------------------------------------------------- | Kinetisches Modell für die Modellierung der | Konzentration von destabilisierten Milchprotein- | Halbzellen (micells) in Abhängigkeit der Zeit (in Minuten) | Die Daten stammen von Jan Sefcik (sefcik@tech.chem.ethz.ch) | | | -------------------------------------------------------------------------------- | | Matlab-Analyse -> /u/sfs/ueb/ChemieIngenieure/mFiles/rg-milchprotein.m | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | mineral: | Mineral | test | Geologie | 9/SS87-5 | | -------------------------------------------------------------------------------- | Messungen des Mineralgehaltes bei zwei geologischen Forma- | tionen. | | | | -------------------------------------------------------------------------------- | 2/7,6 | INPUT form_A form_B; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer myocard: | myocard | Myocardial Infarction, Control Study (retrospective) | Kategoriale Daten, Kontingenztafeln, Poisson | NDK/92; NDK 4 (95/97); Stat.Meth. | "../fortgeschrittene/aufgaben/ll.myocard.tex" &..card-glm.tex | -------------------------------------------------------------------------------- | Daten-Beispiel aus "NDK 1992, J.Lindsey, Categorical Data", auch in NDK-Uebungen | | 49 Frauen unter Behandlung wegen myocardial infarction ("infection" ??) | Herz-Muskel 'Infarkt' / Infektion | werden mit je 3 "Kontroll"-Frauen (gleiche Spitalregion) | | | | | -------------------------------------------------------------------------------- | 224 / 2 (2 x 2) | read.table("/u/sfs/ueb/datasets/myocard.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | D/ Agresti (1990), 2.1.3 | tA/ NDK 4 (95/97) "Kategoriale Daten",Regr. 2b, 1.Halbtag | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Maechler | nbs: | NBS kg | time series, long-range dependence, self-similarity | Physik, Kalibration | VERW.(VORL./J.-S.) : | " .tex" | -------------------------------------------------------------------------------- | NBS (U.S. National Bureau of Standards) data : | Measurements of "Standard Kilogramm" in micrograms: | Differences of the measurements (in micrograms) from 1 kg | | | Selbstähnlich. Jan Beran (199x): | (HubINC) H = .602 > 0.5 (significant on 1%) | | -------------------------------------------------------------------------------- | 1/289 | scan("/u/sfs/ueb/datasets/nbs.dat") | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | Daten kamen zu uns von U.S. National Bureau of Standards, Washington. | | Diss. von J.Beran, Hp. Graf, ....... | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Zeitabstände der Messungen nicht genau aequidistant (J.Be.) | | | -------------------------------------------------------------------------------- | USERS : | Nov.95 / M.Mächler nethosts: | nethosts | Zaehldaten, Zeitreihe, Trend | Zaehldaten | keine | NA | -------------------------------------------------------------------------------- | Anzahl 'hosts', die am Internet angeschlossen sind | mit einem sicheren negativen Bias (Anzahl systematisch unterschätzt). | | Von http://www.switch.ch/domain/hostcount.html (via 'Save as' und dann ein | paar geschickten Emacs befhelen)... | | | Expnonetielles Wachstum oder schnller? / Abflachung ? | -------------------------------------------------------------------------------- | ?? / 90 | read.table("/u/sfs/ueb/datasets/nethosts.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 05.Nov 96 / Martin Maechler neuro: | neuro | Kategoriale Daten, Kontingenztafeln, GLM, Generalized Linear Models | Medizin, Neurologie | NDK/1992 | " .tex" | -------------------------------------------------------------------------------- | NDK-Uebungen 4 aus "NDK 1992, J.Lindsey, Categorical Data"s | | --> neuro2.doc | --> neuro.S | | | | | -------------------------------------------------------------------------------- | N = 149 | read.table("/u/sfs/ueb/datasets/neuro.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | neuro2: | neuro2 | Kategoriale Daten, Kontingenztafeln, GLM, Generalized Linear Models | Medizin, Neurologie | - | " .tex" | -------------------------------------------------------------------------------- | | | Ganz ähnlich wie "neuro" (--> neuro.doc ), aber andere Zahlen | | Von http://hotspur.psych.yorku.ca/SCS/Courses/grcat/grc3.html | | The table below shows the classification of 69 New Orleans patients | regarding multiple sclerosis diagnosis by neurologists in New Orleans and | Winnipeg. | | The agreement chart shows the two intermediate categories lie largely above | the line, indicating that the Winnipeg neurologist tends to classify | patients into more severe diagnostic categories. | | New Orleans |------- Winnipeg Neurologist ------| | Neurologist Certain Probable Possible Doubtful | | Certain MS 5 3 0 0 | Probable MS 3 11 4 0 | Possible MS 2 13 3 4 | Doubtful MS 1 2 4 14 | | | | | | Symmetrie der Tafel ? | | -------------------------------------------------------------------------------- | N = 69 | read.table("/u/sfs/ueb/datasets/neuro.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | | | | Example | | The table below shows the classification of 69 New Orleans patients regarding multiple sclerosis diagnosis by neurologists in | New Orleans and Winnipeg. The agreement chart shows the two intermediate categories lie largely above the line, indicating | that the Winnipeg neurologist tends to classify patients into more severe diagnostic categories. | | New Orleans |------- Winnipeg Neurologist ------| | Neurologist Certain Probable Possible Doubtful SUM | | Certain MS 5 3 0 0 8 | Probable MS 3 11 4 0 18 | Possible MS 2 13 3 4 22 | Doubtful MS 1 2 4 14 21 | | SUM 11 29 11 18 69 nilmin: | Nile river minima | time series, long-range dependence, self-similarity | Umwelt | NDK 1992 | " .tex" | -------------------------------------------------------------------------------- | Jaehrliche Tiefstwasserstaende des Nils (Jahre 622-1284) | | Berühmter Datensatz, führte zur (wieder-)Entdeckung der "long-range | dependence" durch den berühmten Hydrologen Hurst (1951). | | Langfristig Korreliert, d.h. selbstähnlich... | $\rho_k \approx\propto \$|k|^{-\alpha}$, with $\alpha \approx 0.3 $ | Jan Beran (199x): | H= .837 resp. .847 (Hub00 vs. HubINC) | [.786,.888] u. [.770, .904] | -------------------------------------------------------------------------------- | 1/663 | scan("/u/sfs/ueb/datasets/nilmin.dat") | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | \ref{Hurst H.E.}{1951}{Long-term storage capacity of reservoirs} | {Trans. Amer. Soc. Civil Engineers}{116}{770-799} | + VIELE ! | Mandelbrot & Wallis (1968, 1969) | Diss. Jan Beran, HP Graf, ..... | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | USERS : | M. Mächler no2Basel: | NO_2 in Basel | Deskriptive Statistik | Umweltnat. | | ------------------------------------------------------------------------------- | Tägliche Messungen der Konzetration von Stickstoffdioxid | [nu g /m^2] und meteorologische Daten in Basel im | Februar 1991. | | ------------------------------------------------------------------------------- | 4/28 | no2 <- read.table("no2Basel.dat", header=T) | summary(no2) | ## Tag NO2 Temp Wind | 34.00 Min. :-8.7000 Min. :0.500 | 53.50 1st Qu.:-2.9750 1st Qu.:1.325 | 68.00 Median :-1.3500 Median :2.250 | 73.36 Mean :-0.1821 Mean :2.175 | 3.6500 3rd Qu.:2.750 | 8.2000 Max. :4.900 | -------------------------------------------------------------------------------- | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Herkunft unbekannt (Paul Salamin?) | | | -------------------------------------------------------------------------------- | USERS : | 1.11.94/Ruckstuhl | | nuke: | Nuke | regression | Wirtschaft | R/86, R/88-??, R/90-8, R/92-??, S/92-4 | | ------------------------------------------------------------------------------ | Voraussage der Baukosten von Kernkraftwerken | LWR] in den USA | anhand einiger Faktoren. Daten von 32 KKW's liegen vor. | | Einige binaere Variabeln. | | C = Cost of construction, adjusted to 1976 == DIE abhängige Variable | D = Date of construction permit | T1= time between application for & issue of permit | T2= time between permit and operating licence | S = net capacity | PR= earlier LWR at same site [0/1] | NE= north-east of USA [0/1] | CT= cooling tower [0/1] | BW= specific manufacturer [0/1] | N = cum.number of plants by same architect-ing. | PT= partial turnkey guarantee [0/1] | | | -------------------------------------------------------------------------------- | 11/32 | INFILE 'Nuke.dat'; | INPUT C D T1 T2 S PR NE CT BW N PT; | LABEL | C = 'Cost, adjusted to 1976' | D = 'Date of construction permit' | T1= 'time betw.appl.for & issue of permit' | T2= 'time betw. permit and operating lic.' | S = 'net capacity' | PR= 'earlier LWR at same site' | NE= 'north-east of USA' | CT= 'cooling tower' | BW= 'specific manufacturer' | N = 'cum.no.of plants by same architect-ing.' | PT= 'partial turnkey guarantee'; | | -------------------------------------------------------------------------------- | D,vA /Cox and Snell 81 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | Reduziert die Garantie (PT=1) die Kosten? | | -------------------------------------------------------------------------------- | | 9.12.87/ch. schleiffer numerische-integration: | numerische Integration | 1 Stichprobe-Test) | | | | -------------------------------------------------------------------------------- | | | SPEZ. EIG. : | | -------------------------------------------------------------------------------- | | read.table(" ... ", header=T) | | -------------------------------------------------------------------------------- | * / LITERATUR : | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Datensatz für das I Vordiplom Info Fr 2000 | | | | -------------------------------------------------------------------------------- | | Feb/00/CSa | | | | | | | | ny-rivers: | New York Rivers Study | Regression, leverage points. | Umweltwissenschaften | VERW.(VORL./J.-S.) : | " .tex" | -------------------------------------------------------------------------------- | KURZE BESCHREIBUNG : | Stickstoffgehalt von verschiedenen Flüssen im Staat New York | abhänging von der Bodennutzung in der Umgebung. | Stickstoffgehalt [mg/l]; | Mittelwert aus regelmässigen Stichproben in Frühlings- bis Herbstmonaten | % Gebiet für Landwirtschaftliche Nutzung (inkl. Blumen,Gemüse,..) | % Gebiet Wald (inkl. Pflanzungen) | % Gebiet `residential' (Wohnen) | % Gebiet `commerical / industrial' (Industrie) | | Fall 5 "Hackensack" ist ein Leverage-Pkt.; | weitere 'Faelle'; Kollinearitaeten. | Simpson et al. definieren UR := RS + CI & OTHER:= 100-AC-FR-UR | und betrachten N ~ -1+OTHER + AC + FR + UR (mit und ohne Fall 5). | -------------------------------------------------------------------------------- | 5/20 | read.table("/u/sfs/ueb/datasets/NY-rivers.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | D. Allen and F. Cady (1982). Analyzing experimental | data by regression. Belmont, Cal. ETHbib = {746 088} | Simpson, D. G., Ruppert, D. and Carroll, R. J. (1992). | On One-step {GM} Estimates and Stability of Inferences in Linear Regression. | JASA 87, 439--450. | | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | Martin Maechler | 11.Sep.95 orangen: | orangen.dat | Varianzanalyse | Lebensmitteltechnologie | Lebensmitteling. WS 97/98 P.Holzer | "/u/sfs/ueb/einfuehrung/aufgaben/ad.orangen.tex" | -------------------------------------------------------------------------------- | Qualität verschiedener Orangenjusvarianten | * 62 KonsumentInnen bewerten 8 "Varianten" | * die Varianten bestehen aus unterschiedlicher | Bitterkeit und Süsse | | | | | | -------------------------------------------------------------------------------- | 8*62 | read.table("/u/sfs/ueb/datasets/orangen.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | Preference Mapping for Product | * Optimization | Multivariate Analysis of Data in Sensory Science | ed. by T. Naes and E. Risvik, Elsevier, 1996, | pp. 71-102 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | oxygen: | Oxygen | | Biologie | | " .tex" | -------------------------------------------------------------------------------- | Aufnahme von Sauerstoff durch Abf"alle von Milchprod. | bod oxygen demand | tkn total Kjeldahl nitrogen | ts total solids | tvs total volatile solids | cod chemical oxygen demand | o2up oxygen uptake (Zielvariable | | Y logarithmieren | | -------------------------------------------------------------------------------- | 5+1 / 20 | read.table("/u/sfs/datasets/oxygen.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | Weisberg, Problem 8.7/ | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | partikelkonz: | Partikelkonz | Regression | Umwelt | 4/ss92 | | -------------------------------------------------------------------------------- | Es wird die Partikelkonzentration in der Stadt | (=1.Var) und ausserhalb der Stadt (=2.Var) gemessen. | | | | | | | -------------------------------------------------------------------------------- | 2/26 | INFILE | INPUT | | | -------------------------------------------------------------------------------- | Moore/McCabe, Introduction to the practice of Statistics | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | USERS : | 30.5.92 V.Gelpke party: | party | | Kategoriale Daten, Kontingenztafeln, Poisson | | " .tex" | -------------------------------------------------------------------------------- | Daten-Beispiel aus "NDK 1992, J.Lindsey, Categorical Data", auch in NDK-Uebungen | | | | | | | -------------------------------------------------------------------------------- | ?? / 8 | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | passagiere: | Passagiere | timeserie | Wirtschaft | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | Monatliche Anzahl von International-Airline Passagieren in | der Periode von Jan.1949 - Dez.1960. | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | 1/144 | scan("/u/sfs/ueb/datasets/passagiere.dat") | INFILE 'Passagiere.dat'; | INPUT passeng; | | -------------------------------------------------------------------------------- | D / Box,Jenkins 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | Jan Beran, NDK'92 ('air.dat') | 10.9.87/Schleiffer | petri: | petri.dat | Poisson | biologie, chemie, lebensmitteltechnologie,... | Lebensmitteling. WS96 97 | " .tex" | -------------------------------------------------------------------------------- | In der Datei sind die Häufigkeiten von Mikrosporen | enthalten. Ein Doktorand der ETH verteilte eine Mikrosporen-Suspension auf | Petrischalen. Nach einer Induktionsphase von 4 Tagen hat er die Sporen | einer Petrischale auf je 5 Videobildern (Variable Bild) | festgehalten. Jedes Bild ist in 8 flächengleiche "Zählkammern" unterteilt | worden. Gezählt wurden nur die sich entwickelnden Mikrosporen. Die Variable | Versuch1 enthält die 5 mal 8 Anzahlen von Schale 1, die Variable Versuch2 | diejenigen von Schale 2. | | | | | | -------------------------------------------------------------------------------- | 4/40 | read.table("/u/sfs/ueb/datasets/petri.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | /?? | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | V.Gelpke | 12.11.96 poisson: | poisson.dat | Poissonverteilung | | Lebensmitteling. WS 97/98 P.Holzer | "/u/sfs/ueb/einfuehrung/aufgaben/ad.poisson.distrib.tex" | -------------------------------------------------------------------------------- | Mit Zufallszahlengenerator 400 Zahlen ~ P(6) generiert | | | | | | -------------------------------------------------------------------------------- | 1*400 | read.table("/u/sfs/ueb/datasets/poisson.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | potatobeetles: | potatobeetles | poisson, negativ binomial, chi^2-test | oekologie | 10/SS98-4 | "/u/sfs/ueb/einfuehrung/aufgaben/as.evans.tex" | -------------------------------------------------------------------------------- | anzahlen von kartoffelkäfern auf 2304 zellen eines | kartoffelackers | | | | | | -------------------------------------------------------------------------------- | 1/28 | read.table("/u/sfs/ueb/datasets/potatobeetles.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | D/John. A. Rice, 1995 | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Grischott | 15.Apr 98 /Grischott protein: | protein | Systemanalyse | | Chem. Ing. (5.Sem.) - Math. und Systems-methoden | Matlab-File ist "demo-rg-protein.tex" in | /u/sfs/ueb/ChemieIngenieure/mFiles | -------------------------------------------------------------------------------- | Die Reaktion beschreibt die Hydrolyse eines Proteins | durch ein Enzym. | | | | -------------------------------------------------------------------------------- | | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | race: | race | | Kategoriale Daten, Kontingenztafeln, GLM, Generalized Linear Models | | " .tex" | -------------------------------------------------------------------------------- | NDK-Uebungen 4 aus "NDK 1992, J.Lindsey, Categorical Data"s | | | | | | | -------------------------------------------------------------------------------- | ?? / 10 | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | rats: | Rats | regression | Biologie, Chemie | Stat.Meth./88/9 | | ------------------------------------------------------------------------------ | | | | | -------------------------------------------------------------------------------- | 4/19 | INFILE 'Rats.dat'; | INPUT bw lw relD y; | LABEL | bw='body weight' | lw='liver weight' | relD='relative dose' | y='% of dose in the liver'; | -------------------------------------------------------------------------------- | | D,tA-vA /Weisberg, 80 | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Eine Beobachtung mit hohem hii fuehrt zu signifikantem | Resultat (wst) | | -------------------------------------------------------------------------------- | w.stahel | 19.1.89/ch. schleiffer | reactionYield: | reactionYield | Wirkungsfläche 1. Ordnung) | Line search) | Wirkungsfläche 2. Ordnung) | | Wirkungsflächen | | | -------------------------------------------------------------------------------- | Übung rg-reactionYield.tex im Verzeichnis | /u/sfs/ueb/ChemieIngenieure/aufgaben/ | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | | -------------------------------------------------------------------------------- | Design and Analysis of Experiments | (Wiley 1991), Ex. 16-1 (p.525) und Ex. 16-2 (p.533) | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | rhein-extrem: | Rhein-Extrema | Zeitreihen, Extremwerte | Hydrologie, Umweltwissenschaft | | " .tex" | -------------------------------------------------------------------------------- | Abfluss-maxima und -minima des Rheins, 1931--1990 | Die Messstelle wurde zweimal geändert; | dabei scheint kein Effekt (shift,..) sichtbar zu sein. | | In der betrachteten Periode haben die | menschlichen Regulationen zugenommen (Regulierung der Zuflüsse, ...). | Deshalb könnte eine Tendenz zu weniger starken Extrema -- dank | menschlich-technischer Ausgleichung -- vorliegen. Keine Daten dazu. | | 2 Jahre fehlen | | -------------------------------------------------------------------------------- | 3/58 | read.table("/u/sfs/ueb/datasets/rhein-extrem.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | Fri, 4 Sep 92 14:33:25 MET DST | IHW3@JANUS.vmsmail.ethz.ch | ABFLUSS | MAECHLER@STAT.MATH.ETHZ.CH | | Lieber Dr. Maechler, | | Ganz herzliche Dank fuer Ihre freundliche Beratung ueber Statistik. Wir | werden was von Ihnen vorgeschlagen sind in die Uebung einnehmen, sodass man | fuer die geschaetzte Hochwasserabfluss ein Vertrauensintervall festlegen koente. | Dies wird nur fuer die Log-Normal Verteilung durchfuehren. | | Wie versprochen sende ich Ihnen die Daten des extremalen Abflusses des Rheins -- | die maximalen sowie minimalen jaehrlichen Abfluesse Qmax sowie Qmin | Kubik-Meter pro Sekunde). | Die Messstelle haben sich geaendert: | | Periode Messstelle | --------- ------------- | 1931-1953 St. Margrethen | 1955-1983 Schmitter | 1984- Diepoldsau | | Es ist festzustellen, dass die Aenderung der Messstelle keine grosse | Einfluesse auf die Daten hat, da die daraus verursachte Flaechen-Aenderung | vernachlaessigbar klein ist. | | Keine Messungen ist in den Jahren 1937 sowie 1954 durchgefuehrt. | | Landeshydrologie, Bern. | | Nochmals besten Dank und | | mit freundlichen Gruesse | | Jiyang Chen/IHW | | -------------------------------------------------------------------------------- | | Sep.92, Okt.95 / Martin Mächler | | | | | schlafen: | Schlafverlaengerung | 2-groups / 1-group test,anova | Biologie | | | -------------------------------------------------------------------------------- | Zwei Schlafmittel werden an 9 Patienten ausprobiert und die | Schlafverlaengerung wird festgehalten. | | | | -------------------------------------------------------------------------------- | 2/9 | INPUT mittel_A mittel_B; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer seatbelt: | seatbelt | fatal injuries, car accidents, wearing seat belts | Kategoriale Daten, Kontingenztafeln, GLM, Generalized Linear Models | | " .tex" | -------------------------------------------------------------------------------- | NDK-Uebungen 4 aus "NDK 1992, J.Lindsey, Categorical Data"s | Injuries in car accidents in Florida in 1988 are classified as to whether a | seat belt was being used at the time or not. | | -> Kluge Koepfe schuetzen sich ! | | | | -------------------------------------------------------------------------------- | 2 / 2 | read.table("/u/sfs/ueb/datasets/seatbelt.dat") | INFILE | INPUT | | -------------------------------------------------------------------------------- | D,tA/ Agresti (19..) .... , p.30 | Lindsey, NDK-Skript 92/93, p. 10,11,14,.. | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | Feb.94 / M. Maechler senic: | senic | regression | | Statistische Methoden WS98/99 | | ------------------------------------------------------------------------------- | Datensatz für der kontrolle des infektionsrisikos in | US-amerikanischen Spitälern. Daten für 113 Spitälern. | | | | ------------------------------------------------------------------------------- | Reihenfolge der gemessene Variablen: | id = Identifikationsnummer des Spitals | length = mittlere Hospitalisationsl"ange aller PatientInnen (in Tagen) | age = mittleres Alter aller PatientInnen (in Jahren) | inf = mittleres Infektionsrisiko (in Prozent) | cult = Anzahl bakteriologischer Tests pro nichtsymptomatische PatientIn | x 100 | xray = Anzahl R"ontgenuntersuchungen pro nichtsymptomatische PatientIn | x 100 | beds = Anzahl Betten | school = Universitätsklinik 1=ja 0=nein | region = geographische Region 1=NE 2=N 3=S 4=W | pat = mittlere Anzahl PatientInnen im Spital pro Tag | nurs = mittlere Anzahl vollbeschäftigter, ausgebildeter | Krankenschwestern und Pfleger | serv = Prozentsatz angebotener Dienstleistungen aus insgesamt 35 | möglichen | | | -------------------------------------------------------------------------------- | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | - einfach z:=y/v=a+bv | | -------------------------------------------------------------------------------- | | 8.12.98 Christian Sangiorgio | shoe: | shoe | Regression | Biometrie | StMeth/WS9798-6 | "/u/sfs/ueb/fortgeschrittene/StMeth/97-06.tex" | -------------------------------------------------------------------------------- | Enth"alt K"orpergr"osse (in cm), Gewicht (in kg) | und Schuhgr"osse (US) von 403 Studierenden. | | | | -------------------------------------------------------------------------------- | 3 / 404 | read.table("/u/sfs/ueb/datasets/shoe.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Gefunden beim Aufräumen von Frisullos Konto... | Leider gibt's kein echtes Aufgaben-File, | sondern einfach obiges 97-06.tex | | | | | -------------------------------------------------------------------------------- | M.Maechler | 12.May 99 / Maechler sonnenflecken: | Sonnenflecken | timeserie | Physik | VERW.(VORL./J.-S.) : | | ------------------------------------------------------------------------------- | Jaehliche Woelfer Sonnenfleckenanzahl von 1770-1896. | | SPEZ. EIG. : | | ------------------------------------------------------------------------------- | 1/100 | INFILE 'Sonnenflecken.dat'; | INPUT number; | | -------------------------------------------------------------------------------- | D / Box,Jenkins 1970 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | | -------------------------------------------------------------------------------- | Nicht original Box-Jenkins Datensatz Serie E. | ( +1)/100. | | | -------------------------------------------------------------------------------- | USERS : | 10.9.87/Schleiffer sparen: | Sparen | multiple regression | Wirtschaft | R/SS88-39 | | -------------------------------------------------------------------------------- | Sparverhalten der Bevoelkerung in verschiedenen Laendern | in Abhaengigkeit vom Prokopfeinkommen, von der prozentu- | alen Aenderung des Prokopfeinkommens und von zwei demo- | graphischen Groessen. | | | | -------------------------------------------------------------------------------- | 5/50 | INFILE 'Sparen.dat'; | LENGTH Country $ 15; | INPUT Country $ SR POP15 POP75 DPI DDPI; | LABEL | SR = 'average aggregate personal savings rate' | POP15 = 'population under 15 years of age (in %)' | POP75 = 'population over 75 years of age (in %)' | DPI = 'real per-capita disposable income ' | DDPI = 'growth rate of DPI'; | | -------------------------------------------------------------------------------- | vA/ Belsley, Kuh & Welsch (1980) | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 30.8.88/Ruckstuhl strasse: | strasse | regression | | R-SS00-2 | " .tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | 2/11 | read.table("/u/sfs/ueb/datasets/strasse.dat", header = T) | | -------------------------------------------------------------------------------- | J.L. Devore 1991 p.464 | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 19.4.00 / Flückiger student: | Student | univariate | Chemie | 4/SS84-1,4/SS85-4,4/SS87-1 | | -------------------------------------------------------------------------------- | Chemischer Langzeitversuch von Student (1927). | | | | -------------------------------------------------------------------------------- | 1/128 | INPUT data; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer studis: | Studis | | Zeitreihe, Zaehldaten, Trend | Soziologie, Feminismus | | | -------------------------------------------------------------------------------- | Anzahl Studierende insgesamt und Anzahl Studentinnen | an der Universitaet Zuerich vom Sommersemester 1833 (1833) | bis zum Wintersemester 1986/87 (1986.5) | | | -------------------------------------------------------------------------------- | 3/309 | INFILE 'studis.dat' | INPUT sem tot frauen | | | -------------------------------------------------------------------------------- | K /"Ebenso neu als kuehn",hrsg. Verein Feministische | Wissenschaft, eFeF-Verlag, Zuerich 1988 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 4.7.89 / Mueller swiss-heads: | swiss-heads | Multivariate Statistik, Cluster | Medizin, Anthropomorphie | NDK 1996, Multivar.Statistik II | " .tex" | -------------------------------------------------------------------------------- | Aus 'Flury & Riedwyl (1988): | 6 Kopf-Messungen an 200 20-jährigen Rekruten; | Example 10.2, p. 218ff | | p.223 erklärt die Abkürzungen UND zeigt zwei Figuren dazu. | | Ich habe die Daten per E-mail von B.Flury (Indiana) erhalten (MM). | | | | -------------------------------------------------------------------------------- | 6 / 200 | read.table("/u/sfs/ueb/datasets/swiss-heads.dat", head= T) | --> /u/maechler/Vorl/NDK-Multivar-II/S/ch-heads.S | -------------------------------------------------------------------------------- | / | | Flury & Riedwyl (1988); Example 10.2, p. 219-222 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Martin Mächler | 5.Sept.96, MMä temp-calibr: | Temperature-Calibration | Calibration; inverse regression | Maschinen-Ingenieure | -- | " .tex" | -------------------------------------------------------------------------------- | Beispiel Datensatz aus | Montgomery & Peck, | 9.6 "Inverse Estimation (Calibration or Discrimination)", p. 407 f. | | Kalibration eines "Thermocouple"; | 16 äquidistante Messungen von 100-400 o Celsius | "tatsächliche Temp." | "gemessene Temp." | | SPEZ. EIG. : | | -------------------------------------------------------------------------------- | 2/16 | read.table("/u/sfs/ueb/datasets/temp-calibr.dat") | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | @Book{MonDP92, | author = {Douglas C. Montgomery and Elizabeth A. Peck}, | title = {Introduction to Linear Regression Analysis}, | year = 1992, | Publisher = Wiley, | address = NY, | sfs-key = {regr}, | annote = {XIV, 527 p.}, | ETHbib = {764 065}, | ISBN = {0-471-53387-4} | } | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | BEMERKUNGEN : | | | -------------------------------------------------------------------------------- | USERS : | 10.Oct.95 / Martin Mächler tomaten: | tomaten | Varianzanalyse, | Agronomie | Statistik II (Agro) | "/u/sfs/ueb/fortgeschrittene/aufgaben/va.tomaten.tex" | -------------------------------------------------------------------------------- | Ein Farmer hat drei verschiedene Tomatensorten (Faktor Sorte) und vier | verschiedene Pflanzungsdichten (Faktor Dichte) zur Auswahl. Um den Einfluss | der beiden Faktoren auf den Ertrag zu analysieren, führt der | Farmer ein Experiment mit zwei gekreuzten Faktoren und drei Wiederholungen | | Pflanzungsdichte #Pflanzen/ha | Sortenbezeichnung | Wiederholung | Ertrag | | | | | | | | -------------------------------------------------------------------------------- | 4 / 36 | read.table("/u/sfs/ueb/datasets/tomaten.dat", header = T) | | | | -------------------------------------------------------------------------------- | / Devore, Jay. l. (1999) Probability and statistics | for engineering and sciences p.450ff. D,vA,K | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | rbr | 11.Aug 00 / Roland Brun traffic: | traffic | Poisson-Verteilung | Umwelt | WS95 | | -------------------------------------------------------------------------------- | Die Poisson-Verteilung wird als Modell bei geringem | Verkehr verwendet. Man geht dann davon aus, dass die | Verteilung der Anzahl Autos in einem gegebenen | Zeitintervall oder Gebiet genähert Poisson verteilt | sind, falls der Verkehrsfluss ungefähr konstant und der | Verkehr gering ist (damit sich die einzelnen Autos | unabhängig voneinander bewegen können). Die folgende | Tabelle enthält die Anzahl Rechtsabbieger während 300 | mal 3 Minuten Intervallen an einer Kreuzung. | | | | -------------------------------------------------------------------------------- | 2/13 | read.table("/u/sfs/datasets/traffic.dat", header=T) | | -------------------------------------------------------------------------------- | J. Rice 1995 p.286 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | Oct/95/ARu unikurs: | Unikurs | multiple regression | Biologie | | | -------------------------------------------------------------------------------- | Zusammenhang zwischen Gewicht, Alter und Groesse soll | soll anhand von Messungen bei 19 Personen untersucht | werden. | | missing values | | -------------------------------------------------------------------------------- | 5/19 | INFILE 'Unikurs.dat'; | INPUT Name $ Geschlecht $ Alter Groesse Gewicht; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | Uebungsaufgabe im SAS Unikurs, Mai 85(Steinemann) | | -------------------------------------------------------------------------------- | | 30.8.88/Schleiffer units: | | | | | " .tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | varc.gummi: | varc.gummi | Varianzkomponenten, "nested", hierarchischer Design | Gummi-Vulkanisierung | NDK 1992, "VA II" [Kurs 5, Aufg.2] --> H.-R. Roth | " .tex" | -------------------------------------------------------------------------------- | NDK-Uebungen Kurs 5, Aufg2 aus "NDK 1992" | | Vulkanisierung von Gummi. | Verschiedene Schwefelgehalte 'Cure' festgestellt. | Mehrere Variationsursachen kommen in Betracht... | 3 Faktoren [Lab Temp Batch]; Batch hierarchisch in Lab | | --- stammt (?) von H-R. Roth, Agrometrie ETH | | | | -------------------------------------------------------------------------------- | 4 / 109 | read.table("/u/sfs/ueb/datasets/varc.gummi.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | Markus Huerzeler, Martin Maechler | volt: | Voltage | Smoothing, regression | Ingenieure, Batterie | -- | | -------------------------------------------------------------------------------- | | | Voltage drop data: | "The voltage drops in the battery of a guided missile motor during its flight" | | Original Daten, s.unten, wurden (noch) NICHT angeschaut | | y=12.06 | sollte wahrscheinlich (gem"ass Plot) y = 12.60 sein. | | Daten wie in Tabelle von Eubank; | Beobachtung korrigiert nach Plot von Eubank | | -------------------------------------------------------------------------------- | 2 / 41 | volt _ read.table("volt.dat") | # oder | volt _ matrix(scan("volt.dat"), ncol = 2, byrow=T) | | ==> file volt.S | | | -------------------------------------------------------------------------------- | D / Montgomery, Douglas C., and Peck, Elizabeth A. (1982). | Introduction to Linear Regression Analysis. | John Wiley, N.Y. QA 278.2 .M65 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | volt0: | Voltage | Smoothing, regression | Ingenieure, Batterie | -- | | -------------------------------------------------------------------------------- | | | Voltage drop data: | "The voltage drops in the battery of a guided missile motor during its flight" | | Original Daten, s.unten, wurden (noch) NICHT angeschaut | | y=12.06 | sollte wahrscheinlich (gem"ass Plot) y = 12.60 sein. | | Daten wie in Tabelle von Eubank; | Beobachtung korrigiert nach Plot von Eubank | | -------------------------------------------------------------------------------- | 2 / 41 | volt _ read.table("volt.dat") | # oder | volt _ matrix(scan("volt.dat"), ncol = 2, byrow=T) | | ==> file volt.S | | | -------------------------------------------------------------------------------- | D / Montgomery, Douglas C., and Peck, Elizabeth A. (1982). | Introduction to Linear Regression Analysis. | John Wiley, N.Y. QA 278.2 .M65 | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | weizen-3w: | Weizen-3w | VA, anova, 3 way | Landwirtschaft | NDK/92 S/92-9 | VA.I, Kurs 2, 2) | | "/u/maechler/Vorl/StatMeth/Ueb/va.weizen-3w.tex" | -------------------------------------------------------------------------------- | 6 Sorten an 5 Orten in 3 Jahren | Y = "E.Grad" = | Der Erweichungsgrad von Teig aus Weizenmehl | (in Konsistenzeinheiten zwischen 0 und 20) | | | | -------------------------------------------------------------------------------- | 4/90= 6 x 5 x 3 | read.table("/u/sfs/ueb/datasets/weizen-3w.dat", header = T) | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 18.1.93, M.Maechler wiener: | wiener.dat | Varianzanalyse | Lebensmitteltechnologie | lebensmitteling. WS 96/97 V.Gelpke | "/u/sfs/ueb/einfuehrung/aufgaben/ad.wieners.tex" | -------------------------------------------------------------------------------- | Die Konsistenz von "Wienerlis" | * PrüferInnen testen 4 Paar Wienlis auf ihre Knackigkeit | | | | | | -------------------------------------------------------------------------------- | 3*32 | read.table("/u/sfs/ueb/datasets/ .dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | /L.M. Poste et. al. Laboratory methods for sensory | * analysis of food | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | wood: | wood | | | | " .tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | ?? / 21 | read.table("/u/sfs/ueb/datasets/wood.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 02.Apr 97 / ??? woody: | woody | | | | " .tex" | -------------------------------------------------------------------------------- | | | | | | | | -------------------------------------------------------------------------------- | ?? / 21 | read.table("/u/sfs/ueb/datasets/woody.dat", header = T) | INFILE | INPUT | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 02.Apr 97 / ??? zellen: | Zellen | univariate | Biologie | 4/SS87-1 | | -------------------------------------------------------------------------------- | Messungen von Zelldurchmessern. | | | | -------------------------------------------------------------------------------- | 1/24 | INPUT durchm; | | -------------------------------------------------------------------------------- | / | | | * D=Daten, vA=volle Analyse, tA=teilweise Analyse, | K=Kommentar | | -------------------------------------------------------------------------------- | | | | -------------------------------------------------------------------------------- | | 15.9.87/schleiffer