1 |
Front Matter |
|
|
Abstract
|
2 |
|
|
|
Abstract
|
3 |
Grundlagen des Umgangs mit SAS |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Das SAS-System ist ein umfangreiches, eigenständiges statistisches Programmpaket. Es arbeitet auf Großrechnern und PCs unter Betriebssystemen wie Unix, Linux, Mac OS oder Windows. Dieses Buch legt die Windows-Version zugrunde, aber der Großteil der hier vorgestellten Syntax läuft auch unter anderen Betriebssystemen.
|
4 |
Das Hilfesystem |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Klassische Hilfe bietet das Benutzerhandbuch (engl.: User’s Guide). Benutzerhandbücher gibt es zu jedem SAS-Modul. Ein Nachschlagen innerhalb der umfangreichen Benutzerhandbücher ist aber oft sehr mühsam und nur mit genauem Wissen über das Gesuchte zielführend. Erheblich komfortabler ist eine Suche über die „SAS Product Documentation“, eine elektronische Umsetzung dieser Bücher als HTML-Hilfe.
|
5 |
Der DATA-Step |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Dieses Kapitel bildet die Grundlage für alle Datenanalysen. Wie werden Daten in SAS erzeugt, eingelesen, gespeichert und verändert? Das alles erfolgt innerhalb des DATA-Step. Dessen Verständnis ist also notwendig für ein sinnvolles Herangehen an statistische Auswertungen. Denn Auswertungen basierend auf inkorrektem Datenmaterial führen zu fehlerhaften Ergebnissen.
|
6 |
Der PROC-Step |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Nach dem DATA-Step ist der PROC-Step ein wesentlicher Bestandteil von SAS-Programmen. Er ermöglicht unter anderem die Analyse der zuvor vorbereiteten Daten, die Ausgabe der dabei gefundenen Ergebnisse auf dem Bildschirm oder in neue Datensatze sowie die Erzeugung von Grafiken.
|
7 |
|
|
|
Abstract
|
8 |
Das Aufbereiten von Textausgaben |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Die Ergebnisse einer Datenanalyse erscheinen im Textausgabe-Fenster. Ausnahmen sind die Option NOPRINT, die eine Ausgabe unterdrückt, und die Prozedur PROC SUMMARY, die keine Textausgabe erzeugt.
|
9 |
Grafiken in SAS |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Grafiken ermöglichen einen schnellen Einblick in Daten. Viele meinen, Grafiken seien nicht die Stärke von SAS. In der Tat sind die Standardeinstellungen oft nicht befriedigend. Diese lassen sich aber leicht ändern, und damit sind auch in SAS aussagekräftige, gut lesbare Grafiken möglich.
|
10 |
|
|
|
Abstract
|
11 |
Standardverfahren der beschreibenden Statistik |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Die beschreibende oder auch deskriptive Statistik fasst große Datenmengen durch geeignete Kennzahlen zusammen. Das bedeutet aber auch einen Informationsverlust. Die wichtigsten derartigen Kennzahlen sind Mittelwerte und Streuungsmaße.
|
12 |
Standardverfahren der schließenden Statistik |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Wührend die beschreibende Statistik Auffälligkeiten in den Daten finden oder die Daten mit geeigneten Kenngrößen charakterisieren soll, leitet die schließende Statistik aus Stichproben Aussagen über Grundgesamtheiten oder über Eigenschaften von Zufallsvariablen ab.
|
13 |
Regressionsanalyse |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Im Jahr 1885 untersuchte der englische Statistiker Francis Galton den Zusammenhang zwischen den Körpergrößen von Vatern und Söhnen. Er stellte fest: Große Väter haben im Durchschnitt größere Söhne, wenn auch nicht ganz so groß wie sie selbst. Kleine Vöter haben dagegen kleinere Söhne, wenn auch nicht ganz so klein wie sie selbst. Die Körpergröße der Söhne bewegt sich somit auf den allgemeinen Durchschnitt zu. Diese Bewegung hin zum Durchschnitt nannte Galton „Regression“ (von lateinisch: regredi = zurückgehen). Abbildung 9.1 zeigt anhand der Daten Galtons den Zusammenhang zwischen den Körpergrößen. Darin eingezeichnet ist auch die nachfolgend vorgestellte Regressionsgerade.
|
14 |
|
|
|
Abstract
|
15 |
Varianzanalyse und Versuchsplanung |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Die Varianzanalyse (engl.: ANOVA = Analysis of Variance) untersucht den Einfluss von einer oder mehreren qualitativen Variablen (= Faktoren) auf eine abhängige metrische Variable. Faktoren sind kontrollierbare Einflussgrößen und können verschiedene Stufen annehmen. Ein möglicher Faktor ist beispielsweise die Behandlung von Patienten mit verschiedenen Medikamenten. Die wesentliche Aufgabe der Varianzanalyse ist, zu untersuchen, ob die verschiedenen Stufen eines Faktors unterschiedliche Wirkungen aufweisen.
|
16 |
Nichtparametrische Verfahren |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Nichtparametrische statistische Verfahren kommen mit nur wenigen Annahmen über die Verteilung der beobachteten Zufallsvariablen aus. Oft werden sie mit dem Begriff „verteilungsfreie“ Verfahren gleichgesetzt. Eine Unterscheidung ist aber möglich. Ein „verteilungsfreies“ Verfahren basiert auf einer Statistik, deren Verteilung unabhängig von der Verteilung der beobachteten Zufallsvariablen in der Grundgesamtheit ist. Ein derartig universelles Verfahren herzuleiten ist nicht immer möglich. Stattdessen sind schwache Annahmen notwendig, beispielsweise die Stetigkeit der Verteilung. Ein „nichtparametrisches“ Verfahren trifft keine Annahmen über die Parameter der Verteilung der Grundgesamtheit. Naheres siehe Büning, Trenkler (1994).
|
17 |
Multivariate Verfahren |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Multivariate Verfahren lassen sich in strukturprüfende sowie strukturentdeckende Verfahren einteilen. Die hier behandelten strukturentdeckenden Verfahren wie die Faktoren- oder die Clusteranalyse decken Zusammenhänge zwischen verschiedenen Variablen auf.
|
18 |
Zeitreihenverfahren |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Zeitreihen sind Daten, die zeitlich angeordnet sind. Beispiele sind die Tagesschlusskurse von BMW für das aktuelle Börsenjahr, das bundesdeutsche Sozialprodukt ab 1948 oder die monatliche Zahl der Verkehrstoten in Nordrhein-Westfalen des Jahres 2012. Die Abbildung 13.1 zeigt beispielhaft die Zahl der Arbeitslosen in Deutschland über ein Jahrzehnt. Man erkennt deutlich Trends und zyklische Schwankungen.
|
19 |
Ökonometrie |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Ökonomische Daten und Modelle weisen oft Besonderheiten auf, die eine Schätzung mit der „gewöhnlichen“ KQ-Methode erschweren oder sogar unmöglich machen. So beeinflussen sich makrooökonomische Phänomene mitunter gegenseitig, oder die Zusammenhänge zwischen Regressoren und Regressanden sind nicht linear. Diesen Besonderheiten tragen die nachfolgend vorgestellten Verfahren und Modelle Rechnung.
|
20 |
Epidemiologie |
Walter Krämer,Olaf Schoffer,Lars Tschiersch,Joachim Gerß |
|
Abstract
Das vorliegende Kapitel beschäftigt sich nach der Vorstellung verschiedener Studientypen mit der statistischen Auswertung epidemiologischer Daten. Es stellt in Ergänzung zu den Kenngrößen und Verfahren der vorstehenden Kapitel die Inzidenz, die Prävalenz, das Odds Ratio und das relative Risiko vor und erläutert deren Umsetzung in SAS.
|