Der SPSS Viewer

Transcrição

Der SPSS Viewer
TRAINING
SPSS 11 für
Windows
Einführung
SPSS (Schweiz) AG, Seefeldstr. 9, 8008 Zürich, Phone 01 266 90 30,
Fax 01 266 90 39 [email protected] www.spss.ch www.spss.com
SPSS DecisionTime, SPSS Clementine, SPSS Neural Connection, SPSS QI Analyst, SPSS
for Windows, SPSS Data Entry, SPSS-X, SCSS, SPSS/PC, SPSS/PC+, SPSS Categories,
SPSS Graphics, SPSS Regression Models, SPSS Advanced Models, SPSS Tables, SPSS
Trends, SPSS Exact Tests, SPSS Missing Values, SPSS Maps, SPSS AnswerTree, SPSS Report Writer und SPSS TextSmart sind eingetragene Warenzeichen von SPSS Inc. CHAID for
Windows ist das eingetragene Warenze ichen von SPSS Inc. und Statistical Innovations Inc.
Material, das die Namen der aufgeführten Software erwähnt, darf ohne die schriftliche Zustimmung des Besitzers der eingetragenen Warenzeichen, der Lizenzrechte der Software und
des Copyrights veröffentlichter Produkte weder produziert noch weiterverteilt werden.
Allgemeiner Hinweis: Andere erwähnte Produktnamen werden nur zum Zweck der Identifizierung genannt und können eingetragene Warenzeichen anderer Firmen sein.
Copyright © 2002 by SPSS Inc. and SPSS (Schweiz) AG.
Alle Rechte vorbehalten.
Gedruckt in der Schweiz.
Dieses Druckerzeugnis darf ohne die schriftliche Zustimmung der Verfasser weder kopiert,
elektronisch gespeichert noch weitergegeben werden.
Inhaltsverzeichnis
I
Inhaltsverzeichnis
1
Erste Schritte ....................................................................................... 1
Starten von SPSS .................................................................................................................... 1
Arbeiten mit SPSS Server....................................................................................................... 2
Die Fenster von SPSS ............................................................................................................. 3
Vorgehensweise bei der statistischen Analyse ...................................................................... 5
Arbeiten mit mehreren Daten-Dateien................................................................................. 7
Die SPSS-Sitzung beenden...................................................................................................... 8
2
Der Daten-Editor .............................................................................. 10
Definition von Variablen....................................................................................................... 11
Variablentyp.......................................................................................................................... 11
Spaltenformat und Dezimalstellen ....................................................................................... 12
Labels.................................................................................................................................... 12
Spaltenbreite und Ausrichtung............................................................................................. 13
Variablenübersicht................................................................................................................ 13
3
Dateneingabe ..................................................................................... 14
Definition der Variablen....................................................................................................... 14
Variablentyp.......................................................................................................................... 15
Labels.................................................................................................................................... 15
Spalten und Ausrichtung ...................................................................................................... 16
Fehlende Werte ................................................................................................................... 16
Variablendefinitionen kopieren............................................................................................ 17
Eingeben von Daten ............................................................................................................. 18
Speichern der Daten ............................................................................................................ 19
4
Datenübernahme ............................................................................... 22
Excel-Dateien einlesen......................................................................................................... 22
Automatisch umkodieren..................................................................................................... 24
Datenimport mit ODBC...................................................................................................... 26
Text-Dateien einlesen.......................................................................................................... 32
Inhaltsverzeichnis
5
II
Erste Auswertungen.......................................................................... 38
Kategoriale Variablen........................................................................................................... 38
Kontinuierliche Variablen..................................................................................................... 40
6
Der SPSS Viewer ............................................................................... 45
Erzeugen von Ausgabe ......................................................................................................... 45
Suchen im SPSS Viewer........................................................................................................ 46
Anzeigen und Verbergen von Ausgabe................................................................................ 47
Umstellen und Löschen der Ausgabe................................................................................... 48
Speichern der Ausgabe......................................................................................................... 49
Übernahme von Grafiken und Tabellen............................................................................... 50
Exportieren der Ausgabe ..................................................................................................... 51
Drucken der Ausgabe .......................................................................................................... 52
7
Editieren von Tabellen ...................................................................... 54
Pivotieren ............................................................................................................................. 54
Spaltenbreite verändern....................................................................................................... 57
Allgemein.............................................................................................................................. 57
Zellenformate....................................................................................................................... 58
Rahmen................................................................................................................................. 58
Tabellenvorlagen .................................................................................................................. 59
Zelleneigenschaften.............................................................................................................. 60
8
Grafiken .............................................................................................. 63
Balkendiagramm ................................................................................................................... 63
Kreisdiagramm...................................................................................................................... 69
Histogramm.......................................................................................................................... 71
9
Interaktive Diagramme ..................................................................... 74
Balkendiagramm ................................................................................................................... 74
Dreidimensionales Balkendiagramm .................................................................................... 77
Vergleich mehrerer Variablen.............................................................................................. 79
Inhaltsverzeichnis
III
10 Fälle auswählen .................................................................................. 83
11 Daten aufteilen................................................................................... 87
12 Werte umkodieren ........................................................................... 90
13 Werte berechnen .............................................................................. 93
14 Daten aggregieren ............................................................................. 97
Erzeugung von Profilen......................................................................................................... 99
15 Dateien zusammenfügen ................................................................. 103
Dateien mit unterschiedlichen Fällen zusammenzuführen................................................. 103
Zusammenführen einer Datei mit einer Schlüsseltabelle.................................................. 104
Dateien mit unterschiedlichen Variablen zusammenzufügen............................................. 106
16 Tabellen im Basismodul .................................................................. 108
Auswertung kategorialer Daten......................................................................................... 108
Analyse kontinuierlicher Daten ......................................................................................... 110
OLAP-Würfel..................................................................................................................... 113
17 Kreuztabellen ................................................................................... 119
18 Tips und Tricks ................................................................................ 125
Fallnumerierung.................................................................................................................. 125
Datum und Zeit einfügen ................................................................................................... 126
Mehrfach vorhandene Fälle................................................................................................ 126
Befehlssyntax...................................................................................................................... 129
Neues Symbol einer Symolleiste hinzufügen ..................................................................... 132
SPSS AnswerNet................................................................................................................ 134
19 Einstellungen..................................................................................... 138
Allgemein............................................................................................................................ 139
Viewer................................................................................................................................ 140
Text-Viewer....................................................................................................................... 141
Beschriftung der Ausgabe................................................................................................... 141
Diagramme ......................................................................................................................... 143
Inhaltsverzeichnis
IV
Pivot-Tabellen..................................................................................................................... 144
Daten.................................................................................................................................. 144
Währung............................................................................................................................. 145
Skripts................................................................................................................................. 146
Interaktiv ............................................................................................................................ 147
20 Anhang .............................................................................................. 148
Übersicht über die Leistungsmerkmale der SPSS Zusatzmodule ...................................... 148
Erste Schritte
1
1 Erste Schritte
Inhalt
Ø
Ø
Ø
Ø
Starten von SPSS
Die Fenster von SPSS
Vorgehensweise bei der statistischen Analyse
Die SPSS-Sitzung beenden
SPSS für Windows ist ein leistungsfähiges System zur statistischen Datenanalyse und zum
Datenmanagement mit einer grafischen Oberfläche. Mit Hilfe von einfachen, selbsterklärenden Menüs und übersichtlichen Dialogfeldern können Sie schnell Analysen durchführen.
Starten von SPSS
Unter Windows öffnen Sie SPSS aus dem Start-Menü. Klicken Sie in der sogenannten TaskLeiste am unteren Bildschirmrand auf
und wählen Sie Programme aus. Unter den
aufgelisteten Einträgen klicken Sie auf
SPSS for Windows | SPSS 11.0 für Windows
Nach dem Start von SPSS erscheint ein Startdialog, der Ihnen verschiedene Optionen zur Verfügung stellt. Wenn Sie auf Abbrechen drücken, erscheint auf dem Bildschirm der DatenEditor.
Erste Schritte
2
Arbeiten mit SPSS Server
Mit der Version 10 von SPSS für Windows wurde die sogenannte „Verteilte Analyse Architektur“ eingeführt (Englisch: Distributed Analysis Architecture, DAA). Das bedeutet für den
SPSS-Benützer, dass er wie bisher vollständig auf seinem lokalen Desktop PC arbeiten kann.
Er hat aber auch die Möglichkeit rechenintensive Analysen mit grossen Datenmengen auf
SPSS Server ausführen zu lassen. SPSS Server ist in der Regel auf einem leistungsfähigen,
speziell dazu bestimmten Rechner installiert. Ihre lokale SPSS Installation setzen Sie als SPSS
Client ein. Um die Analysen auf SPSS Server ausführen zu lassen gehen Sie auf das Menü
Datei | Server umschalten...
Im darauf folgenden Dialog wählen Sie den Rechner aus, auf dem Sie die Analysen berechnen
lassen wollen und geben Ihr Name und Passwort ein. Voraussetzung ist, dass Sie Zugang zu
einem entsprechend ausgerüsteten Rechner haben. Danach können Sie in gewohnter Weise
mit weiterarbeiten. Sie können alle Dateien öffnen bzw. Datenbanken abfragen, auf die der
Server-Rechner Zugriff hat.
Erste Schritte
3
Die Fenster von SPSS
Für die verschiedenen Anwendungen und Funktionen von SPSS stehen insgesamt acht verschiedene Fenster bzw. Editoren zur Verfügung. Jeder Editor in SPSS hat eine eigene MenüLeiste. Der Daten-Editor enthält die zu analysierenden Daten und muß innerhalb einer SPSSSitzung immer geöffnet sein. Weitere Fenster werden während der Arbeit mit SPSS je nach
Gebrauch geöffnet.
§
§
§
§
§
§
§
Daten-Editor: Ein Datenblatt zum Definieren, Eingeben,
Editieren und Anzeigen von Daten.
Viewer: Im Viewer werden alle Ergebnisse, d.h. die Statistiken, Grafiken und Tabellen, angezeigt. Zur Bearbeitung der Ergebnisse können alle Objekte mittels Doppelklick aktiviert werden.
Grafik-Editor: Zum Editieren von Grafiken.
Pivot-Tabellen-Editor: Hier können Sie nicht nur die Ze ilen und Spalten einer Tabelle beliebig vertauschen, sondern auch alle Elemente der Tabelle, wie Schr ift- und
Rahmenarten, Farben und Beschriftungen, frei wählen.
Text-Ausgabe: Dieser Editor wird automatisch geöffnet
sobald Text editiert wird.
Syntax- Editor: Sie können die Befehlssyntax, die Sie in
ein Syntaxfenster übertragen haben, bearbeiten und speichern. In späteren SPSS-Sitzungen können Sie diese Befehlsdatei wieder aufrufen und die darin enthaltenen Befehle erneut ablaufen lassen. Sie können die abgespeicherte Datei auch im Produktionsmodus abla ufen lassen.
Damit können Sie immer wiederkehrende Vorgänge standardisieren und nahezu automatisieren.
Skript-Editor: Mit dem Skript-Editor von SPSS haben Sie
Erste Schritte
§
4
die Möglichkeit SPSS, mittels einer Visual- Basic kompatiblen Sprache, umfassend an Ihre Bedürfnisse anzupassen. So gestalten Sie eigene Dialogfelder, ma nipulieren
automatisch den Output von SPSS, oder erstellen sich eigene statistische Prozeduren.
Hilfe-Fenster: Genauso wie andere Windows Applikationen bietet SPSS Ihnen eine Online Hilfe.
Es können mehrere Viewer bzw. Syntax- oder Skript-Editoren gleichze itig geöffnet werden.
Die Ergebnisse von SPSS können jedoch immer nur in ein bestimmtes Fenster geschrieben
werden. Dieses Fenster heißt Hauptfenster. Ebenso wird die Syntax, die Sie aus einem Dialogfeld generieren, immer nur in ein bestimmtes Syntaxfenster geschrieben.
Hauptfenster erkennen Sie an einem roten Ausrufezeichen, das in der Mitte der unteren Statuszeile erscheint. Durch Anklicken des Symbols Hauptfenster (rotes Ausrufezeichen) oder
über das Menü
Extras | Hauptfenster
im jeweiligen Ausgabe- bzw. Syntaxfenster können Sie diese zum Hauptfenster machen.
SPSS für Windows ist menügesteuert. Fast alle Funktionen von SPSS können über die Menüs
aufgerufen werden. Nach dem Start von SPSS ist zunächst die Hauptmenüleiste des DatenEditors aktiv. Die Menüle iste kann für jedes Fenster individuell angepaßt werden.
Im Hauptmenü des Daten-Editors stehen Ihnen zehn Untermenüs zur Verfügung.
§
§
§
§
§
Im Datei-Menü erstellen Sie eine neue SPSS-Datei. Sie
öffnen eine vorhandene Datei oder importieren Daten, die
mit anderen Softwareprogrammen erzeugt wurden.
Im Bearbeiten-Menü finden Sie die üblichen Befehle wie
Ausschneiden, Kopieren oder Einfügen.
Das Ansicht-Menü ermöglicht Ihnen verschiedene Optionen zur Darstellung Ihres Datenblattes und der individue llen Anpassung der Symbolleisten.
Im Daten-Menü nehmen Sie globale Änderungen an Datendateien vor, z.B. Verbinden von Dateien, Transponieren der Datenmatrix (Vertauschen von Variablen und Fällen) oder Sie erzeugen Teilmengen von Fällen für bestimmte Analysen. Diese Änderungen sind nur temporär
und betreffen nicht die Ursprungsdatei, solange Sie nicht
ausdrücklich die Datei mit den Änderungen abspeichern.
Im Transformieren-Menü nehmen Sie an ausgewählten
Variablen Änderungen vor und berechnen neue Variablen, die auf den Werten von vorhandenen Variablen basieren. Diese Änderungen betreffen nicht die Ursprungsdatei, solange Sie nicht ausdrücklich die Datei mit den
Änderungen abspeichern.
Erste Schritte
§
§
§
§
§
5
Im Analysieren-Menü wählen Sie die verschiedenen
statistischen Verfahren aus, die Sie anwenden wollen,
z.B. Kreuztabellen, Varianzanalyse, Korrelation und
lineare Regression.
Im Grafik-Menü erzeugen Sie Balkendiagramme, Kreisdiagramme, Histogramme, Streudiagramme und andere
Farbgrafiken. Einige statistische Prozeduren erstellen ebenfalls Grafiken. Alle Grafiken können mit dem Diagramm-Editor individuell gestaltet werden.
Im Extras-Menü lassen Sie sich z.B. Informationen über
den Inhalt von Datendateien anzeigen oder führen ein
Skript aus.
Im Fenstermenü steuern Sie die Anordnung, Auswahl und
Eigenschaften der verschiedenen Fenster.
Das Hilfe-Menü bietet Ihnen verschiedene Hilfemöglichkeiten an.
Vorgehensweise bei der statistischen Analyse
Es gibt drei Hauptschritte bei der Durchführung statistischer Analysen mit SPSS für Windows.
Der erste Schritt beinhaltet die Auswahl der Datendatei. Dies kann eine Datei sein, die Sie
gerade mit dem Dateneditor erstellt haben oder eine Datei, die schon als Datendatei unter einem beliebigen Format vorliegt.
Öffnen Sie über
Datei | Öffnen | Daten
die Datei bank_de.sav.
Erste Schritte
6
Als zweiten Schritt wählen Sie aus dem Statistikmenü das gewünschte statistische Verfahren.
Jeder Menüeintrag im Statistikmenü führt zu einem Untermenü, das die einzelnen Verfahren
enthält. Wählen Sie aus dem Menü
Analysieren | Deskriptive Statistiken | Häufigkeiten.
Quellvariablenliste
Variablenselektionsschalter
Befehlsschaltflächen
Wahlvariablenliste
Kontrollfeld
Schaltflächen
Im dritten Schritt wählen Sie die Variablen, die in die Analyse einbezogen werden sollen,
sowie alle zusätzlichen Parameter mit Hilfe des Hauptdialogfelds eines Verfahrens und den
dazugehörigen Unterdialogfeldern.
Das Hauptdialogfeld für ein statistisches Verfahren hat mehrere Grundkomponenten. Die
Quellvariablenliste enthält eine Liste der Variablen in der aktiven Datendatei. Abhängig vom
gewählten Verfahren erscheinen hier alle oder nur bestimmte geeignete Variablen. Manche
Verfahren setzen z.B. voraus, daß die Variablen numerisch definiert sind. In die Wahlvariablenliste übernehmen Sie die Variablen, die Sie für die Analyse auswählen.
Erste Schritte
7
Die Befehlsschaltflächen stellen Aktionsflächen dar. Durch Anklicken teilen Sie SPSS mit,
was es tun soll, z.B. eine Prozedur ausführen, Hilfe bereitstellen oder ein Unterdialogfeld für
die Angabe zusätzlicher Parameter öffnen. Gewöhnlich enthält das Hauptdialogfeld die Mindestinformationen, die zum Starten einer Prozedur benötigt werden. Zusätzliche Spezifikationen werden über Unterdialogfelder getätigt. Im Hauptdialogfeld weisen Auslassungspunkte
hinter dem Namen einer Schaltfläche darauf hin, daß ein Unterdialogfeld aufgerufen werden
kann. Durch die Auswahl oder Eingabe von Parameterwerten können Sie bei vielen Anwendungen die Ausführung des Verfahrens zusätzlich beeinflussen. Viele Parameter besitzen eine
Voreinstellung.
Klicken Sie auf OK, um die Auswertung zu starten. Die Ergebnisse werden in den Viewer
geschrieben.
Arbeiten mit mehreren Daten-Dateien
Im Gegensatz zu anderen Programmen wie MS Word oder Excel kann innerhalb einer SPSSSitzung nur mit einer einzigen Daten-Datei (*.sav-Datei) gearbeitet werden. Um mit mehreren Daten-Dateien arbeiten zu können, muss für jede Datei eine neue SPSS-Instanz gestartet
werden, d.h. für jede Datei muss SPSS neu gestartet werden.
Jede SPSS-Instanz ist unabhängig von den anderen, d.h. alle mit dem Daten-Editor verbundenen Fenster und Dateien (Ausgabe, Syntax, etc.) werden für jede Instanz getrennt verwaltet.
Erste Schritte
8
Die SPSS-Sitzung beenden
Wählen Sie aus dem Menü
Datei | Beenden.
Für jedes geöffnete Fenster fragt SPSS, ob Sie den Inhalt vor dem Verlassen von SPSS speichern möchten. Um die Sitzung ohne Speichern zu beenden, klicken Sie in jedem Fenster auf
Nein. Wenn Sie Ja anklicken oder die Eingabetaste drücken, öffnet SPSS ein dem Fenster
entsprechendes Dialogfeld, um den Inhalt des Fensters unter dem entsprechenden Dateityp
abzuspeichern.
In SPSS gibt es verschiedene Dateiarten. Jede Datei mit der Erweiterung .sav wird als Datendatei im SPSS-Format identifiziert. Der Inhalt der Datendatei wird im Fenster des Dateneditors angezeigt. Sie können Datendateien aber auch unter anderen Formaten abspeichern.
Jede Datei mit der Erweiterung .spo wird als Viewer-Datei identifiziert und im Viewer angezeigt. In diesem Fenster können Sie Pivot-Tabellen, Grafiken und Text-Ausgaben bearbeiten und als Datei zur späteren Verwendung abspeichern. Da alle Ergebnisse Objekte sind,
können Sie leicht Teile davon ausschneiden und über die Zwischenablage in andere Anwendungsprogramme einfügen und weiterverarbeiten, z.B. in ein Textverarbeitungsprogramm.
Die Verwendung dieser Dateierweiterungen ist nicht zwingend, aber empfehlenswert.
Wichtige Begriffe aus diesem Kapitel
ü Daten-Editor
ü SPSS Server
Erste Schritte
ü
ü
ü
ü
ü
ü
ü
9
Viewer
Syntax- Editor
Skript-Editor
Grafik-Editor
Pivot-Tabellen-Editor
Hauptfenster
Menü
Der Daten-Editor
10
2 Der Daten-Editor
Inhalt
Ø
Ø
Ø
Ø
Übersicht über den Daten-Editor
Das Steuern von SPSS mit der Symbolleiste
Definition von Variablen
Die Variablenübersicht
Der Daten-Editor ist ein Spreadsheet ähnliches Fenster zum Erzeugen und Editieren von
SPSS Datendateien. Das Fenster des Daten-Editors öffnet sich automatisch, wenn Sie eine
SPSS Sitzung beginnen.
Wenn Sie bereits Erfahrung im Umgang mit Tabellenkalkulationsprogrammen haben, werden
Ihnen viele Eigenschaften des Daten-Editors vertraut sein. So können Sie im Daten-Editor
direkt Daten eingeben und verändern. Es gibt jedoch einige wichtige Unterschiede:
Jede Zeile entspricht einem Fall oder einer Beobachtung. In einer Umfrage ist z.B. jede befragte Person ein Fall. Jede Spalte entspricht einer Variablen, d.h. einem Merkmal des Falles.
Beispielsweise ist jede Frage eines Fragebogens ein Merkmal der befragten Person, also eine
Variable. Eine Zelle ist der Schnittpunkt von Fall und Variable. Jede Zelle enthält einen einzelnen Wert einer Variablen für den jeweiligen Fall. Zellen des Daten-Editors enthalten nur
Datenwerte. Sie können nicht, wie bei Tabellenkalkulationsprogrammen, Formeln aufnehmen.
Im Daten- Editor stehen Ihnen Symbole als Arbeitserleichterungen zur Verfügung. Viele
Funktionen können über die Symbolleiste direkt ausgeführt werden: Datei öffnen, Datei speichern, Datei drucken, Auswahl der letzten zehn benutzten Dialogfelder, zum Daten-Editor
springen, Gehe zu Fall, Variablenliste, Text suchen, Syntax-Hilfe, Glossar öffnen, Datenwert
suchen, Fall einfügen, Variable einfügen, Werte-Labels anzeigen, um nur einige zu nennen.
Sehr benutzerfreundlich ist die Möglichkeit, die Symbolleiste für jeden Editor ind ividuell
einzurichten. Damit können Sie jede Funktion von SPSS über ein Symbol steuern.
Der Daten-Editor
11
Definition von Variablen
Für jede Variable können Sie in SPSS bestimmte Eigenschaften definieren. Betrachten wir für
die Datei bank_de.sav die Variable beruf. Wechseln Sie dazu auf die Variablenansicht
des Daten-Editors indem Sie das entsprechende Register im linken unteren Fensterrand anklicken, wo Sie auf der siebten Zeile die Variablendefinitionen von beruf vorfinden.
Durch Doppelklicken auf den Variablenkopf (beruf ) innerhalb der Datenansicht gela ngen Sie
direkt auf diese Zeile.
In den Spalten der Variablenansicht können Sie neben dem Variablennamen den Datentyp,
das Spaltenformat, Anzahl Dezimalstellen, beschreibende Variablennamen, Labels für einze lne Werte, Platzhalter für fehlende Werte, Spaltenbreite und -ausrichtung sowie das Messniveau der Variablen definieren.
Variablentyp
Bei dieser Variablen handelt es sich um die Information, welche der sechs möglichen Berufsgruppen eine Person zugehört. D.h., es wurden nur Werte von 1 bis 6 vergeben. Demzufolge
empfiehlt sich ein numerischer Datentyp mit 0 Dezimalstellen. Wenn Sie auf der Zeile von
beruf das Feld Typ aktivieren und auf ... klicken, sehen Sie genau diese Angaben. Mit einer
Breite von 1 kann man Ziffern von 0 bis 9 darstellen.
Der Daten-Editor
12
Spaltenformat und Dezimalstellen
Das Spaltenformat (Breite) und die Dezimalstellen könne Sie auch direkt in der Variablena nsicht innerhalb der Kolonnen Spaltenformat und Dezimalstellen einstellen bzw. ändern. Beachten Sie, dass der Wert für das Spaltenformat immer um mindestens 1 höher sein muss als
die Anzahl Dezimalstellen.
Labels
Da Variablennamen nur acht Zeichen umfassen dürfen, verwendet SPSS Labels als beschreibende Variablennamen. Anders als in anderen Programmen hat SPSS auch Labels für einze lne Werte. Damit können Sie Werten, Beschreibungen zuweisen.
Durch die Vergabe von Labels verbessern Sie nicht nur die Übersicht im Daten-Editor, sondern es werden auch alle Ergebnisse leichter lesbar. Denn Labels ersetzen in der Ausgabe den
Variablennamen bzw. die tatsächlichen Werteausprägungen (z.B. Ziffern) durch ausführliche
Bezeichnungen. Aktivieren Sie auf derselben Zeile auf das Feld der Wertelabels und klicken
Sie wiederum auf ....
Der Daten-Editor
13
Spaltenbreite und Ausrichtung
Zum Einstellen der Spaltenbreite im Daten-Editor oder zur Änderung der Ausrichtung der
Daten innerhalb einer Spalte, ändern Sie die Werte der Kolonnen Spalten und Ausrichtung.
Variablenübersicht
Um schnell einen ersten Eindruck über die definierten Variablen zu erhalten oder um bestimmte Elemente abzufragen, gibt es
Extras | Variablen
oder das blaue Fragezeichen
.
In diesem Fenster können Sie zwar nicht die Variablendefinition verändern, aber dafür schnell
zu jeder Variablen Informationen abrufen. Darüber hinaus bewirkt ein Klick auf den Schalter
Gehe zu, daß die ausgewählte Spalte markiert im Vordergrund steht.
Wichtige Begriffe aus diesem Kapitel:
ü
ü
ü
ü
ü
Fälle
Variablen
Definition der Variablen
Symbolleiste
Variablenübersicht
Dateneingabe
14
3 Dateneingabe
Inhalt
Ø
Ø
Ø
Ø
Ø
Ø
Definieren von Variablen
Die Variablentypen
Labels
Fehlende Werte
Übernehmen von Variablen-Eigenschaften
Eingeben von Daten
Definition der Variablen
Wenn Sie eine neue Datendatei erstellen, beginnen Sie mit der Definition der Variablen.
Wechseln Sie innerhalb des Daten-Editors auf die Variablenansicht, indem das entsprechende
Register links unten im Fenster anwählen und gehen Sie auf die erste Zeile um eine Variable
zu definieren.
Hier können Sie einen eigenen Variablennamen eingeben, beschreibende Variablen- und Werte-Labels hinzufügen, spezielle Codes für fehlende Werte verwenden und verschiedene Formate zuweisen.
Bei der Vergabe von Variablennamen gelten die folgenden Konvent ionen. Der Name muß mit
einem Buchstaben beginnen. Die restlichen Zeichen können Buchstaben, Ziffern, Punkte sowie die Symbole @, #, _ oder $ sein. Ein Variablenname darf nicht mit einem Punkt enden
und nicht länger als acht Zeichen sein. Leerzeichen und spezielle Ze ichen, wie -, *, !, ? und '
dürfen nicht verwendet werden.
Jeder Variablenname darf nur genau einmal vorkommen. Variable nnamen sind von Groß- und
Kleinschreibung unabhängig.
Die folgenden reservierten Schlüsselwörter dürfen nicht als Variablennamen verwendet werden:
Dateneingabe
ALL NE
EQ
AND NOT GE
15
TO
LE
WITH
LT
BY
OR
GT
Gültige Variablennamen sind z.B.: Alter, Alter#5 oder x.1
Variablentyp
Neue Variablen sind in SPSS per Voreinstellung numerisch. Für einige Datentypen ersche inen Textfelder für Länge und Anzahl der Dezimalstellen; für andere wählen Sie einfach ein
Format aus einer Liste von Beispielen. Wenn bei dem Variablentyp String die definierte Lä nge acht Zeichen nicht überschreitet, handelt es sich um eine kurze alphanumerische Variable.
Wenn die definierte Länge größer als acht Ze ichen ist, dann ist es eine lange String-Variable.
Kurze String- Variablen können in vielen SPSS Prozeduren verwendet werden. Die Verwendung langer String- Variablen ist in den meisten SPSS-Prozeduren stark eingeschränkt oder
nicht erlaubt.
Definieren Sie als erste Variable die Fragebogennummer als numerische Variable. Diese Variable soll 3 Ziffern lang sein und keine Dezimalstellen aufweisen. Die Variable braucht keine
weiteren Angaben. Gehen Sie dazu zur Zelle der Kolonne Typ und drücken Sie auf ....
Labels
Labels werden in SPSS als beschreibende Variablennamen verwendet.
Durch die Vergabe von Labels machen Sie die Ergebnisse leichter
lesbar. Denn Labels ersetzen in der Ausgabe den Variablennamen, der
höchstens 8 Stellen hat bzw. die tatsächlichen Werte (z.B. Ziffern)
durch ausführ liche Bezeichnungen. Bei Labels können Sie im Gege nsatz zu Variablennamen auch Sonderzeichen eingeben. Um Variablenund Werte-Labels einzugeben, gehen Sie auf derselben Zeile zu Wertelabels und drücken Sie wiederum auf ....
Dateneingabe
16
Variablen-Labels können bis zu 120 Zeichen, die Werte-Labels bis zu 60 Ze ichen lang sein.
Definieren Sie als zweites die Variable geschl, der Sie den Typ Numerisch mit einer Breite
von 1 und keine Dezimalstellen zuweisen. Vergeben Sie auch ein erklärendes VariablenLabel und Werte-Labels für die Codierung
"0 = männlich"
"1 = weiblich"
Geben Sie den Wert im Wert-Textfeld ein. Das Label in dem Werte- Label-Textfeld. Wenn
Sie auf die Schalfläche Hinzufügen klicken, wird der Werte-Label der Liste hinzugefügt.
Natürlich können Sie auch bestehende Werte-Labels verändern oder löschen, indem Sie die
Schaltflächen Ändern oder Entfernen benutzen.
Sie können sich anstelle der Werte die Werte-Labels im Fenster des Daten-Editors anzeigen
lassen. Klicken Sie hierzu auf das Symbol Wertelabels
oder wählen Sie die Option
Ansicht | Wertelabels
Spalten und Ausrichtung
Zum Einstellen der Spaltenbreite im Daten-Editor oder zur Änderung der Ausrichtung der
Daten innerhalb einer Spalte, gehen Sie zur Zelle Spalte bzw. Aurichtung. Die voreingestellte
Spaltenbreite ergibt sich aus der definierten Breite für die Variable. Sie ändern die Spaltenbreite, indem Sie einen neuen Wert eingeben. Für die Ausrichtung in der Spalte haben Sie die
Optionen Links, Recht und Mitte.
Fehlende Werte
In SPSS gibt es zwei Arten von fehlenden Werten. Allen leeren numerischen Zellen in der
Datenmatrix wird der systemdefinierte fehlende Wert (System-Missings) zugewiesen. Es erscheint ein Komma im Feld. Oftmals ist es zweckdienlich, verschiedene Gründe für fehlende
Informationen zu unterscheiden. Sie können diesen Gründen verschiedene Werte zuweisen
und als fehlend deklarieren. Die statistischen Prozeduren und Datentransformationen verar-
Dateneingabe
17
beiten dann Fälle, die solche benutzerdefinierten fehlende Werte aufweisen, in einer spezie llen Weise. Um benutzerdefinierte Missing-Werte festzulegen, gehen Sie zur Zelle für Fehlende Werte und drücken Sie auf ....
Wählen Sie die Option ¤Einzelne Fehlende Werte und geben Sie in das erste Textfeld 9 ein.
Jede vorliegende Datendefinition (Variablennamen und Formate) einer bestehenden Datendatei wird von SPSS erkannt und in der Anze ige wiedergegeben. Sie können vorhandene oder
vorgegebene Datendefinitionen durch Ihre eigenen Bestimmungen ersetzen.
Variablendefinitionen kopieren
Sie können dieselbe Information zur Variablendefinition mehreren Variablen zuweisen, indem Sie die Zeile einer bereits definierten Variablen aktivieren und diese kopieren mit dem
Menü Bearbeiten|Kopieren oder mit der Tastenkombination Strg+C, eine neue Zeile aktivieren und dort die Variablendefinitionen mit dem Menü
Bearbeiten | Einfügen
oder mit der Tastenkombination Strg+V einfügen.
Wenn Sie die Variablendefinition erfolgreich eingefügt haben, müssen Sie noch den Variablennamen und die Beschreibung der Variable anpassen. Standardmässig erhält die neue
Variable den Namen var00001.
Dateneingabe
18
Wenn Sie die Definition einer bestehenden Variable nur teilweise übernehmen wollen, aktivieren Sie einfach die Zelle der Variablenansicht, die Sie übernehmen wollen (z.B. Wertelabels oder Fehlende Werte) und gehen Sie für das Kopieren und Einfügen der Definitionen
analog vor.
Eingeben von Daten
Bei der Eingabe in eine einzelne Zelle klicken Sie die Zelle an und ein deutlicher Rahmen
erscheint um diese Zelle. Tippen Sie den Wert ein. Der Wert wird im Ze lleneditor am oberen
Rand des Daten-Editors angezeigt. Drücken Sie die Eingabetaste oder wählen Sie mit der
Maus bzw. über die Pfeiltasten eine andere Zelle. Der Datenwert aus dem Zelleneditor erscheint in der Zelle.
Wurde den Werten in einer Spalte Werte-Labels zugewiesen, so können Sie die komplette
Liste der Labels in jeder Zelle der Variablen abfragen. Gehen Sie dazu in die entsprechende
Zelle und klicken Sie auf das Symbol der Pull-Down-Liste.
Dateneingabe
19
Wenn Sie auf die Fallnummer an der linken Seite der Zeile mit der linken Maustaste klicken,
wird die ganze Zeile markiert. Klicken Sie mit der linken Maustaste einmal auf den Variablennamen am oberen Rand der Spalte, wird die gesamte Spalte markiert.
Speichern der Daten
Für das erstmalige Speichern der Daten wählen Sie das Menü:
Datei | Speichern
Der untenstehende Dialog wird erscheinen. Geben Sie einen beliebigen Namen für die zu
speichernde Datei ein. Standardmässig werden die Daten im SPSS Datendatei-Format abgespeichert (*.sav).
Dateneingabe
20
Wenn Sie nicht alle Variable n abspeichern wollen klicken Sie auf die Befehlsschaltfläche
Variablen. Es erscheint der folgende Dialog.
Geben Sie nun an, welche Variablen Sie beibehalten und welche Sie aus der Datendatei ausschliessen wollen. Bestätigen Sie Ihre Eingaben mit Weiter und speichern Sie die Datei ab.
Dateneingabe
21
Übung
Definieren Sie die Variablen und geben anschließend die Daten der
beiden unten abgedruckten Fragebögen ein.
Tip: Behandeln Sie Frage 7 als String und benutzen Sie für die Definition des Datums ein Datumsformat.
Beispielantworten:
Nr. 1
1.
2.
3.
4.
5.
6.
7.
Geschlecht:
Alter:
Familienstand:
Bestelldatum:
Auftragsannahme:
Möbelservice:
Weitere Anschaffungen:
männlich
25
ledig
27. Januar 1997
zufrieden
nicht zufrieden
Schlafzimmerschrank
Nr. 2
1.
2.
3.
4.
5.
6.
7.
Geschlecht:
Alter:
Familienstand:
Bestelldatum:
Auftragsannahme:
Möbelservice:
Weitere Anschaffungen:
weiblich
33
verheiratet
4. März 1997
sehr zufrieden
zufrieden
Jugendzimmer
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
Codierung
Benutzerdefinierte fehlende Werte
System-Missings
Label
Datenübernahme
22
4 Datenübernahme
Inhalt
Ø
Ø
Ø
Ø
Excel-Dateien einlesen
Automatisch umkodieren
Datenimport mit ODBC
Dateien im ASCII-Format einlesen
Häufig sind Daten, die Sie mit SPSS auswerten wollen, bereits erfaßt und liegen als EXECLDatei oder als Textdatei (ASCII) vor. SPSS bietet Ihnen die Möglichkeit, diese Daten direkt
zu übernehmen, damit Sie ohne Verzögerung mit der Auswertung beginnen können.
Excel-Dateien einlesen
Um die Excel-Datei auto.xls in SPSS einzulesen, wählen Sie aus dem Menü
Datei | Öffnen
Im Dialogfeld Datendatei öffnen wählen Sie als Dateityp Excel. Dadurch erscheint im Feld
Name die Suchoption *.xls und im Feld Dateien werden die Dateien aufgelistet, die die Erweiterung *.xls haben. Genauso leicht können Sie, neben allen SPSS-Formaten, Dateien der
Formate Systat, Lotus, SYLK, dBASE, SAS und ASCII-Text in SPSS übernehmen.
Datenübernahme
23
Im Dialogfenster Optionen markieren Sie aVariablennamen aus ersten Datenzeile einlesen.
Das bedeutet, SPSS soll die Variablennamen aus der ersten Zeile des Arbeitsblattes überne hmen. Unter Arbeitsblatt kann das entsprechende Arbeitblatt ausgewählt werden. In eckigen
Klammern wird der Bereich angezeigt, wo SPSS Daten gefunden hat. Weicht dieser vorgeschlagene Bereich vom tatsächlichen Datenbereich ab, kann unter Bereich - wie in Excel üblich – den Bereich angeben, in dem sich die Daten tatsächlich befinden. Mit OK werden die
Daten in den Dateneditor eingelesen.
Datenübernahme
24
Automatisch umkodieren
Im Unterschied zu SPSS kann Excel aber auch Datenbanken die Variablen entweder mit numerischen Codes oder im String-Format (Zeichenketten) übergeben. Be ispielsweise wird die
Variable firma in SPSS als String der Länge 20 Zeichen eingelesen. Der Vorteil bei der
Übernahme von String-Variablen aus Datenbanken ist, dass alle gleichen Be griffe auch gleich
geschrieben sind. Allerdings können String-Variablen mit mehr als 8 Zeichen schlecht ausgewertet werden. D.h. man benötigt ein Verfahren, das aus den String- Variablen numerische
Codes mit Werte- Labeln schafft. Diese Funktion finden Sie unter
Transformieren | Automatisch umkodieren
In der Variablenliste werden die Variablen im String-Format mit einem < Zeichen für kurze
Strings (bis 8 Zeichen) und mit einem > Zeichen für lange Strings am Symbol für das Skalenniveau gekennzeichnet.
Übernehmen Sie die Variablen, die umkodiert werden sollen, in das Feld Variable → Neuer
Name. Das Programm erwartet im kleinen Textfeld darunter, daß ein Name für die neu zu
erstellende Variable eingegeben wird. Beispielsweise geben Sie hier firma_n ein und klicken Sie auf den Schalter Neuer Name. Abschließend brauchen Sie nur noch OK zu klicken.
Sie erhalten im Ausgabefenster ein Protokoll zur Umkodierung. Hier sehen Sie, welche Firma
welchen numerischen Code erhalten hat.
Datenübernahme
25
FIRMA
Old Value
FIRMA_N
New Value
Alfa Romeo
Audi
Bentley
BMW
Buick
Chrylser
Citroen
Daihatsu
Ferrari
Fiat
Ford
Honda
Jaguar
Lancia
Lotus
Maserati
Mazda
Mercedes
Mitsubishi
Nissan
Opel
Pontiac
Porsche
Renault
Rolls Roye
Rover
Saab
Seat
Skoda
Subaru
Suzuki
Toyota
VW
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
Value Label
Alfa Romeo
Audi
Bentley
BMW
Buick
Chrylser
Citroen
Daihatsu
Ferrari
Fiat
Ford
Honda
Jaguar
Lancia
Lotus
Maserati
Mazda
Mercedes
Mitsubishi
Nissan
Opel
Pontiac
Porsche
Renault
Rolls Roye
Rover
Saab
Seat
Skoda
Subaru
Suzuki
Toyota
VW
_
Zusätzlich zur Variable firma erhalten Sie nun eine neue Variable firma_n, die für jeden
Begriff einen numerischen Code enthält und diesem Code den ursprünglichen Begriff als
Werte-Label zuweist. Sie können dies in der Variablen-Ansicht des Dateneditors überprüfen.
Datenübernahme
26
Datenimport mit ODBC
Mit der Microsoft ODBC-Schnittstelle können Sie problemlos Daten aus einer Vielzahl von
Datenbanken nach SPSS importieren. Dazu wählen Sie in SPSS den Menüpunkt
Datei | Datenbank öffnen | Neue Abfrage
Im folgenden Dialogfeld muss zunächst die gewünschte Datenbank zur List der vorhandenen
Datenbanken hinzugefügt werden. Drücken Sie dazu auf den Knopf Datenquelle hinzufügen.
Im Dialog des ODBC-Datenquellen-Administrators aktivieren Sie das Register Benuter-DSN
und drücken Sie auf den Knopf Hinzufügen.
Datenübernahme
27
Im Dialog um eine neue Datenquelle zu erstellen erscheint nun die Liste aller ve rfügbarer
ODBC-Treiber. Wählen Sie die den Treiber für Microsoft Access-Treiber (*.mdb) aus und
drücken Sie auf den Knopf Fertigstellen.
Nun haben Sie die Möglichkeit, der Datenbank, die wir im nächsten Schritt aus wählen werden, im Textfeld Datenquellenname einen Namen zu geben. Da unsere Übungsdatenbank die
Maschinenverkäufe an unsere Kunden enthält, geben wir „Kundendatenbank“ ein. Gleichze itig besteht die Möglichkeit die Datenbank im Textfeld Beschreibung noch näher zu beschreiben. Schreiben Sie „Datenbank für Übungszwecke“ hin.
Jetzt müssen wir nur noch die entsprechende Datenbankdatei auswählen. Drücken Sie dazu
auf Auswählen und wählen Sie die Datei Access97.mdb aus. Drücken Sie auf OK. Bestätigen
Sie die weiteren Dialoge ebenfalls mit OK.
Datenübernahme
28
Nun finden wir unsere Datenbank in der Liste aller vorhanden Datenbanken des Assistenten vor. Aktivieren Sie unsere „Kundendatenbank“ und drücken Sie auf Weiter.
Übernehmen Sie die Tabelle KUNDEN mit der linken Maustaste in den rechten Teil des Dialogfeldes. Damit erhalten Sie alle Variablen des Datenblattes KUNDEN im Fenster Felder in
dieser Reihenfolge einlesen.
Datenübernahme
29
Sie können auch einzelne Variablen statt des gesamten Datenblattes überne hmen.
Im nächsten Dialogfeld können Sie Einschränkungen für die zu übernehmenden Fälle festlegen. Sie haben die Möglichkeit die Abfrage über Auswahlkriterien oder durch Ziehen einer
Stichprobe einzuschränken.
Im folgenden Dialog wird gezeigt unter welchen Variablennamen die Datenbankfelder eingelesen werden. Beachten Sie, dass längere Feldnamen auf maximal 8 Zeichen abgeschnitten
werden. Sie haben die Möglichkeit den Variablen eigene Namen zu geben. Datenbankfelder
Datenübernahme
30
des Datentyps Alphabetisch können Sie durch entsprechendes Kennzeichnen in der Spalte
Wertelabels automatisch in eine numerische Variable mit Wertelabels umkodieren lassen.
Im letzten Dialogfeld erscheint der SQL-Code für Ihre Datenbankabfrage. Sie haben die Möglichkeit die Abfrage unter Abfrage in Datei speichern abzuspeiche rn, um später wieder zu
verwenden.
Drücken Sie nun auf Fertig stellen um die Daten in SPSS zu importieren.
Datenübernahme
31
Eine gespeicherte Datenbank-Abfrage kann jederzeit neu ausgeführt werden, damit Sie immer
mit aktuellen Daten aus der Datenbank arbeiten können. Wählen Sie dazu aus dem Menü Datei
Datei | Datenbank öffnen | Abfrage ausführen
Im darauf folgenden Dialog wählen Sie die Datei der gespeicherten Abfrage aus.
Datenübernahme
32
Klicken Sie auf Öffnen. Innert Kürze sind die aktuellen Daten aus der Datenbank in SPSS neu
eingelesen.
Text-Dateien einlesen
Die Daten liegen als Text-Datei in der folgenden Form vor:
Suzuki
Suzuki
Suzuki
Suzuki
Suzuki
Yamaha
Yamaha
Yamaha
Yamaha
Yamaha
Yamaha
Yamaha
GSX-R 1100 1052 100 3 225 8.8 3.3 228 15849
GS 800
837 80 3 273 7.3 4.6 203 8899
RG 500
495 95 2 181 10.0 4.0 228 12169
GSX 400
395 27 3 189 4.5 8.4 158 5449
DR 600 S 585 45 3 165 5.1 6.4 147 7439
FJ 1200 1188 100 3 229 7.4 3.5 231 14300
XVZ 12 T 1198 97 3 259 7.8 4.3 192 19500
XJ 600
599 50 3 212 7.1 4.4 203 8030
SRX 600
608 45 3 172 5.5 6.2 170 7130
XT 500
499 27 3 155 6.5 8.5 142 5500
RD 500 LC 499 88 2 216 8.2 5.1 223 12070
XS 400
385 45 3 187 5.5 6.1 168 5480
Die folgende Tabelle gibt die Datenfeldbeschreibung der Variablen an, die hier erfasst sind.
Position
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Variable
marke
modell
ccm
ps
takt
gewicht
verbr
beschleu
spitze
preis
Spalte
1 - 10
12 - 21
23 - 26
28 - 30
32
34 - 36
38 - 41
43 - 46
48 - 50
52 - 56
Wählen Sie aus dem Menü
Datei | Text-Daten einlesen.
Wählen Sie als Dateityp Daten (*.dat), markieren Sie die Datei ascii.dat an und klicken
Sie auf Öffnen.
Datenübernahme
33
Es öffnet sich ein Assistent für den Textimport. Im ersten Schritt haben Sie die Möglichkeit
bereits definierte Formate für den Import zu benützen, die bei vorangegangen Importen abgespeichert wurden.
Beim zweiten Schritt müssen Sie eingeben wie die Variablen angeordnet sind und ob in der
ersten Zeile der Textdatei Variablennamen vorhanden sind. In unseren Datei sind die Variablen in Spalten mit fester Breite angeordnet und Namen für Variablen sind keine vorhanden.
Datenübernahme
34
In Schritt 3 können Sie angeben, in welcher Zeile der erste Fall der Daten beginnt. Dieser
kann von 1 unterschiedlich sein, wenn Variablennamen oder Kommentare den Daten vorangestellt sind. Sollte sich ein einziger Fall über mehrere Zeilen hinweg erstrecken, kann dies im
zweiten Feld eingegeben werden. Zudem besteht die Möglichkeit die Anzahl der eingelesenen
Fällen einzuschränken.
Im vierten Schritt können Sie mit einfachem Klicken und Ziehen and den vertikalen Linien
die Breiten der Variablen bestimmen. Unnötige Linien können durch Wegziehen aus der Datenvorschau eliminiert werden. Zusätzliche Linien können durch Klicken an der entspreche nden Kolonne hinzugefügt werden.
Datenübernahme
35
Schritt 5 erlaubt Ihnen die Variablen umzubenennen oder das vorgeschlagene Datenformat zu
ändern. Soll eine Variable nicht importiert werden, kann dies ebenfalls im Feld Datenformat
gekennzeichnet werden.
Der 6. Und letzte Schritt des Assistenten gibt Ihnen die Möglichkeit, das nun neu definierte
Dateiformat für zukünftige Verwendungen abzuspeichern.
Wenn Sie durch alle 6 Schritte durch sind, klicken Sie auf Fertigstellen. Die Daten erscheinen
im Dateneditor.
Datenübernahme
36
Datenübernahme
Übung
Ergänzen Sie die Angaben zum Einlesen der Daten so, daß auch die
Variablen Modell, Gewicht, Verbrauch, Beschleunigung und Höchstgeschwindigkeit gelesen werden.
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
ü
ü
ü
Excel
Access
Datenbank
ODBC
ASCII
Festes Format
Automatisch umkodieren
37
Erste Auswertungen
38
5 Erste Auswertungen
Inhalt
Ø
Ø
Ø
Ø
Auswerten von kategorialen Variablen
Häufigkeitstabellen und Balkendiagramme erstellen
Auswertung kontinuierlicher Variablen
Histogramm mit Normalverteilung für kontinuierliche Variablen
Es ist immer ein guter Einstieg in die Datenanalyse, sich zunächst einen Überblick über die
Verteilung der erfassten Variablen zu verschaffen.
Bei kategorialen Variablen (z.B. ja/nein oder sehr gut, gut, befriedigend, ...) beginnen Sie mit
einer Auszählung der jeweiligen Ausprägungen via Häufigkeitstabelle, sowie einer grafischen
Darstellung mit einem Balkendiagramm.
Interessiert Sie die Verteilung von kontinuierlichen Variablen (z.B. das Alter oder Einkommen) bieten sich besonders statistische Maßzahlen und das Histogramm an.
Kategoriale Variablen
In SPSS können Sie parallel zu den Häufigkeitstabellen auch gleich entsprechende Grafiken
erzeugen, die diese Werte visualisieren. Wählen Sie für die Datei bank_de.sav aus dem
Menü
Analysieren | Deskriptive Statistiken | Häufigkeiten.
Erste Auswertungen
39
Im Dialogfeld Häufigkeiten markieren Sie in der Variablenliste die Variable beruf und übertragen sie in das Feld 8Variable(n). Achten Sie darauf, daß die Option aHäufigkeitstabellen
anzeigen aktiviert ist. Klicken Sie dann auf die Schaltfläche Diagramme.
Im Unterdialogfeld Häufigkeiten: Grafiken wählen Sie ¤Balkendiagramme, um die Häufigkeiten grafisch darzustellen. Danach wählen Sie Weiter und OK. Die Häufigkeitstabelle wird im
Viewer angezeigt.
Häufigkeitstabelle für Berufsgruppen
Gültig
Trainee
Bürokräfte
Sicherheitsdienst
Sachbearbeiter
Fachkräfte
leitende Angestellte
Gesamt
Gesamt
Häufigkeit
40
176
Prozent
8,4
37,1
Gültige
Prozente
8,4
37,1
Kumulierte
Prozente
8,4
45,6
27
79
147
5,7
16,7
31,0
5,7
16,7
31,0
51,3
67,9
98,9
5
474
474
1,1
100,0
100,0
1,1
100,0
100,0
In der Häufigkeitstabelle erkennen Sie auf einen Blick, daß von den insgesamt 474 Personen
unserer Datendatei 40 Personen in der Gruppe der Trainee sind. Dies entspricht 8,4% bezogen
auf 474 Personen. Die absolut größte Berufsgruppe stellen die Bürokräfte mit 176 Personen
dar, gefolgt von den Fachkräften mit 147 Nennungen.
Die Spalte Gültige Prozente ist dann von Interesse, wenn von Personen nicht bekannt ist,
welcher Berufsgruppe sie angehören. Diese Fälle werden auch Missing-Fälle genannt. Dann
werden die Prozentwerte für die einzelnen Gruppen auf Basis der Anzahl der Personen mit
gültigen Angaben für die Berufszugehörigkeit angegeben. Die letzte Spalte addiert die gültigen Prozentwerte der Gruppen nacheinander auf.
Das Balkendiagramm erscheint im Viewer direkt unter der Häufigkeitstabelle. Klicken Sie
hier doppelt auf die Grafik, um diese zur Weiterbearbeitung in den Grafik-Editor zu übertragen.
Erste Auswertungen
40
Balkendiagramm
200
176
147
100
Häufigkeit
79
40
27
0
Trainee
Sicherheitsdienst
Bürokräfte
Sachbearbeiter
Fachkräfte
leitende Angestellte
Berufsgruppen
Im Grafik-Editor können Sie unter anderem die Balken mit Schatten und Beschriftungen ve rsehen und Gitterlinien einfügen. Im Menü steht Ihnen eine Vielzahl weiterer Bearbeitungsmöglichk eiten zur Verfügung. Wenn Sie über
Format | Balkenbeschriftung
die Werte für die Häufigkeiten als Label einfügen, ist gut zu erkennen, daß das Balkendiagramm und die Häufigkeitstabelle genau die selben Inhalte repräsentieren. Beide stellen die
Häufigkeit des Auftretens jeder Kategorie bzw. jeder Gruppe dar.
Die Darstellung von kontinuierlichen Daten (z.B. Größe, Einkommen oder Alter) mit Balkendiagrammen ist nicht sinnvoll, da für jede unterschiedliche Ausprägung ein Balken erstellt
wird. Sind beispielsweise alle Befragten unterschiedlich alt, so wird für jede Person ein Ba lken erstellt. In einem solchen Fall ist es besser sich ein Histogramm erstellen zu lassen.
Kontinuierliche Variablen
Für kontinuierliche Variablen eignen sich statistische Maßzahlen, wie z.B. der Mittelwert und
Median, sowie zusammenfassende Grafiken, wie das Histogramm. Das Histogramm stellt die
kontinuierlichen Daten - in Gruppen zusammengefaßt - grafisch dar. Wählen Sie für die Darstellung der jetzigen Einkommensverteilung den Menüpunkt
Analysieren | Deskriptive Statistiken | Häufigkeiten.
Erste Auswertungen
Tauschen Sie die Variable beruf gegen gehalt aus. Unter Diagramme wählen Sie
¤Histogramm(e) und aktivieren die Option aMit Normalverteilungskurve.
Im Hauptdialogfeld deaktivieren Sie die Option aHäufigkeitstabellen anzeigen, da eine solche Tabelle lang und unübersichtlich wird.
Mit Ok erhalten Sie die grafische Darstellung der Einkommensverteilung und gleichzeitig als
statistische Maßzahlen die Standardabweichung, den Mittelwert und die Anzahl der Fälle.
41
Erste Auswertungen
42
Histogramm
140
120
100
80
60
Häufigkeit
40
Std.abw. = 17075,66
20
Mittel = 34419,6
N = 474,00
0
,0
00
50
13
,0
00
50
12
,0
00
50
11
,0
00
50
10
0,0
00
95
0,0
00
85
0,0
00
75
0,0
00
65
0,0
00
55
0,0
00
45
0,0
00
35
0,0
00
25
0,0
00
15
jetziges Gehalt
Um beschreibende und zusammenfassende Statistiken für numerische Variablen in einer Tabelle zu erhalten, wählen Sie unter
Analysieren | Deskriptive Statistiken | Häufigkeiten
im Unterdialogfeld Statistiken die gewünschten Maßzahlen aus.
Hier können Sie eine oder mehrere Statistiken wie Perzentilwerte, Lagemaße, Streuungs- und
Verteilungsstatistiken für die ausgewählten Variablen anfordern. Nach der Auswahl kommen
Sie mit Weiter wieder ins Hauptdialogfeld.
Um erste Auswertungen mit kontinuierlichen Variablen auszuführen eignet sich in SPSS auch
die Funktion Deskriptive Statistik. Sie finden diese unter
Erste Auswertungen
Analysieren | Deskriptive Statistik | Deskriptive Statistiken...
Es erscheint folgender Dialog
Durch das Klicken auf die Befehlsschaltflache Optionen können Sie auch mit dieser Funktionen die gebräuchlichen Statistiken wie Mittelwert, Summe, Streuungs- und Verteilungsstatistiken für die ausgewählten Variablen berechnen lassen.
43
Erste Auswertungen
Übung
1. Untersuchen Sie das Anfangsgehalt (einstieg) und das jetzige
Gehalt (gehalt). Welches Gehalt besitzt eine größere Streuung
und wie verhält sich der Mittelwert zum Median?
2. Stellen Sie die Altersstruktur der Bankmitarbeiter grafisch dar.
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
ü
ü
ü
ü
ü
Kategoriale Variablen
Kontinuierliche Variablen
Häufigkeiten
Balkendiagramm
Histogramm
Mittelwert
Standardabweichung
Anzahl der Fälle
Grafik-Editor
44
Der SPSS Viewer
45
6 Der SPSS Viewer
Inhalt
Ø
Ø
Ø
Ø
Ø
Ø
Ø
Ø
Erzeugen von Ausgaben
Suchen im SPSS Viewer
Anzeigen und Verbergen von Ausgabe
Umstellen und Löschen der Ausgabe
Speichern des SPSS Viewers
Übernahme von Grafiken und Tabellen
Exportieren der Ausgabe
Drucken und Seitenansicht
Erzeugen von Ausgabe
Sobald Sie beginnen Analysen durchzuführen, wird automatisch ein SPSS Viewer geöffnet.
Dort werden die entsprechenden Tabellen und Grafiken ausgegeben. Dieser ist in zwei Fenster unterteilt. Das linke Fenster enthält das Inhaltsverzeichnis des SPSS Viewers. Im Ersche inungsbild und Konzept ist dieser dem Windows- Explorer sehr ähnlich. Das rechte Fenster
enthält die statistischen Tabellen, Grafiken und die Textausgabe.
Zur Berechnung einer Häufigkeitstabelle wählen Sie
Analysieren | Deskriptive Statistiken | Häufigkeiten
und übertragen die Variable beruf in Variablen.
Zusätzlich fordern Sie noch unter Diagramme ein Balkendiagramm an.
Der SPSS Viewer
46
Der Navigator enthält dann automatisch alle Teile der angeforderten Ausgaben. Die jeweils
neu erzeugte Ausgabe wird am Ende der letzten Ausgabe angefügt. Bewegen Sie sich im linken Fenster durch die Ausgabe, wird gleichzeitig im rechten Fenster die entsprechende Grafik
oder Tabelle mit einem kleinen roten Pfeil markiert und erscheint im Fenster.
Die Breite der beiden Fenster kann man durch Ziehen mit der Maus am Trennungsbalken ve rändern.
Suchen im SPSS Viewer
Gemeinsam angeforderte Tabellen und Grafiken ergeben jeweils einen Block im SPSS Viewer. Jeder Block ist ein eigenes Objekt, für das in der Inhaltsübersicht ein Symbol steht. Ein
Block besteht aus Titel, Anmerkungen und den ausgewählten Ausgaben, eventuell nochmals
untergliedert. Die Inhaltsübersicht für die Analysen sieht folgendermaßen aus:
Der SPSS Viewer
47
Die Häufigkeitstabelle für die Berufsgruppen erscheint im rechten Fenster.
Häufigkeitstabelle für Berufsgruppen
Gültig
Trainee
Bürokräfte
Sicherheitsdienst
Sachbearbeiter
Fachkräfte
leitende
Angestellte
Gesamt
Gesamt
Häufigkeit
40
176
Prozent
8,4
37,1
Gültige
Prozente
8,4
37,1
Kumulierte
Prozente
8,4
45,6
27
79
147
5,7
16,7
31,0
5,7
16,7
31,0
51,3
67,9
98,9
5
1,1
1,1
100,0
474
474
100,0
100,0
100,0
Anzeigen und Verbergen von Ausgabe
Da die Inhaltsübersicht sehr umfangreich werden kann, ist es möglich, Teile der Ausgabe zu
verbergen. Dies verkürzt die Ausgabe und beinhaltet - im Gegensatz zum Löschen - die Möglichkeit, die Ausgabe jederzeit wieder sichtbar zu machen. Die normale Darstellung der Übersicht ist folgende:
Um Titel, Anmerkungen, Tabellen oder Grafiken zu verbergen, kann man entweder auf das
doppelklicken, in der Symbolleiste das Minussymbol
benutzen oder das Menü
Ansicht | Reduzieren
verwenden. Die verkürzte Ausgabe kann dann zum Beispiel folgendermaßen aussehen:
Der SPSS Viewer
48
Ebenso kann man durch Klicken auf das Pluszeichen einen zusammengefaßten Block wieder
öffnen.
Wenn Sie einzelne Teile eines Ausgabeblocks sehen bzw. verstecken wollen stehen Ihnen
neben dem Doppelklick auf die einzelnen Ausgabeelemente die beiden Symbole
Einblenden bzw.
für das
zum Ausblenden zur Verfügung.
Eine wichtige Ergänzung der Ausgabe sind die Anmerkungen. Sie enthalten Informationen
über die für die Analyse verwendete Datei und die getroffenen Einstellungen. Außerdem wird
dort der verwendete Syntaxbefehl vermerkt. Gemäß Voreinstellung ist dieses Objekt zunächst
ausgeblendet. Zum Ansehen klicken Sie in der Symbolleiste am oberen Rand des Bildschirms
auf das Symbol
oder über das Menü
Ansicht | Einblenden.
Anmerkungen
Ausgabe erstellt
Kommentare
Eingabe
Behandlung fehlender
Werte
31-JAN-2002 15:52:08
Daten
C:\Daten\Base\BANK_DE.SAV
Filter
Gewichtung
<keine>
<keine>
Aufgeteilte Datei
Anzahl der Zeilen in
der Arbeitsdatei
<keine>
Definition von
fehlenden Werten
Benutzerdefinierte fehlende Werte
werden als fehlend behandelt.
Verwendete Fälle
Statistik basiert auf allen Fällen mit
gültigen Daten.
FREQUENCIES
VARIABLES=beruf
/BARCHART FREQ
/ORDER= ANALYSIS .
Syntax
Ressourcen
474
Zugelassene Werte
Verstrichene Zeit
149796
0:00:00.49
Umstellen und Löschen der Ausgabe
Mit dem Navigator ist es möglich, die Anordnung der Ausgabe nach Belieben zu ändern. Man
kann auch Teile kopieren oder löschen.
Um die Anordnung zu verändern, klicken Sie das entsprechende Objekt in der Inhaltsübersicht an.
Der SPSS Viewer
49
Lassen Sie die linke Maustaste gedrückt, bewegen Sie das markierte Objekt an die gewünschte Stelle und lassen Sie die Maus los.
Um Output zu kopieren, klickt man auf das gewünschte Objekt und wählt aus dem Menü
Bearbeiten | Kopieren
oder man verwendet die Tastenkombination Strg + C. Dann bewegt man die Maus an die gewünschte Stelle und klickt auf
Bearbeiten | Einfügen nach
oder man verwendet die Tastenkombination Strg + V.
Um Ausgaben zu löschen, klicken Sie auf das gewünschte Objekt und wählen aus dem Menü
Bearbeiten | Löschen
oder Sie verwenden die Tastenkombination Strg + X bzw. die Entfe rnen-Taste.
Speichern der Ausgabe
Um Ausgaben unter dem voreingestellten Namen zu speichern, wählt man im Menü
Datei | Speichern
Der SPSS Viewer
oder man benutzt das Symbol
50
.
Um die Ausgabe unter einem anderen Namen zu speichern, kann man auch
Datei | Speichern unter
wählen.
Übernahme von Grafiken und Tabellen
Nach Erstellen einer Tabelle oder Grafik können Sie diese problemlos in ein Dokument von
Word, ein Excel Datenblatt, eine PowerPoint Folie oder vergleichbares übernehmen.
Dafür markieren Sie im ersten Schritt im Ausgabe-Navigator die gewünschten Objekte. Aus
dem Menü wählen Sie
Bearbeiten | Kopieren.
Damit werden die Objekte in die Zwischenablage kopiert. Wechseln Sie nun zur entspreche nden Anwendung und wählen Sie dort
Bearbeiten | Einfügen.
Schon sind die gewünschten Objekte übernommen.
Wenn Sie eine Tabelle einfügen, können Sie statt Einfügen auch Inhalte einfügen verwenden.
Dann haben Sie die Auswahl, ob die Tabelle als Text oder als Grafik eingefügt werden soll.
Damit können Sie beispielsweise Ergebniswerte in das Excel Datenblatt übernehmen.
Der SPSS Viewer
51
Diese Vorgehensweise ermöglicht Ihnen einen schnellen und unproblematischen Austausch
von Ergebnissen in Form von Grafiken oder Tabellen.
Exportieren der Ausgabe
Sie haben die Möglichkeit das Ausgabedokument zu exportieren. Als Export-Formate stehen
HTML, Text oder XML zur Verfügung. Wählen Sie dazu das Menü
Datei | Export...
Im Feld Export können Sie angeben, ob Sie nur Tabellen, nur Grafiken oder das ganze Ausgabedokument exportieren wollen. Daneben können Sie den Export auf ausgewählte oder
sichtbare Objekte einschränken.
Die exportierte HTML-Datei kann mit einem beliebigen Internet-Browser (z.B. MS Internet
Explorer oder Netscape) betrachtet werden oder auf einen Internet-Server platziert werden.
Der SPSS Viewer
52
Drucken der Ausgabe
Sie haben die Möglichkeit eine markierte Auswahl oder alle sichtbaren Objekte zu drucken.
Letzteres bedeutet, daß nur das gedruckt wird, was in der Inhaltsübersicht zu sehen ist. Die
versteckten Objekte werden weggelassen.
Nicht zuletzt hat man die Möglichkeit, sich den Ausdruck über den Menüpunkt
Datei | Seitenansicht
anzusehen. Voraussetzung dazu ist, dass ein Drucker für Ihr Windows installiert ist.
Der SPSS Viewer
Wichtige Begriffe aus diesem Kapitel:
ü
ü
ü
ü
ü
SPSS Viewer
Verbergen
Speichern
Drucken
Seitenansicht
53
Editieren von Tabellen
54
7 Editieren von Tabellen
Inhalt
Ø
Ø
Ø
Ø
Ø
Pivotieren - das Vertauschen von Zeilen und Spalten
Spaltenbreite verändern
Rahmen hinzufügen und editieren
Schriftarten und Farben zuweisen
Formatvorlage erstellen und zuweisen
Pivotieren
Tabellen in SPSS ab der Version 7 sind Pivot-Tabellen. Das bedeutet für Sie, die Tabellen
können von Ihnen auch nach dem Erstellen frei gestaltet werden. Dieses umfaßt das Pivotieren der Tabellen, das Editieren und Zuweisen von Spaltenbreiten, Rahmen, Schriftarten, Farben, Zahlenformaten, Ze lleninhalten und das Anwenden von Formatvorlagen.
Pivotieren bedeutet, Zeilen, Spalten und Schichten nach Belieben zu vertauschen. Hierzu
brauchen Sie nun nicht mehr in die entsprechenden Dialogfelder zurück zugehen, um dort die
Variablen zu vertauschen. Es reicht mit einem Doppelklick auf die Pivot-Tabelle diese in den
Pivot-Editor zu übernehmen.
Klicken Sie die Tabelle mit der rechten Maustaste an und wählen Sie dann aus dem Kontextmenü
Objekt: SPSS Pivot-Tabelle | Öffnen
Editieren von Tabellen
55
Im Pivot-Editor verfügen Sie über die zwei zusätzlichen Menüs Pivot und Format. Mit
Pivot | Zeilen und Spalten vertauschen
werden Zeilen und Spalten vertauscht.
Berufsgruppen
Häufigkeit
Prozent
Gültige
Prozente
Kumulierte
Prozente
Gültig
Sachbearb
eiter
79
16.7
Fachkräfte
147
31.0
leitende
Angestellte
5
1.1
Gesamt
474
100.0
100.0
Trainee
40
8.4
Bürokräfte
176
37.1
Sicherheits
dienst
27
5.7
8.4
37.1
5.7
16.7
31.0
1.1
8.4
45.6
51.3
67.9
98.9
100.0
Alternativ können Sie mit
Pivot | Pivot-Leisten
die Elemente der Tabelle beliebig mit der Maus in die grauen Bereiche Zeile, Spalte oder
Schicht verschieben.
Editieren von Tabellen
56
Wenn Sie den Mauszeiger auf eines der farbigen Symbole positionieren, erscheint mit Berufsgruppen oder Statistiken die Beschreibung der Inhalte. Klicken Sie mit der linken Maus auf
das Symbol für die Berufsgruppen und führen Sie das Symbol bei gedrückter Maustaste auf
den grauen Balken Zeilen. Bringen Sie auf dieselbe Weise das Symbol für die Statistiken in
die Schicht.
Auf dem Bildschirm sehen Sie interaktiv die Veränderung der Tabellen.
Um zwischen den Elementen in den Schichten zu wechseln klicken Sie einfach auf die
schwarzen Pfe ile rechts und links neben dem Symbol für Statistiken im Bereich Schichten.
Berufsgruppen
Häufigkeit
Gültig Trainee
Bürokräfte
Sicherheitsdienst
Sachbearbeiter
Fachkräfte
leitende Angestellte
Gesamt
Berufsgruppen
40
176
27
79
147
5
474
Prozent
Gültig Trainee
Bürokräfte
Sicherheitsdienst
Sachbearbeiter
Fachkräfte
leitende Angestellte
Gesamt
8.4
37.1
5.7
16.7
31.0
1.1
100.0
Egal welche Darstellungsform Sie wählen, die Informationen bleiben die selben.
Editieren von Tabellen
57
Spaltenbreite verändern
Im Tabellen- Editor können Sie schnell die Spaltenbreiten verändern. Wenn Sie den Mausze iger auf eine Spaltengrenze bewegen, erscheint ein Doppelpfeil. Mit gedrückter linker Maustaste läßt sich die Spalte vergrößern und verkleinern.
Berufsgruppen
Häufigkeit
Gültig
Gültige
Prozente
8.4
Kumulierte
Prozente
8.4
40
Prozent
8.4
Bürokräfte
Sicherheitsdienst
176
27
37.1
5.7
37.1
5.7
45.6
51.3
Sachbearbeiter
Fachkräfte
79
147
5
16.7
31.0
1.1
16.7
31.0
1.1
67.9
98.9
100.0
474
100.0
100.0
Trainee
leitende Angestellte
Gesamt
Sollen alle Datenspalten gleichzeitig vergrößert oder verkleinert werden wählen Sie
Format | Breite der Datenzellen
Wenn Sie Veränderungen in den Beschriftungen vorgenommen haben oder Sie die Einstellung der Spaltenbreiten wieder rückgängig machen wollen, so klicken Sie einfach auf
Format | Automatisch anpassen.
Übrigens können Sie jede Veränderung mit
Bearbeiten | Rückgängig
zurücknehmen.
Allgemein
Wählen Sie im Menü
Format | Tabelleneigenschaften.
Editieren von Tabellen
58
Unter Allgemein ist besonders die Option Beschriftung für Zeilendimension: ¤Verschachtelt
zu erwähnen. Damit werden die sonst verborgenen Texte in der Ecke der Tabelle angezeigt.
Daneben können die minimalen bzw. maximalen Spaltenbreiten für die Tabellen bestimmt
werden
Zellenformate
Mit Zellenformate können Sie für ausgewählte Bereiche (Bereich:) die Schriftart und - größe,
die Ausrichtung und Schattierung wählen. Jede Veränderung läßt sich im Fenster Beispiel
nachvollziehen. Mit dem Schalter Übernehmen können Sie die Veränderungen auf Ihre Tabelle anwenden ohne das Dialogfeld schließen zu müssen.
Rahmen
Ein weiterer Punkt, der hier erwähnt werden soll, ist das Dialogfenster für die Ra hmen der
Tabelle. Auf der linken Seite des Fensters können Sie die verschiedenen Positionen und die
Linienart der Rahmen bestimmen. Alternativ kann man die gewünschten Elemente auch im
rechten Schaubild anklicken.
Editieren von Tabellen
59
So kann unsere Ausgangstabelle nun beispielsweise wie folgt aussehen:
Berufsgruppen
Trainee
Bürokräfte
Sicherheitsdienst
Gültig
Sachbearbeiter
Fachkräfte
leitende Angestellte
Gesamt
Häufigkeit
Prozent
Gültige
Prozente
Kumulierte
Prozente
40
176
27
79
147
5
474
8.4
37.1
5.7
16.7
31.0
1.1
100.0
8.4
37.1
5.7
16.7
31.0
1.1
100.0
8.4
45.6
51.3
67.9
98.9
100.0
Tabellenvorlagen
Die Einstellung der Tabelleneigenschaften können Sie unter
Format | Tabellenvorlagen
abspeichern. Bereits erstellten oder neu zu erstellende Tabellen können Sie eines der von
SPSS mitgelieferten oder ein selbst definiertes Format zuweisen.
Editieren von Tabellen
60
Zum Speichern einer neuen Tabellenvorlage wählen Sie im Dialogfeld Tabellenvorlagen für
das gewünschte Format den Scha lter Speichern unter.
In diesem Dialogfeld können auch bestehende Formate mit Tabellenvorlage bearbeiten editiert und neu abgespeichert werden.
Zum Anlegen eines eigenen Verzeichnisses für Ihre Tabellenansichten verwenden Sie den
Schalter Durchsuchen. Mit der Angabe des entsprechenden Ordners stellt SPSS die dort
enthaltenden Tabellenvorlagen in der linken Übersicht dar.
Zelleneigenschaften
Mit Tabelleneigenschaften und Tabellenvorlagen läßt sich die gesamte Tabelle bearbeiten.
Zusätzlich können Sie mit Zelleneigenschaften jede einzelne Zelle der Tabelle bearbeiten.
Dazu markieren Sie zuerst das gewünschte Element der Tabelle und rufen
Format | Zelleneigenschaften
auf.
Editieren von Tabellen
61
Hier haben Sie die Auswahl der darzustellenden Inhalte, die Ausrichtung, die Position in der
Zelle und der Schattierung. Zusätzlich kann mit einem Doppelklick der Inhalt jeder Zelle
manuell editiert werden. Dieses ist neben dem Editieren von Beschriftungen auch für Zahlen
mit Nachkommastellen interessant. Mit einem Doppelklick wird der komplette Wert
angezeigt.
Editieren von Tabellen
Übung
Bearbeiten Sie eine Tabelle.
1. Vertauschen Sie Zeilen, Spalten und Schichten.
2. Verändern Sie das Aussehen der Tabelle.
3. Speichern Sie Ihr neues Tabellenformat ab.
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
ü
ü
Editieren
Pivotieren
Zellenformate
Rahmen
Tabellenansichten
Zelleneigenschaften
62
Grafiken
63
8 Grafiken
Inhalt
Ø
Ø
Ø
Ø
Einfaches Balkendiagramm
Editieren von Diagrammen
Kreisdiagramm
Histogramm
Zur Visualisierung Ihrer Daten bietet SPSS eine große Vielfalt von Grafiktypen an. Im Menü
Grafiken können Sie aus über 100 verschiedenen Diagrammen auswählen. Mit SPSS stehen
Ihnen sowohl statistischen Grafiken als auch Präsentationsgrafiken zur Verfügung.
Diagramme werden zunächst im Viewer dargestellt. Durch einen Doppelklick auf das Diagramm können Sie die Grafik im Diagramm- Editor bearbeiten. Für die Nachbearbeitung stehen Ihnen neben allgemeinen Bearbeitungsmöglichkeiten auch für jeden Diagrammtyp spezielle Funktionen zur Verfügung.
Balkendiagramm
Um die Anzahl der Angestellten in den verschiedenen Berufsgruppen grafisch darzustellen,
wählen Sie aus dem Menü
Grafiken | Balken.
Im Dialogfeld Balkendiagramme lassen Sie die Voreinstellungen Einfach und Daten im Diagramm | Auswertung über Kategorien einer Variablen unverändert und klicken auf Definieren.
Grafiken
64
Im Dialogfeld Einfaches Balkendiagramm definieren: Auswertung über Kategorien einer Variablen übernehmen Sie die Variable beruf in das Feld Kategorienachse. Gemäß der Voreinstellung stellen die Balken die Anzahl der Fälle dar.
Klicken Sie nun auf OK, um folgende Grafik zu erhalten:
Grafiken
65
Wollen Sie, daß die Balken eine andere Größe als die Häufigkeit darstellen, betrachten Sie im
Dialogfeld Einfaches Balkendiagramm definieren: Auswertung über Kategorien einer Variablen das Feld Bedeutung der Balken. Hier haben Sie verschiedene Möglichkeiten, die Bedeutung der Balken zu bestimmen. Wählen Sie den Punkt ¤Andere Auswertungsfunktion an und
übergeben Sie die Variable gehalt in das nun aktive Feld Variable.
Grafiken
66
Klicken Sie nun auf die Schaltfläche Auswertungsfunktion. Folgendes Dialogfeld wird geöffnet:
Wählen Sie hier den Punkt ¤Maximalwert an. Mit Weiter und OK erhalten Sie nun ein Ba lkendiagramm für die Berufsgruppe, wobei die Balken den Maximalwert des jetzigen Gehalts
in der jeweiligen Berufsgruppe darstellen.
Grafiken
67
Öffnen Sie die Grafik mittels eines Doppelklicks auf das Diagramm. So gelangen Sie in den
Diagramm- Editor.
Hier können Sie z.B. unter dem Menüpunkt
Format | Balkenart
schattierte Balken auswählen. Klicken Sie nun auf einen der Balken, um die Balken zu ma rkieren. Die Markierung der Balken wird durch kleine schwarze Rechtecke an den Balkenecken angezeigt.
Über
Format | Farbe
können Sie den Balken eine andere Farbe zuweisen. Ähnlich können Sie für den Hintergrund
eine andere Farbe auswählen.
Schließlich wollen wir noch die Werte der einzelnen Balken anzeigen lassen. Dafür klicken
Sie auf
Format | Balkenbeschriftung
und wählen hier Standard aus. Die Grafik kann nun z.B. folgendes Aussehen haben:
160000
140000
135000
120000
100000
103750
80000
Max jetziges Gehalt
80000
60000
40000
20000
42300
35250
31350
0
Trainee
Sicherheitsdienst
Bürokräfte
Fachkräfte
Sachbearbeiter
leitende Angestellte
Berufsgruppen
Um das Aussehen dieses Diagramms als Vorlage verwenden zu können, speichern Sie das
Diagramm über
Datei | Diagrammvorlage speichern
Grafiken
68
unter dem Namen graf1.sct ab.
Soll nun eine Grafik erstellt werden, die für die einzelnen Berufsgruppen das minimale Alter
darstellt, so gehen Sie wie eben vor. Übernehmen Sie allerdings nun die Variable alter in
das Feld ¤Andere Funktion und wählen Sie unter den Funktionen ¤Minimum aus. Klicken
Sie im Feld Vorlage den Punkt aGrafikeinstellungen aus an. Über die Schaltfläche Datei gelangt man in das Dialogfeld Grafikeinstellungen aus Datei übernehmen. Geben Sie unter Dateiname graf1.sct ein. Mit Weiter und OK erhalten Sie ohne weitere Änderungen dieses
Balkendiagramm:
50
40
39
36
30
31
28
Min Alter
26
20
21
10
Trainee
Sicherheitsdienst
Bürokräfte
Sachbearbeiter
Fachkräfte
leitende Angestellte
Berufsgruppen
Diese Grafik hat nun dasselbe Aussehen wie die vorhin erzeugte Grafik, ohne daß Sie erneut
die Grafik bearbeiten mußten.
Als weitere Diagrammtypen für kategoriale Gruppenvariablen stellt SPSS Linien-, Flächenund Kreisdiagramme zur Verfügung.
Bei all diesen Diagrammtypen stehen für die Repräsentation der Grafikdaten drei Möglichkeiten zur Auswahl:
§
§
§
Kategorien einer Variablen: Es werden innerhalb von Untergruppen Fälle gezählt oder Variablen zusammengefaßt.
Verschiedene Variable: Es werden mehrere Variablen zusammengefaßt dargestellt.
Werte einzelner Fälle: Die einzelnen Werte einer Variablen werden in einem Diagramm dargestellt.
Grafiken
69
Kreisdiagramm
Die Verteilung der Bankmitarbeiter nach dem Geschlecht und der Hautfarbe (Variable
edgeschl) können Sie außer mit einer Häufigkeitstabelle auch mit Grafiken darstellen. Hier
bietet sich besonders ein Kreisdiagramm an. Mit
Grafiken | Kreis
kommen Sie zur folgenden Abfrage:
Übernehmen Sie mit einem Klick auf Definieren die Voreinstellung. Im Dialogfeld Kreisdiagramm definieren: Auswertung über Kategorien einer Variablen brauchen Sie nur die Variable edgeschl in das Feld Segmente definieren durch übernehmen und mit OK bestätigen.
Damit erhalten Sie im Viewer ein Kreisdiagramm mit fünf Segmenten für die entsprechenden
Kategorien.
Grafiken
70
Wie das Balkendiagramm, können Sie auch das Kreisdiagramm mit einem Doppelklick in den
Diagramm- Editor übernehmen, um es zu verändern.
Hier stehen Ihnen unter
Diagramme | Optionen
spezielle Funktionen für die Bearbeitung von Kreisdiagrammen zur Verfügung. So können
Sie die Häufigkeiten oder Prozentwerte aufnehmen und mit Format die Position und Rahmen
auswählen. Wie in jeder Grafik können wieder Titel und Farben individuell bestimmt werden.
Ferner können Sie auch einzelne Segmente bei Bedarf weglassen, z.B. hier die fehlenden
Werte.
Grafiken
71
Verteilung der Bankmitarbeiter
weiblich Minderheit
8,5%
männlich
40,6%
37,4%
weiblich
13,4%
männlich
Minderheit
Histogramm
Die Darstellung von kontinuierlichen Daten (z.B. Größe, Einkommen oder Alter) mit Balkendiagrammen ist nicht sinnvoll, da für jede unterschiedliche Ausprägung ein Balken erstellt
wird. Sind beispielsweise alle Befragten unterschiedlich alt, so wird für jede Person ein Ba lken gezeichnet. In einem solchen Fall ist es besser, sich ein Histogramm erstellen zu lassen.
Das Histogramm stellt die kontinuierlichen Daten in Gruppen zusammengefaßt grafisch dar.
Wählen Sie für die Darstellung der aktuellen Altersverteilung den Menüpunkt
Grafiken | Histogramm.
Grafiken
72
100
80
60
40
20
Std.abw. = 11.78
Mittel = 35.7
N = 473.00
0
20.0
25.0
22.5
30.0
27.5
35.0
32.5
40.0
37.5
45.0
42.5
50.0
47.5
55.0
52.5
60.0
57.5
62.5
Alter
Übernehmen Sie aus der Variablenliste alter in das Feld Variable. Mit der Wahl Normalverteilungskurve anzeigen wird diese entsprechend der Daten im Histogramm ausgegeben.
Mit OK erhalten Sie die übersichtliche Darstellung der Altersverteilung und gleichzeitig die
Streuung, Mittelwert sowie Anzahl der Fälle.
Grafiken
73
Übung
Stellen Sie die Verteilung der aktuellen Gehälter in den verschiedenen
ethnischen Gruppen grafisch dar (mehrere Möglichkeiten).
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
Diagramm- Editor
Balkendiagramm
Kreisdiagramm
Histogram
Interaktive Diagramme
74
9 Interaktive Diagramme
Inhalt
Ø Erstellen eines interaktiven Balkendiagrammes
Ø Editieren von interaktiven Diagrammen
Ab der Version 8.0 bietet sich die Möglichkeit, Diagramme auch nach der Erstellung zu ve rändern. Im Gegensatz zu Standarddiagrammen erlauben die interaktiven Funktionen eine Änderung der Diagrammvariablen, eine problemlose Änderung der Diagramme sowie von Auswertungsfunktionen auch nach Fertigstellung der Grafiken.
Die Dialogfelder für die interaktiven Diagramme unterscheiden sich von den herkömmlichen
in folgenden Punkten. So können jetzt die einzelnen Variablen mittels Drag&Drop verschoben werden. Außerdem erlauben die neuen Grafiken auch nach der Erstellung das Einfügen
von zusätzlichen Elementen, Variablen oder Auswertungsfunktionen. Sie könne n ferner als
voll interaktives ActiveX-Objekt in andere Anwendungen eingebunden werden.
Balkendiagramm
Zur Erstellung eines interaktiven Balkendiagrammes wählen Sie aus dem Menü
Graphiken | Interaktiv | Balken
Es erscheint folgendes Dialogfenster:
Interaktive Diagramme
75
Standardmässig sind die Variablen alphabetisch angeordnet. Möchten Sie die Variablen wie
in der Daten-Datei angeordnet haben, klicken Sie mit der rechten Maustaste auf die Liste der
Variablen und wählen Nach Reihenfolge in Datei sortieren. Zur Auswahl einer Variablen
ziehen Sie diese einfach mit gedrückter linker Maustaste auf das jeweilige Zielfeld. Zur grafischen Auswertung der Variablen edgeschl ziehen Sie diese auf die X-Achse des Koordinatensystems. Über das Kontextmenü, das sich mit der rechten Maustaste öffnen läßt, können
Sie beispielsweise verschiedene Sortierungen einstellen.
Mit der Schaltfläche Optionen können Sie u.a. bestimmte Diagrammvorlagen zuweisen.
Wählen Sie hier beispielsweise die Vorlage Ozean aus.
Mit OK startet die Erstellung des Diagramms, die einige Sekunden dauern kann. Mit einem
Doppelklick auf die Grafik wird diese zum Bearbeiten geöffnet.
Interaktive Diagramme
76
Alle verwendeten Grafikelemente können nach der Erstellung beliebig verändert werden. Um
diese Bearbeitung vornehmen zu können, wählen Sie Bearbeiten | Diagramm-Manager oder
klicken Sie auf das Symbol
.
Wählen Sie im Diagramm-Manager nun unter Elemente die Balken aus und Klicken Sie Bearbeiten.
Interaktive Diagramme
77
Wenn Sie die Beschriftung der Balken ändern möchten, finden Sie auf der Registerkarte Optionen für Balken die möglichen Einstellungen. Wählen Sie hier z.B. unter Beschriftung | Anzahl | Lage die Option Am Ende außen, um die jeweilige Anzahl der Fälle über der betreffenden Spalte anzeigen zu lassen.
Die Breite der Balken lässt sich auf der Registerkarte Balkenbreite einstellen. Sie läßt sich
ebenso wie die Tiefe der Balken stufenlos zwischen 5% und 100% verstellen. Mit OK werden
die Einstellungen auf Ihr Diagramm angewendet.
Um beispielsweise den größten Balken hervorzuheben, kann dieser einzeln eingefärbt werden.
Hier müssen Sie lediglich den Balken anklicken und ihm mittels der Schaltfläche
Füllfarbe die gewünschte Farbe zuweisen.
Dreidimensionales Balkendiagramm
Um den Zusammenhang zwischen der Zugehörigkeit zu einer Minderheit und der Berufsgruppe darzustellen, bietet sich ein dreidimensionales Balkendiagramm an. Wählen Sie unter
Grafiken | Interaktiv | Balken
über die Schaltfläche
das 3D-Balkendiagramm aus. Um nun den Zusammenhang darzustellen, weisen Sie den beiden X-Achsen die Variablen minder und beruf zu. Stellen Sie
außerdem unter Optionen für Balkendiagramm einmal die kreisförmige Grundfläche ein.
Interaktive Diagramme
78
Mit OK erhalten Sie folgendes Diagramm:
Balken zeigen Häufigkeiten
Interaktive Diagramme
79
Zur Änderung der Ansicht klicken Sie wieder zwei Mal auf die Grafik. Vor allem bei dreid imensionalen Diagrammen bietet es sich an, die Ansicht auf Abbildung zu verändern, um eine
bessere Übersichtlichkeit zu erhalten. Verwenden Sie hierzu das Dialofeld 3D, welches sich
automatisch beim Bearbeiten öffnet.
Mit Hilfe des Rotationscursors
können Sie mit gedrückter Maustaste das Diagramm beliebig drehen. Die gleiche Funktion erfüllen auch die beiden Rädchen.
Weitere Veränderungen können wieder über den Diagramm-Manager vorgenommen werden.
Um die Beschriftung der Balken übersichtlicher zu gestalten, können beispielsweise über Balken | Optionen für Balken | Beschriftung die Werte und die Prozentangaben an das obere Ende des jeweiligen Balken geschrieben werden.
Vergleich mehrerer Variablen
Wenn Sie mehrere Variablen miteinander vergleichen möchten, z.B. die Variablen einstieg
und gehalt wählen Sie aus dem Menü:
Grafik | Interaktiv | Balken
Mit Hilfe Strg-Taste (Ctrl) wählen Sie gleichzeitig alle Variablen aus, die Sie miteinander
vergleichen möchten.
Interaktive Diagramme
80
Ziehen Sie nun die aktivierten Variablen miteinander in die Kategorienachse. Es öffnet sich
ein Dialog, der ermöglicht, die Beschriftungen der zu erstellenden Grafik zu definieren. Geben Sie im Feld Werte „Mittelwerte“ und im Feld Kategorien „Vergleich“ ein.
Klicken Sie auf OK, um auf den ursprünglichen Diaolog zurückzukehren, der nun folgendermassen aussieht:
Interaktive Diagramme
81
Standardmässig werden die Mittelwerte der zu vergleichenden Variablen dargestellt. Es können aber auch andere Statistiken ausgewählt werden. Durch Klicken auf OK wird nun die
Grafik erstellt.
Balken zeigen Mittelwerte
Mittelwerte
30000
20000
10000
0
Einstiegsgehalt
jetziges Gehalt
Vergleich
Interaktive Diagramme
Übung:
Versuchen Sie mit Hilfe eines Balkendiagrammes den Zusammenhang
zwischen Einstiegsgehalt und jetzigem Gehalt für beide Geschlechter
darzustellen.
Wichtige Begriffe aus diesem Kapitel
ü Interaktives Bearbeiten
ü Diagramm-Manager
ü 3D-Rotation
82
Fälle auswählen
10
83
Fälle auswählen
Inhalt
Ø
Ø
Ø
Ø
Auswählen von Teilmengen aus dem Datenbestand
Erstellen der Filterbedingungen
Selektionen speichern
Anwendung einer bestehenden Filtervariablen
Oft soll sich eine Auswertung nicht auf die gesamte Datendatei, sondern nur auf eine Te ilmenge der erfaßten Fälle beziehen. So möchte man beispielsweise eine bestimmte Auswertung nur für die weiblichen Angestellten machen oder nur für Mitarbeiter, die bereits mehr als
drei Jahre angestellt sind. Manchmal wünscht man sich auch eine zufällige Auswahl aus dem
Datensatz. SPSS bietet Ihnen verschiedene Möglichkeiten, Fälle auszuwählen. Verwenden Sie
dazu den Menüpunkt
Daten | Fälle auswählen
Im Dialogfeld markieren Sie unter Auswählen die Option ¤Falls Bedingung zutrifft und unter
Nicht ausgewählte Fälle die Option ¤Filtern. Klicken Sie dann auf die Schaltfläche Falls....
Im Dialogfeld Fälle auswählen: Falls wird die Bedingung eingegeben, nach der die Fallauswahl erfolgen soll. Wir wählen alle Trainees, die älter als 28 Jahre sind. Das bedeutet
beruf = 1 & alter > 28.
Fälle auswählen
84
Um die entsprechende Kodierung für die Trainees in der Variablen beruf zu erhalten, klicken Sie in der Variablenliste des Dialogfensters mit der rechten Maustaste auf diese Variable. Hier wählen Sie die Option Info zu Variable und es erscheint ein Fenster, daß Sie über die
Labels der Werte und der Variablen informiert.
Übertragen Sie die Variable beruf in das Formelfeld, wählen Sie dann auf dem Tasche nrechner des Dialogfeldes oder von der Tastatur = und geben Sie 1 ein. Um diese Bedingung
mit einer weiteren zu kombinieren, klicken Sie auf & und übertragen Sie die Variable alter,
klicken Sie dann auf > und geben Sie 28 ein. Bei String-Variablen müssen die Werte zw ischen Anführungs- und Schlusszeichen geschrieben werden, z.B. geschl = "m".
SPSS erzeugt eine Filtervariable mit Namen filter_$, die angibt, welche Fälle die Filterbedingung erfüllen und für weitere Analysen herangezogen werden. Außerdem wird die Fallnummer der nicht ausgewählten Fälle durchgestrichen und in der Statuszeile wird angezeigt,
daß ein Filter aktiv ist.
Fälle auswählen
85
Sie können die Fallauswahl jederzeit wieder rückgängig machen, indem Sie im Dialogfeld
Fälle auswählen die Option ¤Alle Fälle markieren.
Wenn Sie eine Filtervariable speichern möchten, empfiehlt es sich, den Namen der Variablen
zu ändern. Sobald Sie das Datenblatt abspeichern, wird auch die Filtervariable gespeichert.
Bereits vorhandene Filtervariablen können unter
Daten | Fälle auswählen
¤Filtervariable verwenden wieder aktiviert werden.
Beim Arbeiten mit den logischen Operatoren & (und) und | (oder) ist darauf zu achten, daß &
stärker bindet als |, d.h. zum Teil sind Klammern erforderlich.
Falls Sie die nicht ausgewählten Fälle nicht mehr benötigen, wählen Sie im Dialogfeld Nicht
ausgewählte Fälle statt ¤Filtern die Alternative ¤Löschen. Beachten Sie dabei aber, daß diese
Fälle verloren gehen, sobald das Datenblatt unter dem gleichen Dateinamen abgespeichert
wird.
Diese allgemeine Fallauswahl gilt nicht für Datentransformationen (berechnen und umkodieren). Hier muß man gegebenenfalls die Auswahlregeln gesondert angeben.
Fälle auswählen
Übung
1. Wählen Sie für die weitere Analyse alle männlichen Mitarbeiter
aus, die noch nicht ihren 30. Geburtstag gefeiert haben oder mehr
als $ 28000 verdienen.
2. Geben Sie die Anzahl der ausgewählt en Fälle an.
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
ü
Filter
Infos zu Variablen anzeigen
Speichern
Löschen
Logische Operatoren
86
Daten aufteilen
11
87
Daten aufteilen
Inhalt
Ø Statistiken und Grafiken für jede Gruppe einer kategorialen Variablen
wiederholen
Ø Ausgaben nach Kategorien sortieren
Ø Ergebnisse der einzelnen Gruppen zusammen ausgeben
Wie kann ich mehrere Analysen jeweils getrennt für verschiedene Ausprägungen einer Variablen ausführen, ohne dieselben Befehle immer wieder einzugeben?
Sie wollen z.B. jeweils für die Kunden der Regionen Nord, Ost, Süd und West getrennt wissen, was sie kaufen und wie hoch das durchschnittliche Alter ist. Statt für jede einzelne Region einen Filter zu verwenden und jedes Mal die Ausgaben aufzurufen, können Sie den Datensatz für die Analyse aufteilen.
Dieser Vorgang ist vergleichbar mit einer virtuellen Zerlegung der Daten in mehrere Teildatensätze. Bei jedem Aufruf von Statistiken und Grafiken werden dann für jeden Teildatensatz
jeweils die entsprechenden Ausgaben erzeugt.
Beispielsweise wollen Sie das Gehalt gehalt für die verschiedenen Ausprägungen der Variablen edgeschl getrennt analysieren. Dafür wählen Sie
Daten | Datei aufteilen
Wählen Sie im erscheinenden Dialog die Option ¤Ausgabe nach Gruppen aufteilen und
übernehmen die Variable edgeschl in das Feld Gruppen basierend auf.
Daten aufteilen
88
Um eine Aufteilung vorzunehmen, muß die Datei nach der/den Gruppenvariablen sortiert
sein. Ist dieses schon der Fall, so können Sie das im Dialogfeld angeben. Ansonsten übernehmen Sie einfach die Voreinstellung.
Zusätzlich haben Sie hier noch die Auswahl, ob die Statistiken für alle Gruppen der Gruppenvariablen in der Ausgabe zusammen dargestellt werden sollen oder für jede Gruppe ein eigener Ausgabeblock zu erstellen ist. Im ersten Fall werden die Statistiken zusammen ausgegeben, im zweiten Fall wird die Ausgabe nach den Kategorien sortiert.
Gruppen vergleichen
Ausgabe nach Gruppen aufteilen
Nach Anklicken von OK wird in der Statuszeile am unteren rechten Rand des Dateneditors
die Meldung Datei aufteilen an angezeigt. Nun wird jedes beliebige Verfahren für jede Ausprägung der Variablen edgeschl separat ausgeführt.
Daten aufteilen
89
Übung
1. Berechnen Sie für die verschiedenen Berufskategorien das durchschnittliche Gehalt und das durchschnittliche Alter.
2. Lassen Sie sich für die einzelnen Berufskategorien Kreisdiagramme der Variablen edgeschl ausgeben.
3. Auf welche Weise kommen Sie zu denselben Ergebnissen wie in
Übung 1 und 2, falls Sie keine Aufteilung wählen würden?
Wichtige Begriffe aus diesem Kapitel:
ü
ü
ü
ü
Aufteilung
Alle Fälle analysieren
Gruppen vergleichen
Ausgabe nach Gruppen aufteilen
Werte umkodieren
12
90
Werte umkodieren
Inhalt
Ø Ändern der Kodierung einer Variablen
Ø Bereiche von kontinuierlichen Variablen gruppieren
Die Variable gehalt ist eine kontinuierliche Variable, welche die Werte für das aktuelle
Einkommen enthält. Wenn Sie Einkommensklassen bzw. Kategorien bilden wollen, können
Sie diese Klassen ganz einfach durch Umkodieren der gegebenen Werte erzeugen. So könnte
man beispielsweise vier Gehaltsklassen bilden, die fo lgende Grenzen haben:
Minimum bis 24000
->
Gehaltsklasse 1
24001 bis 29000
->
Gehaltsklasse 2
29001 bis 38000
->
Gehaltsklasse 3
38001 bis Maximum
->
Gehaltsklasse 4
Wählen Sie aus dem Menü
Transformieren | Umkodieren | In andere Variablen.
Im Dialogfeld Umkodieren in andere Variablen markieren Sie in der Variablenliste die Variable gehalt und übertragen sie in das Feld Eingabevar. -> Ausgabevar.. Als Namen
der Ausgabevariablen geben Sie gehkl an und klicken dann auf Ändern.
Anschließend klicken Sie auf die Schaltfläche Alte und neue Werte, um die Wertebereiche
für das Umkodieren festzulegen.
Im Dialo gfeld Umkodieren in andere Variablen: Alte und neue Werte klicken Sie im Feld
Alte Werte die Option ¤Bereich: Niedrigster bis an und geben Sie die Zahl 9000 ein. Im
Werte umkodieren
91
Feld Neuer Wert klicken Sie den Punkt ¤Wert an und geben eine 1 ein. Entsprechend der
Abbildung unten nehmen Sie die weiteren Wertzuweisungen vor. Bei den Wertzuweisungen
ist darauf zu achten, dass bei den Definitionen der Bereiche weder Löcher noch Überschne idungen auftreten. Sollten Überschneidungen auftreten weist SPSS den betroffen Werten die
erste mögliche Umkodierung der Liste Alt--> Neu zu und übergeht die weiteren. Klicken Sie
nun auf Weiter.
Die Variable gehkl, die die neuen Kodierungen enthält, erscheint sofort am rechten Rand des
Daten-Editors. Es ist nun sinnvoll Wertelabels für die Variable gehkl zu definieren, um bei
weiteren Analysen die Bedeutung der Ausprägungen 1 bis 4 angezeigt zu bekommen (siehe
Variablendefinition).
Vergessen Sie nicht die neue Variable abzuspeichern, damit sie zur späteren Verwendung
verwendet werden kann.
Werte umkodieren
Übung
Die Berufskategorien sollen in einer neuen Variablen anders gestaltet
werden:
1. Die Berufsgruppen der Trainees, die Bürokräfte und die Sachbearbeiter gehören zusammen in die neue Gruppe „tarifliche“.
2. Fachkräfte und leitende Angestellte sind in eine neue Gruppe
„aussertarifliche“ zusammenzufassen.
3. Mitarbeiter aus dem Sicherheitsdienst soll der Missing-Wert zugewiesen werden.
Wichtige Begriffe aus diesem Kapitel
ü Kategorien
ü Alte und neue Werte
ü Umkodieren
92
Werte berechnen
13
93
Werte berechnen
Inhalt
Ø Erstellung von neuen Variablen zur weiteren Verwendung
Ø Arbeiten mit den Funktionen zur Berechnung von Variablen
Ø Hilfefunktionen
Manchmal ist es nötig, für Auswertungen Variablen zu erzeugen und zu verändern, um zu den
gewünschten Ergebnissen zu gelangen. SPSS bietet Ihnen die Möglichkeit, mit Hilfe von Rechenoperationen, verschiedener Funktionen und bestehender Variablen neue Variablen zu
berechnen.
Wünschen Sie sich zum Beispiel, eine Auswertung über die monatlichen Gehälter der Mitarbeiter zu erstellen, so müssen Sie diese zuerst aus der Variablen gehalt, in der das Jahresgehalt des Mitarbeiters gespeichert ist, berechnen. Wählen Sie dazu
Transformieren | Berechnen.
Im Dialogfeld Variable berechnen tippen Sie als Namen für die Zielvariable geh_mon ein.
Das Monatsgehalt errechnet sich aus dem Jahresgehalt mit der Rechenoperation geh_mon =
gehalt / 12. Übernehmen Sie die Variable gehalt in das Feld Numerischer Ausdruck
und ergänzen Sie den Ausdruck durch Eingabe von / 12 über die Tastatur oder mit Hilfe der
Maus.
Klicken Sie nun auf die Schaltfläche OK. Die neue Variable geh_mon wird ganz rechts an
Ihre Datendatei angehängt. Sie enthält für jeden Angestellten das Monatsgehalt.
Werte berechnen
94
Falls Sie die Berechnung der neuen Variablen nur für ausge wählte Fälle durchführen möchten, klicken Sie auf die Schaltfläche Falls. Im Dialogfeld Variable berechnen: Falls Bedingung
erfüllt ist können Sie nun wie bei der allgemeinen Fallauswahl eine Bedingung eingeben.
Für Fälle, die die Bedingung nicht erfüllen, wird kein Wert berechnet. Wenn die Zielvariable
eine neue Variable ist, erhalten diese Fälle das System Missing. Falls die Zielvariable eine
bereits vorhandene Variable ist, behalten diese Fälle ihren ursprünglichen Wert.
Achtung: Die Verwendung des Filters aus Daten | Fälle auswählen hat keinen Einfluß auf die
Berechnung und Erstellung von neuen Variablen.
Bei der Berechnung können Sie auf über siebzig Funktionen zugreifen. In der Funktionenliste
sind arithmetische, statistische und logische Funktionen, Konvertierungs-, Aggregations-, und
Extraktionsfunktionen für Datums- und Zeitangaben, Funktionen für Missing-Werte, Funktionen für den Zugriff auf andere Fälle sowie Funktionen für alphanumerische Variablen enthalten.
Eine kurze Beschreibung erhalten Sie, indem Sie mit der rechten Maustaste auf die Funktion
klicken, die Sie verwenden möchten. Wenn Sie z.B. auf XDATE.YEAR(datum) klicken, erha lten Sie folgende Beschreibung:
Für ausführlichere Hilfe zu den Funktionen klichken Sie auf die Schaltfläche Hilfe. Dadurch
rufen Sie das Hilfefenster zur Berechnung neuer Variablen auf.
Klicken Sie nun auf die Schaltfläche Siehe auch und wählen Sie im Dialogfeld Gefundene
Themen die Möglichkeit Funktionen aus.
Werte berechnen
95
Durch Anklicken des Begriffs Siehe auch wird ein weiteres Hilfefenster geöffnet, in dem
sämtliche Funktionen beschrieben werden.
Werte berechnen
96
Übung
Berechnen Sie für alle Bankmitarbeiter in einer neuen Variablen einen
Bonus. Der Bonus soll ein Zehntel des aktuellen Monatsgehalts (gehalt / 12) ausmachen und jeden Monat gezahlt werden. Berechnen
Sie dann das durch den Bonus erhöhte Jahresgehalt inklusive einem
zusätzlichen 13. Monatsgehalts (inklusive des Bonus).
Wichtige Begriffe aus diesem Kapitel:
ü
ü
ü
ü
ü
Berechnen
Zielvariable
Funktion
Bedingte Berechnung
Interaktive
Hilfe
Daten aggregieren
14
97
Daten aggregieren
Inhalt
Ø
Ø
Ø
Daten in einer neuen Datei verdichten
Wahl der Aggregationsfunktion
Profildiagramm erstellen
Durch das Aggregieren (Zusammenfassen) von Daten bezüglich einer Gruppenvariablen erhalten Sie eine neue Datei mit ausgewählten Statistiken zu den jeweiligen Gruppen. Diese
Daten können Sie für weitere Analysen oder spezielle Grafiken (z.B. Profildiagramme) ve rwenden.
Um Fälle zu aggregieren, wählen Sie als Datendatei prof_dat.sav. In dieser Datei finden
Sie die Ergebnisse einer Befragung. Die befragten Personen wurden gebeten, Benzinmarken
hinsichtlich bestimmter Eigenschaften zu bewerten.
Wählen Sie aus dem Menü
Daten | Aggregieren
Hier übernehmen Sie die Variable marke als 8Break-Variable und alle anderen Variablen in
das Feld 8Aggregierungsvariable(n). Statt der voreingestellten Funktion MEAN (Mittelwert)
können Sie im Unterdialogfeld Funktion auch andere zusammenfassende Statistiken auswählen.
Daten aggregieren
98
Wenn Sie eine Variable nach mehreren Statistiken aggregieren wollen, so übernehmen Sie
diese Variable mehrmals als Aggregierungsvariable und weisen nacheinander den neuen Variablen die gewünschten Statistiken zu.
Um einer Aggregierungsvariablen einen neuen Namen und ein Label zuzuweisen, klicken Sie
auf die Schaltfläche Name & Label und tragen dann Namen und Label in die entsprechenden
Felder ein.
Um die Aggregationsdatei unter dem Namen aggmarke.sav abzuspeichern, klicken Sie auf
die Schaltfläche Datei.. Im Dialogfeld Daten aggregieren: Ausgabedatei ändern Sie den Dateinamen für die Ergebnisdatei zu aggmarke.sav und klicken OK.
Nun haben Sie eine neue Datendatei mit dem Namen aggmarke.sav erstellt. Laden Sie diese Datei über den Befehl
Datei | Öffnen
ins Datenfenster.
Daten aggregieren
99
Sie enthält für jede Marke die durchschnittlichen Werte der einzelnen Eige nschaften.
Erzeugung von Profilen
Verschiedene statistische Kennzahlen (z.B. der Mittelwert jeder Variablen) sollen getrennt
nach Untergruppen berechnet werden, und in einem Diagramm so dargestellt werden, daß die
zu einer Untergruppe gehörigen Werte durch eine Linie verbunden sind. Dies nennt man das
Profil der Gruppe.
Laden Sie zuerst die Datei aggmarke.sav in den Daten-Editor. Wählen Sie nun aus dem
Menü
Grafik | Linien | Mehrfach.
Im Dialogfeld Liniendiagramme ändern Sie die Voreinstellungen auf ¤Werte einzelner Fälle
und klicken das Piktogramm für Mehrfach an. Dann gelangen Sie über Definieren in das Dialogfeld.
Daten aggregieren
100
Im Dialogfeld Mehrfache Linien: Werte einzelner Fälle übernehmen Sie die Variablen sicher_1 bis fremd_1 in das Feld 8Linien entsprechen, klicken Sie in dem Feld Achsenbeschriftung den Punkt ¤Variable an und übernehmen die Variable marke in das entsprechende Feld.
Dadurch wird eine Grafik mit je einer Linie pro Funktion erzeugt. Diese Grafik muß nun im
Grafik-Editor nachbearbeitet werden. Klicken Sie dafür im Ausgabe-Navigator doppelt auf
die Grafik.
Wählen Sie im Grafik-Editor aus dem Menü
DatenreihenDaten transponieren.
Dadurch entsteht ein Profil, in dem die Werte jeder Gruppe durch eine Linie verbunden sind.
Im Grafik-Editor wählen Sie aus die Schaltfläche
Achsen vertauschen
und Sie erhalten das folgende Profil.
Daten aggregieren
101
Auch hier können Sie wieder mit einigen Schritten die Grafik aufbereiten.
Marken-Profil
aggressiv
billig
fortschrittlich
fremdartig
Marke
modisch
FANAL
sicher
JET
umweltfreundlich
SHELL
1
2
3
4
5
6
7
Daten aggregieren
Übung
Erzeugen Sie aus den Bankdaten (bank_de.sav) eine Datei, die für jede
Berufsgruppe (beruf) folgende Informationen enthält:
1.
2.
3.
4.
Durchschnittliches Einstiegsgehalt
Prozent der Mitarbeiter mit einem Einstiegsgehalt über $ 10.000,00
Durchschnittliches aktuelles Gehalt
Prozent der Mitarbeiter mit einem aktuellen Gehalt über $ 10.000,00
Speichern Sie die Aggregationsdatei unter dem Namen aggbank.sav ab.
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
ü
ü
ü
ü
Break-Variable
Aggregieren
Aggregierungsfunktion
Label
Profil
Datenreihen
Transponieren
Achsen vertauschen
102
Dateien zusammenfügen
15
103
Dateien zusammenfügen
Inhalt
Ø Hinzufügen von neuen Fällen zu einer Datei
Ø Verbinden zweier Dateien anhand von Schlüsselvariablen
Ø Neue Variablen aus einer anderen Datei anfügen
Mit SPSS für Windows können Sie zwei Dateien auf unterschiedliche Weise zusammenfügen.
Welche Methode Sie verwenden, hängt von den gegebenen Daten ab.
§
§
Wenn die Dateien dieselben Variablen, aber unterschiedliche Fälle enthalten, dann fügen Sie Fälle hinzu.
Wenn die Dateien dieselben Fälle, aber unterschiedliche
Variablen enthalten, dann fügen Sie Variablen hinzu.
Dateien mit unterschiedlichen Fällen zusammenzuführen
Um die Dateien add1.sav und add2.sav zusammenzufügen, laden Sie die erste Datei in
den Daten-Editor und wählen aus den Menüs
Daten | Dateien zusammenfügen | Fälle hinzufügen.
Im Dialogfeld Datei lesen wählen Sie die zweite Datei add2.sav und klicken auf Öffnen.
Alle Variablen, die in beiden Dateien vorkommen erscheinen im Feld Variablen in der neuen
Arbeitsdatei. Variablen, die nur in einer der beiden Dateien vorkommen, erscheinen im Feld
Dateien zusammenfügen
104
Nicht gepaarte Variablen. Sie können auch diese Variablen in die neue Datei aufnehmen, indem Sie die gewünschte Variable markieren und in die andere Liste übertragen.
Kreuzen Sie auch aDatei-Indikator speichern in Variable an. Damit wird die neue Datendatei
um eine Variable mit dem Namen Quelle01 ergänzt, die den Ursprung der Daten angibt.
Zusammenführen einer Datei mit einer Schlüsseltabelle
Es kann vorkommen, daß die beiden Dateien, die zusammengefügt werden sollen, eine unterschiedliche Struktur haben. Eine Datei enthält Fälle, die durch eine Schlüsselvariable gruppiert sind, d.h. die Werte der Schlüsselvariablen können mehrfach vorkommen. Die andere
Datei ist eine sogenannte Schlüsseltabelle, d.h. sie enthält zu jedem Wert der Schlüsselvariablen nur einen Eintrag. In der Schlüsseltabelle können auch Werte enthalten sein, die in der
anderen Datei nicht vorkommen.
Beim Zusammenfügen der beiden Dateien soll die Information aus der Schlüsseltabelle zu
jedem Fall mit dem entsprechenden Wert der Schlüsselvariablen hinzugefügt werden. Die
Schlüsseltabelle soll keine neuen Fälle liefern.
Kunden
Bestellungen
Wir möchten im folgenden den Bestelldaten aus der Datei bestellungen.sav die Kundendaten der Datei kunden.sav hinzufügen. Die Datei kunden.sav enthält die Schlüsseltabelle, d.h. jeder Fall entspricht einem einzigen Kunden. Als Schlüsselvariable verwenden wir
die Variable kundenid, die in beiden Dateien vorhanden ist. Öffnen Sie als erstes die die
Datei bestellungen.sav und wählen das Menü
Daten | Dateien zusammenfügen | Variablen hinzufügen.
Im Dialogfeld Datei lesen wählen Sie kunden.sav und klicken auf Öffnen.
Dateien zusammenfügen
105
Aktivieren Sie das Kästchen Fälle mittels Schlüsselvariablen verbinden und wählen Sie die
Option ¤Externe Datei ist Schlüsseltabelle und die Variable kundenid als Schlüsselvariable.
Klicken Sie auf OK. Es erscheint eine Warnung, die darauf hinweist, dass für ein erfolgreiches Zusammenfügen beide Dateien vorgängig nach der Schlüsselvariable sortiert sein müssen.
Dies ist bei den verwendeten Dateien der Fall. Wir können die Warnung mit OK bestätigen.
Die Dateien werden nun über die Schlüsselvariable zusammengefügt.
Dateien zusammenfügen
106
Dateien mit unterschiedlichen Variablen zusammenzufügen
Um die Dateien match1.sav und match2.sav zusammenzufügen, laden Sie die erste Datei in den Daten-Editor und wählen aus den Menüs
Daten | Dateien zusammenfügen | Variablen hinzufügen.
Im Dialogfeld Datei lesen wählen Sie match2.sav und klicken auf Öffnen.
Das Feld Neue Arbeitsdatei enthält alle Variablen der aktuellen Arbeitsdatei und aus der
zweiten Datei alle Variablen, die nicht bereits in der Arbeitsdatei enthalten sind. Das Feld
Ausgeschlossene Variablen enthält die Variablen aus der zweiten Datei, deren Variablennamen bereits in der Arbeitsdatei vorkommen.
Wenn Sie keine weiteren Angaben machen, werden die Fälle aus den beiden Dateien zeilenweise zusammengefügt, so wie sie in den jeweiligen Dateien stehen. In der Regel werden die
Fälle jedoch durch eine (oder mehrere) Schlüsselvariable(n) identifiziert, die auch das Verbinden der Fälle steuern soll. Hier ist das die Variable kdnr.
Wählen Sie die Option aFälle mittels Schlüsselvariablen verbinden und markieren Sie die
Variable kdnr in der Liste Ausgeschlossene Variablen. Da die Schlüsselvariable in beiden
Dateien vorkommen muss, ist sie in dieser Liste enthalten. Übertragen Sie nun die Variable
knr in das Feld 8Schlüsselvariablen.
Achten Sie darauf, dass die Option ¤Beide Dateien liefern Fälle gewählt ist. Dadurch ist gewährleistet, dass beide Dateien Fälle zur neuen Arbeitsdatei beisteuern.
Damit das Zusammenfügen der Dateien anhand von Schlüsselvariablen gelingt, ist es erfo rderlich, dass beide Dateien vorher in aufsteigender Reihenfolge der Schlüsselvariablen sortiert sind.
Dateien zusammenfügen
Übung
Ergänzen Sie die Bankdaten um eine Variable, die für jeden Fall (Mitarbeiter/in) angibt, welches durchschnittliche Gehalt in seiner Berufsgruppe gezahlt wird.
Tip: Erzeugen Sie eine Datei, die für jede Berufsgruppe das durchschnittliche Gehalt enthält und verbinden Sie die beiden Dateien.
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
Fälle hinzufügen
Variablen hinzufügen
Schlüsselvariable
Schlüsseltabelle
107
Tabellen im Basismodul
16
108
Tabellen im Basismodul
Inhalt
Ø
Ø
Ø
Ø
Ø
Falllisten
Berichte
Auswertung kategorialer Daten
Analyse kontinuierlicher Daten
OLAP-Würfel
Auswertung kategorialer Daten
Die Auswertung kategorialer Variablen erfolgt zumeist mittels Häufigkeitsauszä hlungen,
Balkendiagrammen oder Kreuztabellen. Manchmal ist aber eine andere Darstellung wünschenswert oder die Auflistung einzelner Fälle nötig. Interessiert die Aufteilung von Männern
und Frauen in den einzelnen Berufsgruppen, so wählt man
Analysieren | Berichte | Fälle zusammenfassen
und übernimmt die Variable beruf als 8Variablen und geschl als 8Gruppenvariable(n).
Möchte man alle Fälle in den Gruppen angezeigt bekommen und zusätzlich die Nummer jedes Falles sehen, so wählt man zu den Voreinstellungen auch die Option bFallnummer anzeigen.
Tabellen im Basismodul
109
Bei einer Beschränkung auf die ersten 10 Fälle entsteht folgende Tabelle:
Zusammenfassung von Fällena
Geschlecht
weiblich
Fallnummer
3
1
2
3
4
5
männlich
Insgesamt
Insgesamt
1
Berufsgruppen
Bürokräfte
4
8
Trainee
Bürokräfte
9
10
Fachkräfte
Bürokräfte
N
1
5
Sachbearbeiter
2
3
2
5
Fachkräfte
Fachkräfte
4
5
6
7
Fachkräfte
Fachkräfte
Insgesamt
N
N
5
10
a. Begrenzt auf die ersten 10 Fälle.
Möchte man nicht alle Fälle angezeigt bekommen, deaktiviert man das Kontrollfeld bFälle
anzeigen. Folgende Ausgabe entsteht:
Tabellen im Basismodul
110
Zusammenfassung von Fällen
N
Geschlecht
weiblich
männlich
Berufsgruppen
216
258
Insgesamt
474
Im Unterdialogfeld Optionen kann man den Titel der Tabelle ändern, eine Beschriftung hinzufügen und über die fehlenden Werte entsche iden.
Interessant für kategoriale Variablen sind vor allem Tabellen mit me hreren Gruppenvariablen.
Übernehmen Sie in das Dialogfeld zusätzlich zu geschl noch die Variablen minder als
Gruppenvariable. Die Tabelle sieht dann fo lgendermaßen aus:
Fallauswertungen
N
Geschlecht
weiblich
männlich
Insgesamt
Angehöriger
einer Minderheit
nein
Berufsgruppen
176
ja
Insgesamt
38
214
nein
ja
191
63
Insgesamt
nein
254
367
ja
Insgesamt
101
468
Analyse kontinuierlicher Daten
Um Aufschluß über kontinuierliche Variablen zu bekommen, lassen sich deskriptive, zusammenfassende statistische Maßzahlen verwenden. Wählen Sie aus dem Menü
Tabellen im Basismodul
111
Analysieren | Berichte | Fälle zusammenfassen
und übertragen die Variablen gehalt, einstieg und alter. Als gruppierende Variable
verwenden wir beruf. Deaktivieren Sie die Voreinstellung bFälle anzeigen.
Im Unterdialogfeld Statistik ist die Anzahl der Fälle voreingestellt. Sollen weitere zusammenfassende Statistiken ausgegeben werden, so wählt man beliebig aus der vorgegebenen Liste
aus.
Wählen Sie die Anzahl der Fälle, Mittelwert, Median, Standardabweichung, Minimum und
Maximum aus. Man erhält folgendes Ergebnis (Auswahl):
Tabellen im Basismodul
112
Fallauswertungen
Berufsgruppen
Trainee
N
Mittelwert
Median
Standardabweichung
Minimum
Maximum
Bürokräfte
N
Mittelwert
Median
Standardabweichung
Minimum
Maximum
Sicherheitsdienst
N
Mittelwert
Median
Standardabweichung
Minimum
Maximum
Sachbearbeiter
N
Mittelwert
Median
Standardabweichung
Minimum
Maximum
Fachkräfte
N
Mittelwert
Median
Standardabweichung
Minimum
Maximum
leitende Angestellte N
Mittelwert
Median
Standardabweichung
Minimum
Maximum
Insgesamt
N
Mittelwert
Median
Standardabweichung
Minimum
Maximum
jetziges Gehalt
40
22316.25
21900.00
4140.999
15750
31350
176
25276.19
24525.00
4893.182
16200
42300
27
30938.89
30750.00
2114.616
24300
35250
79
62466.90
60000.00
16083.867
34410
103750
147
32409.05
31050.00
8451.479
18750
80000
5
87850.00
69250.00
33244.290
59375
135000
474
34419.57
28875.00
17075.661
15750
135000
Einstiegsgehalt
40
12303.75
12000.00
2295.184
9750
18750
176
13013.38
12750.00
2176.868
9000
19980
27
15077.78
15750.00
1341.235
9000
15750
79
29198.73
27510.00
8234.013
15750
60000
147
15880.00
15750.00
2893.999
9000
31980
5
46992.00
42480.00
19309.068
30000
79980
474
17016.09
15000.00
7870.638
9000
79980
Alter
40
46.52
50.00
14.002
22
63
176
34.12
28.00
12.561
21
63
27
50.59
52.00
9.532
31
63
79
32.87
31.00
5.816
26
51
146
33.05
29.00
9.077
23
62
5
43.40
42.00
8.295
34
55
473
35.67
30.00
11.784
21
63
Auch die Tabellen der Funktion Fälle zusammenfassen sind Pivot-Tabellen und lassen sich
mit Hilfe des Tabellen-Editors editieren, formatieren und pivotieren.
Tabellen im Basismodul
113
OLAP-Würfel
Flexible Berichte werden zur Analyse von Daten immer wichtiger. SPSS trägt dieser Entwicklung Rechnung. Ab Version 8 gibt es zusätzlich zur Option Fälle zusammenfassen noch
den sogenannten gegliederten (oder auch geschichteten) Bericht.
Wählen Sie aus dem Menü
Analysieren | Berichte | OLAP-Würfel
und übertragen die Variablen gehalt, einstieg und alter. Als gruppierende Variable
verwenden wir wieder beruf und geschl.
Im Unterdialogfeld Statistik sind bereits verschiedene Statistiken voreingestellt. Sollen weitere zusammenfassende Statistiken ausgegeben werden, so wählt man beliebig aus der vorgegebenen Liste aus.
Tabellen im Basismodul
114
Mit dem Unterdialogfeld Differenzen können Sie prozentuale und arithmetische Differenzen
zwischen Auswertungsvariablen oder zwischen Gruppen, die durch eine Gruppenvariable
definiert sind, berechnen lassen. Die Differenzen werden für alle Maße berechnet, die im Dialogfeld "OLAP-Würfel: Statistiken" ausgewählt wurden.
Es gibt zwei Möglichkeiten, die berechnet werden können:
1. Differenzen zwischen den Variablen: Hiermit werden die Differenzen zwischen Variablenpaaren berechnet. Sie müssen mindestens zwei Auswertungsvariablen im Haup tdialogfeld auswählen, bevor Sie die Differenzen zwischen den Variablen angeben
können.
2. Differenzen zwischen Fallgruppen: Hiermit werden die Differenzen zwischen Gruppenpaaren berechnet, die durch eine Gruppenvariable definiert sind. Sie müssen mindestens eine Gruppenvariable im Hauptdialogfeld auswählen, bevor Sie die Differenzen zwischen den Gruppen angeben können.
Wir möchten die arithmetische Differenz zwischen dem aktuellen Gehalt und dem Einstiegsgehalt berechnen lassen. Wählen Sie als folgende Optionen aus und klicken Sie auf den Pfeil
? und dann auf Weiter
Die damit erzeugten Tabellen werden im Viewer zunächst komprimiert dargestellt, so daß für
jede Variable und jede Statistik nur die Gesamtzahl ausgegeben wird. Die gruppierenden Variablen befinden sich noch in den Schichten.
Tabellen im Basismodul
115
OLAP-Würfel
Berufsgruppen: Trainee
Geschlecht: weiblich
jetziges Gehalt
Einstiegsgehalt
Alter
Jetziges Gehalt Einstiegsgehalt
Summe
644250
351600
1451
% der
Gesamts
umme
3.9%
4.4%
8.6%
% der
Gesamta
nzahl
6.3%
6.3%
6.3%
30
30
30
Mittelwert
21475.00
11720.00
48.37
Standardab
weichung
4204.077
2043.729
13.299
0
9755.00
2160.349
-.4%
.0%
% der
Gesamts
umme
2.7%
2.9%
1.3%
% der
Gesamta
nzahl
1.1%
1.1%
1.1%
-.2%
.0%
N
292650
OLAP-Würfel
Berufsgruppen: leitende Angestellte
Geschlecht: Insgesamt
jetziges Gehalt
Einstiegsgehalt
Alter
Jetziges Gehalt Einstiegsgehalt
Summe
439250
234960
217
5
5
5
Mittelwert
87850.00
46992.00
43.40
Standardab
weichung
33244.290
19309.068
8.295
0
40858.00
13935.222
N
204290
Nach Belieben können nun durch Pivotieren der Tabelle interessierende Ansichten erzeugt
werden. So kann man beispielsweise im direkten Vergleich des Gehaltes für die verschiedenen Berufsgruppen und für das Geschlecht, deutlich erkennen, dass die weiblichen Trainees
zwar 6.3% aller Mitarbeiter ausmachen, aber nur 3.9% der Summe des Gehaltes bekommen.
Die durchschnittliche Differenz zwischen dem jetzigen Gehalt zum Einstiegsgehalt beträgt
$9755.00. Die leitenden Angestellten entsprechen 1.1% der Mitarbeiter und erhalten 2.7% des
Gehaltes und die durchschnittliche Differenz zwischen dem jetzigen Gehalt zum Einstiegsgehalt beträgt $40858.00.
OLAP-Würfel
jetziges Gehalt
Berufsgruppen
Trainee
Bürokräfte
Sicherheitsdienst
Sachbearbeiter
Fachkräfte
leitende Angestellte
Insgesamt
Geschlecht
weiblich
männlich
Insgesamt
weiblich
männlich
Insgesamt
männlich
Insgesamt
weiblich
männlich
Insgesamt
weiblich
männlich
Insgesamt
männlich
Insgesamt
weiblich
männlich
Insgesamt
% der
Gesamtsumme
3.9%
1.5%
5.5%
19.0%
8.3%
27.3%
5.1%
5.1%
2.9%
27.4%
30.2%
8.7%
20.5%
29.2%
2.7%
2.7%
34.5%
65.5%
100.0%
% der
Gesamtanzahl
6.3%
2.1%
8.4%
27.0%
10.1%
37.1%
5.7%
5.7%
2.1%
14.6%
16.7%
10.1%
20.9%
31.0%
1.1%
1.1%
45.6%
54.4%
100.0%
Tabellen im Basismodul
116
Um obige Tabelle zu erhalten, muß zunächst die Tabelle zur Bearbeitung geöffnet werden.
Dann legt man mit Hilfe der Pivot-Leiste die Variablen in die Schicht. Das jetzige Gehalt liegt
dabei ganz oben.
Die gruppierenden Variablen beruf und geschl werden in beliebiger Reihenfolge in die
Zeilen gelegt. Die Statistiken stehen in den Spalten.
Um vorübergehend Summe, N, Mittelwert und Standardabweichung auszublenden, markiert
man zunächst die Spaltenköpfe. Dann wird über das Kontextmenü (rechte Maustaste)
Auswählen | Datenzellen und Beschriftungen
angewählt. Damit sind alle Zellen markiert, die ausgeblendet werden sollen. Im Menü
Ansicht | Ausblenden
wählen und die Tabelle reduziert sich auf die gewünschten Spalten.
Sollten Sie die jetzt verborgene Information nochmals benötigen, kann die Tabelle jederzeit
über
Ansicht | Alles einblenden
Tabellen im Basismodul
117
wiederhergestellt werden. Das Gleiche gilt für Variablen, die sich in Schichten befinden. Damit eignen sich Pivot-Tabellen hervorragend, umfangreiche Informationen konzentriert darzustellen.
Sollten bestimmte Tabellenansichten öfter gewünscht werden, kann man sich auch sogenannte Lesezeichen anlegen. Im Menü
Pivot | Lesezeichen
anwählen und einen Namen für die augenblickliche Tabellenansicht vergeben.
Tabellen im Basismodul
Übung
Pivotieren Sie Zeilen und Spalten der obigen Tabelle und legen Sie
ein Lesezeichen an.
Wichtige Begriffe aus diesem Kapitel:
ü
ü
ü
ü
ü
ü
Fälle zusammenfassen
Fälle anzeigen
Statistische Maßzahlen
Gegliederte Berichte
OLAP-Würfel
Schichten
118
Kreuztabellen
17
119
Kreuztabellen
Inhalt
Ø
Ø
Ø
Ø
Häufigkeiten für zwei kategoriale Variablen in einer Tabelle darstellen
Prozente in Kreuztabellen
Gruppiertes Balkendiagramm
Überprüfung auf Zusammenhänge mit dem Chi² -Test
Wenn man Aussagen über den Zusammenhang zwischen zwei kategorialen Variablen
braucht, verwendet man Kreuztabellen. In einer Kreuztabelle wird für jede Kombination von
Merkmalen die Anzahl der Fälle, die beide Merkmale gleichzeitig erfüllen, dargestellt.
Um die Verteilung der Werte in den einzelnen Kategorien miteinander zu vergleichen, ist es
nützlich, zusätzlich zu den Häufigkeiten auch Prozentwerte in die Tabelle aufzunehmen.
Um eine Kreuztabelle zu erzeugen, wählen Sie aus dem Menü
Analysieren | Deskriptive Statistiken | Kreuztabellen.
Im Dialogfeld Kreuztabellen wählen Sie aus der Variablenliste die Variable beruf und übertragen sie in das Feld 8Zeilen. Dann bringen Sie die Variable geschl in das Feld 8Spalten.
Kreuztabellen
120
Klicken Sie dann auf die Schaltfläche Zellen.
Im Dialogfeld Kreuztabellen: Zelleninhalte ist in der Gruppe Häufigkeiten bereits die Option
aBeobachtete, angekreuzt. Klicken Sie auch auf aZeile und aSpalte in der Gruppe Prozentwerte und schließlich auf Weiter und Ok. Die gewünschte Kreuztabelle wird im Ausgabefenster angezeigt.
Berufsgruppen * Geschlecht Kreuztabelle
Berufsgruppen
Trainee
Bürokräfte
Sicherheitsdienst
Sachbearbeiter
Fachkräfte
leitende Angestellte
Gesamt
Anzahl
% von Berufsgruppen
% von Geschlecht
Anzahl
% von Berufsgruppen
% von Geschlecht
Anzahl
% von Berufsgruppen
% von Geschlecht
Anzahl
% von Berufsgruppen
% von Geschlecht
Anzahl
% von Berufsgruppen
% von Geschlecht
Anzahl
% von Berufsgruppen
% von Geschlecht
Anzahl
% von Berufsgruppen
% von Geschlecht
Geschlecht
weiblich
männlich
30
10
75.0%
25.0%
13.9%
3.9%
128
48
72.7%
27.3%
59.3%
18.6%
27
100.0%
10.5%
10
69
12.7%
87.3%
4.6%
26.7%
48
99
32.7%
67.3%
22.2%
38.4%
5
100.0%
1.9%
216
258
45.6%
54.4%
100.0%
100.0%
Gesamt
40
100.0%
8.4%
176
100.0%
37.1%
27
100.0%
5.7%
79
100.0%
16.7%
147
100.0%
31.0%
5
100.0%
1.1%
474
100.0%
100.0%
Am unteren und seitlichen Rand finden Sie die Häufigkeiten der einzelnen Variablen, die sogenannten Randhäufigkeiten. In den mittleren Zellen steht die Anzahl der Personen, die sowohl der jeweiligen Zeilen- und Spaltengruppe angehören.
Hier gibt es einige Auffälligkeiten. Beispielsweise sind die männlichen Angestellten besonders stark in den Berufsgruppen „leitende Angestellte“, „Fachkräfte“ und „Sicherheitsdienst“
vertreten. Ob diese Verteilung der Geschlechter auf die Berufsgruppen zufällig ist, kann Ihnen
ein statistischer Test beantworten.
Kreuztabellen
121
Im Hauptdialogfeld Kreuztabellen erhalten Sie mit der Option aGruppierte Balkendiagramme anzeigen die Informationen der Kreuztabelle grafisch dargestellt. Hier lassen sich wieder
im Diagramm-Editor über
Format | Balkenbeschriftung
die Häufigkeiten in das Diagramm einfügen. Im Unterschied zur tabellarischen Darstellung ist
das Diagramm aber auf eine Statistik beschränkt.
140
128
120
100
99
80
69
60
48
40
48
Anzahl
Geschlecht
20
0
30
27
weiblich
10
10
Trainee
Sicherheitsdienst
Bürokräfte
männlich
Fachkräfte
Sachbearbeiter
leitende Angestellte
Berufsgruppen
Wählen Sie nochmals das Dialogfeld Kreuztabellen und klicken Sie auf die Schaltfläche Statistiken. Im Dialogfeld Kreuztabellen: Statistiken kreuzen Sie aChi-Quadrat an.
Kreuztabellen
122
Nun wird Ihnen das Ergebnis des Chi-Quadrat-Tests auf Unabhängigkeit der beiden Variablen ausgegeben. Die Null-Hypothese dieses Tests lautet: Die beiden Variablen sind unabhänig. Ist das beobachtete Signifikanzniveau (Asymptotische Signifikanz) kleiner als die von
Ihnen vorgegebene Irrtumswahrscheinlichkeit (üblicherweise kleiner als 0,05 oder 0,01), wird
die Hypothese auf Unabhängigkeit der beiden Variablen abgelehnt.
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Anzahl der gültigen Fälle
137.479
156.402
Asymptotisch
e Signifikanz
(2-seitig)
df
a
5
.000
5
.000
474
a. 2 Zellen (16.7%) haben eine erwartete Häufigkeit kleiner 5.
Die minimale erwartete Häufigkeit ist 2.28.
In diesem Beispiel zeigt sich eine hohe Signifikanz für das Vorliegen eines statistischen Zusammenhangs der Variablen beruf und geschl. Das bedeutet, es ist statistisch kein Zufall,
dass Männer häufiger in bestimmten Berufsgruppen beschäftigt waren als Fraue n und umgekehrt.
Wenn Sie für die Interpretation der Ergebnisse Hilfe brauchen, klicken Sie mit der rechten
Maustaste auf die Tabelle und wählen die Option Ergebnis-Assistent.
Kreuztabellen
123
Es öffnet sich der Ergebnis-Assistent, der die Resultate sehr detailliert erklärt und Hinweise
gibt, wie diese zu interpretieren sind. Diese Hilfemöglichkeit besteht für den grössten Teil der
Resultate von SPSS, sowohl für Grafiken wie auch für Tabellen. Bis zur aktue llen Version
von SPSS liefert der Ergebnis-Assistent die Erklärungen jedoch nur auf Englisch.
Kreuztabellen
124
Übung:
1. Geben Sie bitte an, wieviel Prozent der Bürokräfte in der Gehaltsklasse bis $ 24000 liegen.
2. Wieviel Prozent der leitenden Angestellten verdienen über $
38000?
3. Wieviel Prozent der Beschäftigten sind als Trainee tätig und verdienen zwischen $ 24001 und $ 29000 ?
4. Wieviel Prozent der Beschäftigten, die zwischen $ 29001 und $
38000 verdienen, sind im Sicherheitsdienst beschäftigt?
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
ü
ü
ü
Zeilenprozente
Spaltenprozente
Signifikanzniveau
Randhäufigkeiten
Unabhängigkeit
Chi-Quadrat-Test
Ergebnis-Assistent
Tips und Tricks
18
125
Tips und Tricks
Inhalt
Ø
Ø
Ø
Ø
Ø
Ø
Fallnumerierung einfügen
Datum und Zeit einfügen
Mehrfach vorhandene Fälle löschen
Mehrfach vorhandene Fälle löschen
Symbolleisten anpassen
SPSS AnswerNet
Fallnumerierung
Wollen Sie eine Variable erzeugen, die die Fälle fortlaufend durchnumeriert, können Sie die
Systemvariable $casenum verwenden. Berechnen Sie eine Variable fallnum über
Transformieren | Berechnen
indem Sie einfach als numerischen Ausdruck $casenum einsetzen. Die Eingabe muß dabei
über die Tastatur erfo lgen.
$casenum weist jedem Fall die jeweilige Position im Datensatz zu.
Tips und Tricks
126
Datum und Zeit einfügen
Um eine Variable mit dem aktuellen Datum bzw. der aktuellen Zeit zu berechnen können Sie
die Systemvariable $time verwenden. Berechnen Sie eine Variable datzeit über
Transformieren | Berechnen
indem Sie einfach als numerischen Ausdruck $time einsetzen. Die Eingabe muß dabei über
die Tastatur erfolgen.
Es wird eine neue numerische Variable datum erstellt. Die Werte entsprechen den Anzahl
Sekunden, die seit Beginn des Gregorianischen Kalenders bis zum aktuellen Datum verga ngen sind. Um die Variable im gewohnten Datumsformat darzustellen, wechseln Sie im DatenEditor in die Variablenansicht und ändern den Variablentyp auf das gewünschte Datumsbzw. Zeitformat.
Mehrfach vorhandene Fälle
Es kommt in der Praxis häufig vor, dass Daten von Kunden, Patienten, usw. doppelt vorha nden sind, insbesondere wenn sie von fremden Datenquellen eingelesen werden. Bevor wir mit
der Analyse beginnen können, möchten wir die mehrfach vorhandenen Fälle identifizieren
und evtl. auch entfernen.
Tips und Tricks
127
Wir verwenden die Standardfunktion LAG(), um mehrfach vorhandene Fälle zu kennzeichnen. LAG() gibt den Wert für den jeweils vorherigen Fall in der Datendatei zurück. Für den
ersten Fall in der Datei wird dabei bei numerischen Variablen ein systemdefinierter fehlender
und bei String- Variablen ein leerer Wert angezeigt.
Öffnen Sie Datei match.sav. Wir sehen, dass die Informationen für den Kunden mit Kundennummer 1003 doppelt vorhanden ist. Wir verwenden die Variable kdnr zur Identifizierung der mehrfach vorhandenen Fälle. Zuerst müssen die Fälle nach dieser Variable zu sortiert werden. Wählen Sie das Menü
Daten | Fälle sortieren
und wählen Sie die Variable kdnr zur Sortierung aus.
Um nun die mehrfach vorha ndenen Fälle zu markieren wählen Sie das Menü
Transformieren | Berechnen
Als Zielvariable geben Sie doppelt ein. Wir möchten alle Fälle kennzeichnen, die für den
vorherigen Fall der Variable kdnr denselben Wert haben. Wir erreichen dies mit der Formel:
doppelt = lag(kdnr ) = kdnr. Aus der Liste der Funktionen wählen Sie die Funktion
lag(variable) aus und verwenden Sie die Variable kdnr.
Tips und Tricks
128
Klicken Sie auf OK. Die neue Variable doppelt hat den Wert 1 für Fälle, die zwei oder
mehrfach vorkommen und den Wert 0 für alle die nur einmal vorkommen. Der erste Fall hat
einen systemdefinierten fehlenden Wert erhalten.
Um nun die doppelt oder mehrfach vorkommenden Fälle zu entfernen, wählen Sie das Menü
Daten | Fälle auswählen...
Wählen Sie die Option Falls Bedingung zutrifft und definieren Sie die Bedingung. Es sollen
alle Fälle behalten werden, die nicht doppelt vorkommen, d.h. alle Fälle, die für die Variable
doppelt den Wert 0 haben. Damit auch der erste Fall erhalten bleibt, müssen wir auch die
systemdefiniert fehlenden Werte in der Seletion berücksichtigen. Dies erreichen wir mit der
Funktion SYSMIS(). Die Bedingung sieht also so aus:
Klicken Sie auf Weiter. Um die doppelt oder mehrfach vorkommenden Fälle definitiv zu
entfernen, lassen wir die nicht ausgewählten Fälle löschen.
Tips und Tricks
129
Durch das Klicken auf OK erhalten wir die bereinigten Daten, ohne die mehrfach vorhandenen Fälle.
Befehlssyntax
Auf die meisten SPSS-Befehle können Sie über die Menüs und Dialogfelder zugreifen. Einige
Befehle und Optionen sind aber nur in der SPSS-Befehlssprache verfügbar. Mit der Befehlssprache verfügen Sie ausserdem über die Möglichkeit, Jobs in einer Syntaxdatei zu speichern.
Sie können eine Analyse dann zu einem späteren Zeitpunkt wiederholen oder diese automatisch mit dem Produktionsmodus ausführen lassen.
Eine Syntaxdatei ist eine einfache Textdatei, die SPSS-Befehle enthält. Es ist zwar möglich,
ein Syntaxfenster zu öffnen und Befehle einzugeben. Mit den folgenden Funktionen kann
SPSS Sie jedoch beim Erstellen einer Syntaxdatei unterstützen:
•
Einfügen von Syntaxbefehlen aus Dialogfeldern
•
Kopieren der Syntax aus dem Ausgabe-Log
•
Kopieren der Syntax aus der Journaldatei.
Am einfachsten erstellen Sie eine Befehlssyntax-Datei, indem Sie die entsprechenden Optionen in einem SPSS-Dialogfeld aus wählen und die Syntax für diese Auswahl in ein Syntaxfenster übernehmen. Sie können eine Job-Datei erstellen, indem Sie die Syntax einer längeren
Analyse Schritt für Schritt übernehmen. Auf diese Weise können Sie die Analyse zu einem
späteren Zeitpunkt wiederholen.
In einem Syntaxfenster können Sie die übernommene Syntax ausführen, bearbeiten und in
einer Syntaxdatei speichern.
Wählen Sie beispielsweise im Daten-Editor das Menü
Datei | Öffnen | Daten...
und aktivieren Sie die Datei BANK_DE.SAV im Ordner C:\Daten\Base.
Tips und Tricks
130
Klicken Sie nun auf Einfügen anstatt auf Öffnen. Die Datei wird nicht unmittelbar geöffnet.
Dafür öffnet sich ein neues Syntax-Fenster mit zwei Zeilen Text. Es handelt sich dabei um
den Syntaxbefehl, um die Datei BANK_DE.SAV zu öffnen.
Markieren Sie nun den Befehl mit der Maus und klicken Sie auf das Schaltfeld "Ausführen"
auf der Symbolleiste des Syntaxfensters. Falls Sie keine Auswahl getroffen haben, wird
der Befehl, bei dem sich der Cursor gerade befindet, ausgeführt.
Auf dieselbe Art können Sie nun weitere Befehle hinzufügen und ausführen lassen. Möchten
Sie eine Häufigkeitsanalyse durchführen, wählen Sie das Menü
Analysieren | Deskriptive Statistiken | Häufigkeiten...
Wählen Sie die Variable beruf und klicken sie wiederum auf Einfügen.
Tips und Tricks
131
Wenn Sie zum Syntaxfenster zurückkehren, erkennen Sie, dass drei Zeilen Befehl für die
Häufigkeitsanalyse dazugekommen sind.
Führen Sie den Befehl auf die gleiche Art wie vorher aus oder wählen Sie einen der Befehle
aus dem Menü
Ausführen |
•
Alles. Führt alle Befehle im Syntaxfenster aus.
•
Auswahl. Führt die aktuell ausgewählten Befehle aus. Dies umfaßt alle auch nur teilweise markierten Befehle.
•
Aktuell. Führt den Befehl aus, bei dem sich der Cursor gerade befindet.
•
Bis Ende. Führt alle Befehle von der aktuellen Cursorposition bis zum Ende der Befehlssyntax aus.
Tips und Tricks
132
Sie können die Syntaxbefehle auch manuell bearbeiten oder ergänzen. Beachten Sie dabei die
folgenden einfachen Regeln:
•
Jeder Befehl muß auf einer neuen Zeile beginnen und mit einem Punkt (.) enden.
•
Die meisten Unterbefehle werden durch Schrägstriche (/) voneinander getrennt. Der
Schrägstrich vor dem ersten Unterbefehl ist in der Regel optional.
•
Variablennamen müssen vollständig ausgeschrieben werden.
•
Text in Apostrophe n oder Anführungszeichen muß sich auf einer Zeile befinden.
•
Zeilen mit Befehlssyntax dürfen nicht länger als 80 Zeichen sein.
•
Zum Kennzeichnen der Dezimalstellen muss der Punkt (.) verwendet werden, auch
wenn die regionalen Einstellungen für Windows anders sind.
•
Variablenamen, die mit einem Punkt enden, können bei Befehlen, die aus einem Dialogfeld übernommen wurden, Fehler hervorrufen. Sie dürfen solche Variablennamen
nicht in Dialogfeldern verwenden und sollten sie auch generell vermeiden.
•
Kommentare beginnen auf einer neuen Zeile mit einem Stern (*) und enden mit einem
Punkt (.).
Bei der SPSS-Befehlssyntax wird nicht zwischen Groß- und Kleinschreibung unterschieden.
Für viele Befehle können Abkürzungen aus mindestens drei Zeichen verwendet werden. Sie
können beliebig viele Zeilen zur Angabe eines einzelnen Befehls verwenden. An fast jedem
Punkt, an dem ein Leerzeichen zulässig ist, können Sie beliebig viele Leerzeilen oder Zeilenumbrüche einfügen, beispielsweise bei Schrägstrichen, runden Klammern, arithmetischen
Operatoren oder zwischen Variablennamen.
Wenn Sie die Befehlssyntax abspeichern wollen, wählen Sie im Syntax-Editor das Menü
Datei | Speichern
und speichern Sie die Datei mit einem beliebigen Namen ab. Wenn Sie eine abgespeicherte
Befehlssyntax erneut ausführen möchten, wählen Sie im Daten-Editor das Menü
Datei | Öffnen | Syntax...
und wählen Sie die gewünschte Syntax-Datei aus. Nun können Sie die Befehle erneut ausführen lassen.
Neues Symbol einer Symolleiste hinzufügen
Sie können in SPSS alle vorhandenen Symbolleisten anpassen. Symbolleisten können Symbole für alle in SPSS verfügbaren Funktionen enthalten. Dies schließt Symbole für alle über
Menüs verfügbaren Aktionen ein. Ausserdem können Symbole enthalten sein, mit denen an-
Tips und Tricks
133
dere Anwendungen gestartet sowie Befehlssyntax-Dateien und Skriptdateien ausgeführt werden.
Wenn Sie der Symbolleiste des Daten-Editors ein neues Symbol hinzufügen möchten, von
dem aus eine Syntax-Datei gestartet werden soll, gehen Sie folgendermassen vor:
Wählen Sie das Menü
Ansicht | Symbolleisten...
und klicken Sie auf die Schaltfläche Anpassen. Klicken Sie im Dialogfeld Symbolleiste anpassen auf Neues Symbol.
Geben Sie nun eine aussagekräftige Beschriftung für das Symbol ein.
Wählen Sie die gewünschte Aktion für das Symbol aus, also das Ausführen einer SyntaxDatei.
Klicken Sie auf Durchsuchen, wählen Sie die Syntax-Datei, die dem Symbol zugeordnet werden soll und klicken Sie auf OK.
Neue Symbole werden in der Kategorie Benutzerdefiniert angezeigt. Hier finden Sie ausserdem die benutzerdefinierten Menüeinträge. Schieben Sie nun das von Ihnen erstellte Symbol
mit der Maus an die gewünschte Stelle der darunter liegenden Symbolleiste.
Tips und Tricks
134
Klicken Sie auf OK. Zurück im Dialogfeld Symbolleiste anpassen klicken Sie nochmals OK.
Die Symbolleiste des Daten-Editors ist durch ein zusätzliches Symbol (ganz rechts) erweitert
worden.
Wenn Sie mit der Maus darauf klicken, wird die damit verbundene Syntax ausgeführt.
SPSS AnswerNet
Sollten Sie mit den Hilfemöglichkeiten von SPSS nicht weiterkommen oder auf ein spezielles
Problem gestossen sein, können Sie über das SPSS AnswerNet unter der Adresse
http://www.spss.com/tech/answer/
systematisch nach Lösungen bzw. Hinweisen zu Ihrem Problem bzw. Ihrer Fragestellung suchen. Mit SPSS AnswerNet haben Sie Zugriff auf eine umfassende Datenbank mit allen bekannten Fragen rund um SPSS-Produkte und den entsprechenden Lösungen dazu. Diese Möglichkeit besteht nur in englischer Sprache.
Tips und Tricks
135
Wählen Sie im Abfrageformular das Produkt (z.B. SPSS Base), die benutzte Version und das
Betriebssystem aus. Schränken Sie Ihre Abfrage mit den Suchkriterien Problem Type und
Problem Subtype so genau wie möglich ein, und klicken Sie auf Search.
Als Ergebnis Ihrer Abfrage erhalten Sie eine Liste mit allen bekannten Problemen, die Ihren
Suchkriterien entsprechen. Wählen Sie anhand des Titels die am besten zutreffende Lösungsmöglichkeit aus. Sie erhalten eine detaillierte Problem- bzw. Lösungsbeschreibung, die immer
in einen Titel und eine Beschreibung mit Fragestellung (Q) und Antwort (A) aufgeteilt ist.
Tips und Tricks
136
Tips und Tricks
Übung:
Erstellen Sie eine Syntax-Datei job1.sps, die
•
die Datendatei BANK_DE.SAV öffnet,
•
eine Häufigkeitsauszählung aller kategorialen Variablen mit Balkendiagramm ausführt,
•
eine Kreuztabelle von Berufsgruppe mit Geschlecht mit Spaltenprozenten und eine passende Grafik dazu erstellt,
•
die Differenz zwischen dem jetzigen und dem Einstiegsgehalt berechnet und das Resultat als Histogramm darstellt.
Verknüpfen Sie die Syntax-Datei mit einem neuen Symbol der Symbolleiste des Daten-Editors
Wichtige Begriffe aus diesem Kapitel
ü
ü
ü
ü
ü
ü
Fallnumerierung
Datum und Zeit einfügen
Mehrfach vorhandene Fälle
Befehlssyntax
Symbolleiste
SPSS AnswerNet
137
Einstellungen
19
138
Einstellungen
Inhalt
Ø
Ø
Ø
Ø
Ø
Ø
Optionen für den allgemeinen Umgang mit SPSS
Ein- und Ausblenden von Objekten im Ausgabe-Navigator
Beschriftung der Ausgabe
Diagramme und Pivot-Tabellen definieren
Währungsformate erstellen
Autoskripts ermöglichen
Viele SPSS Voreinstellungen können durch eine benutzerdefinierte Auswahl in den Dialogfeldern ersetzt werden. Die meisten dieser Änderungen bleiben nur für die Dauer einer Sitzung aktiv. Einige Einstellungen bleiben aber über die SPSS Sitzungen hinaus bestehen. Diese dauerhaften Modifikationen der Voreinstellungen werden Optionen genannt. Sie können
diese Einstellungen so festlegen, daß sie Ihren spezifischen Bedürfnissen entsprechen.
Um die SPSS Einstellungen während einer Sitzung zu modifizieren, wählen Sie aus dem Menü
Bearbeiten  Optionen.
Dadurch öffnet sich das Dialogfeld Optionen. Die Optionen sind nach Anwendungsbereichen
getrennt auf sogenannten Karteikarten organisiert. Beginnen wir mit dem Ordner Allgemein.
Einstellungen
139
Allgemein
Sitzungs-Journal
SPSS erstellt und pflegt eine Journaldatei, die alle während einer SPSS Sitzung abgearbeiteten Befehle enthält. Sie können die Journaldatei bearbeiten und die Befehle wieder in anderen
SPSS Sitzungen verwenden. So können Sie auch, falls Sie aus irgendwelchen Gründen SPSS
verlassen muß ten ohne Ihre Ergebnisse abzuspeichern, sich alle Ergebnisse und Veränderungen Ihrer Daten noch einmal erstellen lassen.
Sie haben die Wahl zwischen Anhängen und Überschreiben. Mit der Option Anhängen wird
die Journaldatei über mehrere Sitzungen fortgeschr ieben. Dieses läßt die Journaldatei schnell
unübersichtlich werden. Deswegen ist die Option Überschreiben vorzuziehen. D.h. die Journaldatei wird mit jedem Öffnen von SPSS überschrieben. Wenn Sie Inhalte der Journaldatei
der vorherigen Sitzung nutzen wollen, kopieren Sie die Journaldatei vor dem Starten von
SPSS in ein beliebiges Verzeichnis.
Per Voreinstellung erstellt SPSS eine Journaldatei mit dem Namen spss.jnl, die normale rweise im Verzeichnis c:\windows\temp bzw. c:\WINNT\temp abgelegt wird. Um den
Namen oder das Verzeichnis zu ändern, klicken Sie auf Durchsuchen im Dialogfeld Optionen. Dadurch öffnet sich das Dialogfeld Speichern unter.
Hier geben Sie das Verzeichnis ihrer Wahl an.
Anzeige kleiner Zahlen
Verhindert, dass in der Ausgabe kleine Dezimalzahlen in Exponentialdarstellung angezeigt
werden. Sehr kleine Dezimalstellen werden als 0 oder .000 angezeigt.
Syntax-Fenster bei Start öffnen
Syntax-Fenster sind Textdatei-Fenster, die zur Eingabe, Bearbeitung und Ausführung von
SPSS Befehlen verwendet werden. Wenn Sie häufig mit der Befehlssyntax arbeiten, wählen
Sie diese Option aus.
Einstellungen
140
Masseinheit
Hier können Sie das gewünschte Mass – beispielsweise cm – einstellen. Diese Auswahl hilft
Ihnen bei der Zuweisung der Spaltenbreite von Tabellen.
Sortierfolge für Variablenliste anzeigen
Sie haben die zwei Alternativen für die Sortierung der Variablen in der Variablenliste:
§
§
Alphabetisch zeigt die Variablen in alphabetischer Re ihenfolge an.
Datei zeigt die Variablen in der Reihenfolge der Datendatei an. Dies ist dieselbe Reihenfolge, in der die Variablen
im Fenster des Dateneditors angezeigt werden. Das ist die
Voreinstellung.
Zuletzt verwendete Dateien
Unter dem Menüpunkt Datei können direkt Dateien geöffnet werden. Man kann angeben, wie
viele der zuletzt verwendeten Dateien angezeigt werden sollen.
Benachrichtigung bei Ausgabe
Je nachdem, welche Arbeitsweise Sie bevorzugen, sammeln Sie erst einige Ausgaben oder
wechseln sofort bei jeder Ausgabe in den Viewer.
Viewer
Die zweite wichtige Karteikarte beinhaltet Optionen zum Navigator. Auf der linken Seite
kann ausgewählt werden, welche Ausgabeteile im Viewer gezeigt bzw. ausgeblendet werden
sollen. Ausgeblendete Ausgaben sind im Viewer nach wie vor vorhanden, werden aber auf
den Bildschirm und beim Druck nicht berücksichtigt. Ein offenes Buch bedeutet eingeblendet.
Gleichzeitig lässt sich hier auch die Ausrichtung bestimmen.
Einstellungen
141
Mit der Option Schriftart für Titel kann die Schriftgröße, die Schriftart, die Farbe und Eigenschaften für jede neue Überschrift vorbestimmt werden.
Der weitere Teil der rechten Seite bezieht sich auf Ausgaben, die nicht Tabellen oder Grafiken sind.
Text-Viewer
Hier können Sie die Einstellungen für die klassische Ausgabe in Textform einstellen.
Beschriftung der Ausgabe
Auf dieser Karteikarte stehen Optionen zur Beschriftung der Gliederungsübersicht, zu den
Überschriften von Tabellen und der Beschriftung der Variablenlabels zur Verfügung.
Einstellungen
142
Die Gliederungsbeschriftung, auf der linken Seite des Viewers, ermöglicht eine schnelle
Übersicht und direkte Ausgabestrukturierung aller Ausgabe-Objekte. Mit der Option Variablen in Objektbeschriftungen anzeigen als: wird die Information in der Gliederungsübersicht
beeinflusst:
Mit den Optionen unter Beschriftung für Pivot-Tabellen können die Labels für die Statistiken
sowie die Überschriften und die Variablenwerte bestimmt werden. Nachfolgend drei Beispiele für Variablen in Beschriftungen anzeigen:
Statistiken
Statistiken
N
Gültig Fehlend
Angehöriger einer
Minderheit
468
6
MINDER
Gültig
468
N
Fehlend
6
Statistiken
MINDER Angehöriger
einer Minderheit
Gültig
N
Fehlend
468
6
Die selben Titel werden auch den Überschriften zugewiesen. Abschließend ein Beispiel, bei
dem auch die Option Variablenwerte in Beschriftungen und Variablen in Beschriftungen anzeigen verwendet wurden.
Einstellungen
143
MINDER Angehöriger einer Minderheit
Gültig
Fehlend
Gesamt
0 nein
1 ja
Gesamt
9 keine Angaben
Häufigkeit
367
101
468
6
474
Prozent
77.4
21.3
98.7
1.3
100.0
Gültige
Prozente
78.4
21.6
100.0
Kumulierte
Prozente
78.4
100.0
Diagramme
Bei Diagrammvorlage kann man bestimmte Formatierungen für Grafiken vorgeben. Dazu
speichern Sie vorher eine bestehende Grafik als Vorlage ab. Dann können Sie unter der Option ¤Diagrammvorlage-Datei verwenden die entsprechende Datei angeben.
Unter Aktuelle Einstellungen können Sie die Schriftart für alle Textelemente der Grafik einstellen, und bei Füllmuster und Linienstil zwischen farbiger und monochromer Darstellung der
Diagramme wählen. Unter Seitenverhältnis für Diagramm läßt sich zwischen schmal und hoch
bis breit und flach beliebig das Seitenverhältnis der Grafiken bestimmen.
Einstellungen
144
Rahmen und Gitterlinien kann man vorab den Diagrammen zuweisen.
Pivot-Tabellen
Unter Tabellenansicht können Sie aus einer Liste ein Tabellenformat auswählen. Beim Erzeugen einer neuen Tabelle wird dieses Format der Tabelle zugewiesen.
Daten
Optionen für Transformation & Zusammenführen
Wenn SPSS einen Befehl ausführt, wird jedesmal die Datendatei durchlaufen. Einige Datentransformationen (z.B. Berechnen und Umkodieren) sowie einige Dateitransformationen
(Neue Variablen und Neue Fälle) benötigen keinen eigenen Datendurchlauf. Die Ausführung
dieser Befehle kann solange verzögert werden, bis ein anderer Befehl aufgerufen wird, bei
dem sowieso eine Datentransfo rmation gemacht wird (z.B. eine Statistik).
Einstellungen
145
Anzeigeformat für neue numerische Variablen
Das voreingestellte Format (Breite und die Anzahl der Dezimalstellen) wird auf alle neu zu
erstellenden numerischen Variablen angewendet. Es gibt kein voreingestelltes Format für
neue Stringvariablen.
Währung
Sie können bis zu fünf benutzerdefinierte Währungsformate definieren. Diese können Sie
dann im Dialogfeld
Variablen definieren | Typ
beliebigen Variablen zuweisen. Im Dialogfeld Währung können Sie jeder Zahl führende und
nachfolgende Zeichen (z.B. CHF und ' ,- ') zuweisen.
Einstellungen
146
Skripts
Seit der Version 7.5 steht Ihnen eine zusätzliche Programmiersprache zur Verfügung. In dieser Sprache geschriebene Programme heißen Skripts. Eine spezielle Form sind die sogenannten Autoskripts.
Autoskripts ermöglichen Ihnen, automatisch bestimmte Ausgabeteile bei der Erstellung zu
formatieren. Sobald das entsprechende Objekt erstellt wird, erfolgt automatisch die Formatierung des Objekts.
Unter Autoskript-Ausführung aktivieren ermöglichen Sie allgemein die Verwendung von Autoskripts. Anschließend können Sie im Dialogfeld Status der Autoskript-Subroutine die gewünschten Subrout inen auswählen.
Einstellungen
147
Interaktiv
Die Grundeinstellungen für die interaktiven Grafiken können auf der Karteikarte Interaktiv
eingestellt werden. Hier finden Sie u.a. verschiedene, bereits definierte Diagrammvorlagen.
Anhang
148
20
Anhang
Übersicht über die Leistungsmerkmale der SPSS Zusatzmodule
SPSS Regression Models: Bessere Vorhersagen durch leistungsfähige Regressionsverfahren
•
Multinomische logistische Regression (NOMREG)
•
Binäre logistische Regression (LOGISTIC)
•
Uneingeschränkte nichtlineare Regression (NLR)
•
Eingeschränkte nichtlineare Regression (CNLR)
•
Gewichtete kleinste Quadrate (WLS)
•
Zweistufige kleinste Quadrate (2SLS)
•
Probitanalysen (PROBIT)
SPSS Advanced Models: Analyse komplexer Zusammenhänge mit High-End ModelierInstrumenten
•
Lineare Mixed-Level Modelle
•
Allgemeine lineare Modelle (GLM)
•
Fixed- Effect-Analyse von Varianzen (ANOVA)
•
Kovarianzanalyse (ANCOVA)
•
multivariable Varianzanalyse (MANOVA)
•
multivariable Kovarianzanalyse (MANCOVA)
•
ANOVA und ANCOVA nach Zufalls- oder Mischverfahren
•
Wiederholte Messungen von ANOVA und MANOVA
•
Schätzung von Varianzkomponenten (VARCOMP)
•
Allgemeine Modelle von Mehrweg-Kontingenztafeln (LOGLINEAR)
Anhang
149
•
Hierarchische logarithmisch-lineare Modelle für Mehrweg-Kontingenztafeln (HILOGLINEAR)
•
Logarithmisch- lineare und Logit-Modelle für die Datenzählung durch generalisiertes
lineares Modellkonzept (GENLOG)
•
Überlebensanalyse von Sterbetafeln (SURVIVAL)
•
Kaplan-Meier-Schätzverfahren für die Schätzung der Zeitdauer bis zum Eintritt eines
Ereignisses (KM)
•
Cox-Regression (COXREG)
•
Polynomes Logit-Universalmodellierverfahren für die Vorhersage von Ordinalergebnissen (PLUM)
SPSS Categories: Zum Verständnis von Gruppierungen mit Hilfe von Perzeptualkarten und
zur Vorhersage von kategorischen Ergebnissen
•
Analyse der Hauptkomponenten durch alternierende kleinste Quadrate (CATPCA)
•
Korrespondenzanalyse (CORRESPONDENCE)
•
Kategorische Regressionsanalyse durch optimale Skalierung (CATREG)
•
Homogenitätsanalyse durch alternierende kleinste Quadrate, auch bekannt als mehrfache Korrespondenzanalyse (HOMALS)
•
Kanonische Korrelationsanalyse von zwei oder mehr Sätzen von Variablen durch alternierende kleinste Quadrate (OVERALS)
SPSS Conjoint: Aufzeigen von Verbrauchervorlieben, die zur Optimierung der Produkte
und wirksamen Preisgestaltung beitragen
•
Gebrochene Faktorauslegungen der orthogonalen Haupteffekte; nicht auf zweistufige
Faktoren beschränkt (ORTHOPLAN)
•
Erstellung von Druckkarten für zusammengesetzte Experimente (PLANCARDS); die
gedruckten Karten werden als Stimuli für Sortierung, Rangfolgenerstellung oder Bewertung durch die Subjekte verwendet
•
Durchführung einer normalen Analyse der Vorlieben- oder Bewertungsdaten nach der
Methode der kleinsten Quadrate (CONJOINT)
SPSS Exact Tests: Erstellung von zutreffenden Schlussfolgerungen und bessere Entsche idungsfindung auch bei kleinen Stichproben oder feinen Teilgruppen
•
Über 30 exakte Tests decken das gesamte Spektrum nichtparametrischer und kategorischer Datenprobleme kleiner oder großer Datenmengen ab. Hie rzu zählen:
Anhang
150
•
Tests mit 1 Stichprobe, 2 Stichproben oder K Stichproben an unabhängigen oder miteinander zusammenhängenden Proben
•
Tests der Güte der Anpassung
•
Unabhängigkeitstests in RxC-Kontingenztafeln
•
Tests an Assoziationsmessgrössen
SPSS Missing Value Analysis: Ergänzt Lücken auf dem Weg zu höherwertigen Daten und
besseren Modellen
•
Analyse der Muster fehlender Daten
•
Eingabe fehlender Werte
•
EM-Algorithmus
•
Regressionsalgorithmus
SPSS Tables: Wirkungsvolle Darstellung von Daten mit Mehrfachantworten und kinderleichte Anzeige von Mehrfach-Datenreihen
•
Auswahl aus 35 Statistiken für Zellen und Übersichtsdaten
•
Berechnung von Prozentwerten für Auskunftspersonen oder Antworten, die eine leichtere Interpretation und Analyse von Daten mit Mehrfachantworten ermöglicht
•
Verkettung in sämtlichen Dimensionen für die Aufnahme von Mehrfachvariablen mit
unterschiedlichen Statistiken in einer einzigen Tabelle, so dass Mehrfachdatenreihen
auf einfache Weise angezeigt werden können
•
Unterscheidung nach der Art der fehlenden Werte in Ihren Daten, so dass fehlende
Antworten eindeutig angezeigt werden können
SPSS Trends: Optimierung Ihrer Vorhersagedaten mit leistungsfähigen Instrumenten für
Zeitreihendaten
•
Für die Erstellung von Schätzungen der maximalen Wahrscheinlichkeit für saisonale
und nichtsaisonale univariate Modelle (ARIMA)
•
Einsatz von exponentialen Glättungsverfahren für die Schätzung von bis zu vier Parametern aus 12 ausgewählten verfügbaren Modellen (EXSMOOTH)
•
Schätzung multiplikativer oder additiver saisonabhängiger Faktoren für periodische
Zeitreihen (SEASON)
Anhang
151
•
Zerlegung einer Zeitreihe in eine harmonische Komponente, eine Gruppe regelmäßiger periodischer Funktionen mit unterschiedlichen Wellenlängen oder Perioden
(SPECTRA)
•
Schätzung eines Regressionsmodells, wenn der Fehler aus der Regression zwischen
einem einzelnen Zeitpunkt und dem nächsten korreliert (AREG)
SPSS Maps: Erstellung von geographischen Diagrammen zur präziseren Entscheidungsfindung mit leistungsfähigen Abbildungsfunktionen, die aussagefähige demographische Info rmationen liefern
•
Nahtlose Integration mit SPSS
•
Sechs Optionen für themenbezogene Kartenabbildungen
•
Mehrfach-Themenlagen für die Anzeige von mehr als einem Thema auf einer einzelnen geographischen Kartenabbildung
•
Auswahl aus mehreren Musterabbildungen und Geodatensätzen
•
Importieren zusätzlicher Abbildungen für Sonderanforderungen