Bachelorarbeit - Institut für Informatik

Transcrição

Bachelorarbeit - Institut für Informatik
Fachbereich Mathematik und Informatik
der Freien Universität Berlin Institut für Informatik
Bachelorarbeit
Eine angemessene Geste für den Spieler Analyse von Bewegungen
Verfasser:
Matrikelnummer:
e-Mail:
Carsten Flöth
4456619
[email protected]
Erstprüfer:
Zweitprüfer:
Prof. Dr. Marco Block-Berlitz
Dipl.-Inf. Hilmar Dietrich
Abgabedatum:
27.06.2013
Vorwort
Vorab bedanke ich mich bei Prof. Dr. Marco Block-Berlitz für die Betreuung meine Bachelorarbeit.
Mein Dank geht auch an Hilmar Dietrich, der sich einen Teil seiner knappen Zeit genommen hat, um ebenfalls als Prüfer meiner Bachelorarbeit tätig zu sein.
Die Bereitstellung von Kinetic Space 2.3 PRO durch Matthias Wölfel hat mir während
der Erarbeitung des Toolkonzeptes auch sehr weitergeholfen, sodass eine Implementierung in Zukunft möglich ist.
Bedanken möchte ich mich zu guter Letzt auch bei allen, die mich während der Umsetzung dieser Arbeit unterstützt haben, und ich bitte all jene um Entschuldigung, bei
denen ich durch geistige oder physische Abwesenheit geglänzt habe.
2
Inhaltsverzeichnis
Zusammenfassung
5
1 Einleitung
1.1 Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Ziel und Aufbau der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . .
6
6
6
2 Grundlagen und Begriffe
2.1 Gestik . . . . . . . . . . . . . . . . .
2.1.1 Natürliche Gesten . . . . . .
2.1.2 Anstrengende Gesten . . . . .
2.2 Psychologie . . . . . . . . . . . . . .
2.2.1 Immersion in Videospielen . .
2.2.2 Flow . . . . . . . . . . . . . .
2.3 Microsoft Kinect . . . . . . . . . . .
2.3.1 Hardware . . . . . . . . . . .
2.3.2 Funktionsweise . . . . . . . .
2.4 Dynamic Time Warping Algorithmus
2.5 Verwendete Software . . . . . . . . .
2.5.1 OpenNI . . . . . . . . . . . .
2.5.2 Kinetic Space . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
8
8
8
8
9
9
10
11
11
12
12
15
15
17
3 Theorie und verwandte Arbeiten
3.1 Ergonomie gestenbasierter Interfaces . . . . . . . . . . . . . . . . . . . . .
3.2 Psychologie in Spielen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Technologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
18
19
21
4 Ausgeglichene Gesten-Sets
4.1 Umfrage zur Gestenbewertung . .
4.1.1 Aufbau und Durchführung .
4.1.2 Auswertung . . . . . . . . .
4.1.3 Zwischenfazit . . . . . . . .
4.2 Psychologie . . . . . . . . . . . . .
4.3 Zwischenfazit . . . . . . . . . . . .
23
23
23
25
27
27
29
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Toolkonzeption
30
5.1 Architekturübersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2 Modul Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3
5.3
5.4
Modul Ergonomie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
6 Zusammenfassung und Ausblick
34
Quellenverzeichnis
36
Abbildungsverzeichnis
39
Anhänge
40
4
Zusammenfassung
In der heutigen Zeit ist ein Trend zur alternativen Steuerung von Videospielen zu erkennen, der sich von Gamepad- oder Maus&Tastatur-Steuerung in Richtung natürlicher
Interaktion (engl. Natural User Interaction, kurz NUI) bewegt. Eine mögliche Form
ist der Einsatz von Gesten mit dem gesamten Körper, der allerdings durch konditionelle Fähigkeiten, technische Erfassung der Gesten und dem Willen des Spielers gut
durchdacht sein sollte. Diese Arbeit befasst sich mit der Analyse von Gesten-Sets auf
Ausgeglichenheit, sowie deren Einsatz in Spielen.
5
1 Einleitung
1.1 Problemstellung
Der Stellenwert der Human Computer Interaction (kurz HCI) ist in den letzten Jahren gestiegen, da die globale Technologisierung Natural User Interfaces (kurz NUI) bevorzugt. Dies ist der Fall, weil so die Erlern- und Bedienbarkeit von Systemen vereinfacht wird. In Spielen sind es zumeist Wischbewegungen mit den Fingern auf einer
Smartphone-Oberfläche, aktuell der Einsatz von Virtual Reality Brillen wie der Oculus
Rift oder einige Projekte, die den gesamten Körper als Controller verwenden. Letztere
sind unter anderem deshalb noch nicht weit verbreitet, da die Umsetzung teilweise unausgereift ist.
Zum einen wird die Eingabe, also die Gestenausführung des Spielers, missinterpretiert,
sodass eine andere Geste erkannt“ wird, oder die Gesten können auch so komplex oder
”
anstrengend sein, dass der Spieler sie aus verschiedenen Gründen nicht ausführen will
bzw. kann.
Dies kann große Auswirkungen auf das Spielverhalten und vor allem den Spielspaß haben,
der sich dadurch in Grenzen halten kann. Daher muss bei der Entwicklung eines Spiels,
das durch Gestensteuerung bedient wird, besonders die Auswahl geeigneter Gesten beachtet werden.
1.2 Ziel und Aufbau der Arbeit
Das Ziel dieser Arbeit ist es, herauszufinden, welche Gesten sinnvoll miteinander kombiniert werden sollten, damit sie dem Spieler ein positives Spielerlebnis bieten können.
Der Spieler selbst soll im Fokus der Arbeit stehen, da er als Kunde einen entscheidenden
Einfluss auf den Erfolg eines Spiels besitzt, was als user-oriented design bekannt ist.
Ein positives Spielerlebnis unter Einsatz von Ganzkörpersteuerung kann in verschiedene Ebenen erzeugt bzw. aufrecht erhalten werden, wozu die körperliche Verfassung
des Spielers zählt, wie auch die Elemente des Spiels, die dem Spieler den Anreiz geben,
dieses Spiel mit den gestellten Gesten zu spielen und es zu erleben.
Die Grundlagen zu den einzelnen Ebenen eines Spiels, sowie verwendete Technologien werden in Kapitel 2 erläutert, sodass auf sie in der weiteren Arbeit zurückgegriffen
werden kann. Im Anschluß werden verwandte Arbeiten zur Ergonomie gestenbasierter
Interfaces (siehe 3.1), Psychologie in Spielen (siehe 3.2) und Technologie (siehe 3.3) vorgestellt.
In Kapitel 4 wird aus den gesammelten Informationen zu den verschiedenen Ebenen
erwogen, wie sich ein ausgeglichenes Gesten-Set realisieren lässt. Auf diese Weise kann
6
der Spieler ein positives Gefühl beim Spielen erhalten.
Der abschließende Teil meiner Arbeit ist die Konzeption eines Tools, das das Finden
geeigneter Gesten-Sets durch die erarbeiteten Erkenntnisse erleichtern soll.
Folgende Fragen sollen mit dieser Arbeit beantwortet werden:
• Wann ist ein Set von Gesten ausgeglichen und wie sollte es eingesetzt werden?
• Wo muss besondere Rücksicht auf den Spieler genommen werden (physisch und
psychologisch)?
• Wie muss eine Geste ausgeführt werden, damit sie als korrekte Geste erkannt wird,
aber den Spielspaß nicht mindert?
7
2 Grundlagen und Begriffe
In diesem Kapitel werden die Grundlagen und Begriffe, die in den folgenden Abschnitten
verwendet werden, erläutert. Dies soll dazu dienen, ausgeglichene Gesten-Sets beschreiben und das Toolkonzept vorstellen zu können.
2.1 Gestik
Gesten sind ein Hauptbestandteil der menschlichen Kommunikation. Mit ihnen werden
Dinge ausgedrückt, die zwar auch auf sprachlicher Basis kommuniziert werden können,
aber mit Gesten kann dies in kürzerer Zeit geschehen. Zum Beispiel kann ein Objekt
beschrieben werden, das an einem bestimmten Ort in der Umgebung positioniert ist,
indem die Position anhand anderer Objekte, die der Empfänger dieser Beschreibung
sieht, bestimmt wird. Wenn eine Person allerdings direkt auf dieses Objekt zeigt, also
eine Geste ausführt, kann die Ortsbestimmung mit wesentlich geringerem Aufwand und
in einem kürzeren Zeitraum durchgeführt werden.
Gesten können aber nicht nur Sprache ersetzen, sondern sie auch verstärken. Während
des Sprechens, werden meistens die Hände verwendet, um das Gesagte zu verstärken selbst wenn der Empfänger für ihn nicht sichtbar ist.
2.1.1 Natürliche Gesten
Die Human Computer Interaction wird mit dem Fortschritt der Technik immer wichtiger,
da die Bedienung von Hardware möglichst schnell und somit auch einfach erlernbar sein
soll. Bei den aktuellen Smartphones werden zum Beispiel Wischgesten verwendet. Damit
die Bedienung vereinfacht wird, muss verstärkt auf intuitives Handeln von Personen
eingegangen werden. Gesten, die intuitiv einsetzbar sind, kennt ein Mensch entweder
von Geburt an oder hat sie sich über den Verlauf seines Lebens angeeignet, sodass es für
ihn natürlich ist, sie einzusetzen.
Gesten, die dem Nutzer bekannt vorkommen, erleichtern ihm das Erlernen, da er auf
bekanntes Wissen zurückgreifen kann und nicht den gesamten Bewegungsablauf neu
erlernen muss.
2.1.2 Anstrengende Gesten
Gesten können auf verschiedene Weisen anstrengend sein, wie bereits erwähnt. Zum
einen kann Anstrengung durch Überschreiten körperlicher Grenzen erzeugt werden und
zum anderen durch möglichen geistigen Druck bei der Ausführung nicht gelernter und
unbekannter Gesten.
8
Die körperlichen Grenzen werden unter anderem überschritten, wenn Muskeln mit einem
nicht alltäglichen Aufwand überansprucht werden. Als Beispiel dient hier das Beugen des
rechten Armes. Diese Bewegung wird häufig im Alltag ausgeführt, da sie bei einmaliger
Ausführung kaum Anstrengung erfordert. Wird sie hingegen häufig ausgeführt, und das
häufig in einem kurzem Zeitraum, empfindet man diese Geste als anstrengend, da sie
entgegen dem alltäglichen Gebrauch eingesetzt wird.
Statische Gesten (Posen) können hingegen auch anstrengend werden. Das Zeigen auf ein
Objekt, wie es als eine natürliche Geste oben eingestuft wurde, kann über einen längeren
Zeitraum ebenfalls als anstrengend empfunden werden.
Mueller, Gibbs und Vetere definieren physische Anstrengung als [...] act of exerting,
”
involving skeletal muscles, which results in physical fatigue, [...].“ 1
2.2 Psychologie
Bei der Entwicklung von Computerspielen ist eine psychologische Analyse des Spiels
ein entscheidender Faktor, was oft nicht bewusst wahrgenommen wird. Der Entwickler
muss entscheiden, wie ein Spiel auf den Kunden bzw. den Spieler wirken soll und welche
Gefühle an welcher Stelle hervorgerufen werden sollen. Damit dies gelingt, muss der
Spieler in dem Spiel“ sein, was die sogenannte Immersion (siehe 2.2.1) ist.
”
2.2.1 Immersion in Videospielen
Immersion beschreibt einen Zustand des Spielers, indem er sich in das Spiel eindenken
und einfühlen kann. Dabei verlagert er seine Wahrnehmung von den Geschehnissen der
realen Welt zu denen der virtuellen Welt. Dies erfordert ein hohes Maß an Konzentration
und Aufmerksamkeit2 .
Diese Vertiefung kann auf mindestens zwei verschiedenen Wegen beim Spieler erreicht
werden:
There is the story based immersion into the narrative, plot and setting.
”
And there is flow, the immersion into the game mechanics.“ 3
Wie in dem Zitat angemerkt, gibt es storybasierte Immersion, die eher durch narrative
Methoden hervorgerufen wird und die Immersion durch Spielmechaniken, mit der sich
u.a. die Flow Theorie (siehe 2.2.2) befasst.
Ein etwas anderes Modell von Immersion bieten Ermi und Mäyrä, indem sie die Immersion von Videospielen in drei Komponenten [...] sensory, challenge-based and imagina”
tive immersion (SCI-model). [...]“ 4 aufteilen. Die challenge-based immersion entspricht
dabei der Immersion durch Spielmechanik und die imaginative immersion der der storybasierten Immersion aus dem vorhergehenden Zitat. Die sensory immersion hingegen
wird durch audiovisuelle Eindrücke der Spielwelt hervorgerufen, die das Wahrnehmen
1
2
3
4
[23], S. 265
Vgl. [6], S. 1090
[19]
[26], S. 1
9
der realen Welt überdecken. Immersion wirkt sich durch ein verändertes Zeitgefühl aus,
aber auch durch eine abnehmende Selbstwahrnehmung, da der Spieler sich in die virtuelle
Welt hineinversetzt. 5
2.2.2 Flow
Die Flow Theorie wurde von Csı́kszentmihályi entwickelt, um die Vertiefung von Musikern, Sportlern oder anderen Gruppen in ihre Tätigkeit beschreiben zu können6 . Eine
Vertiefung in eine Tätigkeit hängt von zwei Faktoren ab. Die Anforderungen der Tätigkeit sind der eine und die Fähigkeiten des Subjekts der andere Faktor.
Aus diesen beiden Faktoren lässt sich der Theorie nach eine Zone ableiten, in der ein
Subjekt vertieft sein kann und sich in “the Zone“ 7 befindet. In Abbildung 2.1 ist dieser
Zusammenhang als “Flow channel“ (oder auch “Flow Zone“ genannt) dargestellt.
Ist das Subjekt in seiner Flow Zone, dann entsprechen dessen Fähigkeiten auch den Anforderungen der Aufgabe, ohne dass eine Unter- oder Überforderung auftritt.
Als weitere Ableitung aus der Theorie sind die Zonen der Überforderung (als Anxiety“
”
gekennzeichnet) und der Unterforderung (als Boredom“ gekennzeichnet) in der Abbil”
dung enthalten. Ein Subjekt befindet sich in der Zone der Überforderung, wenn dessen
Fähigkeiten die aktuellen Anforderungen nicht bewerkstelligen können. Dies kann das
Gefühl von psychischem Druck erzeugen, aber ebenso das Gefühl von Angst, da eventuelle Konsequenzen bekannt sein könnten. Wenn allerdings die Fähigkeiten des Subjekts
die Anforderungen übersteigen, wird sich das Subjekt mit einer hohen Wahrscheinlichkeit langweilen und unterfordert fühlen, was dazu führen kann, dass die aktuelle Aufgabe
nicht weiter bearbeitet wird.
Abbildung 2.1: Erstes Flow-Modell nach Csı́kszentmihályi8
5
6
7
8
Im weiteren Verlauf dieser Arbeit wird die challenge-based immersion gemeint sein, wenn von Immersion die Rede ist.
[27], S. 15
[25], S. 31
[20], S. 247
10
2.3 Microsoft Kinect
Die Microsoft Xbox360 Kinect ist eine Hardwareerweiterung für die Konsole Xbox360.
Ursprünglich unter dem Namen Project Natal von Microsoft und PrimeSense entwickelt,
ist die Kinect die Antwort auf Nintendos WiiMote-Controller9 im Bereich alternativer
Steuerung für Konsolen. Dadurch, dass der Spieler für die Bedienung kein Gerät halten
muss, ist er ungebunden von den begrenzten Steuerungsmöglichkeiten und kann nahezu
seinen gesamten Körper als Eingabemedium verwenden. Kurz nach Verkaufsstart der
Kinect wurden von Hackern verschiedene Programme veröffentlicht, die die Kinect als
Eingabemedium für den PC nutzten. Nach vielen weiteren Veröffentlichungen sah Microsoft das Potential dieser alternativen Steuerung für den PC und entwickelte eine Kinect
for Windows, sowie ein passendes SDK, das kostenfrei zur Verfügung gestellt wurde.
2.3.1 Hardware
Der Kinect Sensor10 enthält fünf verschiedene Komponenten (s.Abb. 2.2), die es ermöglichen, die Umgebung vor ihm räumlich zu erfassen:
Es gibt vier einzelne Mikrofone (Mikrofon-Array), mit denen sich Geräuschquellen lokalisieren lassen, sowie eine RGB Kamera, die mit einer Auflösung von 640×512 Pixeln
aufnimmt.
Die besonderen Komponenten der Kinect sind der Infrarot-Projektor und die TiefensensorKamera. Der fünfte Bestandteil der Kinect ist der Neigungsmotor, der im Standfuß des
Gerätes integriert ist und die Kamera um ±27° vertikal ausrichten kann. Beide Kameras
können mit einer Bildwiederholungsrate von 30 FPS aufnehmen.
Abbildung 2.2: Microsoft Kinect11
9
10
11
[4]
[10] enthält die Spezifikation der Kinect for Windows. Die Unterschiede zu der Version für die Xbox
360 sind in den zugehörigen FAQ [11] beantwortet und in der Beschreibung berücksichtigt.
Quelle: [10]
11
2.3.2 Funktionsweise
Die Microsoft Xbox360 Kinect projiziert mit dem Infrarot-Projektor ein spezielles Punktmuster der Wellenlänge 780nm in die Umgebung (s.Abb. 2.3), das von Objekten im Projektionskegel reflektiert wird. Anhand eines Vergleichs vom projizierten Punktmuster
und dem Muster, das von der Tiefensensor Kamera aufgenommen wird, lassen sich Abweichungen bestimmen, mit denen sich ein Tiefenbild erzeugen lässt. Durch Differenzen
in einer Folge von Tiefenbildern lassen sich dadurch auch Bewegungen errechnen. Wenn
in den Bewegungen und Tiefenbildern ein menschenähnliches Objekt erkannt wird, kann
auf diesem ein Skelett berechnet werden, dessen Bones“ für die weitere Verarbeitung
”
zur Verfügung stehen.
Die RGB-Kamera nimmt wie eine handelsübliche Kamera ein farblich-differenziertes Bild
des Sichtkegels auf. Durch Mapping des von der RGB-Kamera empfangenen Bildes und
den Informationen der Tiefenkamera lässt sich der Inhalt des Sichtkegels dreidimensional
und mit korrekten Farben virtuell darstellen.
Die letzte Komponente, das Mikrofon-Array, kann auch zur räumlichen Lokalisierung genutzt werden, indem die empfangenen Frequenzen jedes einzelnen Mikrofons analysiert
und miteinander verglichen werden. Dadurch lässt sich ein lokales Maximum des Frequenzbereichs und so die ungefähre Position der Geräuschquelle vor dem Kinect-Senor
ermitteln.
Abbildung 2.3: Infrarot Punktmuster der Kinect12
2.4 Dynamic Time Warping Algorithmus
Für das Verständnis der Funktionsweise der verwendeten Software (siehe 2.5) wird das
Wissen über den Dynamic Time Warping Algorithmus (kurz DTW) vorausgesetzt, der
in diesem Abschnitt erläutert wird.
Dynamic Time Warping ist ein Algorithmus, der zum Vergleich von zwei Sequenzen, die
12
Quelle: [15]
12
verschiedene zeitliche Längen besitzen können, dient.13 Ein häufiges Anwendungsgebiet
des DTW ist die Spracherkennung, da die vom Nutzer gesprochenen Eingaben mit gespeicherten Lauten verglichen werden müssen. Aufgrund unterschiedlicher Aussprache,
wie zum Beispiel einer etwas längeren Betonung eines Vokals, kommt es zwangsweise zu
einer Abweichung der Eingabe zur gespeicherten Vorlage. Der DTW-Algorithmus setzt
an dieser Stelle an, indem er unterschiedlich lange aber inhaltlich gleiche“ Eingaben
”
vergleicht und die Kosten für einen sogenannten warping path errechnet.
Für die Gestenerkennung ist das ebenfalls von Bedeutung, weil die Ausführung einer
Geste, ähnlich der unterschiedlichen Aussprache von Wörtern, meistens nicht synchron
zu der Referenzgeste verläuft. Dadurch kommt es zu Verzögerungen oder Verkürzungen
in ihr, weshalb das DTW gebraucht wird, um diese zu erkennen und entsprechend zu
behandeln.
Mathematische Definition14
Beim klassischen DTW, der ohne weitere Bedingungen zwei Sequenzen X := (x1 , x2 , ..., xN )
der Länge N ∈ N und Y := (y1 , y2 , ..., yM ) der Länge M ∈ N miteinander vergleicht, werden Glieder xn und ym auf deren Abstand untersucht. Für die Berechnung des Abstands
bzw. der Kosten, die anfallen würden, wenn xn auf ym abgebildet werden soll, wird eine
Kostenfunktion c benötigt. Diese Funktion muss auf R≥0 abbilden, damit die Kosten
zwischen zwei Punkten bestimmt werden können. Durch xn , ym ∈ F mit n ∈ [1, N ] und
m ∈ [1, M ] kann eine Kostenfunktion definiert werden:
c : F × F → R≥0
Mit dieser kann der Abstand zwischen x ∈ F und y ∈ F bestimmt werden.
Daraus ergibt sich eine Matrix (s. Abb. 2.4), in der alle Kosten notiert werden können.
Um zwei Sequenzen mit dem DTW zu vergleichen, werden sogenannte warping paths ermittelt. Ein warping path ist eine Sequenz p = (p1 , p2 , ..., pL ) mit pl = (nl , ml ) ∈ [1, N ] × [1, M ]
für l ∈ [1, L]. Außerdem wird er von drei Bedingungen gestützt:
Abbildung 2.4: Kostenmatrix für Sequenzen der Länge N = 6 und M = 8
Boundary condition
p1 = (1, 1) ∧ pL = (N, M )
13
14
Vgl. [24]
Vgl. [24], S.69-74
13
Durch diese Einschränkung wird gewährleistet, dass jeweils die ersten, sowie die letzten
Punkte der zu vergleichenden Sequenzen identisch sind. Das ist notwendig, damit ein
Intervall existiert, in dem ein warping path existieren kann, der die Sequenzen aufeinander abbilden kann.
In Abbildung 2.5 ist die Bedingung innerhalb der Matrix dargestellt, die auch alle möglichen warping path erfüllen müssen.
Abbildung 2.5: Boundary condition des DTW
Step size condition
pl+1 − pl ∈ {(1, 0), (0, 1), (1, 1)} für l ∈ [1, L − 1]
Die Step size condition begrenzt die Schrittweite von einem Punkt pl zu seinem Nachfolger pl+1 , sodass keine Sequenzglieder von X oder Y ausgelassen werden können.
Monotonicity condition
n1 ≤ n2 ≤ ... ≤ nL und m1 ≤ m2 ≤ ... ≤ mL
Die Monotonicity condition ist schon durch die Step size condition impliziet vorhanden,
allerdings fordert sie alleine, dass es im p warping path keinen zeitlichen Rückgang gibt.
Abbildung 2.6 enthält einen möglichen warping path für zwei Sequenzen der Länge 6, an
dessen Verlauf alle drei Bedingungen erkannt werden können.
Abbildung 2.6: Warping path in R6×6
Kostensumme
Zur Bestimmung der Gesamtkosten eines warping path zwischen X und Y genügt es, die
einzelnen Kosten auf ihm zu addieren:
P
cp (X, Y ) := L
l=1 c(xnl , yml )
14
Damit aber bestimmt werden kann, wie ähnlich sich zwei Sequenzen sind, muss der
warping path mit der geringsten Kostensumme cp (X, Y ) gefunden werden. Der DTW
Abstand DTW(X,Y ) zwischen X und Y ist dann als Gesamtkostensumme des kostengünstigsten warping path p∗ wie folgt definiert:
DT W (X, Y ) := cp∗ (X, Y ) = min{cp (X, Y ) | p ist ein warping path}
Mit dem Algorithmus in Abbildung 2.7 lässt sich ein kostengünstigster warping path finden, wobei dynamische Programmierung verwendet wird, um die Notwendigkeit zu vermeiden, alle möglichen Pfade einzeln betrachten zu müssen. Für den Algorithmus werden
die Präfixsequenzen X(1 : n) := (x1 , x2 , ..., xn ) mit n ∈ [1, N ] und Y (1 : m) := (y1 , y2 , ..., ym )
mit m ∈ [1, M ] definiert. Mit
D(n, m) := DT W (X(1 : n), Y (1 : m))
lässt sich für eine Teilmatrix der kostengünstigste Pfad bestimmen.
Abbildung 2.7: Algorithmus zum Finden eines kostengünstigsten Warping Path15
2.5 Verwendete Software
Das Tool-Konzept in Kapitel 5 enthält verschiedene Software, die eine Realisierung erleichtern soll. Diese Software ist in diesem Abschnitt vorgestellt.
2.5.1 OpenNI
OpenNI16 (kurz für Open Natural Interaction) ist eine Unternehmensgruppe bestehend
aus Primesense, Willow Garage, Sidekick und Asus. Sie wurde mit dem Ziel gegründet,
die Nutzung natürlicher Interaktionsgeräte zu fördern. Daher bieten OpenNI ihre Produkte, das OpenNI SDK und NITE, zur kostenfreien Verwendung an, sodass interessierte
15
16
[24], S.73
[8]
15
Entwickler leichter Anwendungen mit interaktiver Steuerung entwickeln und optimieren
können.
OpenNI SDK
Das OpenNI SDK ist eine kostenfreie Open Source Middleware, bereitgestellt von OpenNI,
die die Entwicklung mit 3D Sensoren, wie zum Beispiel der Microsoft Kinect, erleichtern
soll. Durch die angebotene API kann der Entwickler auf alle Informationen des genutzten 3D-Sensors zugreifen und diese für eigene Anwendungen verwenden. Abbildung 2.8
zeigt die Schichtenarchitektur einer solchen Anwendung.
NITE
Als Middleware zwischen OpenNI und einer Anwendung kann NITE17 (Natural Interface
Technology for End-User) verwendet werden. Es enthält verschiedene Algorithmen, die
zur Erkennung von menschlichen Händen oder Körpern dienen. NITE wurde wie das
OpenNI SDK von OpenNI entwickelt und wird kontinuierlich optimiert. Ein möglicher
Einsatz von NITE neben anderer Middleware zur Realisierung von Anwendungen ist in
Abbildung 2.8 dargestellt.
Abbildung 2.8: OpenNI Architektur18
SimpleOpenNI
SimpleOpenNI19 ist ein OpenNI SDK und NITE Wrapper für Processing. Die aktuelle
Version ist 0.27 (Stand: 19.06.2013) und es sind nicht alle Funktionalitäten für Processing vorhanden, wie sie es in OpenNI SDK und NITE für C/C++ Anwendungen sind.
Entwickelt wurde der Wrapper von Max Rheiner an der Zürcher Hochschule der Künste.
17
18
19
[5]
Quelle: [12]
[13]
16
2.5.2 Kinetic Space
Kinetic Space20 ist ein Tool, das von Matthias Wölfel entwickelt wurde. Auf Grundlage vom OpenNI SDK und NITE, sowie einer Tiefenkamera, z.B. der oben genannten
Microsoft Kinect, können Gesten trainiert und in Gesten-Sets gespeichert werden. Der
Nutzer kann neue Gesten aufnehmen, welche mit denen im Gesten-Set verglichen werden,
was unter Berücksichtigung von Gewichtungen mit dem Dynamic Time Warping Algorithmus (siehe 2.4) geschieht. Dadurch können zu schnell oder zu langsam ausgeführte
Gesten ebenfalls erkannt werden.
Die erwähnten Gewichtungen einzelner Körperteile in den Gesten sind eine Besonderheit
von Kinetic Space. So ist zum Beispiel für eine Wurfgeste die Bewegung des Wurfarms
von großer Bedeutung. Der Wurfarm muss dementsprechend hoch gewichtet sein, damit
beim Vergleich mit dieser Geste dieser Arm einen hohen Stellenwert erhält. Die Füße
können dabei entsprechend vernachlässigt werden und sollten eine niedrige Gewichtung
erhalten.
20
[14]
17
3 Theorie und verwandte Arbeiten
In diesem Kapitel werden einige weitere Arbeiten präsentiert, deren Inhalte sich mit
Teilproblemen dieser Bachelorarbeit befassen. Im Abschnitt 3.1 werden Arbeiten vorgestellt, in denen sich genauer mit der Ergonomie von Gesten auseinandergesetzt wird. Anschließend folgen Arbeiten über die psychologische Betrachtung während der Ausführung
durch den Spieler (Abschnitt 3.2). Den Abschluss des Kapitels bildet 3.3 mit der Vorstellung von verwandten Arbeiten zur eingesetzten Technologie.
3.1 Ergonomie gestenbasierter Interfaces
Die Arbeit von Nielsen1 befasst sich mit der Zusammenstellung von Gesten-Sets zur
HCI, die für die Bedienung mit den Händen gedacht sind. Bei seinen Vorüberlegungen
bezieht er kulturelle Unterschiede mit ein, die auch Auswirkungen auf die Gestenwahl
haben. Diese Bachelorarbeit vernachlässigt hingegen die kulturellen Unterschiede, da
hier nicht festgelegt werden kann, für welche Zielgruppe ganzkörpergesteuerte Spiele
entwickelt werden. Sie ist auf die körperliche Anstrengung und deren Folgen ausgelegt.
Trotz der Abweichung von den Ganzkörpergesten in dieser Arbeit gibt es viele Parallelen
bei der Gestenfindung. Dabei wird besonderer Wert auf die Ergonomie der einzelnen
Gesten, sowie Intuition und Lernvermögen von Nutzern gelegt, die wichtige Merkmale
von Gesten-Sets sind und die in dieser Arbeit auch betrachtet werden.
Das Unternehmen Omek Interactive2 befasst sich mit der Gestensteuerung von Computersystemen und legt dabei besonderen Wert auf intuitive Bedienung und natürliche
Bewegungsabläufe. Im Blog der Homepage befinden sich einige Leitsätze für den Entwurf eines solchen Interfaces, zum Beispiel dem Layout der Benutzeroberfläche, die dem
natürlichen Beugeverhalten der Arme angepasst werden sollte, wenn eine Handsteuerung genutzt wird. Eine Überlegung, die im Rahmen der Bachelorarbeit nicht behandelt
wird, ist die Ausnutzung des zur Verfügung stehenden Raumes während der Gestenausführung. Omek Interactive nennt Bereiche “Effective Interaction Zones“ (kurz: EIZ),
in denen die Gesten am besten ausgeführt werden sollten, damit sie zum einen gut vom
System erkannt werden können und zum anderen für den Nutzer bequem ausführbar
sind. Die Einbeziehung von EIZ ist eine Möglichkeit, das Ergebnis dieser Bachelorarbeit
zu erweitern (siehe auch Kapitel 6).
Ähnlich zu der Beachtung der EIZ haben Koštomaj und Boh3 die Gestenausführung
von Kindern bei verschiedenen Computerspielen untersucht. Dabei haben sie auch analysiert, wie viel Platz jedes Kind bei diesen Spielen benötigt hat und es in Relation zu der
1
2
3
[28]
[7]
[16]
18
Situation gesetzt. Ein Ergebnis ist, dass Kinder während der Ausführung von unbekannten Gesten hektischer werden und dabei mehr Platz benötigen. Dass Geschwindigkeit
und Dynamik einer Gestenausführung deren Genauigkeit beeinflussen, ist ein entscheidender Faktor, der in dieser Arbeit berücksichtigt wird.
In ihrem Ansatz4 verfolgen Norton, Wingrave und LaViola Jr. von der University of
Central Florida eine andere Art, um natürliche Gesten zu finden, die für ein Spiel aus der
Ego-Perspektive geeignet sind. Sie lassen die Testspieler selbst entscheiden, wie sie die
Funktion per Gestik ausführen. Anschließend analysieren sie, wie oft bestimmte Gesten
von den Probanden genutzt wurden und haben die gemachten Erfahrungen dokumentiert. So ist der Durchschnitt der Bewertung zur Aussage “I wouldn’t play more than a
level at a time using full body motion because it would be too tiring.“ 5 4,14 auf einer
Skala von 1-5, wobei 5 starker Widerspruch ist. Das zeigt, dass Menschen oft Gestensteuerung bevorzugen, wenn sie die Wahl haben, da diese im Allgemeinen natürlicher
ist als eine Steuerung per Controller. Dieser Ansatz zur Gestenfindung sollte allerdings
mit einer großen Anzahl an Probanden durchgeführt werden, damit möglichst passende Gesten gefunden werden. Dadurch, dass in dieser Bachelorarbeit ein ausgeglichenes
Gesten-Set auf allgemeinem Weg definiert wird, kann diese Methode nicht angewendet
werden, enthält aber einen vielversprechenden Ansatz.
Mit einer der ersten Analysen zur Ganzkörpersteuerung von Computerspielen hat
Warren6 mit verschiedenen Prototypen zu Spielideen unter anderem den Zusammenhang
zwischen den körperlichen Fähigkeiten des Spielers und den körperlichen Anforderungen des Spiels untersucht. Bei einem Prototypen7 wurden Sprung- und Duckbewegungen
zum Spielen verwendet, sind aber recht schnell sehr anstrengend geworden. Durch Anpassung der Spielelemente konnte er den Kraftaufwand reduzieren, sodass der Spieler über
einen längeren Zeitraum besser auf das Spielgeschehen reagieren konnte, ohne großartige
Ermüdungserscheinungen vorzuweisen. Nach der Anpassung des Spiels hat er auch beobachtet, dass er, ähnlich zu den oben genannten Motivationsgruppen, nun in der Lage
war, die Spielsteuerung zu überblicken und sich eine effizientere Spielweise überlegte.
3.2 Psychologie in Spielen
In ihrem Paper8 befassen sich Bianchi-Berthouze, Kim und Patel damit, ob sich ein
Spieler mehr in ein Spiel hineinversetzen kann, wenn dieses körperliche Bewegung voraussetzt und dabei über einfache Steuerung per Controller hinausgeht. In zwei Experimenten sollten Probanden Spiele mit einem gitarrenförmigen Controller spielen. Dabei
wurde beobachtet, wie sich das Spielverhalten im Vergleich zu einem normalförmigen
Controller verändert und in einem zweiten Schritt, wie es sich verändert, wenn die Probanden alle Funktionen des Controllers kennen, die nur durch Körperbewegung genutzt
werden können. Das Ergebnis zeigte eindeutig, dass mehr Bewegung beim Spielen den
4
5
6
7
8
[17]
[17], S. 4
[29]
[29], S.66-68
[22]
19
Spielspaß aber auch den Einsatz steigern kann. Allerdings sollten es auch Bewegungen
sein, die nicht zu langsam sind bzw. die mit einem positiven Gefühl assoziiert werden. Als
Beispiel dient hier Leaning back and shaking body“, auf das die Probanden Amused,
”
”
excited, happy, content, surprised, satisfied“ 9 reagierten.
Mit der Frage, ob Spieler bei einem Spiel immer nur gewinnen wollen, beschäftigt sich
Juul10 und betrachtet verschiedene Szenarien, in denen Spieler auch verlieren wollen. Dabei stützt er sich auf die in 2.2.2 eingeführte Flow Theorie von Csı́kszentmihályi, welche
er für die Betrachtung von Spielern erweitert (s.Abb. 4.3). Auf diese Erweiterung wird
in Kapitel 4 weiter eingegangen. Im Gegensatz zu dieser Arbeit geht Juul aber genauer
auf die einzelnen Szenarien ein, wie zum Beispiel die Reaktion von Spielern, die auf keine
Weise im Spiel verlieren. Grundlage seiner Analyse sind verschiedene Experimente.
Ein Experiment zur Flowmessung in Computerspielen11 hat Böttcher in seiner Diplomarbeit durchgeführt. Dabei spielten Testpersonen ein ausgewähltes Spiel, das möglichst
immersiv sein soll. Die Erfassung der Daten des aktiven Spielers verlief über vier verschiedene Wege:
• Videoaufnahme des Spiels
• Videoaufnahme der Mimik des Spielers
• Messung der Herzfrequenz
• Messung des Hautwiderstands (elektrische Leitfähigkeit der Hautoberfläche)
Die letzten beiden Messungen wurden mit einen Sensor vorgenommen, der durchgehend
an einer Hand anliegen musste, damit die Messwerte vergleichbar blieben. Außerdem
mussten sie schon vor dem eigentlichen Spielen durchgeführt werden, um Daten über
den Ruhezustand der Testpersonen zu erhalten. Anhand dieser Messwerte konnten dann
emotionale Zustände des Spielers während des Spielens ermittelt und in Relation zu
den Ereignissen im Spiel gesetzt werden. Diese Messumgebung kann wesentlich genauere
und zuverlässigere Ergebnisse liefern, als die der Umfrage zu dieser Bachelorarbeit (siehe Abschnitt 4.1). Die Analyseresultate konnte er dann automatisiert in ein erweitertes
Flow-Modell eintragen lassen, sodass eine Bewertung des Spiels auf Immersion möglich
wird. Für genauere und aussagekräftigere Daten sollte ein ähnliches Messverfahren wie
dieses verwendet werden, sofern die technische Ausstattung vorhanden ist.
Im Artikel Movement-based sports video games: Investigating motivation and gaming
”
experience“ 12 wird u.a. das Spielverhalten von Testpersonen am Spiel Wii Boxing von
Nintendo untersucht. Wii Boxing erreicht im Vergleich zu anderen Spielen für die Nintendo Wii den höchsten Beschäftigungsgrad für den Spieler13 , sodass es potentiell anstrengend ist. Ein Ergebnis dieses Versuchs ist die Ermittlung von zwei Gruppen der
Spielermotivationen, die sich auf das Spielverhalten auswirken. Einerseits wurde das
9
10
11
12
13
[22], S. 9, Table 1
[20]
[27]
[21]
Vgl. [21], S. 51
20
Spiel gespielt, um sich vom Alltag zu entspannen und die Sportart in vereinfachter Art
nachzuempfinden, und andererseits wurde es der Herausforderung wegen gespielt.
[...] When I am playing to relax and I play baseball, I swing like I would
”
with a real baseball bat. But if I am playing to beat somebody else then I
do what I need to do the movements.“ 14
Dieses Zitat eines Probanden beschreibt die Motivationen beider Gruppen recht genau.
Die Motivation der ersten Gruppen ist es das Spiel zu spielen und der Realität für die
Zeit des Spielens zu entfliehen, weshalb dies von einer ausgeprägten Immersion zeugt. Die
zweite Gruppe hingegen versucht beim Spielen ihre Spielweise so an die technischen Gegebenheiten anzupassen, dass mit minimalen Aufwand möglichst gute Resultate erzielt
werden. Eine dritte Gruppe wurde Bianchi-Berthouze15 beschrieben, deren Bewegungen eher unsicher oder ukoordiniert sind. In diesem Fall kennen die Spieler die Sportart
nicht gut genug kennt, um deren Bewegungen gut nachahmen zu können, oder kennen
sich nicht mit der verwendeten Bewegungssteuerung aus, um diese möglichst effizient zu
verwenden, wie es die zweite Gruppe tut.
3.3 Technologie
Matthias Wölfel16 hat zu seinem Tool Kinetic Space ein Paper verfasst, dass die Funktionsweise des Programms beschreibt und auf die Einsatzmöglichkeiten eingeht. Wie
Kinetic Space genutzt werden kann, ist in Abschnitt 2.5.2 näher erläutert. Dadurch,
dass Gesten recht effizient mit einem bestehenden Set verglichen werden können, ist es
als Grundlage für ein Tool gut geeignet, das während der Bearbeitung konzipiert wurde.
Mit der PRO Version von Kinetic Space können benutzerdefinierte OSC-Nachrichten17
an andere Applikationen gesendet werden. Eine Nachricht wird verschickt, wenn eine
Geste mit einer gespeicherten verglichen wird, und kann Informationen über das aktuelle Resultat der Kostenfunktion und den Namen der Referenzgeste enthalten, die von
der Applikation weiterverarbeitet werden.
Einen anderen Ansatz zur Gestenerkennung verfolgt das Full Body Interaction Framework (FUBI18 ), das seit 2011 an der Uni Augsburg entwickelt wird. Gesten werden nicht
wie bei Kinetic Space aufgenommen und mit Gewichtungen angepasst, sondern per C++
Code oder XML manuell definiert. Dabei können gewisse Grenzen gesetzt werden, in denen sich zum Beispiel die z-Koordinate der rechten Hand bewegen darf, um als Teil einer
Geste erkannt zu werden. Es wird zwischen folgenden Gestentypen unterschieden:
1. Posen (statische Gesten)
2. Gesten mit linearer Bewegung
14
15
16
17
18
[21], S. 5
[1], S. 102
[14]
[18], S. 1
[3]
21
3. Kombinationen aus Posen und linearer Bewegung
4. komplexe Gesten
Während die Erkennung von Posen und Gesten mit linearer Bewegung recht einfach definierbar ist, müssen für die Erkennung der Typen 3 & 4 andere Methoden angewendet
werden. Eine Kombination (Typ 3) wird hier versucht als Folge von Gesten des Typs 1
oder 2 interpretiert zu werden, damit im Optimalfall alle Glieder erkannt werden und
so die eigentliche Geste zusammengesetzt wird. Für komplexe Gesten funktioniert dieser
Ansatz hingegen nicht mehr, da im Voraus nicht alle Gesten so definiert werden können,
sodass jedes mögliche Folgenglied berücksichtigt wird. Gesten des Typs 4 lassen sich
dadurch nicht zuverlässig mit FUBI erkennen. Die Idee, Gesten als Folgen zu interpretieren, ist aber für diese Bachelorarbeit interessant, da Spiele mit Bewegungssteuerung
eine begrenzte Anzahl an Gesten verwenden, die in verschiedenen Kombinationen eingesetzt werden. Außerdem wäre es durch die begrenzte Menge möglich, alle vorkommenden
Gesten manuell zu definieren.
22
4 Ausgeglichene Gesten-Sets
“Not all full body interaction is fun and accounts need to be made for issues
such as exhaustion, injury avoidance and boredom.“ 1
Auf Grundlage dieser Aussage baut dieses Kapitel auf. Denn diese Einschränkung ist
sinnvoll, um das erwähnte positive Spielerlebnis erzeugen zu können. Somit stellt sich
die Frage nach der Ausgeglichenheit eines Gesten-Sets, wobei hier Ausgeglichenheit das
reduzierte Risiko einer Unterforderung, die zur Langeweile führen könnte, oder einer
Überforderung, die zu übermäßig anstrengenden Bewegungen oder gar zu einer Verletzung führen könnte, beschreibt. Die Genauigkeit der Gestenausführung spielt eine
ähnliche Rolle.
Ein Spieler, der Gesten nahezu perfekt ausführen muss, wird wahrscheinlich nach einem
relativ geringem Zeitraum frustriert aufgeben. Im Gegensatz dazu wird sich ein Spieler
mit zu großen Freiheiten bei der Ausführung nach einer gewissen Zeit langweilen.
Um geeignete Gesten-Sets zu finden, müssen diese Probleme erkannt und angemessen
gelöst werden. Das bedeutet, dass sich mit möglichen Reaktionen von Spielern auf die
Gesten (siehe Abschnitt 4.2) auseinandergesetzt werden muss. Ebenso mit der Differenzierbarkeit von Gesten und deren Energieaufwand bei der Ausführung, was in dieser
Arbeit mit einer Umfrage untersucht wird (siehe Abschnitt 4.1).
4.1 Umfrage zur Gestenbewertung
Um einen Eindruck zu bekommen, wie verschiedene Personen Gesten während der Ausführung
empfinden, wurde im Rahmen dieser Arbeit eine Umfrage durchgeführt, die zur Bewertung festgelegter Gesten auf persönliche Anstrengung erstellt worden ist.
An der Umfrage haben 35 Personen teilgenommen. Die Probanden waren zwischen 18
und 28 Jahren alt. Diese Altersgruppe wurde gewählt, da viele Spieler nach einer Statistik des BIU (s.Abb.4.1) zwischen 20 und 29 Jahre alt sind. Die Altersgrenzen wurde
zugunsten etwas jüngerer Spieler, die schon volljährig sind, gesenkt.
4.1.1 Aufbau und Durchführung
Für die Umfrage wurden sieben verschiedene Gesten ausgewählt, die jeweils mit der
rechten und linken Körperhälfte ausgeführt werden sollten. Jede Geste wird aktiv nur
1
2
[17], S. 1
[2]
23
Abbildung 4.1: BIU Statistik zur Altersverteilung von Gamern2
von einem Körperteil ausgeführt, damit sie einer von vier Bewegungszonen zugeordnet
werden kann:
• rechter Arm
• linker Arm
• linkes Bein
• rechtes Bein
Eine Geste sollte 20 Sekunden lang stehend, in einer konstanten Geschwindigkeit ausgeführt und anschließend vom Probanden, auf die persönliche Anstrengung während der
Ausführung hin, bewertet werden. Die Bewertung erfolgte ähnlich der Borg-Skala, die
auf einer Skala von 6 ( sehr sehr leicht“) über 13 ( etwas anstrengend“) bis 20 ( sehr sehr
”
”
”
schwer“) angelegt ist, mit dem Unterschied, dass bei einigen Versuchen mit Bewertungen
auf Grundlage der Borg-Skala die Herzfrequenz und der Atemrhythmus berücksichtigt
werden. Aufgrund von technischen Einschränkungen wurde auf diese Messungsmethode
verzichtet und dem Probanden selbst überlassen, wie er seine Anstrengung einschätzt.
Die verwendete Skala ist im Intervall von 0 ( sehr leicht“) bis 10 ( sehr anstrengend“)
”
”
angelegt. Diese Vorgehensweise besitzt den Nachteil, dass die Resultate der einzelnen
Probanden nicht anhand vorgegebener Merkmale verglichen werden können. Das kann
aber vernachlässigt werden, da das Empfinden des Spielers entscheidend ist und nur
subjektiv bewertet werden kann.
Die in Tabelle 4.1 aufgelisteten Gesten wurden von den Probanden (jeweils rechts und
links) ausgeführt und bewertet. Ein rot markierter Bereich in der Skizze kennzeichnet
eine aktive Zone, ein blau markierter eine passive.
Die Gesten wurden in geforderter Länge und Geschwindigkeit in jeweils einem Video
vorgemacht und sollten nacheinander ausgeführt werden. Die wiederholte Ausführung
24
Tabelle 4.1: Umfragegesten (jeweils rechte und linke Körperhälfte)
Bewegungszone
Ausgeführte Gesten
1. Arm waagerecht rechts ausstrecken (Pose)
2. Arm waagerecht nach vorne ausstrecken (Pose)
3. Arm senkrecht nach oben ausstrecken (Pose)
4. Winkbewegung, dabei waagerechter Oberarm (lineare
Bewegung)
5.
Angelwurf“ / Schwerthieb“ ]90° nach vorne (lineare
”
”
Bewegung)
1. Bein ]30° zum anderen Bein anwinkeln (Pose)
2. Knie wiederholt anheben (lineare Bewegung)
(bzw. längere Ausführung bei Posen) ist notwendig gewesen, um eine Anstrengung hervorzurufen, die bewertet werden kann. Sie hat in diesem Kontext keine realitätsnahe
Anwendungsmöglichkeit als Hintergrund. Bei der Ausführung wurde in der Anordnung
ein häufiger Wechsel der Bewegungszone berücksichtigt, sodass ein Bereich nicht überanstrengt werden kann und für jede einzelne Gestenausführung annähernd gleiche Ausgangsbedingungen vorhanden waren. Nach jeder Ausführung sollte der Proband diese
Geste nach der oben dargestellten Skala bewerten. Am Ende der Umfrage wurden die
Ergebnisse, samt Alter und Geschlecht des Probanden, per Mail abgeschickt, sodass sie
ausgewertet werden konnten.
4.1.2 Auswertung
Die Ergebnisse der Umfrage sind in Abbildung 4.2 enthalten. Aus den Bewertungen der
35 Probanden konnte für jede Geste ein Durchschnittswert berechnet werden, der zwar
nicht repräsentativ ist, aber eine Tendenz angibt. In den Zeilen der Tabelle sind die
einzelnen Gesten, sortiert nach ihrem Durchschnittswert, eingetragen. In den Spalten
rechts von den Durchschnittswerten befinden sich die Bewertungen der einzelnen Probanden zu jeder Geste, wobei alle Werte eines Probanden in einer Spalte vorhanden sind.
Jede Zelle, die eine Bewertung enthält, ist entsprechend ihres Wertes eingefärbt, wobei
der Wert 0“ mit einer weißen und der Wert 10“ mit einer dunkel-orangenen Färbung
”
”
angezeigt wird. Unter den Bewertungen eines Probanden sind diese aufsummiert. Nach
25
Abbildung 4.2: Umfrageergebnisse
diesen Summen wurden die Testpersonen in aufsteigender Reihenfolge sortiert.
Trotz subjektiver Einschätzungen ohne medizinische Belege lassen sich aus den Ergebnissen mehrere Schlussfolgerungen ziehen:
1. Gesten, die mit dem rechten Arm ausgeführt werden, sind im Allgemeinen (ohne
Berücksichtigung der Händigkeit) weniger anstrengend als die entsprechend mit
dem linken Arm ausgeführten Gesten.
2. Mit einem Bein aktiv ausgeführte Gesten sind im Allgemeinen anstrengender als
Gesten, die mit einem Arm ausgeführt werden.
3. Gesten, die mit dem linken Bein ausgeführt wurden, sind im Allgemeinen nicht
wesentlich anstrengender als die entsprechend mit dem rechten Bein ausgeführte
Geste.
Die Erklärung für 1. ist die häufigere und vielfältigere Nutzung des rechten Arms im
Alltag, weshalb Gesten mit dem rechten Arm natürlicher wirken und so auch weniger
anstrengend sind.
Wenn eine Geste mit einem Bein ausgeführt wird, ist dieses zwar aktiv, aber das andere
Bein muss in diesem Zeitraum die Balance des Körpers halten, wofür normalerweise beide Beine eingesetzt würden. Zusätzlich zu der Verschiebung des Körperschwerpunkts auf
das passive Bein kann durch mögliche Bewegungen des aktiven Beins der Schwerpunkt
kontinuierlich verschoben werden. Dadurch entsteht auch ein erhöhter Kraftaufwand für
das passive Bein. Bei Armen tritt diese Tatsache in wesentlich geringerem Maße auf, da
sie den Körper nicht primär im Gleichgewicht halten müssen. Dadurch ist eine einseitige
Belastung, wie in 2. beschrieben, bei Beinen anstrengender als bei Armen.
Ähnlich zu den vorhergehenden Erklärungen lässt sich die dritte Schlussfolgerung herleiten: Jeder Mensch bevorzugt eines seiner Beine für verschiedene Bewegungen. Das macht
sich beim Abspringen mit einem Bein bemerkbar, ist aber beim normalen Laufen nicht
weiter auffällig. Da beide Beine für alle Bewegungsabläufe im Alltag wichtig sind, um
das Körpergleichgewicht zu bewahren, unterscheiden sie sich auch nicht sonderlich beim
26
Kraftaufwand. Das gilt natürlich nicht für Personen, die ihre Körper einseitig trainieren.
Die Probanden 1, 4, 6 und 13 empfanden die Armgesten als gar nicht oder sehr gering anstrengend. Die Beingesten dagegen haben sie als etwas anstrengend“ bis sehr
”
”
anstrengend“ bewertet. Dies kann nicht zuverlässig ohne das Wissen über mögliche Verletzungen der Probanden bewertet werden, bestätigt aber die zweite Schlussfolgerung.
Eine Auffälligkeit nach der Sortierung bezüglich Durchschnittswert der Gesten und Bewertungssumme ist der Farbverlauf, der sich ergibt. An ihm ist ablesbar, dass die Werte
einer Spalte von oben nach unten im Allgemeinen größer werden, genauso wie von links
nach rechts. Letzteres könnte auf die subjektive Bewertung zurückgeführt werden, da
Probanden in der rechten Hälfte der Tabelle die erste Geste persönlich als anstrengender
empfunden haben als die Probanden in der linken Hälfte. Die folgenden Gesten wurden
ab diesem Zeitpunkt in Relation zu der ersten Geste, der Referenzgeste, gesetzt, weshalb
die Bewertungen im Vergleich höher sind als die der linken Tabellenhälfte.
4.1.3 Zwischenfazit
Aus den Daten der Umfrage ließ sich einiges über den Aufbau und Einsatz eines guten
Gesten-Sets erfahren, auch wenn eine Auswertung mit medizinischen Daten, wie sie von
Böttcher3 erfasst wurden, mehr über den genauen Kraftaufwand aussagen würde, als
die subjektiven Bewertungen der Probanden. Dennoch weist das Ergebnis eindeutig die
Diskrepanz der subjektiven Bewertungen auf, die in Bezug auf ein positives Spielerlebnis genauso aussagekräftig sind. Dadurch wird die Funktion eines Durchschnitsspielers
wichtiger, um auf die verschiedenen Fähigkeiten eingehen zu können, was zum Beispiel
durch Schwierigkeitsstufen realisiert werden kann.
Für ein ausgeglichenes Gesten-Set bietet sich eher an, Gesten vom Oberkörper ausführen
zu lassen, da so das Körpergleichgewicht leichter bewahrt werden kann. Auf diese Weise
muss sich der Spieler nicht zusätzlich zum Spielgeschehen und der eigentlichen Geste auf
die Erhaltung des Gleichgewichts konzentrieren.
4.2 Psychologie
Das in 2.2.2 beschriebene Flow Modell von Csı́kszentmihályi dient zur Veranschaulichung der optimalen Schwierigkeitsstufe eines Spiels, wenn nur ein Spieler betrachtet
wird. Spiele werden aber im Allgemeinen für ein großes Publikum entworfen und entwickelt, sodass die Rolle des Spielers verloren geht und das Modell vorerst nicht zutreffen
kann.
Trotzdem muss, wie in Abschnitt 3.2 erwähnt, vom Entwickler festgelegt werden, wie
ein Spiel wirken soll und ob es eine Lernkurve der Fähigkeiten voraussetzt. Durch diese
Überlegungen wird eine Zielgruppe definiert und somit auch der Spieler bzw. ein Durchschnittsspieler für dieses Spiel. Durch diesen Spieler kann auch wieder das Flow Modell
angewendet werden.
3
[27]
27
Ein Spiel kann einen Spieler auch etwas mehr fordern, als es seine Fähigkeiten zu diesem
Zeitpunkt zulassen, damit er sie erweitern muss, um eine bestimmte Aufgabe zu lösen.
Damit sich ein Spieler aber nicht dauerhaft in einem Stresszustand befindet, gibt es zwei
Möglichkeiten diesen zu beenden oder zu umgehen.
Zum einen ist die Abwechslung von Stresssituationen und Ruhephasen eine geeignete Methode dieses zu erreichen, da der Adrenalinausstoß des Spielers wieder reguliert werden
kann, aber auch weil er nach Bewältigung einer schwierigen Situation im Optimalfall ein
Glücksgefühl erhält, das er in der Ruhephase genießen kann. Zum anderen können verschiedene Schwierigkeitsstufen in das Spiel implementiert werden, die das Flow Modell
im Vergleich zum Durchschnittsspieler um weitere Flow Zones erweitern. Durch diese
variierenden Stufen kann ein Spieler sich selbst einstufen, um so seiner persönlichen
Flow Zone möglichst nahe zu kommen, die ihm dann wiederum ein positives Spielerlebnis bereiten kann. Ein weiterer Vorteil tritt mit dem Ausbau der Fähigkeiten auf.
Ist der Spieler durch die aktuelle Schwierigkeitsstufe unterfordert, kann er sie erhöhen,
damit die Aufgaben seinen Fähigkeiten angepasst werden. Beide Möglichkeiten können
auch gut kombiniert werden. In Abbildung 4.3 ist ein möglicher Schwierigkeitsgrad als
grüner Pfeil dargestellt und die optimale Flow Zone des Spielers als blaue gestrichelte
Linie. Je nach Spielfortschritt wird der Spieler etwas gefordert (grüner Pfeil ist über
der Flow Zone) oder kann sich etwas entspannen (grüner Pfeil ist unterhalb der Flow
Zone). Hinzu kommt die Motivation des Spielers, mit der er das Spiel spielen will. Die
von Pasch4 ermittelten Motivationsgruppen sind eine gute Grundlage, auf der ein Spiel
entwickelt werden sollte. Ist die Motivation die Immersion selbst, sollte der Fokus auf
Gesten liegen, die den Bewegungsabläufen im Spiel ähnlich sind. Zum Beispiel könnte
ein Rollenspiel, das aus der Third Person Perspektive gesteuert wird, Gesten verwenden,
die den Bewegungen der Spielfigur sehr ähnlich sind. Der Nachteil an dieser Stelle ist,
dass einige Bewegungen der Spielfigur in der Realität sehr anstrengend sein könnten. Das
würde sich u.a. bei Spielen des Genres Action-Adventure bemerkbar machen, in denen
die Spielfigur oft mit vielen Sprüngen und schnellen Aktionen in Kämpfen konfrontiert
wird, die der Spieler steuern muss. Ist die Gestensteuerung in solchen Situationen zu
realistisch, dann würde sich der Spieler einen Großteil der Spielzeit deutlich über seiner Flow Zone befinden und somit überfordert sein. Außerdem wird die Steuerung nach
einiger Zeit als zu anstrengend empfunden, wenn die Gesten nicht natürlich sind. Der
Spieler kann dadurch nicht mehr die Zeit investieren, um sich in das Spiel zu vertiefen,
da er nur mit der Ausführung der Gesten beschäftigt ist.
Ein ebenso wichtiger Faktor beim Spielen ist die Genauigkeit der Gestenausführung.
Der Spieler könnte in einer Situation, in der er überfordert ist, die benötigten Gesten
ungenauer ausführen, wie es von Kostomaj und Boh5 bei Kindern beobachtet wurde.
Es ist möglich, dass eine Geste als eine andere erkannt wird, wenn der Spieler bei der
Ausführung unkonzentriert ist. Durch diese Fehlinterpretation wird eine andere als die
gewünschte Aktion im Spiel gestartet, was bei häufiger Wiederholung zu Frustration
seitens des Spielers führen kann.
4
5
[21]
[16]
28
Abbildung 4.3: Flow in Spielen6
4.3 Zwischenfazit
Bei der Gestaltung eines Gesten-Sets sind mehrere Faktoren zu beachten, wie die Psychologie des Spielers und dessen körperliche Fähigkeiten. Dabei darf sich aber nicht
auf einen realen Spieler konzentriert werden, sondern es sollte der Durchschnittsspieler
der gewünschten Zielgruppe ermittelt werden. Um ihn zu finden, müssen Versuche mit
Spielern der Zielgruppe durchgeführt werden, in denen ähnlich wie bei der Umfrage Bewegungen durchgeführt werden, aus denen sich die durchschnittliche körperliche Fitness
ermitteln lässt. Damit zuverlässige Daten erhoben werden können, sollte zusätzlich zur
Befragung der Probanden eine automatische Messung von medizinischen Werten durchgeführt werden, wie es von Böttcher7 getan wurde.
Wenn der Spieler für das Spiel möglichst genau ermittelt wurde, können Gesten gestaltet
werden, die möglichst natürlich in der Ausführung sind und sich nicht zu sehr ähneln.
Geeignete Gesten lassen sich mit einem Programm finden, wie es in 5 beschrieben ist.
Beim Einsatz der Gesten sollte noch beachtet werden, dass anstrengende Gesten nicht zu
häufig eingesetzt werden, um den Spieler einerseits physisch zu schonen und andererseits
das positive Spielerlebnis zu wahren.
6
7
[20], S. 248
[27]
29
5 Toolkonzeption
Im Rahmen der Bachelorarbeit wurde ein Tool zur automatischen Umsetzung einiger der
gewonnenen Erkenntnisse konzipiert. Dazu gehört insbesondere die Frage nach der Differenzierbarkeit der Gesten, als auch die Betrachtung der Ergonomie. Die Erkenntnisse
zu der Psychologie des Spielers werden durch die Module Ergonomie und Differenzierbarkeit im Konzept umgesetzt.
In diesem Kapitel wird zuerst in Abschnitt 5.1 ein Überblick über eine mögliche Architektur der Software gegeben, bevor in 5.2 und 5.3 die einzelnen Module näher erläutert
werden.
5.1 Architekturübersicht
Abbildung 5.1: Tool Softwarearchitektur
Das Programm soll dem Entwickler möglichst viele Freiheiten bei dem Entwurf des
Gesten-Sets bieten, aber dabei die in dieser Bachelorarbeit analysierten Merkmale eines
ausgeglichenen Gesten-Sets berücksichtigen. Daher ist es für die Software unerlässlich
ein Mittel zur Bestimmung der Differenzierbarket aller Gesten im Set zu besitzen, als
auch die Gesten einzeln auf physische Anstrengung zu untersuchen.
In der Softwarearchitektur des Tools (s. Abb. 5.1) existieren die Module Differenzierbarkeit und Ergonomie, die zur Lösung dieser Probleme eingesetzt werden. Kinetic Space
in der PRO Version ist eine zentrale Komponente der Software, denn Gestenvergleiche
werden darüber realisiert. Der Einsatz ist damit begründet, dass Kinetic Space mehrfach
erfolgreich eingesetzt worden ist1 und stabil während der Ausführung läuft. Außerdem
1
[14], S. 63
30
kann die Kostenfunktion des genutzten DTW-Algorithmus auch sinnvoll vom Modul
Differenzierbarkeit genutzt werden. Die Gesten Datenbank (GestenDB) enthält Gesten,
die durch eine ausreichende Anzahl Probanden auf Anstrengung bewertet worden sind,
und der Gesten-Pool hält alle Gesten, die aktuell zum Gesten-Set gehören. Die grafische
Oberfläche des Tools ist ähnlich der von Kinetic Space aufgebaut (s. Abb. 5.2), weil dort
die wichtigen Informationen übersichtlich angeordnet sind, wie zum Beispiel das Abspielen der ausgeführten Geste und die einstellbaren Gewichte. Das GUI benötigt noch einen
Regler für die Einstellung von Kostentoleranzen, die in Abschnitt 5.2 erklärt sind, sowie
eine Anzeige für die ermittelte Anstrengung aus Abschnitt 5.3.
Abbildung 5.2: Benutzeroberfläche von Kinetic Space2
5.2 Modul Differenzierbarkeit
Das Modul Differenzierbarkeit dient zur Sicherstellung, dass sich Gesten in einem GestenSet nicht zu ähnlich sind. Dieses Modul ist eine wichtige Komponente des Konzepts, denn
mit ihm soll die Fehlinterpretation von Gesten beim Spielen schon während der Entwicklung reduziert werden.
Die Grundlage bilden ein Gesten-Pool, der anfangs keine Gesten enthält, und Kinetic
Space in der PRO Version. Der Nutzer kann eine neue Geste aufnehmen, die dem GestenSet hinzugefügt werden soll. Diese wird mit allen vorhandenen Gesten im Gesten-Pool
durch Kinetic Space verglichen, indem für jede enthaltene Geste die Kosten bestimmt
werden. Jede Geste im Gesten-Pool muss einen individuellen Kostenwert gespeichert
haben, der die Genauigkeit der Ausführung für diese Geste angibt. Das Ergebnis der
DTW-Kostenfunktion wird als OSC-Nachricht an das Modul Differenzierbarkeit gesendet. Sind die Kosten jeweils über dem Grenzwert der Geste, den der Entwickler festlegen
muss, dann ist der Unterschied zwischen den verglichenen Gesten groß genug, um eine
Fehlinterpretation zu vermeiden. Wenn keine große Ähnlichkeit entdeckt wurde, kann die
aufgenommene Geste dem Gesten-Pool hinzugefügt werden und mit den beschriebenen
Funktionen von Kinetic Space trainiert werden.
2
[14], S. 60
31
Ein frei wählbarer Kostenwert ist sinnvoll, damit der Entwickler eigene Game Design
Entscheidungen umsetzen kann, die zum Beispiel eine möglichst genaue Ausführung fordern.
Ein anderes Szenario enthält Spielabschnitte, in denen der Spieler bewusst gefordert
wird und so die Ausführung der Gesten ungenauer werden kann. Ein Beispiel hierfür ist
der Prototyp Duck and Jump 3 , bei dem der Spielablauf selbst sehr fordernd war von der
Schnelligkeit und Intensität der Bewegungen, sodass Anpassungen vorgenommen werden
mussten. Mit Hilfe einer Erhöhung des variablen Kostenwertes ist es möglich dem Spieler
diesen Spielabschnitt zu erleichtern, wenn dort eine bestimmte Geste verwendet werden
soll.
Der Vergleich durch dieses Modul erfolgt zeitlich vor der Anstrengungsanalyse, da diese
nicht durchgeführt werden muss, wenn die Differenzierbarkeit nicht gewährleistet ist.
5.3 Modul Ergonomie
Zur Ermittlung der Anstrengung einer Ganzkörpergeste wird für dieses Tool eine Kombination aus Kinetic Space und FUBI verwendet, bei dem Gesten in verschiedene Glieder
unterteilt werden. Die Unterteilung erfolgt in die vier Körperbereiche, die in der Umfrage
betrachtet wurden. Die Gesten Datenbank hält somit nur Gesten, die anhand des aktiven Körperteils einem Bereich zugeordnet werden können. Bei der Analyse einer Geste
werden nun die Körperteile mit den gespeicherten durch Kinetic Space verglichen, was
mit den Gewichtungen einfach realisierbar ist. Im Idealfall werden vier Gesten erkannt,
deren Anstrengungswerte ausgelesen werden können und zu einer Gesamtanstrengung
für diese Geste verrechnet werden. Die Idee hinter der Aufteilung entspricht dem eines
Baukastensystem, mit dem verschiedene Gesten erfasst werden können, ohne jede einzeln
aufnehmen zu müssen.
5.4 Diskussion
Die Aufteilung der Gestenanalyse in vier Bereiche kann die Anstrengungsberechnung
erleichtern, da nur eine relativ geringe Menge an Teilgesten verwendet werden muss, um
viele Ganzkörpergesten zusammenzusetzen. Ein Nachteil ergibt sich aber durch eben
diese Zusammensetzung, die ebenfalls ein Problem bei dem FUBI Projekt ist, weil komplexe Gesten nicht zuverlässig berechnet werden können. Die Winkbewegung aus der
Umfrage wurde als nicht sehr anstrengend bewertet. Wenn sie aber in Kombination mit
unnatürlicher Körperhaltung ausgeführt wird, könnte sie als wesentlich anstrengender
empfunden werden. Daher sollte der Einsatz eines solchen Tools auf Posen und lineare
Bewegungen beschränkt werden, solange keine zuverlässigen Berechnungsmethoden für
die Gesamtanstrengung vorliegen.
Die Toleranzwerte aus dem Modul Differenzierbarkeit geben dem Entwickler Freiheiten
bei dem Entwurf seines Gesten-Sets. Durch zu hohe oder zu niedrige Werte kann aber der
3
[29], S.66-68
32
Spielspaß minimiert werden, da bei zu hohen Werten die Genauigkeit stark sinkt, damit
die Geste erkannt wird, und bei zu niedrigen die ausgeführte Geste nahezu identisch mit
der Referenzgeste sein muss. Daher ist es erforderlich, dass die Gesten oft von verschiedenen Personen trainiert werden, damit ein zufriedenstellendes Ergebnis vorliegen kann.
Beim Trainieren müssen, ähnlich wie die Gewichtungen von Kinetic Space, die Toleranzwerte optimiert werden, um dem Spieler ein möglichst positives Spielerlebnis bieten zu
können.
Weitere Vor- und Nachteile können erst nach Implementierung und Testen des Tools
erkannt und adäquat behandelt werden.
33
6 Zusammenfassung und Ausblick
Das Erstellen eines ausgeglichenen Gesten-Sets besitzt viele verschiedene Faktoren, die
nicht alle in einer Bachelorarbeit erfasst und in vollem Umfang analysiert werden können.
Das Betrachten von Spielerverhaltensweisen lässt aber Tendenzen erkennen, wie bestimmte Bewegungen empfunden werden, das aber im Kontext des Spiels geschehen
muss. Anhand dieser Tendenzen kann ungefähr ein Durchschnittsspieler der Zielgruppe
ermittelt werden, dessen Flow Zone als Anhaltspunkt für den weiteren Entwurf maßgeblich sein sollte. Das kann sich auf das Game Design auswirken, aber vor allem auf
ein ausgeglichenes Gesten-Set und dessen Einsatz. Durch Abwechslung von psychisch
und physisch fordernden, sowie entspannenden Spielabschnitten kann beim Spieler ein
positives Spielerlebnis erschaffen werden.
Fordernde Abschnitte können unter anderem durch komplexere Gesten gestaltet werden
und für die der Spieler seine Fähigkeiten erweitern muss, um sich in der folgenden Spielphase mit einem Glücksgefühl entspannen kann. Ein ausgeglichenes Set sollte für diesen
Zweck nicht zu viele komplexe Gesten enthalten und dem Spieler eine genügend große
Auswahl bieten, damit er sie seinen Fähigkeiten entsprechend einsetzen kann.
Außerdem sollten sich die Gesten im Set nicht zu sehr ähneln, damit ungewollte Fehlinterpretationen, die Frustration hervorrufen können, möglichst nicht auftreten.
Überlegungen zu kulturellen Unterschieden, wie sie von Nielsen1 vorgeschlagen wurden,
sollten ebenfall ein Bestandteil des Entwurfs sein, auch wenn die Globalisierung voranschreitet und sich einige Verhaltensweisen anpassen.
Zu den Möglichkeiten, die in der Toolkonzeption erfasst wurden, können noch weitere
Elemente hinzugefügt werden. Die Voraussetzung für zuverlässige Erweiterungen ist eine
größere Menge an Daten, die ähnlich denen der Umfrage als Grundlage genommen wird.
Die Anzahl sollte für repräsentative Daten ausreichend sein, damit die Entwicklung der
Zielgruppe gerecht wird.
Das Tool könnte eine Berücksichtigung der Händigkeit aufweisen, damit die Ergonomie
für Rechts- und Linkshänder gleichermaßen optimiert werden kann. Für die Verbesserung der Ergonomie sollte auch eine Einbeziehung der Effective Interaction Zones, wie
sie von Omek Interactive2 definiert wurden, in Erwägung gezogen werden, da die betrachteten Gesten der Umfrage auf einem festen Punkt im Raum ausgeführt wurden.
Durch die Ausnutzung des weiteren Raums ergeben sich weitere Möglichkeiten Gesten
zu gestalten, aber ebenso weitere Herausforderungen bei der Ermittlung der Anstrengung.
1
2
[28], S. 409ff
[7]
34
Abgesehen von den Features, um die das Tool erweitert werden könnte, muss auch der
Fortschritt der Hardware in die Überlegungen miteinbezogen werden. Die nächste Generation der Kinect-Kamera kann nach aktuellen Angaben Muskelspannungen erkennen,
sowie die Herzfrequenz der erfassten Personen messen.3 Dadurch, dass der Puls von Personen von der neuen Kinect-Kamera gemessen werden kann, können Analyseverfahren
des Tools optimiert und die Gesten zuverlässiger trainiert werden. Eine Implementierung
des Tools kann bei Erscheinen und Nutzung der nächsten Generation der Kinect profitieren, denn sie erlaubt Vereinfachungen bei der Ermittlung der notwendigen Daten.
Außerdem besitzt sie eine höhere Auflösung, die die Bewegungserkennung präzisiert und
somit für die Differenzierbakeit vorteilhaft ist.
3
[9]
35
Quellenverzeichnis
[1] Bianchi-Berthouze, N. (2013): Understanding the role of body movement in player
engagement; in: ACII ’07 Proceedings of the 2nd international conference on Affective Computing and Intelligent Interaction, Springer-Verlag Berlin, Heidelberg, S.
102-113
[2] Bundesverband Interaktive Unterhaltungssoftware e.V. Statistik (2013) Online
Link: www.biu-online.de/de/fakten/gamer-statistiken/altersverteilung.
html (14.06.2013)
[3] FUBI - Full Body Interaction Framework (2013) Online Link: http://www.
informatik.uni-augsburg.de/en/chairs/hcm/projects/fubi/ (21.06.2013)
[4] Nintendo Wii (2013) Online Link: www.nintendo.de/Wii/Wii-94559.html
(10.06.2013)
[5] NITE (2013) Online Link: www.openni.org/files/nite (11.06.2013)
[6] Nordin, A.I. et al. (2013): Attention, time perception and immersion in games; in:
CHI 2013 Extended Abstracts, Paris, S. 1089-1094
[7] Omek Interactive (2013) Online Link: www.omekinteractive.com (11.05.2013)
[8] OpenNI (2013) Online Link: www.openni.org (11.06.2013)
[9] The Next Web: The new Xbox One Kinect tracks your heart rate, happiness, hands
”
and hollers“ (2013) Online Link: www.thenextweb.com/microsoft/2013/05/22/
the-new-xbox-one-kinect-tracks-your-heart-rate-happiness-hands-and-hollers
(25.06.2013)
[10] Kinect for Windows Components (2012) Online Link: www.msdn.microsoft.com/
en-us/library/jj131033.aspx (20.06.2013)
[11] Kinect for Windows FAQ (2012) Online Link: www.microsoft.com/en-us/
kinectforwindows/news/faq.aspx (20.06.2013)
[12] OpenNI Architektur (2012) Online Link: www.primesense.com/wp-content/
uploads/2012/10/DPA1.png (20.06.2013)
[13] SimpleOpenNI (2012) Online Link: https://code.google.com/p/simple-openni/
(11.06.2013)
36
[14] Wölfel, M. (2012): KineticSpace 3D Gestenerkennung für dich und mich, Pforzheim:
Konturen, S.58-63
[15] HAW Hamburg Kinect Punktmuster (2010) Online Link: http://livingplace.
informatik.haw-hamburg.de/blog/wp-content/uploads/2010/11/kinect1.
png (17.04.2013)
[16] Koštomaj, M. / Boh, B. (2010): Design and Evaluation of User’s Physical Experience
in Full Body Interactive Games; in: Multimedia Tools and Applications, Volume 54
(2011), Springer-Verlag Berlin, Heidelberg, S. 499-525
[17] Norton, J. / Wingrave, C.A. / LaViola Jr., J.J. (2010): Exploring Strategies and
Guidelines for Developing Full Body Video Game Interfaces; in: Proceedings of the
Fifth International Conference on the Foundations of Digital Games, ACM New
York, New York, S. 155-162
[18] Schmeder, A. / Freed, A. / Wessel, D. (2010): Best Practices for Open Sound
Control; in: Linux Audio Conference (2010)
[19] Game Architecture (2009) Online
immersion-vs-flow (09.06.2013)
Link:
www.gamearch.com/2009/05/05/
[20] Juul, J. (2009): Fear of Failing? The Many Meanings of Difficulty in Video Games;
in: Wolf, M.J.P. / Perron, B. (Hrsg.): The Video Game Theory Reader 2, Routledge,
New York, S. 237-252
[21] Pasch, M., et al. (2009): Movement-based sports video games: Investigating motivation and gaming experience; in: Entertainment Computing 1 (2009), Elsevier,
Amsterdam, S. 49-61
[22] Bianchi-Berthouze, N. / Woong Kim, W. / Patel, D. (2007): Does body movement
engage you more in digital game play? And why?; in: Affective Computing and
Intelligent Interaction (2007), Springer-Verlag Berlin, Heidelberg, S. 102-113
[23] Mueller, F. / Gibbs, M. / Vetere, F. (2007): Taxonomy of Exertion Games; in:
Proceedings of the 20th Australasian Conference on Computer-Human Interaction:
Designing for Habitus and Habitat, ACM New York, New York, S. 263-266
[24] Müller, M. (2007): Information Retrieval for Music and Motion (Chapter 4: Dynamic
Time Warping), Springer Berlin Heidelberg, S. 69-84
[25] Chen, J. (2007): Flow in Games (and Everything Else); in: Communications of the
ACM Vol. 50 (2007), ACM New York, New York, S. 21-34
[26] Ermi, L. / Mäyrä, F. (2005): Fundamental components of the gameplay experience:
Analysing immersion; in: DIGRA (2005), DIGRA
[27] Böttcher, Ralf Armin (2005): Flow in Computerspielen (Diplomarbeit)
37
[28] Nielsen, M., et al.(2003): A procedure for developing intuitive and ergonomic gesture interfaces for HCI; in: Gesture-Based Communication in Human-Computer
Interaction (2004), Springer Berlin Heidelberg, S. 409-420
[29] Warren, J. (2003): Unencumbered Full Body Interaction in Video Games
38
Abbildungsverzeichnis
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
Erstes Flow-Modell nach Csı́kszentmihályi
Microsoft Kinect . . . . . . . . . . . . . .
Infrarot Punktmuster der Kinect . . . . .
DTW Kostenmatrix . . . . . . . . . . . .
DTW Boundary condition . . . . . . . . .
DTW Warping path . . . . . . . . . . . .
Algorithmus OptimalWarpingPath . . . .
OpenNI Architektur . . . . . . . . . . . .
4.1
4.2
4.3
BIU Statistik zur Altersverteilung von Gamern . . . . . . . . . . . . . . . 24
Umfrageergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Flow in Spielen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.1
5.2
Tool Softwarearchitektur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Kinetic Space GUI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
39
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
11
12
13
14
14
15
16
Anhänge
Inhalt der CD
• Bachelorarbeit in PDF-Format
40
Hiermit versichere ich, dass ich die vorliegende Bachelorarbeit selbstständig und nur
unter Zuhilfenahme der angegebenen Quellen erstellt habe.
Berlin, den 26. Juni 2013
(Carsten Flöth)