RoboCup - Institut für Informatik - Hu

Transcrição

RoboCup - Institut für Informatik - Hu
Wie programmiert man einen
Doppelpass?
Roboter spielen Fußball
Illustrierte Einführung in die Robotik
Hans-Dieter Burkhard
Humboldt-Universität zu Berlin
Institut für Informatik
www.ki.informatik.hu-berlin.de
2
RoboCup
Fußball als Testfeld
Jährliche Weltmeisterschaften und Konferenzen
3
Fußball als Testfeld: RoboCup
• Internationale Initiative zur Beförderung der Robotik und
der Künstlichen Intelligenz
• Jährliche Weltmeisterschaft + Konferenz
• Organisiert durch die RoboCup Federation
– RoboCup Soccer Games
– RoboCup-Rescue
– RoboCup@Home
– RoboCupJunior
www.robocup.org
– Weltweit ca. 4000 Mitglieder in ca. 40 Ländern
– Angemeldet in der Schweiz
– Präsidentin Manuela Veloso, CMU (Pitsburgh)
4
Die Vision
Im Jahr 2050 mit autonomen humanoiden
Robotern gegen den FIFA-Weltmeister
spielen und gewinnen.
5
Schach vs. Fußball
1997: Deep Blue
gewinnt gegen
Weltmeister
Kasparov
SCHACH:
• Statisch
• 3 Minuten pro Zug
• Einzelne Aktion
• Einzelner Akteur
• Information:
• zuverlässig
• vollständig
FUSSBALL:
• Dynamisch
• Sekundenbruchteile
• Folgen von Aktionen
• Team
• Information:
• Unzuverlässig
• unvollständig
6
Fußballspielende Roboter
Herausforderung:
Menschliche Dimensionen
• Körper
• Autonomie
7
Herausforderung: Humanoide Roboter
• kein schnelles Fahrzeug
• keine 6 Beine zum Kicken
• kein Ritter mit Rüstung
• keine Kanone
• keine Flügel
• keine Fernsteuerung
…
Aber …
8
Herausforderung: Humanoide Roboter
Aber:
- Voll autonom
- Gestalt wie ein Mensch: Arme, Beine,…, Haut, …
- Bewegungen: laufen, springen, greifen, tragen …
- Verständnis der Welt
- Zweckmäßiges Verhalten
- Kommunikation und Kooperation
…
Ein Roboter, der Fußball spielt und versteht,
kann auch in der U-Bahn mitfahren.
9
Menschenähnliche Roboter?
• Geistig
– Intelligenz?
– Bewusstsein?
– Freier Wille?
Pro:
Einsatz in „normaler“ Umgebung
Medizinische Techniken, Prothetik
• Körperlich
– Erscheinungsbild
– Aufrechter Gang
Fragen zum Umgang mit Robotern:
• Maschine oder Partner?
• Konkurrenz zum Menschen?
10
Menschenähnliche Roboter
Erkenntnisproblem
Körper und Geist:
Gibt es (natürliche) Intelligenz ohne Körper?
Technikproblem
Gibt es Computer-Intelligenz ohne Körper?
11
RoboCup: Aktueller Stand
• Vollständig autonomes Verhalten
– Eigene Wahrnehmung
– Selbständige Entscheidung
(auf primitive Art)
• Körper: Wettbewerbe in mehreren Klassen:
–
–
–
–
–
Middle Size (50 cm Durchmesser)
Small Size (18 cm Durchmesser)
Standard Liga (Aibo, Nao)
Simulation (2D, 3D)
Humanoide
12
Middle Size League
13
Small Size League
14
Humanoid League
15
RoboCup Nao
16
17
RoboCup
Simulation 2D
Aktionen
kick,dash,turn,
turn-neck, catch,
say, ..
Sensorik
see, sense-body,
hear, ...
Coach
Coach
18
Spielfeld Simulationsliga (Stand 1998)
19
20
21
22
23
Asynchrone Zeiten in 2D-Simulationsliga
Sichtinformation wahlweise alle 75,150 oder 300 ms
in entsprechend unterschiedlicher Qualität
24
Weltmodell
starts, in, contemporary bezeichnen
Beziehungen zwischen Intervallen
(aus Dissertation Andrea Miene - Bremen, 2003)
25
RoboCup
Simulation 3D
Physikalische Simulation (mit ODE)
Vereinfachte Wahrnehmung analog zu 2D-Simulationsliga
26
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
Nagoya
Paris
Stockholm
Melbourne
Seattle
Fukuoka
Padua
Lisbon
Osaka
Bremen
Atlanta
Suzhou
Graz
Singapore
Istanbul
RoboCup
Weltmeisterschaften
Bremen 2006:
444 Teams mit ca. 2500
Teilnehmern aus 36 Ländern
27
Wertung der „klassischen Disziplinen“ 1997-2007
(MiddleSize, SmallSize, Legged, Simulation 2D)
1.Place 2.Place 3.Place
Germany
12
12
11
USA
13
5
7
Japan
5
7
8
Australia
4
9
4
China
3
4
Singapore
1
1
5
Portugal
1
1
2
France
1
1
1
Iran
1
3
Netherlands
1
2
Italy
2
Russia
1
Thailand
1
1
UK
1
Points
71
56
37
34
17
10
7
6
6
5
4
3
3
1
28
RoboCup Organisation
• Regionale Wettbewerbe:
„XXX RoboCup Open“ organisiert durch National-Komitees
www.robocup.de
• Deutsches Nationalkomitee:
Arbeitskreis in der Gesellschaft für Informatik
www.robocup-german-open.de
• RoboCup German Open
weltweit größte regionale Veranstaltung im RoboCup
2001-2005 HNF Paderborn
2007-2009 Hannover-Messe
2010-2011 Magdeburg
29
RoboCup an der HU Berlin
AT Humboldt (Virtueller Fußball: Simulationsliga)
– Weltmeister Nagoya 1997
– Vizeweltmeister Paris 1998, Lissabon 2004 (3D)
Aibo-Team Humboldt (Sony Four Legged League)
– Deutscher Meister Paderborn 2001, 2004
– Deutscher Vizemeister Paderborn 2002, 2003, 2005
German Team (Sony Four Legged League)
(Berlin, Bremen, Darmstadt, Dortmund)
– Sieger „Technical Challenge“ Padua2003, Atlanta 2007
– Weltmeister Lissabon 2004, Osaka 2005, Suzhou 2008
Humanoid Team Humboldt (2006/07)
NaoTeam Humboldt (SPL seit 2008, 3D seit 2010)
30
Technik und Visionen in der Geschichte
Mobilität:
Züge, Autos
Fliegen:
Flugzeuge
Mondlandung: Raumfahrt
Künstliche Intelligenz: Schach
31
Technik und Visionen in der Geschichte
Mobilität:
Züge, Autos
Fliegen:
Flugzeuge
Jetzt: Zeit für Roboter
Mondlandung: Raumfahrt
Künstliche Intelligenz: Schach
32
Forschung und Wettbewerb
Kreative Lösungen gesucht für
• Bewegungsformen
• Antriebe
• Sensoren
• Wahrnehmung
• Energieversorgung
• Entscheidung
33
Forschung und Wettbewerb
10 Jahre RoboCup 2006
Melbourne 2000
Bremen 2006
34
4-Legged League
1999:
• Langsamer Lauf
• Nur Geradeaus
(Laufen–Drehen–Laufen …)
Fallrückzieher
(German Team) 2002
2006:
• Schneller omnidirektionaler Lauf
• Viele unterschiedliche Kick-Varianten
35
Humanoid League
2002:
• Langsamer Lauf
• Nur Geradeaus
(Laufen–Drehen–Laufen …)
Vision
(Team Osaka)
2004
2010
•Schneller omnidirektionaler Lauf
• Viele unterschiedliche Kick-Varianten
36
Aktuelle Herausforderungen
Unter freiem Himmel
Bei jedem Wetter
37
Aktuelle Herausforderungen
Größere Teams ( …7 … 9 …11 )
Gemischte Teams unterschiedlicher Institutionen
(auch kommerzielle Hersteller)
38
Aktuelle Herausforderungen für Humanoide
Bewegung:
– Rennen, Springen, Dribbeln, …
– Unterschiedliche Kicks (Fuß, Kopf,…)
Wahrnehmung:
– Resultate anderer Ligen übernehmen
Koordination:
– Resultate anderer Ligen übernehmen
Schneller Fortschritt möglich - wenn
Bewegungsprobleme gelöst werden
39
Ziele für die Forschung
Roboter
Robotersollen
sollen2050
2050gewinnen:
gewinnen:Was
Wasbrauchen
brauchenwir
wir2050
2050??
Um
Umes
es2050
2050zu
zukönnen:
können:Was
Wasbrauchen
brauchenwir
wir2040
2040??
Um
Um
es
es2040
2040
zu
zukönnen:
können:Was
Wasbrauchen
brauchenwir
wir2030
2030??
RoboCup
Roadmap:
Um
Umes
es2030
2030zu
zukönnen:
können:
Was
Wasbrauchen
brauchen
wir
wir2020
2020??
Jährlich
Festlegung
von weiteren
Anforderungen
Um
Umes
es2020
2020zu
zukönnen:
können:Was
Wasbrauchen
brauchenwir
wir2010
2010??
Was
Wasmüssen
müssenwir
wirwissen
wissen??
Wer
Werkann
kannhelfen
helfen??
2000
2010
2020
2030
2040
2050
40
RoboCup Roadmap
Schritte für folgende Jahre:
• Umgebung (Feld, Beleuchtung, …)
• Spieler (Gestalt, Größe, …)
• Teams (Anzahl der Spieler, Rollen, …)
• Neue Ligen (auch Anwendungen)
41
RoboCupRescue
42
RoboCup@Home
Roboter in Haus und Garten
43
RoboCup Junior
• Soccer
• Tanz
• Rescue
bbb
Bundesweite Initiative „RoboCupJunior“
zum Informatikjahr 2006
44
Bau von Robotern
• Energie
• Material
• Sensoren
• Wahrnehmung
• Steuerung
• Aktorik
Nachbildung natürlicher Systeme
Ausnutzung maschineller Vorteile
45
Hardware + Software
für
• Bewegung (Aktoren + Ansteuerung)
• Wahrnehmung (Sensoren + Auswertung)
• Steuerung (Computer + Steuerprogramm)
Sense-think-act-Zyklus
46
sense
Sense-think-act Zyklus
input
act
think
sense
think
act
output
time
47
sense
Sense-think-act Zyklus
Synchronisations-Probleme
input
act
sense
think
?
think
act
output
time
48
Äußeres Erscheinungsbild
Einstein3.wmv
Hanson Robotics
49
Energie
Oscar Pistorius
50
Körper: Arme, Beine, Motoren,...
Nao von Aldebaran
21 Servo-Motoren:
• 2 für den Kopf
• 4 pro Arm
• 5 pro Bein
• 1 Hüfte
500 MHz CPU (x86 AMD Geode)
51
Laufen
Beinbewegung
52
Laufen
Beinbewegung
53
Laufen
Beinbewegung
54
Laufen
a
αα
a∗cos α
b
a
a∗sin α ββ b
b∗cos β
b∗sin β
Beinbewegung modellieren
55
Laufen
a
b
α? a
a∗cos ?
a∗sin ? β? b
b∗cos ?
b∗sin ?
Welche Winkel ergeben
die gewünschte Bewegung?
56
Komplexe Berechnungen
Wie laufen Menschen ohne
Physik und Mathematik?
57
Laufen Lernen
• Ausprobieren
verschiedener Winkel
• Bewerten der Ergebnisse („Loben“)
• Beste Winkel werden gelernt
Am besten alles automatisch
58
Maschinelles Lernen
•Evolutionäre Algorithmen
•Verstärkungslernen
•Fallbasiertes Schließen
•Neuronale Netze
http://www.robocup.de/AT-Humboldt/simloid-evo.shtml?de
59
Proprioception: Körpergefühl
60
Biologically Inspired Robotics
“Emergentes Verhalten”
verwendet “Situierheit in der realen Welt”
Viele Sensoren
Lokale Prozesse
Sensor-Aktor-Kopplung
Neuronale Netze
61
Beschleunigungs-Sensoren der A-Serie
ABSR
Accelboards:
• Real Time (10ms cycle)
• C/Assembler
ABAR
• Lokale Verarbeitung
ABML
ABAL
ABHL
ABHR
ABFR
ABFL
62
Aktuelle Experimente
Lokale Steuerung durch Rekurrente Neuronale Netze
63
Physik: Er läuft (fast) von allein
Dynamic walker
64
Biologische Modelle
Blickhan, Seyfarth (Jena)
65
Energie
Oscar Pistorius
66
Andere Formen der Fortbewegung
RHex Project
67
Sehen und Erkennen
68
Sehen und Erkennen
Interpretationen
im Wettstreit
69
Sehen und Erkennen
Interpretationen
im Wettstreit
70
Sehen und Erkennen
Interpretationen
im Wettstreit
71
Sehen und Erkennen
Interpretationen
im Wettstreit
72
Bildverarbeitung
Interpretationen
im Wettstreit
73
Sehen und Erkennen
Was sieht der Roboter?
Woran erkennt er den Ball?
Der Ball ist orange.
Der Ball ist rund.
Der Ball hängt nicht an der Decke.
Der Ball bewegt sich geradeaus.
74
Sehen und Erkennen
Was sieht der Roboter?
Woran erkennt er den Ball?
Der Ball ist orange.
Der Ball ist rund.
Der Ball hängt nicht an der Decke.
Der Ball bewegt sich geradeaus.
75
Sequentielles „Sehen“
76
Sequentielles „Sehen“
77
Paralleles Sehen
78
Sehen und Erkennen
79
Sehen und Erkennen
80
Diplomarbeit Matthias Jüngel
81
Weitere Sensoren
Erfassung der Außenwelt und des internen Zustands
•
•
•
•
•
•
Entfernungsmessung
Berührung
Schall
Lage/Bewegung/Beschleunigung
Gelenkstellung
…
82
Navigation on the Soccer Field
Sensory data by camera image are incomplete and
noisy
30 images per second in real time
Where am I ?
83
Navigation on the Soccer Field
Badly posted problem:
Reconstruction of 3D scene from 2D image
But:
Much information in image
- Humans could localize
84
Navigation on the Soccer Field
Robot can use information from
Last position
Last motion (odometry)
Actual sensor information (image)
All information is noisy
85
Navigation on the Soccer Field
Noise in perception
leads to different beliefs about position
86
Navigation on the Soccer Field
Reality:
Where I am and go to
u(t)
x(t)
x(t-1)
87
Navigation on the Soccer Field
Reality:
Where I am and go to
x(t)
u(t)
x(t-1)
x´´(t-1)
x´(t)
Belief:
u(t)
Where I belief to be and to go
88
Navigation on the Soccer Field
Reality:
Where I am and go to
x(t) xz(t)
u(t)
x(t-1)
x´´(t-1)
x´(t)
Belief:
u(t)
Where I belief to be and to go
z´(t)
z(t)
Belief:
Where I should be
according to perception
Reality:
What I see (with noise)
Belief:
What I expect to see
89
Navigation on the Soccer Field
Reality:
Where I am and go to
x(t) xz(t)
u(t)
x(t-1)
x´´(t-1)
x´´(t)
x´(t)
Belief:
u(t)
Where I belief to be and to go
z´(t)
Belief:
Where I should be
according to perception
New Belief:
Where I belief to be now
z(t)
Reality:
What I see (with noise)
Belief:
What I expect to see
90
Navigation on the Soccer Field
Belief modeling using Bayes Filters
Initially: a-priori belief
According to motion ut :
Where did I go to?
According to perception zt+1 :
Where would I perceive that?
91
Navigation on the Soccer Field
Belief modeling using Bayes Filters
Initially: Bel(x0)
According to motion ut :
bel (xt+1) = ∫ P(xt+1 | xt ,ut ) Bel(xt ) dxt)
According to perception zt+1 :
Bel (xt+1) = α P( zt+1 | xt+1) bel(xt+1 )
with normalizing α = ∫ Bel(xt) dxt
92
Navigation on the Soccer Field
Monte Carlo Localization (Particle Filter)
approximates position
93
Navigation using Constraints
Robot sees a goal post
at distance d
Constraint:
Robot position is
on a circle with radius
d
94
Navigation using Constraints
Robot sees a line at
distance d
Constraint:
Robot position is
in one of the boxes
95
Navigation using combined Constraints
C1
`
Robot sees angle between goal posts: C1
96
Navigation using combined Constraints
C4
C2
C6
C3
Robot sees ball before penalty line: C2 (line)
and ball at distance d:
C3 (circles)
and left goal post and ball on a line: C4 (lines)
combination C6 = C2 ∩ C3 ∩ C4
97
Navigation using combined Constraints
C4
C2
C3
C6
C1
C7 = C1 ∩ C6
(red crosses)
98
Navigation using combined Constraints
Use Techniques from Constraint Propagation:
Locally consistent restrictions (projections and
intervals)
99
Navigation using combined Constraints
Advantages
Immediate interpretation (particle filters have
delays)
Fast calculation using more information
Ambiguity and noise can be measured
Communication between robots
Problems
Handling of inconsistent information
100
Erkennen + Denken + Handeln:
•Wo bin ich?
•Wo ist der Ball?
•Wo sind die anderen?
•Was machen die anderen?
•Was mache ich jetzt
101
„Bewusstes“ Handeln
Ich sehe das Licht links vor mir.
Ich will zum Licht.
Dafür muss ich nach links vorn gehen.
Dafür muss ich mich nach links drehen und vorwärts laufen.
Dafür muss ich das rechte Rad stärker drehen.
usw.
Alternativ: Reflexe
102
Reflexe
Lichtliebhaber
Braitenberg Vehikel
Lichtscheu
Alternativ:„Bewusstes“ Handeln
103
Reflexe (Stimulus-Response, „reaktiv“)
Zum Ball laufen
Sensor-Aktor-Kopplung
(vgl. Braitenberg-Vehikel)
104
Reflexe (Stimulus-Response, „reaktiv“)
Hindernis vermeiden
Komplexe
Verhaltensweisen
aus einfachen
kombinieren
105
Zielgerichtetes Verhalten
– Handeln gemäß selbst gesetzter Ziele
106
Plan für Kooperation
Kooperation
Gemeinsame Absicht (Doppelpass)
107
Schwarmverhalten
Die erste passende Regel wird ausgeführt:
•
•
•
•
Wenn du beim Ball bist und das gegnerische Tor siehst:
Kick den Ball.
Wenn du beim Ball bist: Dreh dich um den Ball.
Wenn du den Ball siehst: Laufe zum Ball.
Dreh dich bist du den Ball siehst.
108
Schwarmverhalten
Die erste passende Regel wird ausgeführt:
•
•
•
•
Wenn du beim Ball bist und das gegnerische Tor siehst:
Kick den Ball.
Wenn du beim Ball bist: Dreh dich um den Ball.
Wenn du den Ball siehst: Laufe zum Ball.
Dreh dich bist du den Ball siehst.
Resultat: Alle laufen zum Ball.
109
Schwarmverhalten: Alternative Realisierung
Die erste passende Regel wird ausgeführt:
•
•
•
•
•
Wenn du beim Ball bist und das gegnerische Tor siehst:
Kick den Ball.
Wenn du beim Ball bist: Dreh dich um den Ball.
Wenn du den Ball siehst: Laufe zum Ball.
Wenn du nicht in Deiner Region bist: Laufe auf deine
Stammposition.
Dreh dich bist du den Ball siehst.
110
Schwarmverhalten: Alternative Realisierung
Die erste passende Regel wird ausgeführt:
1.
2.
3.
4.
5.
Wenn du beim Ball bist und das gegnerische Tor siehst:
Kick den Ball.
Wenn du beim Ball bist: Dreh dich um den Ball.
Wenn du den Ball siehst: Laufe zum Ball.
Wenn du nicht in Deiner Region bist: Laufe auf deine
Stammposition.
Dreh dich bist du den Ball siehst.
Für Roboter mit beschränkter Sichtweite (!)
111
Schwarmverhalten: Alternative Realisierung
Die erste passende Regel wird ausgeführt:
•
•
•
•
•
Wenn du beim Ball bist und das gegnerische Tor siehst:
Kick den Ball.
Wenn du beim Ball bist: Dreh dich um den Ball.
Wenn du den Ball siehst und der nächste am Ball bist:
Laufe zum Ball.
Wenn du nicht in Deiner Region bist: Laufe auf deine
Stammposition.
Dreh dich bist du den Ball siehst.
112
Koordination und Kommunikation
Koordination ist ohne Kommunikation möglich
….
3. Wenn du den Ball siehst und der nächste am Ball bist:
Laufe zum Ball.
….
• Beobachtung der Situation.
• Annahmen dazu, was der andere in dieser Situation macht.
(es reicht oft schon, wenn der Programmierer das weiß)
113
Komplexere Verhaltensweisen: Mit Zustand
• Vergangenheit: Weltmodell
(z.B. nicht mehr gesehener Ball)
• Simulation im Modell (Bewegungen antizipieren)
• Zukunft: Ziele/Pläne
114
Wie programmiert man einen Doppelpass?
1. Versuch („Schach“):
• Vorausschauende Simulation
• Wahl der besten Alternative
115
Doppelpass
Ziel: Gegner überwinden – aber wie?
Aktionenfolge: Dribbeln – passen – Laufen – Annehmen
Begrenzte Information
Begrenzte Zeit
116
Wie programmieren?
Wahrnehmung: Was ist die aktuelle Situation?
Wo bin ich?
Wo sind die anderen, was machen sie?
Entscheidung: Was sind meine Möglichkeiten?
Was möchte ich?
Wie kann ich das erreichen?
Aktion:
Was mache ich jetzt?
Was sage ich jetzt?
Probleme abhängig von
der Umgebung
117
Wo ist der Ball erreichbar?
Abschätzen
(„nach Gefühl“)
Lernen
Berechnung
Simulation
118
Wer ist zuerst am Ball?
Verwenden
„Wo ist der Ball
erreichbar?“
119
Hysteresis-Problem
….
3. Wenn du den Ball siehst und der nächste am Ball bist:
Laufe zum Ball.
….
Was passiert,
wenn zwei Spieler nahezu gleich weit vom Ball entfernt sind?
(Problem unscharfer Wahrnehmungen.)
120
Wohin passen?
Verwenden
„Wer ist zuerst am Ball?“
(Verwenden
„Wo ist der Ball
erreichbar?“)
121
Wie programmiert man einen Doppelpass?
1. Versuch („Schach“):
• Vorausschauende Simulation
• Wahl der besten Alternative
Resultat:
Nur für kurzfristige Aktionen brauchbar
122
Wie programmiert man einen Doppelpass?
2. Versuch („Emergenz“):
Wenn sich jeder zeitnah optimal verhält,
ergibt sich ein Doppelpass von allein.
Resultat:
Doppelpass emergiert gelegentlich
123
Wie programmiert man einen Doppelpass?
3. Versuch:
Beschränkte Rationalität nachbilden
Belief-Desire-Intention-Architektur (BDI)
Zur Zeit in Arbeit …
124
Wie programmieren?
Wahrnehmung: Was ist die aktuelle Situation?
Wo bin ich?
Wo sind die anderen, was machen sie?
Entscheidung: Was sind meine Möglichkeiten?
Was möchte ich?
Wie kann ich das erreichen?
Aktion:
Was mache ich jetzt?
Was sage ich jetzt?
Probleme abhängig von
der Umgebung
125
Konzept: (Beschränkte) Rationalität
Rational Choice:
• Agenten maximieren ihr Ergebnis
Benötigt genaue Kenntnis der Konsequenzen
Kritik (Simon): Bounded Rationality
• Nur beschränkt Informationen verfügbar
• Nur beschränkte Ressourcen für Entscheidungen
126
BDI-Approach (Bratman, 1987)
Bratman, M. E. (1987).
Intentions, Plans, and Practical Reason.
Harvard University Press: Cambridge, MA.
Belief:
Wie der Agent die Situation sieht
Desires: Was der Agent gern hätte
Intentions: Wozu sich der Agent entschließt
Populärer Ansatz in Agenten-orientierten Techniken
127
BDI-Ansatz: Umgang mit Konflikten
Konflikte sind zu lösen
Lösung verbraucht Ressourcen
• Konsistenz:
– Wünsche (Desires) können inkonsistent sein
– Absichten (Intentions) müssen konsistent sein
Absichten definieren „screen of admissibility:
Nur solche Wünsche auswählen,
die mit existierenden Absichten verträglich sind
128
BDI-Ansatz: Umgang mit Konflikten
Stabilität vs. Flexibilität
Verrauschte Daten
können zu
Oszillationen führen
129
BDI-Ansatz: Umgang mit Konflikten
Alte Absicht beibehalten
+ Stabilität
+ Zuverlässigkeit, Vorhersagbarkeit (Kooperation!)
- Festhalten an schlechten Varianten (Fanatismus)
Übergang zu neuer Absicht
+ Anpassung an neue Situation
- Oszillationen
Müssen alte und potenzielle neue Absichten betrachten
Screen of admissibility bevorzugt Stabilität (alte Absicht).
130
Time 5´10´´
Analysis of situation <situation description>
5´10´´
Dribbling on path <???>
Kick with parameters <???> to team mate 10
Run on path <???> over opponent 7
Run to ball on path <???> kicked by team mate 10
Intercept ball at point <???> optimal intercept point
131
Time 5´20´´
Analysis of situation <situation description>
5´10´´
5´12´´
5´13´´
Dribbling on path <path parameters>
Kick with parameters <ball speed vector>
Run on path <path parameters>
5´17´´
5´19´´
5´20´´
Run to ball on path <path parameters>
Intercept ball at point <position>
132
Hierarchy of Options
PlaySoccer
Offensive
Score
Defensive
DoublePass/1
DoublePass/2 ...
ChangeWings/1
...
Attack
...
OffsideTrap
Dribble
Kick
...
...
...
...
...
...
...
...
Pass
...
...
Run
...
Reposition
...
...
...
...
Intercept
133
Result of “Deliberator“: Intention Subtree
PlaySoccer
Offensive
Score
Defensive
...
DoublePass/2
DoublePass/1
ChangeWings/1
...
Attack
...
OffsideTrap
Dribble
Kick
...
...
...
...
...
...
...
...
...
Pass
...
...
Run
...
Reposition
...
...
...
...
Intercept
...
...
134
Activity Path: Present state of an Intention
PlaySoccer
Offensive
Score
Defensive
...
DoublePass/2
DoublePass/1
ChangeWings/1
...
Attack
...
OffsideTrap
Dribble
Kick
...
...
...
...
...
...
...
...
...
Pass
...
...
Run
...
Reposition
...
...
. . . checks conditions on all
...
„Executor“
levels of the hierarchy and decides
by least commitment principle
Intercept
...
...
135
Activity Path: Present state of an Intention
PlaySoccer
Offensive
Score
Defensive
...
DoublePass/2
DoublePass/1
ChangeWings/1
...
Attack
...
OffsideTrap
Dribble
Kick
...
...
...
...
...
...
...
Pass
...
Pass ready, next: Run
...
...
...
Run
...
Reposition
...
...
...
...
Intercept
...
...
136
Double-Pass Architecture
– Predefined Option Hierarchy
– Deliberator
– Executor
„Doubled“ 1-Pass-Architecture:
– 1. Pass: Deliberator (goal-oriented: Intention Subtree)
– 2. Pass: Executor (stimulus-response: activity path)
- on all levels Differences to “classical” Programming
– Control flow by Deliberation (“Agent- oriented”)
– Runtime organisation by 2 Passes through all levels
137
Pläne können fehlschlagen
138
Pläne können fehlschlagen
PlaySoccer
Offensive
Score
Defensive
...
DoublePass/2
DoublePass/1
ChangeWings/1
...
Attack
...
OffsideTrap
Dribble
Kick
...
...
...
...
...
...
...
...
...
Pass
...
...
Run
...
Reposition
...
...
...
...
Intercept
...
...
139
Alternativer Aktivitätspfad
PlaySoccer
Offensive
Score
Defensive
...
DoublePass/2
DoublePass/1
ChangeWings/1
...
Attack
...
OffsideTrap
Dribble
Kick
...
...
...
...
...
...
...
...
...
Pass
...
...
Run
...
Reposition
...
...
...
...
Intercept
...
...
140
Other Approach: Case Based Reasoning
Acting by experience:
What did I do
last time in this situation?
141
Programmierung von Fußball-Robotern
Was können wir lernen?
– Fußball umfasst viele Probleme einer Alltagsumwelt
– Alltags-Intelligenz verstehen lernen
– Ähnliche Fähigkeiten für Lösen von Problemen
– Roboter können (aber müssen nicht) nach gleichen
Methoden gebaut werden.
Es ist eigentlich unwichtig,
ob Roboter 2050 im Fußball gewinnen ...
142
Dank an
RoboCup Federation
RoboCup Teams in aller Welt
Deutsche Forschungsgemeinschaft (DFG)
Bundesministerium für Bildung und Forschung (BMBF)
Arbeitsgruppe „Künstliche Intelligenz“ der HU Berlin
Sponsoren
Sony, DaimlerChrysler, Empolis, PSI, WISTA, Think-Cell
143
Auf Wiedersehen zur RoboCup German
Open 2011 in Magdeburg!
Danke!
144