Link - Fakultät IV - Hochschule Hannover
Transcrição
Link - Fakultät IV - Hochschule Hannover
Fakultät IV – Wirtschaft und Informatik Arbeitspapier / Abteilung Wirtschaft Stephan König Erfolgsfaktoren in Business Intelligence Projekten Arbeitspapier 03-2009 ISSN Nr. 1436-1035 (print) ISSN Nr. 1436-1507 (Internet) www.fh-hannover.de/f4 Arbeitspapier (Forschungsbericht) Erfolgsfaktoren in Business Intelligence Projekten Prof. Dr. Stephan König Fakultät IV (Abteilung Wirtschaft) Fachhochschule Hannover Wintersemester 2008/09 i Inhaltsverzeichnis Inhaltsverzeichnis ...................................................................................................i Abbildungsverzeichnis ............................................................................................iii 1 Einleitung .............................................................................................1 2 Business Intelligence .............................................................................3 3 Business Intelligence Projektmanagement ..............................................5 4 4.1 4.2 Real Time Data Warehousing ................................................................7 Begriffsdefinition Real Time Data Warehousing ........................................7 Fachliche Anforderungen an ein Real Time Data Warehouse .......................8 4.3 4.3.1 4.3.2 4.3.3 4.4 Real Time Data Warehouse Architekturen .................................................12 Szenario 1: (Near) Real Time Data Warehouse ........................................12 Szenario 2: Operational Data Store .........................................................13 Szenario 3: Event Stream Processing ......................................................14 Zusammenfassung ..................................................................................17 5 5.1 5.2 5.2.1 5.2.2 Der Kimball Lifecycle ...........................................................................18 Einführung ............................................................................................18 Gesamtüberblick ....................................................................................19 Program/Project Planning ......................................................................20 Program/Project Management ................................................................20 5.2.3 5.2.4 5.2.5 5.2.6 5.2.7 5.2.8 5.2.9 5.2.10 5.2.11 5.2.12 5.2.13 5.3 Business Requirements Definition ..........................................................20 Technologie: Technical Architecture Design ...........................................21 Technologie: Product Selection and Installation .......................................21 Daten: Dimensional Modelling ..............................................................21 Daten: Physical Design .........................................................................21 Daten: ETL-Design and Development ....................................................22 BI-Anwendungen: BI Application Design ...............................................22 BI-Anwendungen: BI Application Development ......................................22 Deployment .........................................................................................22 Maintenance ........................................................................................22 Growth ...............................................................................................23 Zusammenfassung ..................................................................................23 ii 6 6.1 6.2 6.2.1 6.2.2 Real Time Data Warehousing Projektmanagement ................................24 Einführung ............................................................................................24 Launching and Managing the Project/Program ...........................................26 Project Definition .................................................................................27 Project Planning ...................................................................................31 6.2.3 6.2.4 Manage the Project ...............................................................................35 Manage the Program .............................................................................37 6.2.5 6.3 Zusammenfassung ................................................................................38 Business Requirements Definition ............................................................39 6.3.1 6.3.2 Overall Approach to Requirements Definition .........................................41 Prepare for the Interview .......................................................................41 6.3.3 6.3.4 6.3.5 6.3.6 6.3.7 6.3.8 6.4 Conduct the Interview ...........................................................................42 Wrap up the Interview ..........................................................................42 Review the Interview Results .................................................................42 Prepare and Publish Requirements Deliverables .......................................42 Prioritize and Agree on Next Steps .........................................................42 Zusammenfassung ................................................................................43 Technical Architecture ............................................................................44 6.4.1 6.4.2 6.4.3 6.4.4 6.4.5 6.4.6 6.4.7 6.5 6.5.1 6.5.2 TA: Gesamtüberblick............................................................................45 TA: Back Room ...................................................................................46 TA: Presentation Server Architecture ......................................................49 TA: Front Room Architecture ................................................................50 TA: Infrastruktur ..................................................................................53 TA: Security ........................................................................................54 Zusammenfassung ................................................................................55 Creating the Technical Architecture Plan ...................................................56 Prozessschritte .....................................................................................56 Select Products ....................................................................................59 6.5.3 Zusammenfassung ................................................................................61 7 Zusammenfassung und Ausblick ...........................................................62 8 Literaturverzeichnis ..............................................................................64 9 9.1 9.2 9.3 Anhang.................................................................................................66 Anhang A ..............................................................................................66 Anhang B ..............................................................................................67 Anhang C ..............................................................................................68 9.4 Anhang D ..............................................................................................69 iii Abbildungsverzeichnis Abbildung 2.1: Ordnungsrahmen Business Intelligence (Gluchowski08) ................................ 3 Abbildung 2.2: Klassische BI-Architektur (Kemper06) .......................................................... 4 Abbildung 4.1: Data Warehouse Entwicklungsstufen (Turban07) .......................................... 10 Abbildung 4.2: Wertverlust der Information mit der Zeit (Gluchowski08, Hackathorn03) ..... 11 Abbildung 4.3: Architektur für ein (Near) Real Time Data Warehouse .................................. 13 Abbildung 4.4: Architektur für einen Operational Data Store ................................................ 14 Abbildung 4.5: Event Stream Processing ................................................................................ 15 Abbildung 4.6: Blue Print für eine Real Time BI-Architektur (Gluchowski08) ....................... 16 Abbildung 4.7: Integration von BI und SOA (Gluchowski08) ................................................. 17 Abbildung 5.1: Der Kimball Lifecycle (Kimball08) ................................................................. 19 Abbildung 6.1: Launching and Managing the Project/Program .............................................. 26 Abbildung 6.2: Aufgaben im Bereich Launching and Managing the Project/Program ............ 27 Abbildung 6.3: Projektrollen für ein RTDW-Projekt ............................................................. 32 Abbildung 6.4: Business Requirements Definition .................................................................. 40 Abbildung 6.5: TA Design und Product Selection and Installation .......................................... 44 Abbildung 6.6: (Logisches) Gesamtmodell Systemarchitektur DW/BI-System (Kimball08) .... 46 Abbildung 6.7: Back Room Architecture DW/BI-System (Kimball08) .................................... 47 Abbildung 6.8: Presentation Server System Architektur DW/BI-System (Kimball08)............. 50 Abbildung 6.9: Front Room Architecture DW/BI-System System (Kimball08) ....................... 51 Abbildung 6.10: DW/BI Application Architecture Top-Down Approach ................................ 57 Abbildung 9.1: Teradata’s Real-Time Enterprise Reference Architecture (Hedegard07) ........ 66 Abbildung 9.2: Übersicht aller Aufgaben und die ihnen zugeordneten Rollen aus dem Bereich Launching und Managing the Project/Program (Kimball08) ................... 67 Abbildung 9.3: Übersicht aller Aufgaben und die ihnen zugeordneten Rollen aus dem Bereich Business Requirements Definition (Kimball08) ........................................ 68 Abbildung 9.4: Übersicht aller Aufgaben und die ihnen zugeordneten Rollen aus dem Bereich Technical Architecture (Kimball08) ........................................................ 70 Kapitel 1 - Einleitung 1 1 Einleitung Das Thema Business Intelligence (BI) hat in den vergangenen Jahren sowohl in der Forschung als auch in der unternehmerischen Praxis eine sehr hohe Dynamik bewiesen und dabei stark an Komplexität – insbesondere was die fachlichen Anwendungsszenarien angeht – zugenommen. BI-Einführungsprojekte weisen in den meisten Fällen eine sehr große Komplexität und Dynamik auf. Dies führt zu Herausforderungen im BI-Projektmanagement, die in aller Regel deutlich über denen von typischen Anwendungsentwicklungsprojekten liegen. Im Rahmen dieser Arbeit werden auf Basis der vorhandenen Literatur Erfolgsfaktoren im Projektmanagement von BI-Einführungsprojekten zu identifiziert und für eine spezielle Form von BIProjekten, den Real Time Data Warehousing Projekten, erweitert. Diese Fragestellung wurde bisher in der Literatur noch nicht im Detail untersucht. Im Mittelpunkt steht dabei das folgende Szenario: Ein Unternehmen möchte seine existierende Business Intelligence Lösung aufgrund neuer fachlicher Anforderungen nach Echtzeitdaten zu einem Real Time Data Warehouse (RTDW) erweitern. Untersucht wird dabei insbesondere, welche speziellen Fragen und Aspekte zu Beginn eines RTDWProjektes zu berücksichtigen sind: Welche besonderen Herausforderungen sind in den Bereichen Projektplanung und Projektmanagement für ein RTDW-Projekt zu erwarten? Welche fachlichen Anforderungen liegen typischerweise einem RTDW zu Grunde und wie können diese systematisch ermittelt und priorisiert werden? Wie und an welchen Stellen muss die Technische Architektur (TA) der existierenden BILösung für ein RTDW erweitert werden? Über weite Bereiche wird dabei der Kimball Lifecycle (Kimball08) - eine Vorgehensweise für BIProjekte - als Ausgangspunkt verwendet. Von ihm aus werden die für die oben genannten Fragestellungen wichtigen Erweiterungen im Rahmen dieser Arbeit herausgearbeitet.1 Dazu wird in Kapitel 2 zunächst kurz das im folgenden verwendete Verständnis des Begriffes Business Intelligence definiert, bevor in Kapitel 3 ein Überblick über das Thema BI-Projektmanagement gegeben wird. Kapitel 4 geht näher auf fachliche Überlegungen zur Einführung eines Real Time Data Warehouse ein. In diesem Zusammenhang werden mögliche Einsatzszenarien exemplarisch vorgestellt und grundlegende Technische Architekturalternativen aufgezeigt. Der Kimball Lifecycle 1 Nicht im Mittelpunkt dieser Arbeit stehen (aus Zeitgründen) die sich im Projektverlauf anschließenden Themen Datenmodellierung, ETL-Prozesses und die eigentlichen BI Anwendungen. Kapitel 1 - Einleitung 2 wird in Kapitel 5 vorgestellt bevor in Kapitel 6 spezifische Anforderungen an das Projektmanagement von RTDW-Projekten im Detail untersucht werden. Die Arbeit schließt in Kapitel 7 mit Zusammenfassung und Ausblick. Diese Arbeit ist im Wintersemester 2008/09 im Rahmen eines Forschungsprojektes an der Fachhochschule Hannover entstanden. Das Forschungsprojekt wurde seitens der Hochschule dankenswerterweise mit einer Lehrdeputatsermäßigung von 2 LVS gefördert. Kapitel 2 - Business Intelligence 2 3 Business Intelligence Business Intelligence (BI) umfasst die Integration von Strategien, Prozessen und Technologien, um im Umfeld der entscheidungsunterstützenden Systeme aus fragmentierten, inhomogenen Unternehmens-, Markt- und Wettbewerberdaten erfolgskritisches Wissen über Status, Potenziale und Perspektiven zu generieren und dies für Analyse-, Planungs- und Steuerungszwecke geeignet darzustellen (siehe auch: Weites BI-Verständnis in Abbildung 2.1). Abbildung 2.1: Ordnungsrahmen Business Intelligence (Gluchowski08) Eine flexible BI-Architektur, die diesen Ansprüchen gerecht wird, weist in aller Regel eine große Komplexität auf. Bewährt hat sich ein Drei-Schichten Modell bestehend aus einer Datenbereitstellungsschicht, einer Analyseschicht und einer Präsentationsschicht (siehe Abbildung 2.2). Kommerziell erhältliche Lösungen decken häufig nur Teilfunktionalitäten ab, so dass sich in der Praxis häufig weitere Herausforderung bei der Integration verschiedener Produkte ergeben. Kapitel 2 - Business Intelligence 4 Abbildung 2.2: Klassische BI-Architektur (Kemper06) Für eine weiterführende Einführung in das Thema Business Intelligence siehe zum Beispiel (Bauer09, Chamoni06, Gluchowski08, Kemper06, Lusti02, Mucksch00, Oehler06, Schütte01, Turban07). Kapitel 3 - Business Intelligence Projektmanagement 3 5 Business Intelligence Projektmanagement BI-Projekte weisen in den meisten Fällen eine große Komplexität und Dynamik auf. Dies ergibt sich insbesondere aus den abteilungsübergreifenden (Anwender-) Anforderungen, den verwendeten Technologien und Produkten und insbesondere auch der Interdisziplinarität resultierend aus fachlichen und technischen Fragestellungen. Daraus ergeben sich in den meisten Fällen sehr lange Projektlaufzeiten (3+ Jahre) und hohe Kosten (Mio. Euro). Damit liegen die Herausforderungen an das BIProjektmanagement in aller Regel deutlich über denen von typischen Anwendungsentwicklungsprojekten. Auch erfordert das grundsätzlich unterschiedliche Anwenderverhalten im analytischen BI-Umfeld (im Gegensatz zu operativen Anwendungssystemen) Projektvorgehensweisen, die vom klassischen Wasserfallmodell abweichen. Dabei muss der explorative Charakter des stark subjektiven Anwenderrverhaltens mit bewusst ungewissem Ausgang und flexiblen Navigationsräumen - im Gegensatz zu den klar definierten, standardisierten und anwenderunabhängigen Use Cases der operativen Systeme - berücksichtigt werden. Angehende BI-Projektmanager sind daher gut beraten, sich vor dem Projektstart über Erfolgsfaktoren und bewährte Vorgehensweisen (Best Practices) im BI-Projektmanagement zu informieren. Dies erlaubt es ihnen, Risiken, Kosten und Komplexitäten besser zu beherrschen und auf Erfahrungen anderer Projekte aufzubauen. Zahlreiche deutsch- und englischsprachige Lehrbücher zum Thema Business Intelligence (Bauer09, Chamoni06, Gluchowski08, Kemper06, Lusti02, Mucksch00, Oehler06, Schütte01, Turban07) widmen sich auch dem Thema BI-Projektmanagement. Speziell auf das Thema BI-Projektmanagement ausgerichtet sind die Lehrbücher von Atre, Inmon, Kimball und Westermann (Atre07, Inmon96, Kimball08, Westermann01). Während Westermann (Westermann01) eher einen historischen Abriss über eines der ersten großen Data Warehouse Projekte darstellt, geben die drei anderen Autoren (Atre07, Inmon96, Kimball08) einen umfassenden Gesamtüberblick über das Thema BI-Projektmanagement. Dabei spricht sich Inmon deutlich gegen das klassische Wasserfallmodell aus und propagiert, in einem iterativen Ansatz erst im Anschluss an die Datenzusammenführung und Anwendungsentwicklung die Anforderungen der Anwender zu erfassen (Inmon96). Kimball hingegen plädiert deutlich dafür, zunächst die Anforderungen der zukünftigen Anwender an die analytischen Anwendungen zu erheben und erst dann mit der Umsetzung zu beginnen (Kimball08). Bereits an diesem Beispiel wird deutlich, dass sich aufgrund der Aktualität der Fragestellung noch keine einheitlichen Vorgehensweisen herausgebildet haben. Weiterhin seien exemplarisch die folgenden Veröffentlichungen zum Themenumfeld BIProjektmanagement genannt: (Goeken04, Lehmann97, Schirp01, Sen05). Kapitel 3 - Business Intelligence Projektmanagement 6 Sen et al. haben 15 verschiedene Data Warehouse Methodologien untersucht und nach verschiedenen Kriterien (u.a. Kernkompetenzen, Anforderungsmodellierung, Datenmodellierung, Umsetzungsstrategie, Skalierbarkeit, Änderungsmanagement) bewertet. Auch sie kommen zum Schluss, dass sich noch keine allgemein akzeptierten Standards herausgebildet haben und erwarten für die Zukunft im Rahmen eines Reifeprozesses eine Konvergenz der verschiedenen Methodologien (Sen05). Goeken skizziert eine Methode zur referenzgestützten Einführung von Führungsinformationssystemen (Goeken04). Zwar können diese Lehrbücher und Veröffentlichungen einen groben Rahmen für die im folgenden zu untersuchenden RTDW-Projekte vorgeben, sie erreichen aber für diese spezielle Form von BIProjekten keine ausreichende Detailtiefe. Diese Lücke soll im folgenden durch diese Arbeit geschlossen werden. Dabei wird im wesentlichen auf die Arbeiten von Kimball (Kimball08) aufgebaut werden. Kapitel 4 - Real Time Data Warehousing 4 7 Real Time Data Warehousing In diesem Kapitel wird erläutert, was ein Real Time Data Warehouse ist und aus welchen Gründen in der unternehmerischen Praxis immer häufiger ein Real Time Data Warehouse (RTDW) in Erweiterung eines bereits bestehenden Data Warehouse als sinnvoll erachtet wird: Welche fachlichen Anforderungen sind Ausgangspunkt für ein RTDW? Wie sehen typische Einsatzszenarien aus und welche Technischen Architekturen bieten sich für ein RTDW an? Diese Überlegungen stellen die Basis für die in Kapitel 6 folgenden Ausführungen zu speziellen Aspekten des Projektmanagements von RTDW-Projekten dar. Eine Einführung in das Thema RTDW findet sich auch in (Gluchowski08, Oehler06, Turban07). 4.1 Begriffsdefinition Real Time Data Warehousing Data Warehousing bezeichnet den Gesamtprozess von der Datenbeschaffung bis zur Datenanalyse in einem Data Warehouse. Typischerweise wird dabei der ETL-Prozess (Extract, Transform, Load) zur Befüllung des Data Warehouse aus den operativen Systemen etwa im Tages- oder Wochenrhythmus durchgeführt. Steigen die fachlichen Anforderungen an die Aktualität der Daten im Data Warehouse, kann dies durch eine Erhöhung der Frequenz der ETL-Prozesse erreicht werden. Damit lassen sich die Latenzzeiten zwischen der Abbildung eines Geschäftsereignisses in den operativen Systemen und der Analysemöglichkeit der korrespondierenden Daten im Data Warehouse senken. Man spricht dann von Real Time Data Warehousing. Typischerweise bewegen sich die Anforderungen an die Latenzzeit für ein RTDW im Bereich von Minuten bis Stunden. Dies stellt eine erhebliche Verkürzung gegenüber den oben genannten ursprünglichen Anforderungen dar. Gelegentlich wird korrekterweise auch von Right Time Data Warehousing (oder Near Real Time Data Warehousing) gesprochen, um auszudrücken, dass Real Time im technischen Sinne (Latenzzeit Null) oft nicht - oder nur mit unverhältnismäßig hohen Kosten - im Data Warehouse Umfeld realisierbar ist und aus fachlichen Gründen bei genauerer Analyse in den meisten Fällen auch nicht wirklich erforderlich ist.2 Kimball (Kimball08) unterscheidet auf der Zeitachse instantaneous, frequently und daily. Er betont, dass bereits in der fachlichen Anforderungsanalyse frühzeitig geklärt werden 2 Auch der Begriff Active Data Warehouse wird in diesem Zusammenhang verwendet. Im engeren Sinne enthält er aber einen zusätzlichen Aspekt: Die aktive Zustellung der Echtzeitdaten an den Anwender im Sinne einer Push-Technologie. Kapitel 4 - Real Time Data Warehousing 8 muss, welche Variante für eine gegebene Situation sinnvoll ist. Letztendlich hat diese Grundentscheidung - wie im folgenden dargestellt wird - erhebliche Auswirkungen insbesondere auf das Design der Technischen Architektur (siehe 4.3). Data Warehouse Architekturen sind ursprünglich nicht für den Echtzeitbetrieb konzipiert worden. Zum einen lag dies an der ursprünglichen fachlichen Ausrichtung des Data Warehouse als Analysewerkzeug für primär strategische Entscheidungen. In diesem Zusammenhang spielten Echtzeitdaten eher eine untergeordnete Rolle. Entscheidend waren aber zum anderen sicher auch die verfügbaren Hardwareressourcen, die zum Beispiel einen untertägigen ETL-Prozess nicht zuließen. Hiefür stand nur das nächtliche Batchfenster zur Verfügung, häufig sogar nur das Wochenende. Wichtiger war eine gleichmäßige Auslastung der begrenzten Ressourcen durch ein geschicktes Verteilen der Online- und Batch-Workloads. Andererseits erlaubten diese recht langen Batchfenster dann aber zeitaufwendige ETL-Prozesse mit Store and Forward Architekturen, Persistenz in allen Verarbeitungsstufen, sequenzieller Verarbeitung von Full Table Loads und qualitätssichernden Maßnahmen. Es wird zu prüfen sein, inwieweit sich diese Anforderungen auch in einer RTDW-Architektur aufrechterhalten lassen. 4.2 Fachliche Anforderungen an ein Real Time Data Warehouse Real Time Data Warehousing ist eine der Schlüsseltechnologien für ein Real Time Enterprise (RTE). Unter einem Real Time Enterprise versteht man nach Hugos (Hugos04) ein Unternehmen, dass gelernt hat, unter sich ständig verändernden Randbedingungen flexibel und zeitnah auf die Anforderungen seiner Zulieferer und Kunden zu reagieren, kontinuierlich Informationen über seine Märkte und seine internen Geschäftsprozesse sammelt, analysiert und für die Entscheidungsfindung verwendet, sich einem ständigen Prozess der Geschäftsprozessoptimierung befindet und neue Marktchancen und Trends schnell erkennt und umgehend nutzen kann. Eine ähnliche Definition von Gartner wird in (Hedegard07) genannt: The RTE monitors, captures, and analyzes root-cause and overt events that are critical to its success the instant those events occur, to identify new opportunities, avoid mishaps, and minimize delays in core business processes. The RTE will then exploit that information to progressively remove delays in the management and execution of its critical business processes. Drei Beispiele mögen den durch ein RTDW generierten Mehrwert verdeutlichen. Dieser Mehrwert muss bei der Investitionsentscheidung für ein RTDW eine entscheidende Rolle spielen. Ein Unternehmen möchte auf Basis der aktuellen Kundenprofitabilität die Service Levels und Cross Selling Angebote für seine Kunden mit Hilfe einer Rules Engine automatisiert in Echtzeit differenzieren. Kapitel 4 - Real Time Data Warehousing 9 Nach Untersuchungen von Saitz et al. (Saitz02) sind Fondsmanager bereit, für transparent berichtende Unternehmen 15 bis 20% höhere Kurse zu bezahlen. Als Beispiele werden Cisco und Motorola aufgeführt, die nahezu in Echtzeit einen virtuellen Abschluss erstellen können. Somit dient eine schnellere Berichterstattung als ein mögliches Werkzeug zur Wertschöpfung und somit zur Steigerung des Shareholder Value. Anderson et al. stellen in (Anderson04) ein Flight Management Dashboard von Continental Airlines vor. Dies ermöglicht es bei verspätet ankommenden Flugzeugen diese an solche Gates zu dirigieren, so dass umsteigende hochprofitable Statuskunden einen möglichst kurzen Weg zu ihren Anschlussflügen haben, um diese so doch noch erreichen können. Weitere Anwendungsfelder für ein RTDW finden sind typischerweise in den folgenden Bereichen: Analytisches Customer Relationship Management (Beispiel: Kampagnenmanagement in Echtzeit auf Basis verschiedener Anwendungen und Datenquellen)(Gluchowski08). Financial Performance Management (Beispiel: Fast Close / Virtual Close)(Oehler06, Saitz02) Bereitstellung und Analyse von Finanzmarktdaten in Echtzeit (Kemper04) Customer Service Marketing Integrierte Logistik (Supply Chain Management)(Hedegard07) Fraud Detection / Corporate Security Weitere Beispiele finden sich in (Bucher08). Damit wird deutlich, dass ein RTDW nicht mehr - wie ursprünglich für das Date Warehouse gedacht - primär für strategische Entscheidungen der obersten Führungsebene eines Unternehmens verwendet wird. Gesucht wird vielmehr eine Entscheidungsunterstützung auch für Entscheidungen mit überwiegend taktischem und sogar operativem Charakter. Gleichzeitig ist damit ein signifikanter Anstieg in der Anzahl der zu treffenden Entscheidungen in einem häufig zunehmend härteren Wettbewerbsumfeld zu verzeichnen. Es werden mehr Geschäftsereignisse aktiv registriert und verstärkt werden mit einem Data Warehouse nicht nur Analysen der Vergangenheit durchgeführt, sondern auch Vorhersagen in die Zukunft gemacht. Es wird daher deutlich, dass auch die vielen kleinen Entscheidungen im täglichen Kundenkontakt Profitabilität und Reputation eines Unternehmens maßgeblich mitbestimmen. Die Entwicklung zu schnelleren Entscheidungen im Real Time Enterprise vergrößert gleichzeitig auch die Anwenderzielgruppe für das RTDW. Zunehmend benötigen auch Fach- und Führungskräfte mittlerer und unterer Hierarchieebenen analytische Werkzeuge. Es ist nicht mehr akzeptabel, dass solche Entscheider aktuelle Informationen mühsam manuell aus verschiedenen operativen Systemen zusammentragen müssen. Kapitel 4 - Real Time Data Warehousing 10 Die historische Entwicklung von einer eher vergangenheitsorientierten Betrachtungsweise (Reporting - What happened?) über das RTDW (Operationalizing - What is happening?) hin zu einer auf Regelbasis automatisierten Entscheidungsfindung (Activating - Make it happen) ist auch in Abbildung 4.1 dargestellt. Abbildung 4.1: Data Warehouse Entwicklungsstufen (Turban07) Insgesamt zeichnet sich also ab, dass sich durch Echtzeit-Analytik zusätzliche Wertschöpfung generieren lässt und somit Business Intelligence zunehmend in den Kontext gestellt wird, in dem der größte Nutzen erzielbar ist: Business Process Management (BPM). Diese Verknüpfung wird in der Literatur (Oehler06) auch mit dem Begriff Corporate Performance Management (CPM) zum Ausdruck gebracht. Zusammenfassend ist festzuhalten, dass sich durch ein RTDW zahlreiche neue fachliche Optionen eröffnen: Entscheidungsunterstützung nahezu in Echtzeit auf Basis operativer Performancekennzahlen. Steuerungskompetenz der Analyseergebnisse für das BPM: Optimierte Geschäftsprozesse. Realisierung eines Closed Loop: Rückkopplung der analytischen Ergebnisse in operative Prozesse durch einen geschlossenen Kreislauf zwischen dispositiven und operativen Systemen (Gluchowski08), wobei die Grenzen zwischen operativen und analytischen Anwendungen zunehmend verwischen. Kapitel 4 - Real Time Data Warehousing 11 Active Business Intelligence: Automatisierte Aktionen auf Basis einer Rules Engine. In diesem Zusammenhang sollte allerdings auch nicht unerwähnt bleiben, dass ein RTDW in aller Regel lediglich die technische Voraussetzung für ein Real Time Enterprise darstellt. Entscheidend ist letztendlich auch der erforderliche organisatorische und kulturelle Wandel im Unternehmen, wie er zum Beispiel durch ein Business Process Re-Engineering angestoßen werden kann. Erst dann wird es gelingen, die durch ein RTDW schneller bereitgestellten Daten (Verkürzung der Data Latency) auch zeitnah zu analysieren (Analysis Latency) und in Entscheidungen und Aktionen einfließen zu lassen (Decision Latency). Nur so wird die letztendlich endscheidende Gesamtzeit zwischen dem Geschäftsereignis und der daraus resultierenden Aktion auf ein Minimum reduziert und somit auch der mit der Verzögerung einhergehende Wertverlust der Informationen mit der Zeit minimiert. Dieser Zusammenhang ist in Abbildung 4.2 dargestellt.3 Abbildung 4.2: Wertverlust der Information mit der Zeit (Gluchowski08, Hackathorn03) 3 Allerdings sollte auch beachtet werden, dass der Wert einer Information im Laufe der Zeit auch zunehmen kann. Zum Beispiel werden Auswirkungen eines Ereignisses oft erst nach einer gewissen Zeit in ihrem vollen Ausmaße deutlich. Kapitel 4 - Real Time Data Warehousing 12 Für die Wirtschaftlichkeitsbetrachtung eines RTDW müssen die tatsächlichen Anforderungen an die Latenzzeiten fachlich sehr sorgfältig analysiert werden. Nur in wenigen Fällen wird das technisch (mit hohen Kosten) machbare, auch aus fachlicher Sicht vertretbar sein. In aller Regel wird ein Senkung der Latenzzeiten in die Größenordnung von Stunden völlig ausreichend sein. Eine Übersicht über aktuelle Entwicklungstendenzen im RTDW-Umfeld auf Basis einer Marktstudie bei verschiedenen Unternehmen findet sich in (Ventana07). 4.3 Real Time Data Warehouse Architekturen Im diesem Abschnitt werden exemplarisch drei verschiedene RTDW-Architekturen vorgestellt und ihre Vor- und Nachteile erläutert. Diese Darstellung basiert auf (Forrester08) und ist weder umfassend und vollständig. Sie soll lediglich einige Kernentscheidungen beim Entwurf einer RTDWArchitektur andeuten, um die in Kapitel 6 folgenden Ausführungen zu speziellen Aspekten des Projektmanagements von RTDW-Projekten auf eine sinnvolle Basis zu stellen. Grundsätzlich offerieren sowohl der ETL-Prozess als auch die Verarbeitung im Data Warehouse bzw. in den Analysesystemen Beschleunigungspotenzial. Der ETL-Prozess lässt sich zum Beispiel durch eine Erhöhung der Ladefrequenzen und/oder die Verkürzung der Ladedauer (inkrementelle oder Delta Loads, parallele Verarbeitung) beschleunigen. 4.3.1 Szenario 1: (Near) Real Time Data Warehouse Die in Abbildung 4.3 dargestellte Architektur für ein (Near) Real Time Data Warehouse stellt den Ausbau eines existierenden Data Warehouse zu einem (Near) RTDW dar. Damit lassen sich Latenzzeiten im Bereich von Stunden bis Minuten realisieren. Diese Lösung ist inkrementell realisierbar und wird für die meisten Unternehmen die beste Lösung darstellen. Beschleunigungspotenziale gegenüber dem klassischen Data Warehouse lassen über die folgenden Mechanismen realisieren: Datenbank-Trigger, die Datenänderungen in den operativen Systemen sofort registrieren. Erhöhung der ETL-Frequenz. Reduktion des ETL-Datenvolumens durch inkrementelle Batches (Trickle Feed). Schnellere Verarbeitung der Daten im Data Warehouse und in den Analysesystemen. Ausbau der Hardwareressourcen. Evolutionäre Verbesserungen der Middleware und des Workload Managements. Kapitel 4 - Real Time Data Warehousing 13 Abbildung 4.3: Architektur für ein (Near) Real Time Data Warehouse Die Vorteile dieses Szenarios bestehen darin, dass durch die inkrementelle Vorgehensweise bisherige Data Warehouse Investitionen und Know How weiter genutzt werden können. Zudem sind die Auswirkungen auf die operativen Systeme minimal. Echtzeitdaten und historische Daten werden auch weiter in einem einzigen Data Warehouse gespeichert. Letzteres vereinfacht zum Beispiel das Datenqualitätsmanagement. Der Hauptnachteil dieses Szenarios besteht darin, dass es nicht für ein echtes RTDW mit garantierten Sub-Second, End-to-End Datenlatenzzeiten geeignet ist. 4.3.2 Szenario 2: Operational Data Store Abbildung 4.4 ist eine Architektur dargestellt, in der das RTDW über einen zusätzlichen Operational Data Store (ODS) realisiert wird. Der ODS enthält nur die aktuellen, aber keine historischen Daten, ist nicht persistent und die Daten liegen in hoher Granularität (Transaktionsdetails, kaum Integration) vor. Somit existiert eine zentrale Datenbasis für Analysen in Echtzeit Diese Datenbasis beruht auf einem beschleunigten ETL-Prozess zur Befüllung des ODS. Kapitel 4 - Real Time Data Warehousing 14 Abbildung 4.4: Architektur für einen Operational Data Store Der Hauptvorteil dieser Architektur besteht darin, dass sie einen separaten Pfad aufweist, der schnell einzurichten ist und für das DW keinen zusätzliche Workload bedeutet. Nachteile bestehen in der Erweiterung der bisherigen Architektur. Dies erhöht die Wartungskosten aufgrund der gewachsenen Komplexität. Zudem ergeben sich neue Herausforderungen im Bereich Datenqualitätsmanagement, da der ODS nicht in das bisherige Datenqualitätsmanagement integriert ist. Beachtet werden muss auch, dass der ODS im Normalfall keine integrierten und/oder historischen Daten enthält. 4.3.3 Szenario 3: Event Stream Processing Die architektonisch aufwendigste Lösung ist in Abbildung 4.5 skizziert. Sie ermöglicht ein echtes RTDW im garantierten Sub-Second Bereich End-to-End. Dies lässt sich durch eine Integration der Ideen moderner Enterprise Application Integration (EAI) Architekturen in den ETL-Prozess erreichen. So lassen sich (Geschäfts-) Ereignisse (Events) in Echtzeit registrieren und von der Datenintegrationsplattform sofort weiterverarbeiten. Kapitel 4 - Real Time Data Warehousing 15 Traditionelle ETL-Prozesse zeichnen sich dadurch aus, dass sie mit oft komplexen Transformationen aggregierte Datenmengen verarbeiten. Dies ermöglicht eine Subjekt- und Analyseorientierung, führt aber zu Verzögerungen, die im RTDW-Umfeld nicht akzeptabel sind. EAI-Architekturen hingegen sehen von vornherein eine zeitnahe Übertragung kleinerer, isolierter, ereignisorientierter Datenmengen vor (und sind somit deutlich transaktionsorientierter und weniger qualitätsgesichert). Abbildung 4.5: Event Stream Processing Es handelt sich um eine recht flexible, dezentralisierte und verteilte Architektur. Verschiedene Subscriber oder Services können jederzeit an die Datenintegrationsplattform angekoppelt werden. Indem die Analytik als Service in eine Service Orientierte Architektur (SOA) eingebunden wird erhöht sich die Agility der BI-Services, die so im Sinne von Corporate Performance Management (CPM) und Business Activity Monitoring (BAM) besser bei der Orchestrierung der Geschäftsprozesse unterstützen können. Im Regelfall können bisherige EAI und DW Investitionen werden weiter genutzt. Von Nachteil ist bei dieser Architektur, dass sie eine erhebliche Erweiterung der bisherigen DW Architektur darstellt. Sie erhöht die Komplexität und das damit verbundene erforderliche Know How Kapitel 4 - Real Time Data Warehousing 16 zum Aufbau und zur Wartung deutlich. Zudem müssen mit EAI und ETL zwei bisher weitgehend getrennte Konzepte zusammengeführt werden. Nicht zu vernachlässigen sind auch die Performance Auswirkungen auf die operativen Systeme. Weiterhin muss die neue Datenintegrationsplattform in das bisherige Datenqualitätsmanagement integriert werden. Eine ausführliche Diskussion der Verknüpfung von EAI und ETL im Kontext RTDW findet sich auch in (Chamoni06). Gluchowski (Abbildung 4.6) schlägt eine an einen Enterprise Service Bus gekoppelte Staging Area vor, aus der das Enterprise Data Warehouse in regelmäßigen Ladezyklen gemäß den Echtzeitanforderungen befüllt wird. Abbildung 4.7 zeigt die mögliche Integration von BI in eine SOA über BI und analytische Services. Eine vollständige Diskussion einer Real Time Enterprise Referenzarchitektur findet sich zum Beispiel in (Hedegard07) (Siehe auch Abbildung 9.1 auf Seite 66). Abbildung 4.6: Blue Print für eine Real Time BI-Architektur (Gluchowski08) Kapitel 4 - Real Time Data Warehousing 17 Abbildung 4.7: Integration von BI und SOA (Gluchowski08) 4.4 Zusammenfassung In diesem Kapitel wurde gezeigt, was ein RTDW auszeichnet und welche fachlichen Überlegungen den Einsatz eines RTDW in der unternehmerischen Praxis rechtfertigen. Drei beispielhafte RTDW Architekturen wurden mit ihren Vor- und Nachteilen vorgestellt. Auf dieser Basis sollen in Kapitel 6 spezielle Aspekte des Projektmanagements von RTDW-Projekten untersucht werden. Zunächst wird jedoch in Kapitel 5 mit dem Kimball Lifecycle eine Methodologie für BI-Projekte vorgestellt. Kapitel 5 - Der Kimball Lifecycle 5 18 Der Kimball Lifecycle Wie bereits in Kapitel 3 angedeutet, stellt Kimball mit dem Data Warehouse Lifecycle Toolkit (Kimball08) (kurz: Kimball Lifecycle) eine sehr praxisnahe und pragmatische Methodologie für Projekte im Umfeld von Data Warehousing und Business Intelligence bereit. In diesem Kapitel wird ein Gesamtüberblick über den Kimball Lifecycle vorgestellt, bevor anschließend spezielle Aspekte von RTDW-Projekten in den Bereichen Program/Project Planning, Program/Project Management, Business Requirements Definition, Technical Architecture Design und Product Selection und Installation untersucht werden. 5.1 Einführung Einer der zentralen Grundgedanken von Kimball besteht im Lifecycle Ansatz von DW/BI-Projekten4 und ihrer starken Ausrichtung an den fachlichen Anforderungen. Der Lifecycle Ansatz folgt zwingend aus der Erkenntnis, das sich DW/BI-Systeme in aller Regel ständig weiterentwickeln und eine nicht zu unterschätzende Dynamik entwickeln können, die in Verbindung mit der typischerweise großen fachlichen, technischen und politischen Komplexität hohe Anforderungen an das DW/BIProjektmanagement stellt. Diese Dynamik ist positiv zu sehen, da sie doch in aller Regel Indiz für ein wachsendes Interesse der fachlichen Anwender und den daraus resultierenden neuen Wünschen an das DW/BI-System ist. Für nicht zielführend hält Kimball in diesem Zusammenhang einen Big Bang Ansatz oder einen Ansatz, der zu sehr auf technische Aspekte ausgerichtet ist. Damit liegen die Herausforderungen an das DW/BI-Projektmanagement in aller Regel deutlich über denen von typischen Anwendungsentwicklungsprojekten (siehe auch die Ausführungen in Kapitel 3). Dies führt zur Notwendigkeit, flexible und adaptierbare Designtechniken zu verwenden und von Beginn an vorzusehen, dass DW/BI-Projekte im Normalfall kein eindeutig definiertes Ende besitzen. 4 Kimball verwendet durchgehend den Begriff DW/BI um das Gesamtsystem zu bezeichnen. Dies entspricht dem weiten BI-Verständnis aus Abbildung 2.1. Die zu analysierenden Daten befinden sich im Enterprise Data Warehouse (EDW) und die Schnittstelle zum Anwender bezeichnet Kimball als BI Applications. Kapitel 5 - Der Kimball Lifecycle 19 Stark im Vordergrund steht bei Kimball auch die mehrdimensionale Datenmodellierung. Sie bestimmt entscheidend, wie die Daten den Anwendern zur Verfügung gestellt werden und stellt gleichzeitig eine wichtige Schnittstelle zwischen fachlichen und technischen Anforderungen dar. Seine Ursprünge hat der Kimball Lifecycle in den 80er Jahren. Er wurde in den Folgejahren ständig weiterentwickelt. Die aktuelle Auflage, die Basis für die folgenden Untersuchungen darstellt, stammt aus dem Jahre 2008 (Kimball08). 5.2 Gesamtüberblick Der gesamte Kimball Lifecycle ist in Abbildung 5.1 dargestellt. Charakteristisch für den Kimball Lifecycle ist die enge Verknüpfung verschiedenster Aufgabenbereiche und ihre Gruppierung in drei Hauptzweige: Technologie, Daten und BI-Anwendungen. Dabei ist es wichtig, alle Aspekte eines DW/BI-Projektes ausreichend zu berücksichtigen. DW/BI-Projekte, die ein übermäßiges Gewicht auf Einzelaspekte legen, laufen ein hohes Risiko zu scheitern. Einige Aufgaben in den verschiedenen Zweigen sind in Abbildung 5.1 bewusst übereinander angeordnet, da sie auch zeitlich parallel durchgeführt werden sollen. Allerdings soll die Tatsache, dass alle Kästen i.w. die gleiche Breite haben, nicht implizieren, dass damit auch gleiche Aufwände und Dauern verbunden sind. Dies ist sicher zu stark projektabhängig, als dass es sich für solch einen Überblick verallgemeinern ließe. Abbildung 5.1: Der Kimball Lifecycle (Kimball08) Kapitel 5 - Der Kimball Lifecycle 20 Im folgenden werden alle Hauptaufgabenbereiche aus Abbildung 5.1 kurz skizziert Für die sich anschließenden Untersuchungen von RTDW-Projekten stehen die Bereiche Program/Project Planning, Program/Project Management, Business Requirements Definition, Technical Architecture Design und Product Selection und Installation im Vordergrund (siehe auch Fußnote 1 auf Seite 1). 5.2.1 Program/Project Planning Auf Basis erster ungefährer Ideen für das zu entwickelnde DW/BI-System werden im Project Planning der grobe Projektumfang festgelegt, zu erledigende Aufgaben identifiziert, die damit verbundenen Aufwände geschätzt und ihre Reihenfolge ermittelt. Zudem müssen die dafür benötigten Ressourcen akquiriert werden. Hauptergebnis - und Grundlage für alle folgenden Schritte - ist der Gesamtprojektplan, der die wesentlichen Ergebnisse zusammenfasst. Es besteht eine enge, wechselseitige Beziehung zur folgenden Business Requirements Definition, da dort gefällte Entscheidungen Rückwirkungen auf den Projektplan haben können. Gemäß Kimball ist ein Projekt der einmalige Durchlauf des Lifecycle während unter Programm die übergeordnete und fortlaufende Koordination mehrerer Projekte/Durchläufe verstanden wird. 5.2.2 Program/Project Management Das Program/Project Management muss dafür sorgen, dass die im Projektverlauf zu erledigenden Aufgaben auch tatsächlich zum richtigen Zeitpunkt und in der richtigen Reihenfolge ausgeführt werden. Dazu muss der Projektstatus kontinuierlich überwacht werden und ggf. korrigierend eingegriffen werden. Zudem ist darauf zu achten, dass Änderungen am Projektumfang nur nach Genehmigung erfolgen. Erwartungsmanagement und aktive Kommunikation ergänzen die Aufgaben im Program/Project Management. Diese Aufgabe erstreckt sich i.w. über den gesamten Projektverlauf. 5.2.3 Business Requirements Definition Der Projekterfolg hängt im wesentlichen von einem genauen Verständnis der Anforderungen und Wünsche der zukünftigen Anwender ab. Sonst droht das Projekt zur technischen Spielwiese der ITAbteilung zu verkommen. Daher müssen die fachlichen Anforderungen sorgfältig erfasst werden. Dafür ist ein detailliertes Wissen über das Geschäftsfeld des Unternehmens unbedingt Voraussetzung. Defizite in diesem Bereich werden sich in allen folgenden Aufgabenbereichen negativ auswirken und zu Mehraufwänden und späteren Akzeptanzproblemen führen. Ein wichtiges Ergebnis ist die Data Warehouse Bus Matrix. Diese verknüpft die Kernprozesse der Organisation mit ihnen Datendimensionen. Kapitel 5 - Der Kimball Lifecycle 21 Im Anschluss an die Definition der fachlichen Anforderungen folgen die bereits oben erwähnten drei parallelen Zweige: Technologie, Daten und BI-Anwendungen. 5.2.4 Technologie: Technical Architecture Design Die erste Aufgabe im Technologiezweig liefert ein Gesamtkonzept für die zukünftige Technische Architektur (TA). Neben der bereits existierenden technischen Umgebung müssen hierbei auch die fachlichen Anforderungen und die Technologiegesamtstrategie des Unternehmens berücksichtigt werden. Hier geht es zunächst vor allem um die Frage, welche Services zukünftig bereitgestellt werden sollen. 5.2.5 Technologie: Product Selection and Installation Aufbauend auf dem Design für die Technische Architektur wird nun das „Wie“ definiert: Welche Hardware, Datenbanksysteme, ETL-Tools und Datenzugriffs- und Reportingtools werden benötigt und genügen den Anforderungen? Nach der Auswahl müssen diese Produkte installiert und getestet werden. 5.2.6 Daten: Dimensional Modelling Auf Basis der Enterprise Data Warehouse Bus Matrix aus der Business Requirements Definition beginnt der Datenzweig mit dem Design des (mehrdimensionalen) Datenmodells. Das Datenmodell ist wesentliche Grundlage für flexible und performante Datenanalysen und Reports. Hierzu werden im Dimensional Modelling die benötigten Faktentabellen und ihre Dimensionen identifiziert. 5.2.7 Daten: Physical Design In diesem Schritt wird das zuvor definierte mehrdimensionale (logische) Datenmodell in ein physikalisches Modell in einer relationalen Datenbank übersetzt (Star Schema). Darüber hinaus werden Sicherheitsaspekte und Performancefragen adressiert. Falls erforderlich, werden hier auch die benötigten OLAP-Datenbanken angelegt, die das mehrdimensionale Datenmodell in Würfelform abbilden. Kapitel 5 - Der Kimball Lifecycle 5.2.8 22 Daten: ETL-Design and Development Schlussendlich müssen die analytischen Datenbanken mit Daten gefüllt warden. Die dazu erforderlichen Schritte Extraktion, Transformation und Laden (ETL) werden in diesem Arbeitspaket entworfen und umgesetzt. Gemäß Kimball liegen etwa 70% des Aufwandes und der Risiken eines DW/BIProjektes in diesem Bereich. Ursachen hierfür sind sicherlich in den heterogenen Quellsystemen, den oft mangelhaften Dokumentationen derselben und politischen Herausforderungen zu suchen. Dabei gilt es nicht nur die Erstbefüllung sicherzustellen, sondern auch einen regelmäßigen inkrementellen Updateprozess zu implementieren. 5.2.9 BI-Anwendungen: BI Application Design Sobald die fachlichen Anforderungen bekannt sind, kann gemäß Kimball parallel zu den beiden o.g. Zweigen auch bereits mit der Identifikation der erforderlichen BI-Anwendungen begonnen und geeignete Anwenderschnittstellen entworfen werden. Dabei sollte berücksichtigt werden, dass aus Anwendersicht nicht die Daten an sich, sondern ihre fachliche Aussagenkraft (Business Value), im Vordergrund stehen. 5.2.10 BI-Anwendungen: BI Application Development Nach ihrem Design müssen die BI-Anwendungen konfiguriert und getestet werden. Dies ist die Hauptaufgabe in diesem Arbeitsschritt, der den BI-Anwendungszweig abschließt. 5.2.11 Deployment Abschließend gilt es die Ergebnisse aus den drei verschiedenen Zweigen zusammenzuführen und dem Anwender zur Verfügung zu stellen. Dies setzt eine umfangreiche Planung sehr verschiedener Aktivitäten voraus. Dazu gehören zum Beispiel die Durchführung von Integrationstests, Schulungsmaßnahmen für die Anwender und der Aufbau einer geeigneten Supportstruktur. Sollte es zu Verzögerungen in einem dieser Bereiche kommen, steht das Startdatum der gesamten DW/BIAnwendung in Frage. 5.2.12 Maintenance Um den täglichen produktiven Betrieb der DW/BI-Anwendung sicherzustellen, sind geeignete Betriebsführungsabläufe vorzusehen. Dazu gehören zum Beispiel ein effizientes Monitoring und Performance Tuning, die Wartung der Indizes und die Durchführung regelmäßiger Backups. Ebenso Kapitel 5 - Der Kimball Lifecycle 23 sind klassische Prozesse des IT Service Managements wie zum Beispiel ein Sevice Desk, Incident Management etc. aufzusetzen. 5.2.13 Growth Ist das DW/BI-System von den Anwendern angenommen worden, werden schnell Wünsche nach weiteren Funktionalitäten laut. Dies sollte nicht als Zeichen von Mängeln des aktuellen Systems verstanden werden, sondern als Erfolg und Zeichen der Akzeptanz. Diese Erweiterungswünsche müssen nun gesammelt, analysiert und priorisiert werden. Somit beginnt der Lifecycle wieder von vorne. 5.3 Zusammenfassung Damit ist der Kimball Lifecycle mit seinen Hauptaufgabenbereichen aus Abbildung 5.1vorgestellt. Für die sich anschließenden Untersuchungen von RTDW-Projekten stehen nun die Bereiche Program/Project Planning, Program/Project Management, Business Requirements Definition, Technical Architecture Design und Product Selection und Installation im Vordergrund. Kapitel 6 - Real Time Data Warehousing Projektmanagement 24 6 Real Time Data Warehousing Projektmanagement 6.1 Einführung In den vorangegangenen Kapiteln wurde erläutert, aus welchen fachlichen Überlegungen heraus ein RTDW eine lohnenswerte Investition sein kann und welche IT-Architekturen denkbar sind. Anschließend wurde ein Gesamtüberblick über den Kimball Lifecycle vorgestellt. Spezielle Aspekte des Projektmanagements von RTDW-Projekten werden in der Literatur bisher nur an wenigen Stellen erwähnt (Brobst05). Eine detailliertere und systematische Betrachtung der RTDW spezifischen Aspekte des Projektmanagements auf Basis einer umfassenden BIProjektmanagement Methodologie gibt es sich bisher nicht. Deshalb wird im folgenden der Kimball Lifecycle um spezielle Aspekte des Projektmanagements von Real Time Data Warehouse Projekten erweitert. Dazu werden nun drei wichtige Bereiche des Kimball Lifecycle näher untersucht. Dabei sollen die in (Kimball08) für beliebige DW/BI-Projekte vorgeschlagenen Arbeitspakete und Empfehlungen auf ihre Anwendbarkeit und Relevanz für RTDW-Projekte untersucht werden. Wo es sinnvoll ist, werden spezifische Erweiterungen zum Kimball Lifecycle vorgeschlagen. Dabei stehen eindeutig Aspekte des Projektmanagementprozesses im Vordergrund. Es ist nicht beabsichtigt, konkrete technische oder fachliche Lösungsvorschläge zu erarbeiten. Im Detail werden die folgenden Bereiche betrachtet: Launching and Managing the Project/Program (umfasst die Arbeitspakete Program/Project Planning und Program/Project Management). Collecting the Requirements (umfasst das Arbeitspaket Business Requirements Definition). Creating the Architecture Plan and Selecting Products (umfasst die Arbeitspakete Technical Architecture Design und Product Selection & Installation). Diese Auswahl umfasst mit Launching and Managing the Project/Program und Collecting the Requirements die für die Anfangsphase eines RTDW-Projektes entscheidenden Bereiche und wird ergänzt durch die für ein RTDW-Projekt wichtigen Architekturaspekte. Der nächste logische Schritt wäre eine Untersuchung der Zweige Daten und BI-Anwendungen und der sich daran anschließenden Bereiche Deployment, Growth und Maintenance auf spezifische Aspekte von RTDW-Projekten (Siehe auch Fußnote 1 auf Seite 1 und der Ausblick in Kapitel 7). Im folgenden werden nicht alle Einzelaspekte aus dem Kimball Lifecycle dargestellt. Diese werden in (Kimball08) ausführlich und anschaulich beschrieben. Im Rahmen dieser Arbeit werden lediglich die Hauptaufgaben auf oberster Ebene zur Orientierung kurz skizziert. Auf darunterliegende Aufga- Kapitel 6 - Real Time Data Warehousing Projektmanagement 25 ben wird nur dann eingegangen, wenn sich im Rahmen des Untersuchungsgegenstandes dieser Arbeit Änderungen oder Ergänzungen ergeben. Kimball geht in (Kimball08) nur kurz auf RTDW-Aspekte ein. Dies geschieht im Zusammenhang mit Detailfragen zu ETL-Prozessen. Für andere Bereiche des Lifecycle finden sich keine spezifischen Hinweise für RTDW-Projekte. Für die folgenden Betrachtungen wird von einem fiktiven Unternehmen ausgegangen, das bereits eine DW/BI-Lösung besitzt und nun vor der Frage steht, ob es dies zu einem RTDW erweitern möchte und wie eine geeignete Vorgehensweise aussehen könnte. Kapitel 6 - Real Time Data Warehousing Projektmanagement 6.2 26 Launching and Managing the Project/Program Die zum Launching and Managing the Project/Program gehörenden Arbeitspakete Program/Project Planning und Program/Project Management sind in der Gesamtübersicht zum Kimball Lifecycle in Abbildung 6.1 hervorgehoben. Abbildung 6.1: Launching and Managing the Project/Program Gemäß Kimball sind im Launching and Managing the Project/Program die in Abbildung 6.2 aufgeführten Hauptaufgaben und Aufgaben zu berücksichtigen.5 5 Dabei ist zu beachten, dass sich die Hauptaufgaben nicht 1:1 in die Arbeitspakete aus Abbildung 6.1 übersetzen lassen. Die Zuordnung sollte dem Leser aber trotzdem keine Schwierigkeiten bereiten. Aus Gründen der Vergleichbarkeit lehnt sich diese Arbeit aber an die Darstellung von Kimball an. Kapitel 6 - Real Time Data Warehousing Projektmanagement 27 PROJECT DEFINITION Assess DW/BI-Readiness Develop preliminary Project Scope/Charter Build Business Justification PROJECT PLANNING & MANAGEMENT Establish Project Identity PLAN Identify Project Resources Prepare Project Plan Develop Project Communication Plan Conduct Project Team Kick Off & Planning Develop Process to manage Scope. Control Changes MANAGE Develop Process to measure Success User Acceptance/Project Review Ongoing Project Management PROGRAM PLANNING & MANAGEMENT Establish Governance Responsibility/Process Establish Program Communication Plan Establish Enterprise Data Stewardship Establish Program Best Practices Conduct Periodic Program Assessments Ongoing Program Management Abbildung 6.2: Aufgaben im Bereich Launching and Managing the Project/Program Diese Aufgaben werden im folgenden genauer auf ihre RTDW-Spezifika hin untersucht. 6.2.1 Project Definition Entsteht in einem Unternehmen, das bereits eine DW/BI-Lösung besitzt, die Idee zu einem RTDW, sollten zunächst im Rahmen der Projektdefinition einige grundsätzliche Startvoraussetzungen geklärt werden und anschließend der Projektumfang grob festgelegt werden. Wichtig in diesem Zusammenhang ist insbesondere auch die Beantwortung der Frage nach dem wirtschaftlichen Nutzen des RTDW. Kapitel 6 - Real Time Data Warehousing Projektmanagement 28 6.2.1.1 Assess DW/BI-Readiness Drei Voraussetzungen sollten bei einem RTDW-Projekt erfüllt sein, bevor die Projektdefinition ernsthaft in Angriff genommen wird. Ansonsten läuft das Projekt Gefahr, von vornherein keine sinnvolle Basis zu besitzen. 1. Die Kernvoraussetzung besteht darin, dass mindestens ein einflussreicher Sponsor aus dem oberen Management gefunden werden kann, der von der Idee eines RTDW überzeugt ist. Sollte es nicht gelingen, einen solchen zu finden, liegt dies möglicherweise in einer unzureichenden Analyse der fachlichen Motivation des Projektes (siehe 2.). 2. Aus fachlichen Überlegungen heraus muss es einen zwingenden Grund für das RTDW geben. In Kapitel 4 wurden Beispiele aufgeführt, aus denen ersichtlich wurde, weshalb die Verfügbarkeit von Echtzeitinformationen einen Mehrwert für ein Unternehmen darstellen kann. Insbesondere ist in diesem Zusammenhang genau zu untersuchen, wie zeitnah die Informationen wirklich zur Verfügung stehen müssen. In aller Regel wird man hier sorgfältig zwischen den Grenzkosten für eine weitere Senkung der Latenzzeiten und dem erzielbaren Grenznutzen abwägen. Oft spielen aber auch externe Gründe (Wettbewerbssituation, Marktchancen, gesetzliche Vorgaben) eine entscheidende Rolle. Hilfreich bei der Analyse der Notwendigkeit eines RTDW sind oft auch die Unternehmensstrategie und die durch schneller verfügbare Informationen möglichen Verbesserungen in den KPIs der Hauptgeschäftsprozesse. 3. Weniger als die technische Machbarkeit sollte die Qualität der zur Verfügung stehenden Daten im Rahmen eines Data Profiling bereits in dieser frühen Phase überprüft werden. Stehen die Daten in den Quellsystemen nicht im geforderten Umfang in der geforderten Aktualität zur Verfügung, fehlt dem RTDW die entscheidende Basis. Kein noch so guter ETL-Prozess wird dies ausgleichen können. Daher ist im Rahmen des Data Profiling grob zu untersuchen, welche Daten aus welchen Quellsystemen in welcher Aktualität für das RTDW benötigt werden, und ob die Quellsysteme diese Anforderungen erfüllen können (oder die operativen Systeme zum Beispiel schon durch den OLTP-Betrieb derart unter Last sind, dass einige für das RTDW zeitnah benötigte Transaktionsdaten erst mit unakzeptabler Verzögerung zur Verfügung gestellt werden können. Weitere Aspekte wie das Verhältnis der IT-Abteilung zur Fachabteilung oder die Frage nach einer grundsätzlichen Offenheit der Unternehmenskultur in Hinblick auf analytische Systeme sollten im Rahmen dieser Überlegungen zu RTDW-Projekten keine besondere Rolle spielen, da (gemäß der Grundannahme) das Unternehmen bereits DW/BI-Systeme einsetzt. Kapitel 6 - Real Time Data Warehousing Projektmanagement 29 6.2.1.2 Develop preliminary Project Scope/Charter Im nächsten Schritt muss der Projektumfang festgelegt werden. Dies kann nur in enger Anlehnung an die Business Requirements Definition im nächsten Arbeitspaket geschehen (siehe Kapitel 6.3). Ähnlich wie bei DW/BI-Projekten ist es auch für ein RTDW-Projekt sinnvoll, sich zunächst auf die Real-Time Analysemöglichkeit eines einzigen (Kern-) Geschäftsprozesses zu konzentrieren, um die fachliche Komplexität zu reduzieren. Dieser Geschäftsprozess wird häufig auch durch ein einziges operatives Quellsystem abgebildet, was auch die technische Realisierung zusätzlich erleichtern sollte. Wichtig ist, dass dieser Geschäftsprozess einerseits nicht zu komplex ist (um den Projektumfang nicht unnötig zu vergrößern), andererseits seine Einbindung in ein RTDW aber genügend Mehrwert generiert, um die hohen Projektkosten für ein RTDW zu rechtfertigen. Gerade für RTDW-Projekte, die auf einer existierenden DW/BI-Lösung aufsetzen, besteht die Gefahr, dass die Anwender die mit einer Verkürzung der Latenzzeiten einhergehenden Aufwände und Herausforderungen unterschätzen. Daher ist rechtzeitig ein aktives Erwartungsmanagement aufzusetzen, um die Gründe für die Konzentration auf zunächst nur einen Geschäftsprozess zu kommunizieren. Eng mit der Definition des Projektumfanges sollte auch die Identifizierung von (messbaren) Erfolgsfaktoren für das Projekt einhergehen. Am Ende diese Schrittes steht das Scope Dokument, das die gerade beschriebenen Aspekte zusammenfasst und ein einheitliches Verständnis über den Projektumfang bei allen Stakeholdern ermöglicht. Auch ist von vornherein einzuplanen, dass sich das Scope Dokument im Projektverlauf verändern wird. Allerdings sollte darauf geachtet werden, dass der Projektumfang sich dabei nicht unkontrolliert ausweitet (Scope Creep). 6.2.1.3 Build Business Justification In diesem Schritt wird der Business Case für das RTDW-Projekt ausgearbeitet. Eine zentrale Rolle spielt dabei die Gegenüberstellung der zu erwartenden Kosten mit dem zukünftigen Nutzen. Dazu werden meist Finanzkennzahlen wie ROI (Return on Investment), NPV (Net Present Value) oder IRR (Internal Rate of Return) verwendet. Viele Unternehmen besitzen Vorgaben zur Berechnung dieser Finanzkennzahlen (zum Beispiel Discount Rate), um verschiedene Projektskizzen besser vergleichen zu können. Ein RTDW-Projekt wird hier an den Business Case für das DW/BI-System anknüpfen können. Trotzdem ist es zum jetzigen (frühen) Zeitpunkt wahrscheinlich nur möglich, relativ grobe Schätzungen abzugeben. Auf der Kostenseite stehen im Zusammenhang mit einem RTDW-Projekt insbesondere folgende Überlegungen an: Kapitel 6 - Real Time Data Warehousing Projektmanagement 30 Hardware-Kosten: Welche zusätzlichen Hardware Investitionen fallen im Zusammenhang mit dem RTDW an? Dazu sollte eine grobe Entscheidung für eine der in Kapitel 4.3 aufgeführten IT-Architekturvarianten bereits gefallen sein. Insbesondere bei der möglichen Verwendung einer Datenintegrationsplatform (EAI) können erhebliche zusätzliche Kosten anfallen. Hier ist zu prüfen, inwieweit ähnliche Technologien bereits anderweitig im Unternehmen eingesetzt werden. Zusätzliche Kosten für Datenbankserver, Speicherplatz und erforderliche Netzwerkkapazitäten sollten auf Basis des bestehenden DW/BI-Systems relativ gut abschätzbar sein. Software-Kosten: Hier gilt es grob zu prüfen, inwieweit vorhandene ETL- und AnalysisSoftware wahrscheinlich auch im Kontext des RTDW weiterverwendet werden können, oder ob sie den Anforderungen nach Echtzeitfähigkeit nicht genügen und daher Alternativprodukte angeschafft werden müssen. Eine detaillierte Analyse dazu folgt in Kapitel 6.4. In anderen Bereichen (Reporting, Data Profiling, Metadata-Management, OS, DBMS) sind die zusätzlichen Investitionen vermutlich eher gering. Personalkosten: Erfahrungsgemäß ist dies auch im Rahmen eines RTDW-Projektes der größte Kostenblock. Neben internen Mitarbeitern sind je nach Architekturvariante auch externe Berater vorzusehen. Betriebskosten: Neben den einmaligen Projektkosten müssen auch die - oft nicht unerheblichen - zukünftigen Betriebskosten abgeschätzt werden. Allerdings sollten hier nur die zusätzlich zum bisherigen Betrieb der DW/BI-Lösungen anfallenden Kosten aufgeführt werden: Wartungskosten, Supportkosten und Kosten für ein mögliches Wachstum und potenzielle Erweiterungen (steigende Anwenderzahlen, Upgrades, Performance-Tuning). Aufgrund der höheren Zeitkritikalität eines RTDW ist insbesondere im Support Bereich mit gesteigerten Anforderungen (SLA) an die Reaktionszeiten bei Störungen zu rechnen. Während sich die Kostenseite oftmals relativ einfach abschätzen lässt, ist die Quantifizierung der Nutzenseite oft deutlich schwieriger. Bei einer soliden Fundierung des RTDW-Projektes auf fachlichen Anforderungen - verbunden mit der Konzentration auf einen (Kern-) Geschäftsprozess - sollte es aber möglich sein, auch diesen Aspekt ausreichend in Zahlen zu fassen. Im Kern muss versucht werden, die durch das RTDW erzielten Umsatzsteigerungen und Kosteneinsparungen abzuschätzen. Die in Kapitel 4 aufgeführten Beispiele zeigen mögliche Ansatzpunkte auf. Auch hier ist davon auszugehen, dass die bereits für das DW/BI-System ermittelten Zahlen zumindest als Ausgangspunkt weiterverwendet werden können. Im Vordergrund der Nutzenanalyse stehen dabei natürlich solche Bereiche, in denen die Zeitkritikalität eine entscheidende Rolle spielt. Als Beispiel könnten hier Umsatzsteigerungen durch eine kürzere Reaktionszeit auf veränderte Wettbewerbssituationen oder eine höhere Zufriedenheit - und damit höhere Umsätze - von Statuskunden (siehe Anderson04) dienen. Eventuell ist es auch sinnvoll, die Opportunitätskosten bei Fehlen eines RTDW oder externe Faktoren wie gesetzliche Vorgaben mit ins Kalkül zu ziehen. Kapitel 6 - Real Time Data Warehousing Projektmanagement 31 Damit ist die Projekt Planung abgeschlossen und die Entscheidung über die Projektdurchführung sollten zeitnah fallen. 6.2.2 Project Planning Ist das RTDW-Projekt in groben Zügen definiert und wurde genehmigt, besteht die nächste wichtige Hauptaufgabe nun darin, eine detaillierten Projektplan zu erstellen. 6.2.2.1 Establish Project Identity Hier ergeben sich für ein RTDW keine spezifischen Aufgaben, die von denen für ein DW/BI-Projekt abweichen. 6.2.2.2 Identify Project Ressources Ein wichtiges Erfolgskriterium für jedes Projekt besteht darin, die richtigen Personen für die zu erledigenden Aufgaben zu identifizieren und für das Projekt zu gewinnen. Meistens besteht dabei keine 1:1 Beziehung zwischen Personen und Rollen, sondern eine Person nimmt häufig mehrere Rollen wahr. Typischerweise besteht ein RTDW-Projekt etwa aus 5 bis 20 Mitgliedern. Natürlich variiert diese Größe sehr stark mit den Randbedingungen des Projektes und seinem Umfang. In Abbildung 6.3 sind die nach (Kimball08) für ein DW/BI-Projekt zu besetzenden Rollen aufgeführt. Die Rollen, auf die im Rahmen eines RTDW-Projektes besondere Aufgaben zukommen, sind hervorgehoben. Diese werden im folgenden genauer erläutert. Kapitel 6 - Real Time Data Warehousing Projektmanagement Fans Business Users Front Office Business Sponsor / Business Driver 32 DW/BI-Director / Program Manager Project Manager Coaches Business Project Lead Regular Line-Up Business Analyst Data Steward / QA Analyst Data Architect / Data Modeler / DBA Metadata Manager ETL-Architect / ETL-Developer BI-Architect / BI-Application Developer / Portal Developer Special Teams Technical Architect / Tech Support Specialist Security Manager Lead Tester Data Mining / Stats Specialist Educator Abbildung 6.3: Projektrollen für ein RTDW-Projekt Im wesentlichen gelten beim Staffing für ein RTDW-Projekt die gleichen Überlegungen, wie von Kimball in (Kimball08) für ein allgemeines DW/BI-Projekt beschrieben. Daher ist es wünschenswert, wenn möglichst viele der am Aufbau das DW/BI-Systems beteiligten Personen auch in das RTDW-Projekt miteinbezogen werden. Folgende Aspekte sind jedoch im Rahmen eines RTDW-Projektes besonders zu beachten: Data Steward / Quality Assurance Analyst: In einem RTDW werden erhöhte Ansprüche an die Aktualität der Daten gestellt. Die benötigten Echtzeitdaten müssen identifiziert und definiert werden, die Geschäftsregeln für die Daten müssen formuliert werden und gültige Wertebereiche vereinbart werden. Dies setzt ein hohes fachliches Know How voraus und erfordert in aller Regel Durchsetzungsvermögen und gute Kommunikationsfähigkeiten, da verschiedene Abteilungen an dieser Stelle zusammenarbeiten müssen. Ebenso muss der Quality Assurance Prozess für die Bedürfnisse des RTDW erweitert werden. Data Architect / Data Modeler / DBA: Je nach der gewählten Technischen Architektur für das RTDW kommen auf den Data Architect, den Data Modeler und den Datenbankadministrator verschiedene Aufgaben zu. Das mehrdimensionale Datenmodell muss erweitert oder angepaßt werden und in das physikalische relationale Modell übersetzt werden. Schlussend- Kapitel 6 - Real Time Data Warehousing Projektmanagement 33 lich müssen die Datenbanksysteme auch unter den Rahmenbedingungen deutlich höherer ETL-Frequenzen betrieben werden. Folgende grundsätzliche Ansätze sind dabei denkbar (Langseth04): o Modellierung „as usual“: Bei Trickle & Flip sowie Direct Trickle Feed (Details hierzu sind im nächsten Punkt beschrieben) wird kein spezieller Modellierungsansatz benötigt, da historische und Echtzeit-Daten in den gleichen Faktentabellen gespeichert werden. o Separate Real-Time Partition: Echtzeit-Daten werden in separaten Faktentabellen gespeichert. Dies erfordert den Einsatz intelligenter Abfrage-Tools, die Tabellenpartition unterstützen. o Integrated Real-Time durch Views: Kombination der getrennten historischen Daten und Echtzeit-Daten durch Views. Die Datenspeicherung erfolgt in kleineren Tabellen, diese können im Cache gelagert werden. o Modellierung mit externem Real-Time Datencache: Keine spezielle Modellierung erforderlich, da der externe Real-Time Datencache ein identisches Datenschema wie das Data Warehouse hat. ETL-Architect / ETL-Developer: Eine der Hauptherausforderungen in einem RTDW-Projekt besteht in der Beschleunigung des ETL-Prozesses. Die Laufzeit muss durch Maßnahmen wie zum Beispiel inkrementelle Loads verkürzt werden und die Frequenzen müssen gemäß den Anforderungen an die Latenzzeit verkürzt werden. Dies setzt ein detailliertes Verständnis der operativen Quellsysteme und der verwendeten ETL-Tools voraus. Ein Großteil der Aufwände für das RTDW-Projekt sind in diesem Bereich zu erwarten. Die Komplexität der ETL-Prozesse lässt es auch ratsam erscheinen, ein sorgfältiges modulares Design derselben zu entwerfen. Neben den bereits in Kapitel 4.3 genannten Technischen Architekturvarianten beschreibt (Langseth04) die folgenden Ansätze: o Near Real-Time ETL: Die einfachste und billigste Lösung durch Frequenzerhöhung der Updates. o Direct Trickle Feed: Das Data Warehouse wird mit aktuellen Daten der Quellsysteme gefüllt. Dies läßt sich im allgemeinen durch eine Integrationsplatform wie in 4.3.3 beschrieben, realisieren Allerdings müssen Probleme in den Bereichen Skalierbarkeit und Performanz adressiert werden. o Trickle & Flip: Die Echtzeit-Daten werden in Zwischentabellen geladen, anschließend werden diese Tabellen dupliziert und die Kopie mit der Zieltabelle ausgetauscht (= Flip). o Externer Real-Time Daten-Cache (RTDC): Speicherung der Echtzeit-Daten außerhalb des traditionellen Data Warehouse, zum Beispiel in einem zusätzlichen Datenbank-Server, der nur für das ETL der Echtzeitdaten zuständig ist. Die Abfrage von Kapitel 6 - Real Time Data Warehousing Projektmanagement 34 Echtzeit-Daten wird direkt an den RTDC geleitet (dies ist im Sinne des ODS in Kapitel 4.3.2). BI-Architect / BI-Application Developer / Portal Developer: Auch die BI-Anwendungen müssen an die neuen Analysemöglichkeiten angepasst werden. Diese Aufgabe umfasst die Analyse der fachlichen Anforderungen und deren Abbildung in die BI-Anwendungen. Typischerweise handelt es sich dabei um die Konfiguration von kommerziellen BI-Lösungen (und nur selten um eine selbst programmierte Software). Insbesondere die OLAP-Tools wurden ursprünglich für Operationen auf statischen, unveränderlichen Daten entwickelt. Daher können bei schnell veränderlichen Daten Inkonsistenzprobleme auftreten. Folgende Lösungsansätze sind denkbar (Langseth04): o Der Near Real-Time Ansatz: Verzicht auf wirkliche Echtzeit-Daten im OLAP Umfeld. o Risikominderung für „true“ Real-Time: Anwendern hochkomplexe Abfragen auf Echzeit-Daten verbieten o Nutzung eines externen RTDC: Strikte Trennung der Echtzeit-Daten von den historischen Daten. Technical Architect / Tech Support Specialist: Wie bereits in Kapitel 4.3 angedeutet und aus den vorhergehenden Punkten ersichtlich, spielt die Wahl einer zu den fachlichen Anforderungen passenden Technischen Architektur eine große Rolle. Sie bestimmt maßgeblich den zukünftigen Erfolg des RTDW und muss die bereits für das DW/BI-System existierende Technische Architektur sinnvoll ergänzen. Daher hat der technische Architekt in einem RTDW-Projekt eine besonders wichtige Aufgabe. Er muss eine passende Architektur entwerfen, darauf achten, dass alle Komponenten zusammenpassen und die richtigen Produkte auswählen. Der Technische Architekt kann kein Experte in Detailfragen zu allen Technologien sein. Daher wird er durch Technical Support Specialists unterstützt. Sollte die Architekturvariante einer Datenintegrationsplattform (siehe 4.3.3) gewählt werden, ist zu prüfen, inwieweit die EAI-Architekten des Unternehmens direkt in das RTDW-Projekt eingebunden werden. Schlussendlich muss der RTDW-Projektmanager aus diesen Einzelspezialisten ein funktionierendes Team formen. Diese Aufgabe sollte sich aber bei einem RTDW-Projekt nicht wesentlich von der auf anderen IT-Projekten unterscheiden. 6.2.2.3 Prepare Project Plan Auch ein RTDW-Projekt benötigt einen detaillierten und integrierten Projektplan. Die in Kimball (Kimball08) beschriebene Vorgehensweise für DW/BI-Projekte ist genauso für ein RTDW-Projekt anwendbar. Die vermutlich größte Unsicherheit in der Aufwandsschätzung liegt im ETL-Bereich. Trotzdem ist davon auszugehen, dass die Erfahrungen bei der Projektplanung für das bestehende Kapitel 6 - Real Time Data Warehousing Projektmanagement 35 DW/BI-System eine wertvolle Basis darstellen. Insbesondere wenn zu Projektabschluss der ursprüngliche Projektplan rückblickend noch einmal kritisch mit den Ist-Werten in Beziehung gesetzt wurde. 6.2.2.4 Project Communication Plan Die im Rahmen des Kommunikationsplans für ein RTDW-Projekt zu beachtenden Aspekte und zu erledigenden Aufgaben sind identisch mit denen für ein DW/BI-Projekt. Insofern ergeben sich keine Ergänzungen oder Erweiterungen zu den Ausführungen von Kimball. Damit sind die planerischen Aufgaben abgeschlossen. 6.2.3 Manage the Project Nachdem der Projektplan erstellt und das Projektteam zusammengestellt wurde, kann mit der eigentlichen Projektdurchführung begonnen werden. Dabei stehen auch für ein RTDW-Projekt die typischen Managementaufgaben einer Projektdurchführungsphase an, die im wesentlichen darauf abzielen, den Projektstatus zu erfassen und - falls notwendig - korrigierend einzugreifen, um die Projektziele (Termin, Kosten, Qualität) wie geplant zu erreichen. Zu den Aufgaben gehören insbesondere: Statusüberwachung Umfangsmanagement Erwartungsmanagement DW/BI-Projekte, und somit auch RTDW-Projekte, unterscheiden sich dabei in vielen Aspekten nicht von anderen IT-Projekten. Somit sind allgemeingültige Projektmanagementtechniken im allgemeinen gut anwendbar. Kimball führt aber vier Charakteristika von DW/BI-Projekten auf, die aus Projektmanagementsicht besonderer Beachtung bedürfen: Die Projektteams sind stärker interdisziplinär ausgerichtet als bei vielen anderen Projekten. Der iterative Entwicklungszyklus der mehrere DW/BI-Projekte umfasst und zu einer sehr langen Programmlaufzeit führt. Die häufigen und oft komplexen Probleme im Bereich der Daten, hier insbesondere im Rahmen des ETL-Prozesses. Die aufgrund der großen Bedeutung meist prominente Rolle von DW/BI-Projekten innerhalb des Unternehmens. Dies ist oft mit hohen Erwartungen an ihren Erfolg verknüpft. Kapitel 6 - Real Time Data Warehousing Projektmanagement 36 Auf RTDW-Projekte trifft wahrscheinlich der dritte Punkt besonders zu. Deshalb wurde ihm bereits in Kapitel 5.2.1 im Abschnitt Assess DW/BI-Readiness besondere Aufmerksamkeit geschenkt. Innerhalb von Manage the Project sind gemäß Kimball die folgenden Aufgaben zu: Conduct Project Team Kick-Off & Planning Develop Process to manage Scope. Control Changes Develop Process to measure Success User Acceptance / Project Review Ongoing Project Management Der korrespondierende Abschnitt in (Kimball08) weist eine leicht andere Struktur auf, die sich aber leicht auf die o.g. Aufgaben abbilden lässt: Conduct the Project Team Kick-Off Meeting Monitor Project Status Maintain the Project Plan Consolidate the Project Documentation Manage the Scope Manage Expectations Recognize Project Trouble Signs Während diese Projektmanagementaufgaben in einem RTDW-Projekt weit gehend ähnlich denen in anderen DW/BI-Projekten sind - und deshalb hier nicht weiter ausgeführt werden - gibt es unter den von Kimball aufgeführten Frühindikatoren für entstehende Probleme zwei, die für RTDW-Projekte besonders relevant sind: Start oder Fortführung des Projektes, obwohl deutlich wird, dass die Quelldaten in den operativen Systemen keine ausreichende Qualität aufweisen: Im Zusammenhang mit einem RTDW-Projekt könnte dies insbesondere der Fall sein, falls sich herausstellt, dass die Quellsysteme nicht in der Lage sind, die Daten mit den geforderten geringen Latenzzeiten und Frequenzen bereitzustellen. Deshalb wurde diesem Aspekt bereits in Kapitel 6.2.1 im Abschnitt Assess DW/BI-Readiness besondere Aufmerksamkeit geschenkt. Die Herausforderungen im ETL-Bereich führen dazu, dass die Anwenderschnittstelle in den BI-Anwendungen vernachlässigt wird: Diese Gefahr droht sicher auch in einem RTDWProjekt, da ein Großteil der Aufwände im ETL-Bereich angesiedelt sein werden. Gleichzeitig sind aber auch an der Anwenderschnittstelle umfangreiche Änderungen erforderlich, sollen die durch die Senkung der Latenzzeiten entstandenen neuen fachlichen Möglichkeiten auch realisiert werden. Kapitel 6 - Real Time Data Warehousing Projektmanagement 6.2.4 37 Manage the Program Die bisherigen Ausführungen bezogen sich auf ein einzelnes Projekt und somit einen Durchlauf des Kimball Lifecycle. Meist wird ein DW/BI-Projekt mit seinem Abschluss „nur“ eine Version 1.0 bereitstellen. Sehr schnell erkennen die Anwender den durch die DW/BI-Systeme generierten Mehrwert und fordern zusätzliche Funktionalitäten und Erweiterungen. Diese führen in aller Regel zu einem Folgeprojekt. Somit entsteht die Notwendigkeit, eine Organisationsstruktur über mehrere Projekte hinweg zu schaffen: Das Programmmanagement. Zu Hauptaufgabe des Programmmanagements zählt es, Erfahrungen und Ergebnisse über Projektgrenzen hinweg weiterzutragen und somit steilere Lernkurven der Folgeprojekte sicherzustellen. Davon kann auch ein RTDW-Projekt sehr stark profitieren. Typischerweise wird die Senkung der Latenzzeiten in einem ersten DW/BI-Projekt keine Priorität besitzen. Zusätzlich stehen andere Fragestellungen im Vordergrund, um überhaupt ein erstes DW/BI-System bereitzustellen. Erst in der Folge wird der Wunsch nach einem RTDW entstehen. Somit sollte ein RTDW-Projekt - sichergestellt durch ein Programmmanagement - auf den vorhergehenden DW/BI-Projekten aufbauen und von den dort gemachten Erfahrungen profitieren. Beispiele wurden in den vorhergehenden Kapiteln bereits genannt. Dies wird es dem RTDW-Projekt gerade in der Anfangsphase ermöglichen, besser zu planen und sich so auf seine eigentlichen Herausforderungen konzentrieren zu können. Nach Kimball fallen folgende Aufgaben in den Bereich Programmmanagement: Establish Governance Responsibility/Process Establish Program Communication Plan Establish Enterprise Data Stewardship Establish Program Best Practices Conduct Periodic Program Assessments Ongoing Program Management Von besonderer Bedeutung für ein RTDW-Projekt ist sicherlich, dass der Data Steward bereits möglichst frühzeitig eine Verfügbarkeit von Echtzeitdaten in seinem Aufgabenbereich berücksichtigt. Im allgemeinen stehen bei einem RTDW-Projekt allerdings eher die Projektaspekte im Vordergrund, so dass an dieser Stelle nicht weiter auf Details des Programmmanagements eingegangen werden muss. Es ist davon auszugehen, dass das RTDW-Projekt - je nach Anzahl der zu unterstützenden Geschäftsprozesse - in einem, oder maximal zwei Projekten, realisiert werden kann. Kapitel 6 - Real Time Data Warehousing Projektmanagement 6.2.5 38 Zusammenfassung Zusammenfassend lässt sich festhalten, das im Aufgabenpaket Launching und Managing the Project/Program bereits einige wichtige Ergänzungen für RTDW-Projekte zu beachten sind. Bei der Projektdefinition gilt es insbesondere im Rahmen von Assess DW/BI-Readiness auf die fachliche Begründung für ein RTDW zu achten und durch ein Data Profiling die Verfügbarkeit der erforderlichen (Echtzeit-) Daten abzuschätzen. Zudem sollte im Rahmen der Aufgabe Develop preliminary Project Scope / Charter darauf geachtet werden, sich zunächst auf die Real-Time Analysemöglichkeit eines einzigen (Kern-) Geschäftsprozess zu konzentrieren Eine fundierte Kosten-/Nutzenanalyse ist das Ergebnis der Aufgabe Build Business Justification. Im Rahmen der Projektplanung wird ein geeignetes Projektteam zusammengestellt. Für ein RTDWProjekt sind insbesondere die folgenden Rollen von besonderer Wichtigkeit, weshalb sie sorgsam besetzt werden müssen: Data Steward / QA-Analyst Data Architect / Data Modeler / DBA ETL-Architect / ETL-Developer BI-Architect / BI-Application Developer / Portal Developer Technical Architect / Tech Support Specialist Die Durchführung eines RTDW-Projektes (Manage the Project) unterscheidet sich im Kern nicht von anderen (DW/BI-) Projekten. Allerdings ist auch hierbei wieder ein besonderes Augenmerk auf die Bereiche Datenqualität und ETL-Prozess zu legen, da sie sich oft als besonders kritisch herausstellen. Ein RTDW-Projekt kann stark von einem guten Programmmanagement profitieren. Insbesondere die Rolle des Data Steward kann in Hinblick auf die Datenqualitätsthematik sehr hilfreich sein. Ansonsten sollte ein gutes Programmmanagement vor allem einen schnellen Start des RTDW-Projektes ermöglichen, da viele wichtige Informationen und Erfahrungen aus vorhergehenden Projekten wiederverwendet werden können. Eine Übersicht aller Aufgaben aus dem Bereich Launching und Managing the Project/Program sind in Anhang B in Tabellenform dargestellt. Zusätzlich sind dort den Aufgaben Rollen zugeordnet. Kapitel 6 - Real Time Data Warehousing Projektmanagement 6.3 39 Business Requirements Definition „Business requirements sit at the centre of the universe“. Damit beginnt Kimball in (Kimball08) seine Ausführung zum Arbeitspaket Business Requirements Definition. Es verdeutlicht den Stellenwert, den er diesem Thema zuordnet. Damit ist aber auch von vornherein deutlich, dass ein DW/BIProjekt, und gleiches muss für ein RTDW-Projekt gelten, kein technisches Spielzeug der ITAbteilung sein kann, sondern es ganz klar auf fachlichen Anforderungen beruhen muss. Deshalb kommt der detaillierten fachlichen Anforderungsanalyse ein überragender Stellenwert zu. Dies wird auch dadurch deutlich, dass die fachlichen Anforderungen direkte Auswirkungen auf nahezu jeden Aspekt des Projektes haben: Project / Program Planning / Management Technical Architecture Dimensional Modelling Physical Design ETL-Design / Development BI-Application Design / Development Deployment Maintenance & Growth Deshalb ist eine möglichst frühe detaillierte Erfassung der fachlichen Anforderungen sehr wichtig. Spätere Änderungen lassen sich oftmals nur schwer in einem laufenden Projekt berücksichtigen. Trotz ihrer Wichtigkeit sollte die Anforderungsanalyse jedoch zeitlich auch nicht zu sehr ausgedehnt werden und auf ein definiertes Enddatum geachtet werden. Je nach Projektumfang ist etwa eine Dauer von drei bis vier Wochen vorzusehen. Am Ende muss zwischen dem Projekt, der Fach- und der IT-Abteilung Einvernehmen darüber bestehen, welche Anforderungen wesentlich sind und welche lediglich mögliche Ergänzungen darstellen. Eine wichtige Rolle kommt in dieser Phase neben dem Projektmanager dem Business Analyst zu. Während im Arbeitspaket Project Definition mit der Business Justification bereits wesentliche Gründe für die fachliche Notwendigkeit des RTDW-Projektes identifiziert wurden, gilt es nun, diese weiter zu detaillieren und damit eine solide Ausgangsbasis für die in den drei Zweigen Technische Architektur, Daten und BI-Anwendungen folgenden Aufgaben zu haben (siehe Abbildung 6.4). Kapitel 6 - Real Time Data Warehousing Projektmanagement 40 Abbildung 6.4: Business Requirements Definition Fachliche Anforderungen können sowohl auf Programm- als auch auf Projektebene erhoben werden. Auch wenn es auf inhaltlicher Ebene Unterschiede im Detailgrad und in der Gesamtausrichtung gibt, ist der eigentliche Prozess der Anforderungsanalyse in beiden Fällen ähnlich. Folgende Prozessschritte sind zu durchlaufen: Preparation Participants Selection Business Questioning Data Audit Documentation Next Steps Im Rahmen eines RTDW-Projektes wird man sich auf der Projektebene bewegen. Ziel ist es, detaillierte fachliche Anforderungen für den in der Project Definition identifizierten Geschäftsprozess zu ermitteln. Ein Großteil der von Kimball in (Kimball08) beschriebenen Vorgehensweisen liefert sehr wertvolle praktische Hinweise und Interviewtechniken und ist unverändert auch für RTDW-Projekte gültig. Speziell sollte aber im Rahmen eines RTDW-Projektes in den einzelnen Arbeitsschritten auf die im folgenden beschriebenen Aspekte geachtet werden: Kapitel 6 - Real Time Data Warehousing Projektmanagement 6.3.1 41 Overall Approach to Requirements Definition Hier ergeben sich für ein RTDW keine spezifischen Aufgaben, die von denen für ein DW/BI-Projekt abweichen. 6.3.2 Prepare for the Interview Hier gilt es u.a. geeignete Interviewpartner zu identifizieren. Neben Vertretern der fachlichen Seite werden dies auch Mitglieder der IT-Abteilung sein. Im Rahmen eines RTDW-Projektes wird insbesondere auch letzteren eine wichtige Rolle bei den Interviews zukommen. Eine zentrale Fragestellung wird die Fähigkeit der operativen Quellsysteme sein, Echtzeitdaten in geeigneter Weise zur Verfügung stellen zu können. Darüber hinaus kann das IT-Management eventuell auch noch weitere mögliche Anwendungsszenarien für ein RTDW aufzeigen. Sollten sich durch das RTDW neue - über die bereits im Rahmen der DW/BI-Lösung diskutierten Fragen bezüglich Compliance und/oder Security ergeben, sind entsprechende Vertreter ebenfalls für Interviews einzuplanen. Bei der Erstellung der Interview-Leitfäden ist darauf zu achten, dass spezifische Fragen nach dem durch das RTDW angestrebten Mehrwert vorgesehen sind. Beispiele für ergänzende Fragen zum Leitfaden für fachliche Interviews in (Kimball08) könnten wie folgt aussehen: Welche bereits heute durchgeführten Reports und Datenanalysen sind besonders zeitkritisch? Wie häufig werden sie durchgeführt? Welche zusätzlichen Möglichkeiten würden sich eröffnen, falls Sie die Analysen häufiger durchführen könnten? Was sind die wichtigsten geschäftlichen Erfolgskriterien? Wie oft werden Informationen darüber benötigt? Wie lassen sie sich quantifizieren? Welche Ausgangsdaten werden für ihre Berechnung benötigt? Wie aktuell ist das in DW dazu vorhandene Zahlenmaterial? Wozu könnten Analysen aus dem RTDW eingesetzt werden? Wie zeitnah werden Marktentwicklungen heute erkannt? Welche Möglichkeiten eröffnen sich durch Echtzeitdaten? Welche finanziellen Vorteile (Umsatz, Gewinn, Kosten) ließen sich dadurch realisieren? Was sind zentrale Erfolgskriterien für das RTDW? Wie lassen sie sich quantifizieren? Gibt es strategische Geschäftsziele, die im Zusammenhang mit dem RTDW stehen? Hauptziel der Interviews mit der IT-Abteilung muss es sein, die durch die fachlichen Interviews aufgezeigten Möglichkeiten auf ihre grundsätzliche Machbarkeit hin zu überprüfen: Stehen die benötigten Daten rechtzeitig zur Verfügung oder wie könnte man sie bereitstellen? Welche Anwendungssysteme sind einzubeziehen? Stehen auch die Daten aus anderen Quellsystemen für eine Gesamtintegration der Daten zur Verfügung (Data Warehouse Datenbestände sind subjektorientiert)? Kapitel 6 - Real Time Data Warehousing Projektmanagement 6.3.3 42 Conduct the Interview Hier ergeben sich für ein RTDW keine spezifischen Aufgaben, die von denen für ein DW/BI-Projekt abweichen. 6.3.4 Wrap up the Interview Hier ergeben sich für ein RTDW keine spezifischen Aufgaben, die von denen für ein DW/BI-Projekt abweichen. 6.3.5 Review the Interview Results Hier ergeben sich für ein RTDW keine spezifischen Aufgaben, die von denen für ein DW/BI-Projekt abweichen. 6.3.6 Prepare and Publish Requirements Deliverables Die in diesem Schritt zu erstellenden Anforderungskataloge müssen die in den Interviews zutage getretenen fachlichen Anforderungen nach Geschäftsprozessen aufgegliedert zusammenfassen und in einer Data Warehouse Bus Matrix zusammenstellen. Die Data Warehouse Bus Matrix verknüpft die Geschäftsprozesse mit den sie beschreibenden Datendimensionen. Auf Basis der Interviews mit der IT-Abteilung lässt sich so abschätzen, wie realistisch die Abbildung dieser Geschäftsprozesse in einem RTDW ist. 6.3.7 Prioritize and Agree on Next Steps Sollte sich in dem oben beschriebenen Prozess herausstellen, dass die gesammelten Anforderungen einen sinnvollen RTDW-Projektumfang sprengen, ist ein Priorisierung erforderlich. Dazu schlägt Kimball vor, die Geschäftsprozesse auf Basis der Anforderungskataloge in einem Treffen mit den verantwortlichen Führungskräften nach fachlichem Nutzen und der Umsetzbarkeit hin zu priorisieren.6 6 Die Auswahl eines einzigen Geschäftsprozesses bedeutet natürlich nicht, dass damit auch nur eine einzige Abteilung in dem RTDW-Projekt eingebunden ist. Kapitel 6 - Real Time Data Warehousing Projektmanagement 43 Abschließend sollte nicht vergessen werden, den im vorherigen Schritt (Launching and Managing the Project / Program, siehe Kapitel 6.2) definierten Projektumfang ggfs. an diese Ergebnisse des Business Requirements Definition anzupassen. 6.3.8 Zusammenfassung Damit stehen die detaillierten fachlichen Anforderungen als Basis für folgenden Arbeitspakete im Kimball Lifecycle zur Verfügung. Abbildung 9.4 im Anhang C gibt einen Überblick über alle Aufgaben aus dem Bereich Business Requirements Definition und die daran beteiligten Rollen. Zusammenfassend lässt sich festhalten, dass die Vorgehensweise für ein RTDW-Projekt im Arbeitspaket Business Requirements Definition in den meisten Punkten mit der für ein DW/BI-Projekt identisch ist. Insbesondere die Interviewleitfäden müssen aber um die spezifischen Fragen nach den fachlichen Anforderungen für das RTDW erweitert werden. Kapitel 6 - Real Time Data Warehousing Projektmanagement 6.4 44 Technical Architecture Nachdem die fachlichen Anforderungen an das RTDW bekannt sind (Was soll das RTDW leisten?) (siehe Kapitel 6.3), folgen im Kimball Lifecycle darauf aufbauend drei parallel verlaufende Zeige (siehe Abbildung 6.5): Das Aufsetzen einer passenden Technische Architektur für die RTDW Anwendung (samt der dazu erforderlichen Infrastruktur). Die Modellierung der Daten mit den dazu erforderlichen ETL-Prozessen in der Datenarchitektur. Der Entwurf der BI-Anwendungen für den Anwender. Wie bereits in der Einleitung erläutert, liegt der Schwerpunkt dieser Arbeit im Bereich der Technischen Architektur. Hier steht die Frage, wie die fachlichen Anforderungen technisch umgesetzt werden können, im Vordergrund. Im folgenden wird zunächst beschrieben warum eine sorgfältige Definition der Technischen Architektur wichtig ist und welche Komponenten der Technischen Architektur eines DW/BI-Systems im Kontext eines RTDW genauer betrachtet werden müssen. In Kapitel 6.5 steht dann der Prozess, wie im Rahmen eines RTDW-Projektes eine passende Technische Architektur entworfen und umgesetzt werden kann, im Vordergrund. Abbildung 6.5: TA Design und Product Selection and Installation Kapitel 6 - Real Time Data Warehousing Projektmanagement 6.4.1 45 TA: Gesamtüberblick Die Hauptvorteile einer sauber definierten Technischen Architektur liegen in den folgenden Aspekten: Bessere Umsetzung der fachlichen Anforderungen Darstellung der technischen Anforderungen und ihrer Abhängigkeiten Kommunikationswerkzeug für alle Beteiligten Zentrale Basis für eine detaillierte Projektplanung Flexibilität, Wartbarkeit und Skalierbarkeit der Lösung Einfachere Einarbeitungsmöglichkeit (zum Beispiel für neue Projektmitglieder) Kernbereiche einer Technischen Architektur für eine DW/BI-Lösung - und damit i.w. auch für ein RTDW - sind: ETL-Prozesse Der Präsentationsserver mit den analytischen Daten BI-Anwendungen und Services Die Technische Infrastruktur Metadaten Sicherheitsaspekte Somit umfasst die Technische Architektur den gesamten Datenfluss von den Quellsystemen über die Transformationsprozesse und Datenspeicher bis zu den Anwendern. Auch wenn viele grundlegende Aspekte der Technischen Architektur für alle DW/BI-Anwendungen sehr ähnlich sind, ergeben sich doch auf Detailebene je nach den spezifischen fachlichen Anforderungen sehr unterschiedlichen Lösungen. Im folgenden stehen die spezifische Anforderungen eines RTDW im Vordergrund. In Abbildung 6.6 ist das (logisches) Gesamtmodell einer Systemarchitektur für ein DW/BI-System dargestellt. Ausgehend von den Quellsystemen auf der linke Seite laufen die Daten durch die ETLProzesse in die Präsentationsserver. Dort werden die Daten für den Endanwenderzugriff durch die verschiedenen BI-Werkzeuge und Anwendungen in mehrdimensionalen Datenmodellen gespeichert. Eine wesentliche Rolle bei der Steuerung des Gesamtprozesses spielen die Metadaten.7 Kimball geht so weit, die Architektur für ein DW/BI-System als Metadata Driven zu bezeichnen. 7 Unter Metadaten versteht man die Informationen, die die Strukturen, Operationen und Inhalte des DW/BI-Systems beschrieben. Kimball unterscheidet dabei zwischen technischen, fachlichen und Kapitel 6 - Real Time Data Warehousing Projektmanagement 46 Im folgenden werden die einzelnen Bereiche der DW/BI-Architektur auf Erweiterungen bzw. Anpassungen für ein RTDW untersucht. Abbildung 6.6: (Logisches) Gesamtmodell Systemarchitektur DW/BI-System (Kimball08) 6.4.2 TA: Back Room Im Back Room der Technischen Architektur finden die ETL-Prozesse statt. Diese extrahieren die erforderlichen Daten zum richtigen Zeitpunkt aus den Quellsystemen, transformieren sie und schreiben sie anschließend in den Presentation Server. ETL-Tools können bei der Automatisierung wesentlich unterstützen. Trotzdem ist dies aufgrund der Vielzahl, Heterogenität, Komplexität und Dynamik der Quellsysteme ein Bereich, der sich nicht nur beim Aufbau, sondern auch im späteren Betrieb in aller Regel als sehr aufwendig erweist. Kimball (Kimball08) schätzt, dass durchschnittlich ca. 70% der Entwicklungszeit für ein DW/BIProjekt dem ETL-Prozess zuzuordnen sind. Der Aufbau eines komplett neuen ETL-Prozesses für einen Geschäftsprozess sollte demnach mit etwa 6 Monaten veranschlagt werden. Wesentliche Aufwandstreiber sind dabei: Prozess-orientierten Metadaten. Idealerweise sind diese alle in einem zentralen Metadata Repository gespeichert. Kapitel 6 - Real Time Data Warehousing Projektmanagement 47 Identifizierung und Dokumentation der Quellsysteme (Data Profiling) Datenextraktion Data Cleansing und Conforming Laden der Daten in den Presentation Server Aufsetzen eines Management Prozesses für den ETL-Prozess Eine Detaillierung der Back Room Architecture ist in Abbildung 6.7 dargestellt. Abbildung 6.7: Back Room Architecture DW/BI-System (Kimball08) Der Entwurf einer Technischen Architektur mit einem ETL-Prozess, der nicht nur mit deutlich höherer Frequenz stattfindet, sondern auch wesentlich schneller durchlaufen wird, ist eine der Hauptaufgaben im Bereich der Technischen Architektur für ein RTDW-Projekt. Im Rahmen dieser Untersuchung, soll der ETL-Process nur aus Architektursicht beleuchtet werden. Tiefer gehende Designfragen stehen hier nicht im Fokus.8 8 Details hierzu finden sich zum Beispiel in (Kimball08). Kapitel 6 - Real Time Data Warehousing Projektmanagement 48 Im Rahmen einer RTDW-Architektur müssen insbesondere folgende Aspekte im Back Room besonders berücksichtigt werden:9 Inwieweit erfüllt das bereits für das DW/BI-System verwendete ETL-Tool die neuen Anforderungen nach Frequenzerhöhung und Beschleunigung? Gibt es alternative Tools? Welche internen und externen Quellsysteme werden für das RTDW (zusätzlich) benötigt? Stellen sie die Daten in der erforderlichen Aktualität zur Verfügung? Können die Daten parallel zum Onlinebetrieb extrahiert werden? Gibt es bereits einen Operational Data Stores (ODS), in den detaillierte operative Transaktionsdaten, zum Beispiel für ein operatives Reporting, (nahezu) in Echtzeit geladen werden? Stellt dieser ein mögliches Quellsystem für ein RTDW dar (oder sollte er im Rahmen des RTDW-Projektes in das RTDW integriert werden, da die technische Notwendigkeit einer Trennung aufgrund verbesserter HW inzwischen weitgehend entfallen ist)? Ist im Unternehmen bereits eine Service-orientierte Architektur (SOA) oder eine Enterpise Application Integration (EAI) Architektur realisiert? Können diese in das RTDW-Projektes einbezogen werden? Kann das RTDW an einen Message Bus oder Enterprise Service Bus, über den operative Transaktionsdaten in Echtzeit laufen (siehe auch 4.3.3), angeschlossen werden? Dies sind mögliche (revolutionäre) Alternativen zu dem Versuch, existierende ETL-Batchläufe (evolutionär) zu beschleunigen. Wie lassen sich veränderte Daten im Rahmen des Extract identifizieren? Diese Frage wurde vermutlich bereits für das existierende DW/BI-System beantwortet. Sie muss aber für ein RTDW präziser beantwortet werden, da es im RTDW aus Performancegründen nicht mehr möglich ist, alle Daten, die bereits einmal den ETL-Prozess durchlaufen haben, beim nächsten ETL-Lauf in identischer Form erneut zu verarbeiten. Wird über die Einbeziehung einer SOA oder EAI nachgedacht (s.o.), müssen eventuell ganz neue Change Data Capture Ansätze gesucht werden. Beim Clean and Conform müssen die verwendeten Regeln auf ihre Effizienz hin überprüft werden. Zudem ist vorzusehen, dass die Fehlerbehandlung beschleunigt werden muss, um keinen zu großen Rückstau entstehen zu lassen. Im Arbeitsschritt Deliver werden die Daten in den Presentation Server geschrieben. Die dazugehörigen Funktionen sind ebenfalls auf ihre Echtzeitfähigkeit hin zu überprüfen (zum Beispiel Late arriving Data Handler, Aggregate Builder. Details siehe (Kimball08)). Schlussendlich sind die ETL Management Prozesse an die gesenkten Latenzzeiten anzupassen. Dazu gehören insbesondere die folgenden Funktionen: Job Scheduler, Backup System, Workflow Monitor, Problem Escalating, Paralleling and Pipelining. 9 Für eine vollständige Diskussion aller für ein DW/BI-System relevanten Back Room Aspekte siehe (Kimball08). Kapitel 6 - Real Time Data Warehousing Projektmanagement 49 Weisen die ETL System Data Stores und die Data Quality Data Stores auch für ein RTDW ausreichende Kapazitäten und Performanz auf? Sind die ETL Process Metadata (zum Beispiel ETL Operational Statistics, Quality Screen Results) auch für die Anforderungen des RTDW ausreichend? Wurden die ETL Technical Metadata (zum Beispiel Processing Schedules) und ETL Buisness Metadata (zum Beispiel Data Quality Screen Specifications) angepasst? Die Beantwortung dieser Fragen sollte die wesentlichen Änderungsbedarfe für die Back Room Technical Architecture aufzeigen. Diese werden einen großen Teil der Aufwände für das gesamte RTDW ausmachen. 6.4.3 TA: Presentation Server Architecture Am Ende des ETL-Prozesses werden die Daten in den Presentation Server geschrieben. Hier stehen sie dann für Abfragen der Endanwender, für Reports und andere BI-Anwendungen zur Verfügung. Aus fachlicher Sicht ist der Zugriff auf alle Daten für alle Anwender (eventuell aus verschiedenen Blickwinkeln) erforderlich. Darüber hinaus sollen nicht nur aggregierte sondern auch atomare Daten für Detailanalysen bereitstehen. Zudem sollte es nach Kimball nur einen einzigen Single Point of Truth geben (und daher zum Beispiel keine abteilungsspezifischen Data Marts). Um diesen Anforderungen zu genügen, muss die Presentation Server Architecture auf Atomic Level Business Process Dimensional Models in einer relationalen Datenbank beruhen (siehe auch Abbildung 6.8). Lassen sich Aggregate für Anwenderanalysen aufgrund des Datenvolumens nicht mehr mit realistischen Antwortzeiten zur Laufzeit zusammenstellen, müssen sie im Rahmen des Ladeprozesses vorberechnet werden. Dies stellt eine zusätzliche logische Schicht dar. Die Implementierung kann zum Beispiel in relationalen Datenbanken oder OLAP Servern erfolgen. Aus Sicht eines RTDW-Projektes sind im Bereich Presentation Server Architecture folgende Aspekte zu berücksichtigen: Während die atomaren Daten aus RTDW-Sicht eher unproblematisch sind, stellt sich bei den Aggregaten die (aus Performanceüberlegungen entscheidende) Frage, in welchen Zeitabständen welche Aggregate auf Basis welcher fachlichen Anforderungen neu generiert werden sollen. Letztendlich muss eine RTDW-Architektur hierfür eine (automatische) Optimierung auf Basis des tatsächlichen Analyseverhaltens der Anwender vorsehen. Bei der Verwendung eines OLAP-Servers ist auch zu überlegen, ob aus Performancegründen nicht auch die atomaren Daten in die OLAP Datenbank übernommen werden sollten. Der Presentation Server ist kein normaler Datenbankserver. Er ist im Rahmen des DW/BISystems bereits auf die Belange mehrdimensionaler Datenmodelle ausgerichtet worden. Aus Kapitel 6 - Real Time Data Warehousing Projektmanagement 50 RTDW-Sicht sind insbesondere Performanceaspekte zu hinterfragen: Zum Beispiel die Einrichtung zusätzlicher spezieller Hot Partitions (siehe Kimball08). Die Presentation Server Metadata müssen auf ihre Eignung für ein RTDW hin untersucht werden. Zum Beispiel wird es erforderlich sein, aus dem Bereich der Process Metadata die Database Monitoring System Tables und bei den Technical Metadata die Aggregate Definitions (Wie oft sollen die Aggregates erzeugt werden?) anzupassen. Die wesentlichen Aufwände im Bereich der Presentation Server Architecture für ein RTDW sind in der Bereitstellung geeigneter Aggregate zu erwarten. Abbildung 6.8: Presentation Server System Architektur DW/BI-System (Kimball08) 6.4.4 TA: Front Room Architecture Der Front Room ist die Schnittstelle des DW/BI-Systems zum Anwender und stellt somit eine Zwischenschicht für BI-Anwendungen zwischen den Daten im Presentation Server und dem Anwender dar. Abbildung 6.9 zeigt die dazugehörigen Services und Datenspeicher. Der Front Room muss auf die fachlichen Anforderungen ausgerichtet sein und eine intuitive Benutzerführung vorsehen, so dass die Anwender schnell finden, was sie suchen. Im Zusammenhang mit einem RTDW ist zu untersuchen, inwieweit bereits existierende Tools und Reports in diesem Zusammenhang erweitert bzw. angepasst werden müssen. Kapitel 6 - Real Time Data Warehousing Projektmanagement 51 Abbildung 6.9 listet die wichtigsten BI-Anwendungen auf. Für ein RTDW ist insbesondere das Operational BI relevant. Dabei handelt es sich um Echtzeitabfragen und -analysen über den aktuellen Status des operativen Geschäfts. Instantaneous BI (oder Enterprise Information Integration, EII) sieht einen direkten Kanal von den operativen Quellsystemen zum Analystenbildschirm vor und zielt damit in eine ähnliche Richtung. Abbildung 6.9: Front Room Architecture DW/BI-System System (Kimball08) Weiter finden sich in Abbildung 6.9 die BI-Management Services. Aus RTDW Sicht sind dabei insbesondere folgende Services zu betrachten: Usage Monitor: Hier werden Nutzungsstatistiken über das RTDW erstellt. Dies ist ein wichtiger Ausgangspunkt für die Analyse von Performanceengpässen: Woraus setzt sich die Antwortzeit der RTDW Anwendungen zusammen? Wo gibt es Beschleunigungspotenzial? Kapitel 6 - Real Time Data Warehousing Projektmanagement 52 Welche Real Time Aggregate werden häufig abgefragt? Welche Akzeptanz hat das RTDW bei seinen Anwendern gefunden (Marketing)? Zeichnen sich zukünftige Performanceengpässe ab? Wie entwickelt sich das ETL-Volumen? Query Management: Das Query Management übersetzt die Benutzerabfrage in die für den Presentation Server passende Syntax. Hier sind im Zusammenhang mit dem RTDW Anpassungen zu erwarten. Es kommen neue Abfragen hinzu und existierende Abfragen müssen umpriorisiert werden. Eventuell müssen spezielle User Accounts für Echtzeitabfragen mit höherer Priorisierung eingerichtet werden. Durch das RTDW kommen neue Datenbanken hinzu. Somit müssen die Metadaten erweitert werden, damit die für die Beantwortung einer Abfrage benötigten Tabellen auch gefunden werden. Schlussendlich muss bekannt sein, welche (Echtzeit-) Aggregate mit welchen Eigenschaften neu hinzugekommen sind, so dass diese auch für die Beantwortung der Abfragen verwendet werden. Enterprise Reporting: Hier müssen auf Basis der fachlichen Anforderungen ggf. neue Echtzeit-Reports definiert und in die regelmäßige, automatisierte Generierung eingebaut werden. Auch hierbei ergeben sich möglicherweise neue Herausforderungen: Die Zeitfenster für die Erstellung eines zeitkritischen Reports werden möglicherweise recht kurz sein. Zudem muss der Report vielleicht zu einem Zeitpunkt am Tage erstellt werden, zu die dem Auslastung der Systeme schon hoch ist. Web & Portal Services: Im Zusammenhang mit einem RTDW werden Anforderungen entstehen, die die Zugriffsmöglichkeit auf das RTDW von mobilen Endgeräten vorsehen. Dies stellt neue Herausforderungen an die Darstellung der Ergebnisse, die Navigationsmöglichkeiten und auch die Sicherheitsmechanismen. Operational BI Write Back: Mit dem RTDW wird auch der Wunsch aufkommen, dass Entscheider nach der Analyse der Echtzeitdaten im RTDW ihre Entscheidungen direkt in Transaktionen in den operativen Systemen münden lassen können. Dieser - auch als Closed-Loop bezeichnete - Ansatz bedeutet einen Paradigmenwechsel. Historisch war der Datenfluss aus den operativen Systemen über den ETL-Prozess in das Data Warehouse eine Einbahnstraße. Mit der Senkung der Latenzzeiten und der damit einhergehenden Operationalisierung der Entscheidungen in einem RTDW erscheint eine Rückkopplungsmöglichkeit zurück in die operativen Systeme aber sinnvoll. Dies stellt aber eine nicht zu unterschätzende neue Herausforderung an die Technische Architektur dar. Theoretisch sollte es im Front Room keine größeren Datenspeicher geben. Der für die Datenspeicherung vorgesehene Ort ist der Presentation Server. Trotzdem tauchen in Abbildung 6.9 BI Data Stores auf. Diese werden typischerweise für eine (kurzfristige) lokale Speicherung und Weiterverarbeitung der Daten beim Anwender benötigt. Im Zusammenhang mit dem RTDW ist zu prüfen, inwiefern Replikationsmechanismen, die die Aktualität der Daten in den BI Data Stores gewährleisten sollen, angepasst werden müssen und können. Es sollte aber auch darüber nachgedacht werden, diese BI Data Stores auf ein Minimum zu reduzieren, da sie aus vielen Aspekten der Idee eines zentralen Single Point of Truth zuwiederlau- Kapitel 6 - Real Time Data Warehousing Projektmanagement 53 fen. Meistens lässt sich die fachliche Anforderung, die ursprünglich zu ihrem Entstehen geführt hat, auch mit einem Enterprise Data Warehouse lösen. Sind Downstream Systems (zum Beispiel ERP-Systeme) an das RTDW angekoppelt sind auch hier die geänderten Anforderungen durch die Senkung der Latenzzeiten zu prüfen und ggf. umzusetzen. Auch im Front Room spielen Metadaten eine wichtige Rolle. Dazu gehören statistische Nutzungsdaten im Bereich der Prozess Metadaten, technische Metadaten und fachliche Metadaten. Diese sollten auch sorgfältig auf ihren Änderungsbedarf in Hinblick auf ein RTDW überprüft werden. Es wird deutlich, dass es auch im Bereich der Front Room Architecture zu wichtigen Erweiterungen im Zusammenhang mit dem RTDW-Projekt kommen wird. 6.4.5 TA: Infrastruktur In diesem Abschnitt werden die für ein RTDW benötigten Infrastrukturkomponenten betrachtet. Dazu gehören insbesondere Hardware, Netzwerke und grundlegende Sicherheitsdienste. Im Bereich Hardware und Netzwerke ergeben sich bei sorgfältiger Analyse Beschleunigungspotenziale für ein RTDW. Grundsätzlich sollten DW/BI-Anwendungen aber lediglich als ein Abnehmer von Infrastruktur Services im Unternehmen angesehen werden. Insofern gilt es, die im folgenden beschriebenen Aspekte mit dem Infrastruktur Provider zu besprechen. Auch für ein RTDW ist es nur in wenigen Ausnahmefällen sinnvoll, eine komplett eigene Infrastrukturplattform aufzubauen. Die damit verbundenen Aufwände für Hardware, Software, Betrieb und Schulungen sind im Normalfall unvertretbar hoch. Auch bei Infrastrukturfragen sollten weiterhin die fachlichen Anforderungen Grundlage für alle Entscheidungen sein. Für ein RTDW ist dies in jedem Falle die Frage nach der aus den fachlichen Überlegungen abgeleiteten Latenzzeit. Aus dieser müssen sich die Infrastrukturanforderungen ergeben. Weiterhin sollten Skalierungsüberlegungen (zum Beispiel: Wachstum der Benutzerzahlen) mit berücksichtigt werden. Zu beachten sind allerdings im Infrastrukturbereich auch Standardisierungsbemühungen, IT-Policies und Plattform- und Vendor-Strategien des Unternehmens. Folgende Aspekte sollten im Zusammenhang mit einem RTDW-Projekt untersucht werden: Data Size: Wie verändern sich die Datenvolumina durch die beabsichtigte Senkung der Latenzzeiten? Volatility: Wie verändern sich die dynamischen Aspekte der Datenbank? Wie oft soll die Datenbank (oder Teile derselben) aktualisiert werden? Welches Datenvolumen wird dabei verändert? Wie lange darf der Ladeprozess dauern? Wann muss der Ladeprozess durchgeführt werden? Kapitel 6 - Real Time Data Warehousing Projektmanagement 54 Number of Users: Kommen durch das RTDW neue Anwendergruppen hinzu? Wie wird sich das Anwenderverhalten ändern? Wie viele Anwender werden parallel auf das RTDW zugreifen? Welche Lastspitzen sind zu erwarten? Service Level Agreements: Für das RTDW sind gestiegene Verfügbarkeits- und Performanceanforderungen zu erwarten. Diese sollten in SLAs gefasst werden. Dazu gehören auch die höheren Anforderungen an die verkürzten Reaktionszeiten von Service Desk und Incident Management bei möglichen Störungen. Die Umsetzung dieser Anforderungen für ein RTDW ist oft nur durch eine Hardwarearchitektur mit paralleler Verarbeitung realisierbar. Dazu stehen verschiedene Varianten zur Verfügung (und wurden vielleicht schon im Rahmen des DW/BI-Systems realisiert): Zum Beispiel Symmetric Multiprocessing (SMP) oder Massively Parallel Processing (MPP). Auf Basis der zu erwartenden Lastcharakteristika gilt es eine geeignete Variante auszuwählen. Dazu muss geklärt werden, ob eher Ad-hoc Abfragen oder mehr Standard Reports zu erwarten sind. Schlussendlich muss das DBMS die HWArchitektur nutzen können. Eine grundsätzliche Architekturentscheidung wird die über einen separaten Datenspeicher für das RTDW sein (siehe ODS in Kapitel 4.3.2). Es ist zu klären, wie mit Abfragen, die neben den aktuellen Daten aus dem ODS gleichzeitig (zum Beispiel historische) Daten aus dem Enterprise Data Warehouse benötigen, zu verfahren ist. Welche Replikations- und Lock-Mechanismen sollen dafür vorgesehen werden? Entscheidende Beschleunigungspotenziale lassen sich typischerweise auch im Bereich der Platten (I/O Bandbreiten), des Hauptspeichers und der CPUs realisieren. Dort haben sich Storage Area Networks (SAN) und RAID-Systeme bewährt. Vermutlich wurden diese schon für das bestehende DW/BI-System angeschafft, so dass sich hier für das RTDW keine grundsätzlich neuen Überlegungen ergeben. Auch die Frage nach der (physikalischen) Datenbankplattform (Relational oder Multidimensional/OLAP) wurde schon beim Aufbau des bestehenden DW/BI-Systems getroffen und wird im Rahmen des RTDW vermutlich nicht erneut in Frage gestellt werden. Es wird deutlich, dass die für das DW/BI-System aufgebaute Infrastruktur sorgsam an die Anforderungen eines RTDW angepasst werden muss, um mögliche Beschleunigungspotenziale zu realisieren. 6.4.6 TA: Security Im Bereich der Security ergeben sich durch das RTDW keine grundsätzlich neuen Anforderungen gegenüber einem bestehenden DW/BI-System. Es wird neue Anwender(gruppen) geben. Diese lassen sich aber meist leicht in die bestehenden Strukturen abbilden. Eng damit verknüpft ist auch die Frage der Zugriffsrechte auf die Echtzeitdaten. Aber auch diese Frage sollte sich mit den bereits zur Kapitel 6 - Real Time Data Warehousing Projektmanagement 55 Verfügung stehenden Konzepten lösen lassen. Schließlich handelt es sich ja beim RTDW primär um eine Senkung der Latenzzeiten und nicht um die Bereitstellung völlig andersartiger Daten. Es muss aber zeitig eingeplant werden, wie zukünftig Backups für das RTDW organisiert werden sollen. Insbesondere muss die Frage geklärt werden, welche Zeitfenster dafür zur Verfügung stehen und zu welchem Zeitpunkt ein Backup (Snapshot) in einem sich ständig aktualisierenden RTDW konsistent durchführbar ist. 6.4.7 Zusammenfassung In diesem Kapitel wurden wesentliche Fragen der Technischen Architektur im Zusammenhang mit einem RTDW diskutiert. Der Schwerpunkt lag dabei nicht auf einer kompletten Beschreibung aller bereits im Zusammenhang mit der DW/BI-Lösung geklärten Fragen, sondern auf den Spezifika eines RTDW-Projektes. Als wesentliche haben sich dabei die Bereiche Back Room Architecture Presentation Server Front Room Architecture Infrastructure herausgestellt. Für diese wurden wichtige Fragestellungen, die es im Rahmen eines RTDW-Projektes zu untersuchen gilt, erläutert und Lösungsansätze aufgezeigt. Im folgenden Kapitel steht nach diesen eher Technischen Überlegungen wieder die Prozesssicht im Vordergrund. Es wird beschrieben, auf welchem Wege man in einem RTDW-Projekt zu einem passenden Architekturplan kommt. Kapitel 6 - Real Time Data Warehousing Projektmanagement 6.5 56 Creating the Technical Architecture Plan Nachdem im vorhergehenden Kapitel Komponenten und Services eine DW/BI-Architektur auf ihren Anpassungsbedarf für ein RTDW hin untersucht wurden, steht nun darauf aufbauend der Entwurf eines Architekturplans für ein RTDW im Vordergrund. Dabei wird wieder davon ausgegangen, das ein DW/BI-System bereits existiert und dies zu einem RTDW erweitert werden soll. Im Vordergrund steht also nun eine prozessorientierte Projektvorgehensweise, insbesondere beim Architekturdesign. Dabei stellt der Architekturplan (das Hauptergebnis) die technische Übersetzung der fachlichen Anforderungen dar. Er beantwortet die Frage: Welche Funktionalitäten müssen bereitgestellt werden, damit die Anforderungen der Anwender erfüllt werden? Dazu müssen ausgehend von den wichtigsten fachlichen Anforderungen, diejenigen Funktionalitäten einer Technischen Architektur identifiziert werden, die für Umsetzung dieser Anforderungen erforderlich sind. Der Application Architecture Plan beschreibt die Vision für die zukünftige Struktur der RTDWArchitektur. Dabei ist davon auszugehen, dass der zu erstellende Application Architecture Plan auf dem für das bestehende DW/BI-System aufbaut und ihn an den für das RTDW relevanten Stellen erweitert. Für die Erstellung des Application Architecture Plan sollte ein Zeitraum von etwa 4 bis 6 Wochen eingeplant werden. Typischerweise wird man für die Definition einer DW/BI-Architektur nur in Ansätzen auf eines der großen Architektur-Frameworks (zum Beispiel Zachman Framework oder The Open Group Architecture Framework) zurückgreifen. Dies trifft erst recht auch für ein RTDW-Projekt zu. Wir orientieren uns daher am Architecture Development Process, wie er von Kimball in (Kimball08) vorgeschlagen wird. Zu beachten ist, dass es sich dabei prinzipiell um einen iterativen Prozess handelt, das RTDW-Projekt aber wahrscheinlich nur eine (maximal zwei) Iteration darstellt. Die Anwendungsarchitektur stellt nur einen Teil der Gesamtarchitektur dar. Dazu gehören auch noch die Datenarchitektur und die Infrastruktur, die aber im Rahmen dieser Arbeit nicht weiter untersucht werden. 6.5.1 Prozessschritte Folgende Prozessschritte sind im Rahmen des DW/BI Application Architecture Top-Down Approaches zu durchlaufen: 1. Business Requirements and Data Audit 2. Architecture Implications and Models 3. Detailed Models and Specifications 4. Product Selection and Implementation Kapitel 6 - Real Time Data Warehousing Projektmanagement 57 Diese Schritte werden getrennt für den Back Room und den Front Room betrachtet, da diese beiden Bereiche sehr unterschiedliche Anforderungen an die Architektur stellen. In Abbildung 6.10 sind die für die beiden Bereiche wichtigsten Fragen im Zusammenhang mit einem RTDW-Projekt aufgeführt. Business Requirements and Data Audit Architecture Implications and Models Detailed Models and Specifications Product Selection and Implementation Back Room Front Room Welche Daten sind aus fachlicher Sicht in Echtzeit erforderlich? Woher kommen die für das RTDW erforderlichen Echtzeitdaten? Was sind die wichtigsten Geschäftsziele, die in Echtzeit überwacht werden sollen? Wie lassen diese sich messen und analysieren? Welche Funktionen und Komponenten sind erforderlich, um die Daten zum richtigen Zeitpunkt in der richtigen Form am richtigen Ort zu haben? Welche Datenspeicher und Services werden dazu benötigt? Welche Metadaten sind erforderlich? Was im Detail steht in den Datenspeichern? Welche Funktionalitäten müssen die einzelnen Services genau bereitstellen? Welche kommerziellen Produkte stellen welche der benötigten Funktionalitäten bereit? Wie lassen sich die Produkte integrieren? Wie lässt sich der ETL-Prozess implementieren und betreiben? Welche Entscheider werden mit dem RTDW arbeiten? Welche Informationen müssen ihnen in Echtzeit zur Verfügung gestellt werden? Welche BI-Anwendungen brauchen sie zur Datenanalyse in Echtzeit? Wie sehen die in Echtzeit zu erstellenden Reports und Templates im Detail aus? Wie und wann werden sie dem Anwender zur Verfügung gestellt? Welche Produkte stellen die benötigten Funktionalitäten bereit? Wie lassen sich die Produkte integrieren? Wie lassen sich die vorhandenen BIAnwendungen für die Anforderungen des RTDW modifizieren oder erweitern? Wie sieht der spätere Betrieb aus? Abbildung 6.10: DW/BI Application Architecture Top-Down Approach Kimball schlägt im Detail folgende Vorgehensweise bei der Entwicklung des Application Architecture Plans vor (Kimball08). Wo erforderlich, wird er um die für ein RTDW spezifischen Fragestellungen ergänzt. Kapitel 6 - Real Time Data Warehousing Projektmanagement 58 6.5.1.1 Form an Architecture Task Force Idealerweise sollte zumindest ein Teil der Mitglieder bereits Mitglied der Architecture Task Force für das DW/BI-System gewesen sein. Nur so können die damals gefällten Entscheidungen und Überlegungen in die Erweiterungen für das RTDW einfließen. 6.5.1.2 Gather Architecture Related Requirements Die spezifischen Anforderungen an die Architektur des RTDW sollten sich aus den fachlichen Anforderungen ableiten lassen. Wichtig sind insbesondere die fachlichen Erwartungen an die Aktualität der Daten und die Granularität der geplanten Auswertungen. Darüber hinaus sollte ermittelt werden, welche IT-Strategie das Unternehmen verfolgt (zum Beispiel in Hinblick auf SOA und/oder EAI). Welche Infrastrukturprojekte, die Auswirkungen auf das RTDW haben könnten, sind geplant? Welche Produkt- und Plattform-Standards sind einzuhalten? Wo könnte es in der Infrastruktur im Zusammenhang mit dem RTDW zu Engpässen kommen? Welche Alternativen sind denkbar? Gibt es Vorgaben durch eine zentrale Architekturgruppe? 6.5.1.3 Create a Draft Architectural Implications Document Welche fachlichen Anforderungen gibt es an die Architektur und was sind konkrete Auswirkungen auf die Anwendungsarchitektur? Welche SLAs ergeben sich aus erhöhten Anforderungen an Performance, Verfügbarkeit und Latency? 6.5.1.4 Create the Architecture Model Ziel dieses Schrittes ist es, in Anlehnung an die generische Abbildung 6.6 ein konkretes Modell für die RTDW-Architektur zu entwickeln, dass die spezifischen Anforderungen des Unternehmens berücksichtigt. Dies geschieht auf Basis einer geeigneten Gruppierung der Architecture Implications aus dem vorhergehenden Schritt 3. 6.5.1.5 Determine the Architecture Implementation Phases Wie lassen sich die fachlichen Anforderungen phasenweise in den Lebenszyklus der Architektur einordnen? Es ist zu erwarten, dass sich die RTDW-Architektur in einer, maximal zwei Phasen/Iterationen umsetzen lässt, da sie lediglich eine Erweiterung der bestehenden DW/BI-Architektur bedeutet. Kapitel 6 - Real Time Data Warehousing Projektmanagement 59 6.5.1.6 Design and Specify the Subsystems Hier ergeben sich für ein RTDW keine spezifischen Aufgaben, die von denen für ein DW/BI-Projekt abweichen. 6.5.1.7 Create the Application Architecture Plan Document Hier erfolgt eine detaillierte Beschreibung der für ein RTDW benötigten Architekturkomponenten und Services und deren Ableitung aus den fachlichen Anforderungen. 6.5.1.8 Review the Draft Hier ergeben sich für ein RTDW keine spezifischen Aufgaben, die von denen für ein DW/BI-Projekt abweichen. 6.5.2 Select Products Nachdem die RTDW-Architektur definiert wurde, müssen dazu geeignete Produkte ausgewählt werden.10 Auch der Produktauswahlprozess ist stark an den fachlichen Anforderungen auszurichten. Es muss insbesondere ein geeigneter Zeitpunkt gefunden werden, zu dem die Anforderungen ausreichend stabil sind. Für ein RTDW-Projekt sind Produkte aus den Bereichen HW und DBMS Plattformen sowie ETLund BI-Tools zu untersuchen. In vielen Fällen werden existierende Komponenten aus dem DW/BISystem weiterverwendet werden können. Der Evaluationsprozess ist im wesentlichen unabhängig von den zu evaluierenden Produkten. Daher kann im RTDW-Projekt hier auf Erfahrungen aus dem DW/BI-Projekt zurückgegriffen werden. Typischerweise werden die folgenden Schritte durchlaufen (Kimball08): 1. Understand the Purchasing Process 2. Develop the Product Evaluation Matrix 3. Conduct Market Research 4. Narrow your Options to a short List 10 Grundsätzlich ist dabei davon auszugehen, dass es effizienter ist, verfügbare kommerzielle Produkte zu kaufen und diese für die spezifischen Anforderungen zu konfigurieren, als von Grund auf eigene Anwendungen zu bauen. Kapitel 6 - Real Time Data Warehousing Projektmanagement 60 5. Evaluate the Candidates 6. Recommend a Product 7. Trial 8. Contract Negotiations Dabei werden die Performanceaspekte der untersuchten Produkte eine deutlich stärkere Rolle spielen, als dies für das DW/BI-Projekt der Fall war. Ansonsten haben die sehr hilfreichen Hinweise in (Kimball08) weiterhin Gültigkeit. Folgende inhaltliche Aspekte sollten bei dem Evaluationsprozess aus RTDW-Sicht speziell berücksichtigt werden (Details wurden bereits in Kapitel 6.4 vorgestellt): Hardware Plattform: Welche Anforderungen an Skalierbarkeit, Performance und Kapazität ergeben sich für Speicher, CPUs, Platten und Netzwerk? Können diese durch die existierende Plattform erfüllt werden? Sind Design- und Konfigurationsänderungen erforderlich? Ist ein Testsystem erforderlich um das Lastverhalten zu simulieren? DBMS Plattform: Sind die für das DW/BI-System gefällten Entscheidungen hinsichtlich relationalen- und mehrdimensionalen/OLAP Datenbanken weiterhin gültig? Gerade bei OLAP-Datenbanken gibt es große Unterschiede was Skalierbarkeit und Performance angeht. Gibt es Anpassungsbedarf im Bereich Datenmodelle, Indizes, Partitionen und Views? Welche Performanceverbesserungen bietet das RDBMS (zum Beispiel Star Join Optimization, Bit-mapped Indizes). ETL-Tool: Kann das vorhandene ETL-System die neuen Anforderungen an UpdateFrequenzen und Laufzeiten erfüllen? Front Room: Können die vorhandenen BI-Tools auch für ein RTDW weiterverwendet werden? Sowohl aus funktionaler Sicht als auch aus Architektursicht? Wo sind Anpassungen für das Standardreporting und die Ad-hoc Analysen erforderlich? Gibt es Spezialanbieter, die bessere Lösungen anbieten? Hier sollten die zukünftigen Anwender eng einbezogen und ein prototypisches Testsystem aufgebaut werden. Darüber hinaus müssen die durch das RTDW erweiterten Anforderungen an das Metadaten Management untersucht werden. Auch hier geht es primär darum, Erweiterungsbedarf zum DW/BISystem zu erkennen. Die grundsätzlichen Vorteile eines Metadatenmanagements sollten zu diesem Zeitpunkt im Unternehmen bereits akzeptiert sein und somit gibt es einen Metadatenmanager, der sich dieser Ergänzungen am Metadatenkatalog annehmen kann. Werden im Zuge des RTDWProjektes neue Tools angeschafft, müssen diese in das Metadatenmanagement integriert werden. Ein weiterer wichtiger Aspekt, der im Rahmen des RTDW-Projektes zu überprüfen ist, stellt das Sicherheitskonzept für das RTDW dar. Hier sind allerdings keine wesentlichen Änderungen gegenüber dem DW/BI-System zu erwarten. Am kritischsten sind vermutlich die komplexeren Anforderungen an die regelmäßig zu erstellenden Backups. Kapitel 6 - Real Time Data Warehousing Projektmanagement 61 Am Ende des gesamten Architekturprozesses steht die Infrastructure Map. In dieser werden alle Server-, Platten-, Netzwerk- und Desktopkomponenten mit ihren wesentlichen Softwarekomponenten dargestellt. Sie ist ein wichtiges Kommunikationsvehikel, um alle auf Architektur und Infrastruktur aufbauenden weiteren Prozesse - insbesondere auch den Betrieb - in geeigneter Weise zu informieren. Ein Beispiel findet sich in (Kimball08). Die Infrastructure Map stellt eine wichtige Basis für die spätere Installation aller Komponenten dar. 6.5.3 Zusammenfassung Ein RTDW-Projekt sollte nicht ohne einen Architecture Plan durchgeführt werden. Dazu muss der bereits für das DW/BI-System erstellte Architecture Plan in einem mehrstufigen Prozess um die Spezifika des RTDW erweitert werden. Dabei sollte darauf geachtet werden, dass die fachlichen Anforderungen die Basis für alle Entscheidungen darstellen, der Aufwand zur Erstellung des Architecture Plans und der sich anschließenden Produktauswahl sinnvoll gewählt wird und neue Produkte einem Praxistest unterzogen werden. Die Hauptverantwortung kommt dabei der Rolle des Technischen Architekten für das RTDW zu. Die in diesem Zusammenhang anfallenden Aufgaben sind in Anhang C aufgeführt. Dabei ist jeweils für das konkrete RTDW-Projekt zu überprüfen, inwieweit die Aufgabe erforderlich ist. Kapitel 7 - Zusammenfassung und Ausblick 7 62 Zusammenfassung und Ausblick Im Rahmen dieser Arbeit wurden auf Basis der vorhandenen Literatur Erfolgsfaktoren im Projektmanagement von Real Time Data Warehouse Projekten erarbeitet. Der Hauptfokus lag dabei auf den frühen Projektphasen Projektplanung und -management, Anforderungsanalyse und technische Architektur. Verwendet wurde dabei ein Szenario, bei dem ein Unternehmen sein bestehendes DW/BI-System in ein Real Time Data Warehouse erweitern möchte. Zunächst wurden fachlichen Gründe für eine Senkung der Latenzzeiten aufgezeigt und mögliche Architekturvarianten für ein Real Time Data Warehouse skizziert. Aufbauend auf dem Kimball Lifecycle (Kimball08) - einer bewährten Vorgehensweise für BI- Projekte - wurden dann Bereiche identifiziert, die im Rahmen eines Real Time Data Warehouse Projektes besondere Beachtung erfordern: Im Bereich Launching und Managing the Project/Program gilt es bei der Projektdefinition insbesondere im Rahmen von Assess DW/BI-Readiness auf die fachliche Begründung für ein RTDW zu achten und durch ein Data Profiling die Verfügbarkeit der erforderlichen (Echtzeit-) Daten abzuschätzen. Zudem sollte im Rahmen der Aufgabe Develop preliminary Project Scope/Charter darauf geachtet werden, sich zunächst auf die Real-Time Analysemöglichkeit eines einzigen (Kern-) Geschäftsprozess zu konzentrieren Eine fundierte Kosten-/Nutzenanalyse sollte Ergebnis der Aufgabe Build Business Justification sein. Die Business Requirements Definition ist in den meisten Punkten mit der für ein DW/BIProjekt identisch. Insbesondere die Interviewleitfäden sind aber um die spezifischen Fragen nach den fachlichen Anforderungen für das Real Time Data Warehouse zu erweitern. Im Bereich der technischen Architektur müssen insbesondere die Bereiche Back Room Architecture, Presentation Server und Front Room Architecture auf spezielle Anforderungen eines RTDW-Projektes hin untersucht werden. o Im Back Room sind die ETL-Prozesse und Tools an die geforderte Senkung der Latenzzeiten anzupassen. Dies erfordert eine genaue Analyse der operativen Quellsysteme und bei einem möglichen Wechsel zu einer Datenintegrationsplattform (EAI) die Verwendung grundsätzlich neuer Technologien im DW/BI-Zusammenhang. o Für den Presentation Server steht die Frage im Vordergrund, wie häufig Aggregate aus fachlicher Sicht neu generiert werden müssen. o Die BI-Anwendungen im Front Room müssen für Echtzeitanalysen der Anwender angepasst werden. Zudem ist zu untersuchen, wie sich Closed Loop Ansätze realisieren lassen (soweit sie aus fachlicher Sicht gewünscht sind). Kapitel 7 - Zusammenfassung und Ausblick 63 Aus Prozesssicht ist zu beachten, dass ein RTDW-Projekt nicht ohne einen Architecture Plan durchgeführt werden sollte. Dazu muss der bereits für das DW/BI-System erstellte Architecture Plan in einem mehrstufigen Prozess um die Spezifika des RTDW erweitert werden. Dabei sollte darauf geachtet werden, dass die fachlichen Anforderungen die Basis für alle Entscheidungen darstellen, der Aufwand zur Erstellung des Architecture Plans und der sich anschließenden Produktauswahl sinnvoll gewählt wird und neue Produkte einem Praxistest unterzogen werden. Insgesamt wird deutlich, das Real Time Data Warehouse Projekte zwar in vielen Bereichen große Ähnlichkeiten mit DW/BI-Projekten aufweisen und somit auf diesen aufbauen können. Im Detail gibt es aber wichtige Erweiterungen und Ergänzungen, die sorgsam analysiert und geplant werden müssen. Eine sinnvolle Fortführung dieser Arbeit wäre die Erweiterung insbesondere auf die Zweige Daten und BI-Anwendungen im Kimball Lifecycle (siehe Abbildung 5.1). Darüber hinaus ist eine detaillierte Untersuchung von Real Time Data Warehouse Projekten in der Praxis wünschenswert. Dies würde es erlauben, die theoretischen Überlegungen mit Erfahrungen aus der Praxis abzugleichen. Kapitel 8 - Literaturverzeichnis 8 64 Literaturverzeichnis (Anderson04) Anderson-Lehman, R., Watson, H. J., Wixom, B. H., Hoffer, J. A., Continental Airline flies high with Real-Time Business Intelligence, MIS Quarterly Executive 3 (4), 2004. (Atre07) Atre, S., Moss, L. T., Business Intelligence Roadmap: The Complete Project Lifecycle for Decision-Support-Applications, Addison-Wesley, 2007. (Bauer09) Bauer, A., Günzel, H., Data Warehouse Systeme: Architektur, Entwicklung, Anwendung, dpunkt.verlag, 2009. (Brobst05) Brobst, S., Twelve Mistakes to Avoid When Constructing a Real-Time Data Warehouse. In: Schelp, J., Winter, R., Auf dem Weg zur Integration Factory. Proceedings der DW2004, Physica Verlag, 2005. (Bucher08) Bucher, T., Dinter, B., Anwendungsfälle der Nutzung analytischer Informationen im operativen Kontext. In: Bichler, M. et al., Multikonferenz Wirtschaftsinformatik 2008, GITO-Verlag, 2008. (Chamoni06) Chamoni, P., Gluchowski, P., Analytische Informationssysteme: BusinessIntelligence-Technologien und -Anwendungen, Springer, 2006. (Forrester08) Forrester, Really Urgent Analytics. The Sweet Spot For Real-Time Data Warehousing, Forrester Teleconference, 2008. (Gluchowski08) Gluchowski, P., Gabriel, R., Dittmar, C., Management Support Systeme und Business Intelligence: Computergestützte Informationssysteme für Fach- und Führungskräfte, Springer, 2008. (Goeken04) Goeken, M., Referenzmodellbasierte Einführung von Führungsinformationssystemen - Grundlagen, Anforderungen, Methode, Wirtschaftsinformatik 2004 (05), 2004. (Hackathorn03) Hackathorn, R., Minimizing Action Distance, The Data Administrator Newsletter, 2003. (Hedegard07) Hedegard, L., Teradata’s Real-Time Enterprise. Reference Architecture., Teradata, 2007. (Hugos04) Hugos, M., Building the Real-Time Enterprise. An Executive Briefing, Wiley & Sons, 2004. (Inmon96) Inmon, W.H., Building the data warehouse, Wiley, 1996. (Kemper06) Kemper, H.-G., Mehanna, W., Unger, C., Business Intelligence - Grundlagen und praktische Anwendungen : eine Einführung in die IT-basierte Managementunterstützung, Vieweg, 2006. (Kimball08) Kimball, R., The data warehouse lifecycle toolkit : Practical techniques for building data warehouse and business intelligence systems, Wiley, 2008. (Langseth04) Langseth, J., Real-Time Data Warehousing: Challenges and Solutions, DSSResources.com, 2004. (Lehmann97) Lehmann, P., Ellerau, P., Implementierung eines Data Warehouse für die Verpackungsindustrie, HMD, Heft 195, 1997. Kapitel 8 - Literaturverzeichnis 65 (Lusti02) Lusti, M., Data Warehousing und Data Mining : Eine Einführung in entscheidungsunterstützende Systeme, Springer, 2002. (Mucksch00) Mucksch, H.,Das Data Warehouse-Konzept: Architektur, Datenmodelle, Anwendungen, Gabler, 2000. (Oehler06) Oehler, K., Corporate Performance Management mit Business-IntelligenceWerkzeugen, Hanser, 2006. (Saitz02) Saitz, B., Wolbert, J., Value Reporting – Einstieg in eine neue Dimension der kapitalmarktorientierten Unternehmensberichterstattung, Controlling 2002 (6), 2002. (Schirp01) Schirp, G., Anforderungsanalyse im Data-Warehouse-Projekt: Ein Erfahrungsbericht aus der Praxis, HMD, Heft 222, 2001. (Schütte01) Schütte, R., Data Warehouse Managementhandbuch : Konzepte, Software, Erfahrungen, Springer, 2001. (Sen05) Sen, A., Sinha, A. P., A comparison of data warehousing methodologies, Communications of the ACM 48 (3), 2005. (Töpfer08) Töpfer, J., Winter, R., Active Enterprise Intelligence, Springer, 2008. (Turban07) Turban, E., Aronson, J., Liang, T., Sharda, R., Decision Support Systems and Business Intelligence Systems, Prentice Hall, 2007. (Ventana07) Ventana Research, Operational Business Intelligence - Assessing Market Trends and the use of BI in Operations, 2007. (Westermann01) Westermann, P., Data Warehousing, Morgan Kaufmann, 2001. Kapitel 9 - Anhang 9 Anhang 9.1 Anhang A 66 Abbildung 9.1: Teradata’s Real-Time Enterprise Reference Architecture (Hedegard07) Kapitel 9 - Anhang 9.2 67 Anhang B Abbildung 9.2: Übersicht aller Aufgaben und die ihnen zugeordneten Rollen aus dem Bereich Launching und Managing the Project/Program (Kimball08) Kapitel 9 - Anhang 9.3 68 Anhang C Abbildung 9.3: Übersicht aller Aufgaben und die ihnen zugeordneten Rollen aus dem Bereich Business Requirements Definition (Kimball08) Kapitel 9 - Anhang 9.4 Anhang D 69 Kapitel 9 - Anhang 70 Abbildung 9.4: Übersicht aller Aufgaben und die ihnen zugeordneten Rollen aus dem Bereich Technical Architecture (Kimball08)