SAP Monitoring
Transcrição
SAP Monitoring
www.itnovum.de Ein Unternehmen der MEHLER AG SAP Monitoring Exemplarische Projekterfahrungen www.itnovum.de Business Track Nagios Konferenz, 22.September 2006 Michael Kienle, Geschäftsführer it-novum GmbH Ein Unternehmen der MEHLER AG Agenda • Bedeutung & Notwendigkeit der SAP Überwachung • Kurze Einführung in das SAP-Monitoring-Tool: CCMS • www.itnovum.de – Möglichkeiten CCMS – Warum Nagios benutzen wenn es CCMS gibt? – Wie werden die Daten vom CCMS ins Nagios übernommen? Auswahl und Eingrenzung: Welche Werte sollten überwacht werden? – Welche Werte im CCMS sind sinnvoll? – Verschiedene Reaktionszeiten – Schwellwerte • CCMS vs. SAP Solution Manager • Fazit: Genügt eine OpenSource Plattform den Anforderungen eines ERP-Monitorings? Ein Unternehmen der MEHLER AG IT-Kompetenz-Zentrum eines Konzerns • IT-Lösungen für den Mittelstand – • Komplette Wertschöpfungskette – • • www.itnovum.de Sichere, zuverlässige und wirtschaftliche IT Beratung, Planung, Umsetzung, Betrieb Am externen Markt seit 1999 – Überwiegend Regional (FD + 150 km, ~ von KS bis F) – Ca. 50% externer Umsatz, Trend: steigend – Synergieeffekte & Innovationen durch Konzernzugehörigkeit (>2 Mrd €) – Partnerschaften und Zertifizierungen Schwerpunkte & Kompetenzen: – Systemmanagement – ServerBasedComputing – Outsourcing/Datacenter/SAP – Konzepte, Analysen und Betrieb – Storage- und Servervirtualisierung, Konsolidierung – IT-Sicherheit, Datenschutz, Datensicherheit Ein Unternehmen der MEHLER AG Notwendigkeit des SAP Monitorings • Unternehmenskritische ERP-Anwendungen: Stabilität: – Störung der Betriebsabläufe; bis zum kompletten Stillstand – Vereinbarung SLA (Service Level Agreements) – Daher: Kosten sind eher zu vernachlässigen • Das Systemmanagement sollte dementsprechend: – die Wahrscheinlichkeit eines Ausfalles deutlich verringen – im Fehlerfall schnellere Fehlerlokalisierung ermöglichen – übergreifend eine “angemessene” Nutzung sicherzustellen • In der Praxis bedeutet dieses an Einsatzgebieten: – Incident Management – Performance Management: Sizing aber auch proaktive Erweiterung www.itnovum.de – SLA-Reporting: Verfügbarkeiten, Antwortzeiten Ein Unternehmen der MEHLER AG Der Monitor Ansatz von SAP „Die Verwaltung verteilter Client-Server-Systeme stellt hohe Anforderungen an Systemadministratoren. Bei verteilten Systemen, die über die Mindestkonfiguration hinausgehen, sind Werkzeuge zur Unterstützung von Systemadministratoren bei dieser Aufgabe unentbehrlich.“ SAP AG, Dokumentation CCMS www.itnovum.de Ein Unternehmen der MEHLER AG CCMS I • CCMS = Computing Center Management System • SAP Tool Überwachung und Verwaltung: – SAP-Transaktion „rz20“ – Baumstruktur, Komplexität: >n-1.000 • If you can not control it you can not manage it • BUT do not measure what you will not change • Praxis (Zitate): – “leicht den Durchblick verlieren…” – “Schwierigkeiten zu unterscheiden ob der angezeigte Fehler wirklich ein Problem darstellt oder nur zur Information, temporär…” www.itnovum.de Ein Unternehmen der MEHLER AG CCMS II – Dialog Overview www.itnovum.de • Durchschnitt Dialogschritt • Durchschnitt NetzwerkAntwortzeit FrontendApplikationserver • Durchschnitt 1 festgelegten Transaktion • Anzahl eingeloggte User Ein Unternehmen der MEHLER AG CCMS III – Dialog Application Service www.itnovum.de • Mittlere Zeit DispatcherWarteschlange • Mittlere Lade- und Generierungszeit von CUA-Objekte • Durchschnitt Datenbankanforderung Ein Unternehmen der MEHLER AG CCMS IV – Operating System www.itnovum.de Ein Unternehmen der MEHLER AG CCMS V - Database • www.itnovum.de TableSpaces Ein Unternehmen der MEHLER AG Warum Nagios benutzen wenn es CCMS gibt? I • Ziel: Umfassende Übersicht – – – Nicht: Überwachung einer Summe von Einzelkomponenten Sondern: vom Enduser “gefühltes” Systemverhalten Sinnvoll: Übernahme der wichtigsten CCMS-Daten SAP / CCMS Umweltbedingungen www.itnovum.de Netzwerkkomponenten Betriebssystem Ein Unternehmen der MEHLER AG Warum Nagios benutzen wenn es CCMS gibt? II • CCMS konzentriert sich ausschließlich auf SAP – www.itnovum.de z.B. Umweltbedingungen /RZ oder Basissystem/Hardware nicht berücksichtigt. Ein Unternehmen der MEHLER AG Warum Nagios benutzen wenn es CCMS gibt? III • Performance aus Anwendersicht: – Datenbank, Applikationsserver, Netzwerkanbindung, Workstation • Übergreifende Überwachung notwendig Applikations-Server Workstation Switch S ta tu s hp procurve switch 5372xl J4848A R e se t 1 C le ar 2 A B C D E F G H A ct S e lf Te st C o ns o le Fa n Fa u l t Po we r Mo d u le s F Dx Max u se x l mo du le s on ly L E D M od e S e le ct J4 820A P o wer 1 Faul t S ta tu s hp procurve switch 5372xl J4848A R e se t 1 C le ar 2 A B C D E F G Fa n Fa u l t Po we r 1 Mo d u le s F Dx J4 820A 1 2 3 4 5 6 7 8 9 10 11 12 24 p ort 6 13 hp procurve 10/10 0TX xl Module J4 820A 10/100TX 13 14 15 16 17 18 19 20 21 22 23 24 J4 820A hp procurve 10/10 0TX xl Module J4 820A 1 7 1 2 3 4 5 6 7 8 9 10 11 12 6 12 13 19 7 12 10/100TX J4 820A 13 14 15 16 17 18 19 20 21 22 23 24 1 18 24 hp procurve 10/10 0TX xl Module J4 820A 7 1 2 3 4 5 6 7 8 9 10 11 12 6 12 13 1 2 3 4 5 6 7 8 9 10 11 12 24 p ort 6 13 3 4 9 10 5 11 24 p ort 6 12 6 12 10/100TX J4 820A 13 14 15 16 17 18 19 20 21 22 23 24 1 18 1 2 3 4 5 6 7 8 9 10 11 12 13 10/100TX 13 14 15 19 16 17 18 22 23 24 13 14 15 16 17 18 19 20 20 21 21 22 23 24 18 24 19 24 p ort 6 13 10/100TX 18 24 19 24 p ort 7 18 1 hp procurve 10/10 0TX xl Module J4 820A 2 u se x l m o du le s on ly 1 24 p ort 8 Max L E D M od e S e le ct Faul t J4 820A 7 H A ct S e lf Te st C o ns o le P o wer hp procurve 10/10 0TX xl Module J4 820A 10/100TX 13 14 15 16 17 18 19 20 21 22 23 24 19 7 12 19 24 hp procurve 10/10 0TX xl Module J4 820A 7 12 19 24 18 24 Switch Pr ocurv e Routing S witch 9308M HP J 4138A Pr ocurv e Routing S witch 9308M HP J 4138A Router Router z.B. MPLS www.itnovum.de Oracle Datenbank Ein Unternehmen der MEHLER AG Warum Nagios benutzen wenn es CCMS gibt? IV • Überwachung sämtlicher Komponenten der IT – • “Tactical Overview” – www.itnovum.de Business-Prozess-orientierte Sicht vs. eher Infrastruktur-Perspektive systemweiter Überblick, aufkommende Probleme können effizient erkannt und gezielt beseitigt werden Ein Unternehmen der MEHLER AG Wie werden Daten vom CCMS ins Nagios übernommen? I Perfomance-Problem bei CCMS-Plugin, abhängig vom Volumen der zu überwachenden Services Die einzelnen benötigten Werte finden sich an verschiedenen Stellen der Baumstrucktur. Das Plugin meldet sich für jeden abzuholenden Wert einzeln im SAP-System an: Nagios belastet ständig das SAP-System mit mehreren Benutzern. Lösung: Neuer Monitor. Hier werden dann alle gewünschten Werte eingefügt. Dieser Knoten wird dann komplett vom Nagios-CCMS-Plugin abgeholt. Alternativ: SNMP-Traps möglich www.itnovum.de Ein Unternehmen der MEHLER AG Wie werden Daten vom CCMS ins Nagios übernommen? II Ablauf bei der Datenabholung Nagios ruft ein (selbstentwickeltes) Skript auf, dieses ruft das CCMSPlugin auf, welches den gesamten Monitor „Nagios/Allgemein“ aus dem SAP ausliest. Diese Daten werden von dem CCMS-Plugin zurückgegeben, welches in eine Datendatei schreibt. Je nach Erfolg dieser Transaktion, meldet das selbstgeschriebene Skript den Status „OK“ oder „CRITICAL“ an Nagios zurück. Skript CCMS-Plugin Datendatei www.itnovum.de Ein Unternehmen der MEHLER AG Wie werden Daten vom CCMS ins Nagios übernommen? III Um die Daten möglichst übersichtlich von der Datendatei ins Nagios zu integrieren, wurde ein eigenes Skript entwickelt, welches die gewünschten Information aus der Datendatei holt, den Wert in einen Graph einträgt und den Status und den Wert ans Nagios zurückmeldet. RRD-File ApanSQL Skript Datendatei MySQL www.itnovum.de Ein Unternehmen der MEHLER AG Welche Werte im CCMS sind sinnvoll? II Überwachen verschiedener SAPPuffer auf: Kriterien Space Used Hit Ratio Swap Auslagerungen Pufferspeichers in Prozent Datenbankanfragen/Cache Swaps pro Minute Felder GenericKey Program www.itnovum.de ganz/teilweise gepufferte DB-Tabellen kompilierte SAP-Programme Ein Unternehmen der MEHLER AG Welche Werte im CCMS sind sinnvoll? III Diverse wichtige SAP interne Speicher: R3RollUsed Belegung des Rollbereichs Rollbereich: Speicherbereich fester, konfigurierbaren Größe, der zu einem Workprozess gehört; enthält benutzerspezifische Daten und ist der erste Speicher, den ein Workprozess erhält. EsAct Belegung des Erweiterungsspeichers Der Erweiterungsspeicher enthält den größten Teil des Benutzerkontexts. Die Seitenverwaltung dieses Speichers erfolgt nicht durch das Betriebssystem, sondern direkt durch das SAP-System. HeapAct Belegung des privaten Speichers Einem Workprozess wird erst dann privater Speicher zugewiesen,wenn Rollbereich und Erweiterungsspeicher belegt sind; der Workprozess ist dann bis zum Ende der Transaktion für den aktuellen Benutzerkontext reserviert (PRIV-Modus). Laufen zu viele Dialog-Workprozesse im PRIV-Modus, entstehen Performance-Probleme. www.itnovum.de Ein Unternehmen der MEHLER AG Welche Werte im CCMS sind sinnvoll? IV Spool-System: Used Numbers Belegung der Spool-Nummern in Prozent. (Sie müssen alte Ausgabeaufträge löschen, damit diese Zahl nie 100 Prozent erreicht.) www.itnovum.de WaitTime Wartezeit im Spool-Service in Sekunden Utilisation Auslastung der Spool-Workprozesse in Prozent Ein Unternehmen der MEHLER AG Welche Werte im CCMS sind sinnvoll? V Allgemeine Performance-Werte: DialogSteps mittlere Anzahl von Dialogschritten pro Minute. Ein hoher Wert in Verbindung mit einer hohen ResponseTime weist auf generelle Überlastung hin, ein sehr niedriger Wert auf eine Fehlfunktion Eine der verschiedenen Antwortzeiten www.itnovum.de Ein Unternehmen der MEHLER AG Welche Werte im CCMS sind sinnvoll? VI Die Option „AbortedJobs“ meldet alle abgebrochenen (Background-) Jobs im SAP. Im produktiven Einsatz kommt es immer wieder zu Jobabbrüchen, die jedoch nicht immer systemkritische Bedeutung haben. z.B. Fehleranalyse: Transaktion “sm37” (Dumpanalyse Background) www.itnovum.de Ein Unternehmen der MEHLER AG Verschiedene Reaktionszeiten I Dialogantwortzeit = durchschnittliche Antwortzeit zur Verarbeitung eines Dialogschritts Bei diesem Wert kann es zu Ausreißern kommen, die meist nur durch einen einzigen großen Prozess hervorgerufen werden. Diese hohen Werte haben aber leider keine wirkliche Aussagekraft, da die SAP-Clients der Anwender trotz hoher Werte an dieser Stelle, keine Performanceeinbusen erleiden. www.itnovum.de Ein Unternehmen der MEHLER AG Verschiedene Reaktionszeiten II Netzlaufzeit = Zeit für Datentransfer zwischen Frontend und Anwendungsserver Durchschnittswert aller Netzlaufzeiten. Es lässt erkennen das irgendwelche SAP-Clients durch das Netzwerk verzögert ihre Daten erhalten, aber leider nicht welche Clients genau betroffen sind oder durch welchen Teil des Netzwerks diese Verzögerung ausgelöst wird. Hier sind mit weiteren Tools genauere Analyse zu erstellen. www.itnovum.de Ein Unternehmen der MEHLER AG Verschiedene Reaktionszeiten III normierte Antwortzeit = Wie Dialogantwortzeit, nur für eine voreingestellte Standardtransaktion. Durch das Messen der Zeit die eine immer gleiche Standardtransaktion zur Bearbeitung im SAP benötigt, erhählt man einen realistischen Wert, der die Performance des SAP-Systems gut wiederspiegelt. Das Auftreten von Spitzen deutet auf eine momentane Überlastung des SAP-Systems hin; alle angeschlossenen SAP-Anwender werden Performanceeinbußen erleben. www.itnovum.de Ein Unternehmen der MEHLER AG Verschiedene Reaktionszeiten IV • Überwachung SAP-Server mit einem direkten benachbarten Nagios nicht besonders aussagekräftig • Einbezug Standorte/RemoteUser („gefühlte Performance“) • „Simulieren“ eines Benutzers; Zeitmessung: – Einloggen, bestimmte Ein-/Ausgaben & Transaktionen, Ausloggen – End-2-End Performance (generisch verwendbar) www.itnovum.de Ein Unternehmen der MEHLER AG Schwellwerte I Zur effizienten Alarmierung sind im Nagios Schwellwerte zu definieren. Falls für abgefragte Werte noch keine Erfahrungen bestehen, ist es immer empfehlenswert, die im CCMS durch SAP vordefinierten Standardschwellwerte erst einmal zu übernehmen und dann sukzessive anzupassen. Schwellwerte des Monitorattributes auf seiner Eigenschaftsseite www.itnovum.de Ein Unternehmen der MEHLER AG Schwellwerte II Individuelle Schwellwerte lassen sich gut über die aufgezeichneten Graphen bestimmen. Sinnvoll aber zeitaufwändig (lange Erfahrungen/Messungen notwendig) Als erster Schritt wurden die Schwellwerte vom CCMS übernommen. Danach erfolgt eine längere Messung der “IST-Situation” mit abschließender Analyse der Ergebnisse und der Neueinstellung der Schwellwerte. CRITICAL www.itnovum.de WARNING Ein Unternehmen der MEHLER AG Screenshot www.itnovum.de Ein Unternehmen der MEHLER AG CCMS vs. Solution Manager • • www.itnovum.de CCMS: – Stärken eher in der Infrastruktur – „Tunnelblick“ auf Anwendungen Solution Manager: – „Bietet Kunden ein Standard Management Konzept um die BusinessProzesse in der zugrunde gelegten Systemlandschaft mit der optimalen Verfügbarkeit, optimalen Performance und niedrigen Kosten zu betreiben.“ (SAP Solution Manager Dokumentation) – Zukünftige Anforderungen: Einheitliche und umfassende Überwachung in einem Umfeld das geprägt ist durch: • Global • Heterogene Lösungen / Systeme • Business Prozesse • Neue Technologien Ein Unternehmen der MEHLER AG SAP Solution Manager www.itnovum.de Ein Unternehmen der MEHLER AG Business Process Management www.itnovum.de Ein Unternehmen der MEHLER AG Statements aus der Praxis “Nagios entlastet mich von einem erheblichen Teil meiner turnusmäßigen Kontrollen. Einige der per Nagios gemeldeten Alerts sind nicht sogleich systemkritisch, zeigen aber einen evtl. vorhandenen Trend an, auf den man dann gezielt reagieren kann. Eine komplette Ablösung von CCMS halte ich – auch gerade da detaillierte Fehler im CCMS analysiert werden – für verfrüht. Ich sehe den Mehrwert von Nagios eher im Bereich der umfassenden Überwachung SAP/Infrastruktur bzw. der guten und schnellen Benachrichtigung außerhalb des Büros und der üblichen Dienstzeiten. Viel Know-How ist erforderlich, sowohl auf Seiten CCMS als auch auf Seiten Nagios.” K.K., Leiter SAP Basisysteme der Firma xxx GmbH www.itnovum.de Ein Unternehmen der MEHLER AG Fazit “Genügt eine OpenSource Plattform den Anforderungen für ein SAP-Monitoring?”” www.itnovum.de • Nagios kann direkt auf das SAP eigene, integrierte Monitoring-Tool CCMS zugreifen, dadurch ergeben sich viele Möglichkeiten. • Nagios kann (mit Unterstützung) kostengünstig und schnell implementiert werden; darüber hinaus wird nicht nur den Bereich SAP abgedeckt sondern auch andere IT-Komponenten überwacht. • Viel Know-How notwendig; sowohl Nagios als CCMS / SAP • Wir sehen das Einsatzgebiet mit dem Schwerpunkt einer breiteren und umfassenderen Überwachung, welche “weniger in die Tiefe” geht. • Die Zukunft liegt klar im “Business Process Monitoring” (mySAP ERP Solution Manager). In wie weit diese tiefgehende Integration anderweitig sinnvoll zu realisieren ist, bleibt den zukünftigen Projekten überlassen. Ein Unternehmen der MEHLER AG Danke für Ihre Aufmerksamkeit! Michael Kienle Geschäftsführer [email protected] www.itnovum.de Ein Unternehmen der MEHLER AG