Overclocking x86
Transcrição
Overclocking x86
RST-L WS06/07 Overclocking x86 Version 1.2 20.02.2007 Thomas Winkler 100765 <[email protected]> Matthias Lübben 96342 <[email protected]> Abstrakt Dieser Bericht, der im Rahmen der Veranstaltung Rechnerstrukturen-Labor erstellt wurde, soll die Auswirkungen bezüglich Leistungszuwachs, Lebenserwartung und Temperaturentwicklung aufgrund einer Übertaktung eines Athlon XP Prozessors und einer Asus V8420 Deluxe Grakkarte untersuchen. Um aussagekräftigere Messergebnisse zu erzielen wurde eine spezielle Benchmark Software entwickelt, die CPU-Zeiten eines Prozesses ermitteln kann. RST-L WS06/07 Overclocking x86 Inhaltsverzeichnis 1 Einführung 4 1.1 Systemumgebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2 Gründe für das Übertakten 4 1.3 Zu berücksichtigende Kriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Hardware Komponenten 2.1 Prozessor 4 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.1.1 Ordering Part Number . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.1.2 Angestrebter Übertaktungswert . . . . . . . . . . . . . . . . . . . . 10 2.2 Hauptplatine 2.3 Grakkarte 2.2.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Besondere Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.3.1 Abweichungen vom Referenzdesign . . . . . . . . . . . . . . . . . . 13 2.3.2 Angestrebter Übertaktungswert . . . . . . . . . . . . . . . . . . . . 14 2.4 Speicher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.5 Wasserkühlung 16 2.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Ziel einer Wasserkühlung . . . . . . . . . . . . . . . . . . . . . . . 16 2.5.2 Aufbau der Wasserkühlung im Testrechner . . . . . . . . . . . . . . 16 2.5.3 Komponenten der Wasserkühlung . . . . . . . . . . . . . . . . . . . 16 Lüftersteuerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3 Durchführung 3.1 3.2 22 Verwendete Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.1.1 Prozess Benchmark . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.1.2 ASUS SmartDoctor 4.6.8 . . . . . . . . . . . . . . . . . . . . . . . 24 3.1.3 Motherboard Monitor 5.370 . . . . . . . . . . . . . . . . . . . . . . 25 3.1.4 CPU Burn-in v1.01 . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.1.5 RivaTuner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.1.6 3D Mark 2001 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Übertaktung des Prozessors . . . . . . . . . . . . . . . . . . . . . . . . . . 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.2.1 Vorüberlegungen 3.2.2 Durchführung (Versuchsziel 1) 3.2.3 Ergebnisse (Versuchsziel 1) 3.2.4 Langzeittest (Versuchsziel 1) 3.2.5 Ergebnisse Langzeittest (Versuchsziel 1) Thomas Winkler, Matthias Lübben . . . . . . . . . . . . . . . . . . . . 28 . . . . . . . . . . . . . . . . . . . . . . 30 . . . . . . . . . . . . . . . . . . . . . 30 . . . . . . . . . . . . . . . 31 2 RST-L WS06/07 3.3 3.4 Overclocking x86 3.2.6 Durchführung (Versuchsziel 2) . . . . . . . . . . . . . . . . . . . . 34 3.2.7 Ergebnisse (Versuchsziel 2) 3.2.8 Langzeittest (Versuchsziel 2) . . . . . . . . . . . . . . . . . . . . . . 36 . . . . . . . . . . . . . . . . . . . . . 36 Übertaktung der Grakkarte . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.3.1 Vorüberlegungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.3.2 Durchführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.3.3 Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Abschlieÿender Langzeitgesamttest . . . . . . . . . . . . . . . . . . . . . . 4 Benchmark 39 40 4.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.2 Audio Encoding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.2.1 Benchmark Beschreibung . . . . . . . . . . . . . . . . . . . . . . . 40 4.2.2 Benchmark Messwerte . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.2.3 Benchmark Auswertung . . . . . . . . . . . . . . . . . . . . . . . . 43 Video Encoding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.3.1 Bennchmark Beschreibung . . . . . . . . . . . . . . . . . . . . . . . 45 4.3.2 Benchmark Messwerte . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.3.3 Benchmark Auswertung 4.3 4.4 . . . . . . . . . . . . . . . . . . . . . . . . 47 3D Mark 2001 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.4.1 Benchmark Beschreibung 49 4.4.2 Benchmark Messwerte und Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5 Fazit 51 6 Begrie 52 Literaturverzeichnis 53 Abbildungsverzeichnis 55 Tabellenverzeichnis 56 Anlagen: Thomas Winkler, Matthias Lübben 3 RST-L WS06/07 Overclocking x86 1 Einführung 1.1 Systemumgebung Parameter Wert CPU AMD Athlon XP 1700+ (T-Bred B) Motherboard A7N8X-E Deluxe (Revision 2.0) Speicher 2x512MB PC3200 von MCI Computer Grakkarte ASUS V8420 Deluxe (Geforce 4 TI4200) Festplatte 2x160GB SAMSUNG SP1614N Betriebssystem Microsoft Windows XP mit SP2 Kühlung Wasserkühlung für CPU und GPU + 7 verbaute Lüfter Tabelle 1.1: Systemumgebung 1.2 Gründe für das Übertakten Die Erhöhung der Taktraten von CPU und Grakkarte resultiert in einer Leistungserhöhung des Gesamtsystems. Je nach Komponente kann der Performancegewinn erheblich sein und weit über der Normalleistung liegen, damit kann eine Investition in eine ab Werk höher getaktete Variante einer Komponente vermieden werden, welche logischerweise mitunter erheblich teurer ausfällt. 1.3 Zu berücksichtigende Kriterien Übertaktete Systeme können instabil werden und (Rechen-)Fehler produzieren. Diese äussern sich in einem Systemreboot, abstürzenden Programmen oder ähnlichen Ungereimtheiten. Beim Betreiben von Komponenten auÿerhalb ihrer Spezikationen erlischt in nahezu allen Fällen die Garantie des Herstellers. Auch die Lebenserwartung der übertakteten Bauteile kann bei nicht ausreichender Kühlung stark sinken. Durch einen höheren Takt und vor allem erhöhte Spannung wird die Elektromigration begünstigt. Die Thomas Winkler, Matthias Lübben 4 RST-L WS06/07 Overclocking x86 Verlustleistung steigt linear mit dem Takt und exponentiell mit der Spannung. Durch die erhöhte Verlustleistung ist zum Übertakten meist eine verbesserte Kühlung und gegebenenfalls ein stärkeres Netzteil nötig. Bei Verwendung einer Wasserkühlung gilt aber zu beachten, dass damit nur einzelne Teile gekühlt werden. Andere Komponenten wie z.B. die Kondensatoren auf dem Mainboard, welche bei einer konventionellen Luftkühlung von dem Luftstrom des CPU-Lüfters mitgekühlt werden, können durch das Fehlen dieses Lüfters sehr warm werden oder sogar überhitzen. Thomas Winkler, Matthias Lübben 5 RST-L WS06/07 Overclocking x86 2 Hardware Komponenten 2.1 Prozessor Bei der CPU handelt es sich um einen AMD Athlon XP 1700+ der Modellreihe Thoroughbred (T-Bred) [2] welcher gegen Ende 2002 veröentlich worden ist und den Nachfolger der ersten XP Modellreihe namens Palomino darstellt. Im Jahr 2003 wurde der T-Bred durch die zwei Modellreihen Thorton und Barton ersetzt. Danach wurde die Weiterentwicklung der AMD Athlon XP Prozessoren zu gunsten der AMD Athlon64 CPUs eingestellt. Der Prozessor verfügt über die Erweiterungen MMX, Extended 3DNow! und SSE1. Den Thoroughbred gibt es in den Varianten A und B, welche sich darin unterscheiden, dass die B-Variante über zusätzliche Kupfer-Verbindungsstücke verfügt, um Interferenz zu reduzieren. Der in diesem Versuch benutze Prozessor gehört der neueren B-Variante an und sieht laut Originalfoto wie folgt aus: Abbildung 2.1: AMD Athlon XP (T-Bred B-Variante) Thomas Winkler, Matthias Lübben 6 RST-L WS06/07 Overclocking x86 Der Thoroughbred ist von AMD in der B-Variante in den folgenden Versionen veröentlicht worden: FSB Bezeichnung Spannung MHz Datum 266 1600+ 1,6V 1400 Mrz 03 266 1700+ 1,5V - 1,6V 1463 Dez 02 266 1800+ 1,5V - 1,6V 1533 Dez 02 266 1900+ 1,5V - 1,6V 1600 Dez 02 266 2000+ 1,6V 1667 Aug 02 266 2100+ 1,6V 1733 Dez 02 266 2200+ 1,6V 1800 Aug 02 266 2400+ 1,65V 1995 Aug 02 266 2600+ 1,65V 2133 Aug 02 333 2600+ 1,65V 2083 Nov 02 333 2700+ 1,65V 2167 Okt 02 333 2800+ 1,65V 2250 Okt 02 Tabelle 2.1: Prozessor Varianten 2.1.1 Ordering Part Number Um sicher zu gehen, dass es sich bei obigen Prozessor wirklich um einen AMD Athlon XP 1700+ handelt, verizierten wir die Daten anhand der OPN (Ordering Part Number) [9]. Die OPN bezeichnet den Prozessor eindeutig und gibt seine Spezikation an. Die OPN bendet sich ab der T-Bred Modellreihe in Form eines Aufklebers auf der CPU selber. Folgendes Bild der OPN wurde von der in diesem Versuch verwendeten CPU erstellt: Abbildung 2.2: Bild der OPN Folgende Informationen lassen sich anhand dieses Aufklebers über die CPU gewinnen: Thomas Winkler, Matthias Lübben 7 RST-L WS06/07 Overclocking x86 Bedeutung Wert laut OPN TM Produktbezeichnung: AMD Athlon technischen Spezikationen: AXDA1700DUT3C Seriennummer: 9727377260723 Stepping mit Herstellungsdatum: JIUHB 0308WPMW Erstveröentlichung des Kerns: 1999 AMD Tabelle 2.2: OPN Bedeutung Produktbezeichnung Wie der Name schon sagt wird hier die Produktbezeichnung der CPU angegeben. Bei TM. der verwendeten CPU handelt es sich dementsprechend um einen AMD Athlon technischen Spezikationen Die technischen Spezikationen bestehen aus insgesamt sieben Informationen über die CPU. Folgende Tabelle zeigt anhand der Werte der verwendeten CPU, wie der Code aufzuteilen ist: Code: Aufteilung: AXDA 1700 D U T 3 C 1 2 3 4 5 6 7 Tabelle 2.3: Code Entschlüsselung Im folgendem werden die jeweiligen Bedeutungen der sieben Codeteile und deren Wert für die verwendete CPU erleutert: 1. Chiparchitektur: AXDA steht für einen Athlon XP Thoroughbred (A/B) Pro- zessor gefertigt in 0,13µm. 2. QuantiSpeed-Rating: Die 4 Ziern stehen für das so genannte QuantiSpeed- Rating [10]. Dahinter verbirgt sich der theoretische Geschwindigkeitsvergleich zwischen einem AMD Athlon und einem AMD Athlon XP. Der Wert von 1700 steht für das Modell 1700+ der AMD Athlon XP Reihe. Dies bedeutet, dass diese CPU theoretisch über die gleiche Geschwindigkeit wie ein (nicht existierender) AMD Athlon mit genau 1700 MHz verfügt. Diese Angabe ist aber bestenfalls als Richtwert zu deuten und nicht wirklich aussagekräftig, da ein realer Vergleich garnicht möglich ist. Fälschlicherweise wird oft angenommen, dass die Geschwindigkeit mit einem Pentium 3/4 von Intel verglichen wird, was aber auf keinen Fall der Wahrheit entspricht. Thomas Winkler, Matthias Lübben 8 RST-L WS06/07 Overclocking x86 Aus den bisherigen Informationen läÿt sich bereits erkennen, dass es sich bei der CPU wirklich um einen AMD Athlon XP 1700+ Thoroughbred handelt. 3. Gehäusetyp: Der Code D steht für die Bauform OPGA (Organic Pin Grid Array) und bedarf keiner weiteren Erklärung. 4. Betriebsspannung (VCore): Die Betriebsspannung der CPU liegt laut dem Code U bei 1,60V. Da es dieses Modell wie in Tabelle 2.1 zu sehen auch mit einer VCore von 1,50V existiert, ist die Spannung dieser CPU eher als schlecht zu beurteilen, da eine höhere Spannung zu einer höhreren Wärmeentwicklung der CPU führt. Dieser Sachverhalt wurde bereits in Kapitel 1.3 angesprochen. Auÿerdem sinkt das Übertaktungspotential durch schrittweiser Anhebung der VCore zum Maximalwert um 0,1V. 5. Maximale Temperatur des CPU-Kerns: laut dem Code T Die maximale Chiptemperatur darf ◦ 90 C nicht überschreiten. Dieser Maximalwert ist beim späteren Übertakten sehr wichtig, um sicherzugehen, dass wir die CPU nicht überhitzen und damit sehr wahrscheinlich beschädigen. 6. Gröÿe des L2-Cache: Die Gröÿe des L2-Cache beträgt laut dem Code 3 exakt 256KB. 7. Maximaler Front Side Bus (FSB): CPU liegt laut dem Code C Der Maximale FSB für den Betrieb der bei 266 MHz eektivem Takt. Ein anderer Wert war laut Tabelle 2.1 auch nicht zu erwarten. Seriennummer Der Code steht für die Seriennummer dieses Prozessors. Anhand der Seriennummer läÿt sich die CPU exakt identizieren. Stepping mit Herstellungsdatum Die ersten und letzten vier Zeichen des Codes werden als das Stepping [12] bezeichnet. Diese Daten werden seitens AMD nicht näher dokumentiert. Jedoch ergeben sie Aufschluss über die Qualität des Prozessors auf die jeweilige Übertaktbarkeit. Daher sind Prozessoren mit bestimmten Steppings bei Overclockern sehr begehrt. Die vier Ziern in der Mitte beschreiben das Herstellungsdatum. So stehen die ersten zwei Zahlen für das Jahr, hier also das Jahr 2003. Die nächsten beiden Ziern stehen für die Kalenderwoche der Herstellung. Der Prozessor wurde somit in der achten Kalenderwoche des Jahres 2003 hergestellt. Thomas Winkler, Matthias Lübben 9 RST-L WS06/07 Overclocking x86 2.1.2 Angestrebter Übertaktungswert Der angestrebte Wert ergibt sich aus dem Stepping-Code der CPU. Denn laut dem Internet [13] und einschlägiger Foren, die sich mit dem Thema übertakten beschäftigen, sollen Prozessoren mit dem JIUHB-WPMW Stepping ohne Probleme mit einer Taktrate von 1995 MHz stabil und fehlerfrei laufen. 1995 MHz entsprechen einem AMD Athlon XP 2400+ Prozessor. Mit entsprechender Kühlung soll es bei einigen CPUs dieser Baureihe auch möglich sein, Werte über 1995 MHz zu realisieren. Das angestrebte Ziel ist somit, die CPU soweit zu übertakten, dass sie mit einen Athlon XP 2400+ und eventuell auch 2600+ vergleichbar ist. Dies würde einem Geschwindigkeitszuwachs von 544 MHz bis 677 MHz entsprechen. Die CPU würde damit um einen Beschleuningungsfaktor von 1,36 bis 1,45 schneller laufen als eigentlich gedacht, was ein sehr respektables Ergebnis darstellen würde. Natürlich soll die CPU im übertaktenten Zustand weiterhin stabil laufen. Und auch die Temperatur soll nicht den von AMD fest- ◦ gelegten Grenzwert von 90 C annähern oder übersteigen. 2.2 Hauptplatine Das Motherboard [3] und [7] stammt von der Firma ASUS und trägt die Bezeichnung A7N8X-E Deluxe in der Revision 2.0 und schaut wie folgt aus: Abbildung 2.3: ASUS A7N8X-E Deluxe Thomas Winkler, Matthias Lübben 10 RST-L WS06/07 Overclocking x86 Die wichtigsten Spezikationen der Hauptplatine im Überblick: Parameter Wert CPU Socket A for AMD Athlon XP/Athlon/Duron (Thoroughbred/Barton Core Support) Chipsatz NVIDIA nForce2 Ultra 400 NVIDIA nForce2 MCP-T Front Side Bus 400/333/266/200 MHz Memory 3 x 184-pin DIMM Sockets support max. 3GB PC3200/PC2700/PC2100/PC1600 non-ECC DDR SDRAM memory Dual Channel Memory Architecture Expansion Slots 1 x AGP Pro/8X (1.5V only) 5 x PCI 1 x ASUS Wi-Fi slot for optional wireless LAN upgrade 2 x UltraDMA 133/100/66/33 Overclocking Features ASUS JumperFree CPU, Memory, and AGP voltage adjustable Adjustable FSB/DDR ratio, Fixed AGP/PCI frequencies Back Panel I/O Ports 1 x Parallel 1 x Serial 1 x PS/2 Keyboard 1 x PS/2 Mouse 1 x Audio I/O 2 x RJ45 1 x S/PDIF out 1 x Surround L/R audio jack 1 x CNTR/LFE audio jack 4 x USB 2.0/1.1 Tabelle 2.4: Spezikationen 2.2.1 Besondere Merkmale Temperaturmessung: Das A7N8X-E Deluxe liest ab der Revision 2.0 die Temperatur der CPU-Diode aus. Die vorherige Revision war nur in der Lage die Temperatur am Sockel zu messen, was wesentlich ungenauere Ergebnisse liefert. Ferner erlaubt das Motherboard Fremdprogrammen den Zugri auf die gemessenen Temperaturen. Auch dies war in der vorherigen Revision nicht möglich, was bedeutete, dass nur das BIOS in der Lage war, die Temperatur anzuzeigen und zu überwachen. Weiter muÿ berücksichtigt werden, dass ASUS bei vie- Thomas Winkler, Matthias Lübben 11 RST-L WS06/07 Overclocking x86 ◦ ◦ len ihrer Hauptplatinenmodelle zu den ausgelesenen Werten 10 C - 15 C addiert, um sicherzustellen, dass die gemessene Temperatur auf keinen Fall niedriger als die tatsächliche Temperatur ist. Dementsprechend würde es bedeuten das die CPU laut Anzeige ca. ◦ 100 C warm werden darf. Für diesen Versuch wurde allerdings festgelegt, dass die CPU ◦ eine ausgelesne Temperatur von 70 C nicht überschreiten darf. Damit wird ausgeschlossen, dass sich die CPU den erlaubten Maximaltemperaturwert auch nur annähert oder gar überschreitet. CPU Overheating Protection (C.O.P.): Das Motherboard ist in der Lage, der CPU automatisch den Strom zu entziehen, falls diese eine Temperatur erreicht, die den erlaubten Wert überschreitet. C.O.P. schützt die CPU allerdings erst dann, wenn das komplette BIOS in den Speicher geladen worden ist. Würde man z.B. den Rechner starten ohne einen Kühler auf der CPU montiert zu haben, würde auch das C.O.P. versagen und die CPU sehr wahrscheinlich beschädigt werden. Bei diesen Versuch leistet das C.O.P. im Notfall aber seine Dienste, da die Temperatur durch den vorhandenen Kühlkörper, inklusive der daran angeschlossenen Wasserkühlung nur langsam und nicht abrupt ansteigt. Stepless Frequency Selection (SFS): Das SFS ermöglicht es, den tatsächlichen Takt (FSB) des Motherboards beliebig in 1 MHz schritten zwischen 100 MHz und 300 MHz einzustellen. Dies entspricht einem eektiven Takt des FSB von 200 MHz bis 600 MHz. Wie die SFS die verschiedenen Einstellungen des FSB realisiert, wird von Seiten des Herstellers nicht näher erläutert. Ferner ist das Motherboard in der Lage die Taktraten vom AGP-Bus und PCI-Bus konstant zu halten. Das bedeutet, dass egal welche Geschwindigkeit beim FSB gewählt wird, der AGP/PCI Bus nie über- oder untertaktet wird. Das Verhältnis für die Taktung des Speichers und des FSB lässt sich variabel einstellen. Dadurch ist es möglich, den Speicher unabhängig von der Geschwindigkeit des FSB mit einer festen Taktung zu betreiben. Dies ist wichtig, da eine Änderung der Speichertaktung zu einer Verfälschung der Messwerte führen würde. Spannungseinstellungen: Das Motherboard bietet die Möglichkeit, die Spannungen für den AGP-Bus, den Speicher und die CPU separat zu variieren. Dies wird benötigt, um die CPU später mit einer höheren Spannung zu betreiben, was für eine stabile Übertaktung eventuell notwendig werden könnte. Thomas Winkler, Matthias Lübben 12 RST-L WS06/07 Overclocking x86 2.3 Grakkarte Die Grakkarte [4] und [8] stammt wie schon die Hauptplatine von ASUS und trägt den Namen V8420 Deluxe. Hinter dieser Bezeichnung verbirgt sich eine GeForce 4 Ti4200 mit folgendem Layout: Abbildung 2.4: ASUS V8420 Deluxe Die GeForce 4 Ti ist eine direkte Weiterentwicklung der GeForce 3 Ti und war zu ihrer Zeit für den anspruchsvollen Spieler gedacht. Dagegen basiert die für Einsteiger entwickelte GeForce 4 MX auf einer überarbeiteten NVIDIA GeForce 2, die unter anderem den verbesserten Speichercontroller des Geforce 4 Ti-Modelles verwendet. Demzufolge besitzen die GeForce 4 MX keine Pixel- und Vertexshader, sondern nur eine Hardware T&L-Einheit. Die Grakkarte trägt den Namen Deluxe, da ASUS erheblich von dem von NVIDIA vorgegebenen Referenzdesign für das Layout der Karte abweicht: 2.3.1 Abweichungen vom Referenzdesign Wie folgende Tabelle zeigt, weicht ASUS mit der V8240 Deluxe mit einem um 10 MHz höheren GPU Takt und einem um ganze 63 MHz höheren Speichertakt vom NVIDIA vorgegeben Referenzdesing ab: Thomas Winkler, Matthias Lübben 13 RST-L WS06/07 Overclocking x86 Parameter Referenzdesign Asus V8240 Deluxe GPU: NV25 NV25 Chiptakt: 250 MHz 260 MHz Füllrate: 2000 MT/s 2000 MT/s Speicher: 128 MB 128 MB Speichertakt: 222 MHz 275 MHz Speichertyp: 128 Bit DDR 128 Bit DDR Bandbreite: 7,1 GB/s 7,1 GB/s Tabelle 2.5: Vergleich ASUS VS Referenzdesign Ermöglicht wird die schnellere Taktung durch folgende Punkte: Gehäuseform der Speicherchips In der Regel wird für die Ti4200 Karten die TSOP (Thin Small Outline Package) Bauform verwendet, welche schon für die Geforce 3 Serie benutzt wurde. Erst für die Ti4400 und Ti4600 Karten wurde die Bauform BGA (Ball Grid Array) genutzt. Diese Form ermöglicht gegenüber dem TSOP bessere thermische Eigenschaften und daraus resultierende höhere Taktfrequenzen. Diese Speicherform benutzt Asus entgegen des Referenzdesigns für die V8420 Deluxe Grakkarte. Zugriszeit der Speicherchips und Layout der Grakkarte Da der Speichertakt von den Ti4200 Karten nach NVIDIA Referenzdesign 250 MHz nicht überschreitet, betragen die Zugriszeiten der in der Regel verbauten Speicherchips 3,6ns - 4,0ns. Die auf der V8420 Deluxe verbauten Speicherchips hingegen verfügen über eine Zugriszeit von 3,3ns und erlauben theoretisch einen Speichertakt von über 300 MHz. Dies ist allerdings nur dann möglich, wenn die Signalleitungen der verwendeten Karte die Taktfrequenzen auch umsetzen können. Die V8420 Deluxe von Asus weicht auch hier vom Referenzdesign mit 6 Schichten (Layer) ab und spendiert der Karte 8 Schichten, welche eigentlich den Ti4400 und Ti4600 Karten vorbehalten sind. Dadurch ergeben sich saubere Signalanken, welche Taktfrequenzen von über 300 MHz erlauben. 2.3.2 Angestrebter Übertaktungswert Durch obige Abweichungen vom Referenzdesign stellt die V8420 Deluxe einen perfekten Kandidaten zur Übertaktung dar. Schon in der Standardtaktung überholt die V8420 Thomas Winkler, Matthias Lübben 14 RST-L WS06/07 Overclocking x86 Deluxe eine Ti4400 um 25 MHZ (50 Mhz DDR) Speichertakt. Rein theoretisch sollte es möglich sein, bei vernünftiger Kühlung der GPU die V8420 Deluxe auf die Geschwindkeit einer regulären Geforce 4 Ti4600 (Chiptakt: 300 MHz / Speichertakt 325 MHz) zu takten. 2.4 Speicher Die beiden im Testrechner verwendeten baugleichen DDR-SDRAM [11] Speicherriegel mit einer Gröÿe von je 512MB sind vom Hersteller MCI Computer. DDR-SDRAM arbeitet mit beinahe der doppelten Datenrate wie herkömmliche SDRAM Module. Möglich wird dies durch einen relativ simplen Trick. Die Datenbits werden bei der ab- und aufsteigenden Flanke des Taktsignals übertragen, statt nur bei der aufsteigenden. Damit das DDR (Double Data Rate) Verfahren zu einer Beschleunigung führt, muss die Anzahl zusammenhängend angeforderter Daten immer gleich oder gröÿer als die doppelte Busbreite sein. Da das nicht immer der Fall sein kann, ist DDR-SDRAM im Vergleich zu einfachem SDRAM bei gleichem Takt nicht exakt doppelt so schnell. Ein weiterer Grund ist, dass Adress- und Steuersignale im Gegensatz zu den Datensignalen nur mit einer Taktanke gegeben werden. Der Speicher wird bei allen Versuchsdurchführungen mit einer tatsächlichen Geschwindigkeit von 200 MHz getaktet und bendet sich im Dual Channel betrieb. Im Gegensatz zum Single-Channel-Modus, bei dem der Datenbus 64 bit breit ist (also 64 Datenleitungen), werden im Dual-Channel-Modus zwei Module gleichzeitig mit 64-Bit Datenbus betrieben. Da die Taktrate, mit der der Speicher betrieben wird, gleich bleibt, sich die übertragenen Daten pro Takt jedoch verdoppeln (also 128 Bit pro Takt statt wie bisher 64 Bit), führt der Einsatz des Dual-Channel-Modus theoretisch zur Verdopplung des Speicherdurchsatzes. So kann der im Testrechner verwendete PC-3200 Speicher im Single-Channel-Modus ca. 3.2 Gigabyte/sec an Daten zum Speichercontroller transferieren, im Dual-Channel-Modus sind es hingegen ca. 6.4 Gigabyte/sec. Um wie viel sich die Arbeitsgeschwindigkeit durch den Einsatz von Dual Channel steigert, hängt jedoch von den benutzten Programmen, den Speicherzugrismustern und der CPU ab, wobei eine Leistungssteigerung um einen Faktor von ca. 1,05 gegenüber dem Singlechannelbetrieb laut Erfahrungsberichten erwartet werden kann. Thomas Winkler, Matthias Lübben 15 RST-L WS06/07 Overclocking x86 2.5 Wasserkühlung 2.5.1 Ziel einer Wasserkühlung Primäres Ziel der Wasserkühlung in einem PC ist es, die im Rechnergehäuse entstehende Wärme, vor allem von den im Betrieb stark aufheizenden Halbleitern wie z.B. der CPU oder dem Grakprozessor, so ezient und geräuscharm wie möglich abzuführen. Eine mögliche Leistungssteigerung des Rechners durch den Betrieb auÿerhalb der Spezikationen ist ein weiteres Einsatzfeld der Wasserkühlung. Die vergleichsweise hohe Wärmekapazität des Kühlmediums Wasser begünstigt die hohe Wärmeaufnahme von kleinächigen Wärmequellen, wie sie in einem Rechner typisch sind. 2.5.2 Aufbau der Wasserkühlung im Testrechner Folgendes Foto zeigt die im Testrechner verbaute Wasserkühlung: Abbildung 2.5: Wasserkühlung im eingebautem Zustand 2.5.3 Komponenten der Wasserkühlung Die im Testrechner verbaute Wasserkühlung besteht aus folgenden Komponenten: Thomas Winkler, Matthias Lübben 16 RST-L WS06/07 Overclocking x86 1 - Die Pumpe Die Pumpe dient dazu das Wasser im Wasserkreislauf zirkulieren zu lassen. Die hier verwendete Pumpe [5] stammt von Eheim und ist urspünglich für den Gebrauch in Teichen und Aquarien konzipiert worden. Durch die wachsende Beliebtheit von Wassergekühlten Rechnern wurde der Hersteller Eheim quasi ohne Zutun und über Nacht zum bekanntesten Anbieter für Pumpen im Bereich Wasserkühlung. Folgendes Bild zeigt die im Testrechner verwendete Eheim 1048 Pumpe: Technische Daten: • Eheim 1048 Kreiselpumpe • Pumpenleistung 600 l/h • Förderhöhe 1,50 mWs • Leistungsaufnahme 10 W • Schlauchanschluÿ saugseitig Ø13mm • Schlauchanschluÿ druckseitig Ø13mm Abbildung 2.6: Eheim 1048 2 - Der Radiator Der Radiator dient dazu, das erwärmte Wasser im Kühlkreislauf abzukühlen. Es gibt aktive Radiatoren, die den Einsatz von Lüftern zum Kühlen des Wassers benötigen, und passive Radiatoren, welche das Wasser ohne Belüftung aufgrund ihrer groÿen Fläche, welche die Wärme abführen kann, abkühlen. Aktive Radiatoren sind weitaus platzsparender, wesentlich leichter und günstiger als die passive Variante. Passive Radiatoren lassen sich aufgrund ihrer Gröÿe nicht direkt in das Gehäuse einbauen und werden meist von auÿen an einer der beiden Gehäuseseiten befestigt. Aktive Radiatoren hingegen werden in der Regel direkt in das Rechnergehäuse integriert. Der Nachteil der aktiven Radiatoren ist der durch die Lüfter bedingte zusätzliche Energieverbrauch als auch die eventuell hörbaren Laufgeräusche selbiger. Der im Testrechner verbaute aktive Radiator stammt von der Firma Innovatek und trägt die Bezeichnung RADI Dual. Hierbei handelt es sich um einen aktiven Radiator, wel- Thomas Winkler, Matthias Lübben 17 RST-L WS06/07 Overclocking x86 cher Platz für zwei 120er Lüfter bietet. Der Radiator ist in der Lage, bei entsprechender Belüftung ca. 700 Watt an Wärmeenergie abzuführen. Folgendes Bild zeigt den im Testrechner verwendeten Radiator: Abbildung 2.7: RADI Dual 3 - Der Ausgleichsbehälter Ein Ausgleichsbehälter dient zum Entlüften und einfachen Befüllen der Wasserkühlung mit destilliertem Wasser. Der im Testrechner verbaute Ausgleichsbehälter stammt von der Firma Innovatek und trägt die Bezeichnung Tank-O-Matic. Anzumerken ist, dass dieser Ausgleichsbehälter aufgrund seiner Anbringung an der Auÿenseite des Gehäuses überdurchschnittlich groÿ ist. Dies hat den Vorteil, dass der Rechner zum Befüllen nicht geönet werden muÿ. In der Regel werden wesentlich kleinere Ausgleichsbehälter im Gehäuseinneren meist direkt an der Pumpe verbaut. Folgendes Bild zeigt den im Testrechner verwendeten Ausgleichbehälter (liegend): Abbildung 2.8: Tank-O-Matic Thomas Winkler, Matthias Lübben 18 RST-L WS06/07 Overclocking x86 4 - Die Kühlkörper für CPU und GPU Die Kühlkörper dienen zum Kühlen der CPU/GPU. Anders als bei den herkömmlichen Modellen mit einem Lüfter ieÿt bei diesen Kühlkörpern Wasser hindurch, was die Verlustleistung der CPU/GPU, die in Wärme umgesetzt wird eektiver abtransportieren kann als ein Luftgekühlter Kühlkörper. Die im Testrechner verwendeten Kühlkörper stammen von Innovatek und haben die Bezeichnung innovaFlatFlow-O-Matic rev 1.0 für den CPU Kühler und Graph-O-Matic rev 1.0 für den GPU Kühler. Anzumerken ist, dass beide Kühler zu einer der ersten in Serie produzierten Kühlkörper für Wasserkühlungen gehören. Heutige Kühler sind weitaus ezienter beim Abführen der entstehenden Wärme. Das Bild 2.9 zeigt die beiden im Testrechner verwendeten Kühlkörper für CPU und GPU: Abbildung 2.9: innovaFlatFlow-O-Matic und Graph-O-Matic 2.6 Lüftersteuerung Der Versuchsrechner verfügt über insgesamt 7 Lüfter. 6 dieser Lüfter lassen sich Stufenlos in der Geschwindigkeit über die eingebaute Lüftersteuerung regulieren. Der siebte Lüfter bendet sich im Netzteil und ist nicht steuerbar. Lüfterdetails: Anzahl Bezeichnung Durchmesser Laufgeräusch Luftleistung 4 SmartCooler LFM1512E 120mm 15dbA 70m /h 2 1 unbekannt unbekannt 80mm 120mm unbekannt unbekannt 3 unbekannt unbekannt Tabelle 2.6: Lüfterdetails Thomas Winkler, Matthias Lübben 19 RST-L WS06/07 Overclocking x86 Das Bild 2.10 zeigt die eingebaute Lüftersteuerung im Versuchsrechner mit den dazugehörigen Lüftern: Abbildung 2.10: Rechner mit Lüftersteuerung Zu Nr. 1 Zwei Smart Cooler Lüfter [1] benden sich direkt auf dem Radiator und saugen frische Luft von der Unterseite des Gehäuses durch den Radiator hinweg in das Gehäuseinnere. Sie dienen primär zum Kühlen des Wassers im Radiator und sekundär dazu, Frischluft in das Gehäuse zu blasen. Zu Nr. 2 Ein Smart Cooler Lüfter bendet sich ganz unten an der Gehäusevorderseite. Er dient primär dazu, frische Luft in das Gehäuse zu blasen, und sekundär dazu, die beiden sich dahinter bendenden Festplatten zu kühlen. Thomas Winkler, Matthias Lübben 20 RST-L WS06/07 Overclocking x86 Zu Nr. 3 Ein weiterer Smart Cooler Lüfter bendet sich auf mittlerer Höhe an der Rückseite des Gehäuses. Seine Aufgabe besteht darin, die aufgewärmte Luft aus dem Gehäuse zu saugen. Zu Nr. 4 Hierbei handelt es sich um zwei No-Name Lüfter mit 80mm Durchmesser, welche beim Gehäuse dabei waren. Der an der Gehäuseseite bendliche Lüfter bläst frische Luft in das Gehäuse. Der an der Gehäuseoberseite montierte Lüfter dient zum Absaugen der aufgewärmten Luft. Zu Nr. 5 Hierbei handelt es sich um einen No-Name Lüfter mit 120mm Durchmesser, welcher die aufgewärmte Luft aus dem Rechner bläst und dabei das Netzteil kühlt. Dieser Lüfter ist nicht an die Lüftersteuerung angeschlossen und läuft konstant mit 12V Betriebsspannung. Alle Lüfter, welche Luft in das Gehäuse blasen sind mit Staubschutzltern versehen, um eine Verunreinigung des Gehäuseinneren auf ein Minimum zu beschränken. Für den gesamten Versuchszeitraum wurden alle Lüfter mit maximaler Drehzahl betrieben, um die Messergebnisse nicht zu beeinussen. Thomas Winkler, Matthias Lübben 21 RST-L WS06/07 Overclocking x86 3 Durchführung 3.1 Verwendete Software 3.1.1 Prozess Benchmark Das Programm Prozess Benchmark ist eine Eigenentwicklung, um den Einuss des Betriebsystems auf die Laufzeit eines Programs oder besser eines Prozesses zu eliminieren. Diese Thematik wurde bereits in vorangegangen Vorträgen innerhalb der Laborveranstaltung angesprochen. Es ist möglich, für einen einzelnen Prozess festzustellen, wie lange er die CPU belegt hat. Abbildung 3.1: Prozess Benchmark Das Programm verwendet zum Ermitteln der Prozess Zeiten die Funktion GetProcessTimes, die vom Betriebsystem bereitgestellt wird. Diese Funktion ist ab Windows 2000 verfügbar und ist in der Bibliothek kernel32.dll deniert. Diese Funktion steht jedem Programm zur Verfügung. Die Funktion ist wie folgt deklariert. BOOL GetProcessTimes( HANDLE hProcess, LPFILETIME lpCreationTime, Thomas Winkler, Matthias Lübben 22 RST-L WS06/07 Overclocking x86 LPFILETIME lpExitTime, LPFILETIME lpKernelTime, LPFILETIME lpUserTime); Die Oberäche des Programms wurde mit QT 4.2.2 [21] entwickelt, um eine möglichst einfache Portierung auf Linux basierte Betriebsysteme zu ermöglichen. Unter Linux gibt es bereits das bash built-in Kommando time, mit dem es möglich ist, die Laufzeit eines Prozesses zu ermitteln, Daher wurde Process Benchmark auch nur für Windows entwickelt. Das Programm unterliegt jedoch der Einschränkung, dass es nur für Programme vernüftige Werte liefert, die keine Kindprozesse erzeugen: denn dessen Zeit wird nicht gemessen. CreateProcess neue Profork neue Kindprozesse. Prozesse, die aus Unter Windows sind das Programme, die über die Funktion zesse erzeugen. Linux erzeugt über den syscall mehreren Threads bestehen, sind jedoch kein Problem. Das Klassendiagramm in Abbildung 3.2 zeigt die Klassen, die für die Erfassung der Messwerte verantworlich sind. Abbildung 3.2: Klassendiagramm QAbstractTableModel erbt und daher über die QTableView Klasse auf der GUI angezeigt werden kann. QAbstractTableModel und QTableView sind Bestandteile des QT Frameworks. Die Aufgabe der Klasse Model ist es, eine Liste von Record-Klassen zu verwalten und die Daten für die Anzeige aufzu- Die Messwerte werden in der Klasse Model gesammelt, die von bereiten. Die Klasse Record speichert die Werte für eine Messung. Die Dauer des Prozesses totalTime exitTime - creationTime. Die Prozessorzeit processorTime wird dabei berechnet aus Thomas Winkler, Matthias Lübben 23 RST-L WS06/07 Overclocking x86 ergibt sich aus der Summe der im Kernel verbrachten Zeit die Berechnungen des Prozesses selbst Die Klasse Process userTime. ist verantwortlich für das Erzeugen des zu beobachtenden Prozes- ses und aktualisiert alle 250ms die Felder userTime. kernelTime sowie der Zeit für creationTime, exitTime, kernelTime und started, beim Be- Diese Klasse löst beim Starten des Prozesses das Signal finished und nach einer Aktualisierung der eben genannten Felder updated aus. Die GUI des Programms reagisert auf die Signale durch entspreSlots und aktualisiert darauf hin die Daten in der Klasse Model. enden des Prozesses das Signal chende Für eine Portierung auf die Linux Plattform ist die Klasse Process neu zu entwickeln, da diese Klasse Plattformspezische Anweisungen enthält. Für eine Portierung lieÿen sich die C-Funktionen times sowie clock verwenden, wobei clock eher ungeeignet ist, weil die Funktion die CPU Zeit des eigenen Prozesses zurückgibt. Aus dem Dateisystem /proc/<pid>/stat lassen sich die Prozesszeiten ebenfalls ermitteln. 3.1.2 ASUS SmartDoctor 4.6.8 Dieses Tool [14] dient zur Überwachung von Grakkarten der Firma ASUS, wozu auch die im Testrechner verwendete V8420 Deluxe zählt. Es gibt Auskunft über die Temperatur von GPU und Speicher, Spannungswerte der Grakkarte und die Lüfterdrehzahl. Auch kann das Programm einen Alarm auslösen, wenn bestimmte Werte wie z.B. die Temperatur einen denierten Wert überschreiten. Für die GPU ist eine Temperatur von ◦ 90 C als Standartwert zur Alarmierung vordeniert. Daraus lässt sich schlieÿen, dass die ◦ Maximaltemperatur der GPU bei ca. 90 C liegt. Der Alarmierungswert für den Speicher ◦ liegt standardmäÿig bei 75 C. Auch hier lässt sich vermuten, dass dies den maximalen Temperaturwert für den Speicher darstellt. Ferner zeigt das Programm die aktuelle Taktung der GPU und des Speichers der Grakkarte an und bietet beschränkte Möglichkeiten diese zu modizieren: beschränkt deswegen, weil die Taktung für die GPU maximal auf 275 MHz und für den Speicher auf maximal 600 MHz (eektiver Wert) gestellt werden kann. Da unsere angestrebten Werte für die Taktung der GPU und des Speichers aber über diesen Maximalwerten liegen, wurde zur Modizierung der Taktung das Programm RivaTuner verwendet. Thomas Winkler, Matthias Lübben 24 RST-L WS06/07 Overclocking x86 Abbildung 3.3: ASUS SmartDoctor 3.1.3 Motherboard Monitor 5.370 Mit dem Programm Motherboard Monitor (MBM) [15] lassen sich die Temperaturwerte der Sensoren des Mainboards auslesen. Auch Drehzahlen der Lüfter lassen sich ermitteln. Spannungswerte der Hauptplatine stehen ebenfalls zur Verfügung. Ursprünglich wurde das Programm von Alexander van Kaam zum Überwachen des Systems entwickelt. Es läÿt sich aber auch zum Aufzeichnen von Messreihen verwenden. Die Weiterentwicklung wurde im Juli 2004 eingestellt. 3.1.4 CPU Burn-in v1.01 Das Programm CPU Burn-in [16] ist ein Werkzeug zum Testen der Systemstabilität. Es erzeugt eine künstliche Volllast des Systems, um Instabilitäten erkennen zu können. Diese Instabilitäten können z.B. durch die eigene Wärmeentwicklung entstehen. Das Programm bietet zwei verschiedene Testmodi: einen mit Fehlerprüfung und einen ohne Fehlerprüfung. Beide Modi führen in schneller Folge auf der FPU Gleitkommazahlenoperationen aus. Die FPU bendet sich auf dem Die der CPU. Da das Programm sehr klein ist, können sich viele Teile des Programms im Cache benden und dadurch den Durchsatz der Operationen ebenfalls erhöhen, da auf langwierige Arbeitsspeicher Zugrie verzichtet werden kann. Thomas Winkler, Matthias Lübben 25 RST-L WS06/07 Overclocking x86 Abbildung 3.4: CPU Burn-in Der Modus ohne Fehlerprüfung erzeugt ebenfalls eine Steigerung der Gleitkommaoperationen pro Sekunde, weil die berechneten Ergebnisse nicht veriziert werden. Dies hat zur Folge, dass eventuell kleine Fehler, bei denen sich nur ein einzelnes Bit verändert, nicht erkannt werden können. In vielen Fällen ist dies unproblematisch, ein falsch gesetztes Bit in einem Bild führt zu keinen Systamabsturz. Der Benutzer wird auf diesen Fehler erst aufmerksam, falls sich ein Bit in einem Treiber ändert und das System zum Absturz bringt. 3.1.5 RivaTuner Dieses Tool [17] bietet viele Möglichkeiten zur Modikation des oziellen Treibers für Grakkarten mit NVIDIA Chipsatz. Für diesen Versuch wurde das Programm allerdings nur für die Modikation der Taktung der Grakkarte verwendet, weswegen auf den Funktionsumfang, welchen das Tool bietet, nicht näher eingegangen wird. Abbildung 3.5: RivaTuner Thomas Winkler, Matthias Lübben 26 RST-L WS06/07 Overclocking x86 3.1.6 3D Mark 2001 Die Benchmark Software 3D Mark 2001 [18] wurde von der Firma Futuremark entwickelt. Die Entwicklung an der Software ist jedoch eingestellt worden, da es bereits 3 nachfolgende Versionen gibt. Es wurde diese Version von 3D Mark verwendet, da der Testrechner aus einer Generation stammt, in der die Version noch aktuell war. Das Programm benutzt eine echte Spiel-Engine MAX-FX Technology von Remedy Entertainment. Dies soll dem Benchmark eine realitätsnahe Umgebung bereitstellen, in der die Tests ausgeführt werden können. 3.2 Übertaktung des Prozessors 3.2.1 Vorüberlegungen Das erste angestrebte Ziel ist es, die CPU soweit zu übertakten, dass die Geschwindigkeit eines AMD Athlon XP 2400+ erreicht wird (siehe Abschnitt 2.1.2). Dieser hat eine Geschwindigkeit von 1995 MHz. Der Wert für die CPU Geschwindigkeit ergibt sich aus dem tatsächlichen Takt des FSB multipliziert mit einem so genannten Multiplikator, der sich auf der CPU bendet. Formal bedeutet dies: CP U T akt = F SB ∗ M ultiplikator Wie unter Abschnitt 2.1.1 zu sehen ist, ist die im Testrechner verwendete CPU laut OPN für einen eektiven Takt von 266 MHz ausgelegt, was einen tatsächlichen Takt von 133 MHz entspricht. Stellt man die Formel um und setzen die bekannten Werte ein, ergibt sich ein benötigter Multiplikatorwert von 15. M ultiplikator = CP U T akt F SB ⇒ 1995M Hz 133M Hz = 15 Leider unterstützt die CPU als höchsten Multiplikator nur den Wert 12,5. Ohne eine Erhöhung des FSB ist es somit nicht möglich den Wert von 1995 MHz zu erreichen. Eine Erhöhung des FSB auf Werte, welche nicht den Standard (100/133/166/200/...) entsprechen, bringt hingegen in der Regel Taktungsprobleme für Speicher, AGP-Bus und PCI Bus mit sich, da ein Motherboard für krumme Werte keinen passenden Teiler zur Verfügung stellt, die benötigt werden um obige Bussysteme mit der richtigen Taktung zu versorgen. Dies könnte zur Folge haben, dass Speicher, AGP-Bus und/oder PCI-Bus niedriger oder höher getaktet werden als vorgesehen, und daran angebundene Komponenten, wie z.B. der Arbeitsspeicher oder die Grakkarte beschädigt werden könnten. Das im Versuchrechner verwendete Motherboard hingegen sollte damit keine Probleme bekommen (siehe Absatz SFS im Abschnitt 2.2.1). Da die Taktung des FSB für das Er- Thomas Winkler, Matthias Lübben 27 RST-L WS06/07 Overclocking x86 reichen von 1995 MHz stark erhöht werden muss, macht es Sinn, vorsichtshalber gleich den nächsten Standardtakt von 166 MHz (Eektiv 333 MHz), zu wählen. Dadurch ist zu 100% gewährleistet, dass der AGP/PCI Bus richtig getaktet ist. Die Taktrate des Speicher bleibt ebenfalls unverändert bei 200 MHz (siehe Absatz SFS im Abschnitt 2.2.1). Damit hat der benötigte Multiplikator für eine Geschwindigkeit von ca. 1995 MHz den Wert 12. M ultiplikator = CP U T akt F SB ⇒ 1995M Hz 166M Hz ≈ 12 Das zweite Ziel ist es, die Geschwindigkeit eines AMD Athlon XP 2600+ zu erreichen. Dieser hat eine Geschwindigkeit von 2083 Mhz bzw. 2133 MHz (siehe Tabelle 2.1). Mit dem maximal möglichen Multiplikator der verwendeten CPU erreichen wir nur einen maximalen Takt von 2075 MHz. CP U T akt = F SB ∗ M ultiplikator ⇒ 166M Hz ∗ 12, 5 = 2075M Hz Um wirklich die Geschwindigkeit eines XP 2600+ zu erreichen, führt nun kein Weg mehr dran vorbei, den FSB auf nicht standarisierte Werte zu takten. Die bestmögliche Annäherung erreicht man mit einem FSB von 167 MHz oder 171 Mhz. F SB = CP U T akt M ultiplikator ⇒ 2083M Hz 12,5 ≈ 167M Hz F SB = CP U T akt M ultiplikator ⇒ 2133M Hz 12,5 ≈ 171M Hz 3.2.2 Durchführung (Versuchsziel 1) Der FSB wurde auf einen tatsächlichen Takt von 166 MHz eingestellt. Anschlieÿend wurde der Multiplikator auf den kleinstmöglichen Wert (welcher durch den erhöhten FSB schon eine minimale Übertaktung der CPU darstellt) gesetzt. Ingesamt unterstützt die CPU folgende Multiplikatoren: 9X / 9,5X / 10X / 10,5X / 11X / 11,5X / 12X / 12,5X. Die schrittweise Übertaktung wurde nach folgendem Schema ausgeführt: Thomas Winkler, Matthias Lübben 28 RST-L WS06/07 Overclocking x86 Abbildung 3.6: Schema für Versuchsziel 1 Der maximale Wert für den Multiplikator entspricht den Wert 12, falls nicht vorher schon das ENDE erreicht wird. BOOT: Bootet der Rechner ordnungsgemäÿ und wird Windows fehlerfrei gestartet? TEST: Fehlerfreie Ausführung von CPU Burn-in über einen Zeitraum von 1h? ◦ TEMP: Temperatur der CPU nach/während TEST laut MBM Logdatei unter 70 C? VCORE: VCore auf nächst möglichen Wert erhöhen, solange ein Wert von 1,725V nicht überschritten wird. Thomas Winkler, Matthias Lübben 29 RST-L WS06/07 Overclocking x86 3.2.3 Ergebnisse (Versuchsziel 1) Abbildung 3.7: Ergebnisse von Versuchziel 1 Bei einer Geschwindigkeit von 1826 MHz kam es zu den ersten Systemabstürzen während der TEST-Phase. Eine Anhebung der VCore Spannung auf 1,625V reichte aus um die CPU wieder in einen stabilen Zustand zu versetzen. Die nächsten Fehler traten bei einer Geschwindigkeit von 1909 MHz auf. Der Testrechner lieÿ sich nicht mehr ordnungsgemäÿ booten und führte beim Starten des Betriebssystems einen Reboot durch oder zeigte einen Bluescreen an. Das erneutes Anheben der VCore auf 1,65V brachte auch hier die CPU wieder in einen stabilen Zustand. Das erste Versuchziel von ca. 1995 MHz (XP 2400+) konnte ohne weitere Probleme erreicht werden. 3.2.4 Langzeittest (Versuchsziel 1) Um sicher zu stellen, dass die CPU auch im Dauerbetrieb fehlerfrei und stabil läuft, wurde ein Langzeittest durchgeführt. Dazu wurde der Rechner für 3h ausgeschaltet, um die Temperatur des Rechnergehäuses und der Wasserkühlung quasi zu resetten. Nun wurde der Rechner gestartet und das Programm CPU Burn-in für 6h lang betrieben, um die Maximaltemperatur, welche die CPU in dieser Taktung erreichen kann, zu ermitteln. Anschlieÿend wurde der Rechner weitere 3h unter alltäglicher Verwendung betrieben (Textverarbeitung, Spiele und Leerlaufbetrieb). Über den ganzen Zeitraum wurde die Temperatur des Gehäuses und der CPU mittels Motherboard Monitor im 30 Sekunden Takt mitgeloggt. Die Temperatur der Grakkarte konnte leider nicht gespeichert werden, da obiges Programm diese nicht auslesen konnte. Da die Grakkarte noch mit der Standarttaktung von ASUS betrieben wurde ist die Temperatur allerdings relativ unrelevant, da Hitzeschäden an der GPU auszuschlieÿen sind. Thomas Winkler, Matthias Lübben 30 RST-L WS06/07 Overclocking x86 3.2.5 Ergebnisse Langzeittest (Versuchsziel 1) ◦ Die Gehäusetemperatur blieb während des gesamten Tests konstant auf 20 C. Der Temperaturverlauf der CPU wurde in zwei Graken aufgeteilt. Die erste Grak zeigt den Temperaturverlauf der ersten 6h - also den Zeitraum wo CPU Burn-in die CPU maximal auslastete und die zweite Grak zeigt die darauf folgenden 3h, in welchen der Testrechner unter realen Bedingungen betrieben wurde: Thomas Winkler, Matthias Lübben 31 RST-L WS06/07 Overclocking x86 Abbildung 3.8: Temperaturverlauf unter Vollast Wie in der Grak zu erkennen ist, steigt die Temperatur innerhalb der ersten 30 Minu- ◦ ten sehr schnell an und erreicht eine maximale Temperatur von 45-46 C. Die für diesen Thomas Winkler, Matthias Lübben 32 RST-L WS06/07 Overclocking x86 Versuch selbstdenierte Maximaltemperatur (siehe Absatz Temperaturmessung im Ab- ◦ schnitt 2.2.1) von 70 C wurde damit auch nach mehreren Stunden Dauerbelastung bei weitem nicht erreicht. Abbildung 3.9: Temperaturverlauf unter Normallast Thomas Winkler, Matthias Lübben 33 RST-L WS06/07 Overclocking x86 Der anschlieÿende Test unter realen Bedingungen zeigt deutlich, dass die Temperatur ◦ ◦ zwischen dem Maximalwert von 46 C und 42 C je nach CPU Auslastung schwankt. Zu erwähnen ist allerdings, dass die Grakkarte sich im selben Kühlkreislauf wie die CPU bendet. Werden nun über einen sehr langen Zeitraum z.B. Computerspiele gespielt, welche CPU als auch GPU unter Volllast halten, ist es sehr wahrscheinlich das die Temperatur des Kühlwassers um ein paar Grad steigt, was zur Folge hat das sowohl die CPU als auch GPU schlechter gekühlt wird. Auch war die Umgebungstemperatur des Testrechners aufgrund der Jahreszeit relativ niedrig. Im Hochsommer sollte durch die weitaus höhere Umgebungstemperatur ebenfalls eine Temperaturerhöhung des Gehäuseinneren als auch des Wasserkreislaufes stattnden. Dennoch sollte die Temperatur der ◦ ◦ CPU aufgrund der Reserve von 24 C auch unter ungünstigsten Verhältnissen die 70 C nicht überschreiten. Abschlieÿend kann gesagt werden, dass die CPU ohne Probleme die Taktung von ca. 1995 MHz ohne erwähnenswerte Verkürzung der Lebenszeit hinnimmt, da die Temperatur sich ◦ nur 4 C über der des Betriebes im Normalzustand bendet und sich die Betriebsspannung noch im Bereich der Spezikationen für einen Thoroughbred hält. Ferner würde ein Luftgekühlter AMD Athlon XP 1700+ im nicht übertakteten Zustand im Regelfall eine höhere Temperatur aufweisen, als der in diesem Versuch übertaktete Prozessor, welcher Wassergekühlt ist. So gesehen könnte man sogar folgende plakative Behauptung aufstel- Die in diesem Versuch wassergekühlte CPU hat im übertakteten Zustand von ca. 500 MHz eine höhere Lebenserwartung als eine identische luftgekühlte CPU im Normalbetrieb. len: 3.2.6 Durchführung (Versuchsziel 2) Der FSB wurde auf einen tatsächlichen Takt von 166 MHz, die VCore auf 1,65V und der Multiplikator der CPU auf den Wert 12,5 eingestellt. Nun wurde nach folgendem Ablauf vorgegangen: Thomas Winkler, Matthias Lübben 34 RST-L WS06/07 Overclocking x86 Abbildung 3.10: Schema für Versuchsziel 2 Der maximale Wert für den FSB entspricht 171 MHz, falls nicht vorher schon das ENDE erreicht wird. BOOT: Bootet der Rechner ordnungsgemäÿ und wird Windows fehlerfrei gestartet? TEST: Fehlerfreie Ausführung von CPU Burn-in über einen Zeitraum von 1h? ◦ TEMP: Temperatur der CPU nach/während TEST laut MBM Logdatei unter 70 C? VCORE: VCore auf nächst möglichen Wert erhöhen, solange ein Wert von 1,725V nicht überschritten wird. Thomas Winkler, Matthias Lübben 35 RST-L WS06/07 Overclocking x86 3.2.7 Ergebnisse (Versuchsziel 2) Abbildung 3.11: Ergebnisse von Versuchsziel 2 Nachdem man die Versorgungsspannung um weitere 75mV erhöhte, wurde auch die erste Hälfte des zweiten Versuchziels von 2083 MHz erreicht. Auf 2133 MHz zu takten war leider nicht mehr möglich, da die selbstdenierte Maximalspannung für die CPU erreicht war. Da aber schon 2083 MHz als ein Athlon XP 2600+ gelten, kann man dennoch von einem gelungenen Versuch sprechen. Allerdings ist zu bedenken, dass eine Spannung von 1,725V sich um 75mV über dem Maximalwert laut Spezikationen von AMD bendet. Verglichen mit der Standardspannung für die verwendete CPU ist der Wert sogar um 125mV höher. Die durchschnittliche Lebenserwartung für einen Thoroughbred liegt laut Angaben von AMD bei 8 - 12 Jahren. Es ist anzunehmen, dass sich durch eine erhöhte Versorgungsspannung der CPU die Lebenserwartung deutlich verkürzen kann. Genaue Werte hierfür zu bestimmen, ist leider unmöglich, da alle Angaben auf Spekulationen beruhen. Schlieÿlich gibt es diese Prozessorreihe erst seit ca. 6 Jahren. Glaubt man den Angaben aus einschlägigen Übertaktungsforen, so soll eine Versorgungsspannung von bis zu 1,8V für diese CPU die Lebenserwartung nicht all zu stark verkürzen. Die VCore aber noch weiter zu erhöhen, nur um auch die 2133 MHz zu erreichen, steht nicht mehr im Verhältnis zwischen Geschwindigkeitszuwachs und Risiko einer Beschädigung, dem die CPU dann ausgesetzt sein könnte. 3.2.8 Langzeittest (Versuchsziel 2) Auf einen Langzeittest wurde aufgrund des Aufwandes im Verhältnis zum Nutzen verzichtet. Die Temperaturverläufe sollten sich mit denen aus dem Langzeittest von Versuchziel ◦ 1 decken, mit den Unterschied, dass jeder Messwert um ca. 5 C höher sein sollte und damit immernoch weit von den Maximalwerten entfernt. Thomas Winkler, Matthias Lübben 36 RST-L WS06/07 Overclocking x86 3.3 Übertaktung der Grakkarte 3.3.1 Vorüberlegungen Das Ziel ist es, die Grakkarte auf die Standardgeschwindigkeit einer GeForce 4 TI4600 zu takten. Um dieses Ziel zu erreichen müsste die GPU um 40 MHz verglichen mit dem Standardtakt dieser Karte laut ASUS übertaktet werden. Der Speicher müsste um 50 MHz tatsächlichen Takt beschleunigt werden, was eine eektive Steigung von 100 MHz bedeuten würde. Prozentual würde die GPU der Grakkarte damit um ca. 15% und der Speicher um ca. 18% schneller getaktet sein. Wenn eine Grakkarte zu schnell getaktet ist - also nicht mehr fehlerfrei arbeitet - erkennt man dies an folgenden Punkten: • Systemabsturz / Bluescreen: Die Karte ist wesentlich zu schnell getaktet. • Grakfehler: Häufen sich in Grakanwendungen wie z.B. PC Spielen Pixelfehler, lässt dies auf eine zu schnell getaktete Karte schlieÿen. • Temperatur: Die Temperatur der Grakkarte von GPU und/oder Speicher benden sich überhalb der erlaubten Maximalwerte. 3.3.2 Durchführung Die CPU wurde auf ihren eigentlichen Takt zurückgesetzt. Nun folgte die schrittweise Übertaktung der Grakkarte nach folgendem Schema: Thomas Winkler, Matthias Lübben 37 RST-L WS06/07 Overclocking x86 Abbildung 3.12: Schema zur Übertaktung der Grakkarte Der Takt der GPU und des Speichers wurde in folgenden Schritten erhöht: Schritt Nr. GPU Speicher 1 260 MHz 275 MHz 2 270 MHz 285 MHz 3 280 MHz 295 MHz 4 290 MHz 305 MHz 5 295 MHz 315 MHz 6 300 MHz 325 MHz Tabelle 3.1: Übertaktungsschritte TEST: Das Programm 3D Mark 2001 wird dreimal nacheinander ausgeführt und es wird geprüft, ob keine sichtbaren Grakfehler oder Systemabstürze auftreten. TEMP: Die Temperatur wird mittels SmartDoctor überwacht. Das Programm wurde so ◦ eingestellt, dass es einen Alarm auslöst, wenn die GPU über 70 C und der Speicher über ◦ ◦ 55 C warm wird. Diese Werte sind jeweils 20 C vom erlaubten Maximalwert entfernt und bieten genug Spielraum. Die eigentliche Abfrage ist nun: Wird der Alarm während des TESTs nicht ausgelöst? Thomas Winkler, Matthias Lübben 38 RST-L WS06/07 Overclocking x86 3.3.3 Ergebnisse Die Grakkarte lief in allen Testschritten stabil. Auch die Temperatur erreichte nicht die Alarmwerte. Sichtbare Grakfehler wurden ebenfalls keine festgestellt. 3.4 Abschlieÿender Langzeitgesamttest In diesen abschlieÿenden Test wurde geprüft ob die Wasserkühlung genug Abwärme von CPU und GPU kompensieren kann, wenn sich beide unter Vollast als auch im Dauerbetrieb benden. Für den Test wurden Grakkarte und CPU mit den maximal erzielten Ergebnissen getaktet und der Testrechner 72h ohne Unterbrechung betrieben. Während dieses Zeitrahmens wurden verschiedene alltägliche Anwendungen ausgeführt, welchen der Rechner auch unter realen Bedingungen ausgesetzt wäre. Zum einen wurde das Computerspiel World Of Warcraft über 6 Stunden am Stück gespielt. Dieses Spiel eignet sich besonders gut zum Testen, da nicht nur die Grakkarte sondern auch die CPU stark belastet werden. Ferner wurden weitere Spiele wie Quake 3 oder Warcraft 3 über einen gewissen Zeitraum gespielt. ◦ Die Temperatur der CPU stieg während des gesamten Tests nicht über 52 C. Die Gehäu- ◦ ◦ setemperatur lag konstant zwischen 20 C und 22 C. Die GPU wurde nicht wärmer als ◦ ◦ 60 C und der Speicher der Grakkarte überschritt nicht einen Wert von 55 C. Auch bei hohen Auÿentemperaturen sollten die jeweiligen kritischen Temperaturwerte der Komponenten nicht erreicht werden, so dass man sagen kann, dass der Testrechner unter allen üblichen Umgebungsbedinungen fehlerfrei funktionieren sollte. Thomas Winkler, Matthias Lübben 39 RST-L WS06/07 Overclocking x86 4 Benchmark 4.1 Einleitung Nachdem eine Messung deniert wurde, ist sie mit dem entsprechenden Werkzeug mehrmals durchgeführt worden um Messreihen zu erhalten. Anschlieÿend worden die Messreihen tabellarisch dargestellt und ausgewertet. Für die Auswertung wurden aus den Messreihen Mittelwerte gebildet, die mit einander verglichen und interpretiert wurden. 4.2 Audio Encoding Der Bechnmark richtet sich gezielt an die CPU. Die Grakkarte spielt eine zu vernachlässigende Rolle. Insgesamt wurden drei Messreihen mit jeweils 20 Durchläufen, aus denen anschlieÿend Mittelwerte gebildet wurden, aufgenommen. 4.2.1 Benchmark Beschreibung Für diesen Benchmark wurde das Programm lame 3.97 [19] verwendet. Das Programm ist in der Lage, Audio-Daten in das MP3-Format zu konvertieren. Eine inverse Transformation ist auch möglich, jedoch nur unter Verlust von Daten. Dies liegt daran, dass die MP3-Komprimierung ein verlustbehaftetes Verfahren ist. Dieser Benchmark misst die Zeit, die lame benötigt, um eine WAV-Datei (44,1 kHz; 16bit; Stereo; 3:26) mit einer Gröÿe von 38,1 MB (40.017.920 Bytes) in eine MP3-Datei (44,1 kHz; 128 kbps; j-stereo; MPEG-1 Layer 3) zu konvertieren. • Messreihe 1: CPU mit Athlon XP 1700+ Taktung (1463 MHz) • Messreihe 2: CPU mit Athlon XP 2400+ Taktung (1992 MHz) • Messreihe 3: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz) Thomas Winkler, Matthias Lübben 40 RST-L WS06/07 Overclocking x86 Die Benchmarks wurden mit dem Programm zess wurde über den Befehl Prozess Benchmark lame.exe test.wav durchgeführt. Der Pro- gestartet. 4.2.2 Benchmark Messwerte Messreihe 1: CPU mit Athlon XP 1700+ Taktung (1463 MHz) Messung Kernelzeit [s] Userzeit [s] CPU-Zeit [s] reale Zeit [s] 1 0,140 21,625 21,765 23,047 2 0,234 21,828 22,062 23,140 3 0,250 22,031 22,281 23,015 4 0,203 22,171 22,374 22,906 5 0,187 21,750 21,937 23,125 6 0,156 21,375 21,531 23,437 7 0,218 21,343 21,561 23,687 8 0,171 21,531 21,702 23,937 9 0,109 22,062 22,171 24,328 10 0,156 22,140 22,296 24,531 11 0,171 22,250 22,421 24,843 12 0,171 22,203 22,374 24,781 13 0,093 22,328 22,421 24,718 14 0,125 22,484 22,609 24,781 15 0,187 22,296 22,483 24,859 16 0,234 21,068 22,202 24,734 17 0,171 22,078 22,449 24,828 18 0,156 22,218 22,374 24,828 19 0,343 22,093 22,436 24,781 20 0,203 22,234 22,437 24,843 ø 0,184 22,000 22,184 24,157 Tabelle 4.1: Athlon XP 1700+ Taktung (1463 MHz) Thomas Winkler, Matthias Lübben 41 RST-L WS06/07 Overclocking x86 Messreihe 2: CPU mit Athlon XP 2400+ Taktung (1992 MHz) Messung Kernelzeit [s] Userzeit [s] CPU-Zeit [s] reale Zeit [s] 1 0,109 15,812 15,921 16,313 2 0,109 15,953 16,062 16,360 3 0,203 15,906 16,109 16,485 4 0,234 15,984 16,218 16,594 5 0,140 16,140 16,280 16,688 6 0,171 16,265 16,436 16,992 7 0,203 15,265 15,468 16,953 8 0,093 15,484 15,577 17,141 9 0,093 15,609 15,702 17,266 10 0,156 15,750 15,906 17,438 11 0,109 15,859 15,968 17,547 12 0,140 15,937 16,077 17,578 13 0,125 15,921 16,046 17,453 14 0,109 15,921 16,030 17,594 15 0,078 15,828 15,906 17,453 16 0,171 15,875 16,046 17,610 17 0,140 15,890 16,030 17,416 18 0,140 15,890 16,030 17,563 19 0,156 15,812 15,968 17,516 20 0,078 15,796 15,874 17,485 ø 0,138 15,845 15,983 17,174 Tabelle 4.2: CPU mit Athlon XP 2400+ Taktung (1992 MHz) Thomas Winkler, Matthias Lübben 42 RST-L WS06/07 Overclocking x86 Messreihe 3: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz) Messung Kernelzeit [s] Userzeit [s] CPU-Zeit [s] reale Zeit [s] 1 0,156 15,125 15,281 16,172 2 0,109 15,234 16,343 16,672 3 0,187 15,281 16,468 16,812 4 0,203 15,265 16,468 16,859 5 0,140 16,562 16,702 16,093 6 0,218 16,593 16,811 16,172 7 0,156 15,859 15,015 16,281 8 0,281 15,734 15,015 17,437 9 0,171 15,093 15,264 17,718 10 0,234 15,000 15,234 17,657 11 0,203 15,109 15,312 17,735 12 0,265 15,031 16,296 17,891 13 0,125 15,109 16,234 17,766 14 0,203 15,203 16,406 17,797 15 0,171 15,140 15,311 17,813 16 0,140 15,296 16,436 17,922 17 0,218 15,140 16,358 17,907 18 0,109 15,218 16,327 17,813 19 0,125 15,156 15,281 17,828 20 0,093 15,234 15,327 17,735 ø 0,175 15,169 15,344 16,504 Tabelle 4.3: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz) 4.2.3 Benchmark Auswertung In Messreihe 1 (Tabelle 4.1) betrug der Prozessor Takt 1463 MHz und in Messreihe 2 (Tabelle 4.2) 1992 MHz. Daraus ergibt sich ein Quotient von 1, 43 1992 1463 = 1, 36 sowie 2087,5 1463 = für den Takt von 2087,5 MHz aus Messreihe 3 (Tabelle 4.3). Die Auswertung der Messdaten soll zeigen, ob sich das folgende erwartete Verhalten einstellt. Annahme: Dieses Verhätnis besteht auch in etwa zwischen den gemessenen Zeiten. Um die Werte für das tatsächliche Zeitverhältnis mit denen der obigen Geschwindigkeitsverhältnissen zu vergleichen, wurden sie wie folgt berechnet: Zeit V ergleichswert = 1 + (1 − ( U rsprungszeit )) = 2 − Thomas Winkler, Matthias Lübben Zeit U rsprungszeit 43 RST-L WS06/07 Overclocking x86 Auswertung der CPU Leistung FSB MP MHz Taktv. Zeit(ø) Zeitv. Vergleichswert 133 MHz 11,0 1463 MHz - 22,184s - - 166 MHz 12,0 1992 MHz 1,36 15,983s 0,72 1,28 167 MHz 12,5 2087,5 MHz 1,43 15,344s 0,69 1,31 Tabelle 4.4: Lame Auswertung CPU Zeit Auswertung der tatsächlichen Leistung FSB MP MHz Taktv. Zeit(ø) Zeitv. Vergleichswert 133 MHz 11,0 1463 MHz - 24,157s - - 166 MHz 12,0 1992 MHz 1,36 17,174s 0,71 1,29 167 MHz 12,5 2087,5 MHz 1,43 16,504s 0,68 1,32 Tabelle 4.5: Lame Auswertung tatsächliche Zeit Die gemachte Annahme konnte also nur teilweise bestätigt werden. Tatsächlich ist der ausgeführte Prozess relativ zum Takt langsamer gewesen. Der Grund für dieses Phänomen ist, dass nur die Takt-Geschwindigkeit des Prozessors verändert wurde. Alle anderen Komponenten haben ihre ürsprüngliche Taktung beibehalten. Dies gilt sowohl für Speicher als auch für Festplatten und alle weiteren Erweiterungskarten des Systems. Es gibt aber auch Situationen, in denen die Erhöhung des Prozessor-Taktes die Ausführungsgeschwindigkeit eines Programmes positiv beeinussen kann, die aber mehr Betriebssystem technisch bedingt sind und von dem Design der laufenden Programme abhängt. So stehen einem Prozess mehr Zeitscheiben des Prozessors zur Verfügung, wenn die anderen Prozesse zeitgesteuert programmiert wurden, indem sie entweder Gebrauch von Timern machen oder die Sleep() Funktion benutzen. Auch die Verwendung von WM- TIMER -Nachrichten zählt hierzu. Ein Beispiel könnte wie folgt aussehen: ... VOID CALLBACK TimerProc(HWND hwnd, UINT uMsg, UINT_PTR idEvent, DWORD dwTime) { CheckSomethingImportant(); } VOID InstallTimer() { Thomas Winkler, Matthias Lübben 44 RST-L WS06/07 Overclocking x86 SetTimer(NULL, 0, 1000, TimerProc); } ... ... while (TRUE) { CheckSomethingImportant(); Sleep(1000); } ... Der Zeitunterschied entsteht nun dadurch, dass die Prozesse, die diese Methoden verwenden, sich länger im Zustand sleeping benden und dadurch für den lame Prozess mehr Zeitscheiben zur Verfügung stehen und sich dadurch die Laufzeit des Prozesses verringert. 4.3 Video Encoding Der Benchnmark richtet sich wie schon der Audio Encoding Benchmark in Abschnitt 4.2, gezielt an die CPU. Die Grakkarte spielt eine zu vernachlässigende Rolle. Insgesamt wurden drei Messreihen mit jeweils 10 Messwerten aufgenommen, aus denen anschlieÿend Mittelwerte gebildet wurden. 4.3.1 Bennchmark Beschreibung Der zweite Benchmark wird mit dem Programm mpeg SVN-r7215 [20] durchgeführt. Dieses Mal sollen die Ergebnisse veriziert werden, die durch den Benchmark mit lame erarbeitet wurden. Es wurden jedoch nur 10 Messwerte aufgezeichnet, da die Programmlaufzeit von mpeg Das Programm ungefähr dreimal länger ist als bei mpeg lame ). wird dazu verwendet, um Videostreams von einem Format, z.B. MPEG2 in ein anderes Format z.B. MPEG4 zu konvertieren. Mit der Linux-Variante lassen sich auch Echtzeit-Quellen, die über eine V4L2-Treiber verfügen (z.B. TV-Karten oder Webcams) als Eingabestrom verwenden. Für diesen Benchmark wird als Eingangsquelle eine Datei verwendet, um die Bedingungen unter denen das Programm gestartet wird, konstant zu halten. Die Funktionalität von tionalität von mpeg ist daher also ähnlich der Funk- lame. Einüsse, die durch das Betriebsystem entstehen, werden durch die Prozess Benchmark eleminiert. Benutzung des Programms Thomas Winkler, Matthias Lübben 45 RST-L WS06/07 Overclocking x86 Für die Aufzeichnung der Messung wird ein MPEG1-Video (Video: 352x288, 1150kbps; Audio: 44,1kHz, 224kbps, Stereo, MPEG1 layer 2) mit einer Gröÿe von 70,6 MB (74.085.692 Bytes) verwendet. Der Prozess wurde mit folgendem Befehl durch Prozess Benchmark ffmpeg.exe -i test.mpg -y test.avi gestartet. Als Ausgabe erzeugt das Programm eine MPEG4-Video Datei die als Container das AVI-Format benutzt. Als Ausgabeparamter werden die Standardeinstellungen des Programms verwendet. 4.3.2 Benchmark Messwerte Messreihe 1: CPU mit Athlon XP 1700+ Taktung (1463 MHz) Messung Kernelzeit [s] Userzeit [s] CPU-Zeit [s] reale Zeit [s] 1 1,093 56,718 57,811 60,859 2 1,437 57,000 58,437 60,906 3 1,375 57,515 58,890 61,218 4 1,281 58,296 59,577 61,906 5 1,125 55,109 56,234 62,781 6 1,078 55,640 56,718 62,968 7 1,062 56,531 57,593 63,828 8 1,125 56,796 57,921 64,422 9 1,093 57,437 58,530 65,187 10 1,156 58,328 59,484 66,203 ø 1,183 56,937 58,120 63,028 Tabelle 4.6: CPU mit Athlon XP 1700+ Taktung (1463 MHz) Thomas Winkler, Matthias Lübben 46 RST-L WS06/07 Overclocking x86 Messreihe 2: CPU mit Athlon XP 2400+ Taktung (1992 MHz) Messung Kernelzeit [s] Userzeit [s] CPU-Zeit [s] reale Zeit [s] 1 0,921 43,296 44,217 46,516 2 1,109 43,343 44,452 45,906 3 1,187 43,546 44,733 46,468 4 0,796 44,078 44,874 46,406 5 0,859 42,656 43,515 45,125 6 0,734 44,375 45,109 46,984 7 0,609 42,531 43,140 47,422 8 0,750 42,375 43,125 47,672 9 0,687 42,406 43,093 47,968 10 0,671 43,281 43,952 48,625 ø 0,832 43,189 44,021 46,909 Tabelle 4.7: CPU mit Athlon XP 2400+ Taktung (1992 MHz) Messreihe 3: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz) Messung Kernelzeit [s] Userzeit [s] CPU-Zeit [s] reale Zeit [s] 1 0,640 41,953 42,593 44,719 2 1,734 41,750 42,484 45,078 3 1,750 42,437 43,187 44,719 4 0,609 42,468 43,077 44,985 5 0,687 42,953 43,640 45,235 6 0,968 42,937 43,905 45,438 7 0,765 43,000 43,765 45,813 8 0,718 41,031 41,749 46,172 9 0,531 41,390 41,921 46,438 10 0,906 40,718 41,624 52,297 ø 0,731 42,064 42,795 46,089 Tabelle 4.8: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz) 4.3.3 Benchmark Auswertung Für die weitere Auswertung wurden zunächst einmal dieselben Berechnungen für die Verhältnisse wie im Benchmark von lame durchgeführt und in folgender Tabelle festge- halten: Thomas Winkler, Matthias Lübben 47 RST-L WS06/07 Overclocking x86 Auswertung der CPU Geschwindigkeit FSB MP MHz Taktv. Zeit(ø) Zeitv. Vergleichswert 133 MHz 11,0 1463 MHz - 58,120s - - 166 MHz 12,0 1992 MHz 1,36 44,021s 0,76 1,24 167 MHz 12,5 2087,5 MHz 1,43 42,795s 0,74 1,26 Tabelle 4.9: FFmpeg Auswertung CPU Zeit Auswertung der tatsächlichen Geschwindigkeit FSB MP MHz Taktv. Zeit(ø) Zeitv. Vergleichswert 133 MHz 11,0 1463 MHz - 63,028s - - 166 MHz 12,0 1992 MHz 1,36 46,909s 0,74 1,26 167 MHz 12,5 2087,5 MHz 1,43 46,089s 0,73 1,27 Tabelle 4.10: FFmpeg Auswertung tatsächliche Zeit Es ist erfreulich zu sehen, dass sich die Annahme bestätigt, dass sich die Messungen von lame und mpeg ähnlich verhalten. Es ist wieder zu sehen, dass das Prozessorzeitverhältnis geringer ist als das Verhältnis der realen Ausführungszeit der beiden Prozesse. Dies spricht für die im vorherigen Kapitel angesprochenden Gründe. Auällig hingegen ist jedoch, dass bei mpeg die Geschwindigkeitssteigerung geringer ist als bei lame. Auch hierfür gibt es einige mögliche Gründe: • Weil mpeg Videos (Bild+Ton) konvertiert, benötigt das Programm selber mehr Arbeitsspeicher (Programmgröÿe = 3,456MB) als die Software lame (Programm- gröÿe = 0,2MB), die nur Ton konvertiert. Es ist davon auszugehen, dass häuger Teile aus dem Arbeitsspeicher verdrängt werden (paging) bzw. der komplette Prozess ausgelagert wird (swapping). Wobei swapping aufgrund der Arbeitsspeichergröÿe eher unwahrscheinlich ist. • Da die Algorithmen und Datenstrukturen von mpeg gröÿer sind und daher öfter L1- und L2-Cache misses auftreten und daher öfter Daten aus dem Arbeitsspeicher nachgeladen werden müssen als bei lame, fällt die Geschwindigkeitssteigerung geringer aus. • Es mehr Festplattenzugrie gibt, paging bzw. swapping bedingt, und weil die Eingabedatei mit 70MB um 32,5MB gröÿer ist. Die Übertaktung des Prozessors hat auf die Festplatten Geschwindigkeit keine Auswirkung. Jedoch hat die höhere Taktung Thomas Winkler, Matthias Lübben 48 RST-L WS06/07 Overclocking x86 des FSB einuss auf die Übertragungsgeschwindigkeit zwischen Festplattencontroller und CPU. Die Wartezeit des Festplattencontrolles auf die Daten der Festplatte ist hier jedoch ausschlaggebend. 4.4 3D Mark 2001 Die beiden bisherigen Benchmarks sind sehr rechenintensive Programme gewesen, die hauptsächlich auf Prozessorleistung angewiesen sind. Dieser Benchmark [18] hingegen benötigt die maximale Leistung der CPU als auch die der Grakkarte. Insgesamt wurden 9 Messreihen mit jeweils 3 Durchläufen, aus denen anschlieÿend Mittelwerte gebildet wurden, aufgenommen. 4.4.1 Benchmark Beschreibung Das Programm führt eine Reihe von verschiedenen Grakbenchmarks nacheinander aus und ermittelt aus allen Teilergebnissen eine Punktzahl. Ein Druchlauf dauert um die 6 Minuten und setzt sich aus 16 Einzelbenchmarks zusammen. Umso höher diese Punktzahl ausfällt, umso besser das Ergebniss. Wie genau sich diese Punktzahl zusammensetzt, läÿt sich leider nicht klären, da der Hersteller sich darüber ausschweigt. Das Programm verfügt über die Möglichkeit, die erreichte Punktzahl auf die Herstellerseite zu laden und dort mit anderen Rechnern zu vergleichen. Leider ist diese Funktion nicht mehr verwendbar, da der Support als auch die zugehörige Datenbank für diesen Benchmark aufgrund des Alters eingestellt worden ist. Thomas Winkler, Matthias Lübben 49 RST-L WS06/07 Overclocking x86 4.4.2 Benchmark Messwerte und Auswertung Tabelle 4.11: Messwerte mit Auswertung 3D Mark 2001 Eine Recherche mit der Suchmaschine Google hat aber einige Ergebnisse in Foren ans Ta- geslicht gebracht. Ähnliche Kongurationen erzielten dabei annährend identische Werte. Ein Vergleich ist allerdings nicht möglich, da es immer eine Komponente gab die Unterschiedlich war. Die Quellen sind auÿerdem äuÿert fragwürdig, aufgrund der Tatsache, dass es sich um Diskussionsforenbeiträge handelt, in welchen jeder Verfasser natürlich möglichst viele Punkte mit seinen Rechner erhalten möchte. • Athlon XP 1800+, 256 MB DDR-CL2, Aopen Aeolus TI 4200 128 MB, 8734 Punkte http://www.chip.de/c1_forum/thread.html?bwthreadid=237159&bwpage=8&bwsortorder= ascending • Athlon XP 2400+, Geforce 4 Ti 4800SE, 512MB Infeon DDR333, 12048 Punkte http://www.chip.de/c1_forum/thread.html?bwthreadid=345449 • http://www. tweakpc.de/forum/benchmarks/231-3d-mark-2001-se-viel-punkte-18.html Athlon XP 2400+, Sapphire 9500, 3x512MB DDR333, 11590 Punkte Ergebnisse für ein Athlon XP 1700+ sind sehr schwer zu nden, da diese Systeme meistens übertaktet wurden. Thomas Winkler, Matthias Lübben 50 RST-L WS06/07 Overclocking x86 5 Fazit Aus der Versuchsduchführung und den zugehörigen Benchmarks läÿt sich ein Leistungsgewinn zwischen β = 1, 25 und β = 1, 32 im alltäglichen Betrieb erkennen. Die Tem- peraturentwicklungen der übertakteten Komponenten waren dabei nicht bedenklich und lagen verglichen mit einer Luftkühlung selbiger im normalen Temperaturbereich. Das Ergebnis ist eine erhebliche Steigerung der Leistung ohne einen erhöhten Kostenoder gröÿeren Arbeitsaufwand. Dies stimmt allerdings nur unter der Bedingung, dass man die zur Verfügung stehende Wasserkühlung nicht extra für den Zweck der Übertaktung kauft, sondern diese aus anderen Gründen wie z.B. der Verminderung der Geräuschentwicklung bereits verwendet. Denn die Komponenten einer Wasserkühlung kosten weitaus mehr als eine entsprechend schnellere Hardware. Thomas Winkler, Matthias Lübben 51 RST-L WS06/07 Overclocking x86 6 Begrie ATA Siehe ATAPI ATAPI Advanced Technology Attachment with Packet Interface AGP Accelerated Graphics Port BGA Ball Grid Array BIOS Basic Input Output System C.O.P. CPU Overheating Protection CPU Central Processing Unit DDR Double Data Rate DMA Direct Memory Access FSB Front Side Bus GNU GNU's Not Unix GPL General Public License GPU Graphics Processing Unit LAME LAME Ain't an MP3 Encoder MBM Motherboard Monitor MIPS Million Instructions per Second MPEG Motion Pictures Expert Group OPN Ordering Part Number PCI Peripheral Component Interconnect RAID Redundant Array of Inexpensive Disks RAM Random Access Memory SFS Stepless Frequency Selection TSOP Thin Small Outline Package Thomas Winkler, Matthias Lübben 52 RST-L WS06/07 Overclocking x86 Literaturverzeichnis [1] Datenblatt: LFx1512E http://www.smartcooler.de/proddata/PDD-LFx1512E.htm [2] Datenblatt: CPU http://www.bytes-and-more.de/tech/amd_athlon_tech.htm [3] Datenblatt: Motherboard http://de.asus.com/products.aspx?l1=3&l2=13&l3=56&model= 217&modelmenu=2 [4] Datenblatt: Grakkarte http://dlsvr01.asus.com/pub/ASUS/vga/agp/v8420dex/e1145_ v8460.pdf [5] Datenblatt: Eheim 1048 http://www.eheim.com/universal.htm [6] Informationen: CPU http://de.wikipedia.org/wiki/Athlon_XP [7] Informationen: Motherboard http://www.computerbase.de/artikel/hardware/mainboards/ 2004/test_asus_a7n8x-e_w-lan-edition/1/ [8] Informationen: Grakkarte http://www.hardwareluxx.de/cgi-bin/ubb/ultimatebb.cgi?ubb= get_topic&f=2&t=000014 [9] Informationen: Ordering Part Number (OPN) http://de.wikipedia.org/wiki/Ordering_Part_Number_von_AMD_ CPUs#Aufbau_der_OPN_f.C3.BCr_Slot-A-CPUs und Thomas Winkler, Matthias Lübben 53 RST-L WS06/07 Overclocking x86 http://www.athlon.de/showthread.php?t=50677 [10] Informationen: QuantiSpeed-Rating http://de.wikipedia.org/wiki/QuantiSpeed#Quantispeed-Rating [11] Informationen: DDR-SDRAM http://de.wikipedia.org/wiki/DDR-SDRAM [12] Informationen: Stepping http://www.wikipedia.de/Stepping [13] Informationen: Stepping Gerüchte http://www.teccentral.de/artikel/artikeldrucken_192.html [14] Software Link: ASUS SmartDoctor http://dlsvr01.asus.com/pub/ASUS/vga/nVidia/Utility/ SmartDoc464.zip [15] Software Link: Motherboard Monitor http://www.zdnet.de/downloads/prg/m/w/de0AMW-wc.html [16] Software Link: CPU Burn-in http://users.bigpond.net.au/cpuburn/ [17] Software Link: RivaTuner http://www.3dcenter.de/downloads/rivatuner.php [18] Software Link: 3DMark2001 http://www.futuremark.com/download/?3dmark2001.shtml [19] Software Link: Lame 3.97 http://lame.sourceforge.net/index.php [20] Software Link: FFmpeg SVN-r7215 http://arrozcru.no-ip.org/ffmpeg_builds/ [21] Software Link: Trolltech's QT 4.2 http://www.trolltech.de/ Thomas Winkler, Matthias Lübben 54 RST-L WS06/07 Overclocking x86 Abbildungsverzeichnis 2.1 AMD Athlon XP (T-Bred B-Variante) . . . . . . . . . . . . . . . . . . . . 6 2.2 Bild der OPN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 ASUS A7N8X-E Deluxe 2.4 ASUS V8420 Deluxe 2.5 2.6 Eheim 1048 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.7 RADI Dual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.8 Tank-O-Matic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.9 innovaFlatFlow-O-Matic und Graph-O-Matic 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Wasserkühlung im eingebautem Zustand . . . . . . . . . . . . . . . . . . . 16 . . . . . . . . . . . . . . . . 19 . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.1 Prozess Benchmark . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.2 Klassendiagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.3 ASUS SmartDoctor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.4 CPU Burn-in . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.5 RivaTuner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.6 Schema für Versuchsziel 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.7 Ergebnisse von Versuchziel 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.8 Temperaturverlauf unter Vollast . . . . . . . . . . . . . . . . . . . . . . . . 32 3.9 Temperaturverlauf unter Normallast . . . . . . . . . . . . . . . . . . . . . 33 . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.10 Rechner mit Lüftersteuerung 3.10 Schema für Versuchsziel 2 3.11 Ergebnisse von Versuchsziel 2 . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.12 Schema zur Übertaktung der Grakkarte . . . . . . . . . . . . . . . . . . . 38 Thomas Winkler, Matthias Lübben 55 RST-L WS06/07 Overclocking x86 Tabellenverzeichnis 1.1 Systemumgebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.1 Prozessor Varianten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 OPN Bedeutung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.3 Code Entschlüsselung 2.4 Spezikationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.5 Vergleich ASUS VS Referenzdesign . . . . . . . . . . . . . . . . . . . . . . 14 2.6 Lüfterdetails . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.1 Übertaktungsschritte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 4.1 Athlon XP 1700+ Taktung (1463 MHz) . . . . . . . . . . . . . . . . . . . 41 4.2 CPU mit Athlon XP 2400+ Taktung (1992 MHz) . . . . . . . . . . . . . . 42 4.3 CPU mit Athlon XP 2600+ Taktung (2087,5 MHz) . . . . . . . . . . . . . 43 4.4 Lame Auswertung CPU Zeit . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.5 Lame Auswertung tatsächliche Zeit . . . . . . . . . . . . . . . . . . . . . . 44 4.6 CPU mit Athlon XP 1700+ Taktung (1463 MHz) . . . . . . . . . . . . . . 46 4.7 CPU mit Athlon XP 2400+ Taktung (1992 MHz) . . . . . . . . . . . . . . 47 4.8 CPU mit Athlon XP 2600+ Taktung (2087,5 MHz) . . . . . . . . . . . . . 47 4.9 FFmpeg Auswertung CPU Zeit 48 . . . . . . . . . . . . . . . . . . . . . . . . 4.10 FFmpeg Auswertung tatsächliche Zeit . . . . . . . . . . . . . . . . . . . . 48 4.11 Messwerte mit Auswertung 3D Mark 2001 . . . . . . . . . . . . . . . . . . 50 Thomas Winkler, Matthias Lübben 56