Overclocking x86

Transcrição

Overclocking x86
RST-L WS06/07
Overclocking x86
Version 1.2
20.02.2007
Thomas Winkler 100765 <[email protected]>
Matthias Lübben 96342 <[email protected]>
Abstrakt
Dieser Bericht, der im Rahmen der Veranstaltung Rechnerstrukturen-Labor
erstellt wurde, soll die Auswirkungen bezüglich Leistungszuwachs,
Lebenserwartung und Temperaturentwicklung aufgrund einer Übertaktung eines
Athlon XP Prozessors und einer Asus V8420 Deluxe Grakkarte untersuchen.
Um aussagekräftigere Messergebnisse zu erzielen wurde eine spezielle Benchmark
Software entwickelt, die CPU-Zeiten eines Prozesses ermitteln kann.
RST-L WS06/07
Overclocking x86
Inhaltsverzeichnis
1 Einführung
4
1.1
Systemumgebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.2
Gründe für das Übertakten
4
1.3
Zu berücksichtigende Kriterien
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . .
2 Hardware Komponenten
2.1
Prozessor
4
6
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
2.1.1
Ordering Part Number . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.1.2
Angestrebter Übertaktungswert . . . . . . . . . . . . . . . . . . . .
10
2.2
Hauptplatine
2.3
Grakkarte
2.2.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
Besondere Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . .
11
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
2.3.1
Abweichungen vom Referenzdesign . . . . . . . . . . . . . . . . . .
13
2.3.2
Angestrebter Übertaktungswert . . . . . . . . . . . . . . . . . . . .
14
2.4
Speicher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2.5
Wasserkühlung
16
2.6
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1
Ziel einer Wasserkühlung
. . . . . . . . . . . . . . . . . . . . . . .
16
2.5.2
Aufbau der Wasserkühlung im Testrechner . . . . . . . . . . . . . .
16
2.5.3
Komponenten der Wasserkühlung . . . . . . . . . . . . . . . . . . .
16
Lüftersteuerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
3 Durchführung
3.1
3.2
22
Verwendete Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
3.1.1
Prozess Benchmark . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
3.1.2
ASUS SmartDoctor 4.6.8
. . . . . . . . . . . . . . . . . . . . . . .
24
3.1.3
Motherboard Monitor 5.370 . . . . . . . . . . . . . . . . . . . . . .
25
3.1.4
CPU Burn-in v1.01 . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
3.1.5
RivaTuner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
3.1.6
3D Mark 2001 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
Übertaktung des Prozessors
. . . . . . . . . . . . . . . . . . . . . . . . . .
27
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
3.2.1
Vorüberlegungen
3.2.2
Durchführung (Versuchsziel 1)
3.2.3
Ergebnisse (Versuchsziel 1)
3.2.4
Langzeittest (Versuchsziel 1)
3.2.5
Ergebnisse Langzeittest (Versuchsziel 1)
Thomas Winkler, Matthias Lübben
. . . . . . . . . . . . . . . . . . . .
28
. . . . . . . . . . . . . . . . . . . . . .
30
. . . . . . . . . . . . . . . . . . . . .
30
. . . . . . . . . . . . . . .
31
2
RST-L WS06/07
3.3
3.4
Overclocking x86
3.2.6
Durchführung (Versuchsziel 2)
. . . . . . . . . . . . . . . . . . . .
34
3.2.7
Ergebnisse (Versuchsziel 2)
3.2.8
Langzeittest (Versuchsziel 2)
. . . . . . . . . . . . . . . . . . . . . .
36
. . . . . . . . . . . . . . . . . . . . .
36
Übertaktung der Grakkarte . . . . . . . . . . . . . . . . . . . . . . . . . .
37
3.3.1
Vorüberlegungen
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
3.3.2
Durchführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
3.3.3
Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
Abschlieÿender Langzeitgesamttest
. . . . . . . . . . . . . . . . . . . . . .
4 Benchmark
39
40
4.1
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
4.2
Audio Encoding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
4.2.1
Benchmark Beschreibung
. . . . . . . . . . . . . . . . . . . . . . .
40
4.2.2
Benchmark Messwerte . . . . . . . . . . . . . . . . . . . . . . . . .
41
4.2.3
Benchmark Auswertung
. . . . . . . . . . . . . . . . . . . . . . . .
43
Video Encoding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
4.3.1
Bennchmark Beschreibung . . . . . . . . . . . . . . . . . . . . . . .
45
4.3.2
Benchmark Messwerte . . . . . . . . . . . . . . . . . . . . . . . . .
46
4.3.3
Benchmark Auswertung
4.3
4.4
. . . . . . . . . . . . . . . . . . . . . . . .
47
3D Mark 2001 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
4.4.1
Benchmark Beschreibung
49
4.4.2
Benchmark Messwerte und Auswertung
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
50
5 Fazit
51
6 Begrie
52
Literaturverzeichnis
53
Abbildungsverzeichnis
55
Tabellenverzeichnis
56
Anlagen:
Thomas Winkler, Matthias Lübben
3
RST-L WS06/07
Overclocking x86
1 Einführung
1.1 Systemumgebung
Parameter
Wert
CPU
AMD Athlon XP 1700+ (T-Bred B)
Motherboard
A7N8X-E Deluxe (Revision 2.0)
Speicher
2x512MB PC3200 von MCI Computer
Grakkarte
ASUS V8420 Deluxe (Geforce 4 TI4200)
Festplatte
2x160GB SAMSUNG SP1614N
Betriebssystem
Microsoft Windows XP mit SP2
Kühlung
Wasserkühlung für CPU und GPU + 7 verbaute Lüfter
Tabelle 1.1: Systemumgebung
1.2 Gründe für das Übertakten
Die Erhöhung der Taktraten von CPU und Grakkarte resultiert in einer Leistungserhöhung des Gesamtsystems. Je nach Komponente kann der Performancegewinn erheblich
sein und weit über der Normalleistung liegen, damit kann eine Investition in eine ab
Werk höher getaktete Variante einer Komponente vermieden werden, welche logischerweise mitunter erheblich teurer ausfällt.
1.3 Zu berücksichtigende Kriterien
Übertaktete Systeme können instabil werden und (Rechen-)Fehler produzieren. Diese
äussern sich in einem Systemreboot, abstürzenden Programmen oder ähnlichen Ungereimtheiten. Beim Betreiben von Komponenten auÿerhalb ihrer Spezikationen erlischt
in nahezu allen Fällen die Garantie des Herstellers. Auch die Lebenserwartung der übertakteten Bauteile kann bei nicht ausreichender Kühlung stark sinken. Durch einen höheren Takt und vor allem erhöhte Spannung wird die Elektromigration begünstigt. Die
Thomas Winkler, Matthias Lübben
4
RST-L WS06/07
Overclocking x86
Verlustleistung steigt linear mit dem Takt und exponentiell mit der Spannung. Durch die
erhöhte Verlustleistung ist zum Übertakten meist eine verbesserte Kühlung und gegebenenfalls ein stärkeres Netzteil nötig. Bei Verwendung einer Wasserkühlung gilt aber zu
beachten, dass damit nur einzelne Teile gekühlt werden. Andere Komponenten wie z.B.
die Kondensatoren auf dem Mainboard, welche bei einer konventionellen Luftkühlung
von dem Luftstrom des CPU-Lüfters mitgekühlt werden, können durch das Fehlen dieses
Lüfters sehr warm werden oder sogar überhitzen.
Thomas Winkler, Matthias Lübben
5
RST-L WS06/07
Overclocking x86
2 Hardware Komponenten
2.1 Prozessor
Bei der CPU handelt es sich um einen AMD Athlon XP 1700+ der Modellreihe Thoroughbred (T-Bred) [2] welcher gegen Ende 2002 veröentlich worden ist und den Nachfolger der ersten XP Modellreihe namens Palomino darstellt. Im Jahr 2003 wurde der
T-Bred durch die zwei Modellreihen Thorton und Barton ersetzt. Danach wurde die Weiterentwicklung der AMD Athlon XP Prozessoren zu gunsten der AMD Athlon64 CPUs
eingestellt. Der Prozessor verfügt über die Erweiterungen MMX, Extended 3DNow! und
SSE1. Den Thoroughbred gibt es in den Varianten A und B, welche sich darin unterscheiden, dass die B-Variante über zusätzliche Kupfer-Verbindungsstücke verfügt, um
Interferenz zu reduzieren. Der in diesem Versuch benutze Prozessor gehört der neueren
B-Variante an und sieht laut Originalfoto wie folgt aus:
Abbildung 2.1: AMD Athlon XP (T-Bred B-Variante)
Thomas Winkler, Matthias Lübben
6
RST-L WS06/07
Overclocking x86
Der Thoroughbred ist von AMD in der B-Variante in den folgenden Versionen veröentlicht worden:
FSB
Bezeichnung
Spannung
MHz
Datum
266
1600+
1,6V
1400
Mrz 03
266
1700+
1,5V - 1,6V
1463
Dez 02
266
1800+
1,5V - 1,6V
1533
Dez 02
266
1900+
1,5V - 1,6V
1600
Dez 02
266
2000+
1,6V
1667
Aug 02
266
2100+
1,6V
1733
Dez 02
266
2200+
1,6V
1800
Aug 02
266
2400+
1,65V
1995
Aug 02
266
2600+
1,65V
2133
Aug 02
333
2600+
1,65V
2083
Nov 02
333
2700+
1,65V
2167
Okt 02
333
2800+
1,65V
2250
Okt 02
Tabelle 2.1: Prozessor Varianten
2.1.1 Ordering Part Number
Um sicher zu gehen, dass es sich bei obigen Prozessor wirklich um einen AMD Athlon XP
1700+ handelt, verizierten wir die Daten anhand der OPN (Ordering Part Number) [9].
Die OPN bezeichnet den Prozessor eindeutig und gibt seine Spezikation an. Die OPN
bendet sich ab der T-Bred Modellreihe in Form eines Aufklebers auf der CPU selber.
Folgendes Bild der OPN wurde von der in diesem Versuch verwendeten CPU erstellt:
Abbildung 2.2: Bild der OPN
Folgende Informationen lassen sich anhand dieses Aufklebers über die CPU gewinnen:
Thomas Winkler, Matthias Lübben
7
RST-L WS06/07
Overclocking x86
Bedeutung
Wert laut OPN
TM
Produktbezeichnung:
AMD Athlon
technischen Spezikationen:
AXDA1700DUT3C
Seriennummer:
9727377260723
Stepping mit Herstellungsdatum:
JIUHB 0308WPMW
Erstveröentlichung des Kerns:
1999 AMD
Tabelle 2.2: OPN Bedeutung
Produktbezeichnung
Wie der Name schon sagt wird hier die Produktbezeichnung der CPU angegeben. Bei
TM.
der verwendeten CPU handelt es sich dementsprechend um einen AMD Athlon
technischen Spezikationen
Die technischen Spezikationen bestehen aus insgesamt sieben Informationen über die
CPU. Folgende Tabelle zeigt anhand der Werte der verwendeten CPU, wie der Code
aufzuteilen ist:
Code:
Aufteilung:
AXDA
1700
D
U
T
3
C
1
2
3
4
5
6
7
Tabelle 2.3: Code Entschlüsselung
Im folgendem werden die jeweiligen Bedeutungen der sieben Codeteile und deren Wert
für die verwendete CPU erleutert:
1.
Chiparchitektur:
AXDA
steht für einen Athlon XP Thoroughbred (A/B) Pro-
zessor gefertigt in 0,13µm.
2.
QuantiSpeed-Rating:
Die 4 Ziern stehen für das so genannte QuantiSpeed-
Rating [10]. Dahinter verbirgt sich der theoretische Geschwindigkeitsvergleich zwischen einem AMD Athlon und einem AMD Athlon XP. Der Wert von
1700
steht
für das Modell 1700+ der AMD Athlon XP Reihe. Dies bedeutet, dass diese CPU
theoretisch über die gleiche Geschwindigkeit wie ein (nicht existierender) AMD
Athlon mit genau 1700 MHz verfügt. Diese Angabe ist aber bestenfalls als Richtwert zu deuten und nicht wirklich aussagekräftig, da ein realer Vergleich garnicht
möglich ist. Fälschlicherweise wird oft angenommen, dass die Geschwindigkeit mit
einem Pentium 3/4 von Intel verglichen wird, was aber auf keinen Fall der Wahrheit
entspricht.
Thomas Winkler, Matthias Lübben
8
RST-L WS06/07
Overclocking x86
Aus den bisherigen Informationen läÿt sich bereits erkennen, dass es sich bei der
CPU wirklich um einen AMD Athlon XP 1700+ Thoroughbred handelt.
3.
Gehäusetyp:
Der Code
D
steht für die Bauform OPGA (Organic Pin Grid Array)
und bedarf keiner weiteren Erklärung.
4.
Betriebsspannung (VCore): Die Betriebsspannung der CPU liegt laut dem Code
U
bei 1,60V. Da es dieses Modell wie in Tabelle 2.1 zu sehen auch mit einer VCore
von 1,50V existiert, ist die Spannung dieser CPU eher als schlecht zu beurteilen,
da eine höhere Spannung zu einer höhreren Wärmeentwicklung der CPU führt.
Dieser Sachverhalt wurde bereits in Kapitel 1.3 angesprochen. Auÿerdem sinkt das
Übertaktungspotential durch schrittweiser Anhebung der VCore zum Maximalwert
um 0,1V.
5.
Maximale Temperatur des CPU-Kerns:
laut dem Code
T
Die maximale Chiptemperatur darf
◦
90 C nicht überschreiten. Dieser Maximalwert ist beim späteren
Übertakten sehr wichtig, um sicherzugehen, dass wir die CPU nicht überhitzen und
damit sehr wahrscheinlich beschädigen.
6.
Gröÿe des L2-Cache:
Die Gröÿe des L2-Cache beträgt laut dem Code
3
exakt
256KB.
7.
Maximaler Front Side Bus (FSB):
CPU liegt laut dem Code
C
Der Maximale FSB für den Betrieb der
bei 266 MHz eektivem Takt. Ein anderer Wert war
laut Tabelle 2.1 auch nicht zu erwarten.
Seriennummer
Der Code steht für die Seriennummer dieses Prozessors. Anhand der Seriennummer läÿt
sich die CPU exakt identizieren.
Stepping mit Herstellungsdatum
Die ersten und letzten vier Zeichen des Codes werden als das Stepping [12] bezeichnet.
Diese Daten werden seitens AMD nicht näher dokumentiert. Jedoch ergeben sie Aufschluss über die Qualität des Prozessors auf die jeweilige Übertaktbarkeit. Daher sind
Prozessoren mit bestimmten Steppings bei Overclockern sehr begehrt. Die vier Ziern in
der Mitte beschreiben das Herstellungsdatum. So stehen die ersten zwei Zahlen für das
Jahr, hier also das Jahr 2003. Die nächsten beiden Ziern stehen für die Kalenderwoche
der Herstellung. Der Prozessor wurde somit in der achten Kalenderwoche des Jahres 2003
hergestellt.
Thomas Winkler, Matthias Lübben
9
RST-L WS06/07
Overclocking x86
2.1.2 Angestrebter Übertaktungswert
Der angestrebte Wert ergibt sich aus dem Stepping-Code der CPU. Denn laut dem Internet [13] und einschlägiger Foren, die sich mit dem Thema übertakten beschäftigen, sollen
Prozessoren mit dem JIUHB-WPMW Stepping ohne Probleme mit einer Taktrate von
1995 MHz stabil und fehlerfrei laufen. 1995 MHz entsprechen einem AMD Athlon XP
2400+ Prozessor. Mit entsprechender Kühlung soll es bei einigen CPUs dieser Baureihe
auch möglich sein, Werte über 1995 MHz zu realisieren.
Das angestrebte Ziel ist somit, die CPU soweit zu übertakten, dass sie mit einen Athlon
XP 2400+ und eventuell auch 2600+ vergleichbar ist. Dies würde einem Geschwindigkeitszuwachs von 544 MHz bis 677 MHz entsprechen. Die CPU würde damit um einen
Beschleuningungsfaktor von 1,36 bis 1,45 schneller laufen als eigentlich gedacht, was ein
sehr respektables Ergebnis darstellen würde. Natürlich soll die CPU im übertaktenten
Zustand weiterhin stabil laufen. Und auch die Temperatur soll nicht den von AMD fest-
◦
gelegten Grenzwert von 90 C annähern oder übersteigen.
2.2 Hauptplatine
Das Motherboard [3] und [7] stammt von der Firma ASUS und trägt die Bezeichnung
A7N8X-E Deluxe in der Revision 2.0 und schaut wie folgt aus:
Abbildung 2.3: ASUS A7N8X-E Deluxe
Thomas Winkler, Matthias Lübben
10
RST-L WS06/07
Overclocking x86
Die wichtigsten Spezikationen der Hauptplatine im Überblick:
Parameter
Wert
CPU
Socket A for AMD Athlon XP/Athlon/Duron
(Thoroughbred/Barton Core Support)
Chipsatz
NVIDIA nForce2 Ultra 400
NVIDIA nForce2 MCP-T
Front Side Bus
400/333/266/200 MHz
Memory
3 x 184-pin DIMM Sockets support max. 3GB
PC3200/PC2700/PC2100/PC1600
non-ECC DDR SDRAM memory
Dual Channel Memory Architecture
Expansion Slots
1 x AGP Pro/8X (1.5V only)
5 x PCI
1 x ASUS Wi-Fi slot for optional wireless LAN upgrade
2 x UltraDMA 133/100/66/33
Overclocking Features
ASUS JumperFree
CPU, Memory, and AGP voltage adjustable
Adjustable FSB/DDR ratio, Fixed AGP/PCI frequencies
Back Panel I/O Ports
1 x Parallel
1 x Serial
1 x PS/2 Keyboard
1 x PS/2 Mouse
1 x Audio I/O
2 x RJ45
1 x S/PDIF out
1 x Surround L/R audio jack
1 x CNTR/LFE audio jack
4 x USB 2.0/1.1
Tabelle 2.4: Spezikationen
2.2.1 Besondere Merkmale
Temperaturmessung:
Das A7N8X-E Deluxe liest ab der Revision 2.0 die Temperatur der CPU-Diode aus. Die
vorherige Revision war nur in der Lage die Temperatur am Sockel zu messen, was wesentlich ungenauere Ergebnisse liefert. Ferner erlaubt das Motherboard Fremdprogrammen
den Zugri auf die gemessenen Temperaturen. Auch dies war in der vorherigen Revision nicht möglich, was bedeutete, dass nur das BIOS in der Lage war, die Temperatur
anzuzeigen und zu überwachen. Weiter muÿ berücksichtigt werden, dass ASUS bei vie-
Thomas Winkler, Matthias Lübben
11
RST-L WS06/07
Overclocking x86
◦
◦
len ihrer Hauptplatinenmodelle zu den ausgelesenen Werten 10 C - 15 C addiert, um
sicherzustellen, dass die gemessene Temperatur auf keinen Fall niedriger als die tatsächliche Temperatur ist. Dementsprechend würde es bedeuten das die CPU laut Anzeige ca.
◦
100 C warm werden darf. Für diesen Versuch wurde allerdings festgelegt, dass die CPU
◦
eine ausgelesne Temperatur von 70 C nicht überschreiten darf. Damit wird ausgeschlossen, dass sich die CPU den erlaubten Maximaltemperaturwert auch nur annähert oder
gar überschreitet.
CPU Overheating Protection (C.O.P.):
Das Motherboard ist in der Lage, der CPU automatisch den Strom zu entziehen, falls
diese eine Temperatur erreicht, die den erlaubten Wert überschreitet. C.O.P. schützt die
CPU allerdings erst dann, wenn das komplette BIOS in den Speicher geladen worden ist.
Würde man z.B. den Rechner starten ohne einen Kühler auf der CPU montiert zu haben,
würde auch das C.O.P. versagen und die CPU sehr wahrscheinlich beschädigt werden.
Bei diesen Versuch leistet das C.O.P. im Notfall aber seine Dienste, da die Temperatur
durch den vorhandenen Kühlkörper, inklusive der daran angeschlossenen Wasserkühlung
nur langsam und nicht abrupt ansteigt.
Stepless Frequency Selection (SFS):
Das SFS ermöglicht es, den tatsächlichen Takt (FSB) des Motherboards beliebig in 1 MHz
schritten zwischen 100 MHz und 300 MHz einzustellen. Dies entspricht einem eektiven
Takt des FSB von 200 MHz bis 600 MHz. Wie die SFS die verschiedenen Einstellungen
des FSB realisiert, wird von Seiten des Herstellers nicht näher erläutert.
Ferner ist das Motherboard in der Lage die Taktraten vom AGP-Bus und PCI-Bus konstant zu halten. Das bedeutet, dass egal welche Geschwindigkeit beim FSB gewählt wird,
der AGP/PCI Bus nie über- oder untertaktet wird. Das Verhältnis für die Taktung des
Speichers und des FSB lässt sich variabel einstellen. Dadurch ist es möglich, den Speicher
unabhängig von der Geschwindigkeit des FSB mit einer festen Taktung zu betreiben. Dies
ist wichtig, da eine Änderung der Speichertaktung zu einer Verfälschung der Messwerte
führen würde.
Spannungseinstellungen:
Das Motherboard bietet die Möglichkeit, die Spannungen für den AGP-Bus, den Speicher
und die CPU separat zu variieren. Dies wird benötigt, um die CPU später mit einer
höheren Spannung zu betreiben, was für eine stabile Übertaktung eventuell notwendig
werden könnte.
Thomas Winkler, Matthias Lübben
12
RST-L WS06/07
Overclocking x86
2.3 Grakkarte
Die Grakkarte [4] und [8] stammt wie schon die Hauptplatine von ASUS und trägt den
Namen V8420 Deluxe. Hinter dieser Bezeichnung verbirgt sich eine GeForce 4 Ti4200
mit folgendem Layout:
Abbildung 2.4: ASUS V8420 Deluxe
Die GeForce 4 Ti ist eine direkte Weiterentwicklung der GeForce 3 Ti und war zu ihrer
Zeit für den anspruchsvollen Spieler gedacht. Dagegen basiert die für Einsteiger entwickelte GeForce 4 MX auf einer überarbeiteten NVIDIA GeForce 2, die unter anderem
den verbesserten Speichercontroller des Geforce 4 Ti-Modelles verwendet. Demzufolge
besitzen die GeForce 4 MX keine Pixel- und Vertexshader, sondern nur eine Hardware
T&L-Einheit.
Die Grakkarte trägt den Namen Deluxe, da ASUS erheblich von dem von NVIDIA
vorgegebenen Referenzdesign für das Layout der Karte abweicht:
2.3.1 Abweichungen vom Referenzdesign
Wie folgende Tabelle zeigt, weicht ASUS mit der V8240 Deluxe mit einem um 10 MHz
höheren GPU Takt und einem um ganze 63 MHz höheren Speichertakt vom NVIDIA
vorgegeben Referenzdesing ab:
Thomas Winkler, Matthias Lübben
13
RST-L WS06/07
Overclocking x86
Parameter
Referenzdesign
Asus V8240 Deluxe
GPU:
NV25
NV25
Chiptakt:
250 MHz
260 MHz
Füllrate:
2000 MT/s
2000 MT/s
Speicher:
128 MB
128 MB
Speichertakt:
222 MHz
275 MHz
Speichertyp:
128 Bit DDR
128 Bit DDR
Bandbreite:
7,1 GB/s
7,1 GB/s
Tabelle 2.5: Vergleich ASUS VS Referenzdesign
Ermöglicht wird die schnellere Taktung durch folgende Punkte:
Gehäuseform der Speicherchips
In der Regel wird für die Ti4200 Karten die TSOP (Thin Small Outline Package) Bauform
verwendet, welche schon für die Geforce 3 Serie benutzt wurde. Erst für die Ti4400 und
Ti4600 Karten wurde die Bauform BGA (Ball Grid Array) genutzt. Diese Form ermöglicht gegenüber dem TSOP bessere thermische Eigenschaften und daraus resultierende
höhere Taktfrequenzen. Diese Speicherform benutzt Asus entgegen des Referenzdesigns
für die V8420 Deluxe Grakkarte.
Zugriszeit der Speicherchips und Layout der Grakkarte
Da der Speichertakt von den Ti4200 Karten nach NVIDIA Referenzdesign 250 MHz nicht
überschreitet, betragen die Zugriszeiten der in der Regel verbauten Speicherchips 3,6ns
- 4,0ns. Die auf der V8420 Deluxe verbauten Speicherchips hingegen verfügen über eine
Zugriszeit von 3,3ns und erlauben theoretisch einen Speichertakt von über 300 MHz.
Dies ist allerdings nur dann möglich, wenn die Signalleitungen der verwendeten Karte
die Taktfrequenzen auch umsetzen können. Die V8420 Deluxe von Asus weicht auch hier
vom Referenzdesign mit 6 Schichten (Layer) ab und spendiert der Karte 8 Schichten,
welche eigentlich den Ti4400 und Ti4600 Karten vorbehalten sind. Dadurch ergeben sich
saubere Signalanken, welche Taktfrequenzen von über 300 MHz erlauben.
2.3.2 Angestrebter Übertaktungswert
Durch obige Abweichungen vom Referenzdesign stellt die V8420 Deluxe einen perfekten Kandidaten zur Übertaktung dar. Schon in der Standardtaktung überholt die V8420
Thomas Winkler, Matthias Lübben
14
RST-L WS06/07
Overclocking x86
Deluxe eine Ti4400 um 25 MHZ (50 Mhz DDR) Speichertakt. Rein theoretisch sollte es
möglich sein, bei vernünftiger Kühlung der GPU die V8420 Deluxe auf die Geschwindkeit einer regulären Geforce 4 Ti4600 (Chiptakt: 300 MHz / Speichertakt 325 MHz) zu
takten.
2.4 Speicher
Die beiden im Testrechner verwendeten baugleichen DDR-SDRAM [11] Speicherriegel
mit einer Gröÿe von je 512MB sind vom Hersteller MCI Computer. DDR-SDRAM arbeitet mit beinahe der doppelten Datenrate wie herkömmliche SDRAM Module. Möglich
wird dies durch einen relativ simplen Trick. Die Datenbits werden bei der ab- und aufsteigenden Flanke des Taktsignals übertragen, statt nur bei der aufsteigenden. Damit
das DDR (Double Data Rate) Verfahren zu einer Beschleunigung führt, muss die Anzahl
zusammenhängend angeforderter Daten immer gleich oder gröÿer als die doppelte Busbreite sein. Da das nicht immer der Fall sein kann, ist DDR-SDRAM im Vergleich zu
einfachem SDRAM bei gleichem Takt nicht exakt doppelt so schnell. Ein weiterer Grund
ist, dass Adress- und Steuersignale im Gegensatz zu den Datensignalen nur mit einer
Taktanke gegeben werden.
Der Speicher wird bei allen Versuchsdurchführungen mit einer tatsächlichen Geschwindigkeit von 200 MHz getaktet und bendet sich im Dual Channel betrieb. Im Gegensatz
zum Single-Channel-Modus, bei dem der Datenbus 64 bit breit ist (also 64 Datenleitungen), werden im Dual-Channel-Modus zwei Module gleichzeitig mit 64-Bit Datenbus
betrieben. Da die Taktrate, mit der der Speicher betrieben wird, gleich bleibt, sich die
übertragenen Daten pro Takt jedoch verdoppeln (also 128 Bit pro Takt statt wie bisher 64 Bit), führt der Einsatz des Dual-Channel-Modus theoretisch zur Verdopplung
des Speicherdurchsatzes. So kann der im Testrechner verwendete PC-3200 Speicher im
Single-Channel-Modus ca. 3.2 Gigabyte/sec an Daten zum Speichercontroller transferieren, im Dual-Channel-Modus sind es hingegen ca. 6.4 Gigabyte/sec. Um wie viel sich die
Arbeitsgeschwindigkeit durch den Einsatz von Dual Channel steigert, hängt jedoch von
den benutzten Programmen, den Speicherzugrismustern und der CPU ab, wobei eine
Leistungssteigerung um einen Faktor von ca. 1,05 gegenüber dem Singlechannelbetrieb
laut Erfahrungsberichten erwartet werden kann.
Thomas Winkler, Matthias Lübben
15
RST-L WS06/07
Overclocking x86
2.5 Wasserkühlung
2.5.1 Ziel einer Wasserkühlung
Primäres Ziel der Wasserkühlung in einem PC ist es, die im Rechnergehäuse entstehende Wärme, vor allem von den im Betrieb stark aufheizenden Halbleitern wie z.B.
der CPU oder dem Grakprozessor, so ezient und geräuscharm wie möglich abzuführen. Eine mögliche Leistungssteigerung des Rechners durch den Betrieb auÿerhalb der
Spezikationen ist ein weiteres Einsatzfeld der Wasserkühlung. Die vergleichsweise hohe Wärmekapazität des Kühlmediums Wasser begünstigt die hohe Wärmeaufnahme von
kleinächigen Wärmequellen, wie sie in einem Rechner typisch sind.
2.5.2 Aufbau der Wasserkühlung im Testrechner
Folgendes Foto zeigt die im Testrechner verbaute Wasserkühlung:
Abbildung 2.5: Wasserkühlung im eingebautem Zustand
2.5.3 Komponenten der Wasserkühlung
Die im Testrechner verbaute Wasserkühlung besteht aus folgenden Komponenten:
Thomas Winkler, Matthias Lübben
16
RST-L WS06/07
Overclocking x86
1 - Die Pumpe
Die Pumpe dient dazu das Wasser im Wasserkreislauf zirkulieren zu lassen. Die hier verwendete Pumpe [5] stammt von Eheim und ist urspünglich für den Gebrauch in Teichen
und Aquarien konzipiert worden. Durch die wachsende Beliebtheit von Wassergekühlten
Rechnern wurde der Hersteller Eheim quasi ohne Zutun und über Nacht zum bekanntesten Anbieter für Pumpen im Bereich Wasserkühlung. Folgendes Bild zeigt die im
Testrechner verwendete Eheim 1048 Pumpe:
Technische Daten:
•
Eheim 1048 Kreiselpumpe
•
Pumpenleistung 600 l/h
•
Förderhöhe 1,50 mWs
•
Leistungsaufnahme 10 W
•
Schlauchanschluÿ saugseitig Ø13mm
•
Schlauchanschluÿ druckseitig Ø13mm
Abbildung 2.6: Eheim 1048
2 - Der Radiator
Der Radiator dient dazu, das erwärmte Wasser im Kühlkreislauf abzukühlen. Es gibt
aktive Radiatoren, die den Einsatz von Lüftern zum Kühlen des Wassers benötigen, und
passive Radiatoren, welche das Wasser ohne Belüftung aufgrund ihrer groÿen Fläche, welche die Wärme abführen kann, abkühlen. Aktive Radiatoren sind weitaus platzsparender,
wesentlich leichter und günstiger als die passive Variante. Passive Radiatoren lassen sich
aufgrund ihrer Gröÿe nicht direkt in das Gehäuse einbauen und werden meist von auÿen
an einer der beiden Gehäuseseiten befestigt. Aktive Radiatoren hingegen werden in der
Regel direkt in das Rechnergehäuse integriert. Der Nachteil der aktiven Radiatoren ist der
durch die Lüfter bedingte zusätzliche Energieverbrauch als auch die eventuell hörbaren
Laufgeräusche selbiger.
Der im Testrechner verbaute aktive Radiator stammt von der Firma Innovatek und trägt
die Bezeichnung RADI Dual. Hierbei handelt es sich um einen aktiven Radiator, wel-
Thomas Winkler, Matthias Lübben
17
RST-L WS06/07
Overclocking x86
cher Platz für zwei 120er Lüfter bietet. Der Radiator ist in der Lage, bei entsprechender
Belüftung ca. 700 Watt an Wärmeenergie abzuführen. Folgendes Bild zeigt den im Testrechner verwendeten Radiator:
Abbildung 2.7: RADI Dual
3 - Der Ausgleichsbehälter
Ein Ausgleichsbehälter dient zum Entlüften und einfachen Befüllen der Wasserkühlung
mit destilliertem Wasser. Der im Testrechner verbaute Ausgleichsbehälter stammt von
der Firma Innovatek und trägt die Bezeichnung Tank-O-Matic. Anzumerken ist, dass
dieser Ausgleichsbehälter aufgrund seiner Anbringung an der Auÿenseite des Gehäuses
überdurchschnittlich groÿ ist. Dies hat den Vorteil, dass der Rechner zum Befüllen nicht
geönet werden muÿ. In der Regel werden wesentlich kleinere Ausgleichsbehälter im Gehäuseinneren meist direkt an der Pumpe verbaut. Folgendes Bild zeigt den im Testrechner
verwendeten Ausgleichbehälter (liegend):
Abbildung 2.8: Tank-O-Matic
Thomas Winkler, Matthias Lübben
18
RST-L WS06/07
Overclocking x86
4 - Die Kühlkörper für CPU und GPU
Die Kühlkörper dienen zum Kühlen der CPU/GPU. Anders als bei den herkömmlichen
Modellen mit einem Lüfter ieÿt bei diesen Kühlkörpern Wasser hindurch, was die Verlustleistung der CPU/GPU, die in Wärme umgesetzt wird eektiver abtransportieren
kann als ein Luftgekühlter Kühlkörper. Die im Testrechner verwendeten Kühlkörper
stammen von Innovatek und haben die Bezeichnung innovaFlatFlow-O-Matic rev 1.0
für den CPU Kühler und Graph-O-Matic rev 1.0 für den GPU Kühler. Anzumerken ist,
dass beide Kühler zu einer der ersten in Serie produzierten Kühlkörper für Wasserkühlungen gehören. Heutige Kühler sind weitaus ezienter beim Abführen der entstehenden
Wärme. Das Bild 2.9 zeigt die beiden im Testrechner verwendeten Kühlkörper für CPU
und GPU:
Abbildung 2.9: innovaFlatFlow-O-Matic und Graph-O-Matic
2.6 Lüftersteuerung
Der Versuchsrechner verfügt über insgesamt 7 Lüfter. 6 dieser Lüfter lassen sich Stufenlos
in der Geschwindigkeit über die eingebaute Lüftersteuerung regulieren. Der siebte Lüfter
bendet sich im Netzteil und ist nicht steuerbar.
Lüfterdetails:
Anzahl
Bezeichnung
Durchmesser
Laufgeräusch
Luftleistung
4
SmartCooler LFM1512E
120mm
15dbA
70m /h
2
1
unbekannt
unbekannt
80mm
120mm
unbekannt
unbekannt
3
unbekannt
unbekannt
Tabelle 2.6: Lüfterdetails
Thomas Winkler, Matthias Lübben
19
RST-L WS06/07
Overclocking x86
Das Bild 2.10 zeigt die eingebaute Lüftersteuerung im Versuchsrechner mit den dazugehörigen Lüftern:
Abbildung 2.10: Rechner mit Lüftersteuerung
Zu Nr. 1
Zwei Smart Cooler Lüfter [1] benden sich direkt auf dem Radiator und saugen frische
Luft von der Unterseite des Gehäuses durch den Radiator hinweg in das Gehäuseinnere.
Sie dienen primär zum Kühlen des Wassers im Radiator und sekundär dazu, Frischluft
in das Gehäuse zu blasen.
Zu Nr. 2
Ein Smart Cooler Lüfter bendet sich ganz unten an der Gehäusevorderseite. Er dient
primär dazu, frische Luft in das Gehäuse zu blasen, und sekundär dazu, die beiden sich
dahinter bendenden Festplatten zu kühlen.
Thomas Winkler, Matthias Lübben
20
RST-L WS06/07
Overclocking x86
Zu Nr. 3
Ein weiterer Smart Cooler Lüfter bendet sich auf mittlerer Höhe an der Rückseite
des Gehäuses. Seine Aufgabe besteht darin, die aufgewärmte Luft aus dem Gehäuse zu
saugen.
Zu Nr. 4
Hierbei handelt es sich um zwei No-Name Lüfter mit 80mm Durchmesser, welche beim
Gehäuse dabei waren. Der an der Gehäuseseite bendliche Lüfter bläst frische Luft in
das Gehäuse. Der an der Gehäuseoberseite montierte Lüfter dient zum Absaugen der
aufgewärmten Luft.
Zu Nr. 5
Hierbei handelt es sich um einen No-Name Lüfter mit 120mm Durchmesser, welcher die
aufgewärmte Luft aus dem Rechner bläst und dabei das Netzteil kühlt. Dieser Lüfter ist
nicht an die Lüftersteuerung angeschlossen und läuft konstant mit 12V Betriebsspannung.
Alle Lüfter, welche Luft in das Gehäuse blasen sind mit Staubschutzltern versehen,
um eine Verunreinigung des Gehäuseinneren auf ein Minimum zu beschränken. Für den
gesamten Versuchszeitraum wurden alle Lüfter mit maximaler Drehzahl betrieben, um
die Messergebnisse nicht zu beeinussen.
Thomas Winkler, Matthias Lübben
21
RST-L WS06/07
Overclocking x86
3 Durchführung
3.1 Verwendete Software
3.1.1 Prozess Benchmark
Das Programm Prozess Benchmark ist eine Eigenentwicklung, um den Einuss des Betriebsystems auf die Laufzeit eines Programs oder besser eines Prozesses zu eliminieren.
Diese Thematik wurde bereits in vorangegangen Vorträgen innerhalb der Laborveranstaltung angesprochen. Es ist möglich, für einen einzelnen Prozess festzustellen, wie lange er
die CPU belegt hat.
Abbildung 3.1: Prozess Benchmark
Das Programm verwendet zum Ermitteln der Prozess Zeiten die Funktion
GetProcessTimes,
die vom Betriebsystem bereitgestellt wird. Diese Funktion ist ab Windows 2000 verfügbar
und ist in der Bibliothek kernel32.dll deniert. Diese Funktion steht jedem Programm
zur Verfügung. Die Funktion ist wie folgt deklariert.
BOOL GetProcessTimes(
HANDLE hProcess,
LPFILETIME lpCreationTime,
Thomas Winkler, Matthias Lübben
22
RST-L WS06/07
Overclocking x86
LPFILETIME lpExitTime,
LPFILETIME lpKernelTime,
LPFILETIME lpUserTime);
Die Oberäche des Programms wurde mit QT 4.2.2 [21] entwickelt, um eine möglichst
einfache Portierung auf Linux basierte Betriebsysteme zu ermöglichen. Unter Linux gibt
es bereits das bash built-in Kommando time, mit dem es möglich ist, die Laufzeit eines
Prozesses zu ermitteln, Daher wurde Process Benchmark auch nur für Windows entwickelt.
Das Programm unterliegt jedoch der Einschränkung, dass es nur für Programme vernüftige Werte liefert, die keine Kindprozesse erzeugen: denn dessen Zeit wird nicht gemessen.
CreateProcess neue Profork neue Kindprozesse. Prozesse, die aus
Unter Windows sind das Programme, die über die Funktion
zesse erzeugen. Linux erzeugt über den syscall
mehreren Threads bestehen, sind jedoch kein Problem.
Das Klassendiagramm in Abbildung 3.2 zeigt die Klassen, die für die Erfassung der
Messwerte verantworlich sind.
Abbildung 3.2: Klassendiagramm
QAbstractTableModel
erbt und daher über die QTableView Klasse auf der GUI angezeigt werden kann. QAbstractTableModel
und QTableView sind Bestandteile des QT Frameworks. Die Aufgabe der Klasse Model
ist es, eine Liste von Record-Klassen zu verwalten und die Daten für die Anzeige aufzu-
Die Messwerte werden in der Klasse
Model
gesammelt, die von
bereiten.
Die Klasse
Record speichert die Werte für eine Messung. Die Dauer des Prozesses totalTime
exitTime - creationTime. Die Prozessorzeit processorTime
wird dabei berechnet aus
Thomas Winkler, Matthias Lübben
23
RST-L WS06/07
Overclocking x86
ergibt sich aus der Summe der im Kernel verbrachten Zeit
die Berechnungen des Prozesses selbst
Die Klasse
Process
userTime.
ist verantwortlich für das Erzeugen des zu beobachtenden Prozes-
ses und aktualisiert alle 250ms die Felder
userTime.
kernelTime sowie der Zeit für
creationTime, exitTime, kernelTime und
started, beim Be-
Diese Klasse löst beim Starten des Prozesses das Signal
finished und nach einer Aktualisierung der eben genannten Felder
updated aus. Die GUI des Programms reagisert auf die Signale durch entspreSlots und aktualisiert darauf hin die Daten in der Klasse Model.
enden des Prozesses
das Signal
chende
Für eine Portierung auf die Linux Plattform ist die Klasse
Process
neu zu entwickeln,
da diese Klasse Plattformspezische Anweisungen enthält. Für eine Portierung lieÿen
sich die C-Funktionen
times
sowie
clock
verwenden, wobei
clock
eher ungeeignet ist,
weil die Funktion die CPU Zeit des eigenen Prozesses zurückgibt. Aus dem Dateisystem
/proc/<pid>/stat
lassen sich die Prozesszeiten ebenfalls ermitteln.
3.1.2 ASUS SmartDoctor 4.6.8
Dieses Tool [14] dient zur Überwachung von Grakkarten der Firma ASUS, wozu auch
die im Testrechner verwendete V8420 Deluxe zählt. Es gibt Auskunft über die Temperatur von GPU und Speicher, Spannungswerte der Grakkarte und die Lüfterdrehzahl.
Auch kann das Programm einen Alarm auslösen, wenn bestimmte Werte wie z.B. die
Temperatur einen denierten Wert überschreiten. Für die GPU ist eine Temperatur von
◦
90 C als Standartwert zur Alarmierung vordeniert. Daraus lässt sich schlieÿen, dass die
◦
Maximaltemperatur der GPU bei ca. 90 C liegt. Der Alarmierungswert für den Speicher
◦
liegt standardmäÿig bei 75 C. Auch hier lässt sich vermuten, dass dies den maximalen
Temperaturwert für den Speicher darstellt. Ferner zeigt das Programm die aktuelle Taktung der GPU und des Speichers der Grakkarte an und bietet beschränkte Möglichkeiten
diese zu modizieren: beschränkt deswegen, weil die Taktung für die GPU maximal auf
275 MHz und für den Speicher auf maximal 600 MHz (eektiver Wert) gestellt werden
kann. Da unsere angestrebten Werte für die Taktung der GPU und des Speichers aber
über diesen Maximalwerten liegen, wurde zur Modizierung der Taktung das Programm
RivaTuner verwendet.
Thomas Winkler, Matthias Lübben
24
RST-L WS06/07
Overclocking x86
Abbildung 3.3: ASUS SmartDoctor
3.1.3 Motherboard Monitor 5.370
Mit dem Programm Motherboard Monitor (MBM) [15] lassen sich die Temperaturwerte
der Sensoren des Mainboards auslesen. Auch Drehzahlen der Lüfter lassen sich ermitteln.
Spannungswerte der Hauptplatine stehen ebenfalls zur Verfügung. Ursprünglich wurde
das Programm von Alexander van Kaam zum Überwachen des Systems entwickelt. Es
läÿt sich aber auch zum Aufzeichnen von Messreihen verwenden. Die Weiterentwicklung
wurde im Juli 2004 eingestellt.
3.1.4 CPU Burn-in v1.01
Das Programm CPU Burn-in [16] ist ein Werkzeug zum Testen der Systemstabilität. Es
erzeugt eine künstliche Volllast des Systems, um Instabilitäten erkennen zu können. Diese
Instabilitäten können z.B. durch die eigene Wärmeentwicklung entstehen. Das Programm
bietet zwei verschiedene Testmodi: einen mit Fehlerprüfung und einen ohne Fehlerprüfung. Beide Modi führen in schneller Folge auf der FPU Gleitkommazahlenoperationen
aus. Die FPU bendet sich auf dem Die der CPU. Da das Programm sehr klein ist,
können sich viele Teile des Programms im Cache benden und dadurch den Durchsatz
der Operationen ebenfalls erhöhen, da auf langwierige Arbeitsspeicher Zugrie verzichtet
werden kann.
Thomas Winkler, Matthias Lübben
25
RST-L WS06/07
Overclocking x86
Abbildung 3.4: CPU Burn-in
Der Modus ohne Fehlerprüfung erzeugt ebenfalls eine Steigerung der Gleitkommaoperationen pro Sekunde, weil die berechneten Ergebnisse nicht veriziert werden. Dies hat zur
Folge, dass eventuell kleine Fehler, bei denen sich nur ein einzelnes Bit verändert, nicht
erkannt werden können. In vielen Fällen ist dies unproblematisch, ein falsch gesetztes
Bit in einem Bild führt zu keinen Systamabsturz. Der Benutzer wird auf diesen Fehler
erst aufmerksam, falls sich ein Bit in einem Treiber ändert und das System zum Absturz
bringt.
3.1.5 RivaTuner
Dieses Tool [17] bietet viele Möglichkeiten zur Modikation des oziellen Treibers für
Grakkarten mit NVIDIA Chipsatz. Für diesen Versuch wurde das Programm allerdings
nur für die Modikation der Taktung der Grakkarte verwendet, weswegen auf den Funktionsumfang, welchen das Tool bietet, nicht näher eingegangen wird.
Abbildung 3.5: RivaTuner
Thomas Winkler, Matthias Lübben
26
RST-L WS06/07
Overclocking x86
3.1.6 3D Mark 2001
Die Benchmark Software
3D Mark 2001
[18] wurde von der Firma Futuremark entwickelt.
Die Entwicklung an der Software ist jedoch eingestellt worden, da es bereits 3 nachfolgende Versionen gibt. Es wurde diese Version von 3D Mark verwendet, da der Testrechner aus
einer Generation stammt, in der die Version noch aktuell war. Das Programm benutzt
eine echte Spiel-Engine MAX-FX Technology von Remedy Entertainment. Dies soll
dem Benchmark eine realitätsnahe Umgebung bereitstellen, in der die Tests ausgeführt
werden können.
3.2 Übertaktung des Prozessors
3.2.1 Vorüberlegungen
Das erste angestrebte Ziel ist es, die CPU soweit zu übertakten, dass die Geschwindigkeit eines AMD Athlon XP 2400+ erreicht wird (siehe Abschnitt 2.1.2). Dieser hat eine
Geschwindigkeit von 1995 MHz. Der Wert für die CPU Geschwindigkeit ergibt sich aus
dem tatsächlichen Takt des FSB multipliziert mit einem so genannten Multiplikator, der
sich auf der CPU bendet. Formal bedeutet dies:
CP U T akt = F SB ∗ M ultiplikator
Wie unter Abschnitt 2.1.1 zu sehen ist, ist die im Testrechner verwendete CPU laut OPN
für einen eektiven Takt von 266 MHz ausgelegt, was einen tatsächlichen Takt von 133
MHz entspricht. Stellt man die Formel um und setzen die bekannten Werte ein, ergibt
sich ein benötigter Multiplikatorwert von 15.
M ultiplikator =
CP U T akt
F SB
⇒
1995M Hz
133M Hz
= 15
Leider unterstützt die CPU als höchsten Multiplikator nur den Wert 12,5. Ohne eine
Erhöhung des FSB ist es somit nicht möglich den Wert von 1995 MHz zu erreichen.
Eine Erhöhung des FSB auf Werte, welche nicht den Standard (100/133/166/200/...)
entsprechen, bringt hingegen in der Regel Taktungsprobleme für Speicher, AGP-Bus und
PCI Bus mit sich, da ein Motherboard für krumme Werte keinen passenden Teiler zur
Verfügung stellt, die benötigt werden um obige Bussysteme mit der richtigen Taktung
zu versorgen. Dies könnte zur Folge haben, dass Speicher, AGP-Bus und/oder PCI-Bus
niedriger oder höher getaktet werden als vorgesehen, und daran angebundene Komponenten, wie z.B. der Arbeitsspeicher oder die Grakkarte beschädigt werden könnten.
Das im Versuchrechner verwendete Motherboard hingegen sollte damit keine Probleme
bekommen (siehe Absatz SFS im Abschnitt 2.2.1). Da die Taktung des FSB für das Er-
Thomas Winkler, Matthias Lübben
27
RST-L WS06/07
Overclocking x86
reichen von 1995 MHz stark erhöht werden muss, macht es Sinn, vorsichtshalber gleich
den nächsten Standardtakt von 166 MHz (Eektiv 333 MHz), zu wählen. Dadurch ist zu
100% gewährleistet, dass der AGP/PCI Bus richtig getaktet ist. Die Taktrate des Speicher bleibt ebenfalls unverändert bei 200 MHz (siehe Absatz SFS im Abschnitt 2.2.1).
Damit hat der benötigte Multiplikator für eine Geschwindigkeit von ca. 1995 MHz den
Wert 12.
M ultiplikator =
CP U T akt
F SB
⇒
1995M Hz
166M Hz
≈ 12
Das zweite Ziel ist es, die Geschwindigkeit eines AMD Athlon XP 2600+ zu erreichen.
Dieser hat eine Geschwindigkeit von 2083 Mhz bzw. 2133 MHz (siehe Tabelle 2.1). Mit
dem maximal möglichen Multiplikator der verwendeten CPU erreichen wir nur einen
maximalen Takt von 2075 MHz.
CP U T akt = F SB ∗ M ultiplikator ⇒ 166M Hz ∗ 12, 5 = 2075M Hz
Um wirklich die Geschwindigkeit eines XP 2600+ zu erreichen, führt nun kein Weg mehr
dran vorbei, den FSB auf nicht standarisierte Werte zu takten. Die bestmögliche Annäherung erreicht man mit einem FSB von 167 MHz oder 171 Mhz.
F SB =
CP U T akt
M ultiplikator
⇒
2083M Hz
12,5
≈ 167M Hz
F SB =
CP U T akt
M ultiplikator
⇒
2133M Hz
12,5
≈ 171M Hz
3.2.2 Durchführung (Versuchsziel 1)
Der FSB wurde auf einen tatsächlichen Takt von 166 MHz eingestellt. Anschlieÿend
wurde der Multiplikator auf den kleinstmöglichen Wert (welcher durch den erhöhten
FSB schon eine minimale Übertaktung der CPU darstellt) gesetzt. Ingesamt unterstützt
die CPU folgende Multiplikatoren: 9X / 9,5X / 10X / 10,5X / 11X / 11,5X / 12X /
12,5X. Die schrittweise Übertaktung wurde nach folgendem Schema ausgeführt:
Thomas Winkler, Matthias Lübben
28
RST-L WS06/07
Overclocking x86
Abbildung 3.6: Schema für Versuchsziel 1
Der maximale Wert für den Multiplikator entspricht den Wert 12, falls nicht vorher schon
das ENDE erreicht wird.
BOOT: Bootet der Rechner ordnungsgemäÿ und wird Windows fehlerfrei gestartet?
TEST: Fehlerfreie Ausführung von CPU Burn-in über einen Zeitraum von 1h?
◦
TEMP: Temperatur der CPU nach/während TEST laut MBM Logdatei unter 70 C?
VCORE: VCore auf nächst möglichen Wert erhöhen, solange ein Wert von 1,725V nicht
überschritten wird.
Thomas Winkler, Matthias Lübben
29
RST-L WS06/07
Overclocking x86
3.2.3 Ergebnisse (Versuchsziel 1)
Abbildung 3.7: Ergebnisse von Versuchziel 1
Bei einer Geschwindigkeit von 1826 MHz kam es zu den ersten Systemabstürzen während
der TEST-Phase. Eine Anhebung der VCore Spannung auf 1,625V reichte aus um die
CPU wieder in einen stabilen Zustand zu versetzen. Die nächsten Fehler traten bei einer
Geschwindigkeit von 1909 MHz auf. Der Testrechner lieÿ sich nicht mehr ordnungsgemäÿ
booten und führte beim Starten des Betriebssystems einen Reboot durch oder zeigte
einen Bluescreen an. Das erneutes Anheben der VCore auf 1,65V brachte auch hier die
CPU wieder in einen stabilen Zustand. Das erste Versuchziel von ca. 1995 MHz (XP
2400+) konnte ohne weitere Probleme erreicht werden.
3.2.4 Langzeittest (Versuchsziel 1)
Um sicher zu stellen, dass die CPU auch im Dauerbetrieb fehlerfrei und stabil läuft,
wurde ein Langzeittest durchgeführt. Dazu wurde der Rechner für 3h ausgeschaltet, um
die Temperatur des Rechnergehäuses und der Wasserkühlung quasi zu resetten. Nun
wurde der Rechner gestartet und das Programm CPU Burn-in für 6h lang betrieben, um
die Maximaltemperatur, welche die CPU in dieser Taktung erreichen kann, zu ermitteln.
Anschlieÿend wurde der Rechner weitere 3h unter alltäglicher Verwendung betrieben
(Textverarbeitung, Spiele und Leerlaufbetrieb). Über den ganzen Zeitraum wurde die
Temperatur des Gehäuses und der CPU mittels Motherboard Monitor im 30 Sekunden
Takt mitgeloggt. Die Temperatur der Grakkarte konnte leider nicht gespeichert werden,
da obiges Programm diese nicht auslesen konnte. Da die Grakkarte noch mit der Standarttaktung von ASUS betrieben wurde ist die Temperatur allerdings relativ unrelevant,
da Hitzeschäden an der GPU auszuschlieÿen sind.
Thomas Winkler, Matthias Lübben
30
RST-L WS06/07
Overclocking x86
3.2.5 Ergebnisse Langzeittest (Versuchsziel 1)
◦
Die Gehäusetemperatur blieb während des gesamten Tests konstant auf 20 C. Der Temperaturverlauf der CPU wurde in zwei Graken aufgeteilt. Die erste Grak zeigt den
Temperaturverlauf der ersten 6h - also den Zeitraum wo CPU Burn-in die CPU maximal
auslastete und die zweite Grak zeigt die darauf folgenden 3h, in welchen der Testrechner
unter realen Bedingungen betrieben wurde:
Thomas Winkler, Matthias Lübben
31
RST-L WS06/07
Overclocking x86
Abbildung 3.8: Temperaturverlauf unter Vollast
Wie in der Grak zu erkennen ist, steigt die Temperatur innerhalb der ersten 30 Minu-
◦
ten sehr schnell an und erreicht eine maximale Temperatur von 45-46 C. Die für diesen
Thomas Winkler, Matthias Lübben
32
RST-L WS06/07
Overclocking x86
Versuch selbstdenierte Maximaltemperatur (siehe Absatz Temperaturmessung im Ab-
◦
schnitt 2.2.1) von 70 C wurde damit auch nach mehreren Stunden Dauerbelastung bei
weitem nicht erreicht.
Abbildung 3.9: Temperaturverlauf unter Normallast
Thomas Winkler, Matthias Lübben
33
RST-L WS06/07
Overclocking x86
Der anschlieÿende Test unter realen Bedingungen zeigt deutlich, dass die Temperatur
◦
◦
zwischen dem Maximalwert von 46 C und 42 C je nach CPU Auslastung schwankt. Zu
erwähnen ist allerdings, dass die Grakkarte sich im selben Kühlkreislauf wie die CPU
bendet. Werden nun über einen sehr langen Zeitraum z.B. Computerspiele gespielt,
welche CPU als auch GPU unter Volllast halten, ist es sehr wahrscheinlich das die Temperatur des Kühlwassers um ein paar Grad steigt, was zur Folge hat das sowohl die
CPU als auch GPU schlechter gekühlt wird. Auch war die Umgebungstemperatur des
Testrechners aufgrund der Jahreszeit relativ niedrig. Im Hochsommer sollte durch die
weitaus höhere Umgebungstemperatur ebenfalls eine Temperaturerhöhung des Gehäuseinneren als auch des Wasserkreislaufes stattnden. Dennoch sollte die Temperatur der
◦
◦
CPU aufgrund der Reserve von 24 C auch unter ungünstigsten Verhältnissen die 70 C
nicht überschreiten.
Abschlieÿend kann gesagt werden, dass die CPU ohne Probleme die Taktung von ca. 1995
MHz ohne erwähnenswerte Verkürzung der Lebenszeit hinnimmt, da die Temperatur sich
◦
nur 4 C über der des Betriebes im Normalzustand bendet und sich die Betriebsspannung noch im Bereich der Spezikationen für einen Thoroughbred hält. Ferner würde ein
Luftgekühlter AMD Athlon XP 1700+ im nicht übertakteten Zustand im Regelfall eine
höhere Temperatur aufweisen, als der in diesem Versuch übertaktete Prozessor, welcher
Wassergekühlt ist. So gesehen könnte man sogar folgende plakative Behauptung aufstel-
Die in diesem Versuch wassergekühlte CPU hat im übertakteten Zustand von ca. 500
MHz eine höhere Lebenserwartung als eine identische luftgekühlte CPU im Normalbetrieb.
len:
3.2.6 Durchführung (Versuchsziel 2)
Der FSB wurde auf einen tatsächlichen Takt von 166 MHz, die VCore auf 1,65V und der
Multiplikator der CPU auf den Wert 12,5 eingestellt. Nun wurde nach folgendem Ablauf
vorgegangen:
Thomas Winkler, Matthias Lübben
34
RST-L WS06/07
Overclocking x86
Abbildung 3.10: Schema für Versuchsziel 2
Der maximale Wert für den FSB entspricht 171 MHz, falls nicht vorher schon das ENDE
erreicht wird.
BOOT: Bootet der Rechner ordnungsgemäÿ und wird Windows fehlerfrei gestartet?
TEST: Fehlerfreie Ausführung von CPU Burn-in über einen Zeitraum von 1h?
◦
TEMP: Temperatur der CPU nach/während TEST laut MBM Logdatei unter 70 C?
VCORE: VCore auf nächst möglichen Wert erhöhen, solange ein Wert von 1,725V nicht
überschritten wird.
Thomas Winkler, Matthias Lübben
35
RST-L WS06/07
Overclocking x86
3.2.7 Ergebnisse (Versuchsziel 2)
Abbildung 3.11: Ergebnisse von Versuchsziel 2
Nachdem man die Versorgungsspannung um weitere 75mV erhöhte, wurde auch die erste
Hälfte des zweiten Versuchziels von 2083 MHz erreicht. Auf 2133 MHz zu takten war
leider nicht mehr möglich, da die selbstdenierte Maximalspannung für die CPU erreicht
war. Da aber schon 2083 MHz als ein Athlon XP 2600+ gelten, kann man dennoch von
einem gelungenen Versuch sprechen. Allerdings ist zu bedenken, dass eine Spannung von
1,725V sich um 75mV über dem Maximalwert laut Spezikationen von AMD bendet.
Verglichen mit der Standardspannung für die verwendete CPU ist der Wert sogar um
125mV höher. Die durchschnittliche Lebenserwartung für einen Thoroughbred liegt laut
Angaben von AMD bei 8 - 12 Jahren. Es ist anzunehmen, dass sich durch eine erhöhte
Versorgungsspannung der CPU die Lebenserwartung deutlich verkürzen kann. Genaue
Werte hierfür zu bestimmen, ist leider unmöglich, da alle Angaben auf Spekulationen
beruhen. Schlieÿlich gibt es diese Prozessorreihe erst seit ca. 6 Jahren. Glaubt man den
Angaben aus einschlägigen Übertaktungsforen, so soll eine Versorgungsspannung von bis
zu 1,8V für diese CPU die Lebenserwartung nicht all zu stark verkürzen. Die VCore aber
noch weiter zu erhöhen, nur um auch die 2133 MHz zu erreichen, steht nicht mehr im
Verhältnis zwischen Geschwindigkeitszuwachs und Risiko einer Beschädigung, dem die
CPU dann ausgesetzt sein könnte.
3.2.8 Langzeittest (Versuchsziel 2)
Auf einen Langzeittest wurde aufgrund des Aufwandes im Verhältnis zum Nutzen verzichtet. Die Temperaturverläufe sollten sich mit denen aus dem Langzeittest von Versuchziel
◦
1 decken, mit den Unterschied, dass jeder Messwert um ca. 5 C höher sein sollte und
damit immernoch weit von den Maximalwerten entfernt.
Thomas Winkler, Matthias Lübben
36
RST-L WS06/07
Overclocking x86
3.3 Übertaktung der Grakkarte
3.3.1 Vorüberlegungen
Das Ziel ist es, die Grakkarte auf die Standardgeschwindigkeit einer GeForce 4 TI4600
zu takten. Um dieses Ziel zu erreichen müsste die GPU um 40 MHz verglichen mit dem
Standardtakt dieser Karte laut ASUS übertaktet werden. Der Speicher müsste um 50
MHz tatsächlichen Takt beschleunigt werden, was eine eektive Steigung von 100 MHz
bedeuten würde. Prozentual würde die GPU der Grakkarte damit um ca. 15% und der
Speicher um ca. 18% schneller getaktet sein. Wenn eine Grakkarte zu schnell getaktet
ist - also nicht mehr fehlerfrei arbeitet - erkennt man dies an folgenden Punkten:
•
Systemabsturz / Bluescreen: Die Karte ist wesentlich zu schnell getaktet.
•
Grakfehler: Häufen sich in Grakanwendungen wie z.B. PC Spielen Pixelfehler,
lässt dies auf eine zu schnell getaktete Karte schlieÿen.
•
Temperatur: Die Temperatur der Grakkarte von GPU und/oder Speicher benden
sich überhalb der erlaubten Maximalwerte.
3.3.2 Durchführung
Die CPU wurde auf ihren eigentlichen Takt zurückgesetzt. Nun folgte die schrittweise
Übertaktung der Grakkarte nach folgendem Schema:
Thomas Winkler, Matthias Lübben
37
RST-L WS06/07
Overclocking x86
Abbildung 3.12: Schema zur Übertaktung der Grakkarte
Der Takt der GPU und des Speichers wurde in folgenden Schritten erhöht:
Schritt Nr.
GPU
Speicher
1
260 MHz
275 MHz
2
270 MHz
285 MHz
3
280 MHz
295 MHz
4
290 MHz
305 MHz
5
295 MHz
315 MHz
6
300 MHz
325 MHz
Tabelle 3.1: Übertaktungsschritte
TEST: Das Programm 3D Mark 2001 wird dreimal nacheinander ausgeführt und es wird
geprüft, ob keine sichtbaren Grakfehler oder Systemabstürze auftreten.
TEMP: Die Temperatur wird mittels SmartDoctor überwacht. Das Programm wurde so
◦
eingestellt, dass es einen Alarm auslöst, wenn die GPU über 70 C und der Speicher über
◦
◦
55 C warm wird. Diese Werte sind jeweils 20 C vom erlaubten Maximalwert entfernt
und bieten genug Spielraum. Die eigentliche Abfrage ist nun: Wird der Alarm während
des TESTs
nicht
ausgelöst?
Thomas Winkler, Matthias Lübben
38
RST-L WS06/07
Overclocking x86
3.3.3 Ergebnisse
Die Grakkarte lief in allen Testschritten stabil. Auch die Temperatur erreichte nicht die
Alarmwerte. Sichtbare Grakfehler wurden ebenfalls keine festgestellt.
3.4 Abschlieÿender Langzeitgesamttest
In diesen abschlieÿenden Test wurde geprüft ob die Wasserkühlung genug Abwärme von
CPU und GPU kompensieren kann, wenn sich beide unter Vollast als auch im Dauerbetrieb benden. Für den Test wurden Grakkarte und CPU mit den maximal erzielten
Ergebnissen getaktet und der Testrechner 72h ohne Unterbrechung betrieben. Während
dieses Zeitrahmens wurden verschiedene alltägliche Anwendungen ausgeführt, welchen
der Rechner auch unter realen Bedingungen ausgesetzt wäre. Zum einen wurde das Computerspiel World Of Warcraft über 6 Stunden am Stück gespielt. Dieses Spiel eignet sich
besonders gut zum Testen, da nicht nur die Grakkarte sondern auch die CPU stark
belastet werden. Ferner wurden weitere Spiele wie Quake 3 oder Warcraft 3 über einen
gewissen Zeitraum gespielt.
◦
Die Temperatur der CPU stieg während des gesamten Tests nicht über 52 C. Die Gehäu-
◦
◦
setemperatur lag konstant zwischen 20 C und 22 C. Die GPU wurde nicht wärmer als
◦
◦
60 C und der Speicher der Grakkarte überschritt nicht einen Wert von 55 C. Auch bei
hohen Auÿentemperaturen sollten die jeweiligen kritischen Temperaturwerte der Komponenten nicht erreicht werden, so dass man sagen kann, dass der Testrechner unter allen
üblichen Umgebungsbedinungen fehlerfrei funktionieren sollte.
Thomas Winkler, Matthias Lübben
39
RST-L WS06/07
Overclocking x86
4 Benchmark
4.1 Einleitung
Nachdem eine Messung deniert wurde, ist sie mit dem entsprechenden Werkzeug mehrmals durchgeführt worden um Messreihen zu erhalten. Anschlieÿend worden die Messreihen tabellarisch dargestellt und ausgewertet. Für die Auswertung wurden aus den
Messreihen Mittelwerte gebildet, die mit einander verglichen und interpretiert wurden.
4.2 Audio Encoding
Der Bechnmark richtet sich gezielt an die CPU. Die Grakkarte spielt eine zu vernachlässigende Rolle. Insgesamt wurden drei Messreihen mit jeweils 20 Durchläufen, aus denen
anschlieÿend Mittelwerte gebildet wurden, aufgenommen.
4.2.1 Benchmark Beschreibung
Für diesen Benchmark wurde das Programm
lame 3.97
[19] verwendet. Das Programm
ist in der Lage, Audio-Daten in das MP3-Format zu konvertieren. Eine inverse Transformation ist auch möglich, jedoch nur unter Verlust von Daten. Dies liegt daran, dass die
MP3-Komprimierung ein verlustbehaftetes Verfahren ist.
Dieser Benchmark misst die Zeit, die lame benötigt, um eine WAV-Datei (44,1 kHz; 16bit;
Stereo; 3:26) mit einer Gröÿe von 38,1 MB (40.017.920 Bytes) in eine MP3-Datei (44,1
kHz; 128 kbps; j-stereo; MPEG-1 Layer 3) zu konvertieren.
•
Messreihe 1: CPU mit Athlon XP 1700+ Taktung (1463 MHz)
•
Messreihe 2: CPU mit Athlon XP 2400+ Taktung (1992 MHz)
•
Messreihe 3: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz)
Thomas Winkler, Matthias Lübben
40
RST-L WS06/07
Overclocking x86
Die Benchmarks wurden mit dem Programm
zess wurde über den Befehl
Prozess Benchmark
lame.exe test.wav
durchgeführt. Der Pro-
gestartet.
4.2.2 Benchmark Messwerte
Messreihe 1: CPU mit Athlon XP 1700+ Taktung (1463 MHz)
Messung
Kernelzeit [s]
Userzeit [s]
CPU-Zeit [s]
reale Zeit [s]
1
0,140
21,625
21,765
23,047
2
0,234
21,828
22,062
23,140
3
0,250
22,031
22,281
23,015
4
0,203
22,171
22,374
22,906
5
0,187
21,750
21,937
23,125
6
0,156
21,375
21,531
23,437
7
0,218
21,343
21,561
23,687
8
0,171
21,531
21,702
23,937
9
0,109
22,062
22,171
24,328
10
0,156
22,140
22,296
24,531
11
0,171
22,250
22,421
24,843
12
0,171
22,203
22,374
24,781
13
0,093
22,328
22,421
24,718
14
0,125
22,484
22,609
24,781
15
0,187
22,296
22,483
24,859
16
0,234
21,068
22,202
24,734
17
0,171
22,078
22,449
24,828
18
0,156
22,218
22,374
24,828
19
0,343
22,093
22,436
24,781
20
0,203
22,234
22,437
24,843
ø
0,184
22,000
22,184
24,157
Tabelle 4.1: Athlon XP 1700+ Taktung (1463 MHz)
Thomas Winkler, Matthias Lübben
41
RST-L WS06/07
Overclocking x86
Messreihe 2: CPU mit Athlon XP 2400+ Taktung (1992 MHz)
Messung
Kernelzeit [s]
Userzeit [s]
CPU-Zeit [s]
reale Zeit [s]
1
0,109
15,812
15,921
16,313
2
0,109
15,953
16,062
16,360
3
0,203
15,906
16,109
16,485
4
0,234
15,984
16,218
16,594
5
0,140
16,140
16,280
16,688
6
0,171
16,265
16,436
16,992
7
0,203
15,265
15,468
16,953
8
0,093
15,484
15,577
17,141
9
0,093
15,609
15,702
17,266
10
0,156
15,750
15,906
17,438
11
0,109
15,859
15,968
17,547
12
0,140
15,937
16,077
17,578
13
0,125
15,921
16,046
17,453
14
0,109
15,921
16,030
17,594
15
0,078
15,828
15,906
17,453
16
0,171
15,875
16,046
17,610
17
0,140
15,890
16,030
17,416
18
0,140
15,890
16,030
17,563
19
0,156
15,812
15,968
17,516
20
0,078
15,796
15,874
17,485
ø
0,138
15,845
15,983
17,174
Tabelle 4.2: CPU mit Athlon XP 2400+ Taktung (1992 MHz)
Thomas Winkler, Matthias Lübben
42
RST-L WS06/07
Overclocking x86
Messreihe 3: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz)
Messung
Kernelzeit [s]
Userzeit [s]
CPU-Zeit [s]
reale Zeit [s]
1
0,156
15,125
15,281
16,172
2
0,109
15,234
16,343
16,672
3
0,187
15,281
16,468
16,812
4
0,203
15,265
16,468
16,859
5
0,140
16,562
16,702
16,093
6
0,218
16,593
16,811
16,172
7
0,156
15,859
15,015
16,281
8
0,281
15,734
15,015
17,437
9
0,171
15,093
15,264
17,718
10
0,234
15,000
15,234
17,657
11
0,203
15,109
15,312
17,735
12
0,265
15,031
16,296
17,891
13
0,125
15,109
16,234
17,766
14
0,203
15,203
16,406
17,797
15
0,171
15,140
15,311
17,813
16
0,140
15,296
16,436
17,922
17
0,218
15,140
16,358
17,907
18
0,109
15,218
16,327
17,813
19
0,125
15,156
15,281
17,828
20
0,093
15,234
15,327
17,735
ø
0,175
15,169
15,344
16,504
Tabelle 4.3: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz)
4.2.3 Benchmark Auswertung
In Messreihe 1 (Tabelle 4.1) betrug der Prozessor Takt 1463 MHz und in Messreihe 2
(Tabelle 4.2) 1992 MHz. Daraus ergibt sich ein Quotient von
1, 43
1992
1463
= 1, 36
sowie
2087,5
1463
=
für den Takt von 2087,5 MHz aus Messreihe 3 (Tabelle 4.3). Die Auswertung der
Messdaten soll zeigen, ob sich das folgende erwartete Verhalten einstellt.
Annahme:
Dieses Verhätnis besteht auch in etwa zwischen den gemessenen Zeiten.
Um die Werte für das tatsächliche Zeitverhältnis mit denen der obigen Geschwindigkeitsverhältnissen zu vergleichen, wurden sie wie folgt berechnet:
Zeit
V ergleichswert = 1 + (1 − ( U rsprungszeit
)) = 2 −
Thomas Winkler, Matthias Lübben
Zeit
U rsprungszeit
43
RST-L WS06/07
Overclocking x86
Auswertung der CPU Leistung
FSB
MP
MHz
Taktv.
Zeit(ø)
Zeitv.
Vergleichswert
133 MHz
11,0
1463 MHz
-
22,184s
-
-
166 MHz
12,0
1992 MHz
1,36
15,983s
0,72
1,28
167 MHz
12,5
2087,5 MHz
1,43
15,344s
0,69
1,31
Tabelle 4.4: Lame Auswertung CPU Zeit
Auswertung der tatsächlichen Leistung
FSB
MP
MHz
Taktv.
Zeit(ø)
Zeitv.
Vergleichswert
133 MHz
11,0
1463 MHz
-
24,157s
-
-
166 MHz
12,0
1992 MHz
1,36
17,174s
0,71
1,29
167 MHz
12,5
2087,5 MHz
1,43
16,504s
0,68
1,32
Tabelle 4.5: Lame Auswertung tatsächliche Zeit
Die gemachte Annahme konnte also nur teilweise bestätigt werden. Tatsächlich ist der
ausgeführte Prozess relativ zum Takt langsamer gewesen. Der Grund für dieses Phänomen ist, dass nur die Takt-Geschwindigkeit des Prozessors verändert wurde. Alle anderen
Komponenten haben ihre ürsprüngliche Taktung beibehalten. Dies gilt sowohl für Speicher als auch für Festplatten und alle weiteren Erweiterungskarten des Systems.
Es gibt aber auch Situationen, in denen die Erhöhung des Prozessor-Taktes die Ausführungsgeschwindigkeit eines Programmes positiv beeinussen kann, die aber mehr Betriebssystem technisch bedingt sind und von dem Design der laufenden Programme abhängt. So stehen einem Prozess mehr Zeitscheiben des Prozessors zur Verfügung, wenn
die anderen Prozesse zeitgesteuert programmiert wurden, indem sie entweder Gebrauch
von Timern machen oder die
Sleep() Funktion benutzen. Auch die Verwendung von WM-
TIMER -Nachrichten zählt hierzu. Ein Beispiel könnte wie folgt aussehen:
...
VOID CALLBACK TimerProc(HWND hwnd, UINT uMsg, UINT_PTR idEvent, DWORD dwTime)
{
CheckSomethingImportant();
}
VOID InstallTimer()
{
Thomas Winkler, Matthias Lübben
44
RST-L WS06/07
Overclocking x86
SetTimer(NULL, 0, 1000, TimerProc);
}
...
...
while (TRUE) {
CheckSomethingImportant();
Sleep(1000);
}
...
Der Zeitunterschied entsteht nun dadurch, dass die Prozesse, die diese Methoden verwenden, sich länger im Zustand
sleeping
benden und dadurch für den
lame
Prozess
mehr Zeitscheiben zur Verfügung stehen und sich dadurch die Laufzeit des Prozesses
verringert.
4.3 Video Encoding
Der Benchnmark richtet sich wie schon der Audio Encoding Benchmark in Abschnitt
4.2, gezielt an die CPU. Die Grakkarte spielt eine zu vernachlässigende Rolle. Insgesamt
wurden drei Messreihen mit jeweils 10 Messwerten aufgenommen, aus denen anschlieÿend
Mittelwerte gebildet wurden.
4.3.1 Bennchmark Beschreibung
Der zweite Benchmark wird mit dem Programm
mpeg SVN-r7215
[20] durchgeführt.
Dieses Mal sollen die Ergebnisse veriziert werden, die durch den Benchmark mit
lame
erarbeitet wurden. Es wurden jedoch nur 10 Messwerte aufgezeichnet, da die Programmlaufzeit von
mpeg
Das Programm
ungefähr dreimal länger ist als bei
mpeg
lame ).
wird dazu verwendet, um Videostreams von einem Format, z.B.
MPEG2 in ein anderes Format z.B. MPEG4 zu konvertieren. Mit der Linux-Variante
lassen sich auch Echtzeit-Quellen, die über eine V4L2-Treiber verfügen (z.B. TV-Karten
oder Webcams) als Eingabestrom verwenden. Für diesen Benchmark wird als Eingangsquelle eine Datei verwendet, um die Bedingungen unter denen das Programm gestartet
wird, konstant zu halten. Die Funktionalität von
tionalität von
mpeg
ist daher also ähnlich der Funk-
lame. Einüsse, die durch das Betriebsystem entstehen, werden durch die
Prozess Benchmark eleminiert.
Benutzung des Programms
Thomas Winkler, Matthias Lübben
45
RST-L WS06/07
Overclocking x86
Für die Aufzeichnung der Messung wird ein MPEG1-Video (Video: 352x288, 1150kbps; Audio: 44,1kHz, 224kbps, Stereo, MPEG1 layer 2) mit einer Gröÿe von 70,6 MB
(74.085.692 Bytes) verwendet. Der Prozess wurde mit folgendem Befehl durch Prozess
Benchmark
ffmpeg.exe -i test.mpg -y test.avi
gestartet. Als Ausgabe erzeugt das
Programm eine MPEG4-Video Datei die als Container das AVI-Format benutzt. Als
Ausgabeparamter werden die Standardeinstellungen des Programms verwendet.
4.3.2 Benchmark Messwerte
Messreihe 1: CPU mit Athlon XP 1700+ Taktung (1463 MHz)
Messung
Kernelzeit [s]
Userzeit [s]
CPU-Zeit [s]
reale Zeit [s]
1
1,093
56,718
57,811
60,859
2
1,437
57,000
58,437
60,906
3
1,375
57,515
58,890
61,218
4
1,281
58,296
59,577
61,906
5
1,125
55,109
56,234
62,781
6
1,078
55,640
56,718
62,968
7
1,062
56,531
57,593
63,828
8
1,125
56,796
57,921
64,422
9
1,093
57,437
58,530
65,187
10
1,156
58,328
59,484
66,203
ø
1,183
56,937
58,120
63,028
Tabelle 4.6: CPU mit Athlon XP 1700+ Taktung (1463 MHz)
Thomas Winkler, Matthias Lübben
46
RST-L WS06/07
Overclocking x86
Messreihe 2: CPU mit Athlon XP 2400+ Taktung (1992 MHz)
Messung
Kernelzeit [s]
Userzeit [s]
CPU-Zeit [s]
reale Zeit [s]
1
0,921
43,296
44,217
46,516
2
1,109
43,343
44,452
45,906
3
1,187
43,546
44,733
46,468
4
0,796
44,078
44,874
46,406
5
0,859
42,656
43,515
45,125
6
0,734
44,375
45,109
46,984
7
0,609
42,531
43,140
47,422
8
0,750
42,375
43,125
47,672
9
0,687
42,406
43,093
47,968
10
0,671
43,281
43,952
48,625
ø
0,832
43,189
44,021
46,909
Tabelle 4.7: CPU mit Athlon XP 2400+ Taktung (1992 MHz)
Messreihe 3: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz)
Messung
Kernelzeit [s]
Userzeit [s]
CPU-Zeit [s]
reale Zeit [s]
1
0,640
41,953
42,593
44,719
2
1,734
41,750
42,484
45,078
3
1,750
42,437
43,187
44,719
4
0,609
42,468
43,077
44,985
5
0,687
42,953
43,640
45,235
6
0,968
42,937
43,905
45,438
7
0,765
43,000
43,765
45,813
8
0,718
41,031
41,749
46,172
9
0,531
41,390
41,921
46,438
10
0,906
40,718
41,624
52,297
ø
0,731
42,064
42,795
46,089
Tabelle 4.8: CPU mit Athlon XP 2600+ Taktung (2087,5 MHz)
4.3.3 Benchmark Auswertung
Für die weitere Auswertung wurden zunächst einmal dieselben Berechnungen für die
Verhältnisse wie im Benchmark von
lame
durchgeführt und in folgender Tabelle festge-
halten:
Thomas Winkler, Matthias Lübben
47
RST-L WS06/07
Overclocking x86
Auswertung der CPU Geschwindigkeit
FSB
MP
MHz
Taktv.
Zeit(ø)
Zeitv.
Vergleichswert
133 MHz
11,0
1463 MHz
-
58,120s
-
-
166 MHz
12,0
1992 MHz
1,36
44,021s
0,76
1,24
167 MHz
12,5
2087,5 MHz
1,43
42,795s
0,74
1,26
Tabelle 4.9: FFmpeg Auswertung CPU Zeit
Auswertung der tatsächlichen Geschwindigkeit
FSB
MP
MHz
Taktv.
Zeit(ø)
Zeitv.
Vergleichswert
133 MHz
11,0
1463 MHz
-
63,028s
-
-
166 MHz
12,0
1992 MHz
1,36
46,909s
0,74
1,26
167 MHz
12,5
2087,5 MHz
1,43
46,089s
0,73
1,27
Tabelle 4.10: FFmpeg Auswertung tatsächliche Zeit
Es ist erfreulich zu sehen, dass sich die Annahme bestätigt, dass sich die Messungen von
lame und mpeg ähnlich verhalten. Es ist wieder zu sehen, dass das Prozessorzeitverhältnis geringer ist als das Verhältnis der realen Ausführungszeit der beiden Prozesse. Dies
spricht für die im vorherigen Kapitel angesprochenden Gründe.
Auällig hingegen ist jedoch, dass bei
mpeg
die Geschwindigkeitssteigerung geringer ist
als bei lame. Auch hierfür gibt es einige mögliche Gründe:
•
Weil
mpeg
Videos (Bild+Ton) konvertiert, benötigt das Programm selber mehr
Arbeitsspeicher (Programmgröÿe = 3,456MB) als die Software
lame
(Programm-
gröÿe = 0,2MB), die nur Ton konvertiert. Es ist davon auszugehen, dass häuger
Teile aus dem Arbeitsspeicher verdrängt werden (paging) bzw. der komplette Prozess ausgelagert wird (swapping). Wobei swapping aufgrund der Arbeitsspeichergröÿe eher unwahrscheinlich ist.
•
Da die Algorithmen und Datenstrukturen von
mpeg
gröÿer sind und daher öfter
L1- und L2-Cache misses auftreten und daher öfter Daten aus dem Arbeitsspeicher nachgeladen werden müssen als bei
lame, fällt die Geschwindigkeitssteigerung
geringer aus.
•
Es mehr Festplattenzugrie gibt, paging bzw. swapping bedingt, und weil die Eingabedatei mit 70MB um 32,5MB gröÿer ist. Die Übertaktung des Prozessors hat auf
die Festplatten Geschwindigkeit keine Auswirkung. Jedoch hat die höhere Taktung
Thomas Winkler, Matthias Lübben
48
RST-L WS06/07
Overclocking x86
des FSB einuss auf die Übertragungsgeschwindigkeit zwischen Festplattencontroller und CPU. Die Wartezeit des Festplattencontrolles auf die Daten der Festplatte
ist hier jedoch ausschlaggebend.
4.4 3D Mark 2001
Die beiden bisherigen Benchmarks sind sehr rechenintensive Programme gewesen, die
hauptsächlich auf Prozessorleistung angewiesen sind. Dieser Benchmark [18] hingegen
benötigt die maximale Leistung der CPU als auch die der Grakkarte. Insgesamt wurden
9 Messreihen mit jeweils 3 Durchläufen, aus denen anschlieÿend Mittelwerte gebildet
wurden, aufgenommen.
4.4.1 Benchmark Beschreibung
Das Programm führt eine Reihe von verschiedenen Grakbenchmarks nacheinander aus
und ermittelt aus allen Teilergebnissen eine Punktzahl. Ein Druchlauf dauert um die 6
Minuten und setzt sich aus 16 Einzelbenchmarks zusammen. Umso höher diese Punktzahl
ausfällt, umso besser das Ergebniss. Wie genau sich diese Punktzahl zusammensetzt, läÿt
sich leider nicht klären, da der Hersteller sich darüber ausschweigt. Das Programm verfügt
über die Möglichkeit, die erreichte Punktzahl auf die Herstellerseite zu laden und dort
mit anderen Rechnern zu vergleichen. Leider ist diese Funktion nicht mehr verwendbar,
da der Support als auch die zugehörige Datenbank für diesen Benchmark aufgrund des
Alters eingestellt worden ist.
Thomas Winkler, Matthias Lübben
49
RST-L WS06/07
Overclocking x86
4.4.2 Benchmark Messwerte und Auswertung
Tabelle 4.11: Messwerte mit Auswertung 3D Mark 2001
Eine Recherche mit der Suchmaschine
Google hat aber einige Ergebnisse in Foren ans Ta-
geslicht gebracht. Ähnliche Kongurationen erzielten dabei annährend identische Werte.
Ein Vergleich ist allerdings nicht möglich, da es immer eine Komponente gab die Unterschiedlich war. Die Quellen sind auÿerdem äuÿert fragwürdig, aufgrund der Tatsache,
dass es sich um Diskussionsforenbeiträge handelt, in welchen jeder Verfasser natürlich
möglichst viele Punkte mit seinen Rechner erhalten möchte.
•
Athlon XP 1800+, 256 MB DDR-CL2, Aopen Aeolus TI 4200 128 MB, 8734 Punkte
http://www.chip.de/c1_forum/thread.html?bwthreadid=237159&bwpage=8&bwsortorder=
ascending
•
Athlon XP 2400+, Geforce 4 Ti 4800SE, 512MB Infeon DDR333, 12048 Punkte
http://www.chip.de/c1_forum/thread.html?bwthreadid=345449
•
http://www.
tweakpc.de/forum/benchmarks/231-3d-mark-2001-se-viel-punkte-18.html
Athlon XP 2400+, Sapphire 9500, 3x512MB DDR333, 11590 Punkte
Ergebnisse für ein Athlon XP 1700+ sind sehr schwer zu nden, da diese Systeme meistens
übertaktet wurden.
Thomas Winkler, Matthias Lübben
50
RST-L WS06/07
Overclocking x86
5 Fazit
Aus der Versuchsduchführung und den zugehörigen Benchmarks läÿt sich ein Leistungsgewinn zwischen
β = 1, 25
und
β = 1, 32
im alltäglichen Betrieb erkennen. Die Tem-
peraturentwicklungen der übertakteten Komponenten waren dabei nicht bedenklich und
lagen verglichen mit einer Luftkühlung selbiger im normalen Temperaturbereich.
Das Ergebnis ist eine erhebliche Steigerung der Leistung ohne einen erhöhten Kostenoder gröÿeren Arbeitsaufwand. Dies stimmt allerdings nur unter der Bedingung, dass man
die zur Verfügung stehende Wasserkühlung nicht extra für den Zweck der Übertaktung
kauft, sondern diese aus anderen Gründen wie z.B. der Verminderung der Geräuschentwicklung bereits verwendet. Denn die Komponenten einer Wasserkühlung kosten weitaus
mehr als eine entsprechend schnellere Hardware.
Thomas Winkler, Matthias Lübben
51
RST-L WS06/07
Overclocking x86
6 Begrie
ATA Siehe ATAPI
ATAPI Advanced Technology Attachment with Packet Interface
AGP Accelerated Graphics Port
BGA Ball Grid Array
BIOS Basic Input Output System
C.O.P. CPU Overheating Protection
CPU Central Processing Unit
DDR Double Data Rate
DMA Direct Memory Access
FSB Front Side Bus
GNU GNU's Not Unix
GPL General Public License
GPU Graphics Processing Unit
LAME LAME Ain't an MP3 Encoder
MBM Motherboard Monitor
MIPS Million Instructions per Second
MPEG Motion Pictures Expert Group
OPN Ordering Part Number
PCI Peripheral Component Interconnect
RAID Redundant Array of Inexpensive Disks
RAM Random Access Memory
SFS Stepless Frequency Selection
TSOP Thin Small Outline Package
Thomas Winkler, Matthias Lübben
52
RST-L WS06/07
Overclocking x86
Literaturverzeichnis
[1] Datenblatt: LFx1512E
http://www.smartcooler.de/proddata/PDD-LFx1512E.htm
[2] Datenblatt: CPU
http://www.bytes-and-more.de/tech/amd_athlon_tech.htm
[3] Datenblatt: Motherboard
http://de.asus.com/products.aspx?l1=3&l2=13&l3=56&model=
217&modelmenu=2
[4] Datenblatt: Grakkarte
http://dlsvr01.asus.com/pub/ASUS/vga/agp/v8420dex/e1145_
v8460.pdf
[5] Datenblatt: Eheim 1048
http://www.eheim.com/universal.htm
[6] Informationen: CPU
http://de.wikipedia.org/wiki/Athlon_XP
[7] Informationen: Motherboard
http://www.computerbase.de/artikel/hardware/mainboards/
2004/test_asus_a7n8x-e_w-lan-edition/1/
[8] Informationen: Grakkarte
http://www.hardwareluxx.de/cgi-bin/ubb/ultimatebb.cgi?ubb=
get_topic&f=2&t=000014
[9] Informationen: Ordering Part Number (OPN)
http://de.wikipedia.org/wiki/Ordering_Part_Number_von_AMD_
CPUs#Aufbau_der_OPN_f.C3.BCr_Slot-A-CPUs
und
Thomas Winkler, Matthias Lübben
53
RST-L WS06/07
Overclocking x86
http://www.athlon.de/showthread.php?t=50677
[10] Informationen: QuantiSpeed-Rating
http://de.wikipedia.org/wiki/QuantiSpeed#Quantispeed-Rating
[11] Informationen: DDR-SDRAM
http://de.wikipedia.org/wiki/DDR-SDRAM
[12] Informationen: Stepping
http://www.wikipedia.de/Stepping
[13] Informationen: Stepping Gerüchte
http://www.teccentral.de/artikel/artikeldrucken_192.html
[14] Software Link: ASUS SmartDoctor
http://dlsvr01.asus.com/pub/ASUS/vga/nVidia/Utility/
SmartDoc464.zip
[15] Software Link: Motherboard Monitor
http://www.zdnet.de/downloads/prg/m/w/de0AMW-wc.html
[16] Software Link: CPU Burn-in
http://users.bigpond.net.au/cpuburn/
[17] Software Link: RivaTuner
http://www.3dcenter.de/downloads/rivatuner.php
[18] Software Link: 3DMark2001
http://www.futuremark.com/download/?3dmark2001.shtml
[19] Software Link: Lame 3.97
http://lame.sourceforge.net/index.php
[20] Software Link: FFmpeg SVN-r7215
http://arrozcru.no-ip.org/ffmpeg_builds/
[21] Software Link: Trolltech's QT 4.2
http://www.trolltech.de/
Thomas Winkler, Matthias Lübben
54
RST-L WS06/07
Overclocking x86
Abbildungsverzeichnis
2.1
AMD Athlon XP (T-Bred B-Variante)
. . . . . . . . . . . . . . . . . . . .
6
2.2
Bild der OPN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3
ASUS A7N8X-E Deluxe
2.4
ASUS V8420 Deluxe
2.5
2.6
Eheim 1048
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.7
RADI Dual
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.8
Tank-O-Matic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.9
innovaFlatFlow-O-Matic und Graph-O-Matic
7
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
Wasserkühlung im eingebautem Zustand . . . . . . . . . . . . . . . . . . .
16
. . . . . . . . . . . . . . . .
19
. . . . . . . . . . . . . . . . . . . . . . . . .
20
3.1
Prozess Benchmark . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
3.2
Klassendiagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
3.3
ASUS SmartDoctor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
3.4
CPU Burn-in
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
3.5
RivaTuner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
3.6
Schema für Versuchsziel 1
. . . . . . . . . . . . . . . . . . . . . . . . . . .
29
3.7
Ergebnisse von Versuchziel 1 . . . . . . . . . . . . . . . . . . . . . . . . . .
30
3.8
Temperaturverlauf unter Vollast . . . . . . . . . . . . . . . . . . . . . . . .
32
3.9
Temperaturverlauf unter Normallast
. . . . . . . . . . . . . . . . . . . . .
33
. . . . . . . . . . . . . . . . . . . . . . . . . . .
35
2.10 Rechner mit Lüftersteuerung
3.10 Schema für Versuchsziel 2
3.11 Ergebnisse von Versuchsziel 2
. . . . . . . . . . . . . . . . . . . . . . . . .
36
3.12 Schema zur Übertaktung der Grakkarte . . . . . . . . . . . . . . . . . . .
38
Thomas Winkler, Matthias Lübben
55
RST-L WS06/07
Overclocking x86
Tabellenverzeichnis
1.1
Systemumgebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
2.1
Prozessor Varianten
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.2
OPN Bedeutung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.3
Code Entschlüsselung
2.4
Spezikationen
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2.5
Vergleich ASUS VS Referenzdesign . . . . . . . . . . . . . . . . . . . . . .
14
2.6
Lüfterdetails . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
3.1
Übertaktungsschritte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
4.1
Athlon XP 1700+ Taktung (1463 MHz)
. . . . . . . . . . . . . . . . . . .
41
4.2
CPU mit Athlon XP 2400+ Taktung (1992 MHz) . . . . . . . . . . . . . .
42
4.3
CPU mit Athlon XP 2600+ Taktung (2087,5 MHz) . . . . . . . . . . . . .
43
4.4
Lame Auswertung CPU Zeit . . . . . . . . . . . . . . . . . . . . . . . . . .
44
4.5
Lame Auswertung tatsächliche Zeit . . . . . . . . . . . . . . . . . . . . . .
44
4.6
CPU mit Athlon XP 1700+ Taktung (1463 MHz) . . . . . . . . . . . . . .
46
4.7
CPU mit Athlon XP 2400+ Taktung (1992 MHz) . . . . . . . . . . . . . .
47
4.8
CPU mit Athlon XP 2600+ Taktung (2087,5 MHz) . . . . . . . . . . . . .
47
4.9
FFmpeg Auswertung CPU Zeit
48
. . . . . . . . . . . . . . . . . . . . . . . .
4.10 FFmpeg Auswertung tatsächliche Zeit
. . . . . . . . . . . . . . . . . . . .
48
4.11 Messwerte mit Auswertung 3D Mark 2001 . . . . . . . . . . . . . . . . . .
50
Thomas Winkler, Matthias Lübben
56