Processadores Intel e AMD2

Transcrição

Processadores Intel e AMD2
PROCESSADORES INTEL E AMD
AGENDA










Introdução
Conceitos básicos Microprocessadores
Histórico dos processadores X86 (Intel e AMD)
Linha evolutiva dos processadores
Mercado de processadores
Breve Comparativo Intel x AMD
Resumo Processador Celeron
Processadores 64 bits
Conclusões
Bibliografia e sites relacionados
8088 /RESUMO
8086
EVOLUÇÃO INTEL X AMD
80286
80386
AMD 386
80486
AMD 486
Pentium
Pentium Pro
AMD K5
AMD K6
Pentium II
AMD K6-II
Pentium III
AMD K6-III
Celeron
(Pentiums limitados)
Pentium IV
Duron
Athlon
Semprom
EVOLUÇÃO X86
Nome
• 8086
Data
Transistores
1978
29K
– Processador de 16-bit. Base para o IBM PC & DOS
– Limitado a 1MB de espaço de endereçamento. DOS disponibiliza ao usuário
apenas 640K
• 80286
1982
134K
– Modo de endereçamento mais complexo, mas não muito útil
– Base para IBM PC-AT e Windows
• 386
1985
275K
– Extensão para 32 bits. Adicionado um novo tipo de endereçamento
– Capaz de rodar Unix (modos Real, Protegido)
EVOLUÇÃO X86
• Nome
Data
Transistores
• 486
1989
1.9M
• Pentium
1993
3.1M
• Pentium II/MMX 1997 4.5M
– Adicionada uma coleção especial de instruções para operar em vetores
de 64-bit de dados inteiros de 1, 2, ou 4 bytes
• PentiumPro
1995
6.5M
– Adionadas as instruções de mov condicional
– Grande mudança na microarquitetura
• Preempção de tarefas (saltos)
EVOLUÇÃO X86
• Nome
Data
Transistores
• Pentium III
1999
8.2M
– Adicionadas instruções “streaming SIMD” para operar sobre vetores de
128-bits de dados inteiro ou ponto flutuante de 1, 2 ou 4 bytes
• Pentium 4
2001
42M
– Adicionados formatos de 8-bytes e 144 novas instruções para o modo
streaming SIMD
EVOLUÇÃO AMD
1975 1979 1982
8080A
Transistores
5k
8086
286
29k
134k
1991
1993
Am386
Am486
AMD-K5™
275k
1.200k
3.500k
0.80um
10um
1995
0.35um
1997
1999
AMD-K6® AMD Athlon™
9.300k
22.000k
0.25um
0.18um
2003
2004
2002
AMD Athlon XP™
37.000k
0.13um
2005
+
0.13um
->
0.09um
100.000k Transistores
EVOLUÇÃO AMD
1991
1992
am386
1999
1993
1994
1995
1996
1997
1998
2002
2003
2004
2005
2006
am486
2000
2001
+
ARQUITETURA INTERNA DE
MICROPROCESSADOR
ARQUITETURA 8086
8086 - primeiro microprocessador
de 16 bits da Intel
– arquitetura de 16 bits
• comunicação com a memória em 16 bits (8086)
• capacidade máxima de memória de 1 MByte
• 14 registradores (4 dados, 4 endereços, 4 segmentos, ponteiro
do programa, flags)
• endereço físico = segmento * 16 + deslocamento
• 85 instruções básicas
• coprocessador: 8087 (67 instruções básicas)
• sem cache, sem memória virtual
– 8088 - mesma arquitetura, barramento externo de 8 bits
CARACTERÍSTICAS DA ARQUITETURA 8086
CARACTERÍSTICAS DA ARQUITETURA 8088
CARACTERÍSTICAS DA ARQUITETURA 8086
CARACTERÍSTICAS DA ARQUITETURA 8086
15
AX
BX
CX
DX
SP
BP
SI
DI
IP
FLAGS
CS
DS
SS
ES
8
AH
BH
CH
DH
7
0
AL
BL
CL
DL
acumulador
base
contador
dado
ponteiro para pilha
ponteiro base
índice fonte
índice destino
Dados
Endereços
apontador de instruções
flags
segmento de código
segmento de dados
segmento de pilha
segmento extra
Segmento
REGISTRADORES DE SEGMENTO 8086
• São registradores de endereços;
• Armazena endereços de programa e dados;
• Organização de memória:
– Cada byte na memória possui um endereços de 20 bits iniciando em 0
até 220-1 ou seja, 1M de memória endereçável;
– Endereços são representados por 5 dígitos hexadecimais; de 00000 FFFFF
– Problema: 20 bits de endereços é grande demais para ser colocado em
registradores de 16 bits;
– Solução: Segmentação de memória
•
•
•
•
Blocos de memória de 64K consecutivos (65.536);
Um número de segmento é um número de 16 bits;
Faixa de um endereços de um segmento vai de 0000 a FFFF
Em um segmento, uma posição de memória em particular é especificado
como sendo um offset (deslocamento);
• Um offset também tem faixa de 0000 a FFFF
CARACTERÍSTICAS DA ARQUITETURA 8086
SEGMENTAÇÃO DE MEMÓRIA NO 8086
F0000
E0000
8000:FFFF
D0000
C0000
B0000
A0000
one segment
90000
80000
70000
60000
8000:0250
50000
0250
40000
30000
8000:0000
20000
10000
00000
seg
ofs
GERAÇÃO DE ENDEREÇO FÍSICO
GERAÇÃO DE ENDEREÇO FÍSICO
• Registrador de segmento * 16 + offset
Offset Value (16 bits)
Segment Register (16 bits)
0000
Adder
Physical Address (20 Bits)
ORGANIZAÇÃO DE MEMÓRIA
Bloco
Dados
01
Área de memória para o usuário (64 Kb)
02
Área de memória para o usuário (128 Kb)
03
Área de memória para o usuário (192 Kb)
04
Área de memória para o usuário (256 Kb)
05
Área de memória para o usuário (320 Kb)
06
Área de memória para o usuário (384 Kb)
07
Área de memória para o usuário (448 Kb)
08
Área de memória para o usuário (512 Kb)
09
Área de memória para o usuário (576 Kb)
10
Área de memória para o usuário (640 Kb)
11
Memória de Vídeo
12
Memória de Vídeo
13
Área de Extensão da ROM
14
Área de Extensão da ROM
15
ROM-BIOS do sistema
16
ROM-BIOS do sistema e ROM-BASIC
MICROPROCESSADOR INTEL 80286
–
–
–
–
Praticamente a mesma arquitetura do 8086
Data bus 16 bits (D0 – D15), Address bus 24 bits (16Mb memória)
Modos real (8086) e protegido (memória vitual & 16Mb memória)
4 Unidades funcionais
•
•
•
•
–
–
–
–
–
–
–
–
EU – Unidade de execução de Instruções
BU – Unidade de Acesso e Controle de Barramento
IU – Unidade de decodificação de instruções
AU – Unidade de Formação de endereços
Comunicação com a memória em 16 bits
14 registradores (os do 8086)
Endereço físico ou virtual
15 instruções extras (92 + 15 = 107 instr. básicas)
Co-processador: 80287
Sem cache
Memória virtual segmentada (apenas no modo protegido)
Maior parte dos programas desenvolvidos para modo Real
MICROPROCESSADOR INTEL 80386
– Modos real (8086), protegido e virtual86
– 6 Unidades funcionais
•
•
•
•
•
•
EU – Unidade de execução de Instruções
BU – Unidade de Acesso e Controle de Barramento
IU – Unidade de decodificação de instruções
PU – Unidade de pre-fetch com fila de até 16 bytes
PgU – Unidade de formação de endereços (paging unit)
SU – Unidade de formação de endereços (segmentation unit)
– Comunicação com a memória
• 16 (SX) ou 32 bits (DX)
• Capacidade máxima de memória de 4 GByte
– 14 registradores
• do 8086, com 32 bits, e mais 2 regs. de segmento
– 44 instruções extras
• 107 + 44 = 153 instruções básicas
– Endereço físico ou virtual (64 TByte)
• Memória virtual segmentada (sempre) e paginada (opcional), ambas
apenas no modo protegido
MICROPROCESSADOR
INTEL
80386
31
16 15
8 7
0
EAX
EBX
ECX
EDX
AH
BH
CH
DH
AL
BL
CL
DL
ESP
EBP
ESI
EDI
ponteiro para pilha
ponteiro base
índice fonte
índice destino
apontador de instruções
flags
EIP
EF
CS
DS
SS
ES
FS
GS
acumulador
base
contador
dado
segmento de código
segmento de dados
segmento de pilha
segmento extra
segmento extra
segmento extra
MICROPROCESSADOR INTEL 80386
Conceito do Memória Virtual
grande espaço de endereçamento
endereço gerado
pelas instruções
sendo executadas
mapeamento
por hardware
pequeno
espaço de
endereçamento
MICROPROCESSADOR INTEL 80386
Questões da Memória Virtual:
•
quando mover um bloco da memória secundária para a memória
primária (real) ?
– por demanda
•
quando mover um bloco da memória real para a memória secundária?
– quando faltar espaço na memória real
•
qual o tamanho ideal de um bloco?
– constante (paginação) ou variável (segmentação)
•
onde colocar um novo bloco transferido para a memória principal?
– onde houver área livre (paginação) ou no “melhor” lugar (segmentação)
MICROPROCESSADOR INTEL 80386
Dinâmica da Memória Virtual:
• programa gera endereço virtual
– CPU transforma endereço virtual em endereço físico (hardware)
• bloco está na memória principal?
– Sim: calcular o endereço físico (hardware)
– Não: buscar o bloco da memória secundária (software)
• existe espaço para o bloco na memória principal?
– Sim: carregar o bloco e atualizar descritor (software)
– Não: retirar um outro bloco, carregar o bloco e atualizar descritores (software)
MICROPROCESSADOR INTEL 80386
Memória Virtual Segmentada: (Segmentação => Converte endereços
lógicos em endereços lineares)
CS
DS
SS
ES
...
Registrador de segmento
Deslocamento
15
4 3 0
31
(
g
l
Seletor ode tabela
(Globalbou Local)
(32 bits)
al
o
u
l
Descritor
o Endereço base
de segmento
c
(32 bits)
(8 bytes)
al
)s
Tabela de descritores
e
31
g
Endereço linear
GDTR ou LDTR
m
(Global ou Local)
+
0
endereço lógico
ou virtual
endereço linear
(ainda não é o físico)
0
(Caso a paginação não esteja sendo utilizada, se converte em endereço físico)
MEMÓRIA VIRTUAL SEGMENTADA
•
programa gera endereço virtual
– CPU transforma endereço virtual em endereço físico
•
segmento está na memória principal?
– Sim: calcular o endereço físico. Se este endereço estiver fora do segmento,
gerar erro
– Não: buscar o segmento da memória secundária
•
existe espaço suficiente para o o segmento na memória principal?
– Sim: carregar o segmento na “melhor posição” e atualizar descritor
– Não: retirar um (ou mais) segmentos, carregar novo segmento e atualizar
descritores
MEMÓRIA VIRTUAL PAGINADA
(Paginação => Converte endereços lineares em endereços físicos)
Endereço linear
31
22 21
12 11
0
Diretório
Página
Deslocamento
Diretório de Páginas
(PD)
Tabela de Páginas
(PT)
...
(PT)
...
PDE
(32bits)
PTE
(32 bits)
CR3
31
12 11
0
Endereço de page frame
Deslocamento
Tabelas
(1024 x 32)
Endereço físico
MEMÓRIA VIRTUAL PAGINADA
•
programa gera endereço virtual
– CPU transforma endereço virtual em endereço físico
•
página está na memória principal?
– Sim: calcular o endereço físico. Este endereço sempre está dentro da
página.
– Não: buscar a página da memória secundária
•
existe espaço suficiente para a página na memória principal?
– Sim: carregar a página em qualquer lugar e atualizar descritor
– Não: retirar uma página (é suficiente), carregar nova página e atualizar
descritores
MICROPROCESSADOR INTEL 80386
•
outras características
– Co-processador: 80387 (67 + 7 -1 = 73 instr. básicas)
– Sem cache
– TLB:
• pequena memória associativa que retém os últimos e mais freqüentes
endereços de página acessado
• uma pequena cache de endereços físicos
•
apareceram vários microprocessadores compatíveis no mercado
– AM386
MICROPROCESSADOR INTEL 80486
• Idêntico ao 386
– Modos real (8086), protegido e virtual86
– Comunicação com a memória em 32 bits
– Capacidade máxima de memória de 4 GByte
– 16 registradores (os do 80386, também em 32 bits)
– 6 instruções extras (151 + 6 = 157 instruções básicas)
– Endereço físico ou virtual
• Memória virtual segmentada
• e paginada (opcional)
– Co-processador: 80487 (para 80486SX) integrado no
80486DX
– Com cache de 8 KByte
FPU
MICROPROCESSADOR INTEL PENTIUM
•
Reestruturação do 486
– Modos real (8086), protegido e virtual86
– 16 registradores (os do 80386, também em 32 bits)
– Memória virtual segmentada e paginada
•
•
•
•
•
Comunicação com a memória em 64 bits
Capacidade máxima de memória de 4 GByte
5 instruções extras (157 + 5 = 162 instr. básicas)
FPU: coprocessador aritmético integrado
Cache de 16 KByte (2 x 8 KByte)
MICROPROCESSADOR INTEL PENTIUM
• 2 pipelines para inteiros, operando em paralelo
• cada pipeline inteiro consta de 5 estágios:
–
–
–
–
–
busca de instrução (a partir da cache de instruções),
decodificação de instrução,
geração de endereço,
execução,
escrita (write back).
• FPU também em pipeline (mas não em paralelo)
• operação super-escalar: mais de uma instrução
pronta em um ciclo de relógio
MICROPROCESSADOR INTEL PENTIUM
Cache Instr.
BTB
Buffer de
instruções
barramentos de 64 bits
externos e internos
FPU
reg.
stack
V-pipe
ALU ALU
BIU
U-pipe
+
÷
FPU-pipe
com circuitos
dedicados
para soma,
divisão e
multiplicação
bus interface
unit
caches separadas
dados e instr.
8 KB cada
Registradores
Cache Dados
2 pipelines paralelos
de 5 estágios
para inteiros
MICROPROCESSADOR INTEL PENTIUM PRO
(P6)
• Re-estruturação do Pentium (P5)
– Mesmas características de 80386 (mem. virtual) e do
Pentium (largura de dados de 64 bits)
– FPU
– cache de 16 KByte (2 x 8 KByte)
•
•
•
•
•
5 instruções extras (162 + 5 = 167 instr. básicas)
Operação super-escalar
14 unidades internas
Execução fora de sequência
Execução especulativa
Microprocessador Intel Pentium MMX
• Arquitetura do Pentium (P5)
–
–
–
–
–
Novo tipo de dado: “packed”
57 instruções extras (além das 167 instr. básicas)
Com cache de 32 KByte (2 x 16 KByte)
Operação super-escalar
Não possui as características do Pentium Pro (execução
fora de sequência, exec.especulativa)
– Instruções para processamento de vetores (8 bytes, 4
palavras ou 2 palavras duplas)
– 8 novos registradores lógicos (MMX0 a MMX7)
Intel Pentium II (P6)
• Pentium Pro com MMX
–
–
–
–
–
Mesmas características do Pentium Pro
Instruções MMX
Cinco unidades internas
Pentium
Execução fora de sequência
Execução especulativa
MMX
Pro
PentiumII
Intel Pentium III
– Novo tipo de dado: “floating packed” (Ponto flutuante)
– 70 instr. extras (além das 167 básicas e 57 MMX)
– Instruções para processamento de vetores inteiros (MMX)
ou de ponto flutuante (SSE)
– 8 novos registradores físicos (XMM0 a XMM7), de 128 bits,
para as instruções SSE
– No de série do processador (Inst. CPUID)
Intel Pentium 4
• Lançado em novembro de 2000
 Pipeline de 20 estágios (“hyper pipeline”)
 Até 128 instruções em execução (3 vezes mais que
no Pentium III)
 Algoritmo melhorado para previsão de desvios, com
tabela de 4K
 Novo sistema de cache de nível 1
 Cache de execução de 12 K micro-operações
(Execution Trace Cache)
 Cache de dados de 8 KBytes
Intel Pentium 4
• Instruções SSE2 (Streaming SIMD Extensions 2) 144 novas instruções
– 67 instruções para vetores de pontos flutuante de precisão
dupla (64 bits)
– 69 novas instruções MMX, para vetores inteiros de 128 bits
(utilizando os registradores XMM)
– 8 instruções para controle de cache
 Barramento do sistema “Net Burst” de 400 MHz
Intel Pentium 4 - Diagrama Resumido
MERCADO DE PROCESSADORES

Low –End

Destinado à construção de máquina de baixo poder computacional

Usuário iniciante


Mid-Range

Destinado à construção de máquinas de maior poder computacional

Ferramentas CAD, design house


(Celeron D (Intel), Semprom (AMD)
Pentium IV (Intel), Athlon (AMD)
High-End

Destinado à maquinas de alto poder computacional e compartilhamento


Servidores de Rede
Gerenciamento de Clusters

Pentium HT (Intel), Athlon 64 D (AMD)
COMPARATIVO ENTRE PROCESSADORES INTEL E AMD

Intel foi isoladamente a líder em fabricação de CPUs até
início dos anos 90




Intel Pentium X AMD AM5x86
Intel Pentium, Pentium PRO X AMD K5


Vantagem AMD: Mais barato
Intel Celeron X AMDK6


Equivalente mas lançado 3 anos depois do Pentium
Intel Pentium MMX, II X AMD K6


Até a fabricação do 80286 Não houve concorrência da AMD
Concorrência começou devido a fabricação do AM386 DX
Celeron:Versão “light” do Pentium II
Intel Celeron X AMD Sempron
ESTADO DA ARTE EM PROCESSADORES
• AMD
• Intel
• Desktop: AMD Athlon 64 FX,
AMD Athlon 64
• Server: AMD Opteron
• Desktop: Intel Pentium 4 w/
HT, Intel Pentium 4 Extreme
Edition
• Server: Intel Itanium 2, Xeon
RESUMO PROCESSADORES CELERON

Os processadores Celeron diferenciam-se dos processadores
Pentium II, III e IV pela limitação das seguintes características:



Tamanho da Cache L2
Clock interno
Clock do barramento externo
RESUMO PROCESSADORES CELERON
Modelo
Nomecódigo
Baseado no
Cache
L1
Cache
L2
Tecnolo
gia
Barramento
Externo
Soquete
Celeron SEPP
Convingto
n
32KB
-
0.25µm
66MHz
Slot 1
Celeron A
Mendocino
32KB
128KB
0.25µm
66MHz
Slot 1
Celeron PPGA
Mendocino
32KB
128KB
0.25µm
66MHz
Soquete 370
Celeron
Coppermine
Coppermi
ne
32KB
128KB
0.18µm
66MHz /
100MHz
Soquete 370
Celeron
Tualatin
Tualatin
32KB
256KB
0.13µm
100MHz
Soquete 370
Celeron
Willamette
Willamette
8KB
128KB
0.18µm
400MHz
Soquete 478
Celeron
Northwood
Northwoo
d
8KB
128KB
0.13µm
400MHz
Soquete 478
Celeron D
Prescott
Pentium II
com
núcleo
Deschutes
Pentium II
com
núcleo
Deschutes
Pentium II
com
núcleo
Deschutes
Pentium III
com
núcleo
Coppermine
Pentium III
com
núcleo
Tualatin
Pentium 4
com
núcleo
Willamette
Pentium 4
com
núcleo
Northwood
Pentium 4
com
núcleo
Prescott
8KB
256KB
0.09µm
533MHz
Soquete 478 /
Soquete 775
RESUMO PROCESSADORES CELERON D
Processador
Clock Interno
Clock Externo
Cache L2 Soquete
Hyper-Threading
350
3,2 GHz
533 MHz
256 KB
478 ou 775
Não
345
3,06 GHz
533 MHz
256 KB
478 ou 775
Não
340
2,93 GHz
533 MHz
256 KB
478 ou 775
Não
335
2,80 GHz
533 MHz
256 KB
478 ou 775
Não
330
2,66 GHz
533 MHz
256 KB
478 ou 775
Não
325
2,53 GHz
533 MHz
256 KB
478 ou 775
Não
RESUMO PROCESSADORES SEMPRON
Processador
Clock Interno
Clock Externo
Cache L1 Cache L2 Soquete
Sempron 2200+
1,50 GHz
333 MHz
128 KB
256 KB
462
Sempron 2300+
1,58 GHz
333 MHz
128 KB
256 KB
462
Sempron 2400+
1,67 GHz
333 MHz
128 KB
256 KB
462
Sempron 2500+
1,70 GHz
333 MHz
128 KB
256 KB
462
Sempron 2600+
1,83 GHz
333 MHz
128 KB
256 KB
462
Sempron 2800+
2 GHz
333 MHz
128 KB
256 KB
462
Sempron 3000+
2 GHz
333 MHz
128 KB
512 KB
462
RESUMO PROCESSADORES CELERON

Exemplo: Celeron D





16Kb Cache L1
256Kb Cache L2
Clock ext. 533MHz (Burst 133MHz)
Clock int. 2,13 GHz a 3,2 GHz
Suporte Hyper – Threading => não disponível
INTEL EXTREME EDITION
INTEL EXTREME EDITION
Características:
•Primeiro processador desktop da Intel com tecnologia dual-core.
•Basicamente é evolução do Pentium IV
•Hyper-Threading (HT) : 2 processadores (lógico + Físico)
•Processador dual-core : 4 processadores (2 lógicos + 2 Físicos)
•Hyper-Threading + dual-core: execução de 4 threads
simultaneamente
INTEL EXTREME EDITION
•Processador “lógico”
•barramentos, caches e unidades de execução são
compartilhados
•cada processador lógico tem estado próprio, bem
como registradores de propósitos gerais.
•Processador físico
•tem seus próprios conjuntos de registradores e
caches.
INTEL EXTREME EDITION
•Cache
•2 caches de 16KB (L1).
•2 caches de 1 MB (L2), sendo 1 MB para cada core.
•principal vantagem: redução do tráfego do barramento.
•Trace cache
•cada core tem uma trace cache de até 12KB de microoperações já decodificadas.
•principais vantagens: remoção da etapa de decodificação em
loops e em execução de desvios.
INTEL EXTREME EDITION
•Segurança: bit para desabilitar execução:
•recurso aliado ao S.O
•define áreas ativas ou não-ativas de memória.
•Conjunto de instruções
•instruções dedicadas ao processamento de imagens e
compressão de dados
•mantém compatibilidade com IA-32.
•Gerenciamento de energia: capacidade de desligamento de
pinos e outras partes do chip.
INTEL EXTREME EDITION
Perspectivas:
•Aumento da velocidade do barramento PCI e AGP (média de 3.5
vezes).
•Facilidades para os softwares multi-threads do futuro.
•Dual-core : será base para as pesquisas da Intel nas tecnologias
Hyper-Threading e EM64T.
AMD ATHLON 64
AMD ATHLON 64

Resumo Processadores AMD Atuais

Desktop
 Semprom
(Low End)
 Athlon 64 (Mid Range)
 Athlon 64 FX
 Athlon 64 X2

Notebooks
 Athlon
64 Mobile
 Turion 64

Servidores
 Opteron
AMD ATHLON 64
1975 1979 1982
8080A
Transistores
5k
8086
286
29k
134k
1991
1993
Am386
Am486
AMD-K5™
275k
1.200k
3.500k
0.80um
10um
1995
0.35um
1997
1999
AMD-K6® AMD Athlon™
9.300k
22.000k
0.25um
0.18um
2003
2004
2002
AMD Athlon XP™
37.000k
0.13um
2005
+
0.13um
->
0.09um
100.000k Transistores
L3
UCP
Interface
Gráfica
AGP
‘North
Bridge’
Bus PCI
Adaptador
SCSI
USB
‘South
Bridge’
REDE
Bus SCSI
E/ISA
HD
LAN
CD-ROM
HD
CD-ROM
COM
LPT
Scaner
ROM
BIOS
PCI
I/O
Bus E / ISA
Mouse
Super
I/O
PCMCIA
Floppy
Interface
Som
RAM
L1/L2
RAM
AMD ATHLON 64
AMD ATHLON 64

Novas características incorporadas








1MB L2 Cache
Controlador de Memória DDR incorporado
HyperTransport Channel
Menor consumo de potencia
Novo Core Processador
Registradores em dobro
Pipeline maior (10 12 estágios)
Maior “Look Aside Buffer” (TLB)
AMD64 Architecture
Register Differences: AMD64 vs x86
63
In x86
• AMD64
Added by AMD64
– 64-bit integer registers
– 48-bit Virtual Address
– 40-bit Physical Address
• REX - Register Extensions
127
S
S
E
31
RAX
15
EAX
7
AH AL
0
MMX0
0
79
G
P
R
EAX
0
x
8
7
– Sixteen 64-bit integer registers
– Sixteen 128-bit SSE registers
MMX7
MMX8
• SSE2 Instruction Set
XMM8
EDI
R8
EIP
– Double precision scalar
and vector operations
– 16x8, 8x16 way vector
MMX operations
– SSE1 already added with
MMX15
R15
OS for x64-based Systems
32-bit and 64-bit on a single platform
Um Processador AMD64 pode rodar sistemas operacionais de 32 ou 64 bits
START
BOOT UP
Using 32 bit BIOS
Load 32 bit OS
Run 32 bit
Applications
32-bit
Look
at OS
64-bit
Load 64 bit OS
Run 32 & 64
bit apps
Características da arquitetura AMD64
•
Processamento nativo em 32 e 64 bits
•
Controlador de memória DDR integrado ao processador
•
Tecnologia Hyper Transport
•
Cool’n’quiet (PowerNow! para servers e mobile)
•
Proteção anti-vírus por hardware
•
Benefícios
• Excelente desempenho
• Melhor custo/benefício
• Sistemas mais confiávies
• Preparado para software de 64 bits
Arquitetura do sistema com AMD64
Sistema típico
Sistema AMD64
DDR
CPU
CPU
AMD64
PCI-X
North
Bridge
DDR
PCI
Bridge
PCI Express
PCI-X
PCI Bridge Túnel HT
IDE, FDC,
USB, Etc.
South
Bridge
PCI Express
PCI
IDE, FDC,
USB, Etc.
I/O
Hub
PCI
Processadores AMD64 de dois núcleos
Diferenças na fabricação e compatibilidade de socket e placa
Processador “single-core”
Núcleo
•
•
•
•
•
Athlon 64
Athlon 64 FX
Sempron
Opteron
Turion
• Athlon 64 X2
• Opteron
Processador “dual-core”
Núcleos
Placa mãe
Processadores AMD64 de dois núcleos
Diferenças na fabricação e compatibilidade de socket e placa
Fluxo de Dados em um AMD64 CPU
Bussing Unit
L2 Cache
HyperTransport Technology BUS
L1 Inst. Cache
1MB
Processor Core
Load/Store
Unit
L1 Data Cache
Crossbar
Switch
128-bits wide
Memory
Controller
System Request
Queue (SRQ)
144-bit wide
DRAM interface
DRAM
Controller
Cache, Load/Store &
Bussing Unit
64-bits wide
Integrated North Bridge
FP Unit
Execution Unit
Fetch Scan Align
AMD64
CPU
1MB
Load/Store
Unit
Bussing Unit
Bussing Unit
L2 Cache
L1 Inst. Cache
Load/Store
Unit
L1 Data Cache
1MB
HyperTransport Technology BUS
L1 Data Cache
L2 Cache
128-bits wide
Crossbar
Switch
System Request
Queue (SRQ)
Memory
Controller
L1 Inst. Cache
128-bits wide
64-bits wide
DRAM
Controller
64-bits wide
144-bit wide
DRAM interface
Arquitetura Interna
FP Unit
Execution Unit
Fetch Scan Align
AMD64
CPU
FP Unit
Execution Unit
Fetch Scan Align
AMD64
CPU
Processadores AMD Sempron
•
Processamento nativo em 32 e 64 bits
•
Controlador de memória DDR integrado ao processador
•
Barramento de sistema Hyper Transport
•
Cool’n’quiet para modelos acima do Sempron 2800+
•
Proteção anti-vírus por hardware
•
Acesso à memória em 64 bits
•
Computação do dia-a-dia
Processadores AMD Athlon 64
•
Processamento nativo em 32 e 64 bits
•
Controlador de memória DDR integrado ao processador
•
Barramento de sistema Hyper Transport
•
Cool’n’quiet - Gerenciamento avançado de energia
•
Proteção anti-vírus por hardware
•
Excelente custo/benefício
•
AMD Athlon 64 FX:
• Campeão em aplicações single thread
• Jogos
Processadores AMD Athlon 64 X2
•
Dois núcleos AMD64 (Dual Core)
•
Processamento nativo em 32 e 64 bits
•
Controlador de memória DDR integrado ao processador
•
Barramento de sistema Hyper Transport de 2.0GHz
•
Cool’n’quiet - Gerenciamento avançado de energia
•
Proteção anti-vírus por hardware
•
Acesso à memória em 128 bits
•
Alto desempenho multi-tarefa
Processadores AMD Opteron
•
Para servidores com 1, 2, 4 ou 8 processadores
•
Processamento nativo em 32 e 64 bits
•
Controlador de memória DDR integrado ao processador
•
Barramento de sistema Hyper Transport – Sem gargalos de FSB
•
Power Now! - Gerenciamento avançado de energia
•
Acesso à paralelo à memória, em 128 bits
•
Inclui modelos Dual Core
•
Excelente consumo de energia
Funcionamento de servidor Dual
Alta demanda - controlador de memória no chipset
Funcionamento de servidor Dual
Alta demanda – arquitetura AMD64
Sistema Quad-processado
Solução do problema de gargalo no chipset/FSB
Típico sistema multiprocessado
Processor
Processor
Processor
Sistema AMD Opteron™
Processor
DDR
DDR
DDR
Memory
Expander
North
Bridge
Memory
Expander
IDE, FDC,
USB, Etc.
South
Bridge
PCI-X
Bridge
PCI-X
PCI-X
Bridge
PCI-X
PCI-X
Bridge
PCI-X
PCI
AMD
Opteron™
AMD
Opteron
AMD
Opteron
AMD
Opteron
PCI-X
PCI-X
Bridge
PCI-X
Bridge
Other
I/O
Other
Bridge
DDR
DDR
DDR
IDE, FDC,
USB, Etc.
I/O
Hub
PCI-X
PCI
Multiprocessamento com CPUs de núcleo duplo
Necessidade da evolução da arquitetura de interconexão
CPU CPU CPU
CPUCPU
8 GB/S
CPU
SRQ
SRQ
Crossbar
Crossbar
Mem.Ctrlr
HT
Mem.Ctrlr
HT
8 GB/S
I/O Hub
Memory
PCI-E
Controller
Bridge
Hub
PCI-E
Bridge
PCI-E
Bridge
PCI-E
Bridge
8 GB/S
PCI-E
Bridge
PCI-E
Bridge
8 GB/S
USB
I/O Hub
PCI
Arquitetura x86 tradicional
AMD64 com DirectConnect
• FSB compartilhado por CPUs, Memória e I/O
• Arquitetura x86 padrão de mercado
• Mais CPUs ≠ Maior performance
• Sem gargalo de FSB
• Menor latência no acesso à memória
O futuro do Microprocessador
Mais transistores, mais núcleos, mais threads
•
•
•
•
CPU de 16 núcleos
Mais núcleos
Núcleos especializados
Mais controladores integrados
...
BENCHMARK AMD X INTEL
BENCHMARK AMD X INTEL
CONCLUSÕES

Processadores AMD atuais são mais indicados
para aplicativos (Business), Jogos, Aplicativos
2D com melhor taxa de preço

Processadores Intel estão mais indicados para
aplicativos 3D e Multitasking
BIBLIOGRAFIA E SITES RECOMENDADOS
Patterson, D. - Organizacao e projeto de computadores - a interface hard/software
Torres, G. – Hardware – Curso completo
Weber, R. – Arquitetura de computadores pessoais
Intel Home page: http://www.Intel.com
AMD Home Page: http://www.amd.com