Académique Documents
Professionnel Documents
Culture Documents
129
Arquitetura de Computadores
130
Arquitetura de Computadores
1999
9.500.000
0,25
64 bits
36 bits
64 GB
450 600 MHz
100 ou 133 MHz
26 a 36 W
32 Kb
512KB, (half speed)
Clock Externo
100 MHz
100 MHz
133 MHz
100 MHz
100 MHz
133 MHz
Multiplicador
4,5 x
5x
4x
5,5 x
6x
4,5 x
Potncia
26,6 W
29,3 W
31,1 W
32,2 W
36,1 W
36,1 W
131
Arquitetura de Computadores
1999
28.000.000
0,18
64 bits
36 bits
64 GB
500 1.133 MHz
100 ou 133 MHz
16 a 36 W
32 Kb
256KB, (full speed)
Processador
Pentium III/1.13
Pentium III/1.26
Clock Interno
1.13 GHz
1.26 GHz
Clock Externo
133 MHz
133 MHz
Cache L2
512 KB
512 KB
CPUID
06Bxh
06Bxh
132
Arquitetura de Computadores
2001
28.000.000
0,13
64 bits
36 bits
64 GB
1.133 MHz e superiores
133 MHz
A partir de 29W
32 Kb
256KB ou 512 KB
Desempenho
Existem modelos diferentes de Pentium III com a mesma freqncia de
operao sendo vendidos no mercado. Um exemplo marcante o do Pentium III
de 600 MHz, que encontrado em quatro verses diferentes: Pentium III-600,
Pentium III-600B, Pentium III-600E e Pentium III-600EB.
Os modelos que operam externamente a 133 MHz oferecem um
desempenho superior aos modelos que operam a 100 MHz, j que a taxa de
transferncia de acesso memria passar de 800 MB/s (100 MHz) para 1.064
MB/s (133 MHz). Assim, os processadores Pentium III-600B e Pentium III-600EB
tm desempenho maior do que os processadores Pentium III-600 e Pentium III600E, mesmo operando internamente mesma freqncia de operao.
Segundo (TORRES, 2001), o cache L2, apesar de ter sido diminudo de
tamanho nos modelos E, passando de 512 KB para 256 KB, a sua freqncia de
operao aumentou. Foi verificado em testes que o desempenho dos modelos
com 256 KB de cache similar aos dos modelos com 512 KB de cache por esse
motivo.
133
Arquitetura de Computadores
Nmero de Srie
A idia principal de colocar um nmero de srie dentro de um processador
e poder executar uma identificao remota atravs da Internet, para que um
determinado site quem o usurio. As aplicaes prticas so enormes, a
comear por no precisar fazer uma identificao manual do usurio em
servidores seguros em sites de acesso restrito.
A Intel promove a idia de que o Pentium III o melhor processador para
navegar na Internet: quanto mais mquinas equipadas com processadores
Pentium III e posteriores existirem conectadas Internet, melhor para Intel, pois
facilita o trabalho de vender uma soluo de servidor de comrcio eletrnico
usando tecnologia para empresas de comrcio eletrnico.
Esse nmero gravado dentro da pastilha de silcio do processador e no
existem dois processadores com nmeros de srie iguais, o que parece ser uma
soluo bastante inteligente. Entretanto, essa soluo apresenta uma polmica
em torno da privacidade, pois alguns sites da Internet poderiam buscar
informaes sobre o usurio sem a permisso do mesmo, pois para ler o nmero
de srie do processador necessrio executar uma rotina no micro do usurio.
Quando a solicitao de leitura do nmero de srie do processador for
efetuada por um site, o browser perguntar se o usurio permite essa leitura. O
nmero de srie pode ser desabilitado, atravs do setup da placa-me.
134
Arquitetura de Computadores
135
Arquitetura de Computadores
Desempenho
Placa-me
A placa-me utilizada pelo processador Pentium III depende de seu modelo.
A princpio, processadores Pentium III SECC-2 utilizam placas-me slot 1 que o
mesmo tipo de placa-me desenvolvida para o processador Pentium II, e
processadores Pentium III FC-PGA utilizam placas-me soquete 370, que o
mesmo tipo de placa-me desenvolvida para o processador Celeron.
Alm de ter o mesmo tipo de conector usado pelo processador, a placame precisa ser capaz de fornecer a freqncia de operao externa requerida
pelo processador: 100 MHz ou 133 MHz, dependendo do modelo. Assim, nem
todas as placas-me slot 1 servem para os processadores Pentium III SECC-2,
bem como nem todas as placas-me soquete 370 servem para os processadores
Pentium III FC-PGA. Os modelos de Pentium III de 100 MHz necessitam
obrigatoriamente de memrias do tipo PC-100, enquanto os modelos de 133 MHz
devem utilizar memrias PC-133.
136
Arquitetura de Computadores
Tecnologia
0,25 m
0,18 m
0,18 m
0,18 m
0,18 m
Clock Interno
500 MHz
500 MHz
500 MHz
550 MHz
550 MHz
550 MHz
600 MHz
667 MHz
733 MHz
800 MHz
866 MHz
933 MHz
1000 MHz
700 MHz
700 MHz
900 MHz
Cache L2
512KB, 1MB, 2 MB (no integrada)
256 KB (integrada)
1 MB, 2 MB (integrada)
256 KB (integrada)
2MB (integrada)
Clock Externo
100 MHz
100 MHz
100 MHz
100 MHz
100 MHz
100 MHz
100 MHz
133 MHz
133 MHz
133 MHz
133 MHz
133 MHz
133 MHz
100 MHz
100 MHz
100 MHz
Multiplicador
5x
5x
5x
5,5 x
5,5 x
5,5 x
4,5 x
5x
5,5 x
6x
6,5 x
7x
7,5 x
7x
7x
9x
Potncia
40 W
47 W
39,6 W
37,8 W
37,8 W
43,2 W
21,6 W
23,9 W
26,2 W
28,5 W
30,8 W
33,2 W
34,6 W
33,2 W
33,2 W
40,8 W
137
Arquitetura de Computadores
138
Arquitetura de Computadores
Hiperpipeline
O pipeline dos processadores de 7 gerao muito maior, isto , tem
muito mais estgios que o pipeline dos processadores de 6 gerao. Enquanto a
execuo de uma instruo em processadores de 6 gerao dividida em 11
etapas, nos processadores de 7 gerao a execuo de uma instruo dividida
em 20 etapas (no 486 e no Pentium as instrues eram executadas em apenas
cinco etapas).
Por ter um nmero to alto de estgios, a princpio uma instruo em um
processador Pentium 4 demora mais tempo para ser executada do que seria em
um processador Pentium III! Basta lembrar que cada etapa demora pelo menos 1
pulso de clock. Dessa forma, uma instruo demora no Pentium 4 no mnimo 20
pulsos de clock para ser executada, enquanto que no Pentium III uma instruo
demora no mnimo 11 pulsos de clock. claro que esta comparao terica,
pois no leva em conta os demais recursos presentes na arquitetura do
processador criados para o aumento de desempenho, justamente para compensar
esse aumento no tamanho do pipeline. Um pipeline to grande quanto esse
classificado como hiperpipeline.
Se por um lado um pipeline com muitos estgios traz a desvantagem de
fazer com que uma instruo demore muito tempo para ser totalmente
processada, por outro permite que o processador tenha um clock interno maior.
Esse o motivo tcnico pelo qual os projetistas dessa arquitetura optaram por um
hiperpipeline.
A grande diferena entre os dois pipelines a ausncia, nos processadores
de 7 gerao, das etapas de decodificao. Isso ocorre porque os processadores
de 7 gerao, em vez de um cache L1 de instrues, tm um cache de
microinstrues, que armazena as microinstrues j decodificadas. Assim,
quando h um erro na previso de desvio, o processador no precisa decodificar
novamente as instrues, as mesmas j esto decodificadas no cache de
microinstrues.
139
Arquitetura de Computadores
Arquitetura de Computadores
141
Arquitetura de Computadores
Cache L1
A arquitetura usada pelo cache de memria L1 completamente diferente.
O cache de dados conectado ao cache L2 atravs de um caminho de 256 bits,
permitindo que o desempenho nessa comunicao seja quatro vezes maior do
que o desempenho dos processadores anteriores, que usam um caminho de 64
bits. Em um processador Pentium 4 de 1,5 GHz, a taxa de transferncia entre o
cache L2 e o cache L1 de dados de 48 GB/s, enquanto em um hipottico
processador Pentium III de 1,5 GHz essa taxa seria de 12 GB/s.
J o cache de instrues foi alterado de local. Em todos os processadores
anteriores, o cache L1 de instrues era colocado na entrada da unidade de busca
de informaes. Assim, essa unidade buscava instrues desse cache. Caso a
instruo necessria no estivesse no cache, a instruo teria de ser buscada do
cache L2 e, caso tambm no estivesse no cache L2, ento a instruo teria de
ser lida diretamente da memria RAM.
Nos processadores de 7 gerao, o cache L1 de instrues passou a estar
entre o decodificador de instrues (o decodificador CISC/RISC) e as unidades de
execuo, passando a ser chamado de cache de microinstrues (execution trace
cache). Em vez de armazenar instrues a serem codificadas, o cache de
instrues passa agora a armazenar instrues j decodificadas. Esse cache
capaz de armazenar 12.288 microinstrues RISC. Como cada microinstruo
RISC dos processadores Intel de 7 gerao de 100 bits, ento o cache de
microinstrues de 150 KB.
Essa mudana na arquitetura do cache o torna muito mais rpido,
especialmente quando h um loop (while, for e repeat) no programa, o que uma
situao muito comum. Nos processadores anteriores, quando havia um loop no
programa, as instrues pertencentes a um loop teriam de ser decodificadas uma
a uma novamente. Na arquitetura de 7 gerao, um loop faz com que as
instrues sejam buscadas diretamente no cache de microinstrues, sem
necessitar uma nova decodificao, j que as mesmas foram recentemente
decodificadas e, com isso, ainda esto armazenadas nesse cache.
142
Arquitetura de Computadores
Decodificador CISC/RISC
Ao contrrio dos processadores de 6 gerao, o decodificador CISC/RISC
dos processadores de 7 gerao tem apenas uma nica unidade de
decodificao. O decodificador dos processadores de 6 gerao tinha trs
unidades de decodificao, o que permitia a decodificao simultnea de at trs
instrues x86 em microinstrues RISC.
A princpio, o fato de os processadores de 7 gerao s terem um nico
decodificador pode parecer uma desvantagem em comparao aos processadores
de 6 gerao, porm nos processadores de 7 gerao as instrues x86 so
decodificadas menos vezes do que nos processadores de 6 gerao, por conta
da existncia do cache de microinstrues.
5.8.2 Pentium 4
O processador Pentium 4 o primeiro processador Intel de 7 gerao
lanado. Suas caractersticas so:
143
Arquitetura de Computadores
144
Arquitetura de Computadores
Placa-me
A figura abaixo mostra uma placa-me com soquete 423.
Tecnologia HyperThreading
A tecnologia HyperThreading, desenvolvida pela Intel, mais uma tcnica
criada para oferecer maior eficincia na utilizao dos recursos de execuo do
processador. Segundo a Intel, a HyperThreading oferece um aumento de
desempenho de at 30% dependendo da configurao do sistema.
A tecnologia HyperThreading simula em um nico processador fsico dois
processadores lgicos. Cada processador lgico recebe seu prprio controlador
de interrupo programvel (APIC) e conjunto de registradores. Os outros
recursos do processador fsico, tais como, cache de memria, unidade de
execuo, unidade lgica e aritmtica, unidade de ponto flutuante e barramentos,
so compartilhados entre os processadores lgicos.
Em termos de software, significa que o sistema operacional pode enviar
tarefas para os processadores lgicos como se estivesse enviando para
processadores fsicos em um sistema de multiprocessamento.
145
Arquitetura de Computadores
146
Arquitetura de Computadores
Clock Interno
1300 MHz
1400 MHz
1500 MHz
1600 MHz
1700 MHz
1800 MHz
2000 MHz
2200 MHz
2260 MHz
2400 MHz
2400 MHz
2500 MHz
2530 MHz
2600 MHz
2660 MHz
2800 MHz
3000 MHz
3060 MHz
Clock Externo
400 MHz
400 MHz
400 MHz
400 MHz
400 MHz
400 MHz
400 MHz
400 MHz
533 MHz
400 MHz
533 MHz
400 MHz
533 MHz
400 MHz
533 MHz
533 MHz
800 MHz
533 MHz
Voltagem
1.75 V
1.75 V
1.75 V
1.75 V
1.75 V
1.75 V
Multiplicador
13 x
14 x
15 x
16 x
17 x
18 x
20 x
22 x
17 x
24 x
18 x
25 x
19 x
26 x
20 x
21 x
15 x
23 x
Potncia
51,6 W
54,7 W
57,8 W
61,0 W
64,0 W
66,7 W
147
Arquitetura de Computadores
148
Arquitetura de Computadores
149
Arquitetura de Computadores
Processador Pentium 4
Lanamento
Transistores
Tecnologia
Barramento de dados
Barramento de endereos
Capacidade de endereamento
Clock interno
Clock externo
Consumo
Cache L1
Cache L2
2000
42.000.000
0,18 e 0,13
64 bits
36 bits
64 GB
1.300 MHz e superiores
400 MHz
A partir de 51W
8 KB + 12 KB (microoperaes)
256KB
150
Arquitetura de Computadores
Compatibilidade
Os processadores Pentium 4 com ncleo Prescott continuam usando o
tradicional soquete 478 do Pentium 4, significando que esta nova safra de
processadores pode ser instalada nas placas-me j existentes desde que ela
seja compatvel com o barramento externo de 800 MHz e consiga fornecer a
tenso e corrente requeridas pelo novo processador.
Desempenho
Os modelos com ncleo Prescott so mais rpidos do que os modelos com
ncleo Northwood quando rodando sob um mesmo clock (isto , o Pentium 4 3,2
GHz "E" mais rpido do que o Pentium 4 3,2 GHz), pois h diferenas internas
significativas que aumentaram o desempenho do Pentium 4 Prescott (Pentium 4
"E").
151
Arquitetura de Computadores
Gerenciamento Trmico
O Pentium 4 (todos os modelos) diminuem automaticamente o clock do
processador caso detectem superaquecimento do processador. Diminuindo o
clock, a potncia dissipada menor e, com isto, a temperatura do processador cai.
Mas at agora, esta diminuio de clock estava exclusivamente conjugada
temperatura do processador.
152
Arquitetura de Computadores
Potncia
64 W
89 W
153
Arquitetura de Computadores
A Intel lanou o Pentium 4 de 64 bits para concorrer de igual para igual com
o Athlon 64 da AMD. Foram lanados os seguintes modelos: 630 (3 GHz), 640
(3,2 GHz), 650 (3,4 GHz), 660 (3,6 GHz) e 670 (3,8 GHz). As principais
caractersticas desses processadores so:
Potncia
Os processadores Pentium 4 630, 640 e 650 dissipam uma potncia
mxima de 84 W, enquanto os modelos 660 e 670 esse nmero pula para
impressionantes 115 W.
Nomenclatura
Os processadores Pentium 4 com tecnologia de 64 bits possuem sua
numerao comeando por "6", enquanto os processadores sem esta
caracterstica comeam por "5". Assim, fica fcil saber se o Pentium 4 tem ou no
154
Arquitetura de Computadores
esta caracterstica. Por exemplo, tanto o Pentium 4 540 quanto o 640 rodam a 3,2
GHz, mas o 640 tem a tecnologia de 64 bits e as demais caractersticas no
presentes em outros Pentium 4 em especial a tecnologia SpeedStep e a
memria cache L2 de 2 MB.
Tecnologia SpeedStep
Outra novidade dos processadores Pentium 4 da srie 6 a tecnologia
SpeedStep, presente nos processadores Intel voltados para notebooks. Esta
tecnologia permite diminuir o clock do processador e com isso o consumo do
micro e o calor gerado e a velocidade da ventoinha (significando menos barulho)
em momentos em que o usurio no esteja usando o seu micro no mximo de sua
capacidade.
155
Arquitetura de Computadores
Clock
3.0 GHz
3.2 GHz
3.4 GHz
3.6 GHz
3.8 GHz
Cache L2
2 MB
2 MB
2 MB
2 MB
2 MB
156
Arquitetura de Computadores
157
Arquitetura de Computadores
dessa traduo pode fazer com que os programas IA-32 executem mais lento em
processadores IA-64 do que em processadores IA-32 de mesmo clock.
Barramento externo
Instrues IA-64
Instrues IA-32
Tradutor IA-32/IA-64
Ncleo IA-64
158
Arquitetura de Computadores
159
Arquitetura de Computadores
160
Arquitetura de Computadores
161
Arquitetura de Computadores
162
Arquitetura de Computadores
1.464
Memria
2,6 Terabytes
Armazenagem 75 Terabytes
Desempenho
3,88 Teraflops
Potncia
486 kW
Preo
US$ 94 milhes
Arquitetura de Computadores
Arquitetura de Computadores
constituiro o estado final do computador, ocupando uma rea menor que 2.000
ps quadrados.
165
Arquitetura de Computadores
166
Arquitetura de Computadores
Concluso Parcial
Observa-se claramente que os grandes computadores caminham para o
processamento paralelo. Basicamente, o poder est vindo, no dos megahertz do
processador, mas da quantidade de processadores que em conjunto resolvem um
determinado problema. Isto significa que o tamanho do gro de processamento
ser cada vez menor e os processos cada vez mais acoplados. Como substituio
para o atual modelo de processamento e esperana para os novos computadores,
surge o processador quntico. No prximo nmero veremos alguns computadores
Cray e estudaremos dois processadores simples, porm inovadores.
Tabela de Multiplicadores
Multiplicador Abreviatura Valor
Kilo
10^3
Mega
10^6
Giga
10^9
Tera
10^12
Peta
10^15
167
Arquitetura de Computadores
168