O sucessor do Pentium MMX é o Pentium Pro que foi apresentado em Setembro de 1995. O encapsulamento é de 387 pinos e usa o socket 8, pelo que não é compatível a nível de pinos com os seus antecessores (figs. 3.31 e 3.32).
Figura 3.31 – Pentium Pro
Figura 3.32 – Socket 8
O integrado é construído com o formato de um módulo multichip, a que a Intel chamou Dual Cavity PGA. No seu interior tem dois chips, um com o processador propriamente dito e no outro está a cache L2 de 256 KB ou 512 KB. O processador tem 5,5 milhões de transístores, enquanto que para a memória L2 de 256 KB tem 15,5 milhões e a de 512 KB 31 milhões de transístores, o que dá um impressionante total de 36,5 milhões de transístores no caso de ter 512 KB de cache L2.
A arquitectura do Pentium Pro inclui três pipelines, o que lhe permite executar múltiplas instruções por ciclo, incluindo também uma cache L1 de 16 KB dividida, sendo 8 KB em modo “two-way set associative” para instruções primárias e 8 KB em modo “four-way set associative” para dados. O Pentium Pro tem capacidade de “dynamic branch prediction”, assim como “speculative execution” e pode executar as instruções fora da sua ordem. Estas técnicas são denominadas pela Intel como “dynamic execution”.
Mas vamos, antes de mais, ver na tabela 3.12 um resumo das suas especificações.
| Pentium Pro |
| |
| Apresentação | Setembro 1995 | |
| Velocidades | 150MHz, 166 MHz, 180 MHz e 200 MHz | |
| Factor Multiplicativo | 2,5x – 3x | |
| Tamanho de Registo | 32 bits | |
| Barramento de Dados Externo | 64 bits | |
| Barramento de Cache Integrada | 64 bits | |
| Barramento de Endereços de Memória | 32 bits | |
| Máximo de Memória Endereçável | 4 GB | |
| Cache L1 | 8 KB de código, 8 KB de dados | |
| Número de Transístores | 5,5 milhões | |
| Nº de Transístores na Cache L2 | 15,5 milhões (256 KB), 31 milhões (512 KB) | |
| Tamanho de Circuito | 0,35u | |
| Encapsulamento | 387 pinos Dual Cavity PGA | |
| Coprocessador Matemático | Incorporado | |
| Gestão de Energia | SMM | |
| Tensão de Alimentação | 3,3 volts | |
Tabela 3.12 – Características do Pentium Pro
Apesar de parecer um processador totalmente novo, em muitos aspectos dá-nos mais a sensação de ser uma evolução dos anteriores. O núcleo do chip é de arquitectura RISC, enquanto a interface de instruções externas é de arquitectura CISC. Por outras palavras, ele “pega” nas instruções CISC, transforma-as em várias instruções RISC e executa-as em pipelines de execução paralelas, aumentando assim a performance do processador.
Se compararmos o Pentium Pro com o Pentium, o primeiro é mais rápido, correndo software de 32 bits, já que o dynamic execution do Pentium Pro foi maximizado para trabalhar com sistemas operativos de 32 bits. No que respeita a sistemas operativos de 16 bits, tipo Windows 95 ou 98, aí o caso torna-se bastante diferente, pois um Pentium consegue superar um Pentium Pro de velocidade equivalente (fig. 3.33).
Figura 3.33 – O Pentium Pro e o Pentium
Já referimos neste capítulo a dynamic execution, ou execução dinâmica das instruções, pelo que vamos ver como isso é feito no Pentium Pro. Este tipo de execução é possível porque o Pentium Pro possui três pipelines e desta forma consegue executar três instruções simultaneamente. As instruções são analisadas quanto à sua interligação, mas não são executadas ordenadamente, isto é, são enviadas para os pipelines as instruções que não dependem umas das outras e só depois é que são executadas as que necessitam dos dados das anteriores.
Como vimos no parágrafo anterior, a unidade de execução executa as instruções baseada na não dependência de execução de outras instruções e não na sua ordem original dentro de um programa. Para isso, baseia-se nas seguintes três técnicas:
- Multiple branch prediction (revisão de desvios múltiplos) – Prediz a execução do programa através de vários ramos. Através de um algoritmo especial, o processador pode antecipar saltos ou ramificações no fluxo de instruções. Isto é possível porque, enquanto o processador recebe instruções, ele també está a verificar as instruções do programa mais para a frente.
- Data flow analysis (análise de fluxo de dados) – Cria, optimiza e reordena as instruções analisando a dependência entre elas, independentemente da sua ordem original no programa. O processador lê as instruções descodificadas e determina quando estão disponíveis para processamento ou, por outro lado, se dão dependentes de outras instruções que necessitam de ser executadas primeiro. Assim, o processador determina qual a sequência óptima para processamento e executa as instruções de um modo mais eficiente.
- Speculative execution (execução especulativa) – É o resultado do Multiple Branch Prediction e do Data Flow Analysis. Executa as instruções especulativamente, isto é, as instruções podem ser executadas sem dependências umas das outras. Utiliza a técnica de Data Flow Analysis para verificar as dependências entre instruções e o algoritmo de Multiple Branch Prediction para estabelecer a lista das instruções que podem ser executadas. Assim, o Pentium pró pode em dada ciclo de relógio executar três instruções independentes. Após essa execução, os resultados são armazenados em registos de memória temporários e só são disponibilizados quando as instruções que as antecedem, na sequência original do programa ou processo a que pertencem, tiverem sido igualmente executadas.
Outras das características do Pentium Pro é o facto de ter cache L2 integrada. Ao colocar a cache L2 no interior do chip, a cache pode trabalhar À mesma velocidade do processador, em vez dos típicos 60 MHz do barramento da placa principal. De facto, a cache L2 tem um backside bus interno de 64 bits, o qual não partilha tempo de processamento com o barramento FSB externo de 64 bits do processador.
Outras das características da cache L2 integrada é o multiprocessamento ser grandemente melhorado. O Pentium Pro suporta um novo tipo de configuração do multiprocessador chamado Multiprocessor Specification (MPS 1.1). o Pentium Pro com MPS permite configurações de até quatro processadores. Ao contrário de outras configurações do multiprocessador, o PENTIUM pró elimina problemas de coerência de cache, porque cada chip mantém uma cache L1 e uma L2, separadas internamente.
Sem comentários:
Enviar um comentário