Innehåll

Intel Pentium 4

Inledning
Historik
Netburst
Hyper Pipelined Technology
Execution trace cache & L1 / L2
Rapid Execution Engine & ALU
FPU
SSE2
RDRAM & i850
400 MHz?
Ny Sockel
Flänsfästen & Nätaggregat
Olika demon
Testsystem & Specifikationer
Sisoft Sandra
Nvidia T&L - Treemark & DMZG
3D Mark 2000
Quake 3
Sacrifice
Flask MPG
Sammanfattning
Slutsats

1/2-01 | Axman | axman@64bits.se

Artikelsponsor


Intel - www.intel.com
Ett tack till intel för att de har lånat ut en dator till oss för dessa tester.


Rapid Execution Engine och ALU enheterna

De olika delarna för att förse processorn med den information kallas för rapid execution engine. Eftersom processorn är känslig när det gäller att hålla den matad med information så har man satsat starkt på att den alltid skall ha den informationen den behöver. Till ALU enheterna har man ökat effektiviteten på gissningarna men här har man ändå problem.

Många gissningar är fel vilket gör att effektiviteten blir mycket låg på ALU enheterna.
Pentium 4 har två styck ALU enheter men eftersom effektiviteten på dem blir låg så har man fått ta till med ett trick. Man kör dem på dubbla hastigheten. OM det nu är på dubbla MHz eller om det helt enkelt är så att de kan uträtta två saker per MHz vet jag ej men resultatet blir det samma.

Alltså rusar de på motsvarande 3 GHz på en P5 1.5 GHz. Vi skall titta senare på prestandan men vi vet redan att de kommer att lida av beräkningarnas oförutsägbara natur. Här kommer även Advanced Dynamic Execution in då man har tredubblat antalet instruktioner som finns tillhanda för enheterna vilket gör att de kan börja om snabbare med all information redo.


Processorn i sockeln.


FPU - Enhanced Floating Point & Multimedia Unit

En enhet som är viktig särskilt för tunga 3D spel är FPU enheten. Här har man varit tvungna att skära ned från som först planerat två styck till en enda. Man säger att den är förbättrad vilket stämmer bra. Den presterar bra men den är ack så ensam. En Athlon har tre FPU enheter, pentium 3 har två.

Anledningen till att man gjort på detta sättet är helt enkelt storleken på processorn. För att hålla sig inom ett rimligt antal transistorer så har man fått skära ned på vissa delar och tvingats förlita sig på SSE2. Detta skiljer sig markant från tidigare då just denna punkten varit Intels starka sida ända till Athlonens ankomst.

Detta kan vi komma att se en ändring på i framtiden men just nu så är det en stor svaghet för processorn.


SSE2 - Streaming SIMD Extensions 2

Vad man satsat på i och med pentium4 arkitekturen som den andra stora delen är SSE2. Det är en serie instruktioner för multimedia och är en direkt fortsättning på MMX och SSE. Nu har man lagt till 144 olika instruktioner som effektiviserar arbetet.
SSE2 kan ersätta FPU enheterna i ganska så stor utsträckning men inte helt. Därför så kommer vi även i framtiden att se program som presterar dåligt på en P4 men det mest betydelsefulla är att de presterar dåligt NU!

Vad som är tanken med dessa instruktioner är att i ställer för att ta varje steg ett och ett så utförs en instruktion som ger svaret åt flera andra.
Varför göra samma instruktion flera gånger när man kan göra den endast en gång och tillämpa svaret på flera funktioner?

Det betyder att om det är möjligt så kan prestandan ökas mer än vad som hade varit möjligt genom ren processorkraft. Allt handlar om att hoppa över onödiga steg.
SSE är SIMD instruktioner och tittar vi vad det står för så beskriver det rätt bra vad det betyder.
"Single Instruction Multiple Data" Och det är vad jag sagt innan. En instruktion ger flera data.

Vad SSE och MMX fått tampas med innan är att åtkomsten till dessa instruktionerna har tagit tid. Så när en exempelvis ett spel skall använda sig av dem så får processorn vänta varje gång den exempelvis hoppar mellan FPU enheten och SSE instruktionerna. Det har gjort att det i många fall varit omöjligt eller svårt att få en effektiv användning i många sammanhang.
Med Pentium 4 är detta dröjsmål borta och den kan fritt växla mellan de olika enheterna.

Eftersom Pentium 4 förlitar sig mycket på SSE2 i och med att den bara har en enda FPU enhet så kommer Intel att jobba mycket på att få fram stöd för detta. Så vi kommer antagligen se stöd för det inom sin tid ganska så mycket.

AMD har insett betydelsen av SSE2 de med och kommer att hänga på Intel genom att inkludera SSE2 i sina kommande processorer. Detta kommer säkerligen att göra mycket.
Men vanligtvis så ligger C++ kompilerarna ett par år efter processorerna så Intel måste arbeta på att få ut nya som gör att SSE2 används nu!


Sockeln är väldigt lik socket 370.
Bara aningen större.

Nästa sida -->




1/2-01 | Axman | axman@64bits.se