Title: 2. Performansat dhe zhvillimi i kompjuter
12. Performansat dhe zhvillimi i kompjuterëve
- Një historik i shkurtër
- Dizajnimi dhe performansat
- Evolucioni i Pentiumit dhe PowerPC
-
2ENIAC
- ENIAC (Electronic Numerical Integrator And
Computer) - Eckert and Mauchly
- University of Pennsylvania
- Fillimi 1943
- Filloi te përdoret më 1946
- Përdorimi deri më 1955
3ENIAC
- Decimal (jo binar)
- 20 akumulator me nga 10 shifra
- Programimi manual permes nderpreresve
- 18,000 gypa katodik
- 30 ton
- 15,000 square feet (rreth 1,400 m2)
- 140 kW
- 5,000 operacione te mbledhjes ne sekonde
4(No Transcript)
5Makina e von Neumann/Turing
- Koncepti i kompjuterit me program të brendshëm
(Stored Program). - Programi dhe të dhënat ruhen në memorien
kryesore. - Njësia aritmetiko-logjike (ALU) operon me të
dhëna binare. - Njësia kontrolluese interpreton instruksionet e
vendosura ne memorie dhe i ekzekuton - Pajisjet hyrëse dhe dalëse udhëhiqen nga njësia
kontrolluese - Princeton Institute for Advanced Studies
- IAS
- U kompletua me 1952
6Struktura e makines se von Neumann-it
7Modeli IAS (Institute of Advanced Studies)
- 1000 fjalë 40 bitëshe
- Numrat binarë
- 2 x 20 bit instruksione
- Regjistrat (memoria në CPU)
- Memory Buffer Register (bufer regjistri i
memories) - Memory Address Register (regjistri asdresor i
memories) - Instruction Register (regjistri i instruksioneve)
- Instruction Buffer Register (bufer regjistri i
instruksioneve) - Program Counter (numëruesi programor)
- Accumulator (akumulatori)
- Multiplier Quotient
8Formatet e memories IAS
9Struktura e zgjeruar e kompjuterit IAS
10Kompjuterët komercial
- 1947 - Eckert-Mauchly Computer Corporation
- UNIVAC I (Universal Automatic Computer)
- Kalkulimet për US Bureau of Census 1950
- Prone e Sperry-Rand Corporation
- Fundi i 1950ve - UNIVAC II
- Më i shpejtë
- Më shumë memorie
11IBM
- Pajisjet për procesim të kartelave me vrima 1953
- IBM 701 - Kompjuteri i parë i IBM-it me program të
brendshëm - Për kalkulime shkencore
- 1955 IBM 702
- Aplikacionet Biznes
- Pararendës i serisë IBM 700/7000
12Tranzistorët
- Zëvendsuan gypat katodikë
- Më të vegjël
- Më të lirë
- Lirojnë më pak nxehtësi
- Pajisje solid state
- Prodhohen nga silikoni
- 1947 Bell Labs
- William Shockley etj.
13Kompjuterët e bazuar në tranzistorë
- Gjenerata e dytë
- NCR RCA machines
- IBM 7000
- DEC 1957
- PDP-1
14Kompjuteri IBM 7094
15Gjenerata e tretë qarqet e integruara
- Një tranzistor i vetëm - komponentë diskrete
(vitet 1950-1960). - Problem në industrinë kompjuterike.
- Në fillim të gjeneratës së dytë, kompjuterët
përmbanin rreth 100,000 tranzistorë. - Në vitin 1958 - një arritje që revolucionarizoi
elektronikën. - Filloi era e mikroelektronikës QARKU I
INTEGRUAR. Qarku i integruar shënon edhe lindjen
e gjeneratës së tretë të kompjuterëve. - Katër funksionet bazë
- Ruajtjen e të dhënave (data storage), që ofrojnë
celulat memorike, - Procesimin e të dhënave (data processing), që
ofrojnë portat, - Bartjen e të dhënave (data movement),
shfrytëzohen shtigjet ndërmjet komponenteve për
bartje të të dhënave prej memories në memorie dhe
prej memories nëpërmejt portave te memorit tjera, - Kontrolli (control) shtigjet ndërmjet
komponenteve duhet kontrolluar përmes sinjaleve.
16Mikroelektronika
- Komponentet e kompjuterit portet, qelizat
memorike, ndërlidhjet - Prodhohen nga materiali gjysëmperçues
17Gjeneratat e kompjuterëve
- Gypat katodikë - 1946-1957
- Tranzistorët - 1958-1964
- Small scale integration SSI 1965
- Deri 100 pajisje në çip
- Medium scale integration MSI - deri 1971
- 100-3,000 pajisje në çip
- Large scale integration LSI - 1971-1977
- 3,000 - 100,000 pajisje në çip
- Very large scale integration VLSI- 1978 -1991
- 100,000 - 100,000,000 pajisje në çip
- Ultra large scale integration ULSI 1991 -
- Mbi 100,000,000 pajisje në çip
18Ligji i Moore-it
- Dendësia e rritur e komponenteve në çip
- Gordon Moore bashkëthemelues i Intelit
- Numri i tranzistorëve në çip dyfishohet çdo vit
- Prej 1970s zhvillimi ngadalësohet pak
- Numri i tranzistorëve në çip dyfishohet çdo 18
muaj - Çmimi i çipit i pandryshuar
- Paketimi më i dendur nënkupton rrugë më të
shkurta elektrike, që rezulton me performansa më
të mira - Madhësia më e vogël jep më shumë fleksibilitet
- Nevoja më të vogla për energji dhe ftohje
- Më pak ndërlidhje mes çipave zvogëlojnë problemet
e mundshme
19Rritja e numrit te tranzistoreve ne CPU
20Sistemi i serisë IBM 360
- 1964
- Zëvendsoi serinë IBM 7000
- Familja e parë e kompjuterëve
- Bashkësia e ngjashme ose identike e
instruksioneve - Sistemi operativ identik ose i ngjashëm
- Shpejtësia e rritur
- Numri më i madh i porteve hyrëse/dalëse (p.sh
terminaleve) - Memoria më e madhe
- Çmimi më i lartë
21Seritë IBM 360
22DEC PDP-8
- 1964
- Minikompjuteri i parë
- Nuk i nevojitet klimatizimi
- Mund të vendoset mbi tavolinë
- 16,000
- 100k për IBM 360
- Aplikacionet e integruara dhe OEM
- Struktura e bus-ave
23(No Transcript)
24Struktura e Bus-it DEC PDP-8
25Memoria gjysmëpërçuese
- 1970
- Fairchild
- Madhësia si e bërthamës magnetike
- Përmban 256 bita
- Non-destructive read
- Më e shpejtë se bërthamat magnetike
- Kapaciteti dyfishohet çdo vit
26Intel
- 1971 - 4004
- Mikroprocesori i parë
- Të gjitha komponentete CPU ne një cip
- 4 bit
- 1972 - 8008
- 8 bit
- Të dizajnuar për aplikacione specifike
- 1974 - 8080
- Mikroprocesori i parë i Intelit për përdorim të
pergjithshëm
27Rritja e shpejtësisë
- Pipelining
- Cache në pllakë
- L1 L2 cache në pllakë
- Parashikimi i degëzimit
- Analiza e rrjedhës së të dhënave
- Ekzekutimi spekulativ
28Procesorët
29Procesorët
30Procesorët
31Procesorët
32Performansat
- Rritja e shpejtësisë së procesorit
- Rritja e kapacitetit të memories
- Shpejtësia e procesorit më e madhe se e memories
33Login and Memory Performance Gap
34Zgjidhja
- Rritja e numrit të bitave që merren në një hap
- Ndryshimi i interfejsit të DRAM-it
- Cache
- Zvogëlimi i shpeshtësisë (frekunecës) së qasjes
memories - Cache më kompleks dhe cache në çip
- Rritja e shpejtësisë së ndërlidhjeve
- Busa të shpejtë
- Hierarkia e busave
35Pajisjet H/D
- Periferitë me kërkesa të mëdha për H/D
- Kërkesa për transfer të madh të të dhënave në
njësi kohore - Problemi i bartjes së të dhënave
- Zgjidhjet
- Keshimi
- Baferimi
- Busa interkonektivë me shpejtësi të lartë
- Struktura më komplekse e busave
- Konfigurimet multiprocesorike
36Shpejtësitë tipike të të dhënave të paisjeve H/D
37Balancimi
- Procesorët
- Memoria kryesore
- Pajisjet H/D
- Strukturat ndërlidhëse
38Përmirësimet në organizimin dhe arkitekturën e
çipit
- Rritja e shpejtësisë së procesorit
- Për shkak të zvogëlimit të madhësisë së porteve
logjike - Më shumë porte, të paketuara më shpesh, me
frekuencë më të lartë - Koha e shkurtuar e përhapjes së sinjaleve
elektrike - Rritja e madhësisë dhe shpejtësisë së cache-it
- Hapësira e dedikuar në çipin e procesorit
- Koha e qasjes cache-it bjen drastikisht
- Ndryshimi i organizimit dhe arkitekturës së
procesorit - Rritja e shpejtësise se ekzekutimit
- Paralelizmi
39Probleme me shpejtësinë e kllokut dhe dhe
dendësinë
- Fuqia
- Dendësia e fuqisë rritet me dendësinë e qarqeve
logjike dhe shpejtësinë e kllokut - Disipacioni i nxehtësisë
- Vonesa RC
- Shpejtësia me të cilën lëvizin elektronet
kufizohet me rezistencën e përçuesve dhe
kapacitetet - Rritje e RC rrit vonesat
- Përçuesit më të hollë rrisin rezistencën
- Përçuesit e vendosur më afër njeri tjetrit rrisin
kapacitetin - Ngecja (latency) e memories
- Shpejtësia e memories ngec pas shpejtësise së
procesorit - Zgjidhja
- Më shumë rëndësi zgjidhjeve organizative dhe
arkitektonike
40Performansa Microprocesorëve Intel
41Rritja e kapacitetit te cache-it
- Në rastin tipik, dy-tri nivele të cache-it mes
procesorit dhe memories kryesore - Rritja e dendësisë së çipave
- Më shumë cache memorie në një çip
- Qasja më e shpejtë
- Pentiumi ia dedikon cache-it 10 të sipërfaqes së
çipit. - Pentium4 i dedikon cache-it përafërsiht 50 të
sipërfaqes
42Logjika komplekse e ekzekutimit
- Ekzekutimi paralel i instruksioneve
- Pipeline (tubacioni, gypsjellësi) funsionon si
linja montuese - Instruksionet në stade të ndryshme të ekzekutimit
në kohë të njejtë përgjatë të njejtit pipeline - Procesorët superskalar me më shumë pipeline në
kuadër të një procesori - Instruksionet që nuk varen nga njeri tjetri mund
të ekzekutohen paralelisht.
43Mundësitë modeste për përmirësim
- Organizimi intern i procesorëve kompleks
- Paralelizmi
- Gjasa të vogla për përmirësime drastike
- Benefitet nga cache-i i janë afruar limitit
- Rritja e kllokut shkakton probleme të dispacionit
- Janë arritur disa kufizime fundamentale fizike
44Qasja e re Me shumë bërthama
- Me shumë procesorë në një çip.
- Cache-i i madh i përbashkët
- Brenda procesorit rritja e performansave
proporcionale me rrënjen katrore të rritjes së
kompleksitetit - Nëse software-i mund të shfrytëzojë më shumë
procesorë, dyfishimi i numrit të procesorëve gati
dyfishon performansat. - Pra, përdoren dy procesorë më të thjeshtë në një
çip, në vend të një procesori kompleks - Me dy procesorë ka kuptim cache-i më i madh
- Shpenzimi i qarqeve memorike është më i vogël se
i qarqeve procesorike - Shembull IBM POWER4, Pentium Core 2 Duo
45Organizimi i çipit POWER4
46Evolucioni i Pentiumit
- 8080
- Procesori i parë me përdorim të gjithanshëm
- Rrugët 8 bitëshe të të dhënave
- Përdoret në kompjuterin e parë personal Altair
- 8086
- Shumë më i fuqishëm
- 16 bitësh
- Cache-i i instruksioneve, paramarrja e disa
instruksioneve - 8088 (busi i jashtëm 8 bitësh) përdoret në IBM PC
- 80286
- 16 Mbyte memorje të adresueshme
- 80386
- 32 bitësh
- Përkrahja për multitasking
47Evolucioni i Pentiumit
- 80486
- Pipelining i cache-it dhe instruksioneve
- Koprocesori matematikor i integruar
- Pentium
- Superskalar
- Instruksione të shumëfishta ekzekutohen
paralelisht - Pentium Pro
- Organizimi i theksuar superskalar
- Riemërimi i regjistrave
- Parashikimi i degëzimit
- Analiza e rrjedhës së të dhënave
- Ekzekutimi spekulativ
48Evolucioni i Pentiumit
- Pentium II
- Teknologjia MMX
- Procesimi i grafikës, videos dhe zërit
- Pentium III
- Instruksione shtesë me pikë të lëvizshme për
grafikën 3D - Pentium 4
- Përmirësime shtesë për operacione me pikë të
levizshme dhe multimedia - Itanium
- 64 bit
- Itanium 2
- Përmirësime hardware-ike për rritjen e shpejtësisë
49PowerPC
- 1975, 801 projekti për mikrokompjuter (IBM) RISC
- Procesori Berkeley RISC I
- 1986, produkti komercial workstation i IBM-it
RISC, RT PC. - Nuk pati sukses komercial
- Shumë rival me performanasa të ngjashme apo edhe
më të mira - 1990, IBM RISC System/6000
- RISC-si makinë superskalare
- Arkitektura POWER
- Aleanca IBM me Motorola (68000 microprocessors)
dhe Apple, (te shfrytëzuara 68000 ne Macintosh) - Rezultuan në arkitekturen PowerPC
- Derivuar nga arkitektura POWER
- Superscalar RISC
- Apple Macintosh
- Aplikacionet Embedded chip
50Familja PowerPC
- 601
- Paraqitje e shpejtë në treg. Makinë 32-bitëshe
- 603
- Desktop me permasa të vogla dhe i lëvizshëm
- 32-bit
- Performansë të krahasueshme me 601
- Kosto më e ulët dhe implementim më eficient
- 604
- Desktop dhe serverë të vegjël
- Makinë 32-bitëshe
- Dizajn superskalar shumë më i përparuar
- Performansë më e lartë
- 620
- Serverë të mëdhenjë
- Arkitekturë 64-bitëshe
51Familja PowerPC
- 740/750
- E njohur edhe si G3
- Dy nivele të cache-it në çip
- G4
- Rritjen e paralelizmit dhe shpejtësisë së
brendëshme - G5
- Përmirësime në paralelizëm dhe shpejtësinë e
brendshme - Organizimi 64-bitësh