Académique Documents
Professionnel Documents
Culture Documents
Arkitektura e Kompjuterave
Arkitektura dhe Organizimi 1 Arkitektura perfshin ato atribute qe jane te dukshme per programuesit
Seti i Instruksioneve, numri i biteve te perdorur per perfaqesimin e te dhenave, mekanizmat I/O, teknikat e adresimit. p.sh. A ka instruksion shumezimi?
Arkitektura dhe Organizimi 2 E gjithe familja Intel x86 ndan te njejten arkitekture Familja IBM System/370 ndan te njejten arkitekture te pergjithshme Kjo sjelle nje kompatibilitet te kodit
Te pakten prapa
Strukture eshte menyra se si komponentet lidhen me njeri tjetrin. Funksion eshte operimi i cdo komponenti individual si pjese e struktures
Funksion
Pamja funksionale
Periferike
Kompjuter
Njesia kryesore e perpunimit Memoria
Kompjuter
Nderlidhja e sistemit
Struktura CPU-ja
CPU
Kompjuter
I/O BUS Memoria CPU
Regjistra
Njesi Kontrolli
CPU
ALU BUS Regjistra Njesi kontrolli
Kontrolli i memories
ENIAC - kryesore Electronic Numerical Integrator And Computer Eckert dhe Mauchly Universiteti i Pennsylvania Filloi ne 1943 Perfundoi ne 1946
Shume vone shrytezime ushtarake
ENIAC - detaje Decimal (jo binare) 20 akumulator me 10 shifra Programohej manualisht me celesa 18,000 tuba me vakum 30 ton 140 m2 140 kW fuqia e konsumuar 5,000 mbledhje/s
von Neumann/Turing Koncepti i ruajtjes se programit Memoria kryesore ruan te dhenat dhe programet ALU vepron mbi te dhena binare Njesia e kontrollit interpreton instruksionet qe vijne nga memoria dhe i ekzekuton Paisjet hyrje dalje komandohen nga njesia e kontrollit Instituti ne Princton
IAS
Perfunduar ne 1952
Kompjutera Komerciale 1947 - Eckert-Mauchly Computer Corporation UNIVAC I (Universal Automatic Computer) Perllogaritjet per censusin ne US ne 1950 U be pjese e korporates Sperry-Rand Ne fund te viteve 50 - UNIVAC II
Me i shpejte Me shume memorie
Tranzistoret Zevendesuan tubat me vakum Te vegjel Te lire Me pak nxehtesi e cliruar Te ndertuara prej silici (Rera) Te shpikura ne 1947 ne laboratoret e Bell William Shockley et al.
Kompjuterat e bazuar ne tranzistore Gjenerata e dyte e makinave IBM 7000 DEC - 1957
Prodhuan PDP-1
Mikroelektronika Kompjuteri perbehet nga porta llogjike, qeliza memorie dhe nderlidhje Keto mund te prodhohen ne nje gjysem percjelles p.sh. Shtrese silici
Gjeneratat e Kompjuterave Tuba vakumi- 1946-1957 Tranzistore - 1958-1964 Shkalle e ulet integrimi(SSI) - 1965 Shkalle e mesme integrimi(MSI) - 1971 Shkalle e larte integrimi(LSI) - 1971-1977 Shkalle shume e larte integrimi(VLSI) 1978 -1991 Shkalla ultra e integrimit(ULSI) 1991 - ?
Mbi 100,000,000 paisje ne chip 100,000 - 100,000,000 paisje ne chip 3,000 - 100,000 paisje ne chip 100-3,000 paisje ne chip Deri ne 100 paisje per chip
Ligji i Moore
Rritje e densitetit te komponenteve ne chip Gordon Moore bashkethemeluesi i Intel Numri i tranzistoreve ne chip do te dyfishohet cdo vit Qe nga 1970 shkalla e rritjes se dendesitetit ka rene Numri i tranzistoreve dyfishohet cdo 18 muaj Kosto e chipit ka ngelur pothuajse e pandryshuar Dendesiteti i larte i paketimit do te thote rruge elektrike me te shkurtra Permasa me te vogla do te thote fleksibilitet me i larte Konsum me i vogel kerkesa per ftohje me te zbutura Me pak nderlidhje rrisin besueshmerine
Kompjuterat Embedded
Trendi sot
Software i sistemit
Kompilatori: perkthen kodin ne komanda te makines Sistemi operativ: kodi i sherbimit
Menaxhimi i I/O Menaxhimi i mem. dhe storage Skedulimi i detyrave dhe menaxhimi i burimeve
Hardware-i
Procesori, memoria, kontrollerat I/O
Gjuha asembler
Paraqitja ne hardware
Implementimi
Detajet qe qendrojne poshte nderfaqes
Input/output perfshin
Paisje per nderfaqen me perdoruesin
Display, keyboard, mouse
Storage
Hard disk, CD/DVD, flash
Adaptore rrjeti
Per komunikimin me kompjutera te tjere
Anatomia e kompjuterit
Paisja dalese
Kablli i rrjetit
Paisja hyrese
Paisja hyrese
Ne brendesi
Datapath: kryen operacione ne te dhena Control: kontrollon datapath, memorie, ... Memoria Cache
Nje memorie e shpejt SRAM per akses direkt te te dhenave
Rrjeti Komunikim dhe ndarje e burimeve Local area network (LAN): Ethernet
Brenda nje godine
Paisjet I/O Periferike me kerkesa H/D intensive Kerkesa per transferim te larte te te dhenave ne njesine e kohes Procesori mund ta menaxhoje Problem levizja e te dhenave Disa zgjidhje:
Caching Buffering Buse nderlidhese me shpejtesi te larte Struktura busi te avancuara Konfigurime me disa procesore
Permiresimet ne organizimin dhe arkitekturen e chipit Rritja e shpejtesise hardware-ike te procesorit Perdorimi i memories se shpejte me afer procesorit (cache) Ndryshime ne organizim dhe arkitekture
Rritja e shpejtesise efektive te ekzekutimit Paralelizmi
Douglas DC8-50
Percaktimi i performances
Douglas DC8-50 0 200 400 600 0
Kapaciteti i pasagjereve
5000
10000
Distanca e udhetimit(milje)
Boeing 777 Boeing 747 BAC/Sud Concorde Douglas DC8-50 0 500 1000 1500
400000
Shpejtesi e udhetimit(mph)
Throughput
Puna totale e kryer per njesi kohe
p.sh., detyra/transaksione/ per ore
10s ne A, 15s ne B Koha ekzekutimitB / Koha ekzekutimitA = 15s / 10s = 1.5 Pra A eshte 1.5 here me e shpejte se B
Koha e CPU
Koha e shpenzuar duke perpunuar nje detyre Perfshin kohen e perdoruesit me CPU dhe ate te sistemit me CPU Programe te ndryshme ndikohen ndryshe nga CPU dhe performanca e sistemit
Zbresim kohen me I/O, me detyra te tjera
Ora e Sistemit
Koha e CPU
Koha CPU = Cikle Ore CPU Koha Cikel Ore Cikle Ore CPU = Frekuence Ore
Sa e shpejte duhet te jete ora e kompjuterit B? Ciklet e OresB 1.2 Ciklet e Ores A Frekuenca B = = Koha e CPUB 6s Ciklet e Ores A = Koha CPUA Frekuenca A = 10s 2GHz = 20 10 9 1.2 20 10 9 24 10 9 Frekuenca B = = = 4GHz 6s 6s
CPI Shembull Kompjuteri A: Koha e Ciklit = 250ps, CPI = 2.0 Kompjuteri B: Koha e Ciklit = 500ps, CPI = 1.2 ISA e njejte Cili eshte me i shpejte dhe sa? Koha CPU i Instruksio neve = Numri CPI Koha e Ciklit A A A
A me i shpejte Koha CPU = Numri i Instruksio neve CPI Koha e Ciklit B B B = I 1.2 500ps = I 600ps
Koha CPU B = I 600ps = 1.2 Koha CPU I 500ps A
= I 2.0 250ps = I 500ps
me kaq here
CPI me shume detaje Nese klasa te ndryshme instruksionesh kerkojne numer te ndryshem ciklesh
Ciklet e Ores = (CPIi Numri i Instruksio neve i )
i=1 n
n Ciklet e Ores Numri i Instruksio neve i CPI = = CPIi Numri i Instruksio neve i=1 Numri i Instruksio neve
Frekuenca relative
CPI Shembull Sekuenca kodi te kompiluara ne menyra te ndryshme duke perdorur instruksione nga klasat A, B, C
Klasa CPI per klase Nr. Inst. per sek 1 Nr. Inst. per sek 2
A 1 2 4
B 2 1 1
C 3 2 1
Sekuenca 2: Nr.Inst. = 6
Permbledhje e Performances
Instruksio ne Cikle Ore Sekonda Koha e CPU = Program Instruksio ne Cikle Ore
Fuqia
Ne teknologjine CMOS
Fuqia = Ngarkesa Kapacitive Tensioni 2 Frekuenca
30 5V 1V 1000
Muri i fuqise
Nuk mund te reduktojme tensionin me tej Nuk mund te heqim me shume nxehtesi
Performanca Uniprocesor
Frekuenca e ekzekutimit Millions of instructions per second (MIPS) MIPS=I/KohaCPU*106 Millions of floating point instructions per second (MFLOPS) Varen shume nga seti i instruksioneve, projektimi i kompilatorit etj
Ligji i Amdahl Nese F eshte pjesa e llogaritjeve sekuenciale, dhe (1-F) eshte pjesa qe mund te paralelizohet, atehere rritja maksimale e shpejtesise qe mund te arrihet me P procesore eshte
speedup=1/(F+(1-F)/P)
Shembull Nese 90% e llogaritjeve mund te paralelizohen (pra 10% jane sekuenciale) atehere rritja maksimale e shpejtesise qe mund te arrihet me 5 procesore eshte 1/(0.1+(1-0.1)/5) pra 3.6 . Do te thote qe programi mund te ekzekutohet maksimumi 3.6 here me shpejte ne nje sistem me 5 procesore ne krahasim me nje sistem me nje procesore.
Ne program sekuencial Rritja maksimale e shpetesise ne nje program sekuencial ku nje pjese permiresohet me p here, kufizohet nga mosbarazimi
Shembull Nese pjesa B ne nje kompjuter eshte bere 5 here me e shpejte (p=5) tA =3 tB=1 atehere f= tA/ (tA+tB)=0.75
Speedup5/1+0.75(5-1) =1.25 Nese pjesa A behet 2 here me e shpejte p=2, f=tB/(tA+tB)=0.25 Speedup2/1+0.25(2-1) =1.60
Shembull perfundimi Rritja e A me nje faktor 2 sjell nje permiresim me te larte ne performance sesa rritja e B Perqindja jepet nga formula
(1-1/speedup)*100
Arkitektura e setit te instruksioneve Koha e ekzekutimit: njesia me e mire per matjen e performances Fuqia eshte nje faktor limitues
Perdoret peralelizmi per te permiresuar performancen.
Literatura 1. 2. 3. Arkitektura e Kompjuterave, Agim Cami (faqe 11-16) Organizimi dhe arkitektura e kompjuterave (faqe 37-48) Computer organization and design, D.Patterson, J.Hennessy (Kapitulli I)
FALEMINDERIT