




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第一章概論第一節(jié)計算機系統(tǒng)的層次結構計算機系統(tǒng)=硬件/固件+軟件計算機語言從低級到高級發(fā)展:高一級語言的語句相對于低一級語言來說功能更強,更便于應用,但又都以低級語言為基礎。層次結構由高到低依次為: 應用語言機器級 M5、高級語言機器級 M4、匯編語言機器級 M3、OS機器級M2、傳統(tǒng)機器語言機器級 M1、微程序機器級 M0。虛擬機:由軟件實現(xiàn)的機器。語言實現(xiàn)的兩種基本技術:翻譯:先把N+1級程序全部轉(zhuǎn)換成 N級后,再去執(zhí)行新產(chǎn)生的 N級程序,在執(zhí)行過程中 N+1級程序不再被訪問。解釋:每當一條 N+1級指令被譯碼后,就直接去執(zhí)行等效的N級指令,然后再去取下一條N+1級指令,以此重復執(zhí)行。第二
2、節(jié)計算機系統(tǒng)結構、計算機組成和計算機實現(xiàn)一、計算機系統(tǒng)結構的定義和內(nèi)涵定義:它是軟件和硬件/固件的交界面,即機器語言程序員看到的機器物理系統(tǒng)的抽象。實質(zhì):確定計算機系統(tǒng)中軟、硬件的界面,界面之上是硬件和軟件實現(xiàn)的功能,界面之下是 硬件和固件實現(xiàn)的功能。透明性:在計算機技術中,把這種本來存在的事物或?qū)傩詮哪硞€角度看不到,則稱對它是透明的。二、計算機組成與計算機實現(xiàn)的定義和內(nèi)涵.計算機組成定義:計算機系統(tǒng)結構的邏輯實現(xiàn),包括機器級內(nèi)部的數(shù)據(jù)流和控制流的組成以及邏輯設計等。.計算機實現(xiàn)定義:指的是計算機組成的物理實現(xiàn),包括處理機、主存等部件的物理結構,器件的集 成度和速度,器件、模塊的劃分與連接,專
3、用器件的設計。三、計算機系統(tǒng)結構、組成和實現(xiàn)的相互關系和影響1)相同系統(tǒng)結構,可以有不同的組成;2) 一種組成可以有多種不同的實現(xiàn)方法;3)采用不同的系統(tǒng)結構會使可以采用的組成技術產(chǎn)生差異;4)組成也會影響結構。第三節(jié)計算機系統(tǒng)的軟、硬件取舍及定量設計原理一、 軟硬件取舍的基本原則軟、硬件功能的分配比例對計算機性能的影響:提高硬件功能的比例可提高解題速度,減少程序所需的存儲空間,但會增加硬件成本,降低硬件利用率和計算機系統(tǒng)的靈活性級適應性; 而提高軟件功能的比例可降低硬件成本,提高系統(tǒng)的靈活性、適應性,但解題速度會下降, 軟件設計費用和所需的存儲器用量增加。1,從實現(xiàn)費用、速度和其他性能要求綜
4、合考慮,獲取高的性價比。2.要考慮到準備采用和可能采用的組成技術,使之盡可能不要過多或不合理地限制各種組成、實現(xiàn)技術的采用。3,不能僅從“硬”的角度去考慮如何便于應用組成技術的成果和便于發(fā)揮器件技術的發(fā)展, 還應從“軟”的角度把如何為編譯和OS的實現(xiàn)以及為高級語言程序的設計提供更多、更 好的硬件支持放在首位。二、計算機系統(tǒng)的定量設計原理Huffman 原理盡可能加速處理高頻率的事件遠比加速處理概率很低的事件對性能的提高要顯著。Amdahl 定律1)思想:加快某部件執(zhí)行速度所能獲得的系統(tǒng)性能加速比,受限于該部件的執(zhí)行時 間占系統(tǒng)中系統(tǒng)中總執(zhí)行時間的百分比。2) 加速比 Sp=Told/Tnew=
5、1/(1-Fnew) + 可改進比 Fnew/部件加速比 Rnew)3)原理:定義系統(tǒng)性能的加速比,確定對系統(tǒng)中性能瓶頸部件,計算改進某些部件 所獲得的性能提高。程序訪問的局部性定律1)空間局部性:循環(huán)語句;變量、數(shù)據(jù)。2)時間局部性:順序語句;字符串、數(shù)組。三、計算機系統(tǒng)設計的主要任務和方法.計算機系統(tǒng)設計的主要任務.計算機系統(tǒng)的設計方法第四節(jié) 軟件、應用、器件的發(fā)展對系統(tǒng)結構的影響一、軟件發(fā)展對系統(tǒng)結構的影響軟件的可移植性:一個軟件可以不經(jīng)修改或者只需少量修改就可以由一臺計算機移植到另一 臺計算機上正確地運行,同一軟件可應用于不同的環(huán)境。實現(xiàn)軟件移植的技術:1.統(tǒng)一Wj級語百概念:設計出一
6、種完全通用的高級語言,為程序員所用。應用:這種技術應用于結構相同以至完全不同的機器之間高級語言程序的軟件移植。2,采用系列機概念:由同一廠家生產(chǎn)的具有相同的系統(tǒng)結構,但具有不同組成和實現(xiàn)的一系列不同型號的機器。應用:這種技術只能應用在結構相同或相似的機器之間的匯編程序的軟件移植。3.模擬和仿真1)模擬概念:用機器語言程序解釋實現(xiàn)軟件移植的方法稱為模擬。特點:運行速度慢,性能較差。2) 仿真概念:用微程序直接解釋另一種機器指令系統(tǒng)的方法就稱為仿真。特點:與模擬一樣,除了仿真目標機的指令系統(tǒng)之外,還要仿真其存儲體系、I/O系統(tǒng)和控制臺的操作。 仿真和模擬的主要區(qū)別在解釋用的語言。仿真是用微程序解釋
7、, 其解釋程序存儲于控制存儲器中;而模擬是用機器語言程序解釋,其解釋程序存儲于主存中。 3)模擬和仿真的選擇 不同系列間的軟件移植一般是仿真和模擬并行。頻繁使用的易于仿真的機器指令宜用仿真,以提高速度;很少使用的、難以仿真的指令及I/O操作宜用模擬。即使兩種機器系統(tǒng)差別不大,往往也需要模擬來完成機器間的映像。二、應用的發(fā)展對系統(tǒng)結構的影響計算機應用可歸納為向上升級的4類:數(shù)據(jù)處理、信息處理、知識處理、智能處理。三、器件發(fā)展對系統(tǒng)結構的影響.改變了邏輯設計的傳統(tǒng)方法。.隨時間呈指數(shù)地改進,使計算機的性價比有了顯著提高。.加速了結構的“下移”。.促進了算法、語言和軟件的發(fā)展。第五節(jié)系統(tǒng)結構中的并行
8、性開發(fā)及計算機系統(tǒng)的分類一、并行性的概念與開發(fā).并行性的含義與級別a)定義:解題中具有可以同時進行運算或操作的特性,稱為并行性。并行性包含同時性和并發(fā)性二重含義。同時性指兩個或多個事件在同一時刻發(fā)生。并發(fā)性指兩個或多個事件在同一時間間隔內(nèi)發(fā)生。b)從不同的角度,并行性有不同的等級:1)從計算機系統(tǒng)執(zhí)行程序的角度來看指令內(nèi)部指令之間任務或進程之間作用或程序之間2)從計算機系統(tǒng)處理數(shù)據(jù)的角度來看位串字串位并字串位片串字并全并行3)從計算機信息加工的各個步驟和階段來看存儲器操作并行處理器操作步驟并行處理器操作并行指令、任務、作業(yè)并行.并發(fā)性開發(fā)的途徑時間重疊讓多個處理過程在時間上相互錯開,輪流重疊地
9、使用同一套硬件設備的各個部分,加快硬件周轉(zhuǎn)來贏得速度。如流水線。2)資源重復通過重復設置硬件資源來提高可靠性或性能。如多CPU、多核、多內(nèi)存。3)資源共享用軟件的方法,讓多個用戶按一定時間順序輪流使用同一套資源來提高資源利用率,相應地也就提高了系統(tǒng)的性能。如分時調(diào)度。.計算機系統(tǒng)的并發(fā)性發(fā)展.多機系統(tǒng)的耦合度耦合度反映多機系統(tǒng)中各機器之間物理連接的緊密程度和交叉作用能力的強弱。二、計算機系統(tǒng)的分類Flynn分類法:單指令流單數(shù)據(jù)流 SISH單指令流多數(shù)據(jù)流 SIMD、多指令流單數(shù)據(jù)流 MISD、 多指令流多數(shù)據(jù)流 MIMD。第二章數(shù)據(jù)表示、尋址方式與指令系統(tǒng)第一節(jié)數(shù)據(jù)表示一、數(shù)據(jù)表示與數(shù)據(jù)結構
10、數(shù)據(jù)表示:計算機硬件識別、指令集可直接引用的數(shù)據(jù)類型。數(shù)據(jù)結構:由軟件進行處理和實現(xiàn)的各種數(shù)據(jù)類型。關系:不同的數(shù)據(jù)表示可為數(shù)據(jù)結構的實現(xiàn)提供不同的支持。實質(zhì)上是軟、硬件的取舍。二、高級數(shù)據(jù)表示.自定義數(shù)據(jù)表示1)標志符數(shù)據(jù)表示(一指令對一數(shù)據(jù))主要優(yōu)點:簡化了指令系統(tǒng)和程序設計。簡化了編譯程序。便于實現(xiàn)一致性校驗。能由硬件自動變換數(shù)據(jù)類型。支持數(shù)據(jù)庫系統(tǒng)的實現(xiàn)與數(shù)據(jù)類型無關的要求。為軟件調(diào)試和應用軟件開發(fā)提供了支持。主要缺點:每個數(shù)據(jù)字因增設標志符,增加程序所占的主存空間。采用標志符會降低指令的執(zhí)行速度。2)數(shù)據(jù)描述符(一指令對多數(shù)據(jù))數(shù)據(jù)描述符和標志符的差別:標志符是和每個數(shù)據(jù)相連,合存在
11、一個存儲單元中, 描述單個數(shù)據(jù)的類型特征;數(shù)據(jù)描述符則是與數(shù)據(jù)分開存放,用于描述所要訪問的數(shù)據(jù)是整塊的還是單個的,訪問該數(shù)據(jù)塊或數(shù)據(jù)元素所要的地址以及其他信息等。.向量、數(shù)組數(shù)據(jù)表示節(jié)省大量存儲空間,也由于不必處理零元素,而節(jié)省不少處理時間。3,堆棧數(shù)據(jù)表示在編譯和子程序調(diào)用中很有用。1)由高速寄存器組成的硬件堆棧,并附加控制電路,讓它與主存中的堆棧區(qū)在邏輯上構成整體,使堆棧的訪問速度是寄存器的,容量是主存的。2)有豐富的堆棧操作指令且功能很強,可直接對堆棧中的數(shù)據(jù)進行各種運算和處理。3)有力地支持了高級語言程序的編譯。4)有力地支持了子程序的嵌套和遞歸調(diào)用。三、引入數(shù)據(jù)表示的原則.看系統(tǒng)的效
12、率是否顯著提高, 包括實現(xiàn)時間和存儲空間是否有顯著減少。主存和處理機之間傳送的信息量越少,實現(xiàn)時間就越少。.看引入這種數(shù)據(jù)表示后,其通過性和利用率是否提高。四、浮點數(shù)尾數(shù)基值大小和下溢處理方法的選擇.浮點數(shù)尾數(shù)基值的選擇1)可表示數(shù)的范圍:隨 Rm增大,范圍增大。2) 可表示數(shù)的個數(shù):隨 Rm增大,個數(shù)增大。3)數(shù)在數(shù)軸上的分布:隨 Rm增大,密度更稀疏。4)可表示數(shù)的精度:隨 Rm增大而單調(diào)下降。5)運算中的精度損失:隨 Rm增大,精度的損失越小。6)運算速度:隨Rm增大,運算速度可以提高。2.浮點數(shù)尾數(shù)的下溢處理方法1)截斷法:將尾數(shù)超出計算機字長的部分截去。特點:實現(xiàn)簡單不增加硬件和處理
13、時間,但誤差較大且無法調(diào)節(jié),很少使用。2) 舍入法:增設一附加位存放溢出最高位,每次進行尾數(shù)下溢處理時,附加位加1。特點:實現(xiàn)簡單,增加硬件少,誤差小。但處理速度慢。多用于中低速計算機。3)恒置1”法:將計算機運行的規(guī)定字長的最低位恒置為“1”。特點:實現(xiàn)最簡單,不增加硬件和處理時間,平均誤差趨于0。最大誤差大,多用于中、高速計算機。4) 查表舍入法:用 ROM或PLA存放下溢處理表。特點:速度快,平均誤差可調(diào)節(jié)到0。硬件量大,使用很多。計算機組成設計必須注意解決好數(shù)的下溢處理,因為這種精度損失對系統(tǒng)程序和應用程序設計者都是透明的,設計得不好,同樣的題目在用不同下溢處理方法的計算機上會得到不同
14、的運算結果。下溢處理方法的選擇是在速度、誤差、造假、實現(xiàn)方便等多方便的綜合權衡。第二節(jié)尋址方式尋址方式Addressing mode是指一種指令集結構如何確定所要訪問的數(shù)據(jù)的地址。 一、尋址方式的三種面向1)面向寄存器:保存在寄存器,少量送入主存。2)面向堆棧:主要訪問堆棧,少量訪問主存或寄存器。3) 面向主存:主要訪問主存,少量訪問寄存器。二、尋址方式在指令中的指明1)占用操作碼中的某些位來指明。2)不占用操作碼,而是在地址碼部分專門設置尋址方式位字段指明。三、程序在主存中的定位技術邏輯地址:程序員編程用的地址;物理地址:程序在主存中的實際地址。靜態(tài)再定位目的程序裝入主存,用軟件將邏輯地址變
15、換成物理地址。動態(tài)再定位指令不修改,通過基址尋址法來解決。(越界判斷:邏輯空間小于實存空間)虛實地址映像表查表獲得。(虛擬頁式存儲器)四、物理主存中信息的存儲分布為了使任何時候所需的信息都只用一個存儲周期訪問到,要求信息在主存中存放的地址必須是信息寬度的整數(shù)倍。否則,可能發(fā)生信息跨主存邊界存放,此時認為地址有錯,不予訪問。第三節(jié)指令系統(tǒng)的設計和優(yōu)化一、指令系統(tǒng)設計的基本原則指令系統(tǒng)是軟、硬件的主要界面,它在很大程度上決定了計算機具有的基本功能。二、指令操作碼的優(yōu)化指令是由操作碼和地址碼兩部分組成的。指令格式優(yōu)化:用最短的位數(shù)來表示指令的操作信息和地址信息,使程序中指令的平均字長最短。操作碼優(yōu)化
16、:縮短指令字長,減少程序總位數(shù),增加指令字能表示的操作信息和地址信息。擴展操作碼也必須遵守短碼不能是長碼的前綴的原則。三、指令字格式的優(yōu)化措施:1)采用擴展操作碼。并根據(jù)指令的頻度Pi的分布情況選擇合適的編碼方式,以縮短操作碼的平均長度。2)采用多種尋址方式,以縮短地址碼的長度, 并在有限的地址長度內(nèi)提供更多的地址 信息。3)采用多種地址制,以增強指令的功能, 這樣從宏觀上就能縮短程序的長度,并加快程序的執(zhí)行速度。在同種地址制內(nèi)再采用多種地址形式,讓每種地址字段可以有多種長度,且讓長操作碼與短地址碼進行組配。5)在維持指令字在存儲器中按整數(shù)邊界存儲的前提下,使用多種不同的指令字長度。第四節(jié) 指
17、令系統(tǒng)的發(fā)展和改進一、CISC和 RISCCISC復雜指令集計算機、RISC精簡指令系統(tǒng)計算機二、按CISC方向發(fā)展和改進指令系統(tǒng).面向目標程序的優(yōu)化實現(xiàn)改進1)通過對大量已有機器的機器語言程序及其執(zhí)行情況,統(tǒng)計各種指令和指令串的使用頻率加以分析和改進。2)增設強功能復合指令來取代原先由常用宏指令或子程序?qū)崿F(xiàn)的功能,由微程序解釋實現(xiàn)。.面向高級語言的優(yōu)化實現(xiàn)改進1)通過對源程序中各種高級語言語句的使用頻率進行統(tǒng)計來分析改進。2)如何面向編譯,優(yōu)化代碼生成來改進。3)改進指令系統(tǒng),使它與各種語言間的語義差距都有同等的縮小。4)采用讓計算機具有分別面向各種高級語言的多種指令系統(tǒng)、多種系統(tǒng)結構的面向
18、問題動態(tài)自尋優(yōu)的計算機系統(tǒng)。5)發(fā)展高級語言計算機。(直接執(zhí)行/通過匯編語言間接執(zhí)行).面向OS的優(yōu)化實現(xiàn)改進1)通過對OS中常用指令和指令串的使用頻度進行統(tǒng)計分析來改進。2)考慮如何增設專用于 OS的新指令。3)把OS中頻繁使用時,對速度影響大的機構型軟件子系統(tǒng)硬化或固化,改為直接用 硬件或微程序解釋實現(xiàn)。4)發(fā)展讓OS由專門的處理機來執(zhí)行的功能分布處理系統(tǒng)結構。三、按RISC方向發(fā)展和改進指令系統(tǒng)CISC的問題1)指令系統(tǒng)龐大,200條以上。2)許多指令系統(tǒng)的操作繁雜,執(zhí)行速度很低。3)編譯程序難以優(yōu)化生成高效機器語言程序。4)許多指令使用頻率很低。設計RISC的基本原則1)確定指令系統(tǒng)時
19、,只選擇使用頻度很高的那些指令,在此基礎上增加少量能有效支持OS、高級語言實現(xiàn)及其他功能的指令,大大減少指令條數(shù),一般不超過100條。2)減少指令系統(tǒng)所用尋址方式種類,一般不超過兩種。3)讓所有指令都在一個機器周期完成。4)擴大通用寄存器數(shù),一般不少于32個,盡量減少訪存,所有指令只有存(STORE)、 ?。↙OAD)指令訪存,其他指令一律只對寄存器操作。5)為了提高指令執(zhí)行速度,大多數(shù)指令都用硬聯(lián)控制實現(xiàn),少數(shù)指令才用微程序?qū)崿F(xiàn)。6)通過精簡指令和優(yōu)化設計編譯程序,簡單、有效地支持高級語言的實現(xiàn)。設計RISC結構采用的基本技術按設計RISC的一般原則來設計。2)邏輯實現(xiàn)采用硬聯(lián)和微程序相結合
20、。在CPU中設置大量工作寄存器并采用重疊寄存器窗口?!驹O計RISC結構的重疊寄存器窗口技術:采用讓相鄰過程的低區(qū)和高區(qū)公用同一組物理寄存器的重疊技術,可實現(xiàn)這兩個過程直接交換參數(shù),顯著地減少過程調(diào)用和返回的執(zhí)行時間、執(zhí)行指令的條數(shù)和訪存次數(shù)?!?)指令用流水和延遲轉(zhuǎn)移。5)采用高速緩沖存儲器 Cache,設置指令Cache和數(shù)據(jù)Cache分別存放指令和數(shù)據(jù)。優(yōu)化設計編譯系統(tǒng)。4. RISC技術的發(fā)展1)簡化指令系統(tǒng)設計,適合 VLSI實現(xiàn)。2)提高計算機的執(zhí)行速度和效率。3)降低設計成本,提高系統(tǒng)的可靠性。4)可直接支持高級語言的實現(xiàn),簡化編譯程序的設計。RISC存在的問題:1)由于指令少,使
21、原來在CISC上由單一指令完成的某些復雜功能現(xiàn)在要用多條RISC指令才能完成,加重了匯編語言程序設計的負擔,增加了機器語言程序的長度,占用存儲空間多,加大了指令的信息流量。2)對浮點運算的執(zhí)行和虛擬存儲器的支持仍顯不足。3) RISC計算器的編譯程序比 CISC的難寫。第三章存儲、中斷、總線與I/O系統(tǒng)第一節(jié)存儲系統(tǒng)的基本要求和并行主存系統(tǒng)一、存儲系統(tǒng)的基本要求從用戶的角度來看:容量、速度、價格。三個要求是互相沖突的。 在存儲器所有器件一定的條件下,容量越大,因其延遲增大會使速度降低;容量越大,存儲器總價格會越大;存儲器速度越快,價格也越高。二、并行主存系統(tǒng)能并行讀出多個CPU字的單體多字和多
22、體單字、多體多字的交叉訪問主存系統(tǒng)被稱為并行 主存系統(tǒng)。平均字數(shù)B=(1-(1- ym)/入,轉(zhuǎn)移概率入定義為給定指令的下條指令地址為非順序地址的概 率。局限性:提高模數(shù)m對提高主存實際頻寬的影響已不顯著了。實際上模數(shù)m的進一步增大,會因工程實現(xiàn)上的問題,導致實際性能反而可能更低,且價格更高,所以,模數(shù)m不宜太大。必要性:正因為程序的轉(zhuǎn)移概率不會很低,數(shù)據(jù)分布的離散性較大,所以單純靠增大m來提高并行主存系統(tǒng)的頻寬是有限的,而且性價比還會隨m的增大而下降。如果采用并行主存系統(tǒng)仍不能滿足速度上的要求,就必須從系統(tǒng)結構上進行改進,采用存儲體系。第二節(jié)中斷系統(tǒng)定義:? 中斷:CPU中止正在執(zhí)行的程序,
23、 轉(zhuǎn)去處理隨機提出的請求, 待處理完后,再回到原先 被打斷的程序繼續(xù)恢復執(zhí)行的過程。? 中斷系統(tǒng):響應和處理各種中斷的軟、硬件總體。? 中斷源:引起中斷的各種事件。? 中斷請求:中斷源向中斷系統(tǒng)發(fā)出請求中斷的申請。? 中斷響應:允許其中斷 CPU現(xiàn)行程序的運行,轉(zhuǎn)去中斷處理程序。? 中斷向量:CPU響應中斷時,開始執(zhí)行中斷服務程序前, 所跳轉(zhuǎn)到的一個特定的地址。? 中斷使能:允許 CPU響應中斷請求,做出中斷處理。? 中斷屏蔽,組織 CPU響應中斷請求,禁止中斷處理。? 中斷優(yōu)先級:指示中斷請求的緊迫程序? 中斷嵌套:在進行中斷處理時響應高優(yōu)先級的中斷。一、中斷的分類和分級.中斷的分類機器校驗
24、、管理程序調(diào)用、程序性、外部、輸入/輸出、重啟。.中斷的分級1)第1級:機器校驗。第2級:程序性中斷和管理程序調(diào)用。3)第3級:外部中斷。第4級:輸入/輸出。5)第5級:重啟。二、中斷的響應次序與處理次序中斷的響應次序是在同時發(fā)生多個不同中斷類的中斷請求時,中斷響應硬件中的排隊器所決定的響應次序。中斷的處理要由中斷處理程序來完成,而中斷處理程序在執(zhí)行前或執(zhí)行中是可以被中斷的。三、中斷系統(tǒng)的軟、硬件功能分配定義:中斷處理程序軟件和中斷響應硬件的功能的分配。第三節(jié)總線系統(tǒng)一、總線的分類定義:總線(Bus)是一組信號線的集合,它定義了各引線的信號、電氣和機械特性,使計 算機系統(tǒng)內(nèi)部的各部件之間以及外
25、部的各系統(tǒng)之間建立信號聯(lián)系,進行數(shù)據(jù)傳遞和通信。 總線按在系統(tǒng)中的位置分類:芯片級;板級;系統(tǒng)級。.專用總線:1)優(yōu)點:多個部件可以同時收 /發(fā)信息,系統(tǒng)流量高;通信時不指明源和目的,控制 簡單;任何總線的失效只會使連于該總線的兩個部件不能直接通信,它們?nèi)匀豢梢酝ㄟ^其他部件間接通信,系統(tǒng)可靠。) 缺點:總線數(shù)多。只適用于實現(xiàn)某個設備僅與另一個設備的連接。2.非專用總線:優(yōu)點:總線數(shù)少,造價低;總線接口標準化、模塊化強;可擴充能力強,部件的增加不會使電纜、接口和驅(qū)動電路激增;易用多重總線來提高總線的貸款和可靠性,使故障弱化。2)缺點:系統(tǒng)流量小,經(jīng)常出現(xiàn)爭用總線, 使未獲得總線使用權的部件不得不
26、等待而 降低效率。適宜用于I/O系統(tǒng)。二、總線的控制方式串行鏈接優(yōu)點:選擇算法簡單,用于解決總線控制分配的控制線的線數(shù)少,只需要3根,且不取決于部件的數(shù)量;部件的增減容易,只需簡單地把它連到總線上或從總線上去掉即可,可擴充好;由于邏輯簡單,容易通過重復設置可高可靠性。缺點:對“總線可用”線及其有關電路的失效敏感,如果部件i不能正確傳送”總線可用 “信號,則部件i之后的所有部件將得不到總線的使用權。增減或移動部件受限。定時查詢優(yōu)點:因計數(shù)器初值、部件號均可有程序制定,優(yōu)先次序可用程序控制,靈活性強;不會因某個部件失效而影響其他部件對總線的使用,可靠性高。缺點:控制線的線數(shù)較多,需要 2+long
27、2(N)根;可以共享總線的部件數(shù)受限于定時查詢線的線數(shù),擴展性稍差;控制較為復雜;總線分配的速度取決于計數(shù)信號的頻率和部件數(shù),不能很高。獨立請求優(yōu)點:總線分配的速度很快,所有部件的總線請求同時送到總線控制器,不用查詢;控制器可以使用程序可控的預訂方式、自適應方式、循環(huán)方式或它們的混合方式靈活確定下一個使用總線的部件;能方便地隔離失效部件的請求。缺點:控制線數(shù)量過大,為控制N個設備必須有2N+1根控制線,而且總線控制器要復雜得多。三、總線的通信技術1,同步通信2.異步通信四、數(shù)據(jù)寬度與總線線數(shù)1,數(shù)據(jù)寬度定義:I/O設備取得I/O總線后所傳送數(shù)據(jù)的總量。數(shù)據(jù)寬度分類:單字、定長塊、可變長塊、單字
28、加定長塊、單字加可變長塊。2,總線線數(shù)第四節(jié) I/O系統(tǒng)一、I/O系統(tǒng)概述I/O系統(tǒng)包括輸入/輸出設備、設備控制器及與輸入/輸出操作有關的軟、硬件。I/O系統(tǒng)3種方式:程序控制I/O、直接存儲器訪問 DMA、I/O處理機方式。I/O處理機方式:通道(Channel)方式、外圍處理機(PPU)方式。二、通道處理機的工作原理和流量設計通道處理機的工作原理根據(jù)通道數(shù)據(jù)傳送期中信息傳送方式的不同,分為:1)字節(jié)多路:適用于連接大量的像光電機等字符類低速設備。2)數(shù)組多路:適合于連接多臺磁盤等高速設備。3)選擇通道:適合于優(yōu)先級高的磁盤等高速設備,讓它獨占通道,只能執(zhí)行一道通道程序。2,通道流量設計1)
29、字節(jié)多路:每選擇一臺設備只傳一個字節(jié),F(xiàn)maxbyte=1/(Ts+Td),2)數(shù)組多路:每選擇一臺設備可傳送完K個字節(jié),F(xiàn)maxblock=K/(Ts+K*Td)=1/(Ts/K+Td)3)選擇通道:每選擇一臺設備就把 N個字節(jié)全部的傳送完,F(xiàn)maxselect=N/(Ts+N*Td)=1/(Ts/N+Td)第四章存儲體系第一節(jié)基本概念一、存儲體系及其分支存儲體系:即層次結構是讓構成存儲系統(tǒng)的幾種不同的存儲器(M1Mn )之間配上輔助軟、硬件或輔助硬件,使之從應用程序員角度來看,它們在邏輯上是一個整體。虛擬存儲器是因為主存容量滿足不了要求而提出來的。因主存速度滿足不了要求而引出了Cache存
30、儲器。二、存儲體系的構成依據(jù)三、存儲體系的性能參數(shù)存儲層次的每位價格 C=(C1*Sm1+C2*Sm2)/(Sm1+Sm2)。命中率:CPU訪問存儲系統(tǒng)時,在 M1中找到所需信息的概率。存儲層次的等效訪問時間Ta=H*Ta1+(1-H)Ta2 。存儲層次的訪問效率 e=Ta1/Ta越接近1越好。CPU對存儲層次訪問時間比 r=Ta2/Ta1 。e=Ta1/Ta=Ta1/(h*Ta1+(1-H)*Ta2)=1/(H+(1-H)*r)。在主、輔存之間增加一級,使級間r值不會過大,有利于降低對 H的要求,以獲得同樣的e。第二節(jié)虛擬存儲器一、虛擬存儲器的管理方式.段式管理將主存按段分配的存儲管理方式稱
31、為段式管理。.頁式管理頁式存儲是把主存空間和程序空間都機械式地等分成固定大小的頁,按頁的順序編號。.段頁式管理段頁式存儲是把實(主)存機械地等分成固定大小的頁,程序按模塊分段,每個段又分成與實主存頁面大小相同的頁。二、頁式虛擬存儲器的構成.地址的映像和變換全相聯(lián)映像的實頁沖突概率最低。.頁面替換算法隨機算法RAND先進先出算法FIFO3)近期最少使用算法 LRU4)優(yōu)化替換算法OPTLRU和OPT是堆棧型算法,F(xiàn)IFO不是。頁面失效頻率PFF算法:當主存頁面失效率超過某個值,就自動增加分配給該道程序的主存頁數(shù),以提高命中率;而當主存頁面失效率低于某個值時,就自動減少分配給該道程序的主存頁數(shù),以
32、便釋放出這部分主存頁面位置供其他程序用,從而使整個系統(tǒng)總的主存命中率和利用率得到提高。 3.虛擬存儲器工作的全過程三、頁式虛擬存儲器實現(xiàn)中的問題.頁面失效的處理.提高虛擬存儲器等效訪問速度的措施TLB:存放當前正在使用的虛、實地址映像關系的部分表。慢表:存放全部虛、實地址映像關系的表。結論:如果TLB的命中率不高,系統(tǒng)效率會顯著下降。TLB如果用堆棧型替換算法,則 TLB容量越大,其命中率就越高。但容量越大,會使相連查找的速度越低,所以快表的命中率和查表速度有矛盾。于是TLB和慢表實際構成了一個兩級層次,其所用的替換算法一般也是LRU算法。.影響主存命中率和 CPU效率的某些因素1)當分配給某
33、道程序的主存容量S1 一定時,隨著頁面大小Sp由很小開始增大,命中率H先逐漸增大,到達某個最大值后又減小。同時,分配給該道程序的容量S1增大可普遍提高命中率,達到最高命中率時的頁面大小Sp也可以大一些。2)分配給某道程序的容量 S1的增大也只是在開始時對H提高有明顯作用。第三節(jié)告訴緩沖存儲器一、工作原理和基本結構高速緩沖(Cache)存儲器是為了彌補主存速度的不足,在處理機和主存之間設置一個高速、小容量的Cache,構成Cache主存存儲層次,使之從CPU角度來看,速度接近于Cache , 容量卻是主存的。二、地址的映像與變換地址的映像就是將每個主存塊按某種規(guī)則裝入Cache中;地址的變換就是
34、每次訪Cache時怎樣將主存地址變換成 Cache地址。映像規(guī)則的選擇除了看所用的地址映像和變換硬件是否速度高、價格低和實現(xiàn)方便外,還要看塊沖突概率是否低、Cache空間利用率是否高。.全相聯(lián)映像和變換塊沖突概率最低,只有當Cache裝滿才可能出現(xiàn)塊沖突,所以 Cache的空間利用率最.直接映像及其變換節(jié)省所需硬件,成本很低。.組相聯(lián)映像及其變換比全相聯(lián)成本低得多,性能上接近于全相聯(lián)映像,獲得了廣泛應用。三、Cache存儲器的LRU替換算法的硬件實現(xiàn)四、Cache存儲器的透明性及性能分析Cache存儲器的透明性及解決方法Cache的取算法Cache存儲器的性能分析Cache存儲器性能主要看命中
35、率。命中率與塊的大小、Cache的總容量、組的大小、替換算法有關。不管Cache本身的速度多高,只要命中率有限,等效訪問速度能提高的最大值是有限的。結論:Cache本身的速度與容量都會影響Cache存儲器的等效訪問速度。如果速度差得遠,說明命中率低,應該改進命中率。如果速度接近,更換更高速的Cache芯片。第五章標量處理機第一節(jié)重疊方式一、重疊原理與一次重疊定義:指令的重疊解釋是指在解釋第k條指令的操作完成之前,就可以開始解釋第k+1條指令。實現(xiàn)指令的重疊解釋必須在計算機組成上滿足以下要求:要解決訪主存的沖突。2)要解決“分析“與”執(zhí)行”操作的并行。3)要解決“分析“與”執(zhí)行“操作控制上的同步
36、。4)要解決指令間各種相關的處理。二、相關處理第二節(jié)流水方式一、基本概念. 工作原理概念:計算中的流水線是把一個重復的過程分解為若干個子過程,每個子過程與其他子過程并行進行。由于這種工作方式與工廠中的生產(chǎn)流水線十分相似,因此稱為流水線技術。.流水的分類1)靜態(tài)流水線:在某一時間內(nèi)各段只能按一種功能連接流水,只有等流水線全部流空后,才能切換成按另一種功能連接流水。2)動態(tài)流水線:各功能段在同一時間內(nèi)可按不同運算或功能連接。二、標量流水線的主要性能吞吐率Tp和加速比Sp吞吐率Tp=n/Tk ,是流水線單位時間里能流出的任務數(shù)或結果數(shù)。加速比Sp=T0/Tk ,完成一批任務使用非流水線執(zhí)行時間與使用
37、流水線執(zhí)行時間之比。流水線的最大吞吐率 T=1/maxti,為了提高流水線的最大吞吐率,首先要找出瓶頸,然后設法消除此瓶頸。將瓶頸子程序再細分;通過重復設置多套瓶頸段并聯(lián),讓它們交叉并行。效率流水線的效率E=n個任務實際占用的時空區(qū)/m個段總的時空區(qū),是指流水線中設備的實際使用時間占整個運行時間之比,也稱為流水線設備的時間利用率。三、標量流水機的相關處理和控制機構.局部性相關的處理.全局性相關的處理1)使用猜測法。2)加快和提前形成條件碼。采用延遲處理。加快短循環(huán)程序的處理。.流水機器的中斷處理.非線性流水線的調(diào)度第三節(jié)指令級高度并行的超級處理機一、超標量處理機 Superscalar非常適合于求解像稀疏向量或稀疏矩陣這類標量計算問題。二、超長指令字處理機 VLIW不適用于一般的應用領域。三、超流水線處理機 Superpipelining四、超標量超流水線處理機是超標量與超流水線處理機的結合。第六章向量處理機第一節(jié) 向量的流水處理與向量流水處理機向量處理機是有向量數(shù)據(jù)表示的處理機。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小熊與大樹的對話童話作文(13篇)
- 個人成長潛能呈現(xiàn)承諾書6篇范文
- 公司出口商品質(zhì)量保障承諾書(7篇)
- 2025南平市延平區(qū)疾病預防控制中心招聘駕駛員模擬試卷及參考答案詳解一套
- 尊貴藝術珍品保真購藏承諾函(9篇)
- 2025年煙臺市公費醫(yī)學生考試選聘(139人)考前自測高頻考點模擬試題帶答案詳解
- 企業(yè)資產(chǎn)采購標準合同范本
- 商業(yè)計劃書制作流程工具
- 2025內(nèi)蒙古鄂爾多斯市康巴什區(qū)青年就業(yè)見習計劃招募考前自測高頻考點模擬試題及答案詳解(全優(yōu))
- 遼寧省葫蘆島市2024-2025學年高一下學期期末考試地理地理試卷(解析版)
- 數(shù)據(jù)庫版本管理手冊
- 2024年河南鄭州高新區(qū)招聘社區(qū)工作人員筆試真題
- 財務部門增值稅發(fā)票管理操作手冊
- 2025年交管12123版學法減分全部試題及答案解析
- 完整版消防應急預案范本三篇
- 算力經(jīng)濟發(fā)展研究報告(2025年)
- 互聯(lián)網(wǎng)醫(yī)院醫(yī)療健康服務模式創(chuàng)新與推廣方案
- 出口貿(mào)易安全培訓制度課件
- 加強送餐安全培訓課件
- GB/T 18268.21-2025測量、控制和實驗室用的電設備電磁兼容性要求第21部分:特殊要求無電磁兼容防護場合用敏感性試驗和測量設備的試驗配置、工作條件和性能判據(jù)
- 人教PEP版(2024)2025-2026學年英語四年級上學期期中測試卷(含答案)
評論
0/150
提交評論