Cpu Pentium

  • June 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Cpu Pentium as PDF for free.

More details

  • Words: 6,033
  • Pages: 16
chương IV : CPU PENTIUM

Các thanh ghi

1) Sơ đồ khối.

Vùng đệm đích Rẽ nhánh (BTB)

Bộ xử lý dấu chấm di động

Cache số liệu 8K

Đường ống U của ALU

Cache lệnh 8K

Hàng nhặt sớm

Các thanh ghi

Đường ống V của ALU Bus số liệu 64 bit

2) Đặc điểm của Pentium: Đơn vịCó Busđặc trưng 100MIPS ( 100 Million Instruction *Intel giới thiệu năm 1993: per second); Tốc độ đồng hồ là 66Mhz. Bus địa chỉ 32 bit Về số nguyên gấp nhanh gấp 4 lần 486DX. Hiệu suất số thập phân nhanh hơn 5 đến 7 lần 486DX * Thay đổi chính làm tăng tốc độ do 3 thành phần: -Đơn vị tính số nguyên: Hai đường dây song song đồng thời. -Cache cấp 1riêng cho số liệu và lệnh -Đơn vị tính toán d.c.d.d nhanh hơn. * Đặc điểm chính của Pentium: 1) Sản xuất theo công nghệ BICMOS:( 0,8µm; 4 lớp dây dẫn). 2)Chip có 3,1 triệu Transistor; Bus bên trong rộng 64 bit; Bus ngoài 32 bit. 3) Có cặp song sinh ALU; mỗi đường ống có 5 công đoạn → Có thể thi hành đồng thời 2 lệnh ngôn ngữ máy trong một chu kỳ. 1

4)Có 2 cache nhớ riêng, 2 chiều , 8kb; Một cache cho lệnh và một cache cho data; kết nối bus 64 bit → tốc độ nhanh hơn 486 nhiều lần. 5)Có nghi thức (Protocol) đặc biệt MESI → Làm việc tốt hệ đa vi xử lý (Modified; exclusive; sharedd; Invalid). 6) Bộ xử lý d.c.d.d nhanh hơn là 486; cũng có phần chọn hai lệnh thi hành đồng thời cho số thập phân . 7) Có vùng đệm đích dành cho các lệnh nhảy rẽ nhánh → các lệnh nhảy chỉ mất một chu kỳ. 3) Đường ống (Pipe line): -Thực ra mỗi lệnh khi thi hành ở cả hai loại 486 và Pentium đều phải trải qua 5 công đoạn theo một trình tự nhất định. 1. PF Prefetch - nhặt sớm: Lệnh ngôn ngữ máy nhặt từ bộ nhớ → vào CPU. 2. D1 Decode 1-Giải mã 1: Mục tiêu phân tích lệnh xem CPU sẽ khởi kích hành động nào. 3. D2 Decode 2-Giải mã 2: Tùy hành động → Xác định tác tố cần đến. 4. Ex Execute – Thực thi lệnh, và truy xuất ô nhớ liên quan. 5. WB – WriteBack- Ghi lại: Hoàn tất nội dung các thanh ghi CPU và thanh ghi trạng thái nội bộ vừa được thực hiện. -Mỗi công đoạn này đòi hỏi một chu kỳ máy ( Một nhịp xung đồng hồ của CPU ) Riêng công đoạn D2 và Ex còn có thể yêu cầu thêm một chu kỳ nữa → Tối thiểu phải mất 5 chu kỳ trong đó người ta vẫn nói một số lệnh chỉ dùng hết một hoặc hai chu kỳ máy là do nguyên lý vận dụng như trong dây chuyền lắp ráp sản phẩm. Có nhiều lệnh nhiều công đoạn khác nhau chạy song song trong đường ống → Mỗi lệnh chỉ mất một chu kỳ mặc dù thực chất phải chạy đủ 5 chu kỳ trên một lệnh. -Trong 486 việc thi hành theo đường ống đã nhanh rồi, nhưng Pentium lại còn nhân tốc độ lên bằng cách thiết lập đường ống thứ 2 song song → cơ chế này gọi này gọi là cấu trúc đường ống “Super calar” – siêu vô hướng. Gọi hai đường ống là đường ống U & V: + Nhờ hai đường ống này về mặt lý thuyết Pentium có thể thi hành đồng thời hai lệnh → kết quả tăng gấp đôi tốc độ thi hành lệnh ( Trên thực tế không đơn giản thế, vì hai lệnh kế tiếp nhau thường thi hành tuần tự vì chúng phụ thuộc nhau ). +Công đoạn thứ hai D1 sẽ xác định xem có thể thi hành song song cả hai lệnh được không ? Trong công đoạn PF : lệnh hiện hành phải được thi hành, còn lệnh kế tiếp sẽ được nạp vào đơn vị giải mã song song Lệnh hiện hành → đưa vào đơn vị giải mã ống U 2

Lệnh kế tiếp → dưa vào đơn vị giải mã ống V + Nếu công đoạn D1 xác định là có thể thi hành đồng thời hai lệnh thì mỗi lệnh sẽ trải qua các công đoạn khác nhau trong đường ống của mình theo phương thức song song. Nếu như không thể thi hành hai lệnh cùng lúc thì lệnh hiện hành trong ống U đi đến công đoạn kế tiếp như bình thường, lệnh kế tiếp trong ống V sẽ được chuyển qua thi hành trong ống U ( Vì trước đó các lệnh được nạp vào cả hai đường ống ) → Thực hiện như là một lệnh kế tiếp lệnh hiện hành. Các trình biên dịch đã được tối ưu hóa với Pentium → tổ chức mã máy theo một cách thức sao cho các lệnh ngôn ngữ máy kế tiếp nhau cho phép càng thi hành đồng thời càng nhiều càng tốt. 4) Vùng đệm đích rẽ nhánh BTB: ( Dành cho lệnh nhảy ) -Hiệu quả của nguyên lý đường ống → Dựa vào phải cung cấp liên tục các lệnh cho mỗi đường ống, phải “Cho ăn liên tục” → Phải sử dụng hai vùng đệm prefetch được thiết lập cho công đoạn đầu tiên của cả hai đường ống. -Khi thực hiện một lệnh nhảy thì các vùng đệm prefetch này trở nên vô ích . Thay vì thi hành lệnh kế tiếp → thì chương trình phải thi hành một lệnh hoàn toàn khác → các lệnh tiếp theo nằm trong đường ống phải tống ra ngoài và nạp các lệnh mới → khi gặp lệnh nhảy phải mất một vài chu kỳ trước khi lệnh đầu tiên rời khỏi đường ống sau khi thi hành lệnh nhảy. Để giải quyết → Pentium sử dụng thêm vùng đệm BTB dành cho lệnh nhảy . Vùng đệm BTB sẽ được sử dụng trong công đoạn D1 đối với tất cả các lệnh nhảy gần ( Near Jump – Ví dụ như các lệnh nhảy có điều kiện và vô điều kiện, các lệnh triệu gọi các thủ tục ). Nếu gặp một lệnh nhảy như thế CPU nạp lệnh này vào BTB ( Nó cất cả địa chỉ lệnh nhảy và địa chỉ nơi đến của lệnh nhảy vào trong BTB ). Giả thiết là lệnh nhảy phải thi hành lần nữa thì thay vì nạp lệnh nhảy kế tiếp sau lệnh nhảy vào đường ống → CPU nạp lệnh ở địa chỉ đích của lệnh nhảy vào đường ống. Trong trường hợp này một lệnh nhảy có điều kiện thậm chí cũng chỉ mất có một chu kỳ còn bình thường phải tốn 3 chu kỳ cho một lệnh nhảy. 5) Cache của Pentium: a) Khái niệm Cache -CPU Pentium có hai cache nhớ 8kb riêng biệt: Môt cache cho dữ liệu, một cache cho lệnh chương trình: Cả hai cache đều thuộc loại hai chiều kết hợp với nhau ( 2 way Set- Associative cache ), mỗi chiều gồm có 128 mục vào – 32 bytes ( bằng 4 kb ). Cache có thể làm việc theo chế độ Writethrough và copyback, và có khả năng đáp ứng đồng thời hai truy xuất từ đường ống U và V. 3

-Khái niệm Cache: + Cache CPU (hay Cache cấp 1) + Cache tr ên Main board (Cache cấp 2 ) - Trước hết cache được dùng tăng tốc việc truy xuất số liệu hay thông tin cụ thể bằng cách giữ các dữ liệu trong một vùng nhớ riêng → vùng này là 1 cache. Ưu điểm là việc truy xuất nhanh hơn là truy xuất từ thiết bị trữ tin. + Cache đĩa cứng Cache font Sử dụng RAM làm “Bộ nhớ cao tốc”. Cache CD-Rom Nhưng cache CPU không áp dụng nguyên tắc này vì RAM cung cấp dữ liệu và lệnh chương trình không đủ nhanh cho CPU. -Cache CPU là cấp 1 ( the f irst level cache ) được đặt ngay trong CPU và đọc nhanh như đọc từ các thanh ghi (đặt cache càng to càng nhiều trong CPU càng tốt, nhưng còn tùy thuộc công nghệ chế tạo vi xử lý). Cache cấp 2 là cache nhớ 128 k hoặc 256 k nằm giữa CPU và RAM. Thường là các SRAM (RAM tĩnh ) – dạng RAM cao tốc, nhanh gấp 3, 4 lần các bộ nhớ chính cấu tạo từ DRAM, SRAM (20,25 ns); DRAM (70,80,100 ns). -Cache cấp 3 là bộ nhớ chính [(RAM) thường] dùng làm cache cho đĩa cứng và các thiết bị ngoại vi khác. -Số cấp cache càng tăng → tốc độ càng giảm → giá thành/ 1kb cũng giảm theo. b)Hiệu quả Cache. -Chất lượng và hiệu quả của một cache được đánh giá bằng tỉ số: Số lần trúng tủ/Số lần trượt (Cache hits/Cache misses) Khi truy xuất dữ kiện Cache hits: Dữ kiện CPU yêu cầu có sẵn trong Cache Cache misses: Không có trong Cache. -Tỉ số trên phụ thuộc 3 yếu tố: Tổ chức cache, loại mã lệnh chương trình, kích thước cache. 1. Kích thước Cache : tăng lên → Trữ nhiều thông tin → Truy tìm của CPU nằm sẵn trong Cache tăng. 2. Loại mã lệnh chương trình, Tính địa phương ( Locality ) rất quan trọng vì cache CPU chứa cả dữ liệu và mã lệnh chương trình → nếu các phần trình “bó gọn“(Self Contained), đặc biệt các vòng lặp nằm trọn trong một cache thì tốc độ thi hành rất nhanh ( Khối lệnh chương trình nhỏ hơn kích thước cache ). Nếu một chương trình chứa các lệnh nhảy lên nhảy xuống liên tục giữa các chương trình con khác nhau, hay các phần chương trình khác nhau → hiệu quả dùng cache rất thấp. 4

3. Điều rất quan trọng là tổ chức của Cache phụ thuộc vào hai yếu tố: -Chiến lược trữ đệm ( Cache strategies ) -Cấu trúc Cache c) Chi ến lược trữ đệm. * WriteThrough: Cache chỉ định vị với các truy xuất đọc của CPU, WTC (Writethough cache). Chuyển các truy xuất ghi đến bộ nhớ RAM chính. Trước khi chuyển, WTC kiểm tra xem vị trí ô nhớ vừa mô tả: -Đã được trữ trong Cache do kết quả đọc chưa ? → đã → Trị mới của vị trí ô nhớ cũng được ghi ngay trong Cache. -Không có → truy xuất RAM chính. * Thủ tục hiệu chính tốt hơn WTC là “Buffered Writethough”. Cache cấp 1 được trang bị bổ sung thêm các vùng đệm ghi (Write buffer) để tăng tốc các thao tác ghi đến bộ nhớ ( 486DX có đến 4 vùng đệm này ). Khi số liệu cần phải ghi vào bộ nhớ → WTC đặt vào vùng đệm ghi này → cho phép CPU tiếp tục làm việc khác ngay. Vì vùng đệm ghi này được định vị nhanh, trong khi CPU làm việc thì Cache ghi nội dung các vùng đệm ra bộ nhớ thông thường trên Bus riêng của nó, ngay khi Bus vừa rảnh rỗi. *Thủ tục WriteBack(WBC): Với tác vụ đọc thì WBC giống như WTC. Với tác vụ ghi thì WBC khác với WTC. Nếu thông tin (được ghi ra bộ nhớ) đã nằm sẵn trong Cache, nó chưa phải ra khỏi cache cho đến khi nó cần vị trí đó để đọc thông tin mới vào. Khi cần đến vị trí này → được chuyển vào vùng đệm cas toff → sau đó chuyển đến bộ nhớ song song với công việc của CPU (Làm việc đồng thời với CPU). d) Cấu trúc Cache. - Cache nhớ thường được tổ chức thành các hàng Cache(Cache Line). Kích thước một hàng Cache tùy thuộc dung lượng số liệu nội bộ CPU hoặc dung lượng Cache cấp 1 của CPU. 386: Một hàng Cache: 32 bit ( Dword =4 bytes) 486: Một hàng Cache : 128 bit (4Dword=16 bytes) Pentium: Một hàng Cache: 256 bit( Qword=32 bytes) * Chế độ Burst Mode: Với các CPU đời mới chạy theo chế độ “Burt Mode” làm tăng tốc truy xuất các byte nằm liên tục trong ô nhớ nhanh kinh khủng. Thông thường CPU phải cho địa chỉ lên Bus trước khi đọc ô nhớ mà nó nhắm tới trong chế độ Burst Mode, truy xuất số liệu được đọc như một khối. CPU chỉ cần cung cấp địa chỉ của byte đầu tiên trên bus, sau đó bộ nhớ tự động cung cấp tất cả địa chỉ ô nhớ tiếp theo khi có yêu cầu → giảm chu kỳ chuyển địa chỉ ổ nhớ cần truy xuất: 5

Ví dụ: 486 thường cần 2 chu kỳ đồng hồ để đọc một Dword từ bộ nhớ → để nạp trọn vẹn một hàng Cache cần 4x2=8 chu kỳ đồng hồ trong chế độ Burst Mode chỉ có Dword đầu tiên là cần 2 chu kỳ còn 3 Dword tiếp theo chỉ còn một chu kỳ → Burst Mode chỉ cần 5 chu kỳ 2-1-1-1. Thay cho 8 chu kỳ cho phép chuyển số liệu thông thường. * Cache trữ đệm cả số liệu và cả các địa chỉ của số liệu → Mỗi hàng có một cái tên ( Gọi là tag ). Các tag này không được kèm ngay với hàng Cache mà được ghi vào phần nhớ riêng biệt (Khi tìm sẽ mất thời gian, nhưng bù lại SRAM nhanh hơn). * Cùng với các hàng cache và tag mỗi Cache còn có bộ phận điều khiển Cache. Với Cache cấp 2 → có một bộ vi điều khiển trên vỉ mạch chính. Còn với Cache cấp 1 → Điều khiển Cache là một phần của CPU. e) Tổ chức hàng Cache * Thông tin không thể được cất giữ tùy tiện trong hàng cache bất kỳ; vì như vậy bộ phận điều khiển Cache phải kiểm tra tất cả các tag để tìm đúng địa chỉ so sánh với địa chỉ CPU → Quá trình này mất nhiều thời gian → tổ chức Cache đơn giản nhất gọi là “Ánh xạ trực tiếp” ( Direct Mapping) Địa chỉ  Một hàng Cache. Ví dụ: Cache thứ cấp của 486 →Làm việc một hàng Cache 128 bit (16 byte). Một Cache 256 k cung cấp 16384 hàng ( 214 ) Nhiệm vụ của điều khiển Cache là ánh xạ địa chỉ CPU đến một trong 16384 hàng Cache. Như vậy : -14 bit ( từ 4-17 ) của CPU xác định số thứ tự hàng Cache -4 bit ( từ 0-3): Chỉ mục trong hàng Cache. -Còn lại 18-31: trữ trong tag của một hàng Cache: (Gồm 14 bit ) Nhưng thường chỉ dùng 8 bit ( từ 18-25 ) . Cache chỉ quản lý 64 Mb thấp (226) của bộ nhớ RAM. (Dung lượng này cũng đủ cho RAM trên vỉ mạch chính.). Nhược điểm: 64Mb RAM chỉ được ánh xạ đến 16384 hàng Cache → Có đến 256 địa chỉ ô nhớ cùng chia sẻ một hàng cache → Cache liên hợp. *Cache liên hợp(Associative Cache) tinh chỉnh lại quá trình ánh xạ trực tiếp . Thay vì gán một hàng Cache đơn lẻ cho mỗi địa chỉ ô nhớ, ta có thể gán 2, 4, 8 hàng cache. Gọi là Cache liên hợp gấp đôi ( two fold ), Gấp 4 ( four fold ); gấp 8 (eight fold). f) Phân trang và Đan xen: ( Paging and Interleaving) Nội dung chính là phân phối nội dung các hàng Cache đến các trang khác nhau trong bộ nhớ. Một trang là một khối nhớ liên tục. Không phải các hàng

6

Cache khác nhau bị phân chia rời nhau ra mà chính là nội dung các hàng cache bị chia ra. Ví dụ: Cache dữ liệu cấp 1 của Pentium là Cache đan xen gấp 8, nghĩa là 8 Dword của một hàng 256 bit được đặt trong 8 trang khác nhau. Các Dword đầu tiên từ tất cả hàng Cache được trữ trong trang đầu tiên, Các Dword thứ hai → Trang thứ 2...→ Các đường ống U và V của CPU muốn đọc các Dword khác nhau từ một trong hàng Cache → có thể truy xuất các trang khác nhau, vì thế cả hai đường ống có thể làm việc cùng một lúc. g) Nghi thức MESI ( Viết tắt 4 trạng thái khác nhau của một hàng Cache CPU ) - Nảy sinh vấn đề là các truy xuất trực tiếp như điều khiển DMA, bỏ qua CPU và bộ phận điều khiển Cache mà truy xuất trực tiếp ô nhớ → phá hủy sự nhất quán trong Cache. Hay với hệ đa xử lý, nhiều CPU, mỗi CPU có cache cấp 1 riêng của mình → sự nhất quán giữa các Cache phải được duy trì → sử dụng nghi thức MESI – là nghi thức đặc biệt gọi là ngó trộm Bus ( Bus snooping ). -MESI viết tắt đại diện cho 4 tình trạng của một hàng Cache. Mỗi hàng Cache có một tag chứa các cờ hiệu tích hợp để nhận diện tình trạng này. 1) M (Modified – Điều chỉnh): Hàng Cache này là duy nhất trong Cache ( Các CPU khác không truy xuất nó ); Nhưng nó đã bị điều chỉnh và chưa ghi trở lại RAM . Nội dung RAM khác với nội dung hiện có của địa chỉ ô nhớ. 2) E ( Exclusive – Độc nhất): Hàng Cache này là duy nhất trong Cache chưa bị điều chỉnh ( Nội dung RAM và nội dung hàng Cache khớp nhau ) 3) Shared ( chung ): Hàng Cache này có thể hiện diện trong các Cache khác, (CPU khác có thể truy xuất được). 4) Invalid ( Không hiệu lực ): Nội dung của hàng Cache này bây giờ không có ý nghĩa nữa, xem như là một hàng trống → nhận dữ kiện mới một cách tự do. h) Cache cấp một của Pentium. -2 Cache cấp 1 riêng biệt:-Một dành cho mã lệnh chương trình, một dành cho số liệu, cả hai đều có kích thước 8 k, thuộc loại liên hợp hai tuyến. Mỗi tuyến chứa 128 hàng Cache, mỗi hàng 32 byte (2 tuyến x 128 hàng Cache x 32 byte = 8k) . Cùng lúc có thể truy xuất cả hai cache được . Cache số liệu có khả năng đáp ứng đồng thời hai yêu cầu từ đường ống U & V → để làm được điều này các hàng Cache của nó là hàng đan xen gấp 8. Các tag trong Cache dữ liệu là Tripple – ported; nghĩa là có thể định vị cùng 7

một lúc bởi 3 nguồn khác nhau: hai cho ống U & V, còn một sử dụng cho việc sử dụng ngó trộm bus ( bus snooping) khi cần xác định một địa chỉ cụ thể có nằm trong cache hay không? -Nói chung cấu trúc Cache trong Pentium phức tạp hơn nhiều với Cache trong 486 ( Do sử dụng song song hai đường ống U, V và việc có thể sử dụng Cache của Pentium trong các hệ thống đa xử lý tạo nên sự phức tạp này ). Nhưng chính Cache Pentium là động lực, yếu tố làm nổi bật tốc độ của Pentium. 6. Đơn vị dấu chấm di động ( Floating point Unit ) *Giống như 486 đơn vị d.c.d.d của Pentium được sát nhập ngay trên Chip. Nhưng hiệu suất đã được cải thiện rất lớn. So sánh thời gian thi hành lệnh d.c.d.d. Lệnh 486 Pentium ý nghĩa lệnh FXCH 4chukì 1chukì Trao đổi số liệu FLD 3 1 Nạp FST 3 2 Cất dữ FADD 10 3 Cộng FSUB 10 3 Trừ FMUL 16 3 Nhân FDIV 73 39 Chia Lệnh FXCH có vai trò đặc biệt vì nó được thường xuyên sử dụng trong lập trình dấu chấm di động. Lệnh này phải thi hành với 8 thanh ghi dấu chấm di động ( của bộ xử lý dấu chấm di động). Các thanh ghi này xử lý giống như một ngăn chồng → Các lệnh này được thi hành nhiều hơn cả . Tăng tốc được lệnh FXCH là tăng được nhiều về tốc độ d.c.d.đ . *Đường ống dấu chấm di động gồm 8 công đoạn, super calar tạo nền tảng cho việc thi hành song song một lệnh FXCH và bất kỳ một lệnh dấu chấm di động nào khác(Như vậy có thể không cần một chu kỳ nào cho lệnh FXCH ). Giống như đường ống cho số nguyên; đường ống cho dấu chấm di động cũng gồm hai đường ống làm việc song song với nhau. nhưng gồm 8 công đoạn: PF prefetch - nhặt sớm D1 là Decode 1 – Giải mã 1 D2 là Decode 2 – Giải mã 2 Ex là Excute – Thực thi X1 – FP Excution stage 1 – thực thi dấu chấm di động công đoạn 1. 8

X2 – FP Excution stage 2 - thực thi dấu chấm di động công đoạn 2. WF – Write file – Ghi tập tin ER – Error Report – Báo lỗi -3 công đoạn đầu tiên giống như thi hành một lệnh số nguyên. -Công đoạn thứ 4( Ex ): Với số nguyên là thực thi lệnh, với dấu chấm di động thì nó chuyển đổi lệnh thành một dạng dấu chấm đặc biệt. Việc thi hành thực sự diễn ra trong công đoạn X1 và X2. Trong công đoạn WF, kết quả được quy tròn và được chuyển đến thanh ghi đích trên ngăn chồng dấu chấm di động. -Việc thi hành lệnh kết thúc ở công đoạn ER nếu có lỗi sẽ được báo ra và thanh ghi trạng thái dấu chấm di động làm việc với lệnh mới.

7. Các đặc tính của Pentium :

Pentium CPU

Data 64 bit

Mỗi chuyển tải 8 bytes

32 bit Bus địa chỉ

1) Là vi xử lý 64 bit thực sự ( 386, 486 là 32 bit ) Xử lý gấp 2 lần lượng thông tin so với 486 DX ( cùng tần số làm việc như nhau ) 2) Các Bus nội bộ rộng hơn: -một số là 64 bit, số khác là 128 bit. -bus từ cache nhớ vào vùng đệm prefetch của các ALU rộng 256 bits 3) 2 ALU, 2 Cache nhớ riêng biệt. 4) Đơn vị xử lý dcdd được cải thiện ( 8 công đoạn đường ống ) 5) Tốc độ chuyển giao ( Clock =64 Mhz )→ chu kỳ 15ns. -Chế độ truyền thống: Tốc độ giao dịch = 1giaodịch/ 15ns x 2 chu kỳ =33.333.333 giao dịch/giây Tốc độ chuyển giao=33.333.333 x 8 bytes/1 chuyển giao= 267 MB/giây -Chế độ Burst: Tốc độ giao dịch = 1 giaodịch/15ns = 66.666.667 giaodịch/giây. Tốc độ chuyển giao = 66.666.667 x 8 byte/ 1 lần chuyển giao = 533 MB/giây

9

-Chế độ Burst Mode tính cả thời gian định vị ( 2,1,1,1) Tốc độ chuyển giao = 4 26 MB/giây Tóm lại: Pentium là nhà vô địch hiện nay của họ 80x86. Nhìn từ phía phần mềm Pentium rất giống với 486 chỉ bổ sung thêm 1 vài lệnh. Nhưng về phần cứng thì đây là những tiến bộ rât lớn so với 486.

8. CÁC PHIÊN BẢN CỦA PENTIUM Thế hệ 5 6

Vi xử lý

năm

Pentium Pentium MMX Pentium Pro Pentium II Pentium II Pentium III AMD Athion Pentium III

1993 1997 1995 1997 1998 1999 1999 2001 2001 2002 2004

7 Pentium 4

Data/add 64/32 64/32 64/36 64/36 64/36 64/36 64/36 64/36 64/36 64/36 (64+64)/(32,36)

Cache level 8+8 16+16 8+8 16+16 16+16 16+16 64+64 32+32 64/64 64/64 64/64

Tốc độ bus (MHz) 60 66 66 66 100 100 >200 800-1000 1300-1500 1500 1500

Clock CPU (MHz) (60-200)M (166-233) (150-200) (233-300) (200-450) (450-600) >600 1.2G 1.8G 2.8G 3.2G

a.Pentium Pro: Ra đời 1985; chíp có 5.5 triệu transistor,chíp có ổ cắm riêng,tốc độ cao hơn pentium;cache C2:256-1MB;xử lý 3 lệnh song song. b.Pentium MMX(1997)(MultiMedia Extesions) cache sơ cấp:16+16kb , tăng gấp 2 lần -thêm 57 lệnh cho xử lý Video,Audio và đồ họa. -xử lý 8 byte số liệu song song→rất tốt cho xử lý tin hiệu video,audio. c.Pentium2 (1997) -Thêm bus giữa

CPU

Cache level 2

hoạt động đồng thời song

song với bus hệ thống (2 bus độc lập).

10

-Chip CPU,Cache,tỏa nhiệt : cắm vuông góc mainboard.Card SEC(single edge contact) -Kết hợp ưu điểm của Pentium pro và Pentium MMX -Tối ưu hóa cho hệ điều hành 32 bit; -Giảm năng lượng tiêu hao CPU * Deschutes: Là pentium II ra đời 1998; 333MHz ; công nghệ 0.25µm; Cache level 1 : 512Kb – Loại slot 1 Đầu năm 1999: Ra đời 400MHz (Clock bus : 100M) *Celeron: 4/1998: 0.25µ m; thẻ cắm SEPP; 266MHz rồi 300MHz 8/1998: 128kb Cache level 2 ; 1999: 400MHz. *Pentium II Xeon: 6/48: Chủ yếu cho máy chủ 1999: 450MHz d.Pentium III: 1999: Phát triển của MMX đặc biệt cho đồ họa không gian 3 chiều F=450 - 500MHz. e.Pentium IV: Năm 2000: 0.18 – 0.13µ m. Thay dây dẫn nhôm bằng dây dẫn đồng →Tần số tăng 700MHz Năm 2001: 0.13µ m; f= 1000MHz rồi 1500MHz. f.Vi xử lý 64 bit: Cấu trúc hoàn toàn mới. 64 bit địa chỉ→Định vị 16 Ebyte (Exabyte=260 byte) Làm việc chế độ 64 bit hoặc 32 bit. ( 260= 1Exabyte= 106 Tb= 1012Mb= 109 Gb ) Hiện nay , cuối năm 2006 đã ra đời CPU hai nhân ; đầu năm 2007 sẽ ra đời các chíp CPU đa nhân ( ba , hoặc bốn nhân ) . Hệ điều hành Vistra viết cho vi xử lý 64 bit ! 11

Thai’ computer : HP NoteBook V3320TU Bộ vi xử lý Intel Core 2 Duo 2x1.73GHz Bộ nhớ cache L2 2048KB Ram 512 DDRAM Ổ cứng 80GB Màn hình 14”.1 TFT DVD-Rewriter Reader 5.1 Wireless LAN IEEE802.11b/g Tích hợp sẵn card màn hình 64MB share RAM Adapter , pin 6 tháng

Trang chủ > Hỗ trợ > Thông tin hữu ích

Bí quyết chọn mua CPU Trước đây, giống như chỉ số mã lực ở xe hơi, tốc độ xử lý của bộ xử lý (CPU), đơn vị tính là Hz, nếu càng cao thì máy tính xử lý càng nhanh. Tuy nhiên bước sang “kỷ nguyên” đa lõi, việc so sánh hiệu năng PC cần xét thêm những thông số khác. Khi bộ xử lý máy tính được nâng lên hàng GHz, năng lực xử lý của máy tính trở nên khó kiểm soát khó đánh giá và càng phức tạp hơn khi các chip đa lõi xuất hiện. Hiện nay việc so sánh các bộ vi xử lý không đơn giản là chọn tốc độ xử lý cao nhất. Bạn cần phải xét cả các thông số khác 12

như số lõi chip, tốc độ bus hệ thống và số bộ nhớ đệm mức 2 (L2) cũng như xác định bạn có muốn khả năng xử lý 64 bit hoặc cần ép xung cho CPU hay không. Nếu bạn muốn nâng cấp CPU hoặc dựng những máy tính để bàn với CPU đáp ứng được nhu cầu sử dụng, bài viết này sẽ cung cấp những kiến thức cơ bản giúp bạn đưa ra lựa chọn đúng đắn nhất.

Vì sao chọn chip lõi kép? Thay đổi cơ bản nhất ở bộ xử lý này là chuyển sang đa lõi - tức là ghép hơn một bộ xử lý vào một chip đơn. Thay vì tăng tốc độ xung đồng hồ, phương pháp vốn làm nhanh nóng máy và tốn điện, cả AMD và Intel cùng quyết định tăng cường tốc độ thực thi bằng thiết kế đa lõi. Các bộ xử lý Athlon 64 X2 của AMD và Intel Core 2 Duo đều sử dụng cấu trúc lõi kép để tăng tốc xử lý đa nhiệm. Intel còn đi trước một bước với chip Core 2 Quad và Core 2 Extreme serie QX với 4 lõi trong một chip. AMD cũng có kế hoạch tung ra dòng chip lõi tứ Phenom vào cuối năm nay. Đối thủ của Intel hiện còn tung ra giải pháp Quad FX giúp tạo chip lõi tứ bằng cách ghép hai chip lõi kép Athlon 64 FX với một bo mạch chủ. Lợi thế trong thực thi ứng dụng của chip đa lõi phụ thuộc vào phần mềm bạn dùng và cách sử dụng nó. Các phần mềm ứng dụng và chơi game nếu không được lập trình phân công cho từng bộ xử thành phần - hỗ trợ tối đa cấu trúc đa lõi - thì nó chỉ khai thác được hết công suất của một trong số lõi đó. Tuy nhiên, chip lõi kép vẫn cho năng suất xử lý cao hơn, đáp ứng hầu hết nhu cầu của đa số người dùng, nhất là khi các ứng dụng trong Windows được đưa sang cho lõi thứ hai đảm nhiệm. Vai trò của lõi thứ hai càng rõ rệt khi bạn chạy đa nhiệm như vừa lướt web vừa tải video cho máy duyệt media cầm tay. Hiện tại, một số chương trình như in nhãn đĩa trực tiếp Nero Recode hay biên tập video Pinnacle Studio 11 chỉ hỗ trợ với chip lõi kép. Tuy nhiên, đã có một số chương trình như chỉnh sửa video Sony Vegas 7.0 và Microsoft Flight Simulator X SP1 và 13

Supereme Commander được thiết kế để khai thác năng lực của chip lõi tứ. Phần mềm Sony Vegas có thể biên tập video trên chip lõi tứ Core 2 Quad nhanh hơn một phần ba thời gian sửa video trên một chip lõi đơn. Hiện nay chỉ còn các máy tính cấp thấp mới dùng chip lõi đơn, còn lại hầu hết dòng máy tính đại trà đã sử dụng chip 2 nhân trở lên. Các chip lõi tứ cao cấp thích hợp dành cho dân nghiện game nặng hoặc luôn phải chỉnh sửa, biên tập video và những người thích đón đầu công nghệ.

Đánh giá tốc độ xung, cache và bus Tốc độ xử lý là một chỉ số quan trọng nhưng chỉ so sánh được với các CPU trong cùng serie. Hai thông số khác tốc độ FSB (front side bus) và L2 Cache cũng đóng vai trò quan trọng quyết định tốc độ xử lý của chip nói chung. Với tốc độ xung đồng hồ, bộ xử lý Core 2 Duo E6700 2,66 GHz rõ ràng nhanh hơn chip E6600 2,4 GHz. Tuy nhiên, lưu ý là việc so sánh tốc độ xung không còn giá trị nữa với các chip khác dòng. Chẳng hạn chip Core 2 Duo 1,86 GHz cấp thấp hơn vẫn chạy nhanh hơn chip Pentium D 960 3,6 GHz đời cũ, và chip Core 2 Duo E6700 2,66 GHz của Intel lại tốt hơn chip Athlon X2 6000+ 3 GHz của AMD khi thử nghiệm với hầu hết benchmark (thước đo khả năng thực thi PC). Bộ nhớ đệm L2 của một bộ xử lý giúp cải thiện năng lực vận hành tức là gần như đưa ngay lập tức các dữ liệu tới bộ xử lý. Bộ nhớ đệm L2 càng lớn thì càng tốt với chip Intel hơn là chip Athlon 64 X2 bởi cách thức mỗi chip truy cập vào bộ nhớ. Còn chỉ số FSB (tính theo MHz) là thước đo tốc độ giao tiếp giữa bộ xử lý và bộ điều khiển bộ nhớ, và chỉ số này càng lớn càng tốt. Đây là một thông số chỉ liên quan tới các bộ xử lý của Intel, và hiện có khá nhiều mức tốc độ FSB khác nhau. Tốc độ FSB lớn hơn kéo theo nhu cầu dung lượng RAM lớn hơn để tăng tốc vận hành. Chip mới nhất của Intel có tốc độ FSB là 1,333 MHz. Chip Core 2 Duo serie E6000 gốc có tốc độ bus 1.066MHz, còn serie E4000 có bus 800 MHz. Với bộ xử lý AMD, mạch điều khiển 14

bộ nhớ được tích hợp trên chip nên cho tốc độ truy cập nhanh hơn. Giao tiếp với bộ nhớ thực thường qua đường dẫn HyperTranport Bus, bởi thế tốc độ FSB không phải là vấn đề với các bộ xử lý Athlon. Ảnh hưởng của cache và FSB còn tùy thuộc vào chương trình đang chạy. Bộ xử lý Core 2 Duo E6320 1,86 GHz có thể làm việc tốt hơn bộ xử lý Core 2 Duo E4400 2 GHz trong một số bài thử, nhờ bộ nhớ đệm và FSB lớn hơn mặc dù thời gian xử lý của hầu hết các ứng dụng đều có chênh lệch rất nhỏ.

Tại sao cần chip 64 bit? Hầu hết các phần mềm được viết cho các chip 32 bit. Tuy nhiên, tất cả các bộ xử lý (BXL) trung và cao cấp của Intel và AMD ngày nay có kiến trúc 64 bit nhưng vẫn đảm bảo tính tương thích với các phần mềm này. Các chip 64 bit sẽ khai thác các lợi thế vượt trội của các phần mềm ứng dụng tương ứng nhưng nó cần hệ điều hành cùng hỗ trợ công nghệ này, chẳng hạn Windows Vista 64 bit. Như vậy, tốt nhất bạn phải cài các phần mềm viết riêng cho BXL 64 bit. Đã có một số tiện ích viết theo nền tảng mới này, nhưng nếu chạy các phần mềm 32 bit trên chip mới bạn cũng nhận được những lợi ích đáng kể, bởi chip này thường đi kèm với RAM 4 GB trở lên.

Kỹ thuật ép xung Muốn nâng tốc độ xung lên cao hơn định mức, nhiều người dùng kỹ thuật ép xung để mong có tốc độ thực thi nhanh hơn. Ví dụ, bạn có thể nâng tốc độ xử lý của chip Core 2 Extreme QX6700 từ 2,66 GHz lên 3,3 GHz. Ép xung giúp gia tăng tốc độ thực thi, nhưng cũng tiềm ẩn những rủi ro như tổn thọ BXL, thậm chí là phá hỏng nó. Việc làm mát cũng cần đặc biệt quan tâm. Tìm một mức tốc độ tới hạn mà chip đó còn có thể chịu được cần nhiều kinh nghiệm và đôi khi phải chấp nhận cả sự thất bại. Mặc dù cả Intel và AMD đồng thuận khả năng cho ép xung cho các BXL và chipset nhưng

15

không hãng nào chính thức ra mặt khuyến khích hoặc ủng hộ việc làm này. Bạn cần tìm chủng loại chip dễ ép xung. Những BXL dễ thực hiện nhất là có hệ số nhân không bị khóa. Hệ số nhân này cho biết chip có thể chạy nhanh hơn bao nhiều lần tốc độ tiêu chuẩn của nó. Chẳng hạn, để nâng xung đồng hồ của chip Core 2 Extreme QX6800 2,93 Ghz chỉ đơn giản là thay đổi hệ số nhân trong BIOS từ 11 lên 12. Các chip lõi tứ cao cấp nhất dòng Core 2 Extreme của Intel và chip 64 bit Athlon 64 FX của AMD đều không khóa hệ số nhân. Bạn cũng có thể ép xung với các CPU đã khóa hệ số nhân, nhưng cần phải tăng tốc độ bus của hệ thống, kết quả là các linh kiện khác đều phải chạy “quá sức”. Lưu ý là mặc dù hầu hết các mainboard đều được hỗ trợ lựa chọn ép xung mở rộng, nhưng rất ít nhà sản xuất PC cho tùy chọn này hoạt động.

16

Related Documents

Cpu Pentium
June 2020 2
Pentium
November 2019 10
Cpu
November 2019 42
Cpu
June 2020 17
Cpu
November 2019 42
Cpu
December 2019 43