Tìm hiểu bộ vi xử lý Core 2 Duo

ppt 42 trang phuongnguyen 5460
Bạn đang xem 20 trang mẫu của tài liệu "Tìm hiểu bộ vi xử lý Core 2 Duo", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • ppttim_hieu_bo_vi_xu_ly_core_2_duo.ppt

Nội dung text: Tìm hiểu bộ vi xử lý Core 2 Duo

  1. Tìm hiểu bộ vi xử lý Core 2 Duo Giáo viên hướng dẫn: Võ Thanh Tú Nhóm thực hiên: Lê Thị Phượng Ngô Thị Phương Thảo Bùi Thị Loan Phạm Thị Khánh
  2. I. Giới thiệu về Core 2 Duo
  3. ◼ Tháng 5/2006 :Intel công bố nhãn hiệu Core 2 Duo ◼ Core 2 Duo là tên thương mại cho bộ vi xử lý có tên mã là Merom (cho các máy laptop) ,Conroe (cho các máy desktop) . ◼ Dòng Intel Core 2 Duo 65nm cho máy tính để bàn có mã số là E6xxx và E4xxx , dòng Intel Core 2 Duo 45nm sẽ có mã số là E8xxx và E7xxx , dòng Intel Core 2 Duo cho laptop có các mã số U7xxx, T9xxx, T8xxx,T7xxx, T6xxx, T5xxx ◼ Dòng Intel Core 2 duo sử dụng vi kiến trúc Intel core , nâng cao tới 40% hiệu suất hoạt động và tiết kiệm 40% điện năng , có 291 triệu bóng bán dẫn . ◼ Phục vụ cho doanh nghiệp , gia đình và người yêu điện toán tốc độ cao như giới game thủ .
  4. Cấu trúc vật lý core 2 duo Chân đế của bộ vi xử lý Core 2
  5. Intel Core 2 Duo E7200
  6. Các dòng sản phẩm Core 2 Duo 45nm cho destop Max Intel Intel Gía Tên sản phẩm Nhúng Intel Tình Hyper- Turbo ước TDP Virtualization trạng Threading ost tính
  7. Các dòng sản phẩm Core 2 Duo 65nm cho destop
  8. Hyper Threading (Siêu phân luồng): ◼ Mỗi ứng dụng trên máy tính khi thực hiện sẽ chạy nhiều tiến trình, mỗi tiến trình lại gồm nhiều luồng xử lý. ◼ Với bộ xử lý đơn luồng, tại một thời điểm chỉ có một luồng xử lý được thực hiện. ◼ Với bộ xử lý siêu phân luồng, nó có thể thực hiện song song hai luồng xử lý tận dụng tối đa tài nguyên của hệ thống và rút ngắn thời gian xử lý. ◼ Đòi hỏi phải có sự hỗ trợ của hệ điều hành. Các hệ điều hành Micosoft Windows XP, Vista đều hỗ trợ siêu phân luồng.
  9. Hyper Threading (Siêu phân luồng):
  10. Công nghệ lõi kép: ◼ Cho phép một bộ xử lý có thể chứa 2 lõi hoặc nhiều hơn. ◼ Các lõi này sẽ hoạt động song song với nhau, chia sẻ công việc tính toán xử lý mà bộ xử lý phải đảm nhận.
  11. Kết hợp giữa bộ xử lý lõi kép và công nghệ siêu phân luồng - Nhằm để đạt được 4 luồng xử lý thực hiện song song. Cho tốc độ xử lý nhanh gấp nhiều lần mà không cần tăng tốc độ xung nhịp - Có thể nói rằng công nghệ siêu phân luồng đã trải thảm nhung cho các thế hệ chip lõi kép về sau.
  12. * Mức tiêu thụ điện năng CPU
  13. * Kích thước và số lượng Transitor Processor Die Size Transistor Count Process Core 2 Extreme X6800 143 mm² 291 Mio. 65 nm Core 2 Duo E6700 143 mm² 291 Mio. 65 nm Core 2 Duo E6600 143 mm² 291 Mio. 65 nm Core 2 Duo E6400 111 mm² 167 Mio. 65 nm Core 2 Duo E6300 111 mm² 167 Mio. 65 nm Pentium D 900 280 mm² 376 Mio. 65 nm Athlon 64 FX-62 230 mm² 227 Mio. 90 nm Athlon 64 5000+ 183 mm² 154 Mio. 90 nm Trong bộ vi xử lí Core 2 Duo tổng số Transitor thấp hơn trong Pentium D Dual-core . Nhờ công nghệ 65nm làm cho kích thước của CPU giảm xuống .
  14. Core công nghệ 45 nm và 65 nm
  15. II. Tìm hiểu về kiến trúc
  16. II. Tìm hiểu về kiến trúc ◼ Core 2 duo có cache nhớ dung lượng 2MB - 6MB . - Bộ nhớ cache L1 cho lệnh 32 KB và dữ liệu 32 KB cho mỗi lõi. - Cache nhớ L2 được chia sẻ nghĩa là cả hai lõi đều có thể sử dụng Cache nhớ L2 một cách chung nhau, cấu hình động sẽ được thực hiện cho mỗi Cache . Khác trên Pentium D, phiên bản dual-core của Pentium 4, mỗi core đều có Cache nhớ L2 của riêng nó,tại một thời điểm nào đó khi một lõi này sử dụng hết Cache nhớ trong khi lõi kia lại không sử dụng hết hiệu suất trên Cache nhớ L2 của riêng nó Ví dụ : một CPU có 2 MB L2 cache, một lõi có thể đang sử dụng 1,5MB còn lõi kia sử dụng 512 KB (0.5 MB), ngược lại với tỷ lệ chia cố định 50-50 như đã được sử dụng trước đây trong các CPU dual-core. ◼ Kiến trúc Core sử dụng cấu trúc 14 tầng
  17. 2. Tìm hiểu về kiến trúc ◼ Tốc độ xung nhịp từ 1.8 GHz cho tới 3.33 GHz ( tức là có thể xử lý 1.8*10^9 -3.33*10^9 lệnh/s. ) ◼ FSB - đường vận chuyển thông tin từ bộ nhớ chính vào CPU. (tất cả dữ liệu từ bộ nhớ chính đưa vào CPU để xử lý đều phải thông qua đường Bus này) lớn từ 800 MHz- 1333 MHz . ◼ Được bổ sung thêm đường bus BSB (Backside Bus) thực hiện kết nối trực tiếp riêng biệt từ CPU tới bộ nhớ Cache theo cấu trúc DIB (Dual Independent Bus). Do bộ vi xử lí có tốc độ nhanh hơn khi truy cập với bộ nhớ Cache nên cần Bus độc lập để làm việc này ◼ Đường dẫn dữ liệu 128 bit bên trong. Trong các CPU trước, đường dẫn dữ liệu bên trong chỉ có 64bit. Đây là một vấn đề đối với các chỉ lệnh SSE, chỉ lệnh được gọi là XMM có độ dài 128 bit. Chính vì vậy khi thực thi một chỉ lệnh đã biến đổi thành 128 bit dữ liệu thì toán tử này được chia thành hai toán tử 64bit . Đường dữ liệu 128 bit mới làm cho kiến trúc Core trở nên nhanh hơn trong việc xử lý các chỉ lệnh SSE có 128 bit dữ liệu.
  18. III. Hoạt động : Một chương trình sẽ thực hiện qua 4 giai đoạn cơ bản : -Giai đoạn nạp chương trình -Giải mã chương trình -Thực thi chương trình -Hoàn tất chương trình
  19. III. Hoạt động : ◼ Giai đoạn nạp chương trình : - Khối tiền tìm nạp được chia sẻ giữa các lõi - Trong Core 2 duo ,Intel cũng đã cải thiện khối tiền tìm nạp của CPU để đoán thử dữ liệu mà CPU sẽ tìm nạp tiếp theo và nạp nó vào Cache nhớ trước khi CPU yêu cầu và có một chút cải thiện để nâng cao tính năng này ? Vd: nếu CPU đã nạp dữ liệu từ địa chỉ 1, sau đó yêu cầu dữ liệu trên địa chỉ 3 và sau đó yêu cầu tiếp dữ liệu trên địa chỉ 5 thì khối tiền tìm nạp sẽ đoán rằng chương trình sẽ nạp dữ liệu từ địa chỉ 7 và nó sẽ nạp từ địa chỉ này ra Cache nhớ trước khi CPU yêu cầu đến nó
  20. III. Hoạt động : ◼ Bộ giải mã chỉ lệnh - Một khái niệm mới là macro-fusion : khả năng gắn hai chỉ lệnh x86 vào thành một chỉ lệnh micro-op . VD: Một số cặp vi lệnh thông dụng (như lệnh compare (so sánh) đi kèm lệnh jump (nhảy) có điều kiện) sẽ được macrofusion ghép thành một vi lệnh mới - Ưu điểm : sẽ chỉ thực thi một chỉ lệnh micro-op thay vì hai - cải thiện được hiệu suất của CPU và tiêu tốn ít năng lượng hơn - Nhược điểm : cơ chế này lại bị hạn chế đối với các chỉ lệnh so sánh và các chỉ lệnh rẽ nhánh có điều kiện
  21. III. Hoạt động : - Kiến trúc Core kéo đến 5 chỉ lệnh mỗi lần vào hàng đợi chỉ lệnh , có thể giải mã đến 4 chỉ lệnh trên một chu kỳ clock , trong khi Pentium M và Pentium 4 thì chỉ có thể giải mã được đến 3. - Nếu hai trong số 5 chỉ lệnh được nối thành một thì bộ giải mã vẫn có thể giải mã bốn chỉ lệnh trên một chu kỳ clock - nó sẽ ở chế độ nhàn rỗi cục bộ bất cứ khi nào macro-fusion xảy ra . - Nghĩa là bộ giải mã sẽ chỉ cung cấp ba chỉ lệnh nối micro-op ở đầu ra của Khối tìm nạp và bộ giải mã chỉ lệnh nó trong khi có khả năng cung cấp đến trong kiến trúc Core bốn
  22. III. Hoạt động : ◼ Các khối thực thi trong kiến trúc Core - Có 5 cổng gửi đi nhưng ba trong số chúng được sử dụng cho việc gửi các chỉ lệnh nối micro-ops đến các khối thực thi - có thể gửi ba chỉ lệnh micro-ops đến khối thực thi trên một chu kỳ clock. - Kiến trúc Core cung cấp một FPU mở rộng và một ALU mở rộng (IEU) - có thể xử lý đến ba chỉ lệnh số nguyên trên một chu kỳ clock trong khi Pentium M chỉ có hai - Một sự khác nhau lớn giữa hai kiến trúc Pentium M và Pentium 4 với kiến trúc Core là trên kiến trúc Core, các khối Load và Store có khối tạo địa chỉ của riêng nó nhúng trong. Pentium 4 và Pentium M có các khối tạo địa chỉ riêng và trên Pentium 4 ALU đầu tiên được sử dụng để lưu dữ liệu trên bộ nhớ.
  23. -Toán tử nhân floating- point chỉ có thể được thực thi trong FPU thứ ba và phần thêm vào floating-point chỉ có thể được thực thi trên FPU thứ hai -Các chỉ lệnh Fpmov có thể được thực thi trên FPU thứ nhất hoặc trên hai FPU khác nếu không có chỉ lệnh phức tạp hơn (FPadd or FPmul) đã sẵn sàng được gửi đến chúng Các khối thực thi trong kiến trúc Core -Các chỉ lệnh MMX/SSE đều được xử lý bởi FPU .
  24. IV. Core 2 duo được tích hợp các công nghệ mới của intel ◼ Intel Wide Dynamic Execution ◼ Intel Smart Memory Access ◼ Intel Advanced Smart Cache ◼ Intel Advanced Digital Media Boost ◼ Intel Power Intelligent Capability ◼ Intel Quiet System Technology ◼ Intel Virtualization Technology ◼ Intel Extended Memory 64 Technology ◼ Execute Disable Bit.
  25. 1.Mở rộng thực thi động -Hàng lệnh thực thi được thiết kế dài hơn (14 khâu) giúp tiên đoán nhánh lệnh chính xác hơn và có đến 4 hàng lệnh thực thi cùng lúc (Intel Mobile và NetBurst trước đây chỉ thực thi được cùng lúc ba hàng lệnh). -Một tính năng khác cũng góp phần rút ngắn thời gian thực thi lệnh là macrofusion . -ALU được thiết kế để thực thi các lệnh kết hợp theo cơ chế macrofusion trong một xung nhịp, rút ngắn đáng kể thời gian thực thi và cũng đồng nghĩa giảm năng lượng -Mỗi nhân có thể xử lý đồng thời 4 hàng lệnh.
  26. 2.Truy xuất bộ nhớ thông minh ( Intel Smart Memory Access ) Công nghệ này dùng hai kỹ thuật quan trọng: ◼ Nạp trước dữ liệu (memory disambiguation). ◼ Bộ nạp lệnh tiên tiến (advanced prefetcher).
  27. ◼ Kỹ thuật nạp trước dữ liệu (memory disambiguation) : Có giải thuật đặc biệt để định giá được những lệnh load không lệ thuộc và có thể thực thi vượt trước lệnh store . Hỗ trợ cho môi trường đa nhiệm, xử lý song song .
  28. Kiến trúc nhớ mới cũ : Kiến trúc nhớ mới trong core : - Các chỉ lệnh liên quan đến bộ nhớ -Kiến trúc nhớ mới thực hiện là định vị được thực thi theo một thứ tự giống hệt và thực thi các chỉ lệnh có liên quan với thứ tự chúng xuất hiện trong đến bộ nhớ để có thể thực thi không chương trình theo thứ tự -VD: chỉ lệnh “Load4” không liên - VD:Lệnh “Load4” không có liên quan quan tới bất kỳ đến bộ nhớ nào và có đến các chỉ lệnh khác và có thể được thể được thực thi trước, mặc dù vậy nó thực thi trước – có giá trị X sớm- tăng vẫn phải đợi tất cả các chỉ lệnh khác. tốc thực thi
  29. ◼ Bộ nạp lệnh tiên tiến (advanced prefetcher ) : -Ngoài làm nhiệm vụ nạp dữ liệu vào bộ nhớ mà còn chuyển dữ liệu sẵn sàng tại vùng đệm để tận dụng được tốc độ truy xuất cao của vùng đệm. - Vi kiến trúc Core tích hợp hai cấp L1 và hai cấp L2 với nhiệm vụ đặt dữ liệu của những lệnh thực thi chưa tức thời lên vùng đệm L1 và chuẩn bị sẵn sàng dữ liệu thực thi tức thời trên vùng đệm L2.
  30. 3.Truy xuất bộ nhớ thông minh ( Intel Advanced Smart Cache ) Core 2 Duo sử dụng một bộ đệm L2 dùng chung cho cả hai nhân để nâng cao hiệu năng, tăng phần hiệu quả truy xuất dữ liệu. Khi hai nhân thực thi cần dùng một dữ liệu giống nhau thì có thể lưu tại một nơi trong vùng đệm L2 dùng chung chứ không cần phải lưu thành hai bản tại hai vùng đệm L2 riêng như trước đây. Điều này giúp tiết kiệm tài nguyên, rút ngắn thời gian chuyển dữ liệu qua lại giữa hai bộ đệm.
  31. 4.Tăng tốc phương tiện số tiên tiến (Intel Advanced Digital Media Boost) ◼ Hỗ trợ xử lý các phép toán SIMD 128bit ◼ Rút ngắn gấp đôi thời gian xử lý dữ liệu của các ứng dụng video, âm thanh, đồ họa, và dạng dữ liệu dùng tập lệnh SSE, SSE2. SSE3 ◼ Khả năng tính toán dấu chấm động và số nguyên 128 bit cũng giúp nâng độ chính xác trong các ứng dụng đặc thù như xử lý hình ảnh, video, giọng nói, mã hóa, tài chính, kỹ thuật và khoa học.
  32. 5. Intel Power Intelligent Capability Công nghệ này cho phép kích hoạt và tăng tốc độ xử lý của hệ thống khi có nhu cầu. Trong trường hợp không có nhu cầu thì hệ thống trở về trạng thái “chờ” (giống tính năng Stand by của Windows) giúp giảm đáng kể điện năng tiêu thụ mà không ảnh hưởng đến hiệu suất hoạt động của toàn hệ thống.
  33. 6.Intel Quiet System Technology ◼ Công nghệ giảm tiếng ồn bằng cảm biến nhiệt kỹ thuật số mới (DTS) giúp hệ thống chạy êm hơn, giảm tối đa tiếng ồn và tiết kiệm năng lượng vì hệ thống bo mạch chủ của Intel sẽ quản lý nhiệt độ của CPU và chỉ tăng tốc quạt khi cần thiết. Điều này rất tốt cho các game thủ vì họ không cần phải trang bị thêm hệ thống tản nhiệt (heatsink) hoặc gắn thêm quạt (fan) cho CPU. ◼ Công nghệ này chỉ hỗ trơ ở CPU Core 2 Duo và bo mạch chủ sử dụng chipset Intel 965 Express.
  34. 7.Intel Virtualization Technology ( Công nghệ ảo hóa) ◼ Trên mỗi hệ điều hành, người dùng có thể cài các phần mềm khác nhau. Đối với các doanh nghiệp, Intel Virtualization Technology cải thiện khả năng quản lý, hạn chế thời gian chết và duy trì năng suat cho người sử dụng bằng cách phân chia các hoạt động tính toán thành nhiều phần riêng biệt. ◼ Công nghệ này hoàn toàn khác so với chế độ multi boot của Windows, multi boot chỉ cho phép 1 hệ điều hành hoạt động tại 1 thời điem, còn với công nghệ ảo hóa thì người dùng có cho phép chạy nhiều hệ điều hành cùng một lúc.
  35. 8. Execute Disable Bit ◼ Cho phép bộ nhớ được đánh dấu là có thể thực hiện được hoặc không thể thực hiện được, cho phép CPU báo lỗi cho hệ điều hành nếu có mã lệnh ác ý nào cố chạy trong phần bộ nhớ không thể hoạt động được ◼ Nâng cao tính bảo mật và chống virus cho hệ thống ở mức cao khi có hỗ trợ của hệ điều hành ◼ Công nghệ này đòi hỏi đồng thời cả CPU và hệ điều hành phải hỗ trợ Execute Disable Bit.
  36. V. Họ Core 2 : ◼ Họ Core 2 có ba sản phẩm : - Core 2 Duo - sản phẩm thay thế cho Pentium 4 và Pentium D - Core 2 Quad – sản phẩm này là lõi tứ Core 2 Duo . - Core 2 Extreme – thay thế cho Pentium Extreme Edition .
  37. Chọn xung nhịp cao hay chọn nhiều nhân? MainbCấu hình thử nghiệm: Intel Intel oa ASUS P5K WS Thông số Intel Core™ Core™2 rd cơ Xeon 2 Duo Quad bản 3060 Mushkin Redline E6750 Q6600 RAM XP2-8000 BFG GF8800GTS Socket 775 LGA 775 LGA 775 LGA VGA OC 640MB Core 2405 2671 MHz 2405 MHz Raptor Speed MHz HDD WD740ADFD FSB 1333 MHz 1066MHz 1066 MHz Raid 0 Multiplier 8 9 9 SilverStone Zeus PSU 850 Watts L2 Cache 4MB 4MB 4MBx2 Coolin WC Gigabyte 3D Code Conroe Conroe Kentsfield g Galaxy II Name Cấu hình thử nghiệm: Thông số kỹ thuật của 3 CPU:
  38. Chọn xung nhịp cao hay chọn nhiều nhân? ◼ Thử nghiệm khả năng xử lý của 3 CPU này đối với các ứng dụng bình thường dùng chương trình PCWorldBench 6 Beta 2 . ◼ Trong thử nghiệm này, E6750 dẫn đầu với 121 điểm, Q6600 chỉ đạt 118 điểm còn Xeon 3060 chỉ ghi được 112 điểm. → xung nhịp vẫn chiếm ưu thế .
  39. ◼ Thử nghiệm với phần mềm PCMark 2005 bao gồm phần System Test cơ bản và thêm phần CPU Test. - System Test: Q6600 vượt lên với 8393 điểm, E6750 bám sát với 8260 điểm còn Xeon 3060 bị tụt lại khá xa với chỉ 7725 điểm . - cpu test E6750 dẫn đầu với phần lớn phép thử kể cả với phép thử đa nhiệm chạy cùng lúc 2 ứng dụng - Với phép thử sử dụng cùng lúc 4 ứng dụng hì sức mạnh đa nhiệm Q6600 có kết quả cao gấp đôi với các cpu còn lại
  40. Phần mền 3Dmark chuyên dùng để đánh giá sức mạnh xử lý đồ họa 3D cho kết quả khá trái ngược nhau
  41. Nhận xét ◼ CPU 4 nhân chưa thực sự phát huy được sở trường của mình. Tuy nhiên với các ứng dụng chuyên dùng như 3dsmax hoặc các ứng dụng đồ họa 3D khác đã được tối ưu cho các CPU đa nhân ◼ Với bộ xử lý 4 nhân bạn sẽ có thể vừa chơi game, ghi đĩa, xử lý phim, nén nhạc cùng lúc mà tốc độ xử lý không bị giảm sút. ◼ CPU Core™ 2 Duo đủ sức mạnh xử lý ở tất cả các ứng dụng hiện tại, thậm chí vượt hơn so với Core™ 2 Quad ở đa số phép thử
  42. Kết thúc