Bài giảng Tin học đại cương - Phan Thị Hà

pdf 271 trang phuongnguyen 4030
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học đại cương - Phan Thị Hà", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_tin_hoc_dai_cuong_phan_thi_ha.pdf

Nội dung text: Bài giảng Tin học đại cương - Phan Thị Hà

  1. BÀI GIẢNG TIN HỌC ĐẠI CƯƠNG Biên soạn : PHAN THỊ HÀ NGUYỄN TIẾN HÙNG
  2. Chương 1: Các khái niệm cơ bản Chương 1: CÁC KHÁI NIỆM CƠ BẢN 1.1. THÔNG TIN VÀ XỬ LÝ THÔNG TIN 1.1.1. Khái quát 1.1.1.1. Khái niệm thông tin a. Khái niệm Trong đời sống hàng ngày, chúng ta tiếp nhận và sử dụng nhiều thông tin. Thông tin đem lại cho chúng ta sự hiểu biết, giúp chúng ta nhận thức đúng đắn về các hiện tượng tự nhiên và xã hội; cũng nhờ thông tin ta có được những hành động hợp lý nhằm đạt được những mục đích trong cuộc sống. Chúng ta ai cũng thấy được sự cần thiết của thông tin và cảm nhận được thông tin là gì. Nhưng để đưa ra một định nghĩa chính xác về thông tin thì hầu hết chúng ta đều lúng túng bởi thông tin là một khái niệm khá trừu tượng và nó được thể hiện dưới nhiều dạng thức khác nhau. Tuy nhiên, người ta có thể tạm đưa ra khái niệm sau đây: "Thông tin thường được hiểu là nội dung chứa trong thông báo nhằm tác động vào nhận thức của một số đối tượng nào đó". Thông báo được thể hiện bằng nhiều hình thức: văn bản, lời nói, hình ảnh, cử chỉ ; và các thông báo khác nhau có thể mang cùng một nội dung. Trong lĩnh vực tin học, thông tin có thể được phát sinh, được lưu trữ, được biến đổi trong những vật mang tin; thông tin được biến đổi bởi các dữ liệu và các dữ liệu này có thể được truyền đi, được sao chép, được xử lý hoặc bị phá hủy. Ta có thể lấy một vài ví dụ sau để minh họa Thông báo thể hiện dưới dạng văn bản ví dụ như “Thông tin về một mạng máy tính bị nhiễm virus” - Trong thông báo này, thành phần “Mạng máy tính” đóng vai trò là vật mang tin, còn sự kiện “nhiễm virus” là dữ liệu của thông tin. Hoặc ví dụ “Nhiệt độ đo được ở bệnh nhân là 41oC” - Thông tin này có thể được thể hiện duới dạng văn bản hoặc lời nói. Dữ liệu ở đây là 41oC (nếu được thông báo bằng lời nói thì dữ liệu chính là tín hiệu) và thông tin thu được thông qua dữ liệu cho thấy bệnh nhân bị sốt cao v.v b. Phân loại thông tin Dựa trên đặc điểm liên tục hay gián đoạn về thời gian của các tín hiệu thể hiện thông tin, ta có thể chia thông tin làm hai loại cơ bản như sau: + Thông tin liên tục: Là thông tin mà các tín hiệu thể hiện loại thông tin này thường là các đại lượng được tiếp nhận liên tục trong miền thời gian và nó được biểu diễn bằng hàm số có biến số thời gian độc lập, liên tục. 3
  3. Chương 1: Các khái niệm cơ bản Ví dụ: Thông tin về mức thuỷ triều của nước biển hay thông tin về các tia bức xạ từ ánh sáng mặt trời + Thông tin rời rạc: Là thông tin mà các tín hiệu thể hiện loại thông tin này thường là các đại lượng được tiếp nhận có giá trị ở từng thời điểm rời rạc và nó được biểu diễn dưới dãy số. Ví dụ : Thông tin các vụ tai nạn xảy ra trên đoạn đường Nguyễn Trãi. c. Đơn vị đo thông tin Các đại lượng vật lý đều có đơn vị đo chẳng hạn như đơn vị đo khối lượng (kg), đo chiều dài (m) và đo thời gian (giây) v.v. Để lượng hoá một thông tin ta cũng cần đưa ra một đơn vị đo thông tin. Trong tin học, đơn vị đo thông tin nhỏ nhất là Bit (viết tắt của Binary digit - số nhị phân) - được biểu diễn với 2 giá trị 0 và 1, viết tắt là b. Trong thực tế người ta thường dùng đơn vị lớn hơn là byte. Byte là một nhóm 8 bit trong bảng mã ASCII Ngoài ra người ta còn dùng các bội số của byte như sau: Tên gọi Ký hiệu Giá trị Byte B 8 bit Word w 8,16, 32 hoặc 64 bit KiloByte KB 1024b=210b MegaByte MB 1024Kb=210Kb GigaByte GB 1024Mb=210Mb TeraByte TB 1024Gb=210Gb d. Mã hoá thông tin rời rạc Mã hóa thông tin là quá trình biến đổi thông tin từ dạng biểu diễn thông thường sang một dạng khác theo quy ước nhất định. Quá trình biến đổi ngược lại của mã hóa thông tin được gọi là phép giải mã. Ví dụ: Ta có 1 tập quản lý hồ sơ sinh viên. Nếu ta quản lý bằng tên thì sẽ xảy ra rất nhiều trường hợp tên bị trùng nhau. Nếu ta thêm các yếu tố khác kèm theo như địa chỉ, ngày sinh, quê quán v.v thì việc quản lý trở nên rất rườm rà, phức tạp mà vẫn không loại trừ được khả năng trùng nhau. Nếu ta gán cho mỗi một sinh viên 1 mã số ID khác nhau thì việc quản lý hồ sơ sẽ trở nên thuận tiện hơn nhiều. Từ mã số ID, ta có thể tìm ra số liệu về sinh viên tương ứng. Như vậy, quá trình gán mã số ID cho mỗi hồ sơ sinh viên được gọi là mã hóa; còn quá trình dựa trên mã số ID để xác định thông tin về sinh viên gọi là giải mã. 4
  4. Chương 1: Các khái niệm cơ bản Tất cả các thông tin ở dạng văn bản (text), chữ (character), số (number), ký hiệu (symbol), đồ họa (graphic), hình ảnh (image) hoặc âm thanh (sound) đều được biểu diễn bằng các tín hiệu (signals). Các tín hiệu biểu diễn này có thể là liên tục hay rời rạc và nó được đưa vào xử lý thông qua các hệ thống máy tính. Đối với hệ thống máy tính tương tự (Analog Computer), thông tin được đưa vào xử lý chủ yếu là môt số các tín hiệu liên tục như tín hiệu điện, âm thanh Trong khi đó, hầu hết các dữ liệu mà chúng ta có được thường ở dạng các tín hiệu rời rạc và nó được xử lý trên các hệ thống máy tính số. Do đó, khi đưa các tín hiệu này vào máy tính, chúng được mã hóa theo các tín hiệu số (digital signal) nhằm giúp máy tính có thể hiểu được thông tin đưa vào. Ðây là cơ sở thực tiễn của nguyên lý mã hoá thông tin rời rạc. Nguyên lý này tập trung các điểm chủ yếu sau: Tín hiệu liên tục có thể xem như một chuỗi xấp xỉ các tín hiệu rời rạc với chu kỳ lấy mẫu nhỏ ở mức độ chấp nhận được. Tín hiệu rời rạc có thể được đặc trưng qua các bộ ký hiệu hữu hạn (chữ cái, chữ số, dấu, ) gọi là phép mã hóa (encode). Mọi phép mã hóa đều có thể xây dựng trên bộ ký hiệu các chữ số, đặc biệt chỉ cần bộ ký hiệu gồm 2 chữ số là 0 và 1. Ngược với phép mã hoá gọi là phép giải mã (decode). Chu kỳ lấy mẫu Tg Các mẫu tín hiệu số Tín hiệu số Tín hiệu rời rạc là tín hiệu có trục thời gian bị rời rạc hoá với chu kỳ lấy mẫu là Ts = 1/Fs, trong đó Fs là tần số lấy mẫu. Ta có thể xét một số ví dụ như tiếng nói con người thông thường nằm trong dải âm tần từ 0,3 kHz đến 3,4 kHz; khi tiếng nói con người được truyền đưa trên mạng nó sẽ được rời rạc hóa bằng tần số lấy mẫu là 8 kHz nhưng người nghe vẫn không cảm nhận được điều này. Một ví dụ khác về thông tin rời rạc là hình trên phim khi được chiếu lên màn ảnh là các ảnh rời rạc xuất hiện với tốc độ 25 ảnh/giây. Mắt người không phân biệt sự rời rạc này nên có cảm tưởng hình ảnh là liên tục. Mã hoá thông tin rời rạc là một khái niệm rất căn bản và ứng dụng nhiều trong kỹ thuật máy tính điện tử. 1.1.1.2. Xử lý thông tin a. Sơ đồ tổng quát của một quá trình xử lý thông tin Quá trình xử lý thông tin chính là sự biến đổi những dữ liệu đầu vào ở dạng rời rạc thành thông tin đầu ra ở dạng chuyên biệt phục vụ cho những mục đích nhất định. Mọi quá trình xử lý 5
  5. Chương 1: Các khái niệm cơ bản thông tin cho dù thực hiện bằng máy tính hay bằng con người đều phải tuân thủ theo chu trình sau: Dữ liệu (data) được nhập ở đầu vào (input). Sau đó, máy tính hay con người sẽ thực hiện những quá trình xử lý để xuất thông tin ở đầu ra (output). Quá trình nhập dữ liệu, xử lý và xuất thông tin đều có thể được lưu trữ để phục vụ cho các quá trình tiếp theo khác. NHẬP DỮ LIỆU XỬ LÝ XUẤT DỮ LIỆU (INPUT) (PROCESSING) (OUTPUT) LƯU TRỮ (STORAGE) Mô hình tổng quát quá trình xử lý thông tin b. Xử lý thông tin bằng máy tính điện tử (MTĐT) Máy tính điện tử là một hệ thống xử lý thông tin tự động dựa trên nguyên tắc chung của quá trình xử lý thông tin. Mặc dù khả năng tính toán của máy tính vượt xa so với khả năng tính toán của con người và các phương tiện khác; tuy nhiên, máy tính sẽ không tự nó đưa ra quyết định khi nào phải làm gì mà nó chỉ có thể hoạt động được nhờ sự chỉ dẫn của con người - tức là con người phải cung cấp đầy đủ ngay từ đầu cho MTĐT các mệnh lệnh, chỉ thị để hướng dẫn MTĐT theo yêu cầu đề ra. Tổng quát quá trình xử lý thông tin trên MTĐT có thể được tóm tắt như sau: + Trước hết đưa chương trình cần thực hiện (do con người lập sẵn) vào bộ nhớ của máy tính + Máy bắt đầu xử lý, dữ liệu nhập từ môi trường ngoài vào bộ nhớ (Thông qua thiết bị nhập dữ liệu). + Máy thực hiện thao tác dữ liệu và ghi kết quả trong bộ nhớ. + Đưa kết quả từ bộ nhớ ra bên ngoài nhờ các thiết bị xuất (máy in, màn hình). Máy tính điện tử có một số đặc điểm chính như sau: + Tốc độ xử lý nhanh, độ tin cậy cao. + Khả năng nhớ rất lớn. + Tham số về tốc độ thường được tính bằng số phép tính thực hiện trong một giây, còn khả năng nhớ đựơc tính theo dung lượng bộ nhớ trong đo bằng KB, MB. 1.1.1.3. Tin học và các lĩnh vực nghiên cứu của tin học a. Tin học là gì ? Tin học là một ngành khoa học công nghệ nghiên cứu các phương pháp xử lý thông tin một cách tự động dựa trên các phương tiện kỹ thuật mà chủ yếu hiện tại là máy tính điện tử. 6
  6. Chương 1: Các khái niệm cơ bản b. Các lĩnh vực nghiên cứu của tin học : Từ các định nghĩa trên thấy tin học gồm hai khía cạnh nghiên cứu: - Khía cạnh khoa học: nghiên cứu về các phương pháp xử lý thông tin tự động. - Khía cạnh kỹ thuật: nhằm vào 2 kỹ thuật phát triển song song - đó là : + Kỹ thuật phần cứng (hardware engineering): nghiên cứu chế tạo các thiết bị, linh kiện điện tử, công nghệ vật liệu mới hỗ trợ cho máy tính và mạng máy tính đẩy mạnh khả năng xử lý toán học và truyền thông thông tin. + Kỹ thuật phần mềm (software engineering): nghiên cứu phát triển các hệ điều hành, ngôn ngữ lập trình cho các bài toán khoa học kỹ thuật, mô phỏng, điều khiển tự động, tổ chức dữ liệu và quản lý hệ thống thông tin. c. Ứng dụng của tin học Tin học hiện đang được ứng dụng rộng rãi trong tất cả các ngành nghề khác nhau của xã hội từ khoa học kỹ thuật, y học, kinh tế, công nghệ sản xuất đến khoa học xã hội, nghệ thuật, như: - Tự động hóa văn phòng - Quản trị kinh doanh - Thống kê - An ninh, quốc phòng - Công nghệ thiết kế, Giáo dục - Y học, Công nghệ in - Nông nghiệp, Nghệ thuật, giải trí, v.v 1.1.2. Biểu diễn thông tin trong máy tính 1.1.2.1. Hệ đếm và logic mệnh đề a. Hệ đếm Hệ đếm là tập hợp các ký hiệu và qui tắc sử dụng tập ký hiệu đó để biểu diễn và xác định các giá trị các số. Mỗi hệ đếm có một số ký số (digits) hữu hạn và tổng số ký số của mỗi hệ đếm được gọi là cơ số (base hay radix), ký hiệu là b. Các hệ đếm phổ biến hiện nay hay dùng là hệ đếm La mã và hệ đếm thập phân, hệ đếm nhị phân, hệ đếm bát phân, hệ đếm thập lục phân. Nhưng trong lĩnh vực kỹ thuật hiện nay phổ biến 4 hệ đếm như sau : Hệ đếm Cơ số Ký số và trị tuyệt đối Hệ nhị phân 2 0, 1 Hệ bát phân 8 0, 1, 2, 3, 4, 5, 6, 7 Hệ thập phân 10 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 Hệ thập lục phân 16 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F 7
  7. Chương 1: Các khái niệm cơ bản */ Hệ đếm thập phân (decimal system) Hệ đếm thập phân hay hệ đếm cơ số 10 là một trong những phát minh của người Ả rập cổ, bao gồm 10 ký số theo ký hiệu sau: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 Qui tắc tính giá trị của hệ đếm này là mỗi đơn vị ở một hàng bất kỳ có giá trị bằng 10 đơn vị của hàng kế cận bên phải. (Ở đây b = 10). Bất kỳ số nguyên dương trong hệ thập phân được thể hiện như là một tổng các chuỗi các ký số thập phân nhân với 10 lũy thừa, trong đó số mũ lũy thừa được tăng thêm 1 đơn vị kể từ số mũ lũy thừa phía bên phải nó. Số mũ lũy thừa của hàng đơn vị trong hệ thập phân là 0. Ví dụ: Số 5246 có thể được thể hiện như sau: 5246 = 5 x 103 + 2 x 102 + 4 x 101 + 6 x 100 = 5 x 1000 + 2 x 100 + 4 x 10 + 6 x 1 Thể hiện như trên gọi là ký hiệu mở rộng của số nguyên. Vì 5246 = 5000 + 200 + 40 + 6 Như vậy, trong số 5246: ký số 6 trong số nguyên đại diện cho giá trị 6 đơn vị (1s), ký số 4 đại diện cho giá trị 4 chục (10s), ký số 2 đại diện cho giá trị 2 trăm (100s) và ký số 5 đại diện cho giá trị 5 ngàn (1000s). Nghĩa là, số lũy thừa của 10 tăng dần 1 đơn vị từ trái sang phải tương ứng với vị trí ký hiệu số, 100 = 1 101 = 10 102 = 100 103 = 1000 104 = 10000 Mỗi ký số ở thứ tự khác nhau trong số sẽ có giá trị khác nhau, ta gọi là giá trị vị trí (place value). Phần phân số trong hệ thập phân sau dấu chấm phân cách (theo qui ước của Mỹ) thể hiện trong ký hiệu mở rộng bởi 10 lũy thừa âm tính từ phải sang trái kể từ dấu chấm phân cách Ví dụ: 254.68 = 2x102 + 5x101 + 4x100 + 6x10-1 + 8x10-2 6 8 = 200+50+4+ + 10 100 Tổng quát, hệ đếm cơ số b (b≥2, b là số nguyên dương) mang tính chất sau: · Có b ký số để thể hiện giá trị số. Ký số nhỏ nhất là 0 và lớn nhất là b-1. · Giá trị vị trí thứ n trong một số của hệ đếm bằng cơ số b lũy thừa n : bn Số N(b) trong hệ đếm cơ số (b) thể hiện : N(b) = anan-1an-2 a1a0a-1a-2 a-m trong đó, số N(b) có n+1 ký số chẵn ở phần nguyên và m ký số lẻ, sẽ có giá trị là: n n-1 n-2 1 0 -1 -2 -m N(b) = an.b + an-1.b + an-2.b + +a1b + a0.b + a-1.b + a-2.b + + a-m.b Hay n i N(b) = ∑ ai b i=− m * Hệ đếm nhị phân (binary number system) 8
  8. Chương 1: Các khái niệm cơ bản Với b = 2, chúng ta có hệ đếm nhị phân. Ðây là hệ đếm đơn giản nhất với 2 chữ số là 0 và 1. Mỗi chữ số nhị phân gọi là BIT (viết tắt từ chữ BInary digiT). Hệ nhị phân tương ứng với 2 trạng thái của các linh kiện điện tử trong máy tính - cụ thể: đóng (có điện) ký hiệu là 1 và tắt (không điện) ký hiệu là 0. Vì hệ nhị phân chỉ có 2 trị số là 0 và 1, nên khi muốn diễn tả một số lớn hơn, hoặc các ký tự phức tạp hơn thì cần kết hợp nhiều bit với nhau. Ta có thể chuyển đổi hệ nhị phân theo hệ thập phân quen thuộc. Ví dụ 3.6: Số 11101.11(2) sẽ tương đương với giá trị thập phân là : vị trí dấu chấm cách Số nhị phân: 1 1 1 0 1 1 1 Số vị trí: 4 3 2 1 0 -1 -2 Trị vị trí: 24 23 22 21 20 2-1 2-2 Hệ 10 là: 16 8 4 2 1 0.5 0.25 như vậy: 11101.11(2) = 1x16 + 1x8 + 1x4 + 0x2 + 1x1 + 1x0.5 + 1x0.25 = 29.75 (10) tương tự số 10101 (hệ 2) sang hệ thập phân sẽ là: 4 3 2 1 0 10101(2) = 1x2 + 0x2 + 1x2 + 0x2 + 1x2 = 8 + 0 + 4 + 0 + 1 = 13(10) */ Hệ đếm La mã Hệ đếm La mã được xem như là hệ đếm có tính hệ thống đầu tiên của con người. Hệ đếm La mã sử dụng các ký hiệu ứng với các giá trị như sau: I = 1 V = 5 X = 10 L = 50 C = 100 D = 500 M = 1000 Ký số La mã có một số qui tắc sau: - Số lần n liên tiếp kế nhau của mỗi ký hiệu thể hiện giá trị ký hiệu tăng lên n lần. Số lần n chỉ là 1 hoặc 2 hoặc 3. Riêng ký hiệu M được phép xuất hiện 4 lần liên tiếp. Ví dụ: III = 3 x 1 = 3; XX = 2 x 10 = 20; MMMM = 4000, - Hai ký hiệu đứng cạnh nhau, nếu ký hiệu nhỏ hơn đứng trước thì giá trị của chúng sẽ là hiệu số của giá trị ký hiệu lớn trừ giá trị ký hiệu nhỏ hơn. Ví dụ: IV = 5 -1 = 4; IX = 10 - 1 = 9; CD = 500 - 100 = 400; CM = 1000 - 100 = 900 - Hai ký hiệu đứng cạnh nhau, nếu ký hiệu nhỏ đứng sau thì giá trị của chúng sẽ là tổng số của 2 giá trị ký hiệu. Ví dụ: XI = 10 + 1 = 11; DCC = 500 + 100 + 100 = 700 Giá trị 3986 được thể hiện là: MMMCMLXXXVI - Ðể biểu thị những số lớn hơn 4999 (MMMMCMXCIX), chữ số La mã giải quyết bằng cách dùng những vạch ngang đặt trên đầu ký tự. Một vạch ngang tương đương với việc nhân giá 9
  9. Chương 1: Các khái niệm cơ bản trị của ký tự đó lên 1000 lần. Ví dụ M = 1000x1000 = 106. Như vậy, trên nguyên tắc chữ số La mã có thể biểu thị các giá trị rất lớn. Tuy nhiên trong thực tế người ta thường sử dụng 1 đến 2 vạch ngang là nhiều. Hệ đếm La mã hiện nay ít được sử dụng trong tính toán hiện đại. */ Hệ đếm bát phân (octal number system) Nếu dùng 1 tập hợp 3 bit thì có thể biểu diễn 8 trị số khác nhau: 000, 001, 010, 011, 100, 101, 110, 111. Các trị số này tương đương với 8 trị số trong hệ thập phân là 0, 1, 2, 3, 4, 5, 6, 7. Tập hợp các chữ số này gọi là hệ bát phân, là hệ đếm với b = 8 = 23. Trong hệ bát phân, trị số vị trí là lũy thừa của 8. 2 1 0 -1 -2 Ví dụ: 235 . 64(B) = 2x8 + 3x8 + 5x8 + 6x8 + 4x8 = 157.8125(10) */ Hệ đếm thập lục phân (hexa-decimal number system) Hệ đếm thập lục phân là hệ cơ số b = 16 = 24 tương đương với tập hợp 4 chữ số nhị phân (4 bit). Khi thể hiện ở dạng hexa-decimal, ta có 16 ký tự gồm 10 chữ số từ 0 đến 9, và 6 chữ in A, B, C, D, E, F để biểu diễn các giá trị số tương ứng là 10, 11, 12, 13, 14, 15. Với hệ thập lục phân, trị vị trí là lũy thừa của 16. 4 3 2 1 0 Ví dụ: 34F5C(16) = 3X16 + 4x16 + 15x16 + 5x16 + 12x16 = 216294(10) Ghi chú: Một số chương trình qui định viết số hexa phải có chữ H ở cuối chữ số. Ví dụ: Số 15 viết là FH. Bảng qui đổi tương đương 16 chữ số đầu tiên của 4 hệ đếm Hệ 10 Hệ 2 Hệ 8 Hệ 16 0 0000 00 0 1 0001 01 1 2 0010 02 2 3 0011 03 3 4 0100 04 4 5 0101 05 5 6 0110 06 6 7 0111 07 7 8 1000 10 8 9 1001 11 9 10 1010 12 A 11 1011 13 B 12 1100 14 C 13 1101 15 D 14 1110 16 E 15 1111 17 F *Chuyển đổi số giữa các hệ đếm Chuyển một số từ hệ cơ số L=10 sang hệ cơ số H: 10
  10. Chương 1: Các khái niệm cơ bản Ta lưu ý rằng các hệ cơ số ta xét đều lấy 1 làm đơn vị, vì vậy một số bất kỳ dù biểu diễn ở hệ cơ số nào thì phần thập phân và phần nguyên đều không đổi. Nghĩa là dù biến đổi sang hệ cơ số nào đi nữa thì phần thập phân cũng chỉ chuyển sang phần thập phân, phần nguyên sang phần nguyên. Giả sử ta có một số có phần thập phân b=k+d trong hệ cơ số L trong đó k là phần nguyên trước dấu phẩy và d là phần thập phân sau dấu phẩy. Ta sẽ chuyển đổi riêng từng phần theo quy tắc sau: - Với phần nguyên: Lấy k chia liên tiếp cho H cho đến khi thương số bằng 0, phép chia thứ i có số dư bi là chữ số trong hệ cơ số H, i = 0,1,2, ,n , khi đó bn bn-1 bn-2 b0 là phần nguyên của số b trong hệ cơ số H. - Với phần thập phân: Lấy phần thập phân của d nhân liên tiếp với H cho đến khi kết quả phép nhân không còn phần thập phân hoặc đạt được độ chính xác ta cần, mỗi lần nhân ta lấy phần nguyên của kết quả là cj là chữ số trong hệ cơ số H, j = 1,2, ,m. Khi đó số . c1 c2 cm chính là phần thập phân của số nhị phân cần tìm. (Chúng ta lưu ý là sau mỗi lần nhân ta chỉ lấy phần thập phân để nhân tiếp với H, phần nguyên ở đây được hiểu là phần bên trái dấu chấm thập phân). Ví dụ: Cho số thập phân 14.125 tìm số nhị phân tương ứng. Ta có k = 14, d = 0.125 Chuyển đổi phần nguyên 14 Chia 2 Dư 14 0 7 3 1 1 1 0 Chuyển đổi phần thập phân 0.125 Nhân 2 Phần nguyên 0.125 0.25 0 0.5 0 1 1 Vậy 14.125=1110.001 Chuyển đổi 0.2 sang hệ nhị phân: Nhân 2 Phần nguyên 0.2 0.4 0 0.8 0 1 1 . . . Ta thấy rằng số 0.2 trong hệ cơ số 2 là một số thập phân vô hạn tuần hoàn 0.210=0.(0011)2 11
  11. Chương 1: Các khái niệm cơ bản Chuyển từ hệ bất kỳ sang hệ thập phân Giả sử ta có biểu diễn số B theo cơ số H là B= bn bn-1 bn-2 b1 b0 .c1 c2 cn cm Vì ta đã quen tính toán với hệ cơ số 10 nên ta có thể chuyển đổi trực tiếp theo công thức sau: B= bnxHn + bn-1xHn-1 + bn-2xHn-2 + b1xH + b0+ c1xH-1 + c2xH-2 + + cmxH-m (Ta hoàn toàn có thể áp dụng quy tắc đã nêu: chia lấy phần dư, nhân lấy phần nguyên để tìm biểu diễn của B trong hệ thập phân) Chuyển từ hệ nhị phân sang bát phân (hoặc thập lục phân) Qui tắc: Nhóm các Bit thành từng nhóm 3 Bit (4 Bit - cho hệ thập lục phân) bắt đầu từ Bit ngoài cùng bên phải, tính giá trị số học học quy luật giá trị vị trí riêng cho từng nhóm 3 (hay 4) Bit, viết các giá trị này liền nhau. Ví dụ cho số nhị phân 11110101 chuyển số này sang dạng bát phân và thập lục phân. (11 110 101) -> 365 trong hệ bát phân là số 365 (1111 0101) -> 15 5 -> F5 trong hệ thập lục phân là số F5 Khi cần chuyển ngược lại chúng ta làm theo các bước tương tự Chuyển đổi hệ thống số dựa trên hệ 8 và hệ 16 Trong phần bài giảng, chúng ta đã làm quen với cách chuyển đổi giữa hệ 2 và hệ 10. Tuy nhiên, ở những trị số lớn và dài thì làm cách trên trở nên rất phức tạp và dễ nhầm lẫn, ví dụ : 101110110101(2) = ?(10) 2997(10) = ?(12) Trong ví dụ thứ nhất ta phải liên tiếp làm nhiều phép nhân và ở ví dụ thứ hai, ta lại thực hiện nhiều phép chia liên tiếp. Người ta đưa ra hệ thống số trung gian là hệ 8 và hệ 16 để giải quyết: Hệ 16 Hệ 2 Hệ 10 Hệ 8 Thông qua hệ 8 và hệ 16 để chuyển đổi hệ 2 sang hệ 10 Chia số nhị phân làm thành từng bộ 3 số và 4 số liên tiếp theo thứ tự tương ứng với cách thông qua hệ 8 và hệ 16 và dùng phương pháp nhân với các thừa số bên trên tương ứng rồi cộng lại. Ví dụ: 101110110101(2) = ? (10) THÔNG QUA HỆ 8: Chia số nhị phân từng bộ 3 số: 12
  12. Chương 1: Các khái niệm cơ bản 83 82 81 80 22 21 20 22 21 20 22 21 20 22 21 20 1 0 1 1 1 0 1 1 0 1 0 1 5 6 6 5 Chú ý: 5 = 1x22 + 0x21 + 1x20 và 6 = 1x22 + 1x21 + 0x20 Kết quả: 3 2 1 0 101110110101(2) = 5x8 + 6x8 + 6x8 + 5x8 = 5x512 + 6x64 + 6x8 + 5x1 = 2997(10) THÔNG QUA HỆ 16: Chia số nhị phân thành bộ 4 số 16 16 16 2 1 0 23 22 21 20 23 22 21 20 23 22 21 20 1 0 1 1 1 0 1 1 0 1 0 1 11 11 5 Chú ý: 11 = 1x23 + 0x22 + 1x21 + 1x20 và 5 = 0x23 + 1x22 + 0x21 + 1x20 Kết quả: 2 1 0 101110110101(2) = 11x16 + 11x16 + 5x16 = 11x256 + 11x16 +5x1 = 2997(10) Thông qua hệ 8 và hệ 16 để chuyển hệ 10 sang hệ 2 Cách làm tương tự như trên, nhưng thay phép nhân thành phép chia và lấy các số dư của phép chia ngược từ dưới lên trên để chuyển đổi. Ví dụ: 2997(10) = ? (2) THÔNG QUA HỆ 8: 2997 8 8 Số dư 5 374 46 8 6 8 6 0 5 2 x 1 0 Ta có: 5 (h ệ 8) = 4 + 1 = 1x2 + 0 2 + 1x2 = 101(2) Tương tự: 2 1 0 6 (hệ 8) = 4+2 = 1x2 + 1x2 + 0x2 = 110(2) 13
  13. Chương 1: Các khái niệm cơ bản Suy ra: 2997(10) = 101 110 110 101(2) THÔNG QUA HỆ 16: 2997 16 5 187 16 5 11 11 16 B 11 0 B Số dư Ta có : 2997 (10) = BB5(16) B (hệ 16) = 11 = 8 + 2 +1 = 1x23 + 0x22 + 1x21 + 1x20 = 1011 (hệ 2) 5 (hệ 16) = 4 + 1 = 0x23 + 1x22 + 0x21 + 1x20 = 0101 (hệ 2) Suy ra: 2997(10) = BB6(16) = 1011 1011 0101(2) Chuyển hệ 8 sang hệ 16 và ngược lại: Ta có thể dùng hệ 10 hoặc hệ 2 làm trung gian để chuyển đổi hệ 8 sang hệ 16 và ngược lại. Thông thường dùng hệ 2 để trung chuyển có thuận lợi hơn. Ví dụ: 5665(8) = ?(16) Cách làm như sau: Bước 1: Chuyển hệ 8 thành hệ 2: biểu thị từng trị số trong hệ 8 thành từng nhóm 3 số và ghép các nhóm đó lại. 5 (hệ 8) = 4 + 1 + 0 = 1x22 + 0x21 + 1x20 = 101 (hệ 2) 6 (hệ 8) = 4 + 2 + 2 = 1x22 + 1x21 + 0x20 = 110 (hệ 2) Vậy 5665(8) = 101 110 110 101(2) Bước 2: Chia dãy số hệ 2 vừa có được thành các bộ 4 số và chuyển các bộ đó sang hệ 16 5665(8) = 101 110 110 101(2) = 1011 1011 0101(2) 3 2 1 0 Vì: 1011(2) = 1x2 + 0x2 + 1x2 + 1x2 = 8 + 0 + 2 + 1 = 11 = B(16) 3 2 1 0 0101(2) = 0x2 + 1x2 + 0x2 + 1x2 = 0 + 4 + 0 + 1 = 5(16) Nên: 1011 1011 1010 B B 5 Vậy: 5665(8) = BB5(16) Việc chuyển từ hệ 16 sang hệ 8 ta cũng tiến hành 2 bước như vậy. b. Số học nhị phân 14
  14. Chương 1: Các khái niệm cơ bản Trong số học nhị phân chúng ta cũng có 4 phép toán cơ bản như trong số học thập phân là cộng, trừ, nhân và chia. Qui tắc của 2 phép tính cơ bản cộng và nhân: X Y X + Y X * Y 0 0 0 0 0 1 1 0 1 0 1 0 1 1 10 1 Ghi chú: Với phép cộng trong hệ nhị phân, 1 + 1 = 10, số 10 (đọc là một - không) chính là số 2 tương đương trong hệ thập phân. Viết 10 có thể hiểu là viết 0 nhớ 1. Một cách tổng quát, khi cộng 2 hay nhiều chữ số nếu giá trị tổng lớn hơn cơ số b thì ta viết phần lẻ và nhớ phần lớn hơn sang bên trái cạnh nó. Ví dụ: Cộng 2 số 0101 + 1100 = ? 0101 tương đương số 5 trong hệ 10 `+ 1100 tương đương số 12 trong hệ 10 10001 tương đương số 17 trong hệ 10 Ví dụ: Nhân 2 số 0110 x 1011 = ? 0110 tương đương số 6 trong hệ 10 x1011 tương đương số 11 trong hệ 10 0110 0110 + 0000 0110 tương đương số 66 trong hệ 10 1000010 Phép trừ và phép chia là các phép toán đặc biệt của phép cộng và phép nhân. Ví dụ: Trừ hai số 101 tương đương số 5 trong hệ 10 − 011 tương đương số 3 trong hệ 10 010 tương đương số 2 trong hệ 10 Ghi chú: 0 – 1 = -1 (viết 1 và mượn 1 ở hàng bên trái). Ví dụ: Chia hai số 110 10 tương đương số 6 và trong hệ 10 - 10 11 010 15 -10 00
  15. Chương 1: Các khái niệm cơ bản tương đương số 3 trong hệ 10 Qui tắc 1: Khi nhân một số nhị phân với 2n ta thêm n số 0 vào bên phải số nhị phân đó. Ví dụ : 1011x23 = 1011000 Qui tắc 2: Khi chia một số nguyên nhị phân cho 2n ta đặt dấu chấm ngăn ở vị trí n chữ số bên trái kể từ số cuối của số nguyên đó. Ví dụ : 100111110:23 = 100111.110 c. Mệnh đề logic Mệnh đề logic là mệnh đề chỉ nhận một trong 2 giá trị : Ðúng (TRUE) hoặc Sai (FALSE), tương đương với TRUE = 1 và FALSE = 0. Qui tắc: TRUE = NOT FALSE và FALSE = NOT TRUE Phép toán logic áp dụng cho 2 giá trị TRUE và FALSE ứng với tổ hợp AND (và) và OR (hoặc) như sau: x y x AND y x OR y TRUE TRUE TRUE TRUE TRUE FALSE FALSE TRUE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE Ct1 Ct1 Ct2 Ký hiệu: Ct2 Ct: công tắc Nguồn điện Đèn + : đóng (on) - : ngắt (off) Đèn sáng = [ct1+] AND [ct2+] Đèn sáng = [ct1+] OR [ct2+] Đèn tắt = [ct1-] OR [ct2-] Đèn tắt = [ct1-] AND [ct2-] 1.1.2.2. Biểu diễn dữ liệu Dữ liệu số trong máy tính gồm có số nguyên và số thực. a/ Biểu diễn số nguyên 16
  16. Chương 1: Các khái niệm cơ bản Số nguyên gồm số nguyên không dấu và số nguyên có dấu. * Số nguyên không dấu là số không có bit dấu như 1 byte = 8 bit, có thể biểu diễn 26 = 256 số nguyên dương, cho giá trị từ 0 (0000 0000) đến 255 (1111 1111). * Số nguyên có dấu thể hiện trong máy tính ở dạng nhị phân là số dùng 1 bit làm bít dấu, người ta qui ước dùng bit ở hàng đầu tiên bên trái làm bit dấu (S): 0 là số dương và 1 cho số âm. Ðơn vị chiều dài để chứa thay đổi từ 2 đến 4 bytes. Bit dấu S 2 bytes = 16 bit 15 4 3 2 1 0 4 bytes = 32 bit 31 Ta thấy, với chiều dài 16 bit : bit đầu là bit dấu và 15 bit sau là bit số Trị dương lớn nhất của dãy 2 bytes sẽ là: 01111111 11111111 = 215 - 1 Trị âm lớn nhất trong dãy 2 bytes là -215 Ðể thể hiện số âm trong hệ nhị phân ta có 2 khái niệm: - Số bù 1: Khi đảo ngược tất cả các bit của dãy số nhị phân: 0 thành 1 và 1 thành 0, dãy số đảo đó gọi là số bù 1 của số nhị phân đó. Ví dụ: N = 0101 = 5(!0) Số bù 1 của N là: 1010 - Số bù 2: Số bù 2 của số N là số đảo dấu của nó (-N). Trong hệ nhị phân, số bù 2 được xác định bằng cách lấy số bù 1 của N rồi cộng thêm 1. Ví dụ: N = 0101 = 5(10) Số bù 1 của N là: 1010 + 0001 Số bù 2 của N là: 1011 = -5(10) = - N b/ Biểu diễn số thực Ðối với các số thực (real number) là số có thể có cả phần lẻ hoặc phần thập phân. Trong máy tính, người ta biễu diễn số thực với số dấu chấm tĩnh (fixed point number) và số dấu chấm động (floating point number). */ Số dấu chấm tĩnh: thực chất là số nguyên (integers) là những số không có chấm thập phân */ Số dấu chấm động: là số có chữ số phần lẻ không cố định. Mỗi số như vậy có thể trữ và xử lý trong máy tính ở dạng số mũ. Ví dụ: 499,000,000 = 499 x 106 = 49.9 x107 = 0.499 x 109 = 0.499E + 09 0.000 123 = 123 x 10-6 = 1.23 x 10-4 = 0.123 x 10-3 = 0.123E – 03 17
  17. Chương 1: Các khái niệm cơ bản Ghi chú: Dấu chấm thể hiện trong máy tính để phân biệt phần lẻ, dấu phẩy tượng trưng cho phần ngàn, được viết theo qui ước của Mỹ. Tổng quát, số dấu chấm động được biểu diễn theo 3 phần : - phần dấu S (sign) : 0 cho + và 1 cho - - phần định trị m (mantissa) - phần mũ e (exponent), có thể là số nguyên dương (+) hoặc âm (-) với một số X bất kỳ, có thể viết : X = ± m . b e = ± m E e Trong đó, b là cơ số qui ước, trị số mũ e có thể thay đổi tùy theo số vị trí cần dịch chuyển dấu chấm để có lại trị số ban đầu. Khi dịch chuyển dấu chấm sang ±n vị trí về phía trái (+n) hay phía phải (-n) thì số mũ e thay đổi lên ±n đơn vị tương ứng Ðể biểu diễn số có dấu chấm động, người ta dùng dãy 32 bit với hệ thống cơ số 16. Trong đó, 1 bit cho phần dấu, 7 bit cho phần mũ để biểu diễn phần đặc trị C (characteristic) và 24 bit cho phần định trị m. SC m dấu Phần mũ Phần định trị 1 bit 7 bit 24 bit Phần mũ có 7 bit = 27 = 128 đặc trị C, tương ứng phần mũ e từ -64 đến +63 C = số mũ biểu diễn + 64 Phần mũ e - - - - 2 - 1 0 1 62 63 64 63 62 Ðặc trị C 0 1 2 62 63 64 65 126 127 9 Ví dụ: A = -419.8125(10) = -110100011.1101(2) = -0.1101000111101 x 2 Số mũ của A là 9, số đặc trị C là: C = 9 + 64 = 73 = 1001001(2) Trong máy tính, số A sẽ được trữ theo vị trí nhớ 32 bit như sau : Dấu A đặc trị C (7bit) định trị m (24 bit) Dấu A Đặc trị C (7 bit) định trị m (24 bit) 1 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1 1 1 0 1 0 0 0 0 0 c. Biểu diễn ký tự 18
  18. Chương 1: Các khái niệm cơ bản Ðể có thể biễu diễn các ký tự như chữ cái in và thường, các chữ số, các ký hiệu trên máy tính và các phương tiện trao đổi thông tin khác, người ta phải lập ra các bộ mã (code system) qui ước khác nhau dựa vào việc chọn tập hợp bao nhiêu bit để diễn tả 1 ký tự tương ứng, ví dụ các hệ mã phổ biến : - Hệ thập phân mã nhị phân BCD (Binary Coded Decima) dùng 6 bit. - Hệ thập phân mã nhị phân mở rộng EBCDIC (Extended Binary Coded Decimal Interchange Code) dùng 8 bit tương đương 1 byte để biễu diễn 1 ký tự. - Hệ chuyển đổi thông tin theo mã chuẩn của Mỹ ASCII (American Standard Code for Information Interchange) là hệ mã thông dụng nhất hiện nay trong kỹ thuật tin học. Hệ mã ASCII dùng nhóm 7 bit hoặc 8 bit để biểu diễn tối đa 128 hoặc 256 ký tự khác nhau và mã hóa theo ký tự liên tục theo cơ số 16. Hệ mã ASCII 7 bit, mã hoá 128 ký tự liên tục như sau: 0 : NUL (ký tự rỗng) 1 - 31 : 31 ký tự điều khiển 32 - 47 : các dấu trống SP (space) ! # $ % & ( ) * + , - . / 48 - 57 : ký số từ 0 đến 9 58 - 64 : các dấu : ; ? @ 65 - 90 : các chữ in hoa từ A đến Z 91 - 96 : các dấu [ \ ] _ ` 97 - 122 : các chữ thường từ a đến z 123 - 127 : các dấu { | } ~ DEL (xóa) Hệ mã ASCII 8 bit (ASCII mở rộng) có thêm 128 ký tự khác ngoài các ký tự nêu trên gồm các chữ cái có dấu, các hình vẽ, các đường kẻ khung đơn và khung đôi và một số ký hiệu đặc biệt (xem phụ lục). - Hệ chuyển đổi thông tin theo bộ mã Unicode: Ngày nay máy tính đã toàn cầu hóa, mà hình ảnh cụ thể là mạng Internet, do vậy bảng mã ASCII đã bộc lộ khả năng mã hóa hạn chế của nó. Để thống nhất bộ mã trên toàn thế giới, người ta đã đề xuất bộ mã 16 bit mang tên Unicode. Vì dùng tới 16 bít để mã hóa (mã hóa được 216 kí tự ), vì vậy nó đủ lớn để đáp ứng cho việc mã hóa tất cả các ngôn ngữ trên toàn thế giới. Đặc điểm chính của Unicode là nó không chứa các kí tự điều khiển mà dành tất cả để mã hóa kí tự. Bảng sau đây cho chúng ta biết sơ bộ cách phân bố mã chuẩn trong Unicode: Mã thập phân Kí tự 0 đến 8191 Chữ cái Anh, Latin1, Châu Âu, Latin mở rộng, chữ cái phiên âm, Hy lạp, Nga, Armerical, Do thái, Ả rập, Ethiopi, Dvanagari, bengali, Gurmukhi, Gujarati,Orya, Tamil. Telugu, Kanada, Malaixia, Thái, Lào, Miến điện, Khme, Tây tạng, Mông cổ, Georgi Kí hiệu 19
  19. Chương 1: Các khái niệm cơ bản Chữ tượng hình, chữ cái Hán, chữ Nhật, Hàn 8192-12287 Chữ tượng hình Hán, Nhật, Hàn 12288-16383 Dành cho người sử dụng 16384-59391 Vùng tương thích 59392-65024 Cho các mục đích trong tương lai 65025-65036 8192 giá trị đầu dành cho chữ cái chuẩn; 4096 giá trị tiếp theo dành cho kí tự toán học, kỹ thuật, Unicode qui định các chữ cái có âm tiết trong tiếng Việt là các kí tự tổ hợp. Ví dụ chữ “â” là tổ hợp của hai chữ ‘a’ và ‘Λ’; mỗi kí tự tổ hợp bao gồm nguyên âm cơ sở được nối tiếp bởi kí tự dấu thanh. Nguyên âm cơ sở và dấu thanh được đặt vào cùng vị trí khi hiển thị. Nếu chữ cái được tổ hợp từ hai hay nhiều kí tự âm tiết (ví dụ ‘â’) thứ tự các dấu không quan trọng nếu không có luật chính tả cụ thể. Các kí tự tổ hợp từ trước như chữ ‘đ’ chỉ dùng một mã duy nhất để mô tả. Để biểu diễn tiếng Việt ta cần : - 33 chữ cái hoa - 33 chữ cái thường - 5 dấu thanh: huyền (`), ngã (~), hỏi ( ?), nặng (.), sắc ( ́) 1.2. CẤU TRÚC TỔNG QUÁT CỦA HỆ THỐNG MÁY TÍNH 1.2.1. Nguyên lý thiết kế cơ bản 1.2.1.1. Nguyên lý Turing Alan Mathison Turing (1912 - 1954) là một nhà toán học người Anh đã đưa ra một thiết bị tính đơn giản gọi là máy Turing. Về lý thuyết, mọi quá trình tính toán nếu thực hiện được thì đều có thể mô phỏng lại trên máy Turning. Máy Turning gồm có (xem hình 2.1): - Một bộ điều khiển trạng thái hữu hạn (finite control), trong đó có các trạng thái đặc biệt như trạng thái khởi đầu và trạng thái kết thúc. - Một băng ghi (tape) chứa tín hiệu trong các ô. - Một đầu đọc (head) và ghi có thể di chuyển theo 2 chiều trái hoặc phải một đơn vị. Băng ghi TAPE Đầu đọc/ghi READ/WRITE HEAD (moves in both directions) h q0 Bộ điều khiển hữu hạn . q1B FINITE CONTROL qB B qB 20 3 2
  20. Chương 1: Các khái niệm cơ bản Sơ đồ máy Turing Ðầu đọc/ghi mang chức năng thông tin nối giữa Bộ điều khiển hữu hạn và băng ghi. Ðầu bằng cách đọc dấu hiệu từ băng và cũng dùng nó để thay đổi dấu hiệu trên băng. Bộ kiểm soát vận hành theo từng bước riêng biệt; mỗi bước nó thực hiện 2 chức năng tùy thuộc vào trạng thái hiện tại của nó và tín hiệu hiện tại của băng: 1. Ðặt bộ điều khiển ở trạng thái ban đầu q1, băng trắng và đầu đọc/ghi chỉ vào ô khởi đầu. 2. Nếu: (a) trạng thái hiện tại q trùng với trạng thái kết thúc qo thì máy sẽ dừng. (b) ngược lại, trạng thái q sẽ chuyển qua q, tín hiệu trên băng s thành s và đầu đọc dịch chuyển sang phải hoặc trái một đơn vị. Máy hoàn thành xong một bước tính toán và sẵn sàng cho bước tiếp theo. 1.2.1.2. Nguyên lý Von Neumann Năm 1946, nhà toán học Mỹ John Von Neumann (1903 - 1957) đã đề ra một nguyên lý máy tính hoạt động theo một chương trình được lưu trữ và truy nhập theo địa chỉ. Nguyên lý này được trình bày ở một bài báo nổi tiếng nhan đề: Thảo luận sơ bộ về thiết kế logic của máy tính điện tử . Nội dung nguyên lý Von Neumann gồm: - Máy tính có thể hoạt động theo một chương trình đã được lưu trữ. Theo Von Neumann, chúng ta có thể tập hợp các lệnh cho máy thi hành theo một chương trình được thiết kế và coi đó như một tập dữ liệu. Dữ liệu này được cài vào trong máy và được truyền bằng xung điện. Ðây là một cuộc cách mạng mới cho máy tính nhằm tăng tốc độ tính toán vào thời đó vì trước kia máy chỉ có thể nhận được các lệnh từ băng giấy hoặc bìa đục lỗ và nạp vào bằng tay. Nếu gặp bài toán lặp lại nhiều lần thì cũng tiếp tục bằng cách nạp lại một cách thủ công như vậy gây hạn chế trong tính toán sử dụng. - Bộ nhớ được địa chỉ hóa Mỗi dữ liệu đều có một địa chỉ của vùng nhớ chứa số liệu đó. Như vậy để truy nhập dữ liệu ta chỉ cần xác định địa chỉ của nó trên bộ nhớ. - Bộ đếm của chương trình Nếu mỗi câu lệnh phải dùng một vùng nhớ để chứa địa chỉ của câu lệnh tiếp theo thì không gian bộ nhớ sẽ bị thu hẹp. Ðể khắc phục hạn chế này, máy được gắn một thanh ghi để chỉ ra vị trí của lệnh tiếp theo cần được thực hiện và nội dung của nó tự động được tăng lên mỗi lần lệnh được truy cập. Muốn đổi thứ tự lệnh ta chỉ cần thay đổi nội dung thanh ghi bằng một địa chỉ của lệnh cần được thực hiện tiếp. 21
  21. Chương 1: Các khái niệm cơ bản 1.2.2. Quá trình xử lý thông tin Máy tính là công cụ xử lý thông tin Máy tính là công cụ xử lý thông tin. Về cơ bản, quá trình xử lý thông tin trên máy tính - cũng như quá trình xử lý thông tin của con người - có 4 giai đoạn chính : - Nhận thông tin (Receive input): thu nhận thông tin từ thế giới bên ngoài vào máy tính. Thực chất đây là quá trình chuyển đổi các thông tin ở thế giới thực sang dạng biểu diễn thông tin trong máy tính thông qua các thiết bị đầu vào. - Xử lý thông tin (process information): biến đổi, phân tích, tổng hợp, tra cứu những thông tin ban đầu để có được những thông tin mong muốn. - Xuất thông tin (produce output) : đưa các thông tin kết quả (đã qua xử lý) ra trở lại thế giới bên ngoài. Ðây là quá trình ngược lại với quá trình ban đầu, máy tính sẽ chuyển đổi các thông tin trong máy tính sang dạng thông tin ở thế giới thực thông qua các thiết bị đầu ra. - Lưu trữ thông tin (store information): ghi nhớ lại các thông tin đã được ghi nhận để có thể đem ra sử dụng trong những lần xử lý về sau. Ðể đáp ứng 4 thao tác đó thì một máy tính thông thường cũng gồm bốn thành phần hợp thành, mỗi thành phần có một chức năng riêng: - Thiết bị nhập (input device) : thực hiện thao tác đưa dữ liệu từ thế giới bên ngoài vào, thường là bàn phím và con chuột, nhưng cũng có thể là các loại thiết bị khác mà ta sẽ nói rõ hơn ở những phần sau. - Thiết vị xử lý : hay đơn vị xử lý trung tâm - CPU thực hiện thao tác xử lý, tính toán các kết quả, điều hành hoạt động tính toán của máy vi tính, có thể xem CPU như một bộ não của con người. - Thiết bị xuất (Output) thực hiện thao tác gởi thông tin ra ngoài máy vi tính, hầu hết là dùng màn hình máy tính là thiết bị xuất chuẩn, có thể thêm một số khác như máy in. - Thiết bị lưu trữ (storage devices) được dùng để cất giữ thông tin. Lưu trữ sơ cấp (primary momery) là bộ nhớ trong của máy tính dùng để lưu các tập lệnh của chương trình, các thông tin dữ liệu sẵn sàng trong tư thế chuẩn bị làm việc ty theo yêu cầu của CPU. Lưu trữ thứ cấp 22
  22. Chương 1: Các khái niệm cơ bản (secondary storage) là cách lưu trữ đơn thuần với mục đích cất giữ dư liệu, cách này dùng các thiết bị như đĩa cứng, đĩa mềm, CD, Quá trình xử lý thông tin trên máy tính 1.2.3. Cấu trúc tổng quát của MTĐT Mỗi loại máy tính có thể có các hình dạng hoặc cấu trúc khác nhau tùy theo mục đích sử dụng. Tuy nhiên, một máy tính muốn hoạt động được phải hội tụ đủ các yếu tố sau: - Phần cứng: bao gồm các thiết bị vật lý mà người dùng có thể quan sát được. Đó là các bảng mạch điện tử được lắp ghép lại với nhau và được cung cấp điện năng để hoạt động. Phần cứng máy tính thường được chia ra làm ba phần cơ bản - đó là: Thiết bị nhập, thiết bị xử lý và thiết bị xuất - Phần mềm: bao gồm các chương trình được viết bởi các nhà lập trình nhằm mục đích điều khiển các mạch điện tử cũng như thực hiện các phép tính toán. Phần mềm thường chia làm ba loại cơ bản - đó là: Hệ điều hành, phần mềm ứng dụng và phần mềm tiện ích. 1.2.3.1. Phần cứng (Hardware) Phần cứng có thể được hiểu đơn giản là tất cả các phần trong một hệ máy tính mà chúng ta có thể thấy hoặc sờ được. Phần cứng gồm các thiết bị máy có thể thực hiện các chứa năng sau: * Nhập dữ kiện vào máy (input) * Xử lý dữ kiện (processing) * Xuất dữ kiện/ thông tin (output) Sơ đồ cấu trúc phần cứng Đồng hồ tạo xung 23 Các thiết bị Bộ xử lý trung ương Các thiết bị Nhập CPU Xuất + Bàn phím + Màn hình + Con chuột Đơn vị điều Đơn vị + Máy in khiể tí h t á
  23. Chương 1: Các khái niệm cơ bản Sơ đồ cấu trúc phần cứng a/ Bộ xử lý trung tâm (CPU - Central Processing Unit) CPU là đơn vị xử lý trung tâm, hay còn gọi là bộ vi xử lý - đây là bộ phận đầu não của máy tính, nó thực hiện các lệnh, tính toán và điều khiển các phần cứng. CPU là một vi mạch làm bằng Silicon và có kích cỡ không bằng đầu ngón tay cái. Được bọc trong một lớp vỏ màu đen, CPU được gắn vào bảng mạch chính thông qua giao diện SOCKET hoặc SLOT1. Vi mạch tích hợp này chứa đựng các Transistor (các công tắc bán dẫn mini), các điện trở chỉnh lưu dòng điện và các tụ điện lưu dòng điện. Bộ CPU thực sự đầu tiên là Intel 4004 được sản xuất năm 1971. Hãng Intel được thành lập năm 1968 là hãng chuyên sản xuất các chíp bộ nhớ. Sau khi bộ vi xử lý 8088 của họ được chọn sử dụng cho máy IBM-PC thì doanh thu của hãng tăng cao. Năm 1993 hãng Intel đưa ra chip Pentium với trên 3 triệu transistor và một đường truyền dữ liệu 64 bit. Giống với 80486, Pentium cũng có bộ nhớ đệm Cache dùng để chứa dữ liệu cho đến khi dữ liệu được xử lý và một chíp đồng xử lý toán học. Thêm vào đó, Pentium còn chứa 2 đường dẫn lệnh cho phép nó xử lý 2 lệnh chương trình cùng một lúc với khoảng thời gian gần bằng thời gian xử lý một lệnh. Một số chương trình - đặc biệt là những chương trình video và đồ họa khi chạy trên máy Pentium sẽ nhanh gấp 2 lần so với chạy trên 80486. Tốc độ xử lý của các CPU thường được đo bằng Megahertz (= 1 triệu chu kỳ/giây). CPU có 3 bộ phận chính: khối điều khiển, khối tính toán số học và logic, và một số thanh ghi. · Khối điều khiển (CU: Control Unit) là trung tâm điều hành máy tính. Nó có nhiệm vụ giải mã các lệnh, tạo ra các tín hiệu điều khiển công việc của các bộ phận khác của máy tính theo yêu cầu của người sử dụng hoặc theo chương trình đã cài đặt. 24
  24. Chương 1: Các khái niệm cơ bản · Khối tính toán số học và logic (ALU: Arithmetic-Logic Unit) bao gồm các thiết bị thực hiện các phép tính số học (cộng, trừ, nhân, chia, ), các phép tính logic (AND, OR, NOT, XOR) và các phép tính quan hệ (so sánh lớn hơn, nhỏ hơn, bằng nhau, ) · Các thanh ghi (registers) được gắn chặt vào CPU bằng các mạch điện tử làm nhiệm vụ bộ nhớ trung gian. Các thanh ghi mang các chức năng chuyên dụng giúp tăng tốc độ trao đổi thông tin trong máy tính. Ngoài ra, CPU còn được gắn với một đồng hồ (clock) hay còn gọi là bộ tạo xung nhịp. Tần số đồng hồ càng cao thì tốc độ xử lý thông tin càng nhanh. Thường thì đồng hồ được gắn tương xứng với cấu hình máy và có các tần số dao động (cho các máy PC 386 DX trở lên) là 33 MHz, 66 MHz, 100 MHz, 120 MHz, 133 MHz, hoặc cao hơn. Các thông số quan trọng của CPU: 1- Tốc độ: Tốc độ của CPU được tính bằng tần số xung điện trong lõi của CPU. Tần số xung điện được tính theo đơn vị MHz . Đây cũng chính là tốc độ tính toán của CPU dựa vào các phép toán cơ bản là +/-. Ví dụ: CPU có tốc độ 100 MHz là 100.000.000 Phép tính/giây. 2- Dung lượng bộ nhớ đệm (Cache Size): Quyết định tốc độ xử lý lệnh nhanh hay chậm. Đây là một loại RAM tốc độ nhanh được tích hợp sẵn trong CPU. Dung lượng Cache thường có là: 32 KB, 64 KB, 128 KB, 256 KB, 512 KB. 3- Tốc độ BUS (Đường truyền dữ liệu): Tính bằng MHz. Đây là tốc độ được tính toán thích hợp để CPU và Mainboard có thể giao tiếp được với nhau. Tốc độ BUS thường được gọi là CLOCK và đồng thời cũng là BUS giao tiếp giữa Mainboard và CPU. Các chỉ số CLOCK thường là: 50/ 60/ 66/ 75/ 83/ 100/ 133/ 150/ 200/ 253/ 400/ 800. 4- Điện áp lõi của CPU: Điện áp sử dụng cho các linh kiện bên trong CPU. Đây là điện áp có độ ổn định cao để CPU có thể hoạt động ổn định. Hiện tại các mức điện áp thường từ 1.27 và 2.9 v. Tuỳ thuộc vào thời gian ra đời của các loại CPU, các nhà sản xuất Mainboard thiết kế bảng mạch cho phép người dùng lựa chọn CPU có tốc độ thích hợp với nhu cầu công việc, thích hợp với khả năng tài chính của mình. Để có thể xác định được đúng loại CPU mà Mainboard cho phép cắm, ta phải biết được một số thông số như : đế hoặc khe cắm (SOCKET/SLOT1), tốc độ CPU, tần số BUS của Mainboard (Clock), tần số BUS giao diện của CPU, qui định về thiết lập hệ số nhân xung (Radio, Jumper, Switch), Thông thường, các đặc tính của Mainboard được hướng dẫn rất kỹ trong sách hướng dẫn đi kèm theo từng loại Mainboard, ta nên cố gắng tham khảo các thông tin của Mainboard trước khi lắp đặt một máy tính mới hoặc nâng cấp các thiết bị như CPU, RAM b/ Bo mạch chủ và bộ nhớ (Mainboard and Memory) */ Mainboard (MotherBoard, System Board). Bảng mạch chính (MainBoard) hay còn gọi bảng mạch mẹ (MotherBoard) chứa các IC quan trọng nhất của hệ thống máy tính cá nhân bao gồm: CPU, RAM, ROM và một số IC và các mạch phụ trợ khác như khe cắm cho các vĩ mạch điều khiển ổ đĩa cứng, ổ đĩa mềm, modem, âm thanh, video 25
  25. Chương 1: Các khái niệm cơ bản Trong đó các thành phần của Mainboard: - Khe cắm RAM (RAM Slot): SIMMs RAM Slot: Khe cắm màu trắng có 30, 72 chân. Loại RAM này không còn trên thị trường. Khả năng nâng cấp dung lượng bộ nhớ tuỳ thuộc vào từng loại MAIN. Thườ ng tối đa là (4 khe x 16 MB) DIMMs RAM Slot: Khe cắm màu đen có 168 chân. Kh ả năng nâng cấp bộ nhớ tuỳ thuộc vào từng loại Mainboard khác nhau (số lượng khe cắm) và dung lượng tối đa thườ ng khoảng 1GB. - Khe cắm mở rộng : + ISA (Industrial Standard Architecture): 26
  26. Chương 1: Các khái niệm cơ bản Độ rộng đường truyền 16 bits, sử dụng cho các loại thiết bị tốc độ chậm như các loại thẻ mạch (Card) màn hình, sound, modem 38k Hiện nay các loại Mainboard mới theo tiêu chuẩn PC 99 các loại khe cắm này đã bị loại bỏ. Rất ít các loại Mainboard hỗ trợ cho loại khe cắm này. + VESA Local Bus: Bị loại bỏ hoàn toàn vì thiết kế cồng kềnh. + PCI (Peripheral Component Interconnect): Độ rộng đường truyền 32 bits. Hiên đang thông dụng trên thị trường. Sử dụng cho các thiết bị tốc độ nhanh. + AGP (Accelerate Graphic Port): Độ rộng đường truyền 64 bits. Sử dụng cho các loại thẻ mạch màn hình hỗ trợ đồ hoạ 3 chiều Khe cắm AGP + Chipset Mỗi hãng sản xuất đều đưa ra một loại Main với bộ chipset riêng. Chipsets quyết định khả năng tích hợp, nâng cấp các thiết bị như CPU, RAM. Thẻ mạch mở rộng. Các khả năng này được mô tả chi tiết trong sách hướng dẫn của nhà sản xuất đi kèm theo Mainboard. Các loại Chipset thông dụng là: VIA, INTEL, SIS . + Chân kết nối bộ nhớ ngoài + Chân kết nối ổ đĩa mềm: 27
  27. Chương 1: Các khái niệm cơ bản 1 bộ chân tích hợp trên thẻ mạch vào ra (I/O Card Đối với các hệ thống cũ), tích hợp trên Main (Đối với các hệ thống mới). 34 chân/bộ cho phép tích hợp 2 ổ đĩa mềm đồng thời. + Chân kết nối ổ đĩa cứng: Tích hợp trên thẻ mạch vào ra ( I/O Card ) trên các hệ thống máy cũ. Trên các hệ thống máy mới, các bộ kết nối này được gọi là IDE/ EIDE. 40 chân/ bộ cho phép kết nối tối đa 4 ổ đĩa cứng/ CD ROM. + Chân kết nối các cổng vào ra: . Cổng bàn phím: kết nối bàn phím DIN 5 (AT), MiniDIN 6 (ATX) . Cổng truyền thông, tuần tự (COM): gồm 2 cổng COM 9 chân được sử dụng cho việc kết nối chuột và Modem. . Cổng song song (LPT, PRN): dành cho kết nối máy in. . Cổng đa năng (USB): dành cho kết nối các loại thiết bị hỗ trợ kiểu kết nối này. . Cổng chuột PS2: Dành riêng cho chuột PS2. + Chân kết nối bộ nguồn: 12 chân dành cho chuẩn AT, 20 chân dành cho chuẩn ATX. - BIOS, CMOS RAM và Pin CMOS: Thường đi kèm theo main. Là thiết bị lưu trữ bộ lệnh khởi động và điều khiển ngắt cứng của hệ thống. Khả năng nâng cấp tuỳ thuộc vào từng loại có thể bằng phần cứng (Thay chip BIOS) hoặc bằng phần mềm (FLASH BIOS). + Cầu nối (Jumper). 28
  28. Chương 1: Các khái niệm cơ bản Dành cho người sử dụng để nâng cấp hệ thống. Xác định điện áp, tốc độ cho CPU, RAM, cấp nguồn cho CMOS RAM và một số công dụng khác. Thường có hướng dẫn chi tiết đi kèm theo sách hướng dẫn Mainboard. + Tốc độ BUS (BUS Speed): Tần số xung điện trên Main sẽ quyết định tính tương thích cho các loại thiết bị, tốc độ truyền dữ liệu. Tốc độ xung cơ bản của Mainboard thường là: 50MHz, 60Mhz, 66 MHz, 75 MHz(Cyrix), 83 MHz, 100 MHz, 133 MHz, 150 MHz, 200 MHz (AMD K7),400 MHz, 800 MHz. Một số loại Main thông dụng trên thị trường : INTEL: Sử dụng chipsets Intel. GIGABYTE: Sử dụng chipset Intel và VIA. MSI: Sử dụng chipset Intel và VIA. TOMATO: Phần lớn sử dụng chipset VIA */ Bộ nhớ (Memory) Bộ nhớ là thiết bị lưu trữ thông tin trong quá trình máy tính xử lý. Bộ nhớ bao gồm bộ nhớ trong và bộ nhớ ngoài. - Bộ nhớ trong gồm ROM và RAM : + ROM (Read Only Memory) là bộ nhớ chỉ đọc. Thực chất đây là một Chip IC có khả năng nhớ dữ liệu. Có hai loại ROM chính: ROM và EPROM. Đối với ROM, chương trình được các nhà sản xuất ghi vào Chip và không xoá được; còn đối với EPROM thì chương trình đã ghi vào rồi vẫn có thể dùng một thiết bị đặc biệt để ghi hoặc xoá được với các chế độ điện áp và truy nhập khác nhau. Về phía người dùng, chương trình đã ghi trong ROM thì chỉ có thể đọc ra để dùng cho nên nó thường được gọi là bộ nhớ chỉ đọc. Xét trên một góc độ khác, ROM là một linh kiện IC thuộc phần cứng nhưng nó lại được ghi chương trình điều khiển trong đó nên nó lại có thể được coi là phần mềm. Và trên quan điểm đó, các nhà tin học đã xếp ROM vào loại trung gian và gọi là phần sụn (hay phần nhão)! Trong máy tính, ROM đóng vai trò gì? Khi truy nhập máy tính có khá nhiều thủ tục và chương trình cơ sở cần phải thi hành. Có thể ví CPU là ông chủ thì ROM như là một người thư ký. Mỗi khi máy tính bắt đầu hoạt động (khởi động hệ thống) sẽ có một số động tác cần phải thực thi đầu tiên gọi là POST (Power On Self Test) để kiểm tra các cấu hình chính của hệ thống như RAM, ổ đĩa, bàn phím có hoạt động bình thường không? Để làm những công việc thường xuyên đó, các nhà thiết kế máy tính đã viết những chương trình thực hiện các thủ tục kiểm tra này. Sau đó sẽ ghi vào ROM và mỗi khi khởi động máy, chương trình đó được thực hiện tức thì. Một số chương trình khác theo logic thiết kế cũng được ghi vào ROM. + RAM (Random Access Memory) được gọi là bộ nhớ truy cập ngẫu nhiên. Nó cũng bao gồm các linh kiện IC có khả năng nhớ tạm các chương trình được tải xuống trong quá trình hoạt động của máy tính. Điểm khác biệt về mặt nguyên tắc giữa RAM và ROM là: ROM ghi nhớ các 29
  29. Chương 1: Các khái niệm cơ bản chương trình cố định, không thay đổi còn RAM thì nhớ tạm các chương trình, có thể đọc, ghi đè lên từng phần đã được tải xuống và khi mất điện hoặc tắt máy, các chương trình đó sẽ bị mất. Nếu chúng ta ví ROM như người thư ký, thì có thể ví RAM như bàn làm việc của “ông trung tâm” CPU. Mỗi khi có một chương trình cần chạy, chương trình đó được nạp vào RAM và sẽ được CPU lấy ra để xử lý. Một chương trình nào đó có thể được nạp vào cư trú ở vùng khác hoặc cũng có thể bị ghi đè lên. Với vai trò như vậy, RAM cần được tăng dung lượng nhớ để có thể nạp nhiều chương trình. Trong các máy vi tính hiện nay khá phổ biến là 64/128/256 MB RAM tuỳ nhu cầu người sử dụng. RAM được đóng thành mảng, mỗi mảng có thể 2, 4, 8, 16, 64, 128 MB nhớ. Trong bảng mạch chính có một số khe cắm (slot) để cắm thêm RAM. Cùng với tốc độ của CPU, dung lượng RAM càng lớn càng tăng tốc độ xử lý của hệ thống máy tính. - Bộ nhớ ngoài: như đĩa từ, băng từ Ðể lưu trữ thông tin và có thể chuyển các tin này qua máy tính khác, người ta sử dụng các đĩa, băng từ như là các bộ nhớ ngoài. Các bộ nhớ này có dung lượng chứa lớn, không bị mất đi khi không có nguồn điện. Trên các máy vi tính phổ biến hiện nay có các loại đĩa từ sau: + Ðĩa cứng (hard disk): có nhiều loại dung lượng từ vài trăm MB đến vài chục GB, hiện nay đã có đĩa cứng hơn 80 GB. + Ðĩa mềm (floppy disk): phổ biến có 2 loại đĩa có đường kính 5.25 inches (dung lượng 360 KB hoặc 1.2 MB) và loại 3.5 inches (dung lượng 720 KB hoặc 1.44 MB) Ðĩa máy tính loại 3.5 in và 5.25 in. + Ðĩa quang (Compact disk): loại 4.72 inches có dung lượng vào khoảng 600 MB. Ðĩa quang thường chỉ được đọc và không ghi được (CD-ROM) là thiết bị phổ biến với các phần mềm phong phú mang nhiều thông tin, hình ảnh, âm thanh không thể thiếu được trong các phương tiện đa truyền thông (multimedia). Tốc độ quay của đĩa mềm 5.25 in. khoảng 300 vòng/phút, đĩa 3.5 in. khoảng 600 vòng/phút. Tốc độ quay của đĩa cứng rất cao thường đạt trên 3600 vòng/phút. Vì vậy, thông tin chứa trên đĩa cứng sẽ được truy cập nhanh hơn trên đĩa mềm rất nhiều. 30
  30. Chương 1: Các khái niệm cơ bản Hiện nay trên thị trường còn có loại đĩa nén, có kích thước như loại đĩa 1.44 MB, nhưng có dung lượng đến 100 MB và dễ dàng mang đi các nơi. c/ Các thiết bị vào/ra và lưu trữ dữ liệu Các thiết bị vào ra Các thiết bị nhập thông tin đầu vào bao gồm : - Bàn phím (Keyboard): là thiết bị nhập dữ liệu và câu lệnh, bàn phím máy vi tính phổ biến hiện nay là một bảng chứa 104 phím có các tác dụng khác nhau. Có thể chia làm 3 nhóm phím chính: Bàn phím + Nhóm phím đánh máy: gồm các phím chữ, phím số và phím các ký tự đặc biệt (~, !, @, #, $, %, ^,&, ?, ). + Nhóm phím chức năng (function key): gồm các phím từ F1 đến F12 và các phím khác như ←↑→↓(phím di chuyển từng điểm), phím PgUp (lên trang màn hình), PgDn (xuống trang màn hình), Insert (chèn), Delete (xóa), Home (về đầu), End (về cuối), + Nhóm phím đệm số (numeric keypad) như NumLock (cho các ký tự số), CapsLock (tạo các chữ in), ScrollLock (chế độ cuộn màn hình) thể hiện ở các đèn chỉ thị. Ngoài 3 phím có đèn chỉ thị trên ta còn các nút điều khiển sau: + Phím Shift: kèm với các phím chữ sẽ tạo ra chữ in hoa hoặc thường, đổi phím số thành các ký hiệu tương ứng trên nó. + Phím ←BackSpace: lùi điểm nháy đồng thời xóa ký tự đứng trước nó. + Phím Enter: nút thi hành lệnh hoặc xuống hàng. + Phím Space: thanh dài nhất, tạo ký tự rỗng. + Phím PrintScreen: nút in nội dung màn hình ra giấy. + Phím Pause: dừng thi hành chương trình. 31
  31. Chương 1: Các khái niệm cơ bản + Phím Ctrl (Control) và Alt (Alternate): là phím dùng để phối hợp các phím khác tùy chương trình sử dụng. + Phím Esc (Escape): phím thoát, được dùng khi có chỉ định rõ. + Phím Tab: phím nhảy cách, thường 8 khoảng (khoảng nhảy có thể khác đi tùy chương trình hay người sử dụng định). - Con chuột (Mouse): là thiết bị cần thiết phổ biến hiện nay, nhất là các máy tính chạy trong môi trường Windows. Con chuột có kích thước vừa nắm tay di chuyển trên một tấm phẳng (mouse pad) theo hướng nào thì dấu nháy hoặc mũi tên trên màn hình sẽ di chuyển theo hướng đó tương ứng với vị trí của của viên bi hoặc tia sáng (optical mouse) nằm dưới bụng của nó. Một số máy tính có con chuột được gắn trên bàn phím. Con chuột - Máy quét (scanner): là thiết bị dùng để nhập văn bản hay hình vẽ, hình chụp vào máy tính. Thông tin nguyên thủy trên giấy sẽ được quét thành các tín hiệu số tạo thành các tập tin ảnh (image file). Scanner đi kèm với phần mềm để nhận diện các tập tin ảnh hoặc văn bản. Máy quét Scanner - Digitizer: dùng để nhập dữ liệu đồ họa theo tọa độ X-Y vào máy tính, thường được dùng trong vẽ bản đồ. - Bút quang (Light pen): dùng nhập điểm bằng cách chấm lên màn hình. - Touch screen: màn hình đặc biệt có thể dùng ngón tay để chạm lên các điểm. Các thiết bị xuất thông tin đầu ra bao gồm: - Màn hình (Screen hay Monitor): là thiết bị xuất chuẩn, dùng để hiện thị thông tin cho người sử dụng xem.Thông tin được hiện thị ra màn hình bằng phương pháp ánh xạ bộ nhớ (memory mapping), với cách này màn hình chỉ việc đọc liên tục bộ nhớ và hiển thị (display) bất 32
  32. Chương 1: Các khái niệm cơ bản kỳ thông tin nào hiện có trong vùng nhớ ra màn hình. Vì vậy để xuất thông tin ra màn hình ta chỉ cần xuất ra vùng nhớ tương ứng. Màn hình Có 2 chế độ hiển thị màn hình: + Trong chế độ văn bản, màn hình thể hiện 80 cột ký tự (đánh số từ 0 - 79) và 25 dòng (đánh số từ 0 - 24). + Trong chế độ đồ họa, màn hình được chia thành các phần tử ảnh (pixel: picture element). Ðộ phân giải màn hình được xác định bằng tích số kích thước chiều ngang và chiều cao tính theo phần tử ảnh. Tích số này càng lớn thì màn hình càng mịn, rõ nét. Màn hình phổ biến hiện nay trên thị trường là màn hình màu SVGA và LCD. Loại màn hình màu Ðộ phân giải (pixel) CCA : Color Graphics Adapter 320 x 200 EGA : Enhanced Graphics Adapter 640 x 350 VGA : Video Graphics Array 640 x 480 SVGA : Super VGA 1020 x 768 - Máy in (printer): là thiết bị xuất để đưa thông tin ra giấy. Máy in phổ biến hiện nay là loại máy in ma trận điểm (dot matrix) loại 9 kim và 24 kim, máy in phun mực, máy in laser trắng đen hoặc màu. Giấy in thường dùng là loại giấy in 80 cột (in được 80 ký tự, in nén được 132 ký tự) và loại giấy in khổ rộng in được 132 cột (in 132 ký tự, in nén 256 ký tự). Cả 2 loại giấy in đều có khả năng in 66 dòng/trang. Máy in - Máy vẽ (plotter): loại máy đặc biệt dùng các bút màu để vẽ đồ họa, chữ - Ðĩa từ, băng từ (diskette, tape) : dùng để chứa thông tin xuất 33
  33. Chương 1: Các khái niệm cơ bản 1.2.3.2. Phần mềm máy tính Phần mềm là tên gọi khi nói tới các chương trình chỉ thị máy tính hoạt động xử lý dữ liệu thành những hình thái mà ta mong muốn. Chương trình là một chuỗi các chỉ thị lệnh có liên quan nhằm thực hiện từng bước tại mỗi thời điểm để hoàn thành một vài công việc nào đó dưới sự điều khiển của CPU. Các chương trình sẽ xác định việc các máy tính tiếp nhận đầu vào như thế nào và được hiển thị hoặc đưa tới đầu ra cái gì. Thông thường có 3 kiểu chương trình là : phần mềm hệ thống, trình dịch ngôn ngữ và các chương trình ứng dụng. a/ Phần mềm hệ thống: Phần mềm hệ thống là một thuật ngữ bao gồm tất cả các chương trình quản lý và điều khiển quá trình hoạt động của phần cứng máy tính. Nó có 2 loại chính - đó là: - Phần mềm hệ điều hành. - Các chương trình tiện ích. */ Hệ điều hành: Hệ điều hành là một phần mềm điều khiển quá trình hoạt động của máy tính từ khi khởi tạo hệ thống, nó được coi như là một yếu tố liên kết giữa phần cứng và phần mềm máy tính. Hệ điều hành bao gồm các chương trình quản lý điều khiển truyền thông giữa các bộ phận của phần cứng như card màn hình, card âm thanh, máy in, bảng mạch chính và các ứng dụng. Nó điều khiển tất cả đầu vào, đầu ra từ các thiết bị ngoại vi cũng như sự hoạt động của các chương trình khác. Nó cho phép người sử dụng làm việc và quản lý các tệp tin mà không cần biết cụ thể dữ liệu được lưu trữ và lấy ra trong các hệ thống đa người dùng; ngoài ra hệ điều hành còn quản lý người dùng truy nhập tới bộ xử lý, các thiết bị ngoại vi và lịch trình công tác. Các chức năng của hệ điều hành: - Định vị các tài nguyên hệ thống: điều khiển sự vận chuyển bên trong máy tính, có tác dụng quyết định đến tài nguyên nào sẽ được sử dụng và trong thời gian bao lâu. - Thời gian : định thời trong CPU được phân chia thành các khoảng thời gian có đơn vị tính là ms. Đối với mỗi tác vụ được thực thi, CPU sẽ ấn định đích xác một khoảng thời gian nhất định cho nó. Khi thời gian kết thúc, các tác vụ khác sẽ được đưa vào để tiếp tục quay vòng. - Bộ nhớ : bộ nhớ máy tính cũng được quản lý bởi hệ điều hành. Chúng được CPU sử dụng luân phiên để rời chuyển dữ liệu thông qua các bộ nhớ đệm. Chẳng hạn, các khoảng không gian của đĩa cứng cũng được coi như là một phần của bộ nhớ chính. Điều đó có nghĩa là, việc đưa dữ liệu thẳng từ đĩa cứng lên bộ nhớ chính mỗi khi CPU yêu cầu sẽ rất chậm trong khi dữ liệu đó phải thường xuyên cập nhật lên bộ nhớ. Vì vậy khi bộ nhớ chính bị đầy, một vài dữ liệu sẽ được phân trang đưa ra ngoài đĩa cứng và nó được gọi là vùng nhớ trao đổi (swapping). Trong hệ điều hành Windows, việc sử dụng tệp tin swap cũng chính là cho mục đích này. - Quản lý vào/ra (input/output) : điều khiển luồng lưu lượng cũng là một phần khả năng đáp ứng của hệ điều hành. Hệ điều hành phải quản lý tất cả các yêu cầu như đọc dữ liệu từ ổ đĩa và băng từ hay ghi dữ liệu vào chúng hoặc đưa ra máy in. - Giám sát hoạt động hệ thống : hệ điều hành thực hiện 2 công việc giám sát chủ yếu là thi hành hệ thống và bảo mật hệ thống. Thi hành hệ thống đưa ra các thông tin như tên các tác vụ 34
  34. Chương 1: Các khái niệm cơ bản đang thi hành trên hệ thống, thời gian chiếm giữ CPU, bộ nhớ hay người quản trị hệ thống cũng có thể theo dõi, kiểm tra xem các máy tính trên mạng có bị quá tải không để có những can thiệp kịp thời. Vấn đề bảo mật hệ thống khá quan trọng, đặc biệt khi sử dụng cho chế độ đa người dùng. Khi người sử dụng muốn truy nhập vào hệ thống cần phải thực hiện thủ tục đăng nhập user và mật khẩu (gọi là ID). - Quản lý tệp tin và ổ đĩa: việc lưu trữ và bảo vệ các tệp tin trên thiết bị ổ đĩa, băng từ là một công việc chính, quan trọng trong mỗi hệ điều hành. Hiện nay, hầu hết các hệ điều hành đều sử dụng các hệ thống tệp tin như FAT, NFS. Ngoài việc quản lý các thiết bị nhớ vật lý như FDD, HDD, CDROM, hệ điều hành còn quản lý các bộ nhớ ảo (virtual memory) được tạo ra trên cơ sở phần còn rỗi (free) của các thiết bị nhớ kể trên. Các hệ điều hành cơ bản : - Microsoft Windows: Windows 95, Windows 98, Windows Me (Millennium Edition), Windows NT (NT là viết tắt của New Technology), Windows CE và Windows 2000/NT, - Apple Macintosh. - OS/2 của hãng IBM. - UNIX : SCO Unix, SUN Solaris, AIX (IBM) - LINUX được phát triển bởi Linus Torvalds tại University of Finland */ Các chương trình tiện ích: Các chương trình tiện ích thực hiện các công việc có liên quan đến bảo trì máy tính như phần cứng và dữ liệu. Các hệ điều hành hiện nay, hầu hết đều xây dựng phần mềm các chương trình tiện ích như : - Chương trình quản lý tệp tin: Tạo ra cho người dùng dễ dàng quản lý các tệp tin của mình như : viết các chương trình trợ giúp tìm kiếm tệp tin, tạo ra và tổ chức các thư mục, sao chép, chuyển đổi tên tệp tin. - Chương trình quản lý đĩa: Bao hàm cả định dạng và chống phân mảnh các đĩa. Chương trình chống phân mảnh thực hiện sắp xếp lại vị trí các tệp tin trên đĩa theo một dãy liên tục. Một số chương trình quản lý đĩa còn định rõ sắp đặt cho bạn khi có tệp tin thường xuyên được truy cập. Ngoài ra, có những hệ điều hành còn có thêm một số chức năng mới như cho phép chuyển đổi kiểu hệ thống tệp tin từ FAT32 sang NTFS và ngược lại - Phần mềm quản lý bộ nhớ: Thực hiện điều khiển bộ nhớ khi các dữ liệu hiện thời được đưa lên RAM. Chúng chuyển dịch các đối tượng nội trú bộ nhớ nào đó ra ngoài và điều này có thể làm tăng hiệu quả sử dụng bộ nhớ. - Chương trình sao lưu (Backup) dữ liệu: Cho phép người sử dụng có thể phục hồi lại dữ liệu khi cần thiết. - Chương trình nén dữ liệu: Cho phép người sử dụng thông qua các phần mềm nén dữ liệu trước khi lưu trữ nhằm tiết kiệm không gian nhớ của đĩa. - Chương trình phòng chống Virus: Là các phần mềm khác nhau được cài đặt vào bộ nhớ máy tính nhằm giám sát sự hoạt động của virus trong máy tính và mạng. Nó có nhiệm vụ phát 35
  35. Chương 1: Các khái niệm cơ bản hiện sự hoạt động của virus trong bộ nhớ máy tính và thực hiện “làm sạch” chúng. Hiện nay các phiên bản phần mềm phòng chống virus hữu hiệu được sử dụng rộng rãi như Norton AntiVirus, D2, Bkav2000, b/ Trình dịch và ngôn ngữ: Trong quá trình hoạt động của các thế hệ máy tính điện tử, tất cả các chỉ thị lệnh được hoạt hóa bởi máy tính đều phải cung cấp tới CPU dưới dạng mã máy (machine code). Tuy nhiên, con người không phải tương tác với máy tính tại mức này mà các nhà lập trình có thể viết phần mềm bằng ngôn ngữ Assembler cho phép can thiệp trực tiếp tới các thanh ghi của CPU. Hiện nay, hầu hết các chương trình được viết trên cơ sở các tiêu chuẩn ngôn ngữ bậc cao như Pascal, Basic, C, Trình dịch là một chương trình được thiết kế nhằm chuyển hóa một chương trình được viết bởi ngôn bậc cao thành các chỉ thị lệnh máy của hệ thống tính toán riêng biệt. Đầu ra của một trình dịch C cho máy tính IBM hầu như không có gì chung với đầu ra của một trình dịch C cho máy chủ VAX. Mặc dù các ngôn ngữ bậc cao được dùng chung để phát triển các gói ứng dụng như GIS, nó thường được dịch cho các nền (platform) riêng biệt trước khi phân phối tới người dùng. c/ Phần mềm ứng dụng: Các phần mềm ứng dụng thông dụng hiện nay ngày càng phong phú và đa dạng. Nó bao gồm những chương trình được viết ra phục vụ cho một hay nhiều mục đích cụ thể như ứng dụng văn phòng, tính toán, phân tích dữ liệu, tổ chức hệ thống, bảo mật thông tin, xử lý đồ họa, trò chơi điện tử, dịch vụ thông tin mạng, 1.2.4. Lịch sử phát triển của hệ thống máy tính Do nhu cầu cần tăng độ chính xác và giảm thời gian tính toán, con người đã quan tâm chế tạo các công cụ tính toán từ xưa: bàn tính tay của người Trung quốc, máy cộng cơ học của nhà toán học Pháp Blaise Pascal (1623 - 1662), máy tính cơ học có thể cộng trừ nhân chia của nhà toán học Ðức Gottfried Wilhelmvon Leibniz (1646 - 1716), máy sai phân để tính các đa thức toán học, máy phân giải điều khiển bằng phiếu đục lỗ của Charles Babbage (1792 - 1871) Tuy nhiên, máy tính điện tử thực sự hình thành bắt đầu vào thập niên 1950 và đến nay đã trải qua 5 thế hệ được phân loại theo sự tiến bộ về công nghệ điện tử và vi điện tử cũng như các cải tiến về nguyên lý, tính năng và loại hình của nó. * Thế hệ 1 (1950 - 1958): Máy tính sử dụng các bóng đèn điện tử chân không, mạch riêng rẽ, vào số liệu bằng phiếu đục lỗ, điều khiển bằng tay. Máy có kích thước rất lớn, tiêu thụ năng lượng nhiều, tốc độ tính chậm khoảng 300 - 3.000 phép tính mỗi giây. Loại máy tính điển hình thế hệ 1 như EDVAC (Mỹ) hay BESM (Liên xô cũ), * Thế hệ 2 (1958 - 1964): Máy tính dùng bộ xử lý bằng đèn bán dẫn, mạch in. Máy đã có chương trình dịch như Cobol, Fortran và hệ điều hành đơn giản. Kích thước máy còn lớn, tốc độ tính khoảng 10.000 đến 100.000 phép/s. Ðiển hình như loại IBM-1070 (Mỹ) hay MINSK (Liên Xô cũ), 36
  36. Chương 1: Các khái niệm cơ bản * Thế hệ 3 (1965 - 1974): Máy tính được gắn các bộ xử lý bằng vi mạch điện tử cỡ nhỏ có thể có được tốc độ tính khoảng 100.000 đến 1 triệu phép/s. Máy đã có các hệ điều hành đa chương trình, nhiều người dùng đồng thời hoặc theo kiểu chia thời gian. Kết quả từ máy tính có thể in ra trực tiếp ở máy in. Ðiển hình như loại IBM 360 (Mỹ) hay EC (Liên Xô cũ), * Thế hệ 4 (1974 đến nay): Máy tính bắt đầu có các vi mạch đa xử lý có tốc độ tính hàng chục triệu đến hàng tỷ phép/giây. Giai đoạn này hình thành 2 loại máy tính chính : máy tính cá nhân để bàn (Personal Computer - PC) hoặc xách tay (Laptop hoặc Notebook computer) và các loại máy tính chuyên nghiệp thực hiện đa chương trình, đa vi xử lý hình thành các hệ thống mạng máy tính (Computer Networks), và các ứng dụng phong phú đa phương tiện. * Thế hệ 5 (1990 - nay): Bắt đầu có các nghiên cứu tạo ra các máy tính mô phỏng các hoạt động của não bộ và hành vi con người, có trí khôn nhân tạo với khả năng tự suy diễn phát triển các tình huống nhận được và những hệ quản lý kiến thức cơ sở để giải quyết các bài toán đa dạng. 1.3. THUẬT TOÁN VÀ SƠ ĐỒ KHỐI Muốn giải một bài toán trên máy tính điện tử người ta cần một chương trình hay phần mềm hướng dẫn máy tính thực hiện các thao tác cần thiết. Trước khi giới thiệu phần mềm ta cần hiểu các bước để giải một bài toán trên máy tính. a/ Các giai đoạn giải một bài toán trên máy tính điện tử Ðể giải quyết một bài toán trên máy tính điện tử, cần qua các giai đoạn: · Tìm hiểu mục tiêu chính của bài toán: số liệu nhập và kết quả xuất. · Xây dựng một chuỗi thao tác tính toán theo tuần tự, gọi là thuật giải. · Lập chương trình diễn tả chi tiết các bước tính theo thuật giải · Nhập chương trình vào máy tính, thông dịch và chạy thử để sửa chữa lỗi · Thực hiện giải bài toán với số liệu thu thập được và ghi nhận kết quả · Thử nghiệm với nhiều trường hợp khác nhau của bài toán · Phân tích kết quả và hoàn chỉnh chương trình Trong các bước trên, việc thiết kế thuật toán là giai đoạn quan trọng nhất. b/ Thuật toán (algorithm) Ðịnh nghĩa: Thuật toán là một phương pháp trình bày các bước giải quyết một hay nhiều bài toán theo một tiến trình xác định. Thuật toán có các đặc tính sau: - Tính xác định: Các thao tác của thuật toán là rõ ràng và chắc chắn thực hiện được để dẫn đến kết quả nào đó. - Tính hữu hạn và dừng: thuật toán phải có một số bước giải nhất định và cuối cùng phải có kết thúc ở điểm dừng. - Tính kết quả: Với dữ liệu hợp lý, thuật toán phải cho kết quả thỏa yêu cầu. - Tính phổ dụng: Thuật toán phải giải được nhiều bài toán có cùng cấu trúc với các dữ liệu khác nhau và đều dẫn đến một kết quả mong muốn. 37
  37. Chương 1: Các khái niệm cơ bản - Tính hiệu quả: Thuật giải phải đơn giản, dể hiểu trong các bước giải, tối thiểu hoá bộ nhớ và thời gian thực hiện. -Tính hình thức: Các bước trong thuật toán là máy móc, nghĩa là nó phải thực hiện đúng như quy định mà không cần biết đến mục tiêu cuối cùng. Thuật toán có thể diễn giải một cách trực quan bằng lưu đồ (flowchart). Lưu đồ được sử dụng thông dụng trong việc trình bày các bước cần thiết để giải quyết vấn đề qua các hình khối khác nhau và dòng dữ liệu giữa các bước được chỉ định đi theo các đường mũi tên. Một số qui ước ký hiệu lưu đồ: Ký hiệu Mô tả Điểm bắt đầu và kết thúc một thuật toán Thao tác nhập hay xuất dữ liệu Khối xử lý công việc Khối quyết định chọn lựa Điểm nối Chuẩn bị Tập hợp các tập tin dữ liệu Khối chương trình con Các ghi chú, giải thích Dòng tính toán, thao tác của chương trình Ví dụ: Thuật toán giải phương trình bậc nhất: ax + b = 0, ta đi qua các bước: - Bước 1: Nhập vào 2 hệ số a và b. - Bước 2: Xét điều kiện a = 0 ? Nếu đúng là a = 0, thì đi đến bước 3. Nếu không, nghĩa là a ≠ 0, thì đi đến bước 4. - Bước 3: Xét điều kiện b = 0 ? Nếu b = 0, thì báo phương trình có vô số nghiệm. Ði đến bước 5. 38
  38. Chương 1: Các khái niệm cơ bản Nếu b ≠ 0, thông báo phương trình vô nghiệm. Ði đến bước 5. - Bước 4: Thông báo phương trình có một nghiệm duy nhất là x = - b/a. - Bước 5: Ngưng dứt thuật toán Ví dụ: Với bài toán như trong ví dụ 2.1, ta có thể trình bày với lưu đồ sau: Bắt đầu Nhập a, b Sai x = -b/a a = 0 ? Đúng Sai b = 0 ? Phương trình vô nghiệm Đúng Phương trình vô số nghiệm Ngưng 1.4. MẠNG MÁY TÍNH (COMPUTER NETWORK) 1.4.1. Giới thiệu mô hình tham chiếu OSI Hệ thống A Hệ thống B 7 Application Giao thức tầng Ứng dụng 6 Presentation Trình diễn 5 4 Session Phiên 3 Transport Giao vận 2 Network Mạng 1 Data Link Liên kết dữ liệu Physical Vật lý 39
  39. Chương 1: Các khái niệm cơ bản Mô hình OSI (Open Systems Interconnection) là một cơ sở cho việc chuẩn hóa các hệ thống truyền thông, nó được nghiên cứu và xây dựng vào năm 1971 bởi Tổ chức tiêu chuẩn Quốc tế ISO (International Standards Organization). Mục tiêu chính của mô hình OSI là nhằm tới việc kết nối giữa các sản phẩm của các hãng sản xuất khác nhau và phối hợp các hoạt động chuẩn hóa trong các lĩnh vực viễn thông và hệ thống thông tin. Theo mô hình OSI, chương trình truyền thông được chia thành 7 tầng chức năng khác nhau. Hai tầng đồng mức khi liên kết với nhau phải sử dụng một giao thức chung. Trong mô hình OSI có hai loại giao thức chính được áp dụng: giao thức có liên kết (connection-oriented) và giao thức không liên kết (connectionless) - Giao thức có liên kết: trước khi truyền dữ liệu hai tầng đồng mức cần thiết lập một liên kết logic và các gói tin được trao đổi thông qua liên kết này; việc có liên kết logic sẽ nâng cao độ an toàn trong truyền dữ liệu. - Giao thức không liên kết: Trước khi truyền dữ liệu không thiết lập liên kết logic và mỗi gói tin được truyền độc lập với các gói tin trước hoặc sau nó. Chức năng của các tầng trong mô hình OSI : • Tầng ứng dụng (Application layer): Tầng ứng dụng qui định giao diện giữa người sử dụng và môi trường OSI, nó cung cấp các phương tiện cho người sử dụng truy cập và sử dụng các dịch vụ của mô hình OSI. • Tầng trình bày (Presentation layer): Tầng trình bày chuyển đổi các thông tin từ cú pháp người sử dụng sang cú pháp để truyền dữ liệu. Ngoài ra nó còn có thể nén dữ liệu truyền và mã hóa chúng trước khi truyền để đảm bảo tính báo mật cho dữ liệu. • Tầng phiên (Session layer): Tầng phiên qui định một giao diện ứng dụng cho tầng vận chuyển sử dụng. Nó xác lập ánh xạ giữa các tên đặt địa chỉ, tạo ra các tiếp xúc ban đầu giữa các máy tính khác nhau trên cơ sở các phiên truyền thông. Nó đặt tên nhất quán cho mọi thành phần muốn đối thoại riêng với nhau. • Tầng vận chuyển (Transport layer): Tầng vận chuyển xác định địa chỉ trên mạng, cách thức chuyển giao gói tin trên cơ sở trực tiếp giữa hai điểm (end-to-end). Để đảm bảo được việc truyền ổn định trên mạng tầng vận chuyển thường đánh số các gói tin và đảm bảo chúng chuyển theo thứ tự. • Tầng mạng (Network layer): Tầng mạng có nhiệm vụ xác định việc chuyển hướng, vạch đường các gói tin trong mạng, các gói tin này có thể phải đi qua nhiều chặng trước khi đến được đích cuối cùng. • Tầng liên kết dữ liệu (Data link layer): Tầng liên kết dữ liệu có nhiệm vụ xác định cơ chế truy nhập thông tin trên mạng, các dạng thức chung trong các gói tin, đóng các gói tin, • Tầng vật lý (Physical layer): Tầng vật lý cung cấp phương thức truy cập vào đường truyền vật lý để truyền các dòng Bit không cấu trúc. Ngoài ra, nó cung cấp các chuẩn về điện, dây cáp, đầu nối, kỹ thuật nối mạch điện, điện áp, tốc độ cáp truyền dẫn, giao diện kết nối và các mức kết nối, 40
  40. Chương 1: Các khái niệm cơ bản 1.4.2. Khái niệm về mạng và kết nối mạng Xét ở mức độ đơn giản nhất, mạng (network) bao gồm hai máy tính nối với nhau bằng cáp (cable) sao cho chúng có thể dùng chung dữ liệu. Mọi mạng máy tính dù có phức tạp đến mấy cũng đều bắt nguồn từ hệ thống đơn giản đó. Ý tưởng nối hai máy tính bằng cáp thoạt nghe có vẻ không có gì là phi thường, nhưng nếu nhìn lại, đó chính là một thành tựu lớn lao trong công nghệ truyền thông. Mạng máy tính được phát sinh từ nhu cầu muốn chia sẻ và dùng chung tài nguyên dữ liệu. Máy tính cá nhân là công cụ tuyệt vời giúp ta tạo dữ liệu, bảng tính, hình ảnh và nhiều dạng thông tin khác, nhưng nó lại không cho phép ta thuận tiện chia sẻ dữ liệu ta đã tạo. Khi không có hệ thống mạng, dữ liệu phải được in ra giấy để người khác xem và hiệu chỉnh. Hay một cách tốt hơn là dùng đĩa mềm để sao chép rồi chuyển đến các máy tính khác. Tuy nhiên nếu người khác thay đổi tài liệu thì chúng ta không thể hợp nhất các thay đổi này. Phương thức làm việc kiểu này gọi là làm việc trong môi trường độc lập. Một mạng đơn giản Nếu người dùng làm việc trong môi trường mạng và nối máy tính của mình với các máy tính khác, người này có thể sử dụng dữ liệu trên các máy khác và thậm chí cả máy in. Một nhóm máy tính và những thiết bị ngoại vi kết nối với nhau được gọi là mạng, còn việc đấu nối các máy tính với nhau để sử dụng chung tài nguyên gọi là nối mạng (Networking). Trên thực tế, hiện nay có rất nhiều mạng khác nhau với qui mô phát triển và ứng dụng khác nhau. Để phân biệt được các loại mạng này, ta có nhiều cách phân loại mạng khác nhau tùy thuộc vào yếu tố chính được chọn để làm chỉ tiêu phân loại, chẳng hạn đó là "khoảng cách địa lý", "kỹ thuật chuyển mạch" hay “kiến trúc mạng". */ Phân loại theo khoảng cách địa lý, mạng máy tính gồm có: - Mạng cục bộ (Local Area Networks viết tắt là LAN) là mạng máy tính được tổ chức trong phạm vi nhỏ khoảng vài chục ki lô mét trở lại, ví dụ mạng nội bộ cơ quan, trường học, xí nghiệp, văn phòng - Mạng đô thị (Metropolitan Area Networks viết tắt là MAN) là mạng máy tính được tổ chức trong phạm vi 100 ki lô mét trở lại, ví dụ mạng thành phố, trung tâm kinh tế, khu công nghệ cao 41
  41. Chương 1: Các khái niệm cơ bản - Mạng diện rộng (Wide Area Network viết tắt là WAN) là mạng máy tính được tổ chức trong phạm vi rộng, như mạng quốc gia, liên bang, châu lục . - Mạng toàn cầu (Global Area Network viết tắt là GAN) là mạng máy tính được tổ chức rộng khắp toàn cầu. */ Phân loại theo kỹ thuật chuyển mạch, mạng máy tính gồm có: - Mạng chuyển mạch kênh (Circuit-switched Networks) là mạng thực hiện việc kết nối hai thực thể ở hai đầu theo một kênh cố định trong thời gian truyền tin. - Mạng chuyển mạch thông báo (Message-Switched Networks) thông tin truyền đi theo một khuôn dạng quy định, trong đó được chỉ định đích đến. Căn cứ vào thông tin đích đến các thông báo có thể được truyền qua nhiều con đường khác nhau để đến đích. - Mạng chuyển mạch gói (Packet-Switched Networks) là mạng trong đó thông báo cần gửi đi được chia nhỏ thành các gói (packet) có số lượng bytes cố định. Mỗi gói tin có địa chỉ đích và đánh dấu thứ tự và có thể đi theo nhiều đường khác nhau để tới đích. Khi tới đích, chúng được kết nối lại với nhau theo theo thứ tự đã được đánh số. */ Phân loại theo kiến trúc mạng: Chúng ta thường nghe nói đến mạng SNA của IBM, ISO của ISO hay mạng TCP/IP Trong mạng LAN và thậm chí cả mạng WAN người ta còn phân chia mạng theo TOPO mạng: Mạng hình sao (STAR), mạng hình BUS, mạng hình vòng. Ngoài ra còn một số dạng khác như mạng hình cây (TREE), mạng hình sao vòng, mạng hỗn hợp 1.4.3. Mạng cục bộ (Local Area Network - LAN) Mạng khởi đầu với quy mô rất nhỏ, với khoảng 10 máy tính được nối với nhau và máy in. Công nghệ tin học đã làm hạn chế qui mô phát triển mạng như số lượng máy tính kết nối với nhau, khoảng cách vật lý mà mạng có thể bao phủ. Chẳng hạn, ở những năm đầu thập kỷ 80, phương pháp lắp đặt cáp phổ biến nhất cũng chỉ cho phép chừng 30 người với chiều dài cáp tối đa khoảng 600 fít (xấp xỉ 183m). Mạng cục bộ (LAN - Local Area Network) là một loại mạng máy tính được cài đặt trong phạm vi địa lý tương đối nhỏ, chẳng hạn một toà nhà, trường học, công sở .v.v. Khoảng cách lớn nhất giữa các máy tính trong mạng chỉ khoảng dưới vài chục ki-lô-mét. */ Lợi ích của mạng cục bộ Cũng giống như mạng nói chung, mạng cục bộ có một số lợi ích chính sau: - Chia sẻ thông tin, tài nguyên: Mạng cục bộ cho phép nhiều người dùng truy cập vào CSDL chung, được quản lý tập trung trong các thiết bị lưu trữ. Ví như trong một công ty, các bộ phận khác nhau cùng sở hữu một bộ tài liệu nào đó, và tại bất kì thời điểm nào mạng cũng cho phép chia sẻ bộ tài liệu này . - Truyền dữ liệu với tốc độ cao: Khi không sử dụng mạng cục bộ, người ta sử dụng con người và các dịch vụ thư tín để gửi tài liệu đến các nơi khác nhau. Nhờ có mạng cục bộ mà thư điện tử được truyền qua mạng từ một trạm ở nơi này đến một trạm ở nơi khác. Điều này làm tăng tốc độ truyền thông tin và giảm bớt chi phí công việc. 42
  42. Chương 1: Các khái niệm cơ bản - Giảm chi phí nhờ việc chia sẻ tài nguyên, thiết bị: Chức năng truyền thông tốc độ cao của mạng cục bộ cho phép tất cả các trạm chia sẻ các ổ đĩa (đĩa từ và đĩa quang), máy in, và các thiết bị khác, bởi vậy có thể giảm bớt chi phí. */ Phân loại mạng cục bộ Mạng cục bộ được chia làm 2 loại: - Mạng ngang hàng (Peer-to-Peer). - Mạng dựa trên máy chủ (Server-based). Sự phân biệt giữa 2 loại mạng nói trên là rất quan trọng do mỗi loại có những khả năng khác nhau. Loại mạng bạn sử dụng sẽ phụ thuộc vào một số yếu tố, như là: - Quy mô tổ chức (công ty, văn phòng). - Mức độ bảo mật cần có. - Loại hình công việc. - Mức độ hỗ trợ sẵn có trong công tác quản trị. - Nhu cầu của người dùng mạng. - Ngân sách mạng. (-) Mạng ngang hàng Mạng cục bộ kiểu ngang hàng không có sự phân biệt giữa máy khách và máy chủ. Các máy có mối quan hệ bình đẳng với nhau. Nói cách khác, đó là một mạng cục bộ mà mỗi máy đều có thể là máy khách hoặc máy chủ. Lưu lượng thường không bị tập trung trong hệ thống này. Mạng ngang hàng tương đối đơn giản. Vì mỗi máy tính vừa kiêm các chức năng máy chủ và máy khách, nên không cần có một máy phục vụ trung tâm thật mạnh và cũng không bắt buộc phải có những bộ phận cần thiết cho mạng máy tính công suất cao. Việc xây dựng mạng ngang hàng có thể kinh phí sẽ thấp hơn so với mạng dựa trên máy chủ. Máy chủ / máy khách Các máy tính ở mạng ngang hàng kiêm cả vai trò máy khách và máy chủ (-) Mạng dựa trên máy chủ Mạng cục bộ dựa trên máy chủ bao gồm các máy khách và các máy chủ chuyên dụng. Máy chủ chuyên dụng là máy chỉ hoạt động như một máy chủ chứ không kiêm luôn vai trò máy khách hay trạm làm việc. Các máy khách nhận được các dịch vụ khác nhau do máy chủ cung cấp. 43
  43. Chương 1: Các khái niệm cơ bản Việc truyền thông trong hệ thống này chủ yếu được tiến hành giữa nhiều máy khách và một vài máy chủ, do vậy lưu lượng thông tin sẽ tập trung vào ra các máy chủ rất lớn. Máy khách Máy chủ Mạng dựa trên máy chủ 1.4.4. Cấu trúc liên kết mạng (Topology) Thuật ngữ cấu trúc liên kết (hay còn gọi là Topology) mạng máy tính chỉ sự sắp xếp các trạm cuối được gắn vào mạng. Các cấu trúc liên kết thường dùng là hình sao (star), bus, và vòng (ring). a/ Cấu trúc liên kết hình sao (Star) Mạng hình sao bao gồm một bộ điều khiển trung tâm, mỗi trạm cuối được kết nối vào bộ điều khiển trung tâm này bằng các đường truyền theo dạng hình sao. Trong hình 4.4 ở dưới, mỗi trạm cuối trong mạng hình sao được kết nối tới bộ điều khiển trung tâm (Hub/Switch) bằng một đường truyền riêng biệt (UTP), do đó nó tạo ra dạng hình sao. Bộ điều khiển trung tâm này điều khiển việc truyền thông cho mỗi trạm cuối. Việc truyền thông ở đây bao gồm truyền thông giữa trạm cuối với bộ điều khiển trung tâm hoặc giữa trạm cuối này với trạm cuối khác thông qua bộ điều khiển trung tâm. Bộ điều khiển Trạm cuối Cấu trúc liên kết hình sao b/ Cấu trúc liên kết dạng BUS 44
  44. Chương 1: Các khái niệm cơ bản Mạng dạng BUS bao gồm một đường truyền dữ liệu tốc độ cao duy nhất. Đường truyền này được gọi là bus và được chia sẻ bởi nhiều nút. Bất cứ khi nào muốn truyền dữ liệu, trạm truyền ấn định địa chỉ trạm đích và truyền dữ liệu lên bus. Thông tin được truyền từ bất kì trạm cuối nào đều được gửi tới tất cả các nút. Một nút chỉ nhận dữ liệu khi nó nhận đúng địa chỉ dữ liệu gửi cho nó. Mỗi đầu của BUS được gắn 1 bộ kết cuối (terminator). Bộ kết cuối có tác dụng chặn tín hiệu để tránh tình trạng phản hồi tín hiệu. Vì trong trường hợp có tín hiệu phản hồi, đường truyền sẽ bị nhiễu và sẽ xuất hiện lỗi trong quá trình truyền. Bus (Đường truyền chia sẻ) Trạm nhận Trạm gửi Cấu trúc liên kết hình BUS Chú ý: Đối với Bus một chiều (có nghĩa là tín hiệu chỉ được truyền theo một hướng) thì việc phản hồi tín hiệu là cần thiết. c/ Cấu trúc liên kết dạng vòng (Ring) Mạng có cấu trúc liên kết dạng vòng có hình dạng một vòng tròn khép kín, các nút được nối với vòng tại các điểm cách nhau một khoảng nào đó. Thông tin được truyền trên vòng theo một hướng nhằm tránh xung đột. Do mỗi nút có thể tái tạo và lặp lại tín hiệu nên cấu trúc liên kết kiểu này phù hợp với các mạng có phạm vi rộng hơn so với kiến trúc kiểu bus. Cấu trúc liên kết dạng vòng 45
  45. Chương 1: Các khái niệm cơ bản 1.4.5. Phương tiện truyền dẫn Ngày nay, phần lớn mạng được nối bằng dây dẫn hoặc cáp thuộc loại nào đó, đóng vai trò như phương tiện truyền dẫn giữa các máy tính trong mạng. Rất nhiều loại cáp có thể đáp ứng các yêu cầu và qui mô mạng khác nhau, từ nhỏ đến lớn. Để tránh nhầm lẫn, Belden, một hãng sản xuất cáp hàng đầu, xuất bản một catalog liệt kê hơn 2200 loại cáp. Tuy nhiên chỉ có 3 nhóm cáp chính được dùng để nối hầu hết các mạng. - Cáp đồng trục (coaxial) - Cáp xoắn đôi (twisted-pair) + Cáp xoắn đôi trần (unshielded twisted-pair) + Cáp xoắn đôi có bọc (shielded twisted-pair) - Cáp sợi quang (fiber-optic) a/ Cáp đồng trục Có một thời gian, cáp đồng trục là cáp mạng thông dụng nhất. Sở dĩ cáp đồng trục được sử dụng rộng rãi là do: cáp đồng trục tượng đối rẻ tiền, nhẹ, mềm và dễ kéo dây. Cáp đồng trục phổ biến đến mức nó trở thành phương tiện lắp đặt an toàn và dễ chấp nhận. Ở dạng đơn giản nhất, cáp đồng trục gồm một lõi đồng nguyên chất được bọc chất cách ly, một lớp bảo vệ bằng lưới kim loại và một lớp vỏ bọc ngoài (hình 4.7). Lớp chất cách ly và lớp lưới kim loại được xem là lớp bọc đôi. Tuy nhiên còn có loại cáp bọc 4 lớp dành cho môi trường hay bị nhiễu. Lớp vỏ bọc Chất cách ly Lõi dẫn điện Lưới đồng hay ống nhôm b/ Cáp xoắn đôi Ở dạng đơn giản, cáp xoắn đôi gồm hai sợi dây đồng cách ly cuốn vào nhau. Cáp xoắn đôi có hai loại: cáp xoắn đôi không bọc (UTP) và cáp xoắn đôi có bọc (STP). Một số dây xoắn đôi thường được nhóm chung với nhau và được quấn kín trong vỏ bọc bảo vệ để tạo thành sợi cáp. Số lượng dây xoắn đôi trong các loại cáp là khác nhau. Sự xoắn này làm vô hiệu nhiễu điện từ đây xoắn đôi kế cận và từ những nguồn khác như mô tơ, máy biến thế. 46
  46. Chương 1: Các khái niệm cơ bản c/ Cáp sợi quang Cáp sợi quang gồm một sợi thuỷ tinh cực mảnh, gọi là lõi, được bao bọc bởi một lớp thuỷ tinh đồng tâm gọi là lớp vỏ bọc. Đôi khi các sợi được làm bằng chất dẻo. Chất dẻo dễ lắp đặt hơn nhưng không thể mang xung ánh sáng đi xa như thuỷ tinh. Vỏ bọc thuỷ tinh Lõi (sợi quang) Vỏ bảo vệ ngoài Lõi sợi thuỷ tinh chỉ truyền tín hiệu theo một hướng nhất định, do đó cáp có hai sợi nằm trong vỏ bọc riêng biệt. Một sợi truyền và một sợi nhận. Cáp sợi quang có thể truyền tín hiệu đi xa hơn và với tốc độ cực nhanh (về lý thuyết cáp quang có thể truyền tín hiệu với tốc độ tối đa 200.000Mb/s). 1.4.6. Các thiết bị liên kết mạng Trên thực tế, mỗi chuẩn mạng cục bộ đều có những giới hạn về khoảng cách mạng, về số lượng trạm tối đa trong mạng. Để có thể mở rộng được mạng, cần có các thiết bị để kết nối các đoạn mạng lại với nhau. Các thiết bị liên kết mạng tiêu biểu - đó là: bộ lặp (repeater), HUB, cầu nối (bridge), bộ định tuyến (router) và bộ chuyển mạch LAN (LAN switch). a/ Bộ lặp (repeater) Bộ lặp là thiết bị tầng vật lý được sử dụng để kết nối các đoạn mạng lại với nhau. Bộ lặp cho phép nhiều đoạn mạng có thể hoạt động như một đoạn mạng đơn lẻ. Bộ lặp nhận tín hiệu từ một đoạn mạng, tái tạo và truyền tín hiệu này đến đoạn mạng khác. Nhờ có bộ lặp mà tín hiệu bị suy yếu do phải truyền qua một đoạn cáp dài có thể trở lại dạng ban đầu và truyền đi được xa hơn. Bộ lặp không dịch hoặc lọc bất kỳ tín hiệu nào, nó không có khả năng xử lý lưu lượng. Tất cả các tín hiệu điện, bao gồm cả nhiễu điện từ và các lỗi khác cũng được lặp và khuếch đại. Để bộ lặp hoạt động, cả hai đoạn mạng nối tới bộ lặp phải sử dụng cùng một phương thức truy nhập đường truyền. Ví dụ, bộ lặp không thể nối một đoạn mạng sử dụng phương thức CSMA/CD (Carrier Sense Multiple Access/Collision Detection: Đa truy nhập cảm nhận sóng mang có phát hiện xung đột) và một đoạn mạng sử dụng phương thức chuyển thẻ bài (Token Ring). Bộ lặp 47
  47. Chương 1: Các khái niệm cơ bản Bộ lặp có thể di chuyển gói dữ liệu từ phương tiện truyền dẫn này sang phương tiện truyền dẫn khác. Chẳng hạn, chúng có thể nhận một gói dữ liệu từ một đoạn mạng dùng cáp đồng trục và chuyển gói đó sang đoạn mạng sử dụng b/ HUB Một thiết bị liên kết mạng được sử dụng rất rộng rãi là HUB và việc sử dụng HUB như thành phần trung tâm trong cấu trúc hình sao. HUB */ HUB chủ động Hầu hết các HUB đều là HUB chủ động, chúng tái tạo và truyền lại tín hiệu giống như bộ lặp. HUB thường có nhiều cổng nên thỉnh thong chúng còn được gọi là bộ lặp đa cổng. */ HUB thụ động Các HUB thụ động hoạt động như các điểm kết nối, chúng không tái tạo hoặc khuếch đại tín hiệu. Bảng phối dây là một ví dụ về HUB thụ động. */ HUB lai Các HUB thích ứng với nhiều loại cáp khác nhau được gọi là HUB lai. c/ Cầu nối (bridge) Cầu nối là thiết bị hoạt động ở tầng liên kết dữ liệu. Cũng giống như bộ lặp, cầu nối có thể kết hợp nhiều đoạn mạng hoặc nhóm các mạng LAN khác nhau. Điểm hơn của cầu nối là chúng có thể phân chia mạng nhằm cô lập lưu lượng. Ví dụ, nếu lưu lượng từ một hoặc một nhóm máy tính trở nên quá tải và làm giảm hiệu suất toàn mạng thì cầu nối có thể cô lập máy tính hoặc bộ phận này. Cầu nối được sử dụng để: - Mở rộng khoảng cách của phân đoạn mạng, tăng số lượng máy tính trên mạng. - Làm giảm hiện tượng tắc nghẽn do số lượng máy tính nối vào mạng quá lớn: Cầu nối có thể tiếp nhận một mạng quá tải và chia nó thành hai mạng riêng biệt, nhằm giảm bớt lưu lượng truyền trên mỗi đoạn mạng và do đó mỗi mạng sẽ hoạt động hiệu quả hơn. - Kết nối các phương tiện truyền dẫn khác nhau, chẳng hạn cáp xoắn đôi và cáp quang. - Kết nối các đoạn mạng sử dụng phương thức truy nhập đường truyền khác nhau, chẳng hạn CSMA/CD và chuyển thẻ bài. 48
  48. Chương 1: Các khái niệm cơ bản c/ Bộ định tuyến (router) Trong môi trường gồm nhiều đoạn mạng với giao thức và kiến trúc mạng khác nhau, cầu nối không thể đảm bảo truyền thông nhanh trong tất cả các đoạn mạng. Mạng có độ phức tạp như vậy cần một thiết bị không những biết địa chỉ của mỗi đoạn mạng, mà còn quyết định tuyến đường tốt nhất để truyền dữ liệu và lọc lưu lượng quảng bá trên các đoạn mạng cục bộ. Thiết bị như vậy được gọi là bộ định tuyến. Bộ định tuyến là thiết bị hoạt động ở tầng mạng trong mô hình OSI. Điều này nghĩa là chúng có thể chuyển đổi và định tuyến gói dữ liệu qua nhiều mạng. Bộ định tuyến đọc thông tin địa chỉ mạng trong gói tin và vì chúng hoạt động tại tầng cao hơn so với cầu nối trong mô hình OSI, nên chúng truy cập nhiều thông tin khác. Bộ định tuyến có thể cung cấp các chức năng của cầu nối: - Lọc gói và cô lập lưu lượng mạng - Kết nối nhiều đoạn mạng Tuy nhiên do bộ định tuyến truy cập nhiều thông tin trong gói dữ liệu hơn so với cầu nối, nên chúng dùng các thông tin này để cải thiện việc phân phát gói dữ liệu. Bộ định tuyến được sử dụng trong các trường hợp mạng phức tạp vì chúng cung cấp chức năng quản lý lưu lượng tốt hơn cầu nối và không thực hiện phát quảng bá (chúng không truyền các gói tin quảng bá). Các bộ định tuyến có thể chia sẻ thông tin trạng thái và thông tin định tuyến với nhau và sử dụng thông tin này để bỏ qua các kết nối hỏng hoặc chậm. 1.4.7. Truyền tín hiệu Mạng cục bộ sử dụng hai kỹ thuật truyền tín hiệu chính - đó là: truyền băng cơ sở (baseband) và truyền băng rộng (broadband). Tuy nhiên, hầu hết các mạng cục bộ đều sử dụng kỹ thuật truyền băng cơ sở. a/ Truyền băng cơ sở Hệ thống băng cơ sở truyền tín hiệu số ở một tần số đơn lẻ. Tín hiệu được truyền dưới dạng xung điện hoặc xung ánh sáng rời rạc. Đối với truyền băng cơ sở, toàn bộ dung lượng kênh truyền được dùng để truyền một tín hiệu dữ liệu. Tín hiệu số sử dụng toàn bộ băng thông của cáp, băng thông này tạo thành một kênh. Kỹ thuật này có một số đặc điểm sau: - Thiết bị truyền tín hiệu đn gin và rẻ tiền. - Vì kỹ thuật này sử dụng tín hiệu số nên nó tưng thích với hệ thống máy tính. Tín hiệu số Tín hiệu số Tín hiệu số 01010 01010 01010 Đường b/ Truyền băng rộng Kỹ thuật truyền băng cơ sở 49
  49. Chương 1: Các khái niệm cơ bản Hệ thống băng rộng truyền tín hiệu tương tự ở một khoảng tần số biến thiên. Với công nghệ truyền tương tự, tín hiệu được truyền liên tục. Tín hiệu được truyền qua phương tiện vật lý dưới dạng sóng điện từ hoặc sóng ánh sáng. Khi sử dụng kỹ thuật truyền băng rộng, tín hiệu số từ máy tính phải được điều chế trước khi truyền đi. Tín hiệu số Tín hiệu tương tự Tín hiệu số 01010 01010 Mode Mode Đường F1 F2 Fn Tần Kỹ thuật truyền băng rộng Kỹ thuật này có những đặc điểm sau: - Chi phí cao do cần một MODEM đặc biệt để điều chế tín hiệu. - Cung cấp nhiều kênh truyền dẫn khác nhau do sử dụng các tần số sóng mang khác nhau để điều chế. Vì kỹ thuật này sử dụng nhiều kênh nên việc truyền tín hiệu theo băng rộng cho phép truyền đồng thời nhiều dạng dữ liệu khác nhau, ngoài dữ liệu còn cho phép truyền thoại và hình ảnh cho hội nghị truyền hình và truyền hình cáp. 1.4.8. Phương thức truyền dẫn Việc truyền dữ liệu trong mạng máy tính được thực hiện một trong 3 loại sau: unicast, multicast, và broadcast. Trong các loại truyền này, một gói dữ liệu đơn được chuyển tới một hoặc nhiều nút. Ở phương thức truyền unicast (truyền tới một điểm), một gói dữ liệu đơn được gửi từ nguồn đến một đích trên một mạng nào đó. Đầu tiên, nút nguồn đặt địa chỉ cho gói dữ liệu bằng cách sử dụng địa chỉ unicast. Sau đó gói dữ liệu này được chuyển tới mạng và cuối cùng mạng chuyển gói dữ liệu này đến đúng đích của nó. Ở phương thức truyền multicast (truyền tới nhiều điểm), một gói dữ liệu đơn được sao chép và gửi tới một nhóm các nút trên một mạng nào đó. Đầu tiên, nút nguồn đặt địa chỉ cho gói dữ liệu bằng cách sử dụng địa chỉ multicast. Sau đó gói dữ liệu được gửi đến mạng, mạng sao chép gói dữ liệu này và gửi nó đến mỗi nút thành viên của địa chỉ multicast này. Ở phương thức truyền broadcast (truyền quảng bá), một gói dữ liệu đơn được sao chép và gửi cho tất cả các nút trên một mạng nào đó. Đầu tiên, nút nguồn đặt địa chỉ cho gói dữ liệu bằng cách sử dụng địa chỉ broadcast. Sau đó gói dữ liệu được gửi đến mạng, mạng sao chép và gửi gói dữ liệu đến tất cả các máy tính ở mạng đích. 50
  50. Chương 1: Các khái niệm cơ bản 1.4.9. Mạng Internet/Intranet a/ Lịch sử phát triển của mạng Internet Năm 1968 Cơ quan các dự án nghiên cứu cấp cao (Advanced Research Project Agency- ARPA) của Bộ quốc phòng Mỹ đã đề ra dự án kết nối mạng giữa Bộ quốc phòng Mỹ với một số cơ sở nghiên cứu khoa học lớn ở Mỹ. Mùa thu 1969 việc kết nối giữa 4 trạm (Viện nghiên cứu Stanford, Đại học California ở Los Angeles, Đại học California ở Santa Barbara và Đại học Utah) thành công đánh dấu sự ra đời của ARPANET, tiền thân của INTERNET hôm nay. Giao thức truyền thông lúc đó được dùng là NCP (Network Control Protocol). Các nhà thiết kế ngay từ buổi ban đầu đó cũng đã nhận thức được rằng cần xây dựng “một mạng của các mạng”. Giữa những năm 70 họ giao thức TCP/IP được Vin cerf (đại học Stanford) và Robert Kahn phát triển, đến năm 1983 thì họ giao thức này hoàn toàn thay thế NCP trong ARPANET. ARPANET thành công vang dội và đến năm 1983 thì được tách làm 2: một gọi là MILNET dành cho các địa điểm quân sự còn ARPANET mới dành cho các địa điểm phi quân sự. Tuy nhiên 2 mạng này vẫn còn liên kết với nhau nhờ vào giao thức IP (Internet Protocol - Giao thức Internet) và TCP (Transmission Control Protocol - Giao thức điều khiển truyền tin). Giao thức TCP là một giao thức trong đó các thông tin được số hóa và phân chia thành hàng loạt các gói để truyền đi, sau đó các gói này được lắp ráp lại tại nơi nhận. Hệ thống các gói được tạo ra như vậy nhằm đảm bảo cho thông tin được truyền đi kể cả khi một phần của mạng máy tính không hoạt động. Giao thức IP nhằm đảm bảo các thông tin đến đúng địa chỉ người nhận . Như vậy bất kỳ một máy tính nào tuân thủ các giao thức TCP và IP đều có thể liên hệ với nhau trong INTERNET. Sau một thời gian, kế hoạch sử dụng ARPAnet không thực hiện được như mong muốn vì một số lý do kỹ thuật và chính trị. Do vậy, năm 1986, NSF (National Science Foundation - Hội đồng khoa học Quốc gia) đã xây dựng mạng riêng lấy tên là NSFNet, mạng này hoạt động nhanh hơn nhiều và đã nối với các trung tâm tính toán lớn (tốc độ đường truyền là 1.5 Mb/s thay vì 560Kb/s trong ARPANet). Sự xuất hiện mạng xương sống NSFNet đã thúc đẩy sự tăng trưởng của Internet. Một xa lộ thông tin mới hình thành và nhiều trường đại học, viện nghiên cứu đã tham gia vào cộng đồng Internet. Và sau đó các tổ chức chính phủ và giới kinh doanh cũng vào cuộc và ngày càng chiếm tỷ trọng đáng kể trong thế giới Internet. Về mặt địa lý Internet cũng đã nhanh chóng vượt ra khỏi nước Mỹ và trở thành mạng toàn cầu với vài chục triệu người dùng như hiện nay. Đến năm 1990 thì quá trình chuyển đổi sang Internet hoàn tất và ARPANet ngừng hoạt động. NSFNet giờ đây cũng chỉ còn là một mạng xương sống của mạng Internet. Về kiến trúc, Internet cũng đã có những thay đổi. Trước đây người ta còn có thể định nghĩa “Internet là mạng của tất cả các mạng sử dụng giao thức IP”. Nhưng ngày nay điều đó không còn chính xác nữa vì nhiều mạng với kiến trúc khác (không dùng IP) nhờ có cầu nối đa giao thức (multiprotocol gateway) nên vẫn có thể nối kết được vào Internet và sử dụng đầy đủ các dịch vụ trông tin trên Internet. b/ Internet và Intranet Internet là một xa lộ điện tử nối hàng ngàn mạng trên khắp thế giới lại với nhau với giao thức sử dụng chủ yếu là TCP/IP. Cũng có thể nói rằng Internet là tập hợp hàng ngàn mạng trên thế giới nối lại với nhau qua các bộ chọn đường (router) với giao thức sử dụng chủ yếu là TCP/IP. Hiện nay Internet bao gồm trên 15 000 mạng với không từ 25 đến 30 triệu người sử dụng. Các 51
  51. Chương 1: Các khái niệm cơ bản dịch vụ chính trên mạng Internet là: thư điện tử (E-mail), tìm kiếm thông tin dựa trên siêu văn bn (WWW - World Wide Web), truyền tệp (FTP- File Transfer Protocol), truy nhập từ xa (TELNET), Bên cạnh khái niệm liên mạng Internet), khái niệm mạng nội bộ (Intranet) cũng xuất hiện. Intranet là mạng dùng riêng cho các yêu cầu hoạt động nội bộ của một đơn vị xã hội, có thể là mạng cục bộ hay mạng diện rộng, trong đó sử dụng các công nghệ cốt lõi của Internet. Một câu hỏi đặt ra: Ai là người quản lý Internet? Thực tế là không có một cơ quan quản lý tối cao cho toàn bộ mạng Internet. Một tổ chức có vai trò điều phối tối cao các hoạt động của Internet là Hiệp hội Internet viết tắt là ISOC (Internet Society), là tổ chức phi lợi nhuận tập hợp một số tổ chức và cá nhân tự nguyện tham gia vào các hoạt động nhằm khuyến khích và phát triển sử dụng Internet. Cơ quan lãnh đạo cao nhất của ISOC là ban kiến trúc Internet viết tắt là IAB (Internet Architecture board). Việc phân phối địa chỉ cho các máy tính của người sử dụng (host) nối vào Internet ban đầu do chính ISOC trực tiếp làm. Nhưng từ năm 1992 do sự tăng trưởng quá nhanh của Internet nên công việc đó được phân cấp cho các Trung tâm thông tin mạng viết tắt là NIC (Network Information Center). NIC của khu vực Châu Á - Thái Bình Dương - gọi là APNIC có trụ sở tại Tokyo, Nhật bản. Hiện nay ở khu vực Châu Á - Thái Bình Dương chỉ có 2 NIC quốc gia của Nhật bản và của Hàn Quốc. Hiện tại APNIC ở Tokyo vẫn chịu trách nhiệm điều hành và phân phối địa chỉ cho các Host ở Việt nam. c/ Một số dịch vụ cơ bản của Internet */ Thư điện tử (E-mail) Thư điện tử (Electronic Mail gọi tắt là E-mail) là dịch vụ thông dụng nhất trên Internet. Để gửi hay nhận thư, bước đầu tiên là xác định chính xác địa chỉ của thư cần gửi đến. Cấu trúc của thư điện tử như sau: Tên người sử dụng @ Tên đầy đủ của vùng (domain) Ví dụ : hungnt@itac.com.vn Trong đó từ phải sang trái theo thứ tự: . vn: chỉ vùng địa lý, vn viết tắt của Việt Nam. Phần cuối của tên vùng thường định nghĩa cho hoạt động: EDU, NET, COM (đối với nước Mỹ) hoặc từ viết tắt cho quốc gia. . com: chỉ mạng hoạt động dịch vụ Internet là đào tạo (EDU), kinh doanh (COM), . itac: chỉ tên một máy chủ của công ty iTAC . hungnt: chỉ tên hộp thư của một Account truy nhập của thuê bao. Để gửi thư điện tử máy gửi thư và máy nhận thư không cần phải liên kết trực tiếp. Email là một dịch vụ kiểu lưu (POP3) và chuyển tiếp (SMTP). Thư điện tử được chuyển từ máy này qua máy khác cho tới máy đích (giống như trong hệ thống bưu chính thông thường: thư được chuyển đến tay người nhận sau khi đã đi qua một số bưu cục trung chuyển). Mỗi người dùng (client) đều phải kết nối với một E-mail Server gần nhất (đóng vai trò bưu cục địa phương). Sau khi soạn tho xong thư và đề rõ địa chỉ đích (người nhận), người sử dụng sẽ gửi thư tới E-mail Server của mình. E-mail Server này có nhiệm vụ chuyển thư đến đích hoặc đến một E-mail Server trung gian khác. 52
  52. Chương 1: Các khái niệm cơ bản Thư sẽ chuyển đến E-mail Server của người nhận và được lưu tại đó. Đến khi người nhận thiết lập một cuộc gọi nối tới máy E-mail Server đó thì thư sẽ được chuyển về máy của người nhận và đồng thời vẫn còn lại trên máy chủ cho đến khi máy chủ được dọn dẹp. Giao thức truyền thống sử dụng cho E-mail của Internet là SMTP (Simple Mail Transfer Protocol). Cấu trúc của một thư điện tử thường gồm 2 phần: phần đầu thư (header) và phần thân thư (body) */ Mạng thông tin toàn cầu (World Wide Web; viết tắt là WWW): Đây là dịch vụ mới và mạnh nhất trên Internet. WWW được xây dựng trên kỹ thuật siêu văn bản (Hypertext). Trong các trang văn bản có chứa những từ mà khi ta chọn có thể gọi ra thành một trang thông tin mới có nội dung chi tiết hơn. Trên cùng một trang thông tin có thể có nhiều dạng thông tin khác nhau như văn bản, ảnh hay âm thanh. Để xây dựng các trang dữ liệu với các kiểu dữ liệu khác nhau như vậy, WWW sử dụng một ngôn ngữ có tên là ngôn ngữ siêu văn bản HTML (HyperText Markup Language) HTML là một ngôn ngữ định dạng (hay đánh dấu - Markup). Mỗi tệp tin văn bản được đánh dấu bằng các thẻ (tag) HTML cho phép người sử dụng có thể đọc được chúng trên máy tính của mình hay qua mạng bằng một phần mềm gọi là bộ duyệt Web (Web browser). Thẻ HTML là một đoạn mã được giới hạn bởi các dấu ngoặc nhọn “ ”. Chương trình Web browser sẽ đọc các thẻ khi thực hiện định dạng các tệp tin trên màn hình. Các tài liệu có trong WWW đều là các tệp tin HTML. Để thực hiện việc truy nhập, liên kết các tài nguyên thông tin khác nhau theo kỹ thuật siêu văn bản, WWW sử dụng khái niệm URL (Uniform Resource Locator). Đây chính là một dạng tên để định danh duy nhất cho một tài liệu hoặc một dịch vụ trong Web. Cấu trúc của một URL thường bao gồm các thành phần: Giao thức Internet được sử dụng, vị trí của Server (domain name), tài liệu cụ thể trên Server (path name) và có thể có thêm các thông tin định danh khác. Ví dụ một tài liệu Web có thể có URL như sau: Trong đó: - "http:" là chỉ giao thức - "www.itac.com.vn" là chỉ tên Domain của máy chủ WWW - "/training/library/doc/it/lan.html" là chỉ đường dẫn đến tài liệu trên server http (HyperText Transfer Protocol) là một giao thức truyền thông sử dụng cho Web. Nhưng vì Web có thể chấp nhận các giao thức Internet khác như ftp, gopher, WAISE, ) nên URL có thể có một tiền tố khác với http, chẳng hạn gopher://gopher.msu.edu/ Như vậy, với địa chỉ URL, Web cho phép bạn truy nhập đến các tài nguyên thông tin từ các dịch vụ khác của Internet ở trên các Server khác nhau. Hoạt động của Web cũng dựa trên mô hình client/server. Tại trạm client, người sử dụng sẽ dùng Web browser để gửi yêu cầu tìm kiếm các tệp tin HTML đến Web server ở xa trên mạng Internet nhờ có địa chỉ URL. Web server nhận các yêu cầu đó và thực hiện rồi gửi kết quả về cho 53
  53. Chương 1: Các khái niệm cơ bản Web client. ở đây Web browser sẽ biên dịch các thẻ HTML và hiển thị nội dung các trang tài liệu trên màn hình. Cho đến nay, nhiều hãng phần mềm đã chế tác các browser cho Web, thí dụ: Mosaic của NSCA, Nevigator của Netscape, Internet Explorer của Microsoft, Web Access của Novell, Trong khi đó nhiều hãng, nhiều tổ chức và c người sử dụng cũng đang rầm rộ phát triển các cơ sở dữ liệu cho Web với nhiều chủ đề khác nhau, hứa hẹn những khả năng ứng dụng ngày càng phong phú của Web trong tưng lai. */ Dịch vụ truyền tệp (File Transfer Protocol viết tắt là FTP) Dịch vụ truyền tệp trên Internet được đặt tên theo giao thức mà nó sử dụng là FTP (File Transfer Protocol). FTP cho phép chuyển các tệp từ một trạm này sang một trạm khác, bất kể các trạm đó ở đâu và dùng hệ điều hành gì, chỉ cần chúng đều được nối với Internet và có cài đặt FTP. FTP là một chương trình phức tạp vì có nhiều cácch khác nhau để xử lý tệp và cấu trúc tệp, chưa nói đến có nhiều cách lưu trữ tệp khác nhau (Binary hay ASCII, nén hay không nén,v.v ) Để khởi động FTP, từ trạm làm việc ta gõ ftp ftp sẽ thiết lập liên kết với trạm xa và lúc đó bạn sẽ phải làm các thao tác quen thuộc để đăng nhập vào hệ thống (login/password). Sau khi trên màn hình hiển thị dấu nhắc ftp> bạn có thể gõ tiếp các lệnh cho phép truyền tệp theo cả 2 chiều. Để chuyển một tệp từ máy của bạn đến trạm xa thì dùng lệnh put, ngược lại muốn lấy một tệp từ trạm xa về thì dùng lệnh get với cú pháp tương ứng như sau: ftp> put ftp> get Nếu không chỉ ra tên tệp đích thì bản sao sẽ lấy cùng tên như tệp nguồn. Ngoài put và get, ftp còn nhiều lệnh tiện ích khác Trong trường hợp bạn chưa đăng ký (chưa có account) trên Internet thì bạn sẽ không thể sử dụng ftp như trên được vì bạn chưa có login name/password để đăng nhập vào máy. Tuy nhiên các tác giả của ftp đã nghĩ đến điều đó và cung cấp dịch vụ gọi là “FTP vô danh” (Anonymous FTP) cho phép những người sử dụng không có login name/password có thể truy nhập tới một số tệp nhất định trên máy. Tất nhiên là có sự hạn chế: những người đó chỉ có thể sao chép các tệp chứ không thể tạo được các tệp mới hoặc biến đổi các tệp đã có. Khi dịch vụ này được cung cấp thì sẽ có một login name đặc biệt gọi là anonymous và nếu bạn dùng nó làm login name của bạn thì ftp chấp nhận một xâu ký tự bất kỳ như là password của bạn. Sau khi đã đăng nhập như một “anonymous” bạn sẽ được phép lấy các tệp mà người ta đã dành riêng cho những kẻ vô danh. */ Dịch vụ truy nhập từ xa-TELNET TELNET là một giao thức để truy nhập vào một máy tính ở xa để khai thác tài nguyên ở máy đó giống như ngồi làm việc ở máy mình. Điều cần thiết là máy tính cần nối vào Internet và 54