Bài giảng Ngôn ngữ lập trình c++

pdf 269 trang phuongnguyen 3991
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Ngôn ngữ lập trình c++", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ngon_ngu_lap_trinh_c.pdf

Nội dung text: Bài giảng Ngôn ngữ lập trình c++

  1. BÀI GIẢNG NGÔN NGỮ LẬP TRÌNH C++ PTIT Biên soạn: TS. Nguyễn Mạnh Hùng Hiệu chỉnh: Th.S. Nguyễn Mạnh Sơn
  2. GIỚI THIỆU C++ là ngôn ngữ lập trình hướng đối tượng được mở rộng từ ngôn ngữ C. Do vậy, C++ có ưu điểm của ngôn ngữ C là uyển chuyển, tương thích với các thiết bị phần cứng đồng thời có thể lập trình hướng đối tượng. Hiện nay, C++ là một ngôn ngữ lập trình phổ biến, được hầu hết các trường đại học chọn làm giáo trình giảng dạy về kỹ thuật lập trình lẫn lập trình hướng đối tượng. Đặc biệt là trong các trường kỹ thuật. Tài liệu này ra đời không những nhằm giới thiệu C++ như một ngôn ngữ lập trình, mà còn có tham vọng trình bày phương pháp lập trình hướng đối tượng với C++. Nội dung của tài liệu bao gồm hai phần chính: Phần thứ nhất là lập trình nâng cao với C++, bao gồm lập trình C++ với con trỏ và mảng, với các kiểu dữ liệu có cấu trúc, với các thao tác vào ra trên tệp. Phần thứ hai là lập trình hướng đối tượng với C++, bao gồm các định nghĩa và các thao tác trên lớp đối tượng, tính kế thừa và tương ứng bội trong C++, cách sử dụng một số lớp cơ bản trong thư viện C++. Nội dung tài liệu được tổ chức thành 7 chương: Chương 1: Giới thiệu tổng quan về khác phương pháp lập trình. Trình bày về các phương pháp lập trình tuyến tính, lập trình cấu trúc và đặc biệt, làm quen với các khái niệm trong lập trình hướng đối tượng. Chương 2: Con trỏ và mảng. Trình bày cách khai báo và sử dụng các kiểu con trỏ và mảng trong ngôn ngữ C++. Chương 3: Kiểu dữ liệu có cấu trúcPTIT. Trình bày cách biểu diễn và cài đặt một số kiểu cấu trúc dữ liệu trừu tượng trong C++. Sau đó, trình bày cách áp dụng các kiểu dữ liệu này trong các ứng dụng cụ thể. Chương 4: Vào ra trên tệp. Trình bày các thao tác đọc, ghi dữ liệu trên các tệp tin khác nhau: tệp tin văn bản và tệp tin nhị phân. Trình bày các cách truy nhập tệp tin trực tiếp. Chương 5: Lớp đối tượng. Trình bày các khái niệm mở đầu cho lập trình hướng đối tượng trong C++, bao gồm cách khai báo và sử dụng lớp, các thuộc tính của lớp; cách khởi tạo và huỷ bỏ đối tượng, các quy tắc truy nhập đến các thành phần của lớp. Chương 6: Tính kế thừa và tương ứng bội. Trình bày cách thức kế thừa giữa các lớp trong C++, các nguyên tắc truy nhập trong kế thừa, định nghĩa nạp chồng các phương thức và tính đa hình trong lập trình hướng đối tương với C++. Chương 7: Một số lớp quan trọng. Trình bày cách sử dụng một số lớp có sẵn trong thư viện chuẩn của C++, bao gồm các lớp làm vật chứa: lớp tập hợp, lớp chuỗi, lớp ngăn xếp, lớp hàng đợi và lớp danh sách liên kết 3
  3. Chương 8: Thư viện STL và áp dụng. Trình bày thư viện STL trong C++, các lớp chính, các hàm và cách sử dụng. Trong chương 8 còn có một số bài tập áp dụng mà khi sử dụng STL sẽ có hiệu quả lập trình tốt hơn. Để đọc được cuốn sách này, yêu cầu độc giả phải có các kỹ năng và quen biết các khái niệm cơ bản về lập trình, đã biết về lập trình cơ bản đối với ngôn ngữ C hoặc C++. Cuốn sách này có thể dùng tham khảo cho những độc giả muốn tìm hiểu các kỹ thuật lập trình nâng cao và lập trình hướng đối tượng trong C++. Cuốn sách này có kèm theo một đĩa chương trình, trong đó chứa toàn bộ các chương trình được lấy làm minh hoạ và các bài tập trong cuốn sách này. Mặc dù các tác giả đã có nhiều cố gắng trong việc biên soạn tài liệu này, song không thể tránh khỏi những thiếu sót. Rất mong nhận được những phản hồi từ sinh viên và các bạn đồng nghiệp. PTIT 4
  4. CHƯƠNG 1 GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP LẬP TRÌNH Nội dung của chương này tập trung trình bày các phương pháp lập trình: Phương pháp lập trình tuyến tính Phương pháp lập trình hướng cấu trúc Phương pháp lập trình hướng đối tượng. 1.1 LẬP TRÌNH TUYẾN TÍNH Đặc trưng cơ bản của lập trình tuyến tính là tư duy theo lối tuần tự. Chương trình sẽ được thực hiện tuần tự từ đầu đến cuối, lệnh này kế tiếp lệnh kia cho đến khi kết thúc chương trình. Đặc trưng Lập trình tuyến tính có hai đặc trưng: Đơn giản: chương trình được tiến hành đơn giản theo lối tuần tự, không phức tạp. Đơn luồng: chỉ có một luồng công việc duy nhất, và các công việc được thực hiện tuần tự trong luồng đó. Tính chất Ưu điểm: Do tính đơn giản, lập trình tuyến tính có ưu điểm là chương trình đơn giản, dễ hiểu. Lập trình tuyến tính đượcPTIT ứng dụng cho các chương trình đơn giản. Nhược điểm: Với các ứng dụng phức tạp, người ta không thể dùng lập trình tuyến tính để giải quyết. Ngày nay, lập trình tuyến tính chỉ tồn tại trong phạm vi các modul nhỏ nhất của các phương pháp lập trình khác. Ví dụ trong một chương trình con của lập trình cấu trúc, các lệnh cũng được thực hiện theo tuần tự từ đầu đến cuối chương trình con. 1.2 LẬP TRÌNH HƯỚNG CẤU TRÚC 1.2.1 Đặc trưng của lập trình hướng cấu trúc Trong lập trình hướng cấu trúc, chương trình chính được chia nhỏ thành các chương trình con và mỗi chương trình con thực hiện một công việc xác định. Chương trình chính sẽ gọi đến chương trình con theo một giải thuật, hoặc một cấu trúc được xác định trong chương trình chính. Các ngôn ngữ lập trình cấu trúc phổ biến là Pascal, C và C++. Riêng C++ ngoài việc có đặc trưng của lập trình cấu trúc do kế thừa từ C, còn có đặc trưng của lập trình hướng đối tượng. Cho nên C++ còn được gọi là ngôn ngữ lập trình nửa cấu trúc, nửa hướng đối tượng. 5
  5. Đặc trưng Đặc trưng cơ bản nhất của lập trình cấu trúc thể hiện ở mối quan hệ: Chương trình = Cấu trúc dữ liệu + Giải thuật Trong đó: Cấu trúc dữ liệu là cách tổ chức dữ liệu, cách mô tả bài toán dưới dạng ngôn ngữ lập trình Giải thuật là một quy trình để thực hiện một công việc xác định Trong chương trình, giải thuật có quan hệ phụ thuộc vào cấu trúc dữ liệu: Một cấu trúc dữ liệu chỉ phù hợp với một số hạn chế các giải thuật. Nếu thay đổi cấu trúc dữ liệu thì phải thay đổi giải thuật cho phù hợp. Một giải thuật thường phải đi kèm với một cấu trúc dữ liệu nhất định. Tính chất Mỗi chương trình con có thể được gọi thực hiện nhiều lần trong một chương trình chính. Các chương trình con có thể được gọi đến để thực hiện theo một thứ tự bất kì, tuỳ thuộc vào giải thuật trong chương trình chính mà không phụ thuộc vào thứ tự khai báo của các chương trình con. Các ngôn ngữ lập trình cấu trúc cung cấp một số cấu trúc lệnh điều khiển chương trình. Ưu điểm Chương trình sáng sủa, dễ hiểu, dễ theo dõi. Tư duy giải thuật rõ ràng. PTIT Nhược điểm Lập trình cấu trúc không hỗ trợ việc sử dụng lại mã nguồn: Giải thuật luôn phụ thuộc chặt chẽ vào cấu trúc dữ liệu, do đó, khi thay đổi cấu trúc dữ liệu, phải thay đổi giải thuật, nghĩa là phải viết lại chương trình. Không phù hợp với các phần mềm lớn: tư duy cấu trúc với các giải thuật chỉ phù hợp với các bài toán nhỏ, nằm trong phạm vi một modul của chương trình. Với dự án phần mềm lớn, lập trình cấu trúc tỏ ra không hiệu quả trong việc giải quyết mối quan hệ vĩ mô giữa các modul của phần mềm. Vấn đề Vấn đề cơ bản của lập trình cấu trúc là bằng cách nào để phân chia chương trình chính thành các chương trình con cho phù hợp với yêu cầu, chức năng và mục đích của mỗi bài toán. Thông thường, để phân rã bài toán trong lập trình cấu trúc, người ta sử dụng phương pháp thiết kế trên xuống (top-down). 6
  6. 1.2.2 Phương pháp thiết kế trên xuống (top-down) Phương pháp thiết kế top-down tiếp cận bài toán theo hướng từ trên xuống dưới, từ tổng quan đến chi tiết. Theo đó, một bài toán được chia thành các bài toán con nhỏ hơn. Mỗi bài toán con lại được chia nhỏ tiếp, nếu có thể, thành các bài toán con nhỏ hơn nữa. Quá trình này còn được gọi là quá trình làm mịn dần. Quá trình làm mịn dần sẽ dừng lại khi các bài toán con không cần chia nhỏ thêm nữa. Nghĩa là khi mỗi bài toán con đều có thể giải quyết bằng một chương trình con với một giải thuật đơn giản. Ví dụ, sử dụng phương pháp top-down để giải quyết bài toán là xây một căn nhà mới. Khi đó, ta có thể phân rã bài toán theo các bước như sau: Ở mức thứ nhất, chia bài toán xây nhà thành các bài toán nhỏ hơn như: làm móng, đổ cột, đổ trần, xây tường, lợp mái. Ở mức thứ hai, phân rã các công việc ở mức thứ nhất: việc làm móng nhà có thể phân rã tiếp thành các công việc: đào móng, gia cố nền, làm khung sắt, đổ bê tông. Công việc đổ cột được phần rã thành Ở mức thứ ba, phân rã các công việc của mức thứ hai: việc đào móng có thể phân chia tiếp thành các công việc: đo đạc, cắm mốc, chăng dây, đào và kiểm tra móng. Việc gia cố nền được phân rã thành Quá trình phân rã có thể dừng ở mức này, bởi vì các công việc con thu được là: đo đạc, cắm mốc, chăng dây, đào có thể thực hiện được ngay, không cần chia nhỏ thêm nữa. Lưu ý: Cùng sử dụng phương pháp top-down với cùng một bài toán, nhưng có thể cho ra nhiều kết quả khác nhau. Nguyên nhân là do sự khác nhau trong tiêu chí để phân rã một bài toán thành các bài toán con. Ví dụ, vẫn áp dụng phương pháp PTITtop-down để giải quyết bài toán xây nhà, nhưng nếu sử dụng một cách khác để phân chia bài toán, ta có thể thu được kết quả khác biệt so với phương pháp ban đầu: Ở mức thứ nhất, chia bài toán xây nhà thành các bài toán nhỏ hơn như: làm phần gỗ, làm phần sắt, làm phần bê tông và làm phần gạch. Ở mức thứ hai, phân rã các công việc ở mức thứ nhất: việc làm gỗ có thể chia thành các công việc như: xẻ gỗ, gia công gỗ, tạo khung, lắp vào nhà. Việc làm sắt có thể chia nhỏ thành Rõ ràng, với cách làm mịn thế này, ta sẽ thu được một kết quả khác hẳn với cách thức đã thực hiện ở phần trên. 1.3 LẬP TRÌNH HƯỚNG ĐỐI TƯỢNG 1.3.1 Lập trình hướng đối tượng Trong lập trình hướng đối tượng: 7
  7. Người ta coi các thực thể trong chương trình là các đối tượng và sau đó, người ta trừu tượng hoá đối tượng thành lớp đối tượng. Dữ liệu được tổ chức thành các thuộc tính của lớp. Nguời ta ngăn chặn việc thay đổi tuỳ tiện dữ liệu trong chương trình bằng các cách giới hạn truy nhập, chỉ cho phép truy nhập dữ liệu thông qua đối tượng, thông qua các phương thức mà đối tượng được cung cấp. Quan hệ giữa các đối tượng là quan hệ ngang hàng hoặc quan hệ kế thừa: Nếu lớp B kế thừa từ lớp A thì A được gọi là lớp cơ sở và B được gọi là lớp dẫn xuất. Ngôn ngữ lập trình hướng đối tượng phổ biến hiện nay là Java và C++. Tuy nhiên, C++ mặc dù cũng có những đặc trưng cơ bản của lập trình hướng đối tượng nhưng vẫn không phải là ngôn ngữ lập trình thuần hướng đối tượng. Đặc trưng Lập trình hướng đối tượng có hai đặc trưng cơ bản: Đóng gói dữ liệu: dữ liệu luôn được tổ chức thành các thuộc tính của lớp đối tượng. Việc truy nhập đến dữ liệu phải thông qua các phương thức của đối tượng lớp. Sử dụng lại mã nguồn: việc sử dụng lại mã nguồn được thể hiện thông qua cơ chế kế thừa. Cơ chế này cho phép các lớp đối tượng có thể kế thừa từ các lớp đối tượng khác. Khi đó, trong các lớp dẫn xuất, có thể sử dụng các phương thức (mã nguồn) của các lớp cơ sở mà không cần phải định nghĩa lại. Ưu điểm Lập trình hướng đối tượng có một số ưu điểm nổi bật: Không còn nguy cơ dữ liệu bị thay đổi tự do trong chương trình. Vì dữ liệu đã được đóng gói vào các đối tượng. Nếu muốn truy nhập vào dữ liệu phải thông qua các phương thức được cho phép của đối tượng.PTIT Khi thay đổi cấu trúc dữ liệu của một đối tượng, không cần thay đổi mã nguồn của các đối tượng khác, mà chỉ cần thay đổi một số thành phần của đối tượng dẫn xuất. Điều này hạn chế sự ảnh hưởng xấu của việc thay đổi dữ liệu đến các đối tượng khác trong chương trình. Có thể sử dụng lại mã nguồn, tiết kiệm tài nguyên, chi phí thời gian. Vì nguyên tắc kế thừa cho phép các lớp dẫn xuất sử dụng các phương thức từ lớp cơ sở như những phương thức của chính nó, mà không cần thiết phải định nghĩa lại. Phù hợp với các dự án phần mềm lớn, phức tạp. 1.3.2 Một số khái niệm cơ bản Trong mục này, chúng ta sẽ làm quen với một số khái niệm cơ bản trong lập trình hướng đối tượng. Bao gồm: Khái niệm đối tượng (object) 8
  8. Khái niệm đóng gói dữ liệu (encapsulation) Khái niệm kế thừa (inheritance) Khái niệm đa hình (polymorphism) Đối tượng (Object) Trong lập trình hướng đối tượng, đối tượng được coi là đơn vị cơ bản nhỏ nhất. Các dữ diệu và cách xử lí chỉ là thành phần của đối tượng mà không được coi là thực thể. Một đối tượng chứa các dữ liệu của riêng nó, đồng thời có các phương thức (hành động) thao tác trên các dữ liệu đó: Đối tượng = dữ liệu + phương thức Lớp (Class) Khi có nhiều đối tượng giống nhau về mặt dữ liệu và phương thức, chúng được nhóm lại với nhau và gọi chung là lớp: Lớp là sự trừu tượng hoá của đối tượng Đối tượng là một thể hiện của lớp. Đóng gói dữ liệu (Encapsulation) Các dữ liệu được đóng gói vào trong đối tượng. Mỗi dữ liệu có một phạm vi truy nhập riêng. Không thể truy nhập đến dữ liệu một cách tự do như lập trình cấu trúc Muốn truy nhập đến dữ liệu, phải thông qua các đối tượng, nghĩa là phải sử dụng các phương thức mà đối tượng cung cấp mới có thể truy nhập đến dữ liệu của đối tượng đó. Tuy nhiên, vì C++ chỉ là ngôn ngữ lập trình nửa đối tượng, cho nên C++ vẫn cho phép định nghĩa các biến dữ liệu và các hàm tự do,PTIT đây là kết quả kế thừa từ ngôn ngữ C, một ngôn ngữ lập trình thuần cấu trúc. Kế thừa (Inheritance) Tính kế thừa của lập trình hướng đối tượng cho phép một lớp có thể kế thừa từ một số lớp đã tồn tại. Khi đó, lớp mới có thể sử dụng dữ liệu và phương thức của các lớp cơ sở như là của mình. Ngoài ra, lớp dẫn xuất còn có thể bổ sung thêm một số dữ liệu và phương thức. Ưu điểm của kế thừa là khi thay đổi dữ liệu của một lớp, chỉ cần thay đổi các phương thức trong phạm vi lớpởc sở, mà không cần thay đổi trong các lớp dẫn xuất. Đa hình (Polymorphsim) Đa hình là khái niệm luôn đi kèm với kế thừa. Do tính kế thừa, một lớp có thể sử dụng lại các phương thức của lớp khác. Tuy nhiên, nếu cần thiết, lớp dẫn xuất cũng có thể định nghĩa lại một số phương thức của lớp cơ sở. Đó là sự nạp chồng phương thức trong kế thừa. Nhờ sự nạp chồng phương thức này, ta chỉ cần gọi tên phương thức bị nạp chồng từ đối tượng mà không cần quan tâm đó là đối tượng của lớp nào. Chương trình sẽ tự động kiểm tra xem đối tượng 9
  9. là thuộc kiểu lớpởc sở hay thuộc lớp dẫn xuất, sau đó sẽ gọi phương thức tương ứng với lớp đó. Đó là tính đa hình. 1.3.3 Lập trình hướng đối tượng trong C++ Vì C++ là một ngôn ngữ lập trình được mở rộng từ một ngôn ngữ lập trình cấu trúc C. Cho nên, C++ được xem là ngôn ngữ lập trình nửa hướng đối tượng, nửa hướng cấu trúc. Những đặc trưng hướng đối tượng của C++ Cho phép định nghĩa lớp đối tượng. Cho phép đóng gói dữ liệu vào các lớp đối tượng. Cho phép định nghĩa phạm vi truy nhập dữ liệu của lớp bằng các từ khoá phạm vi: public, protected, private. Cho phép kế thừa lớp với các kiểu kế thừa khác nhau tuỳ vào từ khoá dẫn xuất. Cho phép lớp dẫn xuất sử dụng các phương thức của lớp cơ sở (trong phạm vi quy định). Cho phép định nghĩa chồng phương thức trong lớp dẫn xuất. Những hạn chế hướng đối tượng của C++ Những hạn chế này là do C++ được phát triển từ một ngôn ngữ lập trình thuần cấu trúc C. Cho phép định nghĩa và sử dụng các biến dữ liệu tự do. Cho phép định nghĩa và sử dụng các hàm tự do. Ngay cả khi dữ liệu được đóng gói vào lớp, dữ liệu vẫn có thể truy nhập trực tiếp như dữ liệu tự do bởi các hàm bạn, lớp bạn (friend) trong C++. TỔNG KẾT CHƯƠNG 1 PTIT Chương 1 đã trình bày tổng quan về các phương pháp lập trình hiện nay. Nội dung tập trung vào ba phương pháp lập trình có liên quan trực tiếp đến ngôn ngữ lập trình C++: Lập trình tuyến tính Lập trình hướng cấu trúc Lập trình hướng đối tượng. C++ là ngôn ngữ lập trình được mở rộng từ một ngôn ngữ lập trình cấu trúc C. Do đó, C++ vừa có những đặc trưng của lập trình cấu trúc, vừa có những đặc trưng của lập trình hướng đối tượng. 10
  10. CHƯƠNG 2 CON TRỎ VÀ MẢNG Nội dung của chương này tập trung trình bày các vấn đề cơ bản liên quan đến các thao tác trên kiểu dữ liệu con trỏ và mảng trong C++: Khái niệm con trỏ, cách khai báo và sử dụng con trỏ. Mối quan hệ giữa con trỏ và mảng Con trỏ hàm Cấp phát bộ nhớ cho con trỏ 2.1 KHÁI NIỆM CON TRỎ 2.1.1 Khai báo con trỏ Con trỏ là một biến đặc biệt, nó chứa địa chỉ của một biến khác. Con trỏ có kiểu là kiểu của biến mà nó trỏ tới. Cú pháp khai báo một con trỏ như sau: * ; Trong đó: Kiểu dữ liệu: Có thể là các kiểu dữ liệu cơ bản của C++, hoặc là kiểu dữ liệu có cấu trúc, hoặc là kiểu đối tượng do người dùng tự định nghĩa. Tên con trỏ: Tuân theo qui tắc đặt tên biến của C++: - Chỉ được bắt đầu bằng một kí tự (chữ), hoặc dấu gạch dưới “_”. - Bắt đầu từ kí tự thứ hai,PTIT có thể có kiểu kí tự số. - Không có dấu trống (space bar) trong tên biến. - Có phân biệt chữ hoa và chữ thường. - Không giới hạn độ dài tên biến. Ví dụ, để khai báo một biến con trỏ có kiểu là int và tên là pointerInt, ta viết như sau: int *pointerInt; Lưu ý Có thể viết dấu con trỏ “*” ngay sau kiểu dữ liệu, nghĩa là hai cách khai báo sau là tương đương: int *pointerInt; int* pointerInt; Các cách khai báo con trỏ như sau là sai cú pháp: *int pointerInt; // Khai báo sai con trỏ 11
  11. int pointerInt*; // Khai báo sai con trỏ 2.1.2 Sử dụng con trỏ Con trỏ được sử dụng theo hai phép toán: Lấy địa chỉ con trỏ để thao tác Lấy giá trị của con trỏ để thao tác Lấy địa chỉ con trỏ Bản thân con trỏ sẽ được gán cho địa chỉ của một biến có cùng kiểu dữ liệu với nó. Cú pháp của phép gán như sau: = & ; Lưu ý Trong phép lấy địa chỉ, tên con trỏ không có dấu “*”. Ví dụ: int x, *px; px = &x; sẽ cho con trỏ px có kiểu int trỏ vào địa chỉ của biến x có kiểu nguyên. Phép toán & sẽ cho địa chỉ của biến tương ứng. Lấy giá trị của con trỏ Phép lấy giá trị của con trỏ được thực hiện bằng cách gọi tên: * ; Lưu ý PTIT Trong phép lấy giá trị, phải có dấu con trỏ “*”. Nếu không có dấu con trỏ, sẽ trở thành phép lấy địa chỉ con trỏ. Ví dụ: int x = 12, y, *px; px = &y; *px = x; con trỏ px vẫn trỏ tới địa chỉ biến y và giá trị của biến y sẽ là 12. Phép gán giữa các con trỏ Các con trỏ cùng kiểu có thể gán cho nhau thông qua phép gán và lấy địa chỉ con trỏ: = ; Lưu ý 12
  12. Trong phép gán giữa các con trỏ, bắt buộc phải dùng phép lấy địa chỉ con trỏ (không có dấu “*” trong tên con trỏ) mà không được dùng phép lấy giá trị con trỏ. Hai con trỏ phải cùng kiểu. Trong trường hợp hai con trỏ khác kiểu, phải dụng các phương thức ép kiểu tương tự như trong phép gán các biến thông thường có kiểu khác nhau. Ví dụ: int x = 12, px, py; px = &x; py = px; con trỏ py cũng trỏ vào địa chỉ của biến x như con trỏ px. Khi đó *py cũng có giá trị 12 giống như *px và giá trị biến x. Chương trình 2.1 minh hoạ việc dùng con trỏ giữa các biến của một chương trình C++. Chương trình 2.1 #include #include void main(void){ int x = 12, *px, *py; cout << ”x = ” << x << endl; px = &x; // Con trỏ px trỏ tới địa chỉ của x cout << ”px = &x, *px = ” << *px << endl; PTIT *px = *px + 20; // Nội dung của px là 32 cout << ”*px = *px+20, x = ” << x << endl; py = px; // Cho py trỏ tới chỗ mà px trỏ: địa chỉ của x *py += 15; // Nội dung của py là 47 cout << ”py = px, *py +=15, x = ” << x << endl; } Trong chương trình 2.1, ban đầu biến x có giá trị 12. Sau đó, con trỏ px trỏ vào địa chỉ của biến x nên con trỏ px cũng có giá trị 12. Tiếp theo, ta tăng giá trị của con trỏ px thêm 20, giá trị của con trỏ px là 32. Vì px đang trỏ đến địa chỉ của x nên x cũng có giá trị là 32. Tiếp theo nữa, ta cho con trỏ py trỏ và chỗ mà px đang trỏ tới, địa chỉ của biến x, nên py cũng có giá trị 32. Cuối cùng, ta tăng giá trị của con trỏ py thêm 15, py sẽ có giá trị 37. Vì py cũng đang trỏ đến địa chỉ của x nên x cũng có giá trị 37. Do vậy, ví dụ 2.1 sẽ in ra kết quả như sau: 13
  13. x = 12 px = &x, *px = 12 *px = *px + 20, x = 32 py = px, *py += 15, x = 37 2.2 CON TRỎ VÀ MẢNG 2.2.1 Con trỏ và mảng một chiều Mảng một chiều Trong C++, tên một mảng được coi là một kiểu con trỏ hằng: tên của một mảng được định vị tại một vùng nhớ xác định và địa chỉ của mảng trùng với địa chỉ của phần tử đầu tiên của mảng. Ví dụ khai báo: int A[5]; thì khi đó, địa chỉ của mảng A (cũng viết là A) sẽ trùng với địa chỉ phần tử đầu tiên của mảng A (là &A[0]): A = &A[0]; Quan hệ giữa con trỏ và mảng Vì tên của mảng được coi như một con trỏ hằng, cho nên nó có thể được gán cho một con trỏ có cùng kiểu. Ví dụ khai báo: int A[5] = {5, 10, 15, 20, 25}; int *pa = A; PTIT thì con trỏ pa sẽ trỏ đến mảng A, tức là trỏ đến địa chỉ của phần tử A[0], cho nên hai khai báo sau là tương đương: pa = A; pa = &A[0]; Với khai báo này, thì địa chỉ trỏ tới của con trỏ pa là địa chỉ của phần tử A[0] và giá trị của con trỏ pa là giá trị của phần tử A[0], tức là *pa = 5; Phép toán trên con trỏ và mảng Khi một con trỏ trỏ đến mảng, thì các phép toán tăng giảm trên con trỏ sẽ tương ứng với phép dịch chuyển trên mảng. Ví dụ khai báo: int A[5] = {5, 10, 15, 20, 25}; int *pa = &A[2]; thì con trỏ pa sẽ trỏ đến địa chỉ của phần tử A[2] và giá trị của pa là: *pa = A[2] = 15. 14
  14. Khi đó, phép toán: pa = pa + 1; sẽ đưa con trỏ pa trỏ đến địa chỉ của phần tử tiếp theo của mảng A, đó là địa chỉ của A[3]. Tương tự, phép toán: pa = pa – 1; sẽ đưa con trỏ pa trỏ đến địa chỉ của phần tử A[1]. Lưu ý: Hai phép toán pa++ và *pa++ có tác dụng hoàn toàn khác nhau trên mảng: pa++ là thao tác trên con trỏ, tức là trên bộ nhớ, nó sẽ đưa con trỏ pa trỏ đến địa chỉ của phần tử tiếp theo của mảng. *pa++ là phép toán trên giá trị, nó tăng giá trị hiện tại của phần tử mảng lên một đơn vị. Ví dụ: int A[5] = {5, 10, 15, 20, 25}; int *pa = &A[2]; thì pa++ là tương đương với pa = &A[3] và *pa = 20. nhưng *pa++ lại tương đương với pa = &A[2] và *pa = 15+1 = 16, A[2] = 16. Trong trường hợp: int A[5] = {5, 10, 15, 20, 25}; int *pa = &A[4]; thì phép toán pa++ sẽ đưa con trỏ pa trỏ đến một địa chỉ không xác định. Lí do là A[4] là phần tử cuối của mảng A, nên pa++ sẽ trỏ đến địa chỉ ngay sau địa chỉ của A[4], địa chỉ này nằm ngoài vùng chỉ số của mảng A nên không xác định. Tương tự với trường hợp pa=&A[0], phép toán pa cũngPTIT đưa pa trỏ đến một địa chỉ không xác định. Vì mảng A là con trỏ hằng, cho nên không thể thực hiện các phép toán trên A mà chỉ có thể thực hiện trên các con trỏ trỏ đến A: các phép toán pa++ hoặc pa là hợp lệ, nhưng các phép toán A++ hoặc A là không hợp lệ. Chương trình 2.2a minh hoạ việc cài đặt một thủ tục sắp xếp các phần tử của một mảng theo cách thông thường. Chương trình 2.2a void SortArray(int A[], int n){ int temp; for(int i=0; i A[j]){ temp = A[i]; 15
  15. A[i] = A[j]; A[j] = temp; } } Chương trình 2.2b cài đặt một thủ tục tương tự bằng con trỏ. Hai thủ tục này có chức năng hoàn toàn giống nhau. Chương trình 2.2b void SortArray(int *A, int n){ int temp; for(int i=0; i *(A+j)){ temp = *(A+i); *(A+i) = *(A+j); *(A+j) = temp; } } Trong chương trình 2.2b, thay vì dùng một mảng, ta dùng một con trỏ để trỏ đến mảng cần sắp xếp. Khi đó, ta có thể dùng các thaoPTIT tác trên con trỏ thay vì các thao tác trên các phần tử mảng. 2.2.2 Con trỏ và mảng nhiều chiều Con trỏ và mảng nhiều chiều Một câu hỏi đặt ra là nếu một ma trận một chiều thì tương đương với một con trỏ, vậy một mảng nhiều chiều thì tương đương với con trỏ như thế nào? Xét ví dụ: int A[3][3] = { {5, 10, 15}, {20, 25, 30}, {35, 40, 45} }; Khi đó, địa chỉ của ma trận A chính là địa chỉ của hàng đầu tiên của ma trận A, và cũng là địa chỉ của phần tử đầu tiên của hàng đầu tiên của ma trận A: 16
  16. Địa chỉ của ma trận A: A = A[0] = *(A+0) = &A[0][0]; Địa chỉ của hàng thứ nhất: A[1] = *(A+1) = &A[1][0]; Địa chỉ của hàng thứ i: A[i] = *(A+i) = &A[i][0]; Địa chỉ phần tử &A[i][j] = (*(A+i)) + j; Giá trị phần tử A[i][j] = *((*(A+i)) + j); Như vậy, một mảng hai chiều có thể thay thế bằng một mảng một chiều các con trỏ cùng kiểu: int A[3][3]; có thể thay thế bằng: int (*A)[3]; Con trỏ trỏ tới con trỏ Vì một mảng hai chiều int A[3][3] có thể thay thế bằng một mảng các con trỏ int (*A)[3]. Hơn nữa, một mảng int A[3] lại có thể thay thế bằng một con trỏ int *A. Do vậy, một mảng hai chiều có thể thay thế bằng một mảng các con trỏ, hoặc một con trỏ trỏ đến con trỏ. Nghĩa là các cách viết sau là tương đương: int A[3][3]; int (*A)[3]; int A; 2.3 CON TRỎ HÀM Mặc dù hàm không phải là một biến cụ thể nên không có một địa chỉ xác định. Nhưng trong khi chạy, mỗi một hàm trong C++ cũng có một vùng nhớ xác định, do vậy, C++ cho phép dùng con trỏ để trỏ đến hàm. Con trỏ hàm đượcPTIT dùng để truyền tham số có dạng hàm. Khai báo con trỏ hàm Con trỏ hàm được khai báo tương tự như khai báo nguyên mẫu hàm thông thường trong C++, ngoại trừ việc có thêm kí hiệu con trỏ “*” trước tên hàm. Cú pháp khai báo con trỏ hàm như sau: (* )([ ]); Trong đó: Kiểu dữ liệu trả về: là các kiểu dữ liệu thông thường của C++ hoặc kiểu do người dùng tự định nghĩa. Tên hàm: tên do người dùng tự định nghĩa, tuân thủ theo quy tắc đặt tên biến trong C++. Các tham số: có thể có hoặc không (phần trong dấu “[]” là tuỳ chọn). Nếu có nhiều tham số, mỗi tham số được phân cách nhau bởi dấu phẩy. Ví dụ khai báo: int (*Calcul)(int a, int b); 17
  17. là khai báo một con trỏ hàm, tên là Calcul, có kiểu int và có hai tham số cũng là kiểu int. Lưu ý: Dấu “()” bao bọc tên hàm là cần thiết để chỉ ra rằng ta đang khai báo một con trỏ hàm. Nếu không có dấu ngoặc đơn này, trình biên dịch sẽ hiểu rằng ta đang khai báo một hàm thông thường và có giá trị trả về là một con trỏ. Ví dụ, hai khai báo sau là khác nhau hoàn toàn: // Khai báo một con trỏ hàm int (*Calcul)(int a, int b); // Khai báo một hàm trả về kiểu con trỏ int *Calcul(int a, int b); Sử dụng con trỏ hàm Con trỏ hàm được dùng khi cần gọi một hàm như là tham số của một hàm khác. Khi đó, một hàm được gọi phải có khuôn mẫu giống với con trỏ hàm đã được khai báo. Ví dụ, với khai báo: int (*Calcul)(int a, int b); thì có thể gọi các hàm có hai tham số kiểu int và trả về cũng kiểu int như sau: int add(int a, int b); int sub(int a, int b); nhưng không được gọi các hàm khác kiểu tham số hoặc kiểu trả về như sau: int add(float a, int b); int add(int a); char* sub(char* a, char* b); PTIT Chương trình 2.3 minh hoạ việc khai báo và sử dụng con trỏ hàm. Chương trình 2.3 #include #include // Hàm có sử dụng con trỏ hàm như tham số void Display(char[] str, int (*Xtype)(int c)){ int index = 0; while(str[index] != ‘\0’){ cout << (*Xtype)(str[index]); // Sử dụng con trỏ hàm index ++; 18
  18. } return; } // Hàm main, dùng lời gọi hàm đến con trỏ hàm void main(){ char input[500]; cout > input; char reply; cout > reply; if(reply == ‘l’) // Hiển thị theo dạng lowercase Display(str, tolower); else // Hiển thị theo dạng uppercase Display(str, toupper); return; } Chương trình 2.3 khai báo hàm Display() có sử dụng con trỏ hàm có khuôn mẫu int (*Xtype)(int c); PTIT Trong hàm main, con trỏ hàm này được gọi bởi hai thể hiện là các hàm tolower() và hàm toupper(). Hai hàm này được khai báo trong thư viện ctype.h với mẫu như sau: int tolower(int c); int toupper(int c); Hai khuôn mẫu này phù hợp với con trỏ hàm Xtype trong hàm Display() nên lời gọi hàm Display() trong hàm main là hợp lệ. 2.4 CẤP PHÁT BỘ NHỚ CHO CON TRỎ Xét hai trường hợp sau đây: Trường hợp 1, khai báo một con trỏ và gán giá trị cho nó: int *pa = 12; Trường hợp 2, khai báo con trỏ đến phần tử cuối cùng của mảng rồi tăng thêm một đơn vị cho nó: 19
  19. int A[5] = {5, 10, 15, 20, 25}; int *pa = &A[4]; pa++; Trong cả hai trường hợp, ta đều không biết thực sự con trỏ pa đang trỏ đến địa chỉ nào trong bộ nhớ: trường hợp 1 chỉ ra rằng con trỏ pa đang trỏ tới một địa chỉ không xác định, nhưng lại chứa giá trị là 12 do được gán vào. Trường hợp 2, con trỏ pa đã trỏ đến địa chỉ ngay sau địa chỉ phần tử cuối cùng của mảng A, đó cũng là một địa chỉ không xác định. Các địa chỉ không xác định này là các địa chỉ nằm ở vùng nhớ tự do còn thừa của bộ nhớ. Vùng nhớ này có thể bị chiếm dụng bởi bất kì một chương trình nào đang chạy. Do đó, rất có thể các chương trình khác sẽ chiếm mất các địa chỉ mà con trỏ pa đang trỏ tới. Khi đó, nếu các chương trình thay đổi giá trị của địa chỉ đó, giá trị pa cũng bị thay đổi theo mà ta không thể kiểm soát được. Để tránh các rủi ro có thể gặp phải, C++ yêu cầu phải cấp phát bộ nhớ một cách tường minh cho con trỏ trước khi sử dụng chúng. 2.4.1 Cấp phát bộ nhớ động Cấp phát bộ nhớ động Thao tác cấp phát bộ nhớ cho con trỏ thực chất là gán cho con trỏ một địa chỉ xác định và đưa địa chỉ đó vào vùng đã bị chiếm dụng, các chương trình khác không thể sử dụng địa chỉ đó. Cú pháp cấp phát bộ nhớ cho con trỏ như sau: = new ; Ví dụ, khai báo: int *pa; pa = new int; PTIT sẽ cấp phát bộ nhớ hợp lệ cho con trỏ pa. Lưu ý: Ta có thể vừa cấp phát bộ nhớ, vừa khởi tạo giá trị cho con trỏ theo cú pháp sau: int *pa; pa = new int(12); sẽ cấp phát cho con trỏ pa một địa chỉ xác định, đồng thời gán giá trị của con trỏ *pa = 12. Giải phóng bộ nhớ động Địa chỉ của con trỏ sau khi được cấp phát bởi thao tác new sẽ trở thành vùng nhớ đã bị chiếm dụng, các chương trình khác không thể sử dụng vùng nhớ đó ngay cả khi ta không dùng con trỏ nữa. Để tiết kiệm bộ nhớ, ta phải huỷ bỏ vùng nhớ của con trỏ ngay sau khi không dùng đến con trỏ nữa. Cú pháp huỷ bỏ vùng nhớ của con trỏ như sau: delete ; 20
  20. Ví dụ: int *pa = new int(12); // Khai báo con trỏ pa, cấp phát bộ nhớ // và gán giá trị ban đầu cho pa là 12. delete pa; // Giải phóng vùng nhớ vừa cấp cho pa. Lưu ý: Một con trỏ, sau khi bị giải phóng địa chỉ, vẫn có thể được cấp phát một vùng nhớ mới hoặc trỏ đến một địa chỉ mới: int *pa = new int(12); // Khai báo con trỏ pa, cấp phát bộ nhớ // và gán giá trị ban đầu cho pa là 12. delete pa; // Giải phóng vùng nhớ vừa cấp cho pa. int A[5] = {5, 10, 15, 20, 25}; pa = A; // Cho pa trỏ đến địa chỉ của mảng A Nếu có nhiều con trỏ cùng trỏ vào một địa chỉ, thì chỉ cần giải phóng bộ nhớ của một con trỏ, tất cả các con trỏ còn lại cũng bị giải phóng bộ nhớ: int *pa = new int(12); // *pa = 12 int *pb = pa; // pb trỏ đến cùng địa chỉ pa. *pb += 5; // *pa = *pb = 17 delete pa; // Giải phóng cả pa lẫn pb Một con trỏ sau khi cấp phát bộ nhớ động bằng thao tác new, cần phải phóng bộ nhớ trước khi trỏ đến một địa chỉ mới hoặc cấp phát bộ nhớ mới: int *pa = new int(12); // pa được cấp bộ nhớ và *pa = 12 *pa = new int(15); // pa trỏ đến địa chỉ khác và *pa = 15. PTIT // địa chỉ cũ của pa vẫn bị coi là bận 2.4.2 Cấp phát bộ nhớ cho mảng động một chiều Cấp phát bộ nhớ cho mảng động một chiều Mảng một chiều được coi là tương ứng với một con trỏ cùng kiểu. Tuy nhiên, cú pháp cấp phát bộ nhớ cho mảng động một chiều là khác với cú pháp cấp phát bộ nhớ cho con trỏ thông thường: = new [ ]; Trong đó: Tên con trỏ: tên do người dùng đặt, tuân thủ theo quy tắc đặt tên biến của C++. Kiểu con trỏ: Kiểu dữ liệu cơ bản của C++ hoặc là kiểu do người dùng tự định nghĩa. Độ dài mảng: số lượng các phần tử cần cấp phát bộ nhớ của mảng. Ví dụ: int *A = new int[5]; 21
  21. sẽ khai báo một mảng A có 5 phần tử kiểu int được cấp phát bộ nhớ động. Lưu ý: Khi cấp phát bộ nhớ cho con trỏ có khởi tạo thông thường, ta dùng dấu “()”, khi cấp phát bộ nhớ cho mảng, ta dùng dấu “[]”. Hai lệnh cấp phát sau là hoàn toàn khác nhau: // Cấp phát bộ nhớ và khởi tạo cho một con trỏ int int *A = new int(5); // Cấp phát bộ nhớ cho một mảng 5 phần tử kiểu int int *A = new int[5]; Giải phóng bộ nhớ của mảng động một chiều Để giải phóng vùng nhớ đã được cấp phát cho một mảng động, ta dùng cú pháp sau: delete [] ; Ví dụ: // Cấp phát bộ nhớ cho một mảng có 5 phần tử kiểu int int *A = new int[5]; // Giải phóng vùng nhớ do mảng A đang chiếm giữ. delete [] A; Chương trình 2.4 minh hoạ hai thủ tục khởi tạo và giải phóng một mảng động một chiều. Chương trình 2.4 void InitArray(int *A, int length){ A = new int[length]; PTIT for(int i=0; i<length; i++) A[i] = 0; return; } void DeleteArray(int *A){ delete [] A; return; } 22
  22. 2.4.3 Cấp phát bộ nhớ cho mảng động nhiều chiều Cấp phát bộ nhớ cho mảng động nhiều chiều Một mảng hai chiều là một con trỏ đến một con trỏ. Do vậy, ta phải cấp phát bộ nhớ theo từng chiều theo cú pháp cấp phát bộ nhớ cho mảng động một chiều. Ví dụ: int A; const int length = 10; A = new int*[length]; // Cấp phát bộ nhớ cho số dòng của ma trận A for(int i=0; i #include /* Khai báo nguyên mẫu hàm */ 23
  23. void InitArray(int A, int row, int colum); void AddArray(int A, int B, int row, int colum); void DisplayArray(int A, int row, int colum); void DeleteArray(int A, int row); void InitArray(int A, int row, int colum){ A = new int*[row]; for(int i=0; i > A[i][j]; } return; } void AddArray(int A, int B, int row, int colum){ for(int i=0; i<row; i++) for(int j=0; j<colum; j++) A[i][j] += B[i][j]; return; } PTIT void DisplayArray(int A, int row, int colum){ for(int i=0; i<row; i++){ for(int j=0; j<colum; j++) cout << A[i][j] << “ ”; cout << endl; // Xuống dòng return; } void DeleteArray(int A, int row){ for(int i=0; i<row; i++) delete [] A[i]; delete [] A; 24
  24. return; } void main(){ clrscr(); int A, B, row, colum; cout > row; cout > colum; /* Khởi tạo các ma trận */ cout << “Khoi tao mang A:” << endl; InitArray(A, row, colum); cout << “Khoi tao mang B:” << endl; InitArray(B, row, colum); // Cộng hai ma trận AddArray(A, B, row, colum); // Hiển thị ma trận kết quả cout << “Tong hai mang A vaPTIT mang B:” << endl; DisplayArray(A, row, colum); // Giải phóng bộ nhớ DeleteArray(A, row); DeleteArray(B, row); return; } TỔNG KẾT CHƯƠNG 2 Nội dung chương 2 đã trình bày các vấn đề liên quan đến việc khai báo và sử dụng con trỏ và mảng trong ngôn ngữ C++: 25
  25. Con trỏ là một kiểu biến đặc biệt, nó trỏ đến địa chỉ của một biến khác. Có hai cách truy nhập đến con trỏ là truy nhập đến địa chỉ hoặc truy nhập đến giá trị của địa chỉ mà con trỏ trỏ đến. Con trỏ có thể tham gia vào các phép toán như các biến thông thường bằng phép lấy giá trị. Một con trỏ có sự tương ứng với một mảng một chiều có cùng kiểu. Một ma trận hai chiều có thể thay thế bằng một mảng các con trỏ hoặc một con trỏ trỏ đến con trỏ. Một con trỏ có thể trỏ đến một hàm, khi đó, nó được dùng để gọi một hàm như là một tham số cho hàm khác. Một con trỏ cần phải trỏ vào một địa chỉ xác định hoặc phải được cấp phát bộ nhớ qua phép toán new và giải phóng bộ nhớ sau khi dùng bằng thao tác delete. CÂU HỎI VÀ BÀI TẬP CHƯƠNG 2 1. Trong các khai báo con trỏ sau, những khai báo nào là đúng: a. int A*; b. *int A; c. int* A, B; d. int* A, *B; e. int *A, *B; 2. Với khai báo: int a = 12; PTIT int *pa; Các phép gán nào sau đây là hợp lệ: a. pa = &a; b. pa = a; c. *pa = &a; d. *pa = a; 3. Với khai báo: int A[5] = {10, 20, 30, 40, 50}; int *pa = A+2; Khi đó, *pa = ? a. 10 b. 20 26
  26. c. 30 d. 40 e. 50 4. Với đoạn chương trình: int A[5] = {10, 20, 30, 40, 50}; int *pa = A; *pa += 2; Khi đó, *pa = ? a. 10 b. 12 c. 30 d. 32 5. Với đoạn chương trình: int A[5] = {10, 20, 30, 40, 50}; int *pa = A; pa += 2; Khi đó, *pa = ? a. 10 b. 12 c. 30 d. 32 PTIT 6. Với đoạn chương trình: int A[5] = {10, 20, 30, 40, 50}; int *pa = A; pa += 2; Khi đó, pa = ? a. &A[0] b. A[2] c. &A[2] d. Không xác định 7. Với đoạn chương trình: int A[5] = {10, 20, 30, 40, 50}; int *pa = A; 27
  27. pa -= 2; Khi đó, pa = ? a. &A[0] b. &A[2] c. &A[4] d. Không xác định 8. Với đoạn chương trình: int A[3][3] = { {10, 20, 30}, {40, 50, 60}, {70, 80, 90} }; int *pa; Khi đó, để có được kết quả *pa = 50, các lệnh nào sau đây là đúng? a. pa = A + 4; b. pa = (*(A+1)) + 1; c. pa = &A[1][1]; d. pa = *((*(A+1)) + 1); 9. Giả sử ta khai báo một hàm có sử dụng con trỏ hàm với khuôn mẫu như sau: int Calcul(int a, int b, int (*Xcalcul)(int x, int y)){} Và ta có cài đặt một số hàmPTIT như sau: int add(int a, int b); void cal(int a, int b); int squere(int a); Khi đó, lời gọi hàm nào sau đây là đúng: a. Calcul(5, 10, add); b. Calcul(5, 10, add(2, 3)); c. Calcul(5, 10, cal); d. Calcul(5, 10, squere); 10. Ta muốn cấp phát bộ nhớ cho một con trỏ kiểu int và khởi đầu giá trị cho nó là 20. Lệnh nào sau đây là đúng: a. int *pa = 20; b. int *pa = new int{20}; c. int *pa = new int(20); 28
  28. d. int *pa = new int[20]; 11. Ta muốn cấp phát bộ nhớ cho một mảng động kiểu int có chiều dài là 20. Lệnh nào sau đây là đúng: a. int *pa = 20; b. int *pa = new int{20}; c. int *pa = new int(20); d. int *pa = new int[20]; 12. Xét đoạn chương trình sau: int A[5] = {10, 20, 30, 40, 50}; int *pa = A; pa = new int(2); Khi đó, *pa = ? a. 10 b. 30 c. 2 d. Không xác định 13. Xét đoạn chương trình sau: 1> int A[5] = {10, 20, 30, 40, 50}; 2> int *pa = A; 3> pa += 15; 4> delete pa; Đoạn chương trình trên có lỗiPTIT ở dòng nào? a. 1 b. 2 c. 3 d. 4 14. Viết chương trình thực hiện các phép toán cộng, trừ, nhân, chia trên đa thức. Các đa thức được biểu diễn bằng mảng động một chiều. Bậc của đa thức và các hệ số tương ứng được nhập từ bàn phím. 15. Viết chương trình thực hiện các phép toán cộng, trừ, nhân hai ma trận kích thước m*n. Các ma trận được biểu diễn bằng mảng động hai chiều. Giá trị kích cỡ ma trận (m, n) và giá trị các phần tử của ma trận được nhập từ bàn phím. 29
  29. CHƯƠNG 3 KIỂU DỮ LIỆU CẤU TRÚC Nội dung chương này tập trung trình bày các vấn đề liên quan đến kiểu dữ liệu có cấu trúc trong C++: Định nghĩa một cấu trúc Sử dụng một cấu trúc bằng các phép toán cơ bản trên cấu trúc Con trỏ cấu trúc, khai báo và sử dụng con trỏ cấu trúc Mảng các cấu trúc, khai báo và sử dụng mảng các cấu trúc Một số kiểu dữ liệu trừu tượng khác như ngăn xếp, hàng đợi, danh sách liên kết. 3.1 ĐỊNH NGHĨA CẤU TRÚC Kiểu dữ liệu có cấu trúc được dùng khi ta cần nhóm một số biến dữ liệu luôn đi kèm với nhau. Khi đó, việc xử lí trên một nhóm các biến được thực hiện như trên các biến cơ bản thông thường. 3.1.1 Khai báo cấu trúc Trong C++, một cấu trúc do người dùng tự định nghĩa được khai báo thông qua từ khoá struct: struct { ; ; PTIT ; }; Trong đó: struct: là tên từ khoá để khai báo một cấu trúc, bắt buộc phải có khi định nghĩa cấu trúc. Tên cấu trúc: là tên do người dùng tự định nghĩa, tuân thủ theo quy tắc đặt tên biến trong C++. Tên này sẽ trở thành tên của kiểu dữ liệu có cấu trúc tương ứng. Thuộc tính: mỗi thuộc tính của cấu trúc được khai báo như khai báo một biến thuộc kiểu dữ liệu thông thường, gồm có kiểu dữ liệu và tên biến tương ứng. Mỗi khai báo thuộc tính phải kết thúc bằng dấu chấm phẩy “;” như một câu lệnh C++ thông thường. Ví dụ, để quản lí nhân viên của một công ty, khi xử lí thông tin về mỗi nhân viên, ta luôn phải xử lí các thông tin liên quan như: Tên 30
  30. Tuổi Chức vụ Lương Do đó, ta sẽ dùng cấu trúc để lưu giữ thông tin về mỗi nhân viên bằng cách định nghĩa một cấu trúc có tên là Employeee với các thuộc tính như sau: struct Employeee{ char name[20]; // Tên nhân viên int age; // Tuổi nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên }; Lưu ý: Cấu trúc chỉ cần định nghĩa một lần trong chương trình và có thể được khai báo biến cấu trúc nhiều lần. Khi cấu trúc đã được định nghĩa, việc khai báo biến ở lần khác trong chương trình được thực hiện như khai báo biến thông thường, ngoại trừ việc có thêm từ khoá struct: struct , ; Ví dụ, sau khi đã định nghĩa cấu trúc Employeee, muốn có biến myEmployeee, ta khai báo như sau: struct Employee myEmployeee; 3.1.2 Cấu trúc lồng nhau Các cấu trúc có thể được định nghĩaPTIT lồng nhau khi một thuộc tính của một cấu trúc cũng cần có kiểu là một cấu trúc khác. Khi đó, việc định nghĩa cấu trúc cha được thực hiện như một cấu trúc bình thường, với khai báo về thuộc tính đó là một cấu trúc con: struct { ; // Có kiểu cấu trúc struct ; ; }; Ví dụ, với kiểu cấu trúc Employee, ta không quan tâm đến tuổi nhân viên nữa, mà quan tâm đến ngày sinh của nhân viên. Vì ngày sinh cần có các thông tin luôn đi với nhau là ngày sinh, tháng sinh, năm sinh. Do đó, ta định nghĩa một kiểu cấu trúc con cho kiểu ngày sinh: struct Date{ 31
  31. int day; int month; int year; }; khi đó, cấu trúc Employee trở thành: struct Employee{ char name[20]; // Tên nhân viên struct Date birthDay; // Ngày sinh của nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên }; Lưu ý: Trong định nghĩa các cấu trúc lồng nhau, cấu trúc con phải được định nghĩa trước cấu trúc cha để đảm bảo các kiểu dữ liệu của các thuộc tính của cấu trúc cha là tường minh tại thời điểm nó được định nghĩa. 3.1.3 Định nghĩa cấu trúc với từ khoá typedef Để tránh phải dùng từ khoá struct mỗi khi khai báo biến cấu trúc, ta có thể dùng từ khóa typedef khi định nghĩa cấu trúc: typedef struct { ; ; ; } ; Trong đó: Tên kiểu dữ liệu cấu trúc: là tên kiểu dữ liệu của cấu trúc vừa định nghĩa. Tên này sẽ được dùng như một kiểu dữ liệu thông thường khi khai báo biến cấu trúc. Ví dụ, muốn có kiểu dữ liệu có cấu trúc nhân viên, có tên là Employee, ta dùng từ khoá typedef để định nghĩa cấu trúc như sau: typedef struct { char name[20]; // Tên nhân viên int age; // Tuổi nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên 32
  32. } Employee; Khi đó, muốn có hai biến là myEmployee1 và myEmployee2 có kiểu cấu trúc Employee, ta chỉ cần khai báo như sau mà không cần từ khoá struct: Employee myEmployee1, myEmployee2; Trong ví dụ khai báo lồng cấu trúc Employee, dùng từ khoá typedef cho kiểu Date: typedef struct { int day; int month; int year; } Date; cấu trúc Employee trở thành: typedef struct { char name[20]; // Tên nhân viên Date birthDay; // Ngày sinh của nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên } Employee; Lưu ý: Khi không dùng từ khoá typedef, tên cấu trúc (nằm sau từ khoá struct) được dùng để khai báo biến cùng với từ khoá struct. Trong khi đó, khi có từ khoá typedef, tên kiểu dữ liệu cấu trúc (dòng cuối cùng trong định nghĩa) mới được dùng để khai báo biến, và không cần từ khoá struct. PTIT Khi dùng từ khoá typedef thì không thể khai báo biến đồng thời với định nghĩa cấu trúc. 3.2 CÁC THAO TÁC TRÊN CẤU TRÚC Các thao tác trên cấu trúc bao gồm: Khai báo và khởi tạo giá trị ban đầu cho biến cấu trúc Truy nhập đến các thuộc tính của cấu trúc 3.2.1 Khởi tạo giá trị ban đầu cho cấu trúc Khởi tạo biến có cấu trúc đơn Biến cấu trúc được khai báo theo các cách sau: // Nếu định nghĩa không dùng typedef struct ; 33
  33. // Nếu định nghĩa dùng typedef ; Ngoài ra, ta có thể khởi tạo các giá trị cho các thuộc tính của cấu trúc ngay khi khai báo bằng các cú pháp sau: // Nếu định nghĩa không dùng typedef struct = { , , }; Hoặc: // Nếu định nghĩa dùng typedef = { , , }; Trong đó: Giá trị thuộc tính: là giá trị khởi đầu cho mỗi thuộc tính, có kiểu phù hợp với kiểu dữ liệu của thuộc tính. Mỗi giá trị của thuộc tính được phân cách bằng dấu phẩy “,”. Ví dụ, với định nghĩa cấu trúc: PTIT typedef struct { char name[20]; // Tên nhân viên int age; // Tuổi nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên } Employee; thì có thể khai báo và khởi tạo cho một biến như sau: Employee myEmployee1 = { “Nguyen Van A”, 27, “Nhan vien”, 300f }; 34
  34. Khởi tạo các biến có cấu trúc lồng nhau Trong trường hợp các cấu trúc lồng nhau, phép khởi tạo cũng thực hiện như thông thường với phép khởi tạo cho tất cả các cấu trúc con. Ví dụ với khai báo cấu trúc như sau: typedef struct { int day; int month; int year; } Date; và: typedef struct { char name[20]; // Tên nhân viên Date birthDay; // Ngày sinh của nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên } Employee; Thì khai báo và khởi tạo một biến có kiểu Employee có thể thực hiện như sau: Employee myEmployee1 = { “Nguyen Van A”, {15, 05, 1980}, // Khởi tạo cấu trúc con “Nhan vien”, 300f PTIT }; 3.2.2 Truy nhập đến thuộc tính của cấu trúc Việc truy nhập đến thuộc tính của cấu trúc được thực hiện bằng cú pháp: . Ví dụ, với một biến cấu trúc kiểu Employee đơn: Employee myEmployee1 = { “Nguyen Van A”, 27, “Nhan vien”, 300f }; ta có thể truy xuất như sau: 35
  35. cout #include #include PTIT struct Employee{ char name[20]; // Tên nhân viên int age; // Tuổi nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên }; /* Khai báo khuôn mẫu hàm */ void Display(struct Employee myEmployee); void Display(struct Employee myEmployee){ cout << “Name: ” << myEmployee.name << endl; 36
  36. cout > myEmployee.name; cout > myEmployee.age; cout > myEmployee.role; cout > myEmployee.salary; PTIT cout #include 37
  37. #include typedef struct { int day; int month; int year; } Date; typedef struct { char name[20]; // Tên nhân viên Date birthDay; // Ngày sinh của nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên } Employee; /* Khai báo khuôn mẫu hàm */ void Display(Employee myEmployee); void Display(Employee myEmployee){ cout << “Name: ” << myEmployee.name << endl; cout << “Birth day: ” << myEmployee.birthDay.day << “/” << myEmployee.birthDay.month << “/” << myEmployee.birthDay.yearPTIT << endl; cout << “Role: ” << myEmployee.role << endl; cout << “Salary: ” << myEmployee.salary << endl; return; } void main(){ clrscr(); // Hiển thị giá trị mặc định Employee myEmployee = {“Nguyen Van A”, {15, 5, 1980}, “Nhan vien”, 300f}; cout << “Thông tin mặc định:” << endl; Display(myEmployee); 38
  38. // Thay đổi giá trị cho các thuộc tính cout > myEmployee.name; cout > myEmployee.birthDay.day; cout > myEmployee.birthDay.month; cout > myEmployee.birthDay.year; cout > myEmployee.role; cout > myEmployee.salary; cout * ; // Nếu khai báo cấu trúc có dùng typedef * ; Ví dụ, với kiểu khai báo cấu trúc: typedef struct { int day; int month; 39
  39. int year; } Date; và: typedef struct { char name[20]; // Tên nhân viên Date birthDay; // Ngày sinh của nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên } Employee; thì ta có thể khai báo một con trỏ cấu trúc như sau: Employee *ptrEmployee; Lưu ý: Cũng như khai báo con trỏ thông thường, dấu con trỏ “*” có thể nằm ngay trước tên biến hoặc nằm ngay sau tên kiểu cấu trúc. Cũng giống con trỏ thông thường, con trỏ cấu trúc được sử dụng khi: Cho nó trỏ đến địa chỉ của một biến cấu trúc Cấp phát cho nó một vùng nhớ xác định. Gán địa chỉ cho con trỏ cấu trúc Một con trỏ cấu trúc có thể trỏ đến địa chỉ của một biến cấu trúc có cùng kiểu thông qua phép gán: = & ; Ví dụ, khai báo và phép gán: PTIT Employee *ptrEmployee, myEmployee; ptrEmployee = &myEmployee; sẽ đưa con trỏ ptrEmployee trỏ đến địa chỉ của biến cấu trúc myEmployee. Cấp phát bộ nhớ động cho con trỏ cấu trúc Trong trường hợp ta muốn tạo ra một con trỏ cấu trúc mới, không trỏ vào một biến cấu trúc có sẵn nào, để sử dụng con trỏ mới này, ta phải cấp phát vùng nhớ cho nó. Cú pháp cấp phát vùng nhớ cho con trỏ cấu trúc: // Nếu khai báo cấu trúc không dùng typedef = new struct ; // Nếu khai báo cấu trúc có dùng typedef = new ; Ví dụ, cấu trúc Employee được khai báo bằng từ khoá typedef, ta có thể cấp phát vùng nhớ cho con trỏ cấu trúc như sau: 40
  40. Employee *ptrEmployee; ptrEmployee = new Employee; hoặc cấp phát ngay khi khai báo: Employee *ptrEmployee = new Employee; Sau khi cấp phát vùng nhớ cho con trỏ bằng thao tác new, khi con trỏ không được dùng nữa, hoặc cần trỏ sang một địa chỉ khác, ta phải giải phóng vùng nhớ vừa được cấp phát cho con trỏ bằng thao tác: delete ; Ví dụ: Employee *ptrEmployee = new Employee; // Thực hiện các thao tác trên con trỏ delete ptrEmployee; Lưu ý: Thao tác delete chỉ được thực hiện đối với con trỏ mà trước đó, nó được cấp phát bộ nhớ động thông qua thao tác new: Employee *ptrEmployee = new Employee; delete ptrEmployee; //đúng mà không thể thực hiện với con trỏ chỉ trỏ đến địa chỉ của một biến cấu trúc khác: Employee *ptrEmployee, myEmployee; ptrEmployee = &myEmployee; delete ptrEmployee; PTIT//lỗi Truy nhập thuộc tính của con trỏ cấu trúc Thuộc tính của con trỏ cấu trúc có thể được truy nhập thông qua hai cách: Cách 1: -> ; Cách 2: (* ). ; Ví dụ, thuộc tính tên nhân viên của cấu trúc Employee có thể được truy nhập thông qua hai cách: Employee *ptrEmployee = new Employee; cin >> ptrEmployee -> name; hoặc: cin >> (*ptrEmployee).name; Lưu ý: 41
  41. Trong cách truy nhập thứ hai, phải có dấu ngoặc đơn “()” quanh tên con trỏ vì phép toán truy nhập thuộc tính “.” có độ ưu tiên cao hơn phép toán lấy giá trị con trỏ “*”. Thông thường, ta dùng cách thứ nhất cho đơn giản và thuận tiện. Chương trình 3.2 cài đặt việc khởi tạo và hiển thị nội dung của một con trỏ cấu trúc. Chương trình 3.2 #include #include #include typedef struct { int day; int month; int year; } Date; typedef struct { char name[20]; // Tên nhân viên Date birthDay; // Ngày sinh của nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên } Employee; PTIT /* Khai báo khuôn mẫu hàm */ void InitStruct(Employee *myEmployee); void Display(Employee *myEmployee); void InitStruct(Employee *myEmployee){ myEmployee = new Employee; cout > myEmployee->name; cout > myEmployee->birthDay.day; cout > myEmployee->birthDay.month; 42
  42. cout > myEmployee->birthDay.year; cout > myEmployee->role; cout > myEmployee->salary; } void Display(Employee myEmployee){ cout name birthDay.day birthDay.month birthDay.year role salary [ ]; 43
  43. // Nếu khai báo cấu trúc có dùng typedef [ ]; Ví dụ: Employee employees[10]; là khai báo một mảng tên là employees gồm 10 phần tử có kiểu là cấu trúc Employee. Khai báo mảng động các cấu trúc Khai báo một mảng động các cấu trúc hoàn toàn tương tự khai báo một con trỏ cấu trúc cùng kiểu: // Nếu khai báo cấu trúc không dùng typedef struct * ; // Nếu khai báo cấu trúc có dùng typedef * ; Ví dụ, khai báo: Employee *employees; vừa có thể coi là khai báo một con trỏ thông thường có cấu trúc Employee, vừa có thể coi là khai báo một mảng động các cấu trúc có kiểu cấu trúc Employee. Tuy nhiên, cách cấp phát bộ nhớ động cho mảng các cấu trúc khác với một con trỏ. Đây là cách để chương trình nhận biết ta đang dùng một con trỏ cấu trúc hay một mảng động có cấu trúc. Cú pháp cấp phát bộ nhớ cho mảng động như sau: // Nếu khai báo cấu trúc không dùng typedef = new struct [ ]; // Nếu khai báo cấu trúc có dùng typedef = new [ ]; Ví dụ, khai báo: Employee *employees = new Employee[10]; sẽ cấp phát bộ nhớ cho một mảng động employees có 10 phần tử kiểu cấu trúc Employee. Truy nhập đến phần tử của mảng cấu trúc Việc truy nhập đến các phần tử của mảng cấu trúc được thực hiện như truy cập đến phần tử của mảng thông thường. Ví dụ muốn truy nhập đến thuộc tính tên nhân viên phần tử nhân viên thứ i trong mảng cấu trúc, ta viết như sau: Employee *employees = new Employee[10]; employees[i].name; Chương trình 3.3 cài đặt việc khởi tạo một mảng các nhân viên của một phòng trong một công ty. Sau đó, chương trình sẽ tìm và in ra thông tin về nhân viên có lương cao nhất và nhân viên có lương thấp nhất trong phòng. 44
  44. Chương trình 3.3 #include #include #include typedef struct { int day; int month; int year; } Date; typedef struct { char name[20]; // Tên nhân viên Date birthDay; // Ngày sinh của nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên } Employee; /* Khai báo khuôn mẫu hàm */ void InitArray(Employee *myEmployee, int length); Employee searchSalaryMax(Employee *myEmployee, int length); Employee searchSalaryMin(Employee *myEmployee, int length); void Display(Employee myEmployee);PTIT void InitArray(Employee *myEmployee, int length){ myEmployee = new Employee[length]; for(int i=0; i > myEmployee[i].name; cout > myEmployee[i].birthDay.day; cout > myEmployee[i].birthDay.month; cout << “Year of birth: ”; 45
  45. cin >> myEmployee[i].birthDay.year; cout > myEmployee[i].role; cout > myEmployee[i].salary; } return; } Employee searchSalaryMax(Employee *myEmployee, int length){ int index = 0; int maxSalary = myEmployee[0].salary; for(int i=1; i maxSalary){ maxSalary = myEmployee[i].salary; index = i; } return myEmployee[index]; } Employee searchSalaryMin(Employee *myEmployee, int length){ int index = 0; int minSalary = myEmployee[0].salary;PTIT for(int i=1; i<length; i++) if(myEmployee[i].salary < minSalary){ minSalary = myEmployee[i].salary; index = i; } return myEmployee[index]; } void Display(Employee myEmployee){ cout << “Name: ” << myEmployee.name << endl; cout << “Birth day: ” << myEmployee.birthDay.day << “/” << myEmployee.birthDay.month << “/” 46
  46. > length; // Khởi tạo danh sách nhân viên InitArray(myEmployee); // Nhân viên có lương cao nhất tmpEmployee = searchSalaryMax(myEmployee, length); Display(tmpEmployee); // Nhân viên có lương thấp nhất tmpEmployee = searchSalaryMin(myEmployee, length); Display(tmpEmployee); PTIT // Giải phóng vùng nhớ delete [] myEmployee; return; } 3.4 CÁC KIỂU DỮ LIỆU TRỪU TƯỢNG Nội dung phần này tập trung trình bày việc cài đặt một số cấu trúc dữ liệu trừu tượng, bao gồm: Ngăn xếp (stack) Hàng đợi (queue) Danh sách liên kết (list) 47
  47. 3.4.1 Ngăn xếp Ngăn xếp (stack) là một kiểu danh sách cho phép thêm và bớt các phần tử ở một đầu danh sách, gọi là đỉnh của ngăn xếp. Ngăn xếp hoạt động theo nguyên lí: phần tử nào được đưa vào sau, sẽ được lấy ra trước. Định nghĩa cấu trúc ngăn xếp Vì ta chỉ cần quan tâm đến hai thuộc tính của ngăn xếp là: Danh sách các phần tử của ngăn xếp Vị trí đỉnh của ngăn xếp nên ta có thể định nghĩa cấu trúc ngăn xếp như sau (các phần tử của ngăn xếp có kiểu int): typedef SIZE 100; typedef struct { int top; // Vị trí của đỉnh int nodes[SIZE]; // Danh sách các phần tử } Stack; Tuy nhiên, định nghĩa này tồn tại một vấn đề, đó là kích thước (SIZE) của danh sách chứa các phần tử là tĩnh. Do đó: Nếu ta chọn SIZE lớn, nhưng khi gặp ứng dụng chỉ cần một số ít phần tử cho ngăn xếp thì rất tốn bộ nhớ. Nếu ta khai báo SIZE nhỏ, thì khi gặp bài toán cần ngăn xếp có nhiều phần tử, ta sẽ không thêm được các phần tử mới vào, chương trình sẽ có lỗi. Để khắc phục hạn chế này, ta có thể sử dụng bộ nhớ động (mảng động thông qua con trỏ) để lưu danh sách các phần tử của ngăn xếp.PTIT Khi đó, định nghĩa cấu trúc ngăn xếp sẽ có dạng như sau: typedef struct { int top; // Vị trí của đỉnh int *nodes; // Danh sách các phần tử } Stack; Ta sẽ sử dụng định nghĩa này trong các chương trình ứng dụng ngăn xếp. Các thao tác trên ngăn xếp Đối với các thao tác trên ngăn xếp, ta quan tâm đến hai thao tác cơ bản: Thêm một phần tử mới vào đỉnh ngăn xếp, gọi là push. Lấy ra một phần tử từ đỉnh ngăn xếp, gọi là pop. Khi thêm một phần tử mới vào ngăn xếp, ta làm các bước như sau: 1. Số phần tử trong ngăn xếp cũ là (top+1). Do đó, ta cấp phát một vùng nhớ mới để lưu được (top+1+1) = (top+2) phần tử. 48
  48. 2. Sao chép (top+1) phần tử cũ sang vùng mới. Nếu danh sách ban đầu rỗng (top = -1) thì không cần thực hiện bước này. 3. Thêm phần tử mới vào cuối vùng nhớ mới 4. Giải phóng vùng nhớ của danh sách cũ 5. Cho danh sách nodes trỏ vào vùng nhớ mới. Chương trình 3.4a cài đặt thủ tục thêm một phần tử mới vào ngăn xếp. Chương trình 3.4a void push(Stack *stack, int node){ int *tmpNodes = new int[stack->top + 2];// Cấp phát vùng nhớ mới stack->top ++; // Tăng chỉ số của node đỉnh for(int i=0; i top; i++) // Sao chép sang vùng nhớ mới tmpNodes[i] = stack->nodes[i]; tmpNodes[stack->top] = node; // Thêm node mới vào đỉnh delete [] stack->nodes; // Giải phóng vùng nhớ cũ stack->nodes = tmpNodes; // Trỏ vào vùng nhớ mới return; } Khi lấy ra một phần tử của ngăn xếp, ta làm các bước như sau: Kiểm tra xem ngăn xếp có rỗng (top = -1) hay không. Nếu không rỗng thì thực hiện các bước tiếp theo. PTIT Lấy phần tử ở đỉnh ngăn xếp ra Cấp phát một vùng nhớ mới có (top+1) -1 = top phần tử Sao chép top phần tử từ danh sách cũ sang vùng nhớ mới (trừ phần tử ở đỉnh). Giải phóng vùng nhớ cũ Cho con trỏ danh sách trỏ vào vùng nhớ mới. Trả về giá trị phần tử ở đỉnh đã lấy ra. Chương trình 3.4b cài đặt thủ tục lấy một phần tử từ ngăn xếp. Chương trình 3.4b int pop(Stack *stack){ if(stack->top < 0){ // Kiểm tra ngăn xếp rỗng 49
  49. cout nodes[stack->top];// Lưu giữ giá trị đỉnh int *tmpNodes = new int[stack->top];// Cấp phát vùng nhớ mới for(int i=0; i top; i++) // Sao chép sang vùng nhớ mới tmpNodes[i] = stack->nodes[i]; stack->top ; // Giảm chỉ số của node đỉnh delete [] stack->nodes; // Giải phóng vùng nhớ cũ stack->nodes = tmpNodes; // Trỏ vào vùng nhớ mới return result; // Trả về giá trị node đỉnh } Áp dụng Ngăn xếp được sử dụng trong các ứng dụng thoả mãn nguyên tắc: cái nào đặt vào trước sẽ được lấy ra sau. Chương trính 3.4c minh hoạ việc dùng ngăn xếp để đảo ngược một xâu kí tự được nhập vào từ bàn phím. Chương trình 3.4c #include #include #include PTIT typedef struct { int top; // Vị trí node đỉnh int *nodes; // Danh sách phần tử } Stack; /* Khai báo nguyên mẫu hàm */ void init(Stack *stack); void push(Stack *stack, int node); int pop(Stack *stack); void release(Stack *stack); 50
  50. void init(Stack *stack){ stack = new Stack; // Cấp phát vùng nhớ cho con trỏ stack->top = -1; // Khởi tạo ngăn xếp rỗng } void push(Stack *stack, int node){ int *tmpNodes = new int[stack->top + 2];// Cấp phát vùng nhớ mới stack->top ++; // Tăng chỉ số của node đỉnh for(int i=0; i top; i++) // Sao chép sang vùng nhớ mới tmpNodes[i] = stack->nodes[i]; tmpNodes[stack->top] = node; // Thêm node mới vào đỉnh delete [] stack->nodes; // Giải phóng vùng nhớ cũ stack->nodes = tmpNodes; // Trỏ vào vùng nhớ mới return; } int pop(Stack *stack){ if(stack->top nodes[stack->top];// Lưu giữ giá trị đỉnh int *tmpNodes = new int[stackPTIT->top];// Cấp phát vùng nhớ mới for(int i=0; i top; i++) // Sao chép sang vùng nhớ mới tmpNodes[i] = stack->nodes[i]; stack->top ; // Giảm chỉ số của node đỉnh delete [] stack->nodes; // Giải phóng vùng nhớ cũ stack->nodes = tmpNodes; // Trỏ vào vùng nhớ mới return result; // Trả về giá trị node đỉnh } void release(Stack *stack){ delete [] stack->nodes; // Giải phóng vùng danh sách delete stack; // Giải phóng con trỏ return; 51
  51. } void main(){ clrscr(); Stack *stack; init(stack); // Khởi tạo ngăn xếp char strIn[250]; // Nhập chuỗi kí tự từ bàn phím cout > strIn; for(int i=0; i top > -1) // Lấy ra từ ngăn xếp cout << pop(stack); release(stack); // Giải phóng bộ nhớ return; } 3.4.2 Hàng đợi Hàng đợi (queue) cũng là một cấu trúc tuyến tính các phần tử. Trong đó, các phần tử luôn được thêm vào ở một đầu, gọi là đầu cuối hàng đợi, và việc lấy ra các phần tử luôn được thực hiện ở đầu còn lại, gọi là đầu mặt của hàng đợi. Hàng đợi hoạt động theo nguyên lí: phần tử nào được đưa vào trước, sẽ được lấy ra trước.PTIT Định nghĩa cấu trúc hàng đợi Hàng đợi có các thuộc tính: Một danh sách các phần tử có mặt trong hàng đợi. Chỉ số của phần tử đứng đầu của danh sách (front). Chỉ số phần tử cuối của danh sách (rear). Nếu dùng cấu trúc tĩnh để định nghĩa, hàng đợi có cấu trúc như sau: typedef SIZE 100; typedef struct { int front, rear; // Vị trí của đỉnh đầu, đỉnh cuối int nodes[SIZE]; // Danh sách các phần tử } Queue; 52
  52. Nếu dùng bộ nhớ động để lưu giữ hàng đợi, thì phần tử front luôn là phần tử thứ 0 của danh sách. Và rear sẽ bằng độ dài danh sách trừ đi 1. Cấu trúc động của hàng đợi: typedef struct { int front, rear; // Vị trí của đỉnh đầu, đỉnh cuối int *nodes; // Danh sách các phần tử } Queue; Thao tác trên hàng đợi Thêm một phần tử vào cuối hàng đợi Lấy một phần tử ở vị trí đầu của hàng đợi Thao tác thêm một phần tử vào cuối hàng đợi với bộ nhớ động được thực hiện tương tự với ngăn xếp. Chương trình 3.5a cài đặt thủ tục thêm một phần tử vào cuối hàng đợi động. Chương trình 3.5a void insert(Queue *queue, int node){ int *tmpNodes = new int[queue->rear + 2];// Cấp phát vùng nhớ mới queue->rear ++; // Tăng chỉ số của node đuôi if(queue->front == -1) // Nếu hàng đợi cũ rống queue->front = 0; // thì cập nhật front for(int i=0; i rear; i++) // Sao chép sang vùng nhớ mới tmpNodes[i] = queue->nodes[i]; tmpNodes[queue->rear] = node; // Thêm node mới vào đuôi delete [] queue->nodes; PTIT // Giải phóng vùng nhớ cũ queue->nodes = tmpNodes; // Trỏ vào vùng nhớ mới return; } Thao tác lấy ra một phần tử đầu của hàng đợi thực hiện theo các bước: 1. Kiểm tra tính rỗng (front = rear = -1) của hàng đợi. Nếu không rỗng mới thực hiện tiếp 2. Lấy phần tử nodes[0] ra. 3. Sao chép danh sách còn lại sang vùng nhớ mới 4. Giải phóng vùng nhớ cũ 5. Đưa danh sách trỏ vào vùng nhớ mới 6. Trả về giá trị phần tử lấy ra Chương trình 3.5b cài đặt thủ tục lấy ra một phần tử của hàng đợi động. 53
  53. Chương trình 3.5b int remove(Queue *queue){ if((queue-front nodes[queue->front]; int *tmpNodes; if(queue->rear > 0){ // Nếu có hơn 1 phần tử tmpNodes = new int[queue->rear];// Cấp phát vùng nhớ mới for(int i=0; i rear; i++)// Sao chép sang vùng nhớ mới tmpNodes[i] = queue->nodes[i]; }else // Nếu chỉ có 1 phần tử queue->front ; // Hàng đợi thành rỗng queue->rear ; // Giảm chỉ số của node đuôi delete [] queue->nodes; // Giải phóng vùng nhớ cũ queue->nodes = tmpNodes; // Trỏ vào vùng nhớ mới return result; // Trả về giá trị node đầu } PTIT Áp dụng Hàng đợi được áp dụng trong các bài toán cần cơ chế quản lí cái nào vào trước sẽ được lấy ra trước. Chương trình 3.5c minh hoạ cơ chế quản lí tiến trình đơn giản nhất của hệ điều hành: các tiến trình được quản lí theo mã tiến trình, khi xuất hiện, tiến trình được đưa vào cuối của một hàng đợi. Khi nào CPU rảnh thì sẽ lấy tiến trình đầu hàng đợi ra để thực hiện. Chương trình 3.5c #include #include typedef struct { int front, rear; // Vị trí của đỉnh đầu, đỉnh cuối 54
  54. int *nodes; // Danh sách các phần tử } Queue; /* Khai báo các nguyên mẫu hàm */ void init(Queue *queue); void insert(Queue *queue, int node); int remove(Queue *queue); void travese(Queue *queue); void release(Queue *queue); void init(Queue *queue){ queue = new Queue; // Cấp phát bộ nhớ cho con trỏ queue->front = -1; // Khởi tạo danh sách rỗng queue->rear = -1; return; } void insert(Queue *queue, int node){ int *tmpNodes = new int[queue->rear + 2];// Cấp phát vùng nhớ mới queue->rear ++; // Tăng chỉ số của node đuôi if(queue->front == -1) // Nếu hàng đợi cũ rống queue->front = 0; // thì cập nhật front for(int i=0; i rear; i++)PTIT // Sao chép sang vùng nhớ mới tmpNodes[i] = queue->nodes[i]; tmpNodes[queue->rear] = node; // Thêm node mới vào đuôi delete [] queue->nodes; // Giải phóng vùng nhớ cũ queue->nodes = tmpNodes; // Trỏ vào vùng nhớ mới return; } int remove(Queue *queue){ if((queue-front < 0)||(queue-rear < 0)){// Kiểm tra hàng đợi rỗng cout << “Queue is empty!” << endl; return 0; } 55
  55. // Lưu giữ giá trị phần tử đầu int result = queue->nodes[queue->front]; int *tmpNodes; if(queue->rear > 0){ // Nếu có hơn 1 phần tử tmpNodes = new int[queue->rear];// Cấp phát vùng nhớ mới for(int i=0; i rear; i++)// Sao chép sang vùng nhớ mới tmpNodes[i] = queue->nodes[i]; }else // Nếu chỉ có 1 phần tử queue->front ; // Hàng đợi thành rỗng queue->rear ; // Giảm chỉ số của node đuôi delete [] queue->nodes; // Giải phóng vùng nhớ cũ queue->nodes = tmpNodes; // Trỏ vào vùng nhớ mới return result; // Trả về giá trị node đầu } void travese(Queue *queue){ if(queue->front front; i nodes[i] front > -1) //Nếu danh sách không rỗng thì delete [] queue->nodes; //giải phóng vùng nhớ của danh sách delete queue; //Giải phóng vùng nhớ của con trỏ } void main(){ clrscr(); Queue *queue; 56
  56. init(queue); // Khởi tạo hàng đợi int function; do{ clrscr(); cout > function; switch(function){ case ‘1’: // Thêm vào hàng đợi int maso; cout > maso; insert(queue, maso); break; case ‘2’: // Lấy ra khỏi hàng đợi cout << “Tien trinh duoc thuc hien: ” << remove(queue) << endl; break;PTIT case ‘3’: // Duyệt hàng đợi cout<<“Cac tien trinh dang o trong hang doi la:” <<endl; travese(queue); break; }while(function != ‘5’); release(queue); // Giải phóng hàng đợi return; } 57
  57. 3.4.3 Danh sách liên kết Danh sách liên kết là một kiểu dữ liệu bao gồm một dãy các phần tử có thứ tự, các phần tử có cùng cấu trúc dữ liệu, ngoại trừ node đầu tiên của danh sách là node lưu thông tin về danh sách. Có hai loại danh sách liên kết: Danh sách liên kết đơn: mỗi node có một con trỏ trỏ đến node tiếp theo trong danh sách Danh sách liên kết kép: mỗi node có hai con trỏ, một trỏ vào node trước, một trỏ vào node tiếp theo trong danh sách. Trong phần này sẽ trình bày danh sách liên kết đơn. Danh sách liên kết kép được coi như là một bài tập mở rộng từ danh sách liên kết đơn. Định nghĩa danh sách đơn Mỗi node của danh sách đơn chứa dữ liệu của nó, đồng thời trỏ đến node tiếp theo trong danh sách, cấu trúc một node như sau: struct simple{ Employee employee; // Dữ liệu của node có kiểu Employee struct simple *next; // Trỏ đến node kế tiếp }; typedef struct simple SimpleNode; Node đầu của danh sách đơn có cấu trúc riêng, nó không chứa dữ liệu như node thường mà chứa các thông tin: Số lượng node trong danh sách (không kể bản thân nó – node đầu) Con trỏ đến node đầu tiên của danh sách Con trỏ đến node cuối cùngPTIT của danh sách Do vậy, cấu trúc node đầu của danh sách đơn là: typedef struct{ int nodeNumber; // Số lượng các node SimpleNode *front, *rear;// Trỏ đến node đầu và cuối danh sách } SimpleHeader; Các thao tác trên danh sách liên kết đơn Các thao tác cơ bản trên danh sách đơn bao gồm: Chèn thêm một node vào vị trí thứ n trong danh sách Loại ra một node ở vị trí thứ n trong danh sách Việc chèn thêm một node vào vị trí thứ n trong danh sách được thực hiện theo các bước: 1. Nếu n số phần tử của danh sách, chèn vào cuối. Trường hợp còn lại, chèn vào giữa. 58
  58. 2. Tìm node thứ n: giữ vết của hai node thứ n-1 và thứ n. 3. Tạo một node mới: cho node thứ n-1 trỏ tiếp vào node mới và node mới trỏ tiếp vào node thứ n. Chương trình 3.6a cài đặt thủ tục chèn một node vào vị trí thứ n của danh sách. Chương trình 3.6a void insert(SimpleHeader *list, int position, int value){ SimpleNode *newNode = new SimpleNode; newNode->value = value; if(position next = list->front; // Chèn vào trước node đầu list->front = newNode; // Cập nhật lại node đầu ds if(list->nodeNumber == 0) // Nếu ds ban đầu rỗng thì list->rear = newNode; // node đuôi trùng với node đầu }else if(position >= list->nodeNumber){// Chèn vào cuối ds list->rear->next = newNode; // Chèn vào sau node cuối list->rear = newNode; // Cập nhật lại node cuối ds if(list->nodeNumber == 0) // Nếu ds ban đầu rỗng thì list->front = newNode; // node đầu trùng node đuôi }else{ // Chèn vào giữa ds SimpleNode *prev = list->front, *curr = list->front; int index = 0; PTIT while(index next; index++; } newNode->next = curr; // chèn vào trước node n prev->next = newNode; // và chèn vào sau node n-1 } list->nodeNumber++; // Cập nhật số lượng node return; } Việc xoá một node ở vị trí thứ n trong danh sách được thực hiện theo các bước: 59
  59. 1. Nếu n số phần tử của danh sách, không xoá node nào. 2. Tìm node thứ n: giữ vết của ba node thứ n-1, thứ n và thứ n+1. 3. Cho node thứ n-1 trỏ tiếp vào node thứ n+1, xoá con trỏ của node thứ n. 4. Trả về node thứ n. Chương trình 3.6b cài đặt thủ tục xoá một node ở vị trí thứ n của danh sách. Chương trình 3.6b SimpleNode* remove(SimpleHeader *list, int position){ if((position = list->nodeNumber)) return NULL; // Không xoá node nào cả SimpleNode* result; if(position == 0){ // Xoá node đầu result = list->front; // Giữ node cần xoá list->front = list->front->next;// Cập nhật node đầu if(list->nodeNumber == 1) // Nếu ds chỉ có 1 node thì list->rear = list->front;// Cập nhật node cuối ds }else if(position == list->nodeNumber – 1){ result = list->rear; // Giữ node cần xoá SimpleNode *curr = list->front; while(curr->next != list->rear) curr = curr->next; // Tìm node trước của node cuối curr->next = NULL; PTIT // Xoá node rear hiện tại list->rear = curr; // Cập nhật node cuối ds }else{ SimpleNode *prev = list->front, *curr = list->front; int index = 0; while(index next; index++; } result = curr; // Giữ node cần xoá prev->next = curr->next; // Cho node n-1 trỏ đến node n+1 } 60
  60. list->nodeNumber ; // Cập nhật số lượng node return result; // Trả về node cần xoá } Áp dụng Chương trình 3.6c minh hoạ việc dùng danh sách liên kết đơn để quản lí nhân viên văn phòng với các thông tin rất đơn giản: tên, tuổi và tiền lương của mỗi nhân viên. Chương trình 3.6c #include #include #include typedef struct{ char name[25]; // Tên nhân viên int age; // Tuổi nhân viên float salary; // Lương nhân viên } Employee; struct simple{ Employee employee; // Dữ liệu của node struct simple *next; PTIT// Trỏ đến node kế tiếp }; typedef struct simple SimpleNode; typedef struct{ int nodeNumber; // Số lượng các node SimpleNode *front, *rear; // Trỏ đến node đầu và cuối ds } SimpleHeader; /* Khai báo các nguyên mẫu hàm */ void init(SimpleHeader *list); 61
  61. void insert(SimpleHeader *list, int position, Employee employee); SimpleNode* remove(SimpleHeader *list); void travese(SimpleHeader *list); void release(SimpleHeader *list); void init(SimpleHeader *list){ list = new list; // Cấp phát bộ nhớ cho con trỏ list->front = NULL; // Khởi tạo danh sách rỗng list->rear = NULL; list->nodeNumber = 0; return; } void insert(SimpleHeader *list, int position, Employee employee){ SimpleNode *newNode = new SimpleNode; newNode->employee = employee; if(position next = list->front; // Chèn vào trước node đầu list->front = newNode; // Cập nhật lại node đầu ds if(list->nodeNumber == 0) // Nếu ds ban đầu rỗng thì list->rear = newNode; // node đuôi trùng với node đầu }else if(position >= list->nodeNumber){// Chèn vào cuối ds list->rear->next = newNode;PTIT // Chèn vào sau node cuối list->rear = newNode; // Cập nhật lại node cuối ds if(list->nodeNumber == 0)// Nếu ds ban đầu rỗng thì list->front = newNode; // node đầu trùng node đuôi }else{ // Chèn vào giữa ds SimpleNode *prev = list->front, *curr = list->front; int index = 0; while(index next; index++; } newNode->next = curr; // chèn vào trước node n 62
  62. prev->next = newNode; // và chèn vào sau node n-1 } list->nodeNumber++; // Cập nhật số lượng node return; } SimpleNode* remove(SimpleHeader *list, int position){ if((position = list->nodeNumber)) return NULL; // Không xoá node nào cả SimpleNode* result; if(position == 0){ // Xoá node đầu result = list->front; // Giữ node cần xoá list->front = list->front->next;// Cập nhật node đầu if(list->nodeNumber == 1) // Nếu ds chỉ có 1 node thì list->rear = list->front;// Cập nhật node cuối ds }else if(position == list->nodeNumber – 1){ result = list->rear; // Giữ node cần xoá SimpleNode *curr = list->front; while(curr->next != list->rear) curr = curr->next;// Tìm node trước của node cuối curr->next = NULL; // Xoá node rear hiện tại list->rear = curr; // Cập nhật node cuối ds }else{ PTIT SimpleNode *prev = list->front, *curr = list->front; int index = 0; while(index next; index++; } result = curr; // Giữ node cần xoá prev->next = curr->next;// Cho node n-1 trỏ đến node n+1 } list->nodeNumber ; // Cập nhật số lượng node return result; // Trả về node cần xoá 63
  63. } void travese(SimpleHeader *list){ if(list->nodeNumber front; while(curr != NULL){ cout employee.name employee.age employee.salary next; } return; } void release(SimpleHeader *list){ SimpleNode* curr = remove(list, 0); while(curr != NULL){ delete curr; //Giải phóng vùng nhớ của node curr = remove(list, 0); } PTIT delete list; //Giải phóng vùng nhớ của con trỏ } void main(){ clrscr(); SimpleHeader *list; init(list); // Khởi tạo ds int function; do{ clrscr(); cout << “CAC CHUC NANG:” << endl; cout << “1: Them mot nhan vien” << endl; 64
  64. cout > function; switch(function){ case ‘1’: // Thêm vào ds int position; Employee employee; cout > position; cout > employee.name; cout > employee.age; cout > employee.salary; insert(list, position, employee); break; case ‘2’: // Lấy ra khỏi ds int position; coutPTIT > position; SimpleNode* result = remove(list, position); if(result != NULL){ cout employee.name employee.age employee.salary << endl; } break; 65
  65. case ‘3’: // Duyệt ds cout<<“Cac nhan vien cua phong:”<<endl; travese(list); break; }while(function != ‘5’); release(list); // Giải phóng ds return; } TỔNG KẾT CHƯƠNG 3 Nội dung chương 3 đã trình bày các vấn đề liên quan đến các kiểu dữ liệu có cấu trúc trong C++: Khai báo cấu trúc thông qua từ khoá struct Tự định nghĩa kiểu dữ liệu cấu trúc bằng từ khoá typedef. Khai báo một biến có kiểu dữ liệu cấu trúc Khai báo các cấu trúc lồng nhau. Truy nhập đến các thuộc tính của cấu trúc Khai báo con trỏ cấu trúc, cấp phát và giải phóng bộ nhớ động của con trỏ cấu trúc. Truy nhập đến các thuộc tính của con trỏ cấu trúc. Khai báo và sử dụng mảng cấu trúc Khai báo mảng cấu trúc bằng con trỏ cấu trúc. Cấp phát và giải phóng vùng nhớ của mảng động các cấu trúc. PTIT Cài đặt một số cấu trúc đặc biệt: - Ngăn xếp - Hàng đợi - Danh sách liên kết CÂU HỎI VÀ BÀI TẬP CHƯƠNG 3 1. Để định nghĩa một cấu trúc sinh viên có tên là Sinhvien, gồm có tên và tuổi sinh viên. Định nghĩa nào sau đây là đúng: a. struct Sinhvien{ char name[20]; int age; }; b. struct { 66
  66. char name[20]; int age; } Sinh vien; c. typedef struct Sinhvien{ char name[20]; int age; }; 2. Một cấu trúc được định nghĩa như sau: struct Employee{ char name[20]; int age; }; Khi đó, cách khai báo biến nào sau đây là đúng: a. Employee myEmployee; b. employee myEmployee; c. struct Employee myEmployee; d. struct employee myEmployee; 3. Một cấu trúc được định nghĩa như sau: typedef struct employee{ char name[20]; int age; } Employee; PTIT Khi đó, cách khai báo biến nào sau đây là đúng: a. Employee myEmployee; b. employee myEmployee; c. struct Employee myEmployee; d. struct employee myEmployee; 4. Với cấu trúc được định nghĩa như trong bài 3. Khi đó, cách khởi tạo biến nào sau đây là đúng: a. Employee myEmployee = {‘A’, 27}; b. Employee myEmployee = {“A”, 27}; c. Employee myEmployee = (‘A’, 27); d. Employee myEmployee = (“A”, 27); 67
  67. 5. Với cấu trúc được định nghĩa như trong bài 3. Khi đó, các cách cấp phát bộ nhớ cho biến con trỏ nào sau đây là đúng: a. Employee *myEmployee = new Employee; b. Employee *myEmployee = new Employee(); c. Employee *myEmployee = new Employee(10); d. Employee *myEmployee = new Employee[10]; 6. Định nghĩa một cấu trúc về một môn học của một học sinh có tên Subject, bao gồm các thông tin: Tên môn học, kiểu char[]; Điểm tổng kết môn học, kiểu float; 7. Định nghĩa cấu trúc về một học sinh tên là Stupid bao gồm các thông tin sau: Tên học sinh, kiểu char[]; Tuổi học sinh, kiểu int; Lớp học sinh, kiểu char[]; Danh sách điểm các môn học của học sinh, kiểu là một mảng các cấu trúc Subject đã được định nghĩa trong bài tập 6. Xếp loại học lực, kiểu char[]; 8. Khai báo một biến có cấu trúc là Stupid đã định nghĩa trong bài 7. Sau đó, thực hiện tính điểm trung bình của tất cả các môn học của học sinh đó, và viết một thủ tục xếp loại học sinh dựa vào điểm trung bình các môn học: Nếu điểm tb nhỏ hơnPTIT 5.0, xếp loại kém Nếu điểm tb từ 5.0 đến dưới 6.5, xếp loại trung bình. Nếu điểm tb từ 6.5 đến dưới 8.0, xếp loại khá Nếu điểm tb từ 8.0 trở lên, xếp loại giỏi. 9. Viết một chương trình quản lí các học sinh của một lớp, là một dãy các cấu trúc có kiểu Stupid định nghĩa trong bài 7. Sử dụng thủ tục đã cài đặt trong bài 8 để thực hiện các thao tác sau: Khởi tạo danh sách và điểm của các học sinh trong lớp. Tính điểm trung bình và xếp loại cho tất cả các học sinh. Tìm tất cả các học sinh theo một loại nhất định 10. Sử dụng cấu trúc ngăn xếp đã định nghĩa trong bài để đổi một số từ kiểu thập phân sang kiểu nhị phân: Chi số nguyên cho 2, mãi cho đến khi thương <2, lưu các số dư váo ngăn xếp. Sau đó, đọc các giá trị dư từ ngăn xếp ra, ta sẽ thu được chuỗi nhị phân tương ứng. 68
  68. 11. Mở rộng cấu trúc hàng đợi đã định nghĩa trong bài để trở thành hàng đợi có độ ưu tiên: Cho mỗi node thêm một thuộc tính là độ ưu tiên của node đó Khi thêm một node vào hàng đợi, thay vì thêm vào cuối hàng đợi như thông thường, ta tìm vị trí có độ ưu tiên phù hợp để chèn node vào, sao cho dãy các node trong hàng đợi là một danh sách có độ ưu tiên của các node là giảm dần. Việc lấy ra là không thay đổi: lấy ra phần tử ở đầu hàng đợi, chính là phần tử có độ ưu tiên cao nhất. 12. Áp dụng hàng đợi có độ ưu tiên trong bài 11 để xây dựng chương trình quản lí tiến trình có độ ưu tiên của hệ điều hành, mở rộng ứng dụng trong bài ngăn xếp. 13. Mở rộng cấu trúc danh sách liên kết đơn trong bài thành danh sách liên kết kép: Mỗi node có thêm một con trỏ prev để trỏ đến node trước nó Đối với node header, cũng cần 2 con trỏ: trỏ đến node đầu tiên và node cuối cùng của danh sách Riêng với node đầu tiên (front) của danh sách, con trỏ prev của nó sẽ trỏ đến NULL. Giống như con trỏ next của node rear. 14. Cài đặt lại hai tháo tác thêm vào một node và xoá một node ở một vị trí xác định trong một cấu trúc danh sách liên kết kép định nghĩa trong bài 13. 15. Áp dụng các định nghĩa và thao tác trong các bài 13 và 14. Cài đặt lại chương trình quản lí nhân viên ở chương trình 3.6c bằng danh sách liên kết kép. PTIT 69
  69. CHƯƠNG 4 VÀO RA TRÊN TỆP Nội dung chương này tập trung trình bày các vấn đề liên quan đến các thao tác trên tệp dữ liệu trong ngôn ngữ C++: Khái niệm tệp, tệp văn bản và tệp nhị phân Các thao tác vào ra trên tệp Phương thức truy nhập tệp trực tiếp 4.1 KHÁI NIỆM TỆP 4.1.1 Tệp dữ liệu Trong C++, khi thao tác với một tệp dữ liệu, cần thực hiện tuần tự theo các bước như sau: 1. Mở tệp tin 2. Thực hiện các thao tác đọc, ghi trên tệp tin đang mở 3. Đóng tệp tin Để thực hiện các thao tác liên quan đến tệp dữ liệu, C++ cung cấp một thư viện chứa các lớp và các hàm phục vụ cho các thao tác này. Do vậy, trong các chương trình làm việc với tệp tin, ta cần khai báo chỉ thị dùng thư viện này ngay từ đầu chương trình: #include Khai báo biến tệp PTIT Trong C++, khi khai báo một biến tệp, đồng thời ta sẽ mở tệp tương ứng theo cú pháp tổng quát bằng cách dùng kiểu fstream như sau: fstream ( , ); Trong đó: Tên biến tệp: có tính chất như một tên biến thông thường, nó sẽ được dùng để thực hiện các thao tác với tệp gắn với nó. Tên biến tệp cũng phải tuân thủ theo quy tắc đặt tên biến trong C++. Tên tệp: là tên tệp dữ liệu mà ta cần thao tác trên nó. Chế độ mở tệp: là các hằng kiểu bít đã được định nghĩa sẵn bởi C++. Nó chỉ ra rằng ta đang mở tệp tin ở chế độ nào: đọc hoặc ghi, hoặc cả đọc lẫn ghi. Ví dụ, khai báo: fstream myFile(“abc.txt”, ios::in); là khai báo một biến tệp, có tên là myFile, dùng để mở tệp tin có tên là abc.txt và tệp tin này được mở ở chế độ để đọc dữ liệu (bít chỉ thị ios::in). 70
  70. Lưu ý: Tên tệp tin có dạng một chuỗi kí tự, nếu khai báo tên tệp có đường dẫn thư mục “\” thì mỗi dấu “\” phải được viết thành “\\” để tránh bị nhầm lẫn với các kí tự đặc biệt trong C như “\n”, “\d” Ví dụ, muốn mở một tệp tên là abc.txt trong thư mục myDir để đọc, ta phải khai báo như sau: fstream myFile(“myDir\\abc.txt”, ios::in); Các chế độ mở tệp tin Các chế độ mở tệp tin được định nghĩa bởi các bít chỉ thị: ios::in: Mở một tệp tin để đọc. ios::out: Mở một tệp tin có sẵn để ghi. ios::app: Mở một tệp tin có sẵn để thêm dữ liệu vào cuối tệp. ios::ate: Mở tệp tin và đặt con trỏ tệp tin vào cuối tệp. ios::trunc: Nếu tệp tin đã có sẵn thì dữ liệu của nó sẽ bị mất. ios::nocreate: Mở một tệp tin, tệp tin này bắt buộc phải tồn tại. ios::noreplace: Chỉ mở tệp tin khi tệp tin chưa tồn tại. ios::binary: Mở một tệp tin ở chế độ nhị phân. ios::text: Mở một tệp tin ở chế độ văn bản. Lưu ý: Khi muốn mở một tệp tin đồng thời ở nhiều chế độ khác nhau, ta kết hợp các bít chỉ thị tương ứng bằng phép toán hợp bít “|”. Ví dụ, muốn mở một tệp tin abc.txtPTIT để đọc (ios::in) đồng thời với để ghi (ios::out) dưới chế độ văn bản (ios::text), ta khai báo như sau: fstream myFile(“abc.txt”, ios::in|ios::out|ios::text); 4.1.2 Tệp văn bản Để mở một tệp tin dưới chế độ văn bản, ta dùng cú pháp sau: fstream ( , ios::text); Khi đó, các thao tác đọc, ghi trên biến tệp được thực hiện theo đơn vị là các từ, được phân cách bởi dấu trống (space bar) hoặc dấu xuống dòng (enter). Ví dụ, muốn mở tệp tin baitho.txt dưới chế độ văn bản, ta khai báo như sau: fstream myBaiTho(“baitho.txt”, ios::text); 4.1.3 Tệp nhị phân Để mở một tệp tin dưới chế độ nhị phân, ta dùng cú pháp sau: 71
  71. fstream ( , ios::binary); Khi đó, các thao tác đọc, ghi trên biến tệp được thực hiện theo đơn vị byte theo kích thước các bản ghi (cấu trúc) được ghi trong tệp. Ví dụ, muốn mở tệp tin baitho.txt dưới chế độ nhị phân, ta khai báo như sau: fstream myBaiTho(“baitho.txt”, ios::binary); 4.2 VÀO RA TRÊN TỆP 4.2.1 Vào ra tệp văn bản bằng “>>” và “ ( , ios::out); 2. Ghi dữ liệu vào tệp bằng thao tác “ ; 3. Đóng tệp tin bằng lệnh close(): .close(); Chương trình 4.1 minh hoạ việc ghi dữ liệu vào tệp tin: Tên tệp tin được người dùng tự nhập vào từ bàn phím. Chương trình sẽ ghi vào tệp các kí tự do người dùng gõ vào từ bàn phím, mỗi kí tự được phân cách nhau bởi dấu trống (space bar). Chương trình dừng lại khi PTITngười dùng nhập kí tự ‘e’. Và tệp tin được kết thúc bằng một dấu xuống dòng “endl”. Chương trình 4.1 #include #include #include #include const int length = 25; // Độ dài tối đa tên tệp tin void main(){ clrscr(); 72
  72. char fileName[length], input; cout > setw(length) >> fileName; // Nhập tên tệp tin /* Mở tệp tin */ ofstream fileOut(fileName, ios::out);// Khai báo và mở tệp tin if(!fileOut){ // Không mở được tệp cout > input; // Đọc kí tự từ bàn phím fileOut >” Các bước thực hiện để đọc dữ liệu từ một tệp tin như sau: 1. Mở tệp tin theo chế độ để đọc bằng đối tượng ifstream (mở tệp tin chỉ để đọc): ifstream ( , ios::in); 2. Đọc dữ liệu từ tệp bằng thao tác “>>”: >> ; 3. Đóng tệp tin bằng lệnh close(): .close(); Chương trình 4.2 minh hoạ việc đọc dữ liệu từ tệp tin vừa sử dụng trong chương trình 4.1 ra màn hình: Tên tệp tin được người dùng tự nhập vào từ bàn phím. Chương trình sẽ đọc các kí tự trong tệp và hiển thị ra màn hình, mỗi kí tự được phân cách nhau bởi dấu trống (space bar). 73
  73. Chương trình dừng lại khi kết thúc tệp tin. Chương trình 4.2 #include #include #include #include const int length = 25; // Độ dài tối đa tên tệp tin void main(){ clrscr(); char fileName[length], output; cout > setw(length) >> fileName; // Nhập tên tệp tin /* Mở tệp tin */ ifstream fileIn(fileName, ios::in); // Khai báo và mở tệp tin if(!fileIn){ // Không mở được tệp cout > output; // Đọc kí tự từ tệp tin cout << output; // Ghi kí tự ra màn hình } cout << endl; // Xuống dòng trên màn hình /* Đóng tệp tin */ fileIn.close(); // Đóng tệp tin return; } 74
  74. Chương trình 4.3 minh hoạ việc copy toàn bộ nội dung của một tệp tin sang một tệp tin mới: Tên tệp tin nguồn và tệp tin đích được nhập từ bàn phím bởi người dùng. Tệp tin nguồn được mở ở chế độ đọc. Tệp tin đích được mở ở chế độ ghi. Đọc từng kí tự từ tệp tin nguồn và ghi ngay vào tệp tin đích. Đóng các tệp tin khi kết thúc. Chương trình 4.3 #include #include #include #include const int length = 25; // Độ dài tối đa tên tệp tin void main(){ clrscr(); char sourceFile[length], targetFile[length], data; cout > setw(length) >> sourceFile; // Nhập tên tệp tin nguồn cout > setw(length) >> targetFile; // Nhập tên tệp tin đích /* Mở tệp tin nguồn */ ifstream fileIn(sourceFile, ios::in);// Khai báo và mở tệp nguồn if(!fileIn){ // Không mở được tệp nguồn cout << “Khong the mo duoc tep tin nguon ” << sourceFile << endl; exit(1); } /* Mở tệp tin đích */ ofstream fileOut(targetFile, ios::out);// Khai báo và mở tệp đích 75
  75. if(!fileOut){ // Không mở được tệp đích cout > data; // Đọc kí tự từ tệp nguồn fileOut .open( , ); Ví dụ, đoạn chương trình: ofstream myFile(“abc.txt”, ios::out); // ghi vao file abc.txt myFile.close(); myFile.open(“xyz.txt”, ios::out|ios::app); // Them vao cuoi file xyz.txt myFile.close(); sẽ dùng biến tệp myFile (có kiểu ofstream) hai lần: một lần là dùng với tệp tin abc.txt ở chế độ mở để ghi từ đầu. Một lần khác là với tệp tin xyz.txt ở chế độ mở để ghi thêm vào cuối. 4.2.2 Vào ra tệp nhị phân bằng read và write Ghi vào tệp nhị phân bằng write Các bước thực hiện để ghi dữ liệu vào một tệp nhị phân như sau: 76
  76. 1. Mở tệp tin theo chế độ để ghi nhị phân bằng đối tượng fstream: fstream ( , ios::out|ios::binary); 2. Ghi dữ liệu vào tệp bằng thao tác “write()”: .write(char* , int ); 3. Đóng tệp tin bằng lệnh close(): .close(); Trong đó, thao tác write nhận hai tham số đầu vào như sau: Tham số thứ nhất là con trỏ kiểu char trỏ đến vùng dữ liệu cần ghi vào tệp. Vì con trỏ bắt buộc có kiểu char nên khi muốn ghi dữ liệu có kiểu khác vào tệp, ta dùng hàm chuyển kiểu: reinterpret_cast ( ); Tham số thứ hai là kích cỡ dữ liệu được ghi vào tệp. Kích cỡ này được tính theo byte, nên thông thường ta dùng toán tử: sizeof( ); Lưu ý: Khi muốn đọc, ghi các dữ liệu có cấu trúc (struct) vào tệp thì ta phải dùng ở chế độ đọc/ghi tệp nhị phân mà không thể dùng chế độ đọc/ghi ở chế độ văn bản. Khi đọc/ghi dữ liệu có kiểu cấu trúc, để toán tử sizeof() thực hiện chính xác thì các thành viên của cấu trúc không được là kiểu con trỏ. Vì toán tử sizeof() đối với con trỏ chỉ cho kích cỡ của con trỏ mà không cho kích cỡ thật của vùng dữ liệu mà con trỏ trỏ tới. Chương trình 4.4 minh hoạ việc ghi dữ liệu vào tệp tin nhị phân, dữ liệu là kiểu cấu trúc: Tên tệp tin và số lượng bảnPTIT ghi được người dùng tự nhập vào từ bàn phím. Chương trình sẽ ghi vào tệp các bản ghi có cấu trúc do người dùng gõ vào từ bàn phím. Chương trình 4.4 #include #include #include #include #include const int length = 25; // Độ dài tối đa tên tệp tin typedef struct { 77
  77. int day; // Ngày int month; // Tháng int year; // Năm } Date; typedef struct { char name[20]; // Tên nhân viên Date birthDay; // Ngày sinh của nhân viên char role[20]; // Chức vụ của nhân viên float salary; // Lương của nhân viên } Employee; void main(){ clrscr(); char fileName[length]; // Tên tệp tin cout > setw(length) >> fileName; // Nhập tên tệp tin int recordNumber; // Số lượng bản ghi cout > recordNumber; // Nhập số lượng bản ghi /* Mở tệp tin */ PTIT // Khai báo và mở tệp tin fstream fileOut(fileName, ios::out|ios::binary); if(!fileOut){ // Không mở được tệp cout << “Khong the tao duoc tep tin ” << fileName << endl; exit(1); } /* Ghi dữ liệu vào tệp tin */ Employee myEmployee; for(int i=0; i<recordNumber; i++){ cout << “Ban ghi thu ” << i+1 << endl; cout << “Name: ”; 78
  78. cin >> myEmployee.name; // Nhập tên nhân viên cout > myEmployee.birthDay.day;// Nhập ngày sinh cout > myEmployee.birthDay.month;// Nhập tháng sinh cout > myEmployee.birthDay.year;// Nhập năm sinh cout > myEmployee.role; // Nhập chức vụ cout > myEmployee.salary; // Nhập tiền lương // Ghi dữ liệu vào tệp fileOut.write(reinterpret_cast (&myEmployee), sizeof(Employee)); } /* Đóng tệp tin */ fileOut.close(); // Đóng tệp tin return; } PTIT Đọc dữ liệu từ tệp nhị phân bằng read Các bước thực hiện để đọc dữ liệu từ một tệp tin nhị phân như sau: 1. Mở tệp tin theo chế độ để đọc nhị phân bằng đối tượng fstream (mở tệp tin chỉ để ghi): fstream ( , ios::in|ios::binary); 2. Đọc dữ liệu từ tệp bằng thao tác “read()”: .read(char* , int ); 3. Đóng tệp tin bằng lệnh close(): .close(); Chương trình 4.5 minh hoạ việc đọc dữ liệu từ tệp tin vào biến có cấu trúc: Tên tệp tin được người dùng tự nhập vào từ bàn phím. Chương trình sẽ đọc các cấu trúc nhân viên trong tệp và hiển thị ra màn hình. 79
  79. Chương trình dừng lại khi kết thúc tệp tin. Chương trình 4.5 #include #include #include #include #include const int length = 25; // Độ dài tối đa tên tệp tin typedef struct { int day; // Ngày int month; // Tháng int year; // Năm } Date; typedef struct { char name[20]; // Tên nhân viên Date birthDay; // Ngày sinh của nhân viên char role[20]; // Chức vụ của nhân viên float salary; PTIT // Lương của nhân viên } Employee; void main(){ clrscr(); char fileName[length]; // Tên tệp tin cout > setw(length) >> fileName; // Nhập tên tệp tin /* Mở tệp tin */ // Khai báo và mở tệp tin fstream fileIn(fileName, ios::in|ios::binary); if(!fileIn){ // Không mở được tệp cout << “Khong the mo duoc tep tin ” << fileName << endl; 80
  80. exit(1); } /* Đọc dữ liệu từ tệp tin ra màn hình */ Employee myEmployee; while(fileIn){ fileIn.read(reinterpret_cast (&myEmployee), sizeof(Employee)); // Đọc kí tự từ tệp tin cout << myEmployee.name << “ ” << myEmployee.birthDay.day << “/” << myEmployee.birthDay.month << “/” << myEmployee.birthDay.year << “ ” << myEmployee.role << “ ” << myEmployee.salary << endl; // Ghi kí tự ra màn hình } /* Đóng tệp tin */ fileIn.close(); // Đóng tệp tin return; } 4.3 TRUY NHẬP TỆP TRỰCPTIT TIẾP 4.3.1 Con trỏ tệp tin Con trỏ tệp tin có vai trò như một đầu đọc trỏ vào một vị trí xác định của tệp và thao tác truy nhập tệp diễn ra tuần tự: Tại mỗi thời điểm, con trỏ tệp tin xác định một vị trí trên tệp mà tại đó, thao tác truy nhập tệp (đọc/ghi) được thực hiện. Sau thao tác truy nhập, con trỏ tệp tự động chuyển đến vị trí tiếp theo dựa vào kích thước đơn vị dữ liệu được truy nhập. Cách truy nhập tệp tuần tự có nhược điểm là bao giờ cũng phải bắt đầu từ đầu tệp tin, đi tuần tự cho đến vị trí cần truy nhập. Khi tệp tin có kích thước lớn thì cách truy nhập này rất tốn thời gian. Để tránh nhược điểm này, C++ cho phép truy nhập trực tiếp đến một vị trí xác định trên tệp tin bằng các phép toán: Truy nhập vị trí hiện tại của con trỏ tệp tin 81