Bài giảng Cấu trúc dữ liệu và giải thuật (501040) - Chương 11: Cây đa phân

pdf 26 trang phuongnguyen 3291
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Cấu trúc dữ liệu và giải thuật (501040) - Chương 11: Cây đa phân", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_cau_truc_du_lieu_va_giai_thuat_501040_chuong_11_ca.pdf

Nội dung text: Bài giảng Cấu trúc dữ liệu và giải thuật (501040) - Chương 11: Cây đa phân

  1. A C CẤU TRÚC DỮ LIỆU VÀ B F GIẢI THUẬT (501040) D E Chương 11: Cây đa phân G K H
  2. Định nghĩa Cây đa phân Cây rỗng Hoặc có một node gọi là gốc (root) và nhiều cây con. Biểu diễn: Mỗi node gồm có nhiều nhánh con Mỗi node có 2 liên kết first_child và next_sibling Dùng cây nhị phân 2 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  3. Biểu diễn 3 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  4. Biểu diễn dạng nhị phân Nhị phân: left = black right = color 4 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  5. Cây từ điển: Trie 5 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  6. Thiết kế Trie class Trie { public: // Add method prototypes here. private: // data members Trie_node *root; }; const int num chars = 28; struct Trie_node { // data members Record *data; Trie_node *branch[num_chars]; // constructors Trie_node( ); }; 6 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  7. Giải thuật tìm kiếm trên Trie Algorithm trie_search Input: target là khóa cần tìm Output: mẫu tin tìm thấy 1. Bắt đầu tìm từ node root với ký tự đầu tiên của target 2. while (còn node để tìm và chưa xét hết chuỗi target) 2.1. Nhảy đến node con tương ứng tùy theo ký tự từ target 2.2. Xét ký tự kế tiếp trong chuỗi target 3. if (có node và dữ liệu của nó khác rỗng) 3.1. return dữ liệu của node này 4. return not_present End trie_search 7 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  8. Mã C++ tìm kiếm trên Trie Error_code Trie :: trie_search(const Key &target, Record &x) const { int position = 0; char next_char; Trie_node *location = root; while (location != NULL && (next_char = target.key_letter(position)) !=‘ ’) { location = location->branch[alphabetic order(next char)]; position++; } if (location != NULL && location->data != NULL) { x = *(location->data); return success; } else return not present; } 8 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  9. Giải thuật thêm vào Trie Algorithm trie_insert Input: new_entry là dữ liệu cần thêm vào Output: cây sau khi thêm vào dữ liệu mới 1. if (cây rỗng) 1.1. Thêm node mới vào đây 1.2. Kết thúc 2. Bắt đầu từ node root và ký tự đầu tiên trong khóa của new_entry 3. while (vẫn chưa xét hết chuỗi của khóa của new_entry) 3.1. next_char là ký tự hiện tại trên khóa 3.2. if (node con tại vị trí next_char không có) //Tìm và thêm các node trung gian không có dữ liệu vào 3.2.1. Thêm một node có dữ liệu rỗng vào đây 3.3. Nhảy đến node con tương ứng với vị trí của next_char 3.4. Xét ký tự kế tiếp của khóa 4. Thêm dữ liệu vào node hiện tại End trie_insert 9 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  10. Mã C++ thêm vào Trie Error_code Trie :: insert(const Record &new_entry) { Error_code result = success; if (root == NULL) root = new Trie_node; int position = 0; char next_char; Trie_node *location = root; while ((next char = new entry.key letter(position)) != ‘ ’) { int next_position = alphabetic_order(next_char); if (location->branch[next_position] == NULL) location->branch[next_position] = new Trie_node; location = location->branch[next_position]; position++; } if (location->data != NULL) result = duplicate_error; else location->data = new Record(new_entry); return result; } 10 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  11. Đánh giá trie Tìm kiếm: Lần so sánh = chiều dài khóa Từ điển tiếng Anh 100.000 từ, chiều dài tối đa 15 ký tự: Trie: Số lần so sánh tối đa = 15 Tìm nhị phân = k*lg (100.000) = 17k (k: chiều dài trung bình của từ tiếng Anh) 11 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  12. Cây đa phân tìm kiếm Cây đa phân tìm kiếm bậc m: mỗi node có tối đa m nhánh con 12 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  13. Cây đa phân cân bằng (B-tree) Một B-tree bậc m là một cây đa phân tìm kiếm bậc m: 1. Tất cả các node lá ở cùng một mức. 2. Tất cả các node trung gian trừ node gốc có tối đa m nhánh con và tối thiểu m/2 nhánh con (khác rỗng). 3. Số khóa của mỗi node trung gian ít hơn một so với số nhánh con và phân chia các khóa trong các nhánh con theo cách của cây tìm kiếm. 4. Node gốc có tối đa m nhánh con, tối thiểu là 2 nhánh con khi node gốc không là node lá hoặc không có nhánh con khi cây chỉ có node gốc. 13 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  14. Ví dụ B-tree B-tree bậc 4 14 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  15. Thiết kế B-tree template class B_tree { public: // Add public methods. private: // data members B_node *root; // Add private auxiliary functions here. }; template struct B_node { // data members: int count; Record data[order − 1]; B_node *branch[order]; // constructor: B_node( ); }; 15 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  16. Giải thuật tìm kiếm trên B-tree Algorithm search_B_tree Input: subroot là gốc của cây và target là khóa cần tìm Output: dữ liệu tìm thấy 1. if (cây rỗng) 1.1. return not_present 2. else 2.1. Tìm target trên dữ liệu của subroot 2.2. if (tìm thấy) 2.2.1. return dữ liệu tìm thấy 2.3. else //Tìm không thấy sẽ ngừng tại vị trí có khóa vừa lớn hơn khóa cần //tìm, ở đó có liên kết đến nhánh con gồm các khóa nhỏ hơn nó. 2.3.1. Nhảy đến nhánh con của vị trí không tìm thấy 2.3.1. Call search_B_tree với nhánh con mới End search_B_tree 16 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  17. Mã C++ tìm kiếm trên B-tree template Error_code B_tree :: recursive_search_tree (B_node *current, Record &target) { Error_code result = not_present; int position = 0; if (current != NULL) { while (position count && target > current->data[position]) position++; if (position count && target == current->data[position]) result = success; if (result == not_present) result =recursive_search_tree(current->branch[position], target); else target = current->data[position]; } return result; } 17 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  18. Thêm vào B-tree 18 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  19. Thêm vào B-tree (tt.) 19 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  20. Thêm vào B-tree (tt.) 20 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  21. Thêm vào B-tree (tt.) 21 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  22. Xóa giá trị trên B-tree 22 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  23. Xóa giá trị trên B-tree (tt.) 23 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  24. Xóa giá trị trên B-tree (tt.) 24 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  25. Xóa giá trị trên B-tree (tt.) 25 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân
  26. 26 ĐH Bách Khoa Tp.HCM Khoa Công nghệ Thông tin Chương 11. Cây đa phân