Đề tài Bóc tách thông tin trên Web

pdf 63 trang phuongnguyen 8230
Bạn đang xem 20 trang mẫu của tài liệu "Đề tài Bóc tách thông tin trên Web", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfde_tai_boc_tach_thong_tin_tren_web.pdf

Nội dung text: Đề tài Bóc tách thông tin trên Web

  1. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Mục Lục PhầnI:Tổng quan về RSS 3 1.Lời nói đầu 3 2. RSS là gì? 3 3. Lịch sử ra đời RSS. 4 4. Các phiên bản của RSS 5 5. Ứng dụng của RSS. 6 6. Một số tiện ích đọc tin RSS . 7 7. RSS.NET là gì. 8 8. Ai sử dụng RSS.NET. 8 Phần II. Công nghệ phát triển .NET Framework. 9 Chương 1: Kiến trúc .NET. 9 1.1.Nền tảng .NET 9 1.2 .NET Framework. 10 1.3.Biên dịch và ngôn ngữ trung gian (MSIL). 11 Chương 2. Ngôn ngữ C# 13 2.1 Giới thiệu ngôn ngữ C# 13 2.2. Đặc điểm ngôn ngữ C#. 13 2.3 Các ưu điểm ngôn ngữ C#. 14 Chương3: Phát triển ứng dụng với Windows Form. 16 3.1 Tạo một Windows Form đơn giản 16 3.2 Dùng kéo thả trong Windows 20 3.3.Tạo ứng dụng Windows Form khác. 27 3.3.1.Tạo giao diện cho ứng dụng. 28 3.3.2.Quản lý điều khiển TreeView. 29 3.3.3.Quản lý sự kiện trên điều khiển cây. 32 3.3.4.Quản lý sự kiện nhấn chọn nút xóa ( Delete ) 37 3.3.5 .Tạo siêu liệu XML bằng chú thích. 49 Chương 4:Kết nối CSDL. 52 4.1.Cơ sở dữ liệu và ngôn ngữ truy vấn SQL. 52 4.2.Kiến trúc ADO.NET 52 4.3.DataProvider 53 4.3.1 DataProvider có 5 loại đối tượng: 53 4.3.2 DataProvider có hai trình cung cấp dữ liệu: 54 4.3.3 Đối tượng SqlConnection và SqlCommand. 54 4.3.4 Đối tượng DataAdapter. 55 4.4.DataSet 55 4.4.1.Đối tượng DataTable và DataColumn. 56 4.4.2 Đối tượng DataRelation. 57 4.4.3.Đối tượng DataView 57 Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 1
  2. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web 4.4.4.Đối tượng DataGridview 57 Phần III Phát triển 1 RSS Reader 59 Tài liệu tham khảo 63 Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 2
  3. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web PhầnI:Tổng quan về RSS 1.Lời nói đầu Rss coi là chìa khóa cho việc chia sẻ thông tin. Một trong những điều kì diệu nhất của web là khả năng đem đến cho người dùng những thông tin cập nhật nhật mới nhất vào bất kì thời điểm nào, không chỉ các tiêu đề tin tức mà cả nội dung mới cập nhật của toàn bộ trang web. Vậy điều gì đóng vai trò quyết định tới khả năng thể hiện thông tin trên trang web. Làm thế nào để các trang web có thể cập nhật thông tin mới nhất. Công nghệ RSS(tạm dịch là Rich Site Summary, tạm dịch: Tóm lược website đa thông tin) đóng vai trò lớn đối với điều tuyệt vời này. RSS có thể không phải công nghệ đầu tiên mà bạn nghĩ tới khi nói đến thành phần chính của web, tuy nhiên nó làm cho các thông điệp và tin tức được thể hiện với tốc độ của ánh sáng hoặc ít ra tốc độ mà chiếc modem của bạn có thể phục vụ được. 2. RSS là gì? RSS là định dạng tập tin thuộc họ XML dùng trong việc chia sẻ tức Web được nhiều bởi website tin tức và weblog. Chữ viết tắt RSS dùng để chỉ các chuẩn sau: - Rich Site Summary (RSS 0.91). - RDF Site Summary (RSS 0.9 và 1.0). - Really Simple Sydication (RSS 2.0.0). Công nghệ RSS cho phép người dùng Internet có thể đặt mua thông tin từ các websites có khả năng cung cấp RSS (RSS feeds). Chúng thường là các site có nội dung thay đổi và được thêm vào thường xuyên, để có thể dùng công nghệ này, các người quản trị site đó tạo ra hay quản lý một phần mềm chuyên dụng (như một hệ thống quản lý nội dung- content management system- CMS), với định dạng XML mà máy có thể đọc được, có thể biểu diễn các bài tin mới thành một danh sách, với một hoặc hai dòng cho mỗi bài tin và một liên kết đến bài tin đầy đủ đó. Khác với việc mua nhiều ấn bản của các tờ báo hay tạp chí in giấy, hầu hết việc mua RSS là miễn phí. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 3
  4. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Định dạng RSS là cung cấp nội dung web và tóm lược nội dung web cùng với các liên kết đến phiên bản đầy đủ của nội dung tin đó và các siêu dữ liệu (meta-data) khác. Thông tin này được cung cấp dưới dạng một tập tin XML được gọi là một RSS feed , webfeed, RSS stream, RSS channel. Cùng với việc hỗ trợ cung cấp chia sẻ thông tin, RSS cho phép những độc giả thường xuyên của website có thể theo dõi các cập nhật của site đó cùng một aggregator. Chú thích: Một chương trình gọi là một feed reader hay aggregator có thể kiểm tra xem một website có hỗ trợ RSS cho người dùng không và, nếu có, hiển thị những bài viết cập nhật nhất mà nó tìm thấy từ website đó. 3. Lịch sử ra đời RSS. RDF (Resource Description Framework) Site Summary, phiên bản đầu tiên của RSS, được tạo bởi Dan Libby của Netscape vào tháng 3-1999 dùng cho cổng điện tử My Netscape. Phiên bản này trở thành RSS 0.9. Vào tháng 7-1999, đáp trả lại lời đề nghị và góp ý, Libby đưa ra bản phác thảo ban đầu tên là RSS 0.91 (RSS viết tắt của Rich Site Summary), nhằm đơn giản hóa định dạng và tích hợp một số phần trong định dạng scriptingNews của Winter. Từ đó Libby đề xuất định dạng tương tự RSS 1.0 thông qua các gọi là Future Document. Chẳng bao lâu Netscape không còn tập trung RSS/XML, bỏ rơi định dạng đó. Một nhóm làm việc và danh sách địa chỉ email, RSS-DEV, được thành lập bởi nhiều người dùng và cộng đồng XML để tiếp tục phát triển nó. Cùng thời điểm Winter đưa ra phiên bản sửa đổi RSS 0.91 cho website Userland, vì nó đang được dùng trong sản phẩm của họ. Ông ta cho rằng đặc tả kĩ thuật của RSS 0.91 là tài sản riêng của công ty ông, Userland Software. Vì chẳng có bên nào có tuyên bố chính thức về tên của định dạng cho nên bây giờ có nhiều tên gọi. Nhóm RSS-DEV tiếp tục đưa ra RSS 1.0 vào tháng 12-2000 dựa trên bản phác thảo góp ý sửa đổi cho bản đặc tả kĩ thuật đưa ra bởi Tristan Louis. Giống với RSS 0.9 (không phải 0.91) bản này dựa vào đặc tả RDF, nhưng có tính khả mở hơn, với nhiều mục đích bắt nguồn từ các từ vựng metadata chuẩn như Dublin Core. Mười chin ngày sau, Winer cho ra phiên bản RSS 0.92, có một vài chỉnh sửa có tính tương thích với các thay đổi của RSS 0.91 dựa trên cùng bản góp ý. Vào Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 4
  5. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web tháng 4-2001, ông đưa ra bản phác thảo RSS 0.93 mà hầu hết là giống với bản RSS 0.92. Bản thảo 0.94 ra đời vào tháng 8 và thêm vào thuộc tính (attribute) type cho thành phần (element) description. Vào tháng 9-2002, Winer cho ra bản cuối cùng của RSS 0.92, bây giờ gọi là RSS 2.0 và nhấn mạnh “Really Simple Syndication” là nghĩa của ba kí tự viết tắt RSS. Đặc tả kĩ thuật của RSS 2.0 loại bỏ thuộc tính type từng được thêm vào trong RSS 0.94 và co phép người dùng có thể thêm vào thành phần mở rộng của XML namespaces. Nhiều phiên bản của RSS 2.0 đã được ra đời, nhưng chỉ số của phiên bản thì vẫn không thay đổi. Vào tháng 11-2002, thời báo NewYork Time đã bắt đầu cung cấp cho người đọc khả năng mục các tin có hỗ trợ RSS feeds liên quan đến nhiều chủ đề khác nhau. Vào tháng 1-2003 David Winer đã gọi việc dùng RSS của thời báo NewYork Time là một “điểm nhấn” trong việc đưa định dạng RSS trở thành một chuẩn. Vào tháng 7-2003, Winer và Userland Software được cấp quyền sở hữu của đặc tả kĩ thuật RSS 2.0, bởi Trung tâm Berkman về xã hội và Internet của Harvard. 4. Các phiên bản của RSS a. Version RSS 0.9 : Tạo bởi Netscape, bị thay thế bởi RSS 1.0, hiện giờ không sử dụng. b. Version RSS 0.91: Tạo bởi UserLand, bị thay thế bởi RSS 2.0, nhưng phiên bản RSS 0.91 vẫn được sử dụng; dùng chia sẻ tin tức dạng đơn giản. c. Version RSS 0.92, 0.93, 0.94: cho phép nhiều metadata hơn 0.91, bị thay thế bởi RSS 2.0; sử dụng 2.0 thay thế. d. Version RSS 1.0: Tạo bởi nhóm RSS-DEV, có nền tảng RDF, có không gian tên và mođun hóa, dùng cho ứng dụng có nền tảng RDF hoặc cần phát triển mođun cụ thể. e. Version RSS 2.0: Tạo bởi UserLand, mođun hóa các thành phần; sử dụng trong nhiều mục đích, chia sẻ nhiều siêu dữ liệu. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 5
  6. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web 5. Ứng dụng của RSS. a. WebBlog (hay gọi tắt blog): bắt đầu xuất hiện và bung nổ trong đa số người dùng Internet khoảng 1 đến 2 năm. Blog cho phép người dùng, cá nhân hoặc nhóm, có thể đưa thông tin mạng với mọi chủ đề, thông thương có liên quan đến kinh nghiệm hoặc ý kiến cá nhân. Người sử dụng RSS khi tạo ra các blog để việc cập nhật các tệp blog trở nên dễ dàng hơn và giúp người đọc có thể nhận thấy sự thay đổi . b. Chia sẻ thông tin diện rộng: Việc cung cấp thông tin rộng rãi cho nhiều chủ thể truyền thông là điều khá phổ biến trên truyền hình và các loại hình thông tấn báo chí khác. Đối với mạng lưới báo chí và truyền hình, việc tận dụng các thông tin kiểu này thường có giá thành rẻ hơn và cũng dễ dàng hơn cho việc tự tạo ra các nội dung. Thêm vào đó công chúng dễ dàng nhận biết và theo dõi các thông tin được quảng bá rộng rãi. Các website sử dụng các thông tin được cung cấp rộng rãi cho các chủ thể khác nhau với lý do tương tự. Các chủ thể có uy tín và danh tiếng thường là người khởi tạo, tổ chức và phân phối các dữ liệu dùng chung . Một vài dữ liệu được truyền tải trên web có thể được chia sẻ miễn phí giữa các website, tuy nhiên cũng có nhiều trường hợp các thông tin này được một nhà phân phối bán lại cho các chủ thể có nhu cấu. Nhiều website sử dụng RSS như một công cụ để cập nhật các thông tin mới liên quan tới trang web hoặc các sản phẩm mới. Lấy ví dụ một website đăng tải các thông tin về một sản phẩm cụ thể nào đó, chẳng hạn như Linux, có thể tự động thu thập các dữ liệu RSS từ nhiều website về Linux khác nhằm cung cấp cho khách hàng một kho thông tin chưa đầy các thông tin cập nhật về hệ điều hành này. Trong trường hợp này sử dụng RSS sẽ tiết kiệm thời gian hơn nhiều so với việc webmaster truy cập từng website Linux và cập nhật thông tin một cách thủ công. c. Tập hợp thông tin. Khi đề cập RSS, sự tập hợp thông tin có liên quan mật thiết tới khái niệm chia sẻ thông tin trên diện rộng. Nếu một website thu thập nhiều RSS và sau đó phân phối lại chúng , điều đó đồng nghĩa với sự tập hợp thông tin. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 6
  7. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Các site khác nhau sử dụng các phương pháp tập hợp thông tin khác nhau. Một vài site có thể lựa chọn các nguồn RSS cho mục tiêu duy nhất là cung cấp chúng cho người sử dụng. Các site khác lại tập hợp thông tin để truyền tải dữ liệu RSS đến các website khác nhằm giúp các site này tìm kiếm từ RSS các dữ liệu mà họ muốn hiển thị trên web. Một website tập hợp thông tin cũng có thể tích hợp một số tính năng cá nhân để giúp bạn tìm kiếm thông tin một cách nhanh chóng và dễ dàng hơn. Chẳng hạn, site đó có thể dấu các nguồn RSS mà bạn đã truy cập. Cũng có thể các nguồn RSS sẽ được phân loại nhằm tăng cường tính cấu trúc và hệ thông của toàn bộ website. d. Sức mạnh của RSS. Một trong những lý do quan trọng nhất cho việc ứng dụng RSS là khả năng của nó trong việc tiếp cận với người dùng mà không cần phải phát động một chiến dịch quảng cáo rầm rộ và tốn kém. Nếu bạn có thông tin hấp dẫn trên web của bạn, RSS có thể giúp bạn giới thiệu và truyền tải tới người dùng và thu hút sự quan tâm của khách hàng. Đối với những ai chỉ đơn thuần sử dụng Internet và không cần tới tính năng quảng cáo của RSS, công nghệ này giúp họ tìm kiếm các thông tin quan trọng qua các nguồn RSS, thậm chí từ các website mà họ ít khi hoặc không bao giờ truy nhập. 6. Một số tiện ích đọc tin RSS . Abilon: Chương trình có tốc độ xử lý nhanh này cho phép bạn lựa chọn nhiều cách hiển thị và tích hợp một trình duyệt dạng thẻ (tab). Abilon có khả năng nhanh chóng đồng bộ và trích xuất các tập tin OPML , dùng để chuyển danh sách nguồn tin hiện có sang một trình đọc RSS khác. RssReader: Bạn có thể xem tất cả các nội dung của một nguồn tin hay một nhóm nguồn tin trong một cửa sổ có khả năng cuộn.Thực hiện đồng bộ tập tin OPML dung lượng lớn còn chậm. Feedreader: chỉ hiển thị nội dung một tin tại cùng một thời điểm.Thực hiện đồng bộ tập tin OPML dung lượng lớn còn chậm. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 7
  8. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web 7. RSS.NET là gì. RSS là mã nguồn mở lớp thư viện .NET cho RSS feeds. Nó cung cấp kiểu đối tượng dùng lại cho việc phân tích và viết RSS feeds. RSS.NET tương thích bới các phiên bản của RSS 0.9, 0.91, 0.92, 2.0.1 đều xây dựng được. 8. Ai sử dụng RSS.NET. Sử dụng RSS.NET trong thương mại, cài đặt sẵn, mã nguồn mở, cho những người phát triển phần mềm sử dụng RSS.NET. Nhưng người sử dụng đầu cuối không thể dùng RSS.NET đúng hướng. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 8
  9. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Phần II. Công nghệ phát triển .NET Framework. Chương 1: Kiến trúc .NET. 1.1.Nền tảng .NET Khi Microsoft công bố C# vào tháng 7 năm 2000, việc khánh thành nó chỉ là mootj phần trong số rất nhiều mà sự kiện mà nền tảng .NET được công bố. Nền tảng .Net là bộ khung phát triển ứng dụng mới, nó cung cấp một lập trình giao diện ứng dụng (Application Programming Interface-API) mới mẻ cho các dịch vụ và hệ điều hành của Windows, cụ thể là Windows 2000, nó cũng mang nhiều kĩ thuật khác nổi bật của Microsoft suốt từ những năm 90. Trong số đó có các dịch vụ COM+, công nghệ APS, XML và thiết kế đối tượng, hỗ trợ các giao thức dịch vụ hỗ trợ Web mới như SOAP, WSDL và UDDL với trọng tâm là Internet, tất cả được tích hợp trong kiến trúc DNA. Nền tảng .Net gồm 4 nhóm sau: 1. Một tập hợp các ngôn ngữ, bao gồm C# và Visual Basic .Net; một tập các công cụ phát triển bao gồm Visual Studio .Net; một tập đầy đủ các thư viện phục vụ cho việc xây dựng các ứng dụng web, các dịch vụ web và các ứng dụng Windows; còn có CLR-Common Language Runtime: (ngôn ngữ thực thi dùng chung) để thực thi các đối tượng được xây dựng trên bộ khung này. 2. Một tập các Sever xí nghiệp .Net như SQL 2000, Exchange 2000, BizTalk 2000, chúng cung cấp các chức năng cho việc lưu trữ dữ liệu quan hệ, thư điện tử, thương mại điện tử B2B, 3. Các dịch web thương mại miễn phí, dự án Hailstorm; nhà phát triển có thể dùng các dịch vụ này để xây dựng các ứng dụng đòi hỏi về tri thức định danh người dùng 4. .Net cho các thiết bị không phải PC như điện thoại(cell phone), thiết bị game. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 9
  10. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web 1.2 .NET Framework. .Net hỗ trợ tích hợp ngôn ngữ, tức là ta có thể kế thừa các lớp, bắt các biệt lệ, đa hình thông qua nhiều ngôn ngữ. .Net Framework thực hiện các được việc này nhờ vào đặc tả Common Type System-CTS(hệ thống kiểu chung) mà tất cả các thành phần .Net đều tuân theo. Ví dụ mọi thứ trong .Net đều là đối tượng; thừa kế từ lớp gốc System.Object. Ngoài ra .Net còn bao gồm Common Language Specification-CLS(đặc tả ngôn ngữ chung). Nó cung cấp các qui tắc cơ bản mà ngôn ngữ muốn tích hợp phải thỏa mãn. CLS chỉ ra các yêu cầu tối thiểu của ngôn ngữ hỗ trợ .Net. Trình biên dịch tuân theo CLS sẽ tạo các đối tượng có thể tương hợp với các đối tượng khác. Bộ thư viện lớp với khung ứng dụng (Framework Class Library-FCL) có thể dùng bởi bất kì ngôn ngữ nào tuân theo CLS. .Net Framework nằm ở tầng trên của hệ điều hành (bất kì hệ điều hành nào không chỉ là Windows) .Net Framewok bao gồm: - Bốn ngôn ngữ chính: C#, VB.Net, C++, và Jscript.Net. - Common Language Runtime-CLR, nền tảng hướng đối tượng cho phát triển ứng dụng Windows và web mà các ngôn ngữ có thể chia sẻ sử dụng. - Bộ thư viện Framework Class Library-FCL. Hình 1. Kiến trúc khung ứng dụng .Net Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 10
  11. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Thành phần quan trọng nhất của .Net là CLR, nó cung cấp môi trường cho ứng dụng thực thi, CLR là một máy ảo, tương tự như máy ảo Java. CLR kích họat đối tượng, thực hiện kiểm tra bảo mật, cấp phát bộ nhớ thực thi và thu dọn chúng. Hình 1. Tầng trên của CLR bao gồm: - Các lớp cơ sở - Các lớp dữ liệu và XML. - Các lớp cho dịch vụ web, web form, và windows form. Các lớp này gọi chung FCL, Framework Class Library, cung cấp API hướng đối tượng cho tất cả các chức năng của .Net Framework (hơn 5000 lớp). Các lớp cơ sở tương tự với các lớp trong Java. Các lớp này hỗ trợ các thao tác nhập xuất, thao tác chuỗi, văn bản, quản lý bảo mật truyền thông mạng, quản lý tiến trình và các chức năng tổng hợp khác Trên mức này là lớp dữ liệu và XML. Lớp dữ liệu hỗ trợ việc thao tác các dữ liệu trên cơ sở dữ liệu. Các lớp này bao gồm các lớp SQL (Structure Query Language: ngôn ngữ truy vấn có cấu trúc) cho phép ta thao tác dữ liệu thông qua một SQL chuẩn. Ngoài ra còn có một tập các lớp goi là ADO.Net cũng cho phép thao tác dữ liệu. Lớp XML hỗ trợ thao tác XML, tìm kiếm và diễn dịch XML. Trên lớp dữ liệu và XML và các hỗ trợ xây dựng các ứng dụng Windows (Windons forms), ứng dụng web (Web forms), dịch vụ web (Web Services). 1.3.Biên dịch và ngôn ngữ trung gian (MSIL). Với .Net chương trình không biên dịch thành tập tin thực thi, mà biên dịch ngôn ngữ trung gian (MSIL- Microsoft Intermediate Language, viết tắt là IL), sau đó chúng được CLR thực thi. Các tập tin IL biên dịch từ C# đồng nhất với các tập tin IL biên dịch từ ngôn ngữ .Net khác. Khi biên dịch dự án, mã nguồn C# được chuyển thành tập tin IL lưu trên đĩa. Khi chạy chương trình thì IL được biên dịch (hay thông dịch) một lần nữa bằng trình Just In Time –JIT, khi nầy két quả là mã máy và bộ xử lý được thực thi. Trình biên dịch JIT chỉ chạy khi có yêu cầu. Khi mọi phương thức được gọi, JIT phân tích IL và sinh ra mã máy tối ưu cho từng loại máy. JIT có thể nhận biết mã Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 11
  12. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web nguồn đã được biên dịch chưa, để có thể chạy ngay ứng dụng hay phải biên dịch lại. CLS có nghĩa là các ngôn ngữ .Net cùng sinh ra mã IL. Các đối tượng được tạo theo một ngôn ngữ nào đó sẽ được truy cập và thừa kế bởi các đối tượng của ngôn ngữ khác. Vì vậy ta có tạo được một lớp cơ sở trong Vb.Net và thừa kế nó từ C#. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 12
  13. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Chương 2. Ngôn ngữ C# 2.1 Giới thiệu ngôn ngữ C# Ngôn ngữ C# khá đơn giản, chỉ khoảng 80 từ khóa và hơn mười mấy kiểu dữ liệu được xây dựng sẵn. Tuy nhiên ngôn ngữ C# có ý nghĩa cao khi nó thực thi những khái niệm lập trình hiện đại. C# bao gồm tất cả những hỗ trợ cho cấu trúc, thành phần, lập trình hướng đối tượng. Những tính chất đó hiện diện trong ngôn ngữ lập trình hiện đại. Và ngôn ngữ C# hội tụ những điều kiện như vậy, hơn nữa nó được xây dựng trên nền tảng của hai ngôn ngữ mạnh nhất là C++ và Java. Ngôn ngữ C# được phát triển bởi đội ngũ kỹ sư của Microsoft, trong đó người dẫn đầu là Anders Hejlsberg và Scott Wiltamuth. Cả hai người nay đều là những người nổi tiếng trong đó Anders Hejlsberg được biết đến là tác giả của Turbo Pascal, một ngôn ngữ lập trình PC phổ biến. Và ông đứng đầu nhóm thiết kế Borland Delphi. Một trong những thành công đầu tiên của việc xây dựng môi trường phát triển thích hợp (IDE) cho lập trình client/server. 2.2. Đặc điểm ngôn ngữ C#. Trọng tâm của ngôn ngữ hướng đối tượng là lớp. Lớp định nghĩa kiểu dữ liệu mới, cho phép mở rộng ngôn ngữ theo hướng cần giải quyết. C# có những từ khóa dành cho việc khai báo lớp, phương thức, thuộc tính(property). C# hỗ trợ đầy đủ khái niệm trong lập trình hướng đối tượng: đóng gói, kế thừa, đa hình Trong C# mọi thứ liên quan đến khai báo lớp đều được tìm thấy trong phần khai báo của nó. Định nghĩa một lớp trong ngôn ngữ C# không đòi hỏi phải chia ra tập tin header và tập tin nguồn giống như trong ngôn ngữ C#. Hơn nữa ngôn ngữ C# hỗ trợ kiểu XML, cho phép chèn các tag XML để phát sinh tự đông các document cho lớp. C# hỗ trợ khái niệm giao diện interfaces (tương tự Java). Một lớp chỉ có thể kế thừa duy nhất một lớp cha nhưng có thể cài đặt nhiều giao diện. C# có kiểu cấu trúc, struct (không giống C++). Cấu trúc là kiểu hạng nhẹ và bị giới hạn. Cấu trúc không thể thừa kế lớp hay được kế thừa nhưng có thể cài đặt giao diện. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 13
  14. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web C# cung cấp những đặc trưng lập trình hướng đối tượng như property, sự kiện và dẫn hướng khai báo (được gọi là attribute). Lập trình hướng đối tượng được hỗ trợ bởi CLR thông qua siêu dữ liệu (metadata). Siêu dữ liệu mô tả các lớp bao gồm các phương thức và thuộc tính, các thông tin bảo mật, Assembly là một tập hợp các tập tin theo cách nhìn của lậpn trình viên là các thư viện liên kết động (DLL) hay tập tin (EXE). Trong .Net một assembly là một đơn vị của việc tái sử dụng xác định phiên bản, bảo mật và phân phối. CLR cung cấp một số các lớp để thao tác với assembly. C# cũng cho truy cập trực tiếp bộ nhớ dùng con trỏ kiểu C++, nhưng vùng mã đó được xem như không an toàn. CLR sẽ không thục thi việc thu dọn rác tự động các đối tượng được tham chiếu bởi các con trỏ cho đến khi lập trình viên tự giải phóng. 2.3 Các ưu điểm ngôn ngữ C#. - C# là ngôn ngữ đơn giản. Ngôn ngữ C# là ngôn ngữ đơn giản vì nó dựa trên nền tảng C và C++. C# khá giống về diện mạo, cú pháp biểu thức, toán tử và những chức năng khác được lấy trực tiếp từ ngôn ngữ C và C++ nhưng nó đã được cải tiến làm cho ngôn ngữ đơn giản hơn. - C# là ngôn ngữ hiện đại. Ngôn ngữ C# chứa các đặc tính sau: xử lý ngoại lệ, thu gom bộ nhớ tự động, những kiểu dữ liệu mở rộng và bảo mật mã nguồn. - C# là ngôn ngữ hướng đối tượng. Những đặc điểm chính của ngôn ngữ hướng đối tượng (Object –oriented language) là sự đóng gói (encapsulation), sự kế thừa (inheritance), và đa hình (polymorphism). C# hỗ trợ tất cả các đặc tính trên. - C# là ngôn ngưc mạnh và cũng mềm dẻo, Ngôn ngữ C# chúng ta chỉ bị giới hạn bởi chính bản than hay là trí tưởng tượng của chúng ta, Ngôn ngữ này không đặt những ràng buộc lên những việc có thể làm. C# được sử dụng cho nhiều các dự án khác nhau như là tạo ứng dụng xử lý văn bản, ứng dụng đồ họa, bàn tính, thạm chí những biên dịch cho các ngôn ngữ khác. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 14
  15. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web - C# ngôn ngữ hướng module. Mã nguồn C# có thể được viết trong những phần được gọi là những lớp, những lớp này chứa các phương thức thành viên của nó. Những lớp và phương thức có thể sử dụng lại trong ứng dụng hay các chương trình khác. Bằng cách truyền các mẫu thông tin đến những lớp hay phương thức chúng ta có thể tạo ra những mã nguồn dùng lại có hiệu quả. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 15
  16. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Chương3: Phát triển ứng dụng với Windows Form. 3.1 Tạo một Windows Form đơn giản Windows Form là công cụ dùng để tạo các ứng dụng Windows, nó mượn các ưu điểm mạnh của ngôn ngữ Visual Basic : dễ sử dụng, hỗ trợ mô hình RAD đồng thời kết hợp với tính linh động, hướng đối tượng của ngôn ngữ C#. Việc tạo ứng dụng Windows trở lên hấp dẫn và quen thuộc với các lập trình viên.Trong phần này, ta sẽ thảo luận hai cách khi tạo một ứng dụng Windows : Dùng bộ soạn mã để gõ mã trực tiếp hoặc dùng bộ công cụ kéo thả của IDE. Ứng dụng của chúng ta khi chạy sẽ xuất dòng chữ “Hello World!” ra màn hình, khi người dùng nhấn vào Button “Cancel” thì ứng dụng sẽ kết thúc. Hình 2- Ứng dụng minh họa việc hiển thị chuỗi và bắt sự kiện của Button. Đầu tiên, ta dùng lệnh using để thêm vùng tên sau : using System.Windows.Forms; Ta sẽ cho ứng dụng của ta thừa kế từ vùng tên Form : public class HandDrawnClass : Form Bất kỳ một ứng dụng Windows Form nào cũng đều thừa kế từ đối tượng Form, ta có thể dùng đối tượng này để tạo ra các cửa sổ chuẩn như : các cửa sổ trôi (floating form), thanh công cụ (tools), hộp thoại (dialog box) Mọi Điều khiển trong bộ công cụ của Windows Form (Label, Button, Listbox ) đều thuộc vùng tên này. Ta sẽ khai báo 2 đối tượng, một Label để giữ chuỗi „ Hello World !‟ và một Button để bắt sự kiện kết thúc ứng dụng. private System.Windows.Forms.Label lblOutput; Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 16
  17. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web private System.Windows.Forms.Button btnCancel; Tiếp theo ta sẽ khởi tạo 2 đối tượng trên trong hàm khởi tạo của Form: this.lblOutput = new System.Windows.Forms.Label( ); this.btnCancel = new System.Windows.Forms.Button( ); Sau đó ta gán chuỗi tiêu đề cho Form của ta là „Hello World„ : this.Text = "Hello World"; Gán vị trí, chuỗi và kích thước cho đối tượng Label : lblOutput.Location = new System.Drawing.Point (16, 24); lblOutput.Text = "Hello World!"; lblOutput.Size = new System.Drawing.Size (216, 24); Vị trí của Label được xác định bằng một đối tượng Point, đối tượng này cần hai thông số : vị trí so với chiều ngang (horizontal) và đứng (vertical) của thanh cuộn. Kích thước của Label cũng được đặt bởi đối tượng Size, với hai thông số là chiều rộng (width) và cao (height) của Label. Cả hai đối tượng Point và Size đều thuộc vùng tên System.Drawing : chứa các đối tượng và lớp dùng cho đồ họa. Tương tự làm với đối tượng Button : btnCancel.Location = new System.Drawing.Point (150,200); btnCancel.Size = new System.Drawing.Size (112, 32); btnCancel.Text = "&Cancel"; Để bắt sự kiện click của Button, đối tượng Button cần đăng ký với trình quản lý sự kiện, để thực hiện điều này ta dùng „delegate‟. Phương thức được ủy thác (sẽ bắt sự kiện) có thể có tên bất kỳ nhưng phải trả về kiểu void và phải có hai thông số : một là đối tượng „sender‟ và một là đối tượng „System.EventArgs‟. protected void btnCancel_Click( object sender, System.EventArgs e) { // } Ta đăng ký phương thức bắt sự kiện theo hai bước. Đầu tiên, ta tạo một trình quản lý sự kiện mới System.EventHandler, rồi đẩy tên của phương thức bắt sự kiện vào làm tham số : new System.EventHandler (this.btnCancel_Click); Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 17
  18. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Tiếp theo ta sẽ ủy thác trình quản lý vừa tạo ở trên cho sự kiện click của Button bằng toán tử +=.Mã gộp của hai bước trên : one:btnCancel.Click +=new System.EventHandler (this.btnCancel_Click); Để kết thúc việc viết mã trong hàm khởi tạo của Form, ta sẽ thêm hai đối tượng Label và button vào Form của ta : this.Controls.Add (this.btnCancel); this.Controls.Add (this.lblOutput); Sau khi ta đã định nghĩa hàm bắt sự kiện click trên Button, ta sẽ viết mã thi hành cho hàm này. Ta sẽ dùng hàm tĩnh ( static ) Exit() của lớp Application để kết thúc ứng dụng : protected void btnCancel_Click( object sender, System.EventArgs e) { Application.Exit(); } Cuối cùng, ta sẽ gọi hàm khởi tạo của Form trong hàm Main(). Hàm Main() là điểm vào đầu tiên của Form. public static void Main( ) { Application.Run(new HandDrawnClass( )); } Sau đây là mã hoàn chỉnh của toàn bộ ứng dụng using System; using System.Windows.Forms; namespace ProgCSharp { public class HandDrawnClass : Form { // Label dùng hiển thị chuỗi „Hello World‟ private System.Windows.Forms.Label lblOutput; // Button nhấn „Cancel‟ Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 18
  19. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web private System.Windows.Forms.Button btnCancel; public HandDrawnClass( ) { // Tạo các đối tượng this.lblOutput = new System.Windows.Forms.Label ( ); this.btnCancel = new System.Windows.Forms.Button ( ); // Gán tiêu đề cho Form this.Text = "Hello World"; // Hiệu chỉnh Label lblOutput.Location = new System.Drawing.Point(16,24); lblOutput.Text = "Hello World!"; lblOutput.Size = new System.Drawing.Size (216, 24); // Hiệu chỉnh Button btnCancel.Location = newSystem.Drawing.Point(150,20); btnCancel.Size = new System.Drawing.Size (112, 32); btnCancel.Text = "&Cancel"; // Đăng ký trình quản lý sự kiện btnCancel.Click += new System.EventHandler (this.btnCancel_Click); //Thêm các điều khiển vào Form this.Controls.Add (this.btnCancel); this.Controls.Add (this.lblOutput); } // Bắt sự kiện nhấn Button protected void btnCancel_Click(object sender, EventArgs e) { Application.Exit( ); } // Chạy ứng dụng public static void Main() { Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 19
  20. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Application.Run(new HandDrawnClass( )); } } } 3.2 Dùng kéo thả trong Windows Bên cạnh trình soạn mã, .NET còn cung cấp một bộ các công cụ kéo thả để làm việc trong môi trường phát triển tích hợp IDE ( Intergrate Development Enviroment ), IDE cho phép kéo thả rồi tự động phát sinh mã tương ứng. Ta sẽ tạo lại ứng dụng trên bằng cách dùng bộ công cụ trong Visual Studio, ta mở Visual Studio và chọn „New Project‟. Trong cửa sổ „New Project‟, chọn loại dự án là Visual C# và kiểu ứng dụng là „Windows Applications‟, đặt tên cho ứng dụng là ProgCSharpWindowsForm. Hình 3:Màn hình tạo ứng dụng Windows mới. Vs.NET sẽ tạo một ứng dụng Windows mới và đặt chúng vào IDE như hình dưới : Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 20
  21. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Hình 3 Môi trường thiết kế kéo thả Phía bên trái của cửa hình trên là một bộ các công cụ (Toolbox) kéo thả dành cho các ứng dụng Windows Form, chính giữa là một Form được .NET tạo sẵn có tên Form1. Với bộ công cụ trên, ta có thể kéo và thả một Label hay Button trực tiếp vào Form, như hình sau : Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 21
  22. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Với thanh công cụ Toolbox ở bên trái, ta có thể thêm các thành phần mới vào nó bằng các chọn View/Add Reference. Gó bên phải phía trên là cửa sổ duyệt toàn bộ các tập tin trong giải pháp (Solution, một giải pháp có một hay nhiều dự án con). Phía dưới là cửa sổ thuộc tính, hiển thị mọi thuộc tính về mục chọn hiện hành. Ta có thể gán giá trị chuỗi hiển thị hoặc thay đổi font cho Label một cách trực tiếp trong cửa sổ thuộc tính. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 22
  23. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Hình 5 Thay đổi Font trực tiếp bằng hội thoại Font Với IDE này, ta có thể kéo thả một Button và bắt sự kiện click của nó một cách dễ dàng, chỉ cần Nhấn đúp vào Button thì tự động .NET sẽ phát sinh ra các mã tương ứng trong trang mã của Form (Code-Behind page) như : khai báo, tạo Button và hàm bắt sự kiện click của Button. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 23
  24. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Hình 6 Sau khi click đúp nút Cancel Bây giờ, ta chỉ cần gõ thêm một dòng code nữa trong hàm bắt sự kiện của Button là ứng dụng có thể chạy được y như ứng dụng mà ta đã tạo bằng cách gõ code trong phần trên. Application.Exit( ); Sau đây là toàn bộ mã được phát sinh bởi IDE và dòng mã bạn mới gõ vào : using System; using System.Drawing; using System.Collections; using System.ComponentModel; using System.Windows.Forms; using System.Data; namespace ProgCSharpWindowsForm { Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 24
  25. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web /// /// Summary description for Form1. /// public class Form1 : System.Windows.Forms.Form { private System.Windows.Forms.Label lblOutput; private System.Windows.Forms.Button btnCancel; /// /// Required designer variable. /// private System.ComponentModel.Container components; public Form1( ) { InitializeComponent( ); } public override void Dispose( ) { base.Dispose( ); if(components != null) components.Dispose( ); } #region Windows Form Designer generated code /// /// Required method for Designer support - do not modify /// the contents of this method with the code editor. /// private void InitializeComponent( ) { this.lblOutput = new System.Windows.Forms.Label( ); this.btnCancel = new System.Windows.Forms.Button( ); this.SuspendLayout( ); Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 25
  26. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web // // lblOutput // this.lblOutput.Font = new System.Drawing.Font("Arial", 15.75F, System.Drawing.FontStyle.Bold, System.Drawing.GraphicsUnit.Point,((System.Byte)(0))); this.lblOutput.Location = new System.Drawing.Point(24, 16); this.lblOutput.Name = "lblOutput"; this.lblOutput.Size = new System.Drawing.Size(136, 48); this.lblOutput.TabIndex = 0; this.lblOutput.Text = "Hello World"; // btnCancel this.btnCancel.Location = new System.Drawing.Point(192, 208); this.btnCancel.Name = "btnCancel"; this.btnCancel.TabIndex = 1; this.btnCancel.Text = "Cancel"; this.btnCancel.Click += new System.EventHandler( this.btnCancel_Click ); this.AutoScaleBaseSize = new System.Drawing.Size(5, 13); this.ClientSize = new System.Drawing.Size(292, 273); this.Controls.AddRange(new System.Windows.Forms.Control[]{ this.btnCancel, this.lblOutput}); this.Name = "Form1"; this.Text = "Form1"; this.ResumeLayout(false); } private void btnCancel_Click(object sender, System.EventArgs e) { Application.Exit( ); } #endregion Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 26
  27. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web /// /// The main entry point for the application. /// [STAThread] static void Main( ) { Application.Run(new Form1( )); } } } So với đoạn mã ta gõ vào trong ứng dụng trước thì mã do IDE phát sinh không khác gì nhiều. Các dòng chú thích được dùng để làm sưu liệu báo cáo cho dự án. (mục này sẽ được thảo luận sau) /// /// Summary description for Form1. /// Các mã tạo và hiệu chỉnh đối tượng thay vì được đặt trực tiếp vào hàm khởi tạo của Form, thì ở đây IDE đặt chúng vào trong hàm InitializeComponent(), Sau đó hàm này được gọi bởi hàm khởi tạo của Form. Mọi ứng dụng Windows Form đều phát sinh ra hàm này. 3.3.Tạo ứng dụng Windows Form khác. Trong ứng dụng trên ta đã thảo luận sơ qua về ứng dụng Windows Form, phần này ta sẽ tạo một ứng dụng Windows khác thực tế hơn. Ứng dụng có tên là FileCopier, cho phép chép hay xóa một hoặc nhiều tập tin từ vị trí này sang vị trí khác. Mục đích của ứng dụng là minh họa sâu hơn về các kỹ năng lập trình C# và giúp người đọc hiểu thêm về namespace Windows.Forms. Giao diện của ứng dụng sau khi hoàn chỉnh sẽ như sau: Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 27
  28. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Hình 3-7 Giao diện người dùng của FileCopier Giao diện của ứng dụng gồm các thành phần sau : • Labels: Các tập tin nguồn (Source Files) and Thư múc đích (Target Directory). • Buttons: Bỏ các dấu chọn trên cây bên trái (Clear), Copy, Delete, and Cancel. • Checkbox : ghi đè lên nếu đã có sẵn ( "Overwrite if exists" ) • Checkbox : hiển thị đường dẫn của mục được trọn ở cây bên phải. • Hai cây (TreeView) chứa tập tin. Khi người dùng nhấn vào Button „Copy‟ thì tất các tập tin được chọn ở cây bên trái sẽ được chép qua cây bên phải, cũng như khi nhấn vào Button „Delete‟ thì sẽ xóa các tập tin được chọn. 3.3.1.Tạo giao diện cho ứng dụng. Đầu tiên ta tạo một dự án Windows Form mới có tên FileCopier. IDE sẽ hiển thị màn hình thiết kế (Designer) lên, ta sẽ thực hiện kéo thả các Label, Button, Checkbox và TreeView cho đến khi thích hợp như hình dưới đây : Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 28
  29. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Sau khi tạo giao diện xong, ta đặt thuộc tính CheckBoxes cho cây bên trái có tên tvwSource thành true, còn cây bên phải có tên tvwTargetDir thành false, để thực hiện ta đơn giản chỉ chọn và sửa đổi trên cửa sổ thuộc tính của từng đối tượng. Khi ta nhấn đúp lên bất kỳ Điều khiển nào thì tự động Visual Studio .NET sẽ phát sinh ra mã tương ứng để bắt sự kiện của Điều khiển đó và đặt con trỏ ( Cursor ) vào ngay tại hàm đó, ta nhấn đúp vào Button “Cancel” và bổ sung mã như sau : protected void btnCancel_Click( object sender, System.EventArgs e) { Application.Exit( ); } 3.3.2.Quản lý điều khiển TreeView. Trong ứng dụng này, hai điều khiển TreeView hoạt động tương tự nhau, ngoại trừ điều khiển cây bên trái tvwTargetDir có thuộc tính CheckBoxes là true và liệt kê cả tập tin lẫn thư mục, còn cây bên phải là false và chỉ liệt ke thư mục. Mặc nhiên thì điều khiển cây cho phép chọn nhiều mục một lúc, nhưng ta sẽ chỉnh lại sao cho chỉ cây bên trái tvwSource mới được chọn nhiều mục một lúc,bên phải thì không. Ta sẽ tạo ra một hàm đẩy dữ liệu vào cây : Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 29
  30. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web private void FillDirectoryTree(TreeView tvw, bool isSource) Có 2 tham số : - TreeView tvw: điều khiển cây cần đẩy dữ liệu vào - Bool isSource: cờ xác định là dữ liệu đẩy cho cây. Nếu isSource là true thì cây sẽ liệt kê cả tập tin và thư mục, false thì chỉ có tập tin. Hàm này sẽ được dùng chung cho cả hai điều khiển cây : - FillDirectoryTree(tvwSource, true); - FillDirectoryTree(tvwTargetDir, false); Đối tượng TreeNode Điều khiển TreeView có một thuộc tính Nodes. thuộc tính này nhận vào một đối tượng TreeNodeCollection , đối tượng này thực chất là một mảng chứa các đối tượng TreeNode, mỗi một TreeNode là một nút trên cây. Trước tiên ta cần khởi tạo cây về rỗng : tvw.Nodes.Clear( ); Sau đó ta gọi hàm tĩnh GetLogicalDrives() của đối tượng Enviroment để lấy về tất cả các ổ đĩa logic hiện đang có trên máy. Đối tượng Enviroment cung cấp các thông tin như : tên máy tính, phiên bản hệ điều hành, hệ thống thư mục trên máy tính hiện hành. string[] strDrives = Environment.GetLogicalDrives( ); strDrives sẽ chứa tên các ổ đĩa logic hiện có trên máy. Sau đó ta sẽ duyệt qua từng ổ đĩa bằng cách dùng lệnh foreach. Với mỗi ổ đĩa logic, ta gọi hàm GetDirectories() của đối tượng DirectoryInfo. Hàm này sẽ trả về danh sách các đối tượng DirectoryInfo, chứa tất cả các tập tin và thư mục trên ổ đĩa logic đó. Những tại đây ta không quan tâm đến kết quả mà nó trả về, mục đích ta gọi hàm này chủ yếu là để kiểm tra xem các ổ đĩa có hợp lệ hay không, nếu có bất kỳ một lỗi nào trên ổ đĩa thì hàm GetDirectories() sẽ quăng ra một ngoại lệ. Ta sẽ dùng khối bắt lỗi try catch để bắt lỗi này. foreach (string rootDirectoryName in strDrives) { DirectoryInfo dir = new DirectoryInfo(rootDirectoryName); dir.GetDirectories( ); Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 30
  31. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web } Khi ỗ đĩa hợp lệ, ta sẽ tạo ra một TreeNode ứng với rootDirectoryName ổ đĩa đó,chẳng hạn như : “C:\”, “D:\” Rồi thêm TreeNode này vào điều khiển cây dùng hàm Add() thông qua thuộc tính Nodes của cây. TreeNode ndRoot = new TreeNode(rootDirectoryName); tvw.Nodes.Add(ndRoot); Tiếp theo ta tiến hành duyệt trên mọi thư mục con của đối tượng TreeNode gốc trên, để làm điều này ta gọi hàm GetSubDirectoriesNodes( ), hàm này cần nhận vào các đối số : TreeNode gốc, tên của nó và cờ xác định là có đẩy cả tập tin vào cây hay không. if (isSource) { GetSubDirectoryNodes(ndRoot, ndRoot.Text, true); } else { GetSubDirectoryNodes(ndRoot, ndRoot.Text, false); } Duyệt đệ qui trên các thư mục con Hàm GetSubDirectoryNodes() bắt đầu bằng việc gọi hàm GetDirectories() để nhận về một danh sách các đối tượng DirectoryInfo : private void GetSubDirectoryNodes( TreeNode parentNode, string fullName, bool getFileNames) { DirectoryInfo dir = new DirectoryInfo(fullName); DirectoryInfo[] dirSubs = dir.GetDirectories( ); Ở đây ta thấy node truyền vào có tên là parentNode ( nút cha ), nghĩa là những nút sau này sẽ được xem là nút con của nó. Bạn sẽ rõ hơn khi tìm hiểu hết hàm này. Ta tiến hành duyệt qua danh sách các thư mục con dirSubs, bỏ qua các mục có trạng thái là ẩn ( Hidden ). Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 31
  32. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web foreach (Directory dirSub in dirSubs) { if ( (dirSub.Attributes & FileSystemAttributes.Hidden) != 0 ) { continue; } FileSystemAttributes là biến có kiểu enum, nó chứa một số giá trị như : Archive, Compressed, Encrypted, Hidden, Normal, ReadOnly Nếu như mục hiện hành không ở trạng thái ẩn, ta sẽ tạo ra một TreeNode mới với tham số là tên của nó. Sau đó Thêm nó vào nút cha parentNode : TreeNode subNode = new TreeNode(dirSub.Name); parentNode.Nodes.Add(subNode); Ta sẽ gọi lại đệ qui hàm GetDirectoriesNodes() để liệt kê hết mọi mục con trên thư nút hiện hành, với ba thông số : nút được chuyển vào như nút cha, tên đường dẫn đầy đủ của mục hiện hành và cờ trạng thái. GetSubDirectoryNodes(subNode,dirSub.FullName,getFileNames); Đến đây chắc bạn đã hiểu được sự phân cấp của cấu trúc cây và tại sao hàm GetSubDirectoryNodes() cần truyền có đối số FullName. Lấy về các tập tin trong thư mục Nếu biến cờ getFileNames là True thì ta sẽ tiến hành lấy về tất cả các tập tin thuộc thư mục. Để thực hiện ta gọi hàm GetFiles() của đối tượng DirectoryInfo, hàm này sẽ trả về danh sách các đối tượng FileInfo. Ta sẽ duyệt qua danh sách này để lấy ra tên của từng tập tin một, sau đó tạo ra một nút TreeNode với tên này, nút này sẽ được thêm vào nút cha parentNode hiện hành. 3.3.3.Quản lý sự kiện trên điều khiển cây. Trong ứng dụng này, chúng ta sẽ phải quản lý một số sự kiện. Đầu tiên là sự kiện người dùng nhấn lên ô CheckBox để chọn các tập tin hay thư mục ở cây bên phải hay nhấn các nút ở cây bên phải. Tiếp theo là các sự kiện nhấn vào Button „Cancel‟, „Copy‟,‟Delete‟ hay „Clear‟.Ta sẽ khảo sát sự kiện trên điều khiển cây trước. Sự kiện chọn một nút trên điều khiển cây bên trái Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 32
  33. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Khi người dùng muốn chọn một tập tin hay thư mục để chép hay xóa. Ứng với mỗi lần chọn sẽ phát sinh ra một số sự kiện tương ứng. Ta sẽ bắt sự kiện AfterCheck của điều khiển cây. Ta gõ vào các đoạn mã sau : tvwSource.AfterCheck +=new TreeViewEventHandler( this.tvwSource_AfterCheck ); Ta viết lệnh thực thi cho hàm bắt sự kiện AfterCheck có tên là tvwSource_AfterCheck, hàm này có hai tham số : đầu tiên là biến Sender chứa thông tin về đối tượng phát sinh ra sự kiện, thứ hai là đối tượng TreeViewEventArgs chứa thông tin về sự kiện phát ra. Ta sẽ đánh dấu là chọn cho thư mục được chọn và tất cả các tập tin hay thư mục con của thư mục đó thông qua hàm SetCheck() : protected void tvwSource_AfterCheck ( object sender, System.Windows.Forms.TreeViewEventArgs e) { SetCheck(e.node,e.node.Checked); } Hàm SetCheck() sẽ tiến hành thực hiện đệ qui trên nút hiện hành, hàm gồm hai tham số : nút cần đánh dấu và cờ xác định là đánh dấu hay bỏ đánh dấu chọn, nếu thuộc tính Count bằng không ( nghĩa là nút này là nút lá ) thì ta sẽ đánh dấu chọn cho nút đó. Nếu không ta gọi đệ qui lại hàm SetCheck() : private void SetCheck(TreeNode node, bool check) { node.Checked = check; foreach (TreeNode n in node.Nodes) { if (node.Nodes.Count == 0) { node.Checked = check; } else { Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 33
  34. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web SetCheck(n,check); } } } Sự kiện chọn một nút trên điều khiển cây bên phải Khi người dùng chọn một nút ở cây bên phải, ta sẽ phải cho hiện đường dẫn đầy đủ của nút đó lên TextBox ở góc phíc trên bên phải. Ta sẽ bắt sự kiện AfterSelect của cây. Sự kiện này sẽ được gọi sau khi người dùng nhấn một nút nào đó trên cây, hàm bắt sự kiện này như sau : protected void tvwTargetDir_AfterSelect( object sender, System.Windows.Forms.TreeViewEventArgs e) { string theFullPath = GetParentString(e.node); Sau khi ta có được đường dẫn đầy đủ của nút chọn, ta sẽ bỏ đi dấu \\ (Backslash) nếu có. Rồi cho hiển thị lên hộp thoại TextBox. if (theFullPath.EndsWith("\\")) { theFullPath =theFullPath.Substring(0,theFullPath.Length-1); } txtTargetDir.Text = theFullPath; } Hàm GetParentString() trả về đường dẫn đầy đủ của nút được truyền vào làm thông số. Hàm này cũng tiến hành lặp đệ qui trên nút truyền vào nếu nút này không là nút lá và thêm dấu \\ vào nó. Quá lặp sẽ kết thúc nếu nút hiện hành là không là nút cha. private string GetParentString(TreeNode node) { if(node.Parent == null) { return node.Text; } Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 34
  35. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web else { return GetParentString(node.Parent) + node.Text + (node.Nodes.Count == 0 ? "" : "\\"); } } Quản lý sự kiện nhấn nút bỏ chọn (Clear) Ta tiến hành bổ sung mã lệnh sau cho hàm bắt sự kiện nhấn vào nút „Clear‟ : protected void btnClear_Click( object sender, System.EventArgs e) { foreach ( TreeNode node in tvwSource.Nodes ) { SetCheck(node, false); } } Hàm này chỉ đơn giản là duyệt qua tất cả các nút thuộc cây bên trái, sau đó gọi lại hàm SetCheck() với biến cờ là false, nghĩa là bỏ chọn tất cả các nút hiện đang được chọn trên điều khiển cây. Quản lý sự kiện nhấn nút chép tập tin ( Copy ) Cái ta cần để hoàn chỉnh thao tác này là danh sách các đối tượng FileInfo. Để có thể quản lý linh hoạt trên danh sách này ta sẽ dùng đối tượng ArrayList, nó cho phép ta thực hiện hầu hết mọi thao tác trên danh sách một các dễ dàng. Để lất về danh sách các đối tượng FileInfo, ta sẽ gọi hàm GetFileList() của ta : protected void btnCopy_Click( object sender, System.EventArgs e) { ArrayList fileList = GetFileList( ); Lấy về danh sách các tập tin Đầu tiên ta sẽ khởi tạo một đối tượng ArrayList để lưu trữ danh sách tên các tập tin được chọn, có tên là fileNames : private ArrayList GetFileList( ) { Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 35
  36. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web ArrayList fileNames = new ArrayList( ); Ta lấy về danh sách tên các tập tin được chọn bằng cách duyệt toàn bộ các nút trong điều khiển cây bên phải : foreach (TreeNode theNode in tvwSource.Nodes) { GetCheckedFiles(theNode, fileNames); } Hàm GetCheckedFiles() thêm danh sách tên các tập tin được đánh dấu của nút hiện hành theNode vào đối tượng fileNames. Nếu nút truyền vào là nút lá và được đánh dấu chọn, ta sẽ lấy đường dẫn đầy đủ của nút và thêm vào đối tượng fileNames: private void GetCheckedFiles(TreeNode node, ArrayList fileNames) { if (node.Nodes.Count == 0) { if (node.Checked) { string fullPath = GetParentString(node); fileNames.Add(fullPath); } } Nếu không là nút lá, ta sẽ lập đệ qui để tìm nút lá : else { foreach (TreeNode n in node.Nodes) GetCheckedFiles(n,fileNames); } } Sau khi thực hiện hết hàm này (nghĩa là duyệt hết cây tvwSource), đối tượng fileNames sẽ chứa toàn bộ các tập tin được đánh dấu chọn của cây.Quay trở lại khảo sát tiếp tục hàm GetFileList(), ta tạo thêm một đối tượng ArrayList nữa, tên Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 36
  37. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web fileList. Mảng này sẽ chứa danh sách các đối tượng FileInfo ứng với các tên tập tin tìm được trong mảng fileNames. Thuộc tính Exists của đối tượng FileInfo dùng để kiểm tra là tập tin hay thư mục. Thuộc tính Exists là True thì đối tượng FileInfo đó là tập tin và ta sẽ thêm vào mảng fileList, ngược lại là thư mục thì không thêm . foreach (string fileName in fileNames) { FileInfo file = new File(fileName); if (file.Exists) fileList.Add(file); } 3.3.4.Quản lý sự kiện nhấn chọn nút xóa ( Delete ) Trước tiên ta cần đảm bảo rằng người dùng chắc chắn muốn xóa bằng cách cho hiện lên một hộp thoại xác nhận xóa. Để hiển thị hộp thoại ta dùng hàm tĩnh Show() của đối tượng MessageBox. protected void btnDelete_Click( object sender, System.EventArgs e) { System.Windows.Forms.DialogResult result = MessageBox.Show( "Are you quite sure?",// Thông điệp "Delete Files", // Tiêu đề cho hộp thoại MessageBox.Buttons.OKCancel,// nút nhấn MessageBox.Icon.Exclamation,// biểu tượng hộp thoại MessageBox.DefaultButton.Button2); // nút mặc định } Khi người dùng nhấn nút OK hay Cancel, ta sẽ nhận được giá trị trả về từ đối tượng DialogResult thuộc namespace Forms và tiến hành xử lý tương ứng : if (result == System.Windows.Forms.DialogResult.OK) { Nếu người dùng chọn nút OK thì ta sẽ lấy về danh sách tên các tập tin fileNames, sau đó duyệt qua từng tên và xóa chúng đi : ArrayList fileNames = GetFileList( ); foreach (FileInfo file in fileNames) Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 37
  38. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web { try { lblStatus.Text = "Deleting " + txtTargetDir.Text + "\\" + file.Name + " "; Application.DoEvents( ); file.Delete( ); } catch (Exception ex) { MessageBox.Show(ex.Message); } } lblStatus.Text = "Done."; Application.DoEvents( ); Sau đây là mã của toàn bộ ứng dụng : using System; using System.Collections; using System.ComponentModel; using System.Data; using System.Drawing; using System.IO; using System.Windows.Forms; /// /// chép tập tin – ứng dụng minh họa cho Windows Form /// namespace FileCopier { Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 38
  39. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web /// /// Form minh họa cho ứng dụng Windows Form /// public class Form1 : System.Windows.Forms.Form { /// /// lớp bên trong của lớp Form1, so sánh 2 tập tin /// public class FileComparer : IComparer { public int Compare (object f1, object f2) { FileInfo file1 = (FileInfo) f1; FileInfo file2 = (FileInfo) f2; if (file1.Length > file2.Length) { return -1; } if (file1.Length < file2.Length) { return 1; } return 0; } } public Form1( ) { InitializeComponent( ); // đẩy dữ liệu vào cây bên trái và bên phải FillDirectoryTree(tvwSource, true); FillDirectoryTree(tvwTargetDir, false); Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 39
  40. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web } /// /// phương thức này dùng để đẩy dữ liệu vào cây /// private void FillDirectoryTree(TreeView tvw, bool isSource) { // trước khi đẩy dữ liệu vào cây, ta phải xóa bỏ các nút // hiện đang tồn tại trên cây. tvw.Nodes.Clear( ); // lấy về danh sách các ổ đĩa logic trên máy tính // sau đó đẩy chúng vào làm nút gốc của cây string[] strDrives = Environment.GetLogicalDrives( ); // Duyệt qua các ổ đĩa, dùng khối try/catch để bắt bất // kỳ lỗi nào xảy ra trên đĩa, nếu đĩa hợp lệ thì ta // thêm vào làm nút gốc cho cây. // đĩa không hợp lệ sẽ không thêm vào cây : đĩa mềm hay // CD trống foreach (string rootDirectoryName in strDrives) { if (rootDirectoryName != @"C:\") continue; try { // nếu đĩa không hợp lệ ta sẽ quăng ra một lỗi. DirectoryInfo dir = new DirectoryInfo(rootDirectoryName); dir.GetDirectories( ); TreeNode ndRoot = new TreeNode(rootDirectoryName); // thêm nút gốc vào cây tvw.Nodes.Add(ndRoot); // thêm các nút con vào cây, nếu là cây bên trái Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 40
  41. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web // thì thêm cả tập tin vào cây if (isSource) GetSubDirectoryNodes(ndRoot, ndRoot.Text, true); else GetSubDirectoryNodes(ndRoot, ndRoot.Text, false); } catch (Exception e) { // thông báo đĩa có lỗi MessageBox.Show(e.Message); } } } // kết thúc thao tác đẩy dữ liệu vào cây /// /// lấy về tất cả các thư mục con của nút cha truyền vào, /// thêm các thư mục con tìm được vào cây /// hàm này có 3 đối số : nút cha, tên đầy đủ của nút cha, /// và biến cờ getFileNames xác định có lấy tập tin không /// private void GetSubDirectoryNodes( TreeNode parentNode, string fullName, bool getFileNames) { DirectoryInfo dir = new DirectoryInfo(fullName); DirectoryInfo[] dirSubs = dir.GetDirectories( ); // ứng với mỗi mục con ta thêm vào cây nếu nó không ở // trạng thái ẩn. foreach (DirectoryInfo dirSub in dirSubs) { // bỏ qua các thư mục ẩn if ( (dirSub.Attributes & FileAttributes.Hidden) != 0 ) { Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 41
  42. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web continue; } /// /// ta chỉ cần tên nút để thêm vào cây, còn ta phải /// truyền vào tên đường dẫn đầy đủ của nút trên cây /// cho hàm lặp đệ qui GetSubDirectoryNodes()để nó có /// thể tìm được các nút con cửa nút đó /// TreeNode subNode = new TreeNode(dirSub.Name); parentNode.Nodes.Add(subNode); // lặp đệ qui hàm GetSubDirectoryNodes(). GetSubDirectoryNodes( subNode,dirSub.FullName,getFileNames); } if (getFileNames) { // lấy mọi tập tin thuộc nút FileInfo[] files = dir.GetFiles( ); // thêm các tập tin và nút con foreach (FileInfo file in files) { TreeNode fileNode = new TreeNode(file.Name); parentNode.Nodes.Add(fileNode); } } } /// /// điểm vào chính của ứng dụng. /// Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 42
  43. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web [STAThread] static void Main( ) { Application.Run(new Form1( )); } /// /// tạo ra một danh sách có thứ tự các tập tin được chọn , /// chép chúng sang cây bên phải /// private void btnCopy_Click(object sender, System.EventArgs e) { // lấy về danh sách tập tin ArrayList fileList = GetFileList( ); // tiến hành chép tấp tin foreach (FileInfo file in fileList) { try { lblStatus.Text = "Copying " + txtTargetDir.Text + "\\" + file.Name + " "; Application.DoEvents( ); file.CopyTo(txtTargetDir.Text + "\\" + file.Name,chkOverwrite.Checked); } catch // (ta không làm gì ở đây cả) { } } lblStatus.Text = "Done."; Application.DoEvents( ); Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 43
  44. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web } /// /// bắt sự kiện kết thúc ứng dụng /// private void btnCancel_Click(object sender, System.EventArgs e) { Application.Exit( ); } /// /// bắt sự kiện xóa bỏ các nút được chọn trên cây bên trái /// private void btnClear_Click( object sender, System.EventArgs e) { // lấy về nút gốc trên cây bên trái và // tiến hành lặp đệ qui foreach (TreeNode node in tvwSource.Nodes) { SetCheck(node, false); } } /// /// đảm bảo người dùng muốn xóa nút đó /// private void btnDelete_Click(object sender, System.EventArgs e) { // xác nhận xóa System.Windows.Forms.DialogResult result = MessageBox.Show( "Are you quite sure?", // thông điệp "Delete Files", // tiêu đề MessageBox.Buttons.OKCancel, // nút nhấn Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 44
  45. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web MessageBox.Icon.Exclamation, // biểu tượng MessageBoxDefaultButton.Button2); // nút mặc định // nếu đồng ý xóa if (result == System.Windows.Forms.DialogResult.OK) { // duyệt danh sách các tập tin và xoá các tập tin / được chọn ArrayList fileNames = GetFileList( ); foreach (FileInfo file in fileNames) { try { // cập nhật nhãn lblStatus.Text = "Deleting " + txtTargetDir.Text + "\\" + file.Name + " "; Application.DoEvents( ); file.Delete( ); } catch (Exception ex) { // hộp thoại thông báo MessageBox.Show(ex.Message); } } lblStatus.Text = "Done."; Application.DoEvents( ); } } /// /// lấy đường dẫn đầy đủ của nút được chọn và gán vào /// điều khiển TextBox txtTargetDir Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 45
  46. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web /// private void tvwTargetDir_AfterSelect( object sender, System.Windows.Forms.TreeViewEventArgs e) { // lấy đường dẫn đầy đủ của nút string theFullPath = GetParentString(e.Node); // nếu nó không là nút lá, ta sẽ xóa 2 ký tự cuối cùng // đi, vì đây là dấu // if (theFullPath.EndsWith("\\")) { theFullPath = theFullPath.Substring(0,theFullPath.Length-1); } // gán đường dẫn cho điều khiển TextBox txtTargetDir.Text = theFullPath; } /// /// đánh dấu chọn nút hiện hành và các nút con của nó /// private void tvwSource_AfterCheck(object sender, System.Windows.Forms.TreeViewEventArgs e) { SetCheck(e.Node,e.Node.Checked); } /// /// lập đệ qui việc đánh dấu chọn hay loại bỏ dấu chọn trên /// nút truền vào dựa vào cờ check /// private void SetCheck(TreeNode node, bool check) { // set this node's check mark Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 46
  47. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web node.Checked = check; // tìm tất cả các nút con của nút foreach (TreeNode n in node.Nodes) { // nếu là nút là thì ta đánh dấu chọn hoặc không chọn if (node.Nodes.Count == 0) node.Checked = check; // nếu không là lá thì ta lặp đệ qui else SetCheck(n,check); } } // lấy về tất cả các tập tin đã được đánh dấu chọn thuộc // nút private void GetCheckedFiles(TreeNode node,ArrayList fileNames) // nếu là nút lá if (node.Nodes.Count == 0) { // nếu nút là đánh dấu chọn if (node.Checked) { // lấy đường dẫn đầy đủ của nút và thêm vào cây string fullPath = GetParentString(node); fileNames.Add(fullPath); } } else // không là nút lá { // thực hiện trên tất cả nút con foreach (TreeNode n in node.Nodes) Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 47
  48. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web { GetCheckedFiles(n,fileNames); } } } /// /// lấy về đường dẫn đầy đủ của nút truyền vào /// private string GetParentString(TreeNode node) { // nếu là nút gốc thì trả về tên nút ( c:\ ) if(node.Parent == null) return node.Text; else // nếu là nút cha thì thêm dấu // vào chuỗi trả về // nếu nút lá ta không thêm gì cả return GetParentString(node.Parent) + node.Text + (node.Nodes.Count == 0 ? "" : "\\"); } /// /// trả về danh sách các tập tin được chọn theo thứ tự /// private ArrayList GetFileList( ) { // danh sách tên tập tin đầy đủ không được sắp ArrayList fileNames = new ArrayList( ); // duyệt từng nút của cây và lấy về danh sách các tập // tin được chọn foreach (TreeNode theNode in tvwSource.Nodes) { GetCheckedFiles(theNode, fileNames); Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 48
  49. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web } // danh sách các đối tượng FileInfo ArrayList fileList = new ArrayList( ); // fileNames là tập tin thì ta thêm vào fileList foreach (string fileName in fileNames) { // tạo ra FileInfo tương ứng với filename if (file.Exists) fileList.Add(file); } // tạo ra một thể hiện IComparer IComparer comparer = (IComparer) new FileComparer( ); // sắp xếp danh sách tập tin fileList.Sort(comparer); return fileList; } } } 3.3.5 .Tạo siêu liệu XML bằng chú thích. Ngôn ngữ C# hỗ trợ kiểu chú thích mới, bằng ba dấu gạch chéo ( /// ). Trình biên dịch C# dùng phần chú thích này để tạo thành sưu liệu XML.Ta có thể tạo tập tin sưu liệu XML này bằng mã lệnh, ví dụ như để tạo sưu liệu cho ứng dụng FileCopier ở trên ta gõ các lệnh sau : csc filecopier.cs /r:System.Windows.Forms.dll /r:mscorlib.dll /r:system.dll /r:system.configuration.dll /r:system.data.dll /r:system.diagnostics.dll /r:system.drawing.dll /r:microsoft.win32.interop.dll Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 49
  50. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web /doc:XMLDoc.XML Ta cũng có thể tạo sưu liệu XML trực tiếp ngay trong Visual Studio .NET, bằng cách nhấn chuột phải lên biểu tượng của dự án và chọn „Properties‟ để hiện lên hộp thoại thuộc tính của dự án (Property Pages), sau đó chọn mục Configuration Properties \ Build rồi gõ tên tập tin sưu liệu XML cần tạo ra vào dòng XML Document File. Khi biên dịch dự án, tập tin sưu liệu XML sẽ tự động được tạo ra trong thư mục chứa dự án. Dưới đây là một đoạn mã được trích ra từ tập tin sưu liệu XML được tạo ra từ ứng dụng FileCopier trên : FileCopier Form demonstrating Windows Forms implementation Required designer variable. Tree view of potential target directories Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 50
  51. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Tree view of source directories includes check boxes for checking chosen files or directories Do đoạn mã trên được định dạng dưới kiểu dưới dạng XML, do đó không thuận tiện lắm khi quan sát. Ta có thể viết một tập tin theo định dạng XSLT để chuyển từ định dạng XML sang HTML. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 51
  52. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Chương 4:Kết nối CSDL. Trong thực tế, có rất nhiều ứng dụng cần tương tác với cơ sở dữ liệu. .Net Framework cung cấp một tập các đối tượng cho phép truy cập vào cơ sở dữ liệu, tập các dữ liệu nàu gọi chung ADO.Net. ADO.Net kết nối vào cơ sở dữ liệu để lấy dữ liệu và kết nối trở lại để cập nhật dữ liệu khi người dùng thay đổi chúng. Hầu hết mọi ứng dụng đều sử dụng nhiều thời gian cho việc đọc và hiển thị dữ liệu, vì thế ADO.Net đã cung cấp một tập hợp con các đối tượng dữ liệu không kết nối cho các ứng dụng để người dùng có thể đọc và hiển thị chúng mà không cần kết nối vào cơ sở dữ liệu. 4.1.Cơ sở dữ liệu và ngôn ngữ truy vấn SQL. Để có thể hiểu rõ cách làm việc ADO.Net, chúng ta cần nắm một số khái niệm cơ bản về cơ sở dữ liệu quan hệ và ngôn ngữ truy vấn dữ liệu như : khái niệm dòng, cột, bảng, quan hệ giữa các bảng, khóa ngoại, khóa chính, và cách truy vấn trên các bảng bằng ngôn ngữ truy vấn SQL: Seclect, Update, Delete, Insert . Một số hàm count, sum, avg, min, max ,hay cách viết thủ tục Store Procedure. 4.2.Kiến trúc ADO.NET ADO.Net là tên của tập các lớp nằm trên namespace: System.Data.System.Data.Common System.Data.SqlTypes System.Data.SqlClient System.Data.OleDb; ADO được chia làm 2 phần chính rõ rệt, được thể hiện qua hình Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 52
  53. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Hình 4.1 Dataset là thành phần chính cho đặc trưng kết nối không liên tục của cấu trúc ADO.Net. Dataset được thiết kế có thể thích ứng với bất kì nguồn dữ liệu nào. Dataset chứa một hay nhiều đối tượng DataTable mà nó được tạo ra từ tập các dòng và cột dữ liệu, cùng với khóa chính, khóa ngoại ràng buộc và các thông tin liên quan đến đối tượng DataTable này. Bản thân DataSet được xem dạng tập tin XML. Thành phần thứ hai Provide Data nó chứa các đối tượng phục vụ cho việc thao tác trên cơ sở dữ liệu được hiệu quả và nhanh chóng, nó bao gồm một tập các đối tượng Connection, Command, DataReader và DataAdapter. Đối tượng Connection cung cấp kết nối đến cơ sở dữ liệu, Command cung cấp một thao tác đến cơ sở dữ liệu, DataReader cho phép chỉ đọc dữ liệu, DataAdapter cầu nối trung gian giữa cơ sở dữ liệu và DataSet. 4.3.DataProvider. 4.3.1 DataProvider có 5 loại đối tượng: - Connection - Command - DataReader - Parameter Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 53
  54. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web - DataAdapter. 4.3.2 DataProvider có hai trình cung cấp dữ liệu: + SQL Sever Data Provider bao gồm các đối tượng sau: - SqlConnection - Sql Command - Sql Parameter - Sql DataAdapter - Sql DataReader + OLE DB Data Provider bao gồm các đối tượng sau: - OleDbConnection - OleDbCommand - OleDb Parameter - OleDb DataAdapter - OleDb DataReader. 4.3.3 Đối tượng SqlConnection và SqlCommand. Đối tượng SqlConnection đại diện cho một kết nối đến cơ sở dữ liệu, đối tượng này có thể được dùng chung cho các đối tượng SqlCommand khác. Đối tượng SqlCommand cho phép thực hiện một câu truy vấn trực tiếp như: SELECT, UPDATE, hay DELETE hay gọi thủ tục (Store Proceduce) từ cơ dở dữ liệu. Ví dụ: //Tao kết nối SqlConnection cnn = new SqlConnection(); //Kết nối đên sever local, tên CSDL sử dung sever có tên Northwind; SSPI để dùng cho Windows authentication cnn.ConnectionString = "Data Source=(local);" + "Initial Catalog=Northwind;" + "Integrated Security=SSPI"; // Tạo đối tượng Sqlcommand SqlCommand cmd = cnn.CreateCommand(); //Xác định kiểu câu lệnh cần thực hiện Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 54
  55. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web cmd.CommandType = CommandType.Text; //Xác định câu lệnh cần đối tượng SqlCommand cmd.CommandText = "SELECT COUNT(*) FROM Customers " + "WHERE Country='" + txtCountry.Text + "'"; 4.3.4 Đối tượng DataAdapter. ADO.Net dùng DataAdapter như chiếc cầu nối trung gian giữa DataSet và DataSource (nguồn dữ liệu), nó lấy dữ liệu từ cơ sở dữ liệu sau đó dùng phương thức Fill() để đẩy dữ liệu cho đối tượng DataSet. Nhờ đối tượng DataAdapter mà DataSet tồn tại độc lập, cách biệt với cơ sở dữ liệu và một DataSet có thể là thể hiện của một hay nhiều cơ sở dữ liệu.Ví dụ: //Tạo đối tượng SqlDataAdapter SqlDataAdapter da = new SqlDataAdapter(); //Cung cấp cho da một Sqlcommand và SqlConnection //lấy dữ liệu //Tạo đối tượng DataSet mới DataSet ds= new DataSet(); //Đẩy dữ liệu da vào trong ds bằng hàm Fill() da.Fill(ds, "Ten bang"); 4.4.DataSet Đối tượng DataSet là thành phần chính của kiến trúc không kết nối cơ sở dữ liệu, được dùng để nắm giữ dữ liệu của mọi cơ sở dữ liệu bên trong đối tượng này để sau đó cập nhật trở lại cơ sở dữ liệu nguồn bằng phương thức Update của đối tượng SqlDataAdapter. Trước khi sử dụng dữ liệu trong DataSet ta phải lấy dữ liệu về DataSet. Quá trình lấy về DataSet gồm 4 bước: - Xây dựng đối tượng Sql Connnection để kết nối CSDL. Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 55
  56. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web - Xây dựng đối tượng SqlCommand để lấy dữ liệu cần thiết. - Gán đối tượng SqlCommand cho thuộc tính SeclectCommand của đối tượng SqlDataAdapter. - Gọi phương thức Fill của đối tượng SqlDataAdapter để lấy dữ liệu cần thiết. Hình 4.2 :Mô hình của DataSet 4.4.1.Đối tượng DataTable và DataColumn. Ta có thể viết mã C# để tạo ra đối tượng DataTable hay nhận từ kết quả của câu truy vấn đến cơ sở dữ liệu. DataTable có một số thuộc tính dùng chung(public) như thuộc tính Columns, từ thuộc tính này ta có thể truy vấn đến đối tượng DataColumnsCollection thông qua chỉ ,mục hay tên cột để nhận về các đối tượng DataColumn thích hợp, mỗi DataColumn tương ứng với một cột trong bảng dữ liệu. Ví dụ: DataTable dt= new DataTable("Ten bang"); DataColumn dc = dt.Column("Ten cot"); Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 56
  57. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web 4.4.2 Đối tượng DataRelation. Ngoài đối tượng DataTable được truy cập thông qua thuộc tính Tables, DataSet con có thuộc tính Relations. Thuộc tính này dùng để truy cập đến đối tượng DataRelationCollection thông qua chỉ mục hay tên của quan hệ ta sẽ trả về đối tượng DataRelation tương ứng. Ví dụ: //Tạo đối tượng DataSet mới DataSet ds= new DataSet(); //Liên kết hai bảng thông qua khóa ngoại DataRelation rel = ds.Relations.Add("ten cot", ds.Tables["Ten bangA"].Columns["cot chung 2bang"], ds.Tables["Ten bang B"].Columns["cot chung 2 bang"]); 4.4.3.Đối tượng DataView DataView dùng để trình bày dữ liệu có trong đối tượng DataTable dưới hinhg thức sắp xếp, lọc tìm kiếm, hiệu chỉnh và điều hướng. Ví dụ: DataSet ds= new DataSet(); //Tạo đối tượng DataView DataView dv = new DataView(ds.Tables["Ten bang"]); //Lọc theo tên thuộc tính của bảng dv.RowFilter="Ten cot='Thuoc tinh can loc'" 4.4.4.Đối tượng DataGridview Đối tượng DataGridView dùng để trình bày dữ liệu có trong đối tượng DataSet, DataTable, DataView dưới hình thức khác nhau. Ví dụ : //Khai báo gọi phương thức FillDataSet DataSet da = FillDataSet("select * from Customers"); Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 57
  58. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web // Khai báo điền đối tượng DataSet vào thuộc tính. //DataSource của đối tượng DataGridView this.DataGridView1.DataSource=DataSet.Tables[0] Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 58
  59. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Phần III Phát triển 1 RSS Reader Một số giao diện Giao diện ban đầu: Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 59
  60. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Khi cho link rss của trang nào đó combox phía bên phải: Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 60
  61. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Sau đó click dấu + để hiên ra link bên trong mục đó: Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 61
  62. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Khi click đúp vào link http Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 62
  63. Đế tài nghiên cứu khoa học Bóc tách thông tin trên Web Tài liệu tham khảo 1849c7855a564eb8d5 Sinh viên thực hiện:Trịnh Kiều Xinh-K54C-CNTT 63