Bài giảng Hệ thống thông tin địa lý

pdf 125 trang phuongnguyen 6050
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Hệ thống thông tin địa lý", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_he_thong_thong_tin_dia_ly.pdf

Nội dung text: Bài giảng Hệ thống thông tin địa lý

  1. Hệ thống thơng tin địa lý
  2. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ GIS ngày nay đã trở thành một trong những ứng dụng quan trọng, cùng với sự phát triển của cơng nghệ tin học, các thiết bị phần cứng, phần mềm đã đưa GIS thành một cơng cụ mạnh trong nghiên cứu mơi trường, lập dự án và trợ giúp ra quyết định vv Trong chương này giới thiệu về quá trình hình thành ngành khoa học này và những ứng dụng của nĩ. 1
  3. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ Giới thiệu bản đồ Thơng tin địa lý thể hiện trước hết ở dạng bản đồ. Các bản đồ đầu tiên được phác thảo để mơ tả vị trí, bản đồ địa hình thể hiện các nét chính về cảnh quan như sơng ngịi, đường, làng bản, rừng cây Chúng thường bao gồm địa hình với các ký hiệu điểm riêng biệt và đường contour. Các bản đồ này thích hợp cho mục đích chung hoặc cho quân đội. Các kiểu bản đồ cung cấp thơng tin về từng vấn đề như địa chất, phân vùng lãnh thổ, tỉ lệ thất nghiệp được gọi là các bản đồ chuyên đề. Những bất tiện của bản đồ in trên giấy Ê Bản đồ xây dựng với giá đắt và chi phí nhiều thời gian. Ê Lượng thơng tin hạn chế, nếu bản đồ chứa nhiều thơng tin thì rất khĩ đọc. Ê Khơng thể cập nhật thơng tin theo thời gian. Ê Bản đồ chỉ cho các tài liệu định tính, khơng thể phân tích định lượng các dữ liệu trên bản đồ. Ê Khơng thể phân tích nhiều tập hợp dữ liệu khơng gian từ các bản đồ khác nhau (như đất, sườn dốc và lớp phủ thực vật để đánh giá mức độ xâm thực). Hiện nay, nhu cầu các tài liệu sử dụng nhanh, cĩ thể cung cấp thơng tin cập nhật và chính xác cho các mục đích đặc biệt. Do vậy, bản đồ truyền thống khơng cịn thuận tiện nữa. 2
  4. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ Ra đời HTTTĐL Khoảng những năm 1960, một số người đã cĩ ý tưởng mơ hình hĩa khơng gian lưu trữ vào máy tính, đĩ là một bản đồ đơn giản cĩ thể mã hĩa, lưu trữ trong máy tính, sửa chữa khi cần thiết, cĩ thể hiển thị trên màn hình và in ra giấy. Thời gian đầu, bản đồ điện tốn (computer cartography) thể hiện những điểm, các đường thẳng (vector) và chữ (text). Các đồ thị phức tạp cĩ thể được xây dựng từ những yếu tố này. Ví dụ; những đường khơng theo qui luật như sơng, bờ biển sẽ được tạo ra liên tiếp từ các yếu tố vector nhỏ. Các nhà nghiên cứu đã nhận thấy rằng nhiều vấn đề địa lý địi hỏi thu thập và phân tích một khối lượng lớn thơng tin khơng phải bản đồ. Ví dụ: Ê Điều tra dân số yêu cầu dữ liệu về người, hộ gia đình. Ê Ứng dụng địa chính yêu cầu thơng tin về quyền sở hữu đất Vào lúc này thuật ngữ Bản đồ máy tính được thay thế bởi thuật ngữ HTTTĐL. HTTTĐL đầu tiên xuất hiện vào năm 1964 thuộc dự án “Rehabilitation and Development Agency Program” của chính phủ Canada. Cơ quan “Hệ thống thơng tin địa lý Canada-CGIS” đã thiết kế để phân tích, kiểm kê đất nhằm trợ giúp cho chính phủ trong việc sử dụng đất nơng nghiệp. Dự án CGIS hồn thiện vào năm 1971 và phần mềm vẫn sử dụng tới ngày nay. Dự án CGIS gồm nhiều ý tưởng sáng tạo mà đã được phát triển trong những phần mềm sau này. Giữa những năm 60 và 70, HTTTĐL phát triển chủ yếu trong Chính phủ và các phịng thí nghiệm. Năm 1964, Ơng Howard Fisher thành lập “Phịng thí nghiệm đồ họa máy tính Harvard” phịng dẫn đầu về các cơng nghệ mới. Phịng thí nghiệm Harvard đã tạo ra một loạt các ứng dụng chính HTTTĐL bao gồm: SYMAP (Synagraphic Mapping System), CALFORM, SYMVU, GRID, POLYVRT, và ODYSSEY. ODYSSEY là mơ hình đầu tiên vector HTTTĐL và nĩ trở 3
  5. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ thành chuẩn cho các phần mềm thương phẩm. Hệ thống bản đồ tự động đã được phát triển bởi (CIA) trong cuối những năm 1960s. Dự án này tạo ra “Ngân hàng dữ liệu Thế giới của CIA”, thu thập thơng tin đường bờ biển, con sơng, ranh giới hành chính và phần mềm trọn gĩi CAM tạo ra những bản đồ những tỉ lệ khác nhau từ dữ liệu này. Đây là một hệ thống CSDL bản đồ đầu tiên trên Thế giới. Hai cơng trình cĩ giá trị khác là Hệ thơng tin sử dụng đất New york (1967) và hệ thống tin quản lý đất Minnesota (1969). Năm 1969, Jack Dangermond, một người trong nhĩm nghiên cứu tại phịng thí nghiệm Harvard trong bộ phận đồ họa máy tính, đồng sáng lập (ESRI) cùng với vợ là Laura. ESRI trong ít năm vượt trội trong thị trường HTTTĐL và tạo ra các sản phẩm phần mềm ArcInfo và ArcView. Hội nghị HTTTĐL đầu tiên vào 1970 tổ chức bởi Roger Tomlinson (CGIS) và Duane Marble (giáo sư tại Northwestern University). Trong những năm 1980s và 1990s, nhiều ứng dụng được phát triển là những gĩi phần mềm phát triển bởi các cơng ty tư nhân như: ArcInfo, ArcView, MapInfo, SPANS GIS, PAMAP GIS, INTERGRAPH, và SMALLWORLD. Và rất nhiều ứng dụng đã chuyển từ hệ máy lớn vào sử dụng trong máy tính cá nhân (PC). Ngày nay, HTTTĐL với phần cứng và phần mềm đồ họa hiện đại cĩ sức mạnh trong hiển thị thế giới thực, các kỹ thuật 3D thể hiện cảnh quan, hình ảnh động thể hiện sử thay đổi theo thời gian. Những ứng dụng của HTTTĐL Mơi trường Trong lĩnh vực mơi trường sử dụng HTTTĐL cho nhiều ứng dụng khác nhau từ kiểm kê đơn giản, chất vấn tới phân tích chồng lớp bản đồ, đưa ra quyết 4
  6. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ định. Các ứng dụng chính bao gồm: Ê Mơ hình hĩa rừng Ê Mơ hình hĩa khí/nước Ê Quan trắc mơi trường Ê Thành lập bản đồ phân vùng nhạy cảm mơi trường Ê Phân tích về mối tương tác giữa sự thay đổi kinh tế, khí hậu, thủy văn địa chất. Ê Phân tích tác động mơi trường Ê Chọn vị trí chơn lấp chất thải Ê Giám sát sự thay đổi mơi trường theo thời gian Dữ liệu điển hình cho đầu vào những ứng dụng này bao gồm: độ cao địa hình, lớp phủ rừng, chất lượng lớp phủ đất, lớp phủ địa chất-thủy văn. Một số trường hợp ứng dụng HTTTĐL trong nghiên cứu mơi trường là sự xem xét cân đối giữa phát triển kinh tế và những những điều kiện về mơi trường. Cơ sở hạ tầng và những tiện ích Những kỹ thuật HTTTĐL cũng được áp dụng rộng rãi trong việc thành lập các dự án và quản lý các tiện ích cơng cộng. Các cơ quan quản lý cơ sở hạ tầng và tiện ích cơng cộng tìm thấy ở HTTTĐL những cơng cụ mạnh mẽ để lập dự án, ra quyết định, phục vụ khách hàng, những yêu cầu cần điều chỉnh, và hiển thị máy tính. Những ứng dụng điển hình bao gồm những dịch vụ: Ê Điện lực Ê Khí đốt 5
  7. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ Ê Nước Ê Thốt nước Ê Truyền thơng Ê Đường xá Ê Hiệu quả truyền sĩng TV/FM Ê Những phân tích mối nguy hiểm, rủi ro Ê Tình huống nguy kịch và dịch vụ khẩn cấp. Những dữ liệu đầu vào cho những ứng dụng này bao gồm: Ê Mạng đường phố, Ê Dữ liệu địa hình, Ê Dữ liệu về nhân khẩu, Ê Ranh giới hành chính các cấp. Kinh doanh và bán hàng HTTTĐL sử dụng trong kinh doanh và bán hàng hiệu quả nhất trong một số lĩnh vực bao gồm: Ê Vị trí cĩ khả năng cạnh tranh. Ê Cung cấp phân loại những mối nguy. Ê Trợ giúp quản lý rủi ro trong cơng ty bảo hiểm. Ê Tối ưu tuyến vận chuyển và phân phối. 6
  8. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ Ê Gán địa chỉ và tìm kiếm vị trí. Những dữ liệu đầu vào trong những ứng dụng này bao gồm: Ê Mạng đường phố. Ê Địa chỉ đường phố. Ê Hồ sơ khách hàng. Ê Những tài liệu kinh tế-xã hội. Bản đồ máy tính Sự phát triển máy tính trợ giúp bản đồ đã phát triển mạnh độc lập với phát triển vector-dựa trên HTTTĐL. Với trợ giúp HTTTĐL, quản lý những mảnh bản đồ theo tờ rất thuận lợi, những kỹ thuật chồng lớp các chuyên đề thơng tin bản đồ, những phép chiếu bản đồ vv giúp cập nhật CSDL địa lý dễ dàng để tạo những bản đồ mới. Thơng tin đất HTTTĐL trợ giúp cho quản lý thơng tin sử dụng đất vì nĩ cho phép tạo và duy trì dữ liệu những thửa đất, những dự án đất, tình hình sử dụng. Nhiều nơi những chính quyền địa phương bắt đầu sử dụng HTTTĐL giúp quản lý thơng tin đất của họ. HTTTĐL cho phép dễ dàng nhập, thêm, phục hồi dữ liệu như thuế đất, dự án sử dụng đất, mã đất dễ dàng hơn rất nhiều so với thời đại bản đồ giấy. Những ứng dụng tiêu biểu là quản lý thơng tin đất là: Ê Quản lý đăng ký đất sở hữa đất Ê Chuẩn bị cho những dự án sử dụng đất và bản đồ phân vùng 7
  9. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ Ê Bản đồ địa chính. Nguồn vào dữ liệu bao gồm: Ê Bản đồ quản lý ranh giới hành chính. Ê Giao thơng. Ê Lớp phủ đất. Các ngành liên quan HTTTĐL là kết quả hội tụ kỹ thuật hiện đại của nhiều ngành: Địa lý Quan tâm đến hiểu biết thế giới và nơi lồi người sinh sống. Các nhà địa lý cĩ truyền thống làm việc lâu dài với các dữ liệu khơng gian và nhiều kỹ thuật được chuyển sang HTTTĐL. Giao thơng Ê Quản lý mạng giao thơng. Ê Duy trì tín hiệu đèn giao thơng. Ê Phân tích điểm tai nạn, tìm các điểm nguy hiểm. Ê Tuyến giao thơng du lịch. Ê Quản lý hệ thống ơ tơ, tìm vị trí, tuyến. 8
  10. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ Lâm nghiệp Ê Theo dõi thơng tin những cây gỗ phát triển. Ê Cĩ thể lập dự án khai thác rừng. Ê Làm sao cung cấp những dinh dưỡng cần thiết cho cây, duy trì bảo vệ tài nguyên rừng trong tương lai. Ê Lập kế hoạch thiết lập đường vận chuyển, phương pháp khai thác, di chuyển gỗ theo luật mơi trường. Ê Quản lý rừng theo nhiều mục đích, bao gồm cả việc tái tạo lại. Nơng nghiệp – Trang trại Ê Tăng cường sử dụng các bản đồ chi tiết và những ảnh theo dõi mùa màng. Ê Phân tích sản lượng. Ê Cĩ kế hoạch áp dụng hĩa chất bảo vệ thực vật, hợp chất hĩa học. Ê Những kỹ thuật dự báo nơng nghiệp. Những tiện ích Ê Bao gồm khí, điện thoại, điện tử, nước, truyền hình cáp. Bản đồ học Hiển thị các thơng tin khơng gian dưới dạng các loại bản đồ. Bản đồ đang tồn tại là nguồn dữ liệu quan trọng cho hệ thống bản đồ điện tốn. 9
  11. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ Viễn thám Cĩ nghĩa là thu nhận thơng tin từ tàu vũ trụ và vệ tinh. Theo truyền thống, các thơng tin này gồm ảnh hàng khơng, hiện nay đĩ là các thơng tin ảnh số thu nhận từ vệ tinh. Trắc lượng ảnh Ê Sử dụng ảnh hàng khơng và kỹ thuật chiết xuất thơng tin từ các ảnh này. Trước đây, trắc lượng ảnh sử dụng các nguồn dữ liệu địa hình (độ cao, đặc điểm nhìn thấy được như đường xá và mạng sơng suối, sử dụng đất và lớp phủ đất ). Ê Khảo sát, cung cấp dữ liệu chính xác cao về vị trí ranh giới đất, cơng trình xây dựng, đặc điểm tự nhiên Ê Số liệu quan sát tạo ra tại một điểm cĩ rất nhiều nguồn dữ liệu cho HTTTĐL: bản đồ, biểu đồ khảo sát, ảnh hàng khơng, ảnh vệ tinh, bản câu hỏi, dữ liệu định vị tồn cầu. Thống kê Cung cấp nhiều phương pháp để xây dựng mơ hình điện tốn hoặc để phân tích dữ liệu. Kỹ thuật tối ưu hĩa (như tìm đường ngắn nhất) là trọng tâm trong ứng dụng HTTTĐL. Tốn học Ê Cung cấp rất nhiều phương pháp, nhất là trắc địa và lý thuyết đồ họa. Khoa học máy tính Cung cấp nhiều phương pháp và cơng cụ phần mềm mà các nhà phân tích HTTTĐL cĩ thể lựa chọn để giải quyết các vấn đề riêng biệt. Một số nhánh khoa học máy tính cĩ thể khai thác gồm: 10
  12. Chương 1 BẢN ĐỒ & HỆ THỐNG THƠNG TIN ĐỊA LÝ Ê Trợ giúp thiết kế: cung cấp phần mềm dùng trong HTTTĐL các kỹ thuật nhập dữ liệu, trình bày, hiển thị. Ê Đồ họa máy tính: cung cấp phần cứng và phần mềm để thể hiện các đối tượng đồ thị. Ê Hệ thống quản trị CSDL (DBMS), hệ thống phần mềm để quản trị các bộ cơ sở dữ liệu lớn trong HTTTĐL như các ứng dụng về địa chính và điều tra dân số. Ê Trí tuệ nhân tạo: cung cấp nhiều kỹ thuật để trợ giúp ra quyết định. Hành chính Ê Cơ sở dữ liệu về dân số và các bản đồ kết hợp. Ê Cơ sở dữ liệu địa chính và các bản đồ kết hợp. Ê Địa lý nhân khẩu học. 11
  13. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Chương 2 KHOA HỌC THƠNG TIN ĐỊA LÝ Thơng tin địa lý liên quan rất nhiều đến các hoạt động của con người, đĩ là các thơng tin liên quan với các khu vực trên Trái đất, bao gồm sự phân bố các nguồn tự nhiên (đất, nước, thực vật), các cơ sở hạ tầng (đường, các cơng trình), các vị trí kinh tế, chính trị, các đường biên giới, kể cả các dữ liệu thống kê về dân số, tội phạm Trong chương này giới thiệu về thơng tin địa lý và những khái niệm liên quan tới Hệ thống thơng tin địa lý (HTTTĐL) 12
  14. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Những định nghĩa mở đầu Thơng tin địa lý - Geographic information Là thơng tin về những vị trí trên bề mặt Trái đất. Các thơng tin này cĩ thể rất chi tiết, ví dụ: Ê Thơng tin về những vị trí tất cả - ngơi nhà trong thành phố. Ê Thơng tin về những cây riêng biệt trong khu rừng. Cĩ thể mang tính tổng quát (rộng), ví dụ: Ê Khí hậu trong vùng rộng lớn. Ê Mật độ dân số trên tồn bộ đất nước. Trong những ví dụ trên thể hiện phân giải địa lý của chúng khác nhau Những đặc điểm khác của thơng tin địa lý là thường ít thay đổi (tĩnh) Ê Những yếu tố tự nhiên và những yếu tố con người tạo ra (đập thủy điện, hồ chứa vv ), khơng thay đổi quá nhanh. Ê Chỉ thơng tin tĩnh cĩ thể miêu tả trong bản đồ giấy. Cĩ thể rất đồ sộ Ê Cỡ terabyte (1012 bytes) dữ liệu gửi về từ những vệ tinh trong một ngày. Ê Cỡ gigabytes (gigabyte = 109 bytes) dữ liệu cần thiết mơ tả mạng lưới đường xá Việt Nam. 13
  15. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Dữ liệu địa lý Hình 2.1 Ba hợp phần của thơng tin trong HTTTĐL (theo J.Dangermon, 1983) Dữ liệu địa lý mơ tả những thực thể cĩ vị trí. Dữ liệu địa lý gồm thơng tin vị trí và những thơng tin cần quan tâm, được xem như là các thuộc tính của thực thể. Dữ liệu khơng gian và phi khơng gian. Ê Dữ liệu khơng gian (trả lời cho câu hỏi về vị trí - ở đâu ?) được thể hiện trên bản đồ và HTTTĐL dưới dạng điểm (point), đường (line) hoặc vùng (polygon). Dữ liệu khơng gian là dữ liệu về đối tượng mà vị trí của nĩ được xác định trên bề mặt Trái đất. Dữ liệu khơng gian sử dụng trong HTTTĐL luơn được xây dựng trên một hệ thống tọa độ. Tọa độ lưới chiếu hay hệ thống tọa độ phẳng là vị trí trên mặt cong của trái đất được chiếu lên mặt phẳng, nếu như diện tích quan tâm nhỏ thì độ biến dạng gây nên bởi lưới chiếu khơng đáng kể. Tọa độ địa lý là vị trí được biểu diễn bằng vĩ độ và kinh độ. 14
  16. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Ê Dữ liệu phi khơng gian (Non-Spatial data hay attribute) (nĩ là cá gì?) thể hiện tính chất của đối tượng như chiều dài, rộng của con đường, độ cao của cây rừng, dân cư của thành phố dữ liệu phi khơng gian mơ tả thơng tin về đặc điểm của đối tượng. Ê Dữ liệu thời gian (Temporal data) (nĩ tồn tại khi nào?), thời điểm tồn tại hay xuất hiện của đối tượng. Các thơng tin khơng gian (thơng tin cĩ tọa độ) và thơng tin thuộc tính cĩ thể biến đổi khơng phụ thuộc vào nhau tương đối theo thời gian. Thuộc tính cĩ thể thay đổi theo thời gian mà vẫn giữ nguyên tọa độ của mình và ngược lại, tọa độ cĩ thể thay đổi mà vẫn giữ nguyên thuộc tính của chúng. Việc hiểu rõ tính chất này của mối quan hệ các thơng tin cho phép dễ dàng phân tích các hiện tượng, quá trình động lực trong khơng gian địa lý. Ví dụ: sự di chuyển của các cồn cát làm thay đổi vị trí khơng gian của chúng nhưng lại giữ nguyên các thuộc tính “cồn cát”. Hoặc ví dụ ngược lại; quá trình xĩi mịn làm thay đổi thuộc tính “độ cao” của quả đồi nhưng lại giữa nguyên vị trí tọa độ của nĩ. Thuật ngữ trong cơ sở dữ liệu Trong CSDL HTTTĐL, cần định nghĩa ngắn gọn và súc tích, mơ hình dữ liệu mơ tả mối quan hệ giữa những thực thể. Xác định một số thuật ngữ: Entity (Thực thể) Là “một hiện tượng trong thực tế mà khơng được phân chia nhỏ ra thành những hiện tượng cùng loại. Cĩ sự tồn tại độc lập rõ ràng trong thực tế”. Ví dụ: Ê Một thành phố là một thực thể (nĩ tồn tại độc lập cĩ thể chia nhỏ ra thành các phần nhỏ hơn nhưng các phần này khơng được gọi là thành phố, chúng được gọi là Quận). 15
  17. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Ê Một khu rừng gồm các mảnh rừng nhỏ là một thực thể. Ê Các thực thể thực tế như nhà cửa, đường xá, cầu cống Đối tượng ( Object) Là sự trình bày dạng số của tất cả hoặc một phần của thực thể. Là cái cĩ thể nhìn hay sờ được; hay dạng vật chất chiếm giữ khơng gian. Ví dụ: Ê Một cây là một đối tượng khi ta quan tâm nghiên cứu. Ê Một ngơi nhà. Ê Một hồ nước. Yếu tố (Feature) Cấu tạo, hình thù, dạng hay diện mạo một người hay vật thể Thuật ngữ “yếu tố” cĩ từ bản đồ học và sử dụng rộng rãi trong các ứng dụng bản đồ đĩ là kí hiệu (symbol) dùng để mơ tả đối tượng/thực thể trên một bản đồ. Ví dụ: Ê Các yếu tố (features) nhân tạo như đường contour, ranh giới hành chính Ê Các yếu tố dạng số được cấu trúc từ các yếu tố đồ họa cơ bản như : điểm, đường và vùng. Phương pháp trình bày các yếu tố phụ thuộc vào tỷ lệ. Ví dụ: Ê Về phương diện địa lý một thành phố cĩ thể được trình bày như một điểm (point) nếu như diện tích nghiên cứu ở qui mơ lục địa. 16
  18. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Ê Thành phố đĩ cĩ thể được trình bày như một vùng nếu như diện tích nghiên cứu trong một bang hoặc một quốc gia. Các kiểu thực thể (Entity types) Các hiện tượng (phenomena) lưu trữ trong một cơ sở dữ liệu được xác định như các kiểu thực thể. Một kiểu thực thể là nhĩm hiện tượng tương tự được thể hiện và lưu trữ cùng kiểu. Ví dụ: đường xá, sơng suối, độ cao, thực vật. Trong HTTTĐL xác định từng kiểu thực thể nhằm: Giúp cho việc chồng xếp các nhĩm thơng tin. Trợ giúp cho việc kiểm chứng nội dung của cơ sở dữ liệu. Lớp dữ liệu (Layers) Mỗi lớp cĩ thể trình bày một kiểu thực thể đơn lẻ hoặc một nhĩm kiểu thực thể quan hệ. Ví dụ: một lớp cĩ thể chỉ cĩ các đoạn sơng hoặc cĩ thể cĩ sơng, hồ, bờ biển. Một lớp đối tượng là một tập hợp các đối tượng biểu diễn một tập hợp thực thể. Ví dụ; tập hợp các điểm thể hiện tập hợp các lỗ khoan. 17
  19. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Hình 2.2 Tổ chức các lớp dữ liệu Thuộc tính (Attribute) 18
  20. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Là những mục dữ liệu mơ tả thực thể thường là dữ liệu phi khơng gian. Giá trị thuộc tính Giá trị thực sự của thuộc tính cĩ thể đo lường được và lưu trữ trong cơ sở dữ liệu. Mỗi kiểu thực thể luơn được gán nhãn (label) và được biết bởi các thuộc tính. Ví dụ: con đường cĩ tên và được xác định theo lớp của nĩ như: hẻm hay đường ơ tơ. Các giá trị thuộc tính thường được tổ chức trong các bảng liệt kê các thực thể theo hàng, cột. Mỗi kiểu thực thể chúng ta phải mơ tả một số thuộc tính. Ví dụ: thuộc tính cho thực thể “NGƯỜI” và “CHỖ Ở” và thực thể khơng gian KHU VỰC là: Kiểu thực thể Những thuộc tính Giá trị thuộc tính Thực thể phi khơng gian NGƯỜI Tên "John Smith" Địa chỉ "14 High Street, Toytown" Ngày sinh "July 4 1937" CHỖ Ở Kiểu Separate house Địa chỉ "14 High Street, Toytown" Số lượng phịng 6 Thực thể khơng gian KHU VỰC Dân số 5, 134 Tuổi: 0-9 520 Tuổi: 10-19 724 19
  21. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Những kỹ thuật thơng tin địa lý Là những kỹ thuật-cơng nghệ để thu thập và phân phối thơng tin địa lý. Cĩ ba kiểu chính: Hệ thống định vị tồn cầu - (GPS) Là hệ thống vệ tinh quĩ đạo Trái Đất truyền tải những tín hiệu nhằm định vị trí trên bề mặt Trái đất. Đặc điểm hệ thống này là: Ê Những tín hiệu nhận được bởi các thiết bị điện tử đặc biệt. Các thiết bị này càng ngày càng nhỏ gọn hơn. Ê Cung cấp trực tiếp phép đo vị trí trên bề mặt Trái Đất. Ê Định vị trong dạng (kinh, vĩ độ) hay trong một hệ thống chuẩn khác. Viễn thám Sử dụng những vệ tinh quĩ đạo Trái Đất thu nhận những thơng tin bề mặt Trái Đất và khí quyển. Thơng tin thu nhận được rất khác nhau tùy thuộc vào độ phân giải khơng gian, phân giải phổ thu nhận được. Những tín hiệu được truyền về Trái Đất và thu nhận bởi các trạm thu và những tín hiệu này được chuyển ra dạng phổ biến là những ảnh số. Hệ thống thơng tin địa lý HTTTĐL là sự phối hợp phần mềm, phần cứng, dữ liệu, người sử dụng vv , để giải quyết vấn đề, cho phép ra quyết định, giúp cho phát triển dự án. Khái niệm Hệ thống thơng tin địa lý - HTTTĐL Định nghĩa Hệ thống thống tin địa lý Ủy ban tọa độ quốc gia liên ngành về bản đồ số của Mỹ, 1988 định nghĩa: Hệ thống thơng tin địa lý là tập hợp phần cứng, phần mềm và các thủ tục để lưu trữ, quản lý, điều khiển, phân tích, mơ hình hĩa và hiển thị dữ liệu địa lý 20
  22. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ nhằm giải quyết các vấn đề quản lý và qui hoạch phức tạp. (Fischer and Nijkamp, 1992): Là hệ thống thơng tin máy tính dùng tiếp nhận, lưu trữ, thao tác, phân tích và hiển thị dữ liệu khơng gian và dữ liệu thuộc tính liên quan, nhằm giải quyết những nghiên cứu phức tạp, những vấn đề qui hoạch và quản lý. HTTTĐL đem lại sự thuận tiện nhờ sự phát triển nhanh của kỹ thuật vi xử lý, sức chứa dữ liệu cũng như khả năng phân tích dữ liệu. Dữ liệu ở đây là dữ liệu khơng gian liên quan với thế giới thực. Trong đĩ thế giới thực bao gồm nhiều yếu tố địa lý được thể hiện như những lớp dữ liệu quan hệ. 21
  23. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ Hình 2.3 Thế giới thực gồm nhiều lớp dữ liệu quan hệ Hệ thơng tin địa lý một cơng cụ quản lý, phân tích dữ liệu. Song song với sự phát triển về kỹ thuật HTTTĐL đĩ là sự phát triển về các khả năng ứng dụng của nĩ. Những yêu cầu mới về kỹ thuật bản đồ, quản lý nguồn tài nguyên thiên nhiên, giám sát sự biến đổi mơi trường sinh thái, quản lý rừng, quản lý nhân khẩu và nhiều lĩnh vực khác đã biến HTTTĐL trở thành một trong những ứng dụng máy tính lớn nhất hiện nay. Tại sao lại phát triển kỹ thuật này (?) bởi vì kỹ thuật HTTTĐL giúp chúng ta tổ chức dữ liệu về những vấn đề trên, cho phép tích hợp các thơng tin, tìm hiểu được mối liên hệ giữa các yếu tố. Rất nhiều các chương trình máy tính được sử dụng rộng rãi như Lotus 1-2-3, Excel, Winword cĩ thể hiểu như là dữ liệu (data) và Auto CAD hiểu là dữ liệu đồ họa, nhưng nĩ khơng phải là HTTTĐL, sự khác nhau là HTTTĐL cho phép thực hiện mơ phỏng, vấn đáp, phân tích dữ liệu, tạo ra những sản phẩm dẫn xuất. HTTTĐL khơng phải đơn giản chỉ là hệ thống máy tính tạo ra bản đồ với tỉ lệ khác nhau, trong phép chiếu khác nhau hay với màu khác nhau, mà HTTTĐL là cơng cụ phân tích. Sức mạnh của HTTTĐL cho phép mơ hình hĩa, phân tích, hợp nhất và miêu tả nhiều loại dữ liệu, lưu trữ tạo ra các sản phẩm. HTTTĐL khơng chỉ lưu bản đồ để xem diện tích, chiều dài vv kỹ thuật HTTTĐL lưu dữ liệu ở dạng mà các nhà chuyên mơn tạo ra cách nhìn riêng của mình. HTTTĐL mơ phỏng, liên kết thơng tin địa lý bằng các đối tượng trên bản đồ, thơng tin được lưu như là thuộc tính hay thơng số hình học mơ tả cho các đối tượng. Ví dụ một con đường được thể hiện bằng đường trung tâm, điểm khống sản thể hiện bằng các biểu tượng đặc trưng và các thơng tin về nĩ. HTTTĐL ngày càng trở nên phổ biến với tính năng đồ họa nổi bật cộng với mơ hình 3 chiều sẽ làm cho bản đồ hấp dẫn và quan trọng hơn. Chức năng nối kết và nhúng đối tượng (Object Lingking and Embedding - OLE) sẽ cho phép nhập bản đồ vào bất cứ tài liệu nào. Những cơ sở dữ liệu đồ sộ cĩ thể tạo ra những 22
  24. Chương 2: KHOA HỌC THƠNG TIN ĐỊA LÝ đối tượng bản đồ lớn. Ví dụ; trên bản đồ nước Việt nam, bạn cĩ thể nhấn vào một Tỉnh, một thành phố, một con đường là cĩ đủ thơng tin cần thiết. HTTTĐL cĩ những thuận lợi từ sự tiến bộ trong hai lĩnh vực lớn về máy tính: Ê Phác thảo và vẽ trợ giúp bằng máy tính (CAD) là các thiết bị phục vụ cho đồ họa Ê Hệ thống quản lý cơ sở dữ liệu (DBMS) quản lý thuộc tính và các cột dữ liệu. Cả đồ thị và thuộc tính đều được thao tác bởi HTTTĐL. HTTTĐL mạnh hơn CAD vì dữ liệu đồ thị nối kết với với dữ liệu thuộc tính được điều khiển bởi hệ quản trị dữ liệu (DBMS). Mỗi hệ HTTTĐL bao gồm DBMS hoặc giao tiếp được với DBMS. Sự phân biệt rõ ràng giữa hệ HTTTĐL và CAD là khả năng thực hiện các phân tích khơng gian. Tổng hợp các nhận thức trên cho thấy HTTTĐL khơng chỉ là dụng cụ phác thảo mà cịn là dụng cụ quản lý và phân tích, trợ giúp cho việc ra quyết định với hệ thống cơ sở dữ liệu cĩ các chức năng mạnh. 23
  25. Chương 3 CÁC THÀNH PHẦN GIS Chương 3 CÁC THÀNH PHẦN & HỆ THỐNG CỦA HỆ THỐNG THƠNG TIN ĐỊA LÝ Trong chương này sẽ giới thiệu các thành phần của HTTTĐL bao gồm phần cứng, phần mềm, con người, dữ liệu và các phương pháp. Các hợp phần này tạo nên 3 hệ thống con của HTTTĐL đĩ là: Ê Hệ thống nhập dữ liệu. Ê Hệ thống quản trị dữ liệu. Ê Hệ thống xuất dữ liệu. 23
  26. Chương 3 CÁC THÀNH PHẦN GIS Hình 3.1 Các thành phần cơ bản của HTTTĐL Các thành phần cơ bản HTTTĐL Phần cứng (Hardware) Phần cứng là các thiết bị sử dụng trong các thao tác HTTTĐL. Ngày nay phần mềm HTTTĐL chạy trên mọi kiểu phần cứng, Từ máy chủ trung tâm tới máy tính cá nhân, trên mạng hay máy đơn. Máy tính. Máy tính sử dụng trong HTTTĐL cĩ thể máy tính cá nhân, máy chủ và cĩ thể làm việc trong mơi trường mạng. Vì cĩ quá nhiều dữ liệu địa lý là hệ giao tiếp đồ họa, ví dụ: bao gồm các điểm, đường và các ảnh nên các nhà phân tích HTTTĐL muốn cĩ các phần cứng đặc 24
  27. Chương 3 CÁC THÀNH PHẦN GIS biệt để thực hiện, ví dụ: với cơng việc tương tác cần trạm làm việc giao tiếp đồ họa (workstation) với màn hình lớn, độ phân giải cao. Thiết bị nhập dữ liệu. Bao gồm bàn số hĩa (digitizer) và máy quét (scanner). Bàn số hĩa dùng số hĩa những yếu tố lựa chọn trên bản đồ giấy. Số hĩa bàn số là một phương pháp phổ biến chuyển đổi bản đồ giấy và hình ảnh thành dạng số. Tuy vậy, đây là quá trình mệt mỏi, đặc biệt khi chuyển đổi những bản đồ mật độ cao. Máy quét ngày nay cĩ thể thay thế bàn số bởi tự động chuyển đổi bản đồ giấy thành dạng số. Trong HTTTĐL, những ảnh raster cĩ thể chuyển thành dạng vector thơng quá quá trình chuyển đổi "raster-to-vector". Máy in. Những thiết bị này dùng để in bản đồ. Gồm một số loại như: in kim, in phun, in laser. Kiểu máy vẽ gồm: bút vẽ (pen plotter), vẽ nhiệt thường địi hỏi phần cứng chất lượng cao. Hệ thống lưu trữ. Gồm: đĩa quang học, đĩa từ (ổ cứng máy tính), đĩa mềm, băng từ. Theo quan điểm của các nhà địa lý, phần cứng đang được quan tâm hiện nay là hệ thống định vị tồn cầu. Phần mềm Phần mềm HTTTĐL cung cấp những chức năng và những cơng cụ cần thiết để nhập, lưu trữ, phân tích và hiển thị thơng tin địa lý. Những chức năng chính là: Ê Những cơng cụ cho việc nhập và thao tác với thơng tin địa lý. Ê Hệ thống lưu trữ và quản trị cơ sở dữ liệu. Ê Những cơng cụ cho phép chất vấn, phân tích, thể hiện, chuyển đổi dữ liệu. Ê Giao tiếp đồ họa với người sử dụng dễ dàng truy xuất, trình bày dữ liệu. Phần mềm HTTTĐL bao gồm: 25
  28. Chương 3 CÁC THÀNH PHẦN GIS Chương trình HTTTĐL. Là những gĩi ứng dụng chuyên dụng như mơ hình hĩa địa hình và phân tích mạng lưới. Những phần mềm HTTTĐL gồm: Ê Modul GIS Environment của hãng Intergraph Corp., Ê Geo/SQL của Generation 5 Tech. Inc., Ê ARC/INFO của Environmental Systems Research Institute Inc., (ESRI) Ê SPANS của Tydac Technologies, Ê FMS/AC của Facility Mapping Systems Inc. Những chương trình bản đồ máy tính cung cấp nhiều chức năng như HTTTĐL, nhưng bị giới hạn khả năng các phân tích khơng gian. Chúng được phát triển để thỏa mãn nhu cầu người sử dụng biểu diễn bản đồ. Một số chương trình loại này gồm: Ê MapInfo phát triển bởi MapInfo Corp., Ê Atlas GIS phát triển bởi Strategic Mapping Inc., Ê MapGrafix phát triển bởi ComGrafix Inc., Ê QUIKMAP phát triển bởi AXYS Software Ltd. etc. Phần mềm cơng cộng là những chương trình HTTTĐL phát triển bởi chính phủ hoặc các trường đại học, Cho phép miễn phí hoặc giá tượng trưng. Gồm các phần mềm như: Ê IDRISI của trường Clark University. Ê GRASS của GRASS Information Center. Ê MOSS của Autometric Inc. Dữ liệu 26
  29. Chương 3 CÁC THÀNH PHẦN GIS Thành phần quan trọng trong HTTTĐL là dữ liệu. Dữ liệu địa lý và những dữ liệu bảng biểu liên quan cĩ thể thu thập hoặc mua từ những nhà cung cấp dữ liệu. HTTTĐL sẽ tích hợp dữ trong HTQTDL nhằm tổ chức và duy trì dữ liệu khơng gian và thuộc tính. Khi tiến hành phân tích khơng gian, người dùng phải cĩ các kỹ năng lựa chọn và sử dụng cơng cụ từ các hộp cơng cụ HTTTĐL và cĩ những kiến thức sâu sắc về các dữ liệu sử dụng. Con người (chuyên gia) Con người quản lý hệ thống và phát triển các dự án nhằm ứng dụng HTTTĐL để nghiên cứu các vấn đề thực tế. Người sử dụng gồm các chuyên gia kỹ thuật, người thiết kế và duy trì hệ thống, người sử dụng nĩ để trợ giúp thực hiện những cơng việc hàng ngày. Con người tham gia HTTTĐL gồm: Những thành viên thực hiện, gồm: Ê Người vẽ bản đồ, theo dõi thiết kế hiển thị bản đồ, những chuẩn biểu tượng, ký hiệu bản đồ và những chuẩn loạt bản đồ. Ê Nhập dữ liệu, chuyển đổi bản đồ thành dạng số. Ê Những người sử dụng HTTTĐL. Chuyên viên kỹ thuật: Ê Phân tích thơng tin giải quyết các vấn đề, làm thỏa mãn những yêu cầu thơng tin của người sử dụng. Ê Người quản trị hệ thống, luơn duy trì hệ thống hoạt động. Ê Lập trình viên, chuyển đổi những ứng dụng của người phân tích thành chương trình. Ê Người quản trị dữ liệu, trợ lý cho người phân tích, lập trình viên vả người sử dụng nhằm tổ chức các yếu tố địa lý thành những lớp dữ liệu, 27
  30. Chương 3 CÁC THÀNH PHẦN GIS xác định nguồn dữ liệu, phát triển cấu trúc mã cho các dữ liệu thuộc tính, và những tài liệu thơng tin về nội dung CSDL. Tổ chức: Ê Người quản lý, theo dõi thực hiện dự án HTTTĐL. Ê Người quản lý chất lượng. Những phương pháp Những phương pháp thực hiện sẽ quyết định sự thành cơng một dự án HTTTĐL, tùy thuộc vào những kế hoạch thiết kế, luật lệ chuyển giao vv Hệ thống vận hành HTTTĐL Gồm 3 hệ thống con (Hình 3.3) Hình 3.2 Hệ thống vận hành hệ HTTTĐL 28
  31. Chương 3 CÁC THÀNH PHẦN GIS Hình 3.3 Hệ thống vận hành hệ HTTTĐL Ê Hệ thống đầu vào cho phép thu thập dữ liệu sử dụng cho phân tích theo mục đích. Ê Hệ thống phần mềm, phần cứng để lưu trữ, quản lý và phân tích dữ liệu hiển thị những thao tác trên màn hình máy tính. Ê Hệ thống đầu ra tạo ra các bản in (bản đồ, hình ảnh) và những kiểu kết quả khác. 29
  32. Chương 3 CÁC THÀNH PHẦN GIS Hệ thống của phần mềm HTTTĐL điển hình Hình 3.4: các thành phần của một phần mềm HTTTĐL điển hình. Hệ thống số hĩa bản đồ Hệ thống số hĩa bản đồ sử dụng chuyển bản đồ giấy sang dạng bản đồ số để xây dựng CSDL. Một trong các phương pháp số hĩa thơng thường là dùng bàn số để nhập dữ liệu vector. Phương pháp thứ hai là sử dụng thiết bị scanner để quét bản đồ sau đĩ dùng các chức năng số hĩa của phần mềm HTTTĐL chuyển raster sang vector. 30
  33. Chương 3 CÁC THÀNH PHẦN GIS Hệ thống thể hiện bản đồ Hệ thống này cho phép thể hiện bản đồ trên màn hình máy tính, in bản đồ bằng máy in, máy vẽ. Các sản phẩm bản đồ trong các phần mềm HTTTĐL là rất lớn. HTTTĐL cung cấp các loại bản đồ với chất lượng cao, cho phép trình bày các thành phần bản đồ linh động và tương tác cao trên màn hình, bao gồm các chi tiết kỹ thuật của nhiều lớp dữ liệu phức tạp như chú giải, thước tỷ lệ, bản đồ nhiều màu sắc và những ký hiệu. Hệ thống quản lý cơ sở dữ liệu Theo truyền thống thuật ngữ này trình bày kiểu phần mềm dùng để nhập, quản lý và phân tích dữ liệu thuộc tính cũng như các dữ liệu khơng gian. HTTTĐL kết hợp chặt chẽ khơng chỉ QTCSDL truyền thống mà cịn nhiều tiện ích để quản lý hợp phần khơng gian và thuộc tính các dữ liệu địa lý. Hệ thống QTCSDL quản lý các dữ liệu thuộc tính như các thơng tin dạng bảng, thống kê, chiết suất các thơng tin đặc biệt để tạo các thơng báo mới. Tuy vậy, quan trọng nhất, Hệ thống QTCSDL cung cấp khả năng phân tích dữ liệu thuộc tính. Ví dụ: Thành lập bản đồ những ngơi nhà nơi mà chủ hộ gia đình cĩ một hoặc nhiều con. Sản phẩm cuối cùng (một bản đồ) là dữ liệu khơng gian nhưng trong phân tích nĩ khơng cĩ đặc tính khơng gian. Hệ thống phân tích địa lý Với hệ thống phân tích địa lý, chúng ta mở rộng khả năng chấn vấn dữ liệu truyền thống bao gồm khả năng phân tích dữ liệu dựa vào vị trí của chúng. Ví dụ: đơn giản nhất là khi chúng ta quan tâm sự kiện chung của các yếu tố địa lý khác nhau. Giả thiết chúng ta muốn tìm diện tích đất cư trú trên các loại đá gốc với mức khí radon cao. Đây là vấn đề mà HTQTCSDL đơn giản khơng thể giải quyết vì các kiểu đá gốc và phân chia sử dụng đất khơng chia sẻ cùng một dữ liệu địa lý. Chất vấn cơ sở dữ liệu truyền thống thực hiện tốt với điều kiện là chúng ta nĩi về các thuộc tính phụ thuộc vào cùng một yếu tố. Nhưng khi 31
  34. Chương 3 CÁC THÀNH PHẦN GIS các yếu tố khác nhau, nĩ khơng thể thực hiện. Vì vậy chúng ta phải cần đến HTTTĐL. Thực ra, HTTTĐL cĩ khả năng so sánh các yếu tố khác nhau dựa trên các sự kiện địa lý chung của chúng, đĩ là dấu hiệu xác nhận tiêu chuẩn của HTTTĐL. Sự phân tích này được thực hiện thơng qua một quá trình gọi là "overlay". Giống như HTQTCSDL hệ phân tích địa lý cĩ hai cách tương tác với cơ sở dữ liệu: trong khi truy cập dữ liệu từ cơ sở dữ liệu, nĩ cĩ thể đĩng gĩp các kết quả mà nĩ phân tích như một phần thêm mới cho cơ sở dữ liệu. Ví dụ, chúng ta cĩ thể tìm mối lên quan các giữa các bậc độ dốc và đất đai bị xâm thực do nơng nghiệp và tạo ra bản đồ gọi là nguy cơ xâm thực đất. Bản đồ này khơng phải là bản đồ nguyên thủy mà nĩ xuất phát từ các dữ liệu hiện cĩ và một tập hợp các dữ liệu xác định. Khả năng phân tích của hệ thống phân tích địa lý và HTQTCSDL giữ vai trị quan trọng trong việc mở rộng CSDL thơng qua việc bổ sung các tri thức về mối quan hệ giữa các yếu tố. Hệ thống xử lý ảnh Một số phần mềm HTTTĐL cịn cĩ khả năng phân tích ảnh viễn thám và cung cấp các phân tích thống kê chuyên hĩa. Phần mềm xử lý ảnh cho phép lấy ảnh viễn thám dạng thơ và chuyển sang dạng dữ liệu bản đồ giải đốn (ảnh Landsat, SPOT) theo các thủ tục phân loại khác nhau. Hệ thống phân tích thống kê HTTTĐL cung cấp cả các thủ tục thống kê truyền thống cũng như một số thủ tục chuyên hĩa để phân tích thống kê các dữ liệu khơng gian. Các nhà địa lý đã phát triển hàng loạt các thủ tục chuyên hĩa để mơ tả thống kê các dữ liệu khơng gian, một phần do tính chất đặc biệt của dữ liệu khơng gian, một phần do dữ liệu khơng gian đặt ra các vấn đề đặc biệt để suy luận bản đồ từ các thủ tục thống kê. 32
  35. Chương 4: Cơ sở dữ liệu HTTTĐL Chương 4 Cơ sở dữ liệu HTTTĐL HTTTĐL thuộc loại ứng dụng máy tính để xây dựng một CSDL lớn. Khơng giống như các ứng dụng máy tính khác, người sử dụng cĩ thể dùng ngay sau khi mua phần cứng và phần mềm. Để sử dụng HTTTĐL yêu cầu một CSDL khơng gian được xây dựng thích hợp với phần cứng, phần mềm và những ứng dụng đã phát triển, những thành phần đã thiết đặt, tích hợp và kiểm tra trước khi cĩ thể sử dụng CSDL HTTTĐL. Trong chương này sẽ trình bày những vấn đề liên quan tới xây dựng Cơ Sở Dữ Liệu (CSDL HTTTĐL) 33
  36. Chương 4: Cơ sở dữ liệu HTTTĐL Đặc điểm CSDL HTTTĐL Hình 4.1 Chu trình CSDL HTTTĐL 34
  37. Chương 4: Cơ sở dữ liệu HTTTĐL CSDL rất quan trọng vì để tạo ra nĩ thường tới 3/4 thời gian để phát triển HTTTĐL. Mỗi lần tổ chức thơng tin, CSDL xây dựng từ 10 tới 15 năm. CSDL tĩm lược rành mạch, rõ ràng loại thơng tin về thế giới thực và tổ chức nĩ theo phương thức chứng tỏ sự hiệu quả (hữu ích). CSDL được xem như biểu diễn hay mơ hình của thực tế (world) được phát triển cho ứng dụng cụ thể. Một trong những lý do cĩ rất nhiều hệ thống phần mềm và phần cứng sử dụng cho GIS vì mỗi hệ thống cho phép người sử dụng biểu diễn hay mơ hình những kiểu nào đĩ của tự nhiên. Tổ chức CSDL HTTTĐL hay những mơ hình CSDL Cĩ 4 mơ hình CSDL cơ bản là Mơ hình quan hệ, Mơ hình mạng, Mơ hình phân nhánh, Mơ hình hướng đối tượng. 35
  38. Chương 4: Cơ sở dữ liệu HTTTĐL Các mơ hình CSDL Mơ hình quan hệ Dữ liệu được tổ chức bởi những bản ghi giống như bảng (xem chi tiết hơn trong Chương 5) Hình 4.4 Mơ hình dữ liệu quan hệ Ê Trong mơ hình dữ liệu quan hệ (hình 4.4) khơng cĩ cấp bậc của trường dữ liệu, mỗi trường dữ liệu được dùng như là key. Ê Mỗi bảng hai chiều thường được lưu trữ như một tập tin riêng. Ê Bảng thể hiện mối quan hệ giữa tất cả thuộc tính được chứa trong bảng. Ê Việc tìm kiếm những thuộc tính quan hệ được lưu trữ trong những bảng khác nhau cĩ thể được làm bằng cách nối hai hoặc nhiều bảng dùng thuộc tính giống nhau. Ê Đây là hệ thống linh động nhất và thích hợp cho việc sử dụng SQL 36
  39. Chương 4: Cơ sở dữ liệu HTTTĐL (structured query language). Vì tính linh động hệ thống này nên phần lớn mơ hình dữ liệu quan hệ được sử dụng nhiều nhất để lưu trữ thơng tin thuộc tính trong hệ HTTTĐL. Điều quan trọng là những dữ liệu phi khơng gian được phân chia ra một vài dạng tùy theo sự cần thiết truy xuất chúng như: file ngang hàng, file phân nhánh và file quan hệ. Phương pháp đơn giản nhất là file ngang hàng trong đĩ mỗi yếu tố địa lý tương xứng một hàng dữ liệu. Mơ hình mạng Ê Dữ liệu được tổ chức bởi những bản ghi với con trỏ liên kết. Mơ hình phân nhánh Ê Dữ liệu được tổ chức bởi những bản ghi trong tổ chức cha-con một-tới- nhiều mối quan hệ. Ê Dữ liệu được tổ chức theo cấu trúc hình cây (Hình 4.3). Cấp bậc cao nhất gọi là gốc. Ê Đây là loại mơ hình cĩ lớp trên, lớp dưới. Mỗi thành phần chỉ cĩ một cha nhưng cĩ nhiều con. Ê Trong mơ hình phân cấp, mọi quan hệ là quan hệ nhiều – một hoặc quan hệ một – một. Ê Việc truy tìm dữ liệu sẽ hiệu quả nếu khơng cĩ nhiều cấp trung gian trong CSDL. Hướng đối tượng Mơ hình mới nổi lên, dữ liệu duy nhất xác định như những đối tượng riêng biệt phân loại thành những kiểu đối tượng hay lớp tùy thuộc vào đặc điểm (những thuộc tính và những phép tốn) 37
  40. Chương 4: Cơ sở dữ liệu HTTTĐL Thiết kế một CSDL HTTTĐL Hình 4.2 Các bước phát triển CSDL HTTTĐL. Thiết kế một CSDL HTTTĐL bao gồm các bước: Thiết kế khái niệm 38
  41. Chương 4: Cơ sở dữ liệu HTTTĐL Ở mức thiết kế này là cơ sở hình thành CSDL cần xây dựng, được xây dựng trên cơ sở khảo sát nhu cầu, thơng tin, nguồn dữ liệu. Xây dựng một sơ đồ tổng quát cho các yêu cầu cho CSDL HTTTĐL. Mức thiết kế này khơng phụ thuộc vào phần cứng hoặc phần mềm. Chỉ quan tâm đến các mục tiêu ứng dụng mà người dùng địi hỏi. (Bước 1, 2, 3, 4 trên sơ đồ Hình 4.2). Thiết kế logic Trong mức thiết kế này, CSDL được mơ tả chi tiết, bao gồm các hạng mục tin, các mối quan hệ dữ liệu, đặt mức độ chính xác, các thủ tục đảm bảo tồn vẹn dữ liệu. Thiết kế logic cũng đưa ra cấu trúc của các thành phần trong CSDL (cịn gọi là cấu trúc CSDL). Mức thiết kế này là khởi điểm của các cơng việc tin học. Người thiết kế phải hiểu rõ tính năng của một hệ thống phần mềm quản trị CSDL. Trong mức này, người thiết kế đưa ra các phương án để lựa chọn các thành phần của CSDL HTTTĐL. (Bước 5, 6) Thiết kế vật lý Mức này là sự triển khai và điều chỉnh thành quả của mức logic trên các phần cứng, phần mềm cụ thể của HTTTĐL . Phát triển CSDL HTTTĐL khơng chỉ đơn thuần mua phần cứng hay phần mềm. Phần địi hỏi khắt khe nhất quá trình phát triển HTTTĐL là xây dựng CSDL. Địi hỏi nhiều thời gian nhất, chi phí nhiều tiền nhất, và yêu cầu nỗ lực trong lập kế hoạch và quản lý. Mặc dù chu trình phát triển HTTTĐL hiện nay phần lớn tập trung vào xây dựng CSDL, nhưng một số địa phương vẫn tập trung vào mua phần cứng và phần mềm. Việc chọn lựa đúng cho xây dựng CSDL đúng đắn phải dựa trên sự hiểu biết của những cơ quan cĩ kinh nghiệm. 39
  42. Chương 4: Cơ sở dữ liệu HTTTĐL Các bước phát triển CSDL HTTTĐL Hình 4.2 Các bước phát triển CSDL HTTTĐL. 40
  43. Chương 4: Cơ sở dữ liệu HTTTĐL Gồm 11 bước bắt đầu bằng việc đánh giá và kết thúc với việc sử dụng và duy trì hệ thống HTTTĐL. Những bước này cĩ mối liên quan mật thiết với nhau, mỗi bước hồn thiện sẽ khởi đầu cho những bước tiếp theo. Trong khi thực tế một số hoạt động này cĩ khi xảy ra đồng thời. Mơ hình hĩa dữ liệu Mơ hình hĩa dữ liệu là một quá trình định nghĩa các hiện tượng hay các yếu tố địa lý mà đặc điểm và những mối quan hệ chúng được quan tâm. Liên quan tới thực hiện tổ chức thơng tin và cấu trúc dữ liệu. Cĩ ba mức trong quá trình mơ hình hĩa dữ liệu, những mơ hình dữ liệu tăng dần nghi thức định nghĩa chính xác hơn trong CSDL HTTTĐL. Mơ hình hĩa khái niệm- định nghĩa rộng và tổng quát phạm vi và yêu cầu của CSDL. Mơ hình hĩa Logic – xác định yêu cầu người sử dụng của CSDL với những định nghĩa rõ ràng những thuộc tính và những mối quan hệ. Mơ hình hĩa vật lý – xác định cấu trúc lưu trữ bên trong và tổ chức các file dữ liệu trong CSDL. MHHDL liên quan tới 3 mức mơ hình dữ liệu trong thiết kế CSDL: Mơ hình hĩa khái niệm ªMơ hình dữ liệu Mơ hình hĩa Logic ª Cấu trúc dữ liệu Mơ hình hĩa vật lý ª Cấu trúc file 41
  44. Chương 4: Cơ sở dữ liệu HTTTĐL H 4.1 Những mức độ rút gọn dữ liệu trong tổ chức thơng tin 4.1. Mơ hình hĩa khái niệm Mơ hình hĩa dữ liệu khái niệm: nhận biết, nhận diện nội dung dữ liệu và mơ tả nĩ trong dạng tĩm tắt, hay khái niệm, mức độ của nĩ. Bước này xác định mục tiêu CSDL HTTTĐL cần làm gì, làm sao sẽ thực hiện được. Trên cơ sở đĩ, xác định tất cả các dạng nhu cầu về dữ liệu của người dùng nhằm thực hiện mục tiêu nĩi trên. Thiết kế khái niệm hệ thống HTTTĐL là bước tiền thân của thiết kế CSDL HTTTĐL, bao gồm các mơ hình nghi thức, thủ tục (chuẩn bị cho mơ hình dữ liệu) cho CSDL HTTTĐL và khởi đầu cho chiến lược xây dựng CSDL. Thiết kế khái niệm CSDL là hoạt động quan trọng nhất trong phát triển HTTTĐL. Chuẩn bị mơ hình dữ liệu HTTTĐL Mơ hình dữ liệu là hình thức xác định yêu cầu dữ liệu trong HTTTĐL. Mơ 42
  45. Chương 4: Cơ sở dữ liệu HTTTĐL hình dữ liệu cĩ thể trong một vài dạng: Ê Biểu đồ Thực thể-mối quan hệ. Mục đích của mơ hình dữ liệu và quá trình xác định mơ hình là đảm bảo rằng dữ liệu được nhận dạng và mơ tả trong tính tồn vẹn chính xác và kiểu cách hình thức được người sử dụng và người phân tích dữ liệu chấp nhận. Mơ hình dữ liệu lúc này cĩ hình thức đặc biệt của thực thể những thuộc tính và tất cả mối quan hệ thực thể trong HTTTĐL (Dạng xác định của thực thể, đặc tính của chúng và tất cả các mối quan hệ giữa những thực thể trong HTTTĐL). Việc xây dựng mơ hình dữ liệu khơng cần thiết cho dự án qui mơ nhỏ. Hình Mơ hình thực thể -mối quan hệ Mơ hình hĩa dữ liệu thực thể-mối quan hệ (E-R) Mơ hình thực thể-mối quan hệ (entity-relationship), hai ví dụ sẽ xem xét. Những CSDL bình thường (thực tế) 43
  46. Chương 4: Cơ sở dữ liệu HTTTĐL Ví dụ CSDL về cơng chức trong một tổ chức gồm thơng tin (nhân viên, người phụ thuộc, văn phịng, vv ). Những mối quan hệ giữa những thực thể NHÂN VIÊN làm việc trong CƠ QUAN và NHÂN VIÊN cĩ NGƯỜI LIÊN QUAN. Một số thuộc tính của mỗi thực thể như sau: (Hình 4.4). NHÂN VIÊN (tên, tuổi, giới tính, nghề) NGƯỜI LIÊN QUAN (tên, tuổi, quan hệ với NHÂN VIÊN) CƠ QUAN (tên tên cơ quan, chức năng, qui mơ). CSDL khơng gian đơn giản sẽ như sau Ví dụ CSDL khơng gian đơn giản gồm thơng tin (TRƯỜNG HỌC, MƠN HỌC, THUỘC TỈNH, vv ). Hình 4.5 Những mối quan hệ giữa những thực thể TRƯỜNG HỌC thuộc TỈNH và TRƯỜNG HỌC cĩ MƠN HỌC. Một số thuộc tính của mỗi thực thể như sau: TRƯỜNG HỌC (tên trường, diện tích, loại trường, số giáo viên, ) MƠN HỌC (tốn, lý, hĩa, ) XÃ (Mã xã, tên xã, thuộc Tỉnh, diện tích). 44
  47. Chương 4: Cơ sở dữ liệu HTTTĐL Tên Tên cơ quan Tuổi NHÂN VIÊN Làm việc trong CƠ QUAN Chức năng Giới tính Qui mô Nghề nghiệp Có Tên Tuổi NGƯỜI LIÊN QUAN Mối quan hệ Hình 4.4 CSDL đơn giản một cơ quan Dạng sơ đồ CSDL khơng gian như sau: Tên trường Tên xã (Thuận lợi) Diện tích TRƯỜNG HỌC Nằm trong XÃ Thuộc Tỉnh Loại trường Diện tích Số giáo viên ID# Có Toán Lý Môn học Hóa Hình 4.5 CSDL khơng gian đơn giản. Những sơ đồ trên là ví dụ sử dụng hai chuẩn ký hiệu thiết kế CSDL khái niệm: 45
  48. Chương 4: Cơ sở dữ liệu HTTTĐL Ê Thực thể: tên thực thể và danh sách thuộc tính Ê Biểu đồ quan hệ thực thể: trình bày những thực thể, những thuộc tính của chúng và mối quan hệ giữa các thực thể. Trên hình 4.5, cần hai điều cần chú ý: Ê Biểu đồ tiêu chuẩn thực thể-mối quan hệ khơng biểu diễn hay miêu tả thực thể khơng gian (point, line, polygon) của dữ liệu. Ê Những miêu tả các thuộc tính (biểu diễn bằng hình ellipse) cĩ thể bất tiện vì chiều dài tên khác nhau và số lượng các thuộc tính sẽ trình bày. Mơ hình cơ bản thực thể-mối quan hệ Khi xây dựng mơ hình cơ bản thực thể-mối quan hệ chú ý ba nội dung (Chen 1976): Ê Những thực thể. Ê Quan hệ giữa những thực thể. Ê Những thuộc tính thực thể hay mối quan hệ. Mỗi thành phần cĩ một biểu tượng và chúng tồn tại theo một tập hợp qui luật xây dựng biểu đồ (ví dụ, mơ hình E-R) CSDL sử dụng 3 biểu tượng cơ bản. Hình 4.6. Những thực thể biểu diễn như những hình chữ nhật. Những mối quan hệ biểu diễn như hình thoi. Những thuộc tính biểu diễn như ellipse. Những mối quan hệ thơng thường trong mơ hình E-R cơ bản là: 1. Những mối liên quan. 2. Tập hợp và nhĩm mối quan hệ. 46
  49. Chương 4: Cơ sở dữ liệu HTTTĐL 3. Mối quan hệ cha-con. 4. Những mảng thành phần mỗi đối tượng. MỎ Nằm trong XÃ Khai thác bởi Quản lý bởi Công ty Tên: ABC Chủ tịch xã Tên: Ng V A Hình 4.6 Ví dụ biểu đồ thực thể-mối quan hệ đơn giản Cĩ thể xây dựng nhiều dạng biểu đồ E-R cho dữ liệu. Trong xây dựng biểu đồ E-R (mơ hình khái niệm) của CSDL cần xác định khi nào, cái gì đĩ biễu diễn là thực thể hay như là thuộc tính của thực thể khác. Trong quá trình xây dựng biểu đồ E-R sẽ xuất hiện bất hợp lý trong định nghĩa những thực thể, những mối quan hệ và những thuộc tính. Kết quả biểu đồ E-R nên loại bỏ những bất hợp lý, khi cĩ một biểu đồ rõ ràng cĩ thể trực tiếp chuyển thành những giản đồ thiết kế logic và vật lý. 47
  50. Chương 4: Cơ sở dữ liệu HTTTĐL 4.2. Mơ hình hĩa dữ liệu logic Hình 4.7 Hình thực thể -mối quan hệ Trong mức thiết kế này, CSDL được đặc tả chi tiết, bao gồm các hạng mục tin, các mối quan hệ dữ liệu, đặt độ chính xác, các thủ tục đảm bảo sự tồn vẹn dữ liệu. Thiết kế logic đưa ra cấu trúc của các thành phần trong CSDL (cịn gọi là cấu trúc CSDL). Mức thiết kế này là khởi điểm của các cơng việc tin học. Người thiết kế phải hiểu rõ tính năng của một hệ thống phần mềm quản trị CSDL. Trong mức này, người thiết kế đưa ra các phương án để lựa chọn các thành phần của CSDL HTTTĐL. Đây là cơng việc nhằm chuyển đổi thiết kế khái niệm thành thiết kế (logic) CSDL HTTTĐL. Trên cơ sở các thành phần đã được liệt kê ra trong phần thiết kế mức quan niệm, trong phần thiết kế này sẽ tập trung vào thiết kế chi tiết dữ liệu. Chuyển đổi từ biểu diễn thực thể biểu đồ E-R thành thiết kế logic CSDL cho thực thể đơn. Hình 4.8 minh họa tách riêng giữa thuộc tính thực thể và thơng 48
  51. Chương 4: Cơ sở dữ liệu HTTTĐL tin khơng gian trong MapInfo. THỰC THỂ Mã thuộc tính Đối tượng không gian Đối tượng Mã Mã thuộc tính Lớp dữ liệu Những thuộc tính Những thuộc tính Những thuộc tính *.TAB *.DAT *.MAP *.ID *.IND Những thuộc tính Hình 4.8 HTTTĐL biểu diễn đối tượng và đối tượng khơng gian Sự chuyển đổi từ biểu diễn thực thể trong mơ hình E-R thành thiết kế vật lý CSDL cho một thực thể đơn trong hình 4.8. 49
  52. Chương 4: Cơ sở dữ liệu HTTTĐL Diện tích trùng Thuộc tính khoảnh rừng. Số thứ tự ID# Diện tích. Chu vi. TIỂU KHU RỪNG Xã. Diện tích trùng Huyện Polyline G T TIỂU KHU RỪNG MAPINFO TABLE *.TAB *.DAT *.MAP *.ID *.IND TIỂU KHU RỪNG KHOẢNH TIỂU KHU RỪNG ID# TIỂU KHU RỪNG ID# TIỂU KHU RỪNG ID# Dien_tich KHOẢNH ID# Chu _vi Mã số khoảnh Hình 4.8 Ví dụ minh họa bản đồ hĩa E-R và thuộc tính trong MapInfo. Mỗi thực thể trong biểu đồ E-R sẽ biểu diễn trong một lớp dữ liệu (table trong phần mềm MapInfo). Thơng thường khơng chỉ một thực thể đơn được chuyển thành một lớp dữ liệu mà nhiều thực thể trong một lớp dữ liệu và chúng cĩ mối quan hệ với nhau. Do vậy cĩ thể cĩ một vài bảng dữ liệu được xây dựng để mơ tả những mối quan hệ phức tạp này. Hình 4.9 mơ tả mối quan hệ một vài thực thể trong lớp thủy văn. 50
  53. Chương 4: Cơ sở dữ liệu HTTTĐL SÔNG NHÁNH Polyline G T SÔNG CHÍNH LIÊN KẾT Polyline G T SÔNG NHÁNH Polyline G T Hình 4.9 Ví dụ minh họa bản đồ hĩa E-R và thuộc tính trong MapInfo. Trong hình 4.10 đối tượng sơng chính, sơng phụ (nhánh) trong cùng một lớp dữ liệu như những đối tượng đường, mối quan hệ dữ liệu sẽ tạo ra do phần mềm MapInfo. LỚP DỮ LIỆU THỦY VĂN MAPINFO TABLE *.TAB *.DAT *.MAP *.ID *.IND SÔNG CHÍNH SÔNG CHÍNH ID# SÔNG CHÍNH ID# SÔNG PHỤ SÔNG PHỤ ID# SÔNG PHỤ ID# Hình 4.10 Thiết kế vật lý với hai thực thể trong lớp thủy văn cĩ hai bảng dữ liệu liên quan Mỗi thực thể thể hiện trong sơ đồ E-R được chuyển đổi tới lớp dữ liệu 51
  54. Chương 4: Cơ sở dữ liệu HTTTĐL HTTTĐL trong đĩ gồm cả đối tượng khơng gian và mối liên hệ. Hơn nữa, mối liên hệ biểu diễn trong CSDL (hình lục giác đơn) cần chuyển đổi thành mã nguyên thủy và mã thứ sinh trong bảng dữ liệu của những thực thể biểu diễn. Trong hình 4.11 thực thể “XÔ cĩ “CHỨA” thực thể “KHOẢNH RỪNG”, trong bảng dữ liệu thuộc tính của mỗi lớp dữ liệu cĩ chứa mã nguyên thủy cho mỗi đối tượng (Xà ID#). Nhưng trong dữ liệu khoảnh rừng ngồi mã “KHOẢNH RỪNG ID#” cần cĩ mã thứ sinh “Xà ID#”. XA KHOẢNH RỪNG CHỨA Polygon G T Polygon G T Lớp dữ liệu Lớp dữ liệu KHOẢNH RỪNG ID# Xà ID# Xà ID# Hình 4.11: quan hệ CSDL với mã khĩa chính và phụ Để hồn thành thiết kế logic CSDL cần kiểm tốn tất cả các thực thể và thuộc tính của chúng như một đối tượng khơng gian với tọa độ và topology với tất cả mối quan hệ chứa trong CSDL. Sao cho những thơng tin này cĩ thể sử dụng trong phần mềm HTTTĐL. 52
  55. Chương 4: Cơ sở dữ liệu HTTTĐL 4.3. Mơ hình vật lý (physical data modeling) Hình Mơ vật lý Mức này là sự triển khai và điều chỉnh thành quả của mức logic trên các phần cứng, phần mềm cụ thể của HTTTĐL. Đồng thời nĩ sẽ yêu cầu các cấu hình của phần cứng cũng như phần mềm thích hợp để đảm bảo sự thành cơng của việc triển khai này. Phần mềm HTTTĐL tạo ra phần lớn thiết kế vật lý CSDL. Cấu trúc hay dạng của dữ liệu trong HTTTĐL, như ARC/INFO™, Intergraph™, System 9™, MapInfo™ vv thực sự được xác định trong từng phần mềm. Cĩ thể thấy rằng thiết kế vật lý những thực thể khơng gian hồn tồn xác định bởi các phần mềm và người thiết kế HTTTĐL khơng cần làm bất kỳ gì thêm. Những thuộc tính những thực thể được khống chế trong hệ thống quản lý mối quan hệ liên kết trong HTTTĐL. Trong trường hợp này, người làm HTTTĐL cần thiết kế những bảng quan hệ cho thơng tin thuộc tính. 53
  56. Chương 4: Cơ sở dữ liệu HTTTĐL 4.3.1. Thiết lập CSDL Cơng việc cài đặt này tuân thủ các địi hỏi của phần mềm quản trị CSDL. Thành lập hệ quản trị CSDL khơng gian cĩ khả năng đọc CSDL thuộc tính và kết nối nĩ với dữ liệu khơng gian. Bên cạnh đĩ cĩ thể sử dụng hệ quản trị CSDL phi khơng gian như ORACLE, DB2, SQL Server luơn cung cấp dịch vụ để bất kỳ hệ thống nào cũng cĩ thể truy nhập và đọc dữ liệu trong phạm vi quyền sử dụng của mình. Quan hệ trong cơ sở dữ liệu Trong CSDL HTTTĐL, cần định nghĩa ngắn gọn và súc tích, mơ hình dữ liệu mơ tả mối quan hệ giữa những thực thể. Ví dụ: Trong Lâm nghiệp § Mối quan hệ giữa loại rừng và Tỉnh là "thuộc vị trí" § Loại rừng-Thuộc vị trí-Tỉnh A Những mối quan hệ khơng trực tiếp: § Tỉnh - gồm rất nhiều - Loại rừng Cần xác định mỗi thực thể chỉ cĩ một mối quan hệ hay hơn một. Mối quan hệ cĩ thể: § Một-tới-một § Một-với-nhiều § Nhiều-với-nhiều. § Cĩ > Tỉnh (một) < gồm (nhiều) Loại rừng Dữ liệu khơng gian khơng giống như những dữ liệu cĩ qui luật trong CSDL máy tính, cần định nghĩa những thực thể khơng gian và những mối quan hệ của chúng. Xác định những thực thể dữ liệu địa lý gồm xác định tính chất tĩm tắt thực thể và định nghĩa biểu diễn thực thể khơng gian (ví dụ: polygon đại diện cho một hồ nước). Sự định nghĩa những thực thể khơng gian là một 54
  57. Chương 4: Cơ sở dữ liệu HTTTĐL trong những khác biệt HTTTĐL với hệ CSDL khác. Thực thể: Tự nhiên và Khái niệm Thực thể tự nhiên và Yếu tố không gian và thuộc tính của chúng thuộc tính của chúng Dạng đường (tọa độ, topology) Đoạn đường phố (tên, kiểu, độ rộng, ) Ngôi nhà (Địa chỉ, ngày xây dựng, ) Dạng điểm (Tọa độ) Kiểu đất (Diện tích, chu vi, loại đất, ) Polygon (Tọa độ, Topology, ) Hình 4.3 Ví dụ thực thể và thực thể khơng gian 55
  58. Chương 5 MƠ TẢ THƠNG TIN TRONG HTTTĐL 56
  59. Mức độ mơ tả thơng tin H5.1 Mức độ mơ tả thơng tin Những MHDL HTTTĐL Một CSDL HTTTĐL thể hiện một khía cạnh thế giới thực. Mỗi CSDL HTTTĐL là một tập hợp của dữ liệu cĩ liên quan tới khơng gian, những sự kiện phản ánh thực tế. Ta cĩ khái niệm: “Mơ hình (Model) là một tập hợp các nguyên tắc để mơ tả những dữ liệu được tổ chức hợp lý trong CSDL, đơi khi nĩ ngụ ý cả những chú thích, chú giải mơ tả dữ liệu và tập hợp những thao tác vận hành dữ liệu này” 57
  60. Trong HTTTĐL, chúng ta sử dụng “MHDL” để xây dựng mơ hình máy tính trình bày những một khía cạnh của thế giới thực mà chúng ta quan tâm. MHDL sử dụng trong HTTTĐL Quá trình tổ chức thơng tin liên quan với quá trình tổ chức dữ liệu (miêu tả, biểu diễn thế giới thực bằng cách sử dụng dữ liệu). Mức thấp nhất của mơ tả thơng tin được sử dụng thuật ngữ mơ hình dữ liệu-MHDL (Peuquet, 1991). Cĩ nhiều MHDL được sử dụng trong HTTTĐL, gồm: Mơ hình tổng quát Ê Mơ hình mì ống – (Spaghetti model) MHDL cơ bản – (Basic data models) Ê Vector Ê Raster Mơ hình khơng gian – (Spatial models) Ê Mơ hình hình học phẳng. Ê Mơ hình topology phẳng Mơ hình bề mặt - (Surface models) Ê Mơ hình số độ cao-(Digital Elevation Models -DEMs) Ê Mơ hình mạng tam giác –(Triangular Irregular Network -TIN) Mơ hình tốn học-(Mathematical models) Mơ hình khái niệm-(Conceptual models) Ê Mơ hình Thực thể - mối quan hệ (Entity-Relationship (ER)) 58
  61. Ê Mơ hình Thực thể - mối quan hệ nâng cao (Enhanced Entity- Relationship (EER)) Ê Mơ hình thực thi – (An implementation model) Ê Mơ hình quan hệ-(Relational model) Mơ hình ngữ nghĩa – (Semantic models) Ê Mơ hình hướng đối tượng (Object-oriented model) Ê Mơ hình chức năng (Functional model) Những mơ hình cĩ thứ bậc-(Hierarchical models) Ê quadtrees, strip trees Mơ hình độc quyền (Proprietary models) Ê Arc/Info Ê ERDAS Ê Geovision Ê Grass Ê Caris Ê DBMS based Ê Ingres Ê Oracle Ê Postgres Một số mơ hình sẽ được nĩi tới trong sách này, phần lớn chúng là những MHDL mơ tả. 59
  62. HTTTĐL gồm những mơ hình mơ tả những khía cạnh lựa chọn của thế giới thực. Thực tế khơng cĩ giới hạn những khía cạnh này, vì vậy khơng cĩ giới hạn về những MHDL . Do vậy, ý nghĩa MHDL là sự hữu ích của nĩ. Cấu trúc dữ liệu Mức cao hơn MHDL là cấu trúc dữ liệu, liên quan với thiết kế và quá trình tổ chức thơng tin. Thể hiện định hướng tổ chức dữ liệu thường liên quan tới phần mềm khơng xem xét phần cứng. Cấu trúc file Thể hiện định hướng phần cứng của dữ liệu, lưu trữ vật lý dữ liệu trong một số loại như ổ cứng, băng từ hay liên quan tới phần cứng độc lập nào đĩ. Cấu trúc dữ liệu mơ tả Cấu trúc dữ liệu mơ tả thể hiện thiết kế và thực hiện của quá trình tổ chức thơng tin phi thuộc tính khơng gian (non-spatial data). Như phần lớn các hệ thống thơng tin thực hiện ngày nay dựa trên mơ hình CSDL Quan hệ- relational và hướng đối tượng object-oriented. Cấu trúc dữ liệu quan hệ 60
  63. 5. 3 Cấu trúc dữ liệu quan hệ Đặc điểm cấu trúc dữ liệu quan hệ (Hình 5.3) Ì Mối quan hệ là một tập hợp (ký hiệu, biểu tượng, đặc điểm của một yếu tố) tương ứng như những hàng trong bảng. Ì Số lượng của tập hợp của yếu tố trong mối quan hệ được gọi là phần tử. Ì Các phần tử tạo nên thuộc tính của đối tượng tương ứng với cột trong bảng Ì Số lượng thuộc tính gọi là mức độ Ì Mỗi mối quan hệ xác định duy nhất gọi là khĩa gốc. Khĩa gốc là cột hay phối hợp cột sao cho giá trị một hàng cĩ cùng PK là duy nhất, điều này cho phép sử dụng PK liên kết dữ liệu trong những bảng khác nhau. 61
  64. Ì Những bảng dữ liệu khác cĩ cùng khĩa gốc nhưng được gọi là khĩa ngồi foreign keys . Ì Để đảm bảo tính tồn vẹn dữ liệu, mối quan hệ phải chuẩn hĩa và dựa trên dạng chuẩn hĩa. Cấu trúc dữ liệu hướng đối tượng (Object-oriented data structure) Hình 5.4 Cấu trúc dữ liệu hướng đối tượng Khơng giống mơ hình quan hệ, there is not a formalized object-oriented data structure Cấu trúc dựa trên sự thực hiện các hướng đối tượng khác nhau sẽ cĩ cấu trúc khác nhau, cĩ thể giải thích trong thuật ngữ tổng quát khái niệm tính xác định- 62
  65. object identify, Cấu trúc-object structure và type constructors (Elmasri and Navathe, 1994) Một đối tượng phức tạp được cấu trúc từ những đối tượng đơn giản. Mỗi đối tượng được xem như 3 phần (i, c, v) trong đĩ: i = Xác định duy nhất (he object's unique identifier (OID)) c = Cấu trúc (chỉ ra cơ chế tạo ra giá trị đối tượng) v = giá trị đối tượng (object value) MHDL khơng gian Cĩ hai mơ hình cơ bản để biểu diễn thành phần khơng gian của thơng tin địa lý đĩ là raster và vector. 63
  66. Hình 4.8 Mơ hình raster và vector biểu diễn Thế giới thực Mơ hình Raster (Raster model) Mơ hình raster dựa trên hệ thống hiển thị, định vị và lưu trữ dữ liệu địa lý bằng cách sử dụng ma trận lưới ơ (cell). Những biểu diễn tọa độ của mỗi pixcel là trung tâm (centroid) của nĩ. Lần lượt mỗi cell hay pixel cĩ những thuộc tính dữ liệu riêng biệt được gán cho chúng. Độ phân dải dữ liệu raster tùy thuộc vào kích cỡ pixel hay kích cỡ lưới, cĩ thể từ vài milimet tới nhiều kilomet. Mơ hình raster là những dữ liệu mảng hai chiều (two-dimensional), các thơng tin khác nhau được lưu trữ như lớp phủ rừng (forest cover), kiểu đất (soil type), sử dụng đất (land use), mơi trường đất ướt (wetland habitat), hay những kiểu dữ liệu khác. 64
  67. Với mơ hình raster, diện tích nghiên cứu được chia thành lưới đều đặn của những ơ, gồm các hàng và cột, toạ độ pixel t ính từ gĩc trái trên. Mơ hình Vector (Vector model) Mơ hình vector là mơ hình "điểm-đường-vùng" biểu diễn các đối tượng dạng điểm, đường và vùng. Hệ tọa độ Đềcac (Cartesian coordinates) (ví dụ x, y) và những thuật tốn máy tính về tọa độ xác định những điểm được sử dụng trong hệ thống vector. Những đường hay cung là một chuỗi các điểm. Diện hay vùng (polygon) là cũng lưu trữ như thứ tự các điểm, nhưng điểm đầu và cuối cĩ cùng vị trí, diện được đĩng kín và xác định. Cấu trúc dữ liệu đồ họa (Graphical data structures) Cấu trúc dữ liệu Raster (Raster data structure) 65
  68. Cấu trúc dữ liệu Raster Trong Cấu trúc dữ liệu Raster khơng gian được chia nhỏ thành những lưới ơ (vuơng) đều đặn hay lưới biết như những yếu tố ảnh-picture elements (pixels). Ì Vị trí mỗi ơ xác định số hàng và số cột của nĩ. Ì Diện tích đại diện mỗi ơ xác định độ phân dải khơng gian của dữ liệu. Ì Vị trí yếu tố địa lý chỉ xác định bởi pixel gần nhất. Ì Giá trị lưu trong mỗi ơ lưới chỉ thị những kiểu đối tượng, hiện tượng hay điều kiện tìm thấy trong chúng ở vị trí riêng biệt. Ì Những kiểu giá trị khác nhau cĩ thể mã hĩa: số nguyên (integers), số thực (real numbers) và thứ tự. 66
  69. Ì Giá trị nguyên thường là mã số đối tượng, tham chiếu tới tên trong bảng liện kết (gọi là look-up table) hay chỉ dẫn. Ì Những thuộc tính khác nhau ở cùng một vị trí ơ được lưu trữ trong những chủ đề khác nhau hay những lớp for example, raster data pertaining to the soil type, forest cover and slope covering the same area are stored separately in a soil type theme, a forest cover theme and a slope theme there are several variants to the regular grid raster data structure, including: irregular tessellation (e.g. triangulated irregular network (TIN)), hierarchical tessellation (e.g. quad tree) and scan-line (Peuquet, 1991) Một cách tổng quát, dữ liệu raster địi hỏi ít xử lý hơn dữ liệu vector, nhưng nĩ sử dụng nhiều khơng gian lưu trữ trong máy tính hơn. Trong kỹ thuật viễn thám, quá trình quét của bộ cảm nhận (sensor) trên vệ tinh lưu trữ dữ liệu ở dạng raster. Mơ hình địa hình - Digital terrain models (DTM) và mơ hình số độ cao-digital elevation models (DEM) là những ví dụ dữ liệu raster (Koeln et al 1994 and Huxhold 1991). 67
  70. Hình 4.5 Raster biểu diễn thế giới Cấu trúc dữ liệu Vector (Vector data structure) Hệ thống vector cĩ khả năng phân giải rất cao (» 0.001 inch) và in ấn xuất bản tương tự như bản đồ làm bằng tay. Hệ thống này làm việc tốt với phương vị, khoảng cách và những điểm, nhưng nĩ địi hỏi những cấu trúc phức tạp và ít tương thích với dữ liệu vệ tinh (remote sensing data). Dữ liệu vector cần ít khơng gian lưu trữ và duy trì mối quan hệ hình học dễ dàng. 68
  71. Hình 4.6 Vector biểu diễn thế giới (Koeln et al 1994; and Huxhold 1991) Cĩ nhiều cấu trúc dữ liệu vector, bao gồm: Spaghetti Spaghetti Cĩ lẽ đơn giản nhất trong các mơ hình HTTTĐL là mơ hình spaghetti model, Về bản chất là mơ hình vẽ bản đồ, với chúng những điểm, đường và những chuỗi ký tự được biểu diễn đơn thuần là vị trí. Hầu như khơng cĩ mơ tả rõ ràng cấu trúc Topology. Ranh giới chung giữa 2 polygon kề nhau được ghi 2 lần. 69
  72. Mơ hình này khơng hữu hiệu trong phân tích khơng gian, tuy nhiên nĩ rất hữu hiệu trong việc tái sản xuất bản đồ số mà khơng cần lưu trữ quan hệ khơng gian. Hình 4.9 MHDL Spaghetti Mơ hình (line-for-line) tương tự như bản đồ giấy thường là dữ liệu tạm thời trong số hĩa. 70
  73. Spaghetti Hierarchical (cấu trúc phân cấp) 71
  74. hierarchical 72
  75. Hình 4.3 MHDL phân cấp Topological (cấu trúc hình học) Cấu trúc dữ liệu vector trợ giúp mục đích duy trì mối quan hệ khơng gian bằng cách lưu giữ thơng tin liền kế nhau. 73
  76. topological Mơ hình topology được sử dụng rộng rãi trong việc mã hĩa các mối quan hệ khơng gian. Topology là phương pháp tốn học được dùng để định nghĩa các quan hệ khơng gian. Một số khái niệm trong mơ hình topology trong phần mềm ArcInfo: Arc (cung): chuỗi các điểm bắt đầu và kết thú tại node. Node (điểm nút): - Là điểm giao nhau của 2 hay nhiều arc. - Điểm kết thức 1 arc 74
  77. - Điểm riêng biệt Polygon (vùng): là chuỗi khép kín của các arc thể hiện ranh giới của vùng. Topology được ghi trong 3 bảng dữ liệu cho 3 loại yếu tố khơng gian: polygon, node và arc. Dữ liệu về tọa độ được ghi trong bảng thứ tư. Dữ liệu thuộc tính thường được lưu trữ trong các bảng quan hệ, trong đĩ 1 trường chứa ID của đối tượng khơng gian. Ưu điểm: Phân tích khơng gian được thực hiện khơng sử dụng dữ liệu tọa độ, giảm thời gian phân tích. Nhược: Cập nhật hĩa mơ hình topology mất nhiều thời gian. Hình 4.10 node topology 75
  78. Hình 4.11 arc topology 76
  79. Hình 4.12 polygon topology 4.3. So sánh hệ thống Raster và Vector (Vector hay Raster?) PP Thuận tiện Khơng thuận tiện Cấu trúc đơn giản Yêu cầu lưu trữ nhiều trên máy tính Tương thích với dữ liệu vệ tinh và Tùy thuộc vào kích cỡ pixel, sản phẩn in ấn khơng đẹp Raster dữ liệu ảnh quét. Chuyển đổi hệ thống tọa độ khĩ khăn Qui trình phân tích khơng gian đơn Rất khĩ mơ tả mối quan hệ hình học giản. Cấu trúc phức tạp Khơng thích hợp dữ liệu viễn thám Yêu cầu lưu trữ ít Phần cứng và phần mềm rất đắt tiền Vector Mối quan hệ hình học được duy trì Một số phân tích khơng gian rất khĩ khăn. Tạo những bản in đẹp phân tích chồng lớp các bản đồ vector (Overlaying) mất nhiều thời gian 77
  80. So sánh hai mơ hình, câu hỏi được đặt ra khơng phải là “mơ hình nào là tốt?” mà là dưới điều kiện nào thì cái này tốt hơn cái kia?. Trả lời câu hỏi thứ hai, chúng ta xem xét bốn vấn đề: Ê Độ chính xác tọa độ. coordinate precision Ê Tốc độ xử lý. speed of processing Ê Những yêu cầu lưu trữ. storage requirements Ê Kiểu của dữ liệu đại diện. type of data being represented 5.4 Cấu trúc dữ liệu quan hệ địa lý (The georelational data structure) CTDLQHĐL được phát triển để điều khiển, xử lý dữ liệu địa lý: Nĩ cho phép liên kết, kết hợp giữa khơng gian (graphical) và dữ liệu phi khơng gian (non-spatial) (mơ tả). Nĩ là cấu trúc sử dụng các phần mềm vector HTTTĐL. Cả dữ liệu khơng gian và phi khơng gian lưu trữ trong những bảng quan hệ. Ê Dữ liệu điểm, đường, vùng lưu trữ trong những bảng thuộc tính riêng biệt (separate feature attribute tables (FAT) (Hình ) 78
  81. Những yếu tố đồ họa cơ bản 79
  82. Cấu trúc dữ liệu quan hệ địa lý Trong FAT, mỗi thực thể gán duy nhất feature identifier (FID) Thơng tin hình lưu trữ dùng phương pháp tương tự cấu trúc dữ liệu hình học mơ tả bên trên. Dữ liệu phi khơng gian lưu trữ trong những bảng quan hệ o Những thực thể khơng gian và những bảng quan hệ phi khơng gian liên kết bằng FID cchung (hình) 80
  83. 4.1. Tổ chức dữ liệu thuộc tính HTTTĐL sử dụng mơ hình raster và vector để mơ tả vị trí, nhưng những bản ghi về những hiện tượng thế giới thực theo từng vị trí và những thuộc tính về chúng được biểu diễn như thế nào ?. HTTTĐL dđã cung cấp mối liên kết giữa dữ liệu khơng gian và phi khơng gian. Những mối liên kết này làm cho HTTTĐL thơng minh "intelligent", hơn nữa người sử dụng cĩ thể lưu trữ và kiểm tra thơng tin về “Cái đĩ ở đâu ?- where things are?” và “Chúng là cái gì-what they are”. Dữ liệu khơng gian-Spatial Data >> Phi khơng gian (Non-Spatial Data ) 81
  84. Yếu tố địa lý-Geographic Features >> Thuộc tính-Attributes Cĩ thể khái quát đây là mối quan hệ giữa: Vị trí biểu tượng >> Ý nghĩa chúng Trong hệ thống raster, những ký hiệu là vị trí ơ lưới trong ma trận. Trong hệ thống vector, những ký hiệu định vị cĩ thể là điểm, đường (line), curve, boundary, or vector; hay vùng: area, region, hay polygon. Mối liên kết biểu tượng và ý nghĩa của chúng là việc gán cho bất kỳ một yếu tố địa lý ít nhất một nghĩa xác định, tên hay chỉ số gọi là ID của nĩ, dữ liệu phi khơng gian của yếu tố thường lưu trữ trong một hay nhiều file riêng biệt theo số ID này. Thơng tin vị trí được liên kết tới những thơng tin xác định trong CSDL. 82
  85. Hình 4.1 Nối kết dữ liệu khơng gian và thuộc tính 83
  86. Chương 6 NHẬP, QUẢN TRỊ VÀ XUẤT DỮ LIỆU Xây dựng CSDL HTTTĐL phức tạp hơn việc tái tạo bản đồ. Việc quan trọng xây dựng CSDL HTTTĐL là nhập dữ liệu từ các nguồn tài liệu. Nĩ gồm nhiều nguồn khác nhau được sử dụng, như ảnh hàng khơng, tài liệu bảng biểu, những dữ liệu số khác vv Trong chương này sẽ giới thiệu các phương pháp nhập dữ liệu, sửa chữa các dữ liệu và tổ chức thành CSDL trong GIS. Những phương pháp này ngày càng được cải tiến để nâng cao chất lượng dữ liệu nhập vào, cũng như giảm nhẹ các thao tác cho người nhập dữ liệu. 81
  87. Những thủ tục thu thập dữ liệu: Dữ liệu từ nhiều nguồn khác nhau và tổ chức nĩ thành một CSDL cĩ ích địi hỏi yêu cầu phát triển những thủ tục bao gồm: Ê Thu nhận dữ liệu: bao gồm thu thập dữ liệu đã cĩ từ các nguồn, định lượng và kiểm tra tính hồn thiện và chất lượng hay tạo ra dữ liệu mới bằng đo đạc và giải đốn ảnh máy bay hay đi thực địa khảo sát. Những dự án HTTTĐL cố gắng dựa trên những dữ liệu cĩ sẵn hơn là tạo mới dữ liệu vì chi phí cao hơn dữ liệu nguyên gốc. Nhưng những dữ liệu cĩ sẵn thường xây dựng trên mục đích khác sẽ cĩ sự gượng ép khi sử dụng vào HTTTĐL. Do đĩ việc định lượng và kiểm tra sự thích hợp nguồn dữ liệu cho sử dụng HTTTĐL là rất quan trọng. Ê Sửa chữa dữ liệu nguồn: Tập trung vào những tài liệu bản đồ, hoạt động này gọi là làm sạch bản đồ. Tùy thuộc vào kỹ thuật sử dụng chuyển đổi ảnh bản đồ thành dạng dữ liệu số của nĩ, những tài liệu nguồn thường cĩ một chuẩn nào đĩ. Một số quá trình chuyển đổi yêu cầu dữ liệu tương đối hồn hảo và tự động sửa chữa tất cả những cái cần thiết trên bản đồ. Những yêu cầu dữ liệu kết quả do phân tích HTTTĐL xác định. Những qui trình sửa chữa dữ liệu cần kiểm tra trong những dự án mẫu phạm vi nhỏ trước khi sử dụng trong dự án. Ê Kiểm sốt sự thay đổi, phần lớn loạt bản đồ thường khơng cố định và sẽ được sửa chữa, nâng cấp theo chu kỳ. Một phần của bản đồ sẽ gửi tới số hĩa sửa chữa những thay đổi và xây dựng file dữ liệu số mới. Ê Xây dựng CSDL HTTTĐL, khi số hĩa xong bản đồ, chúng ta sẽ cĩ một tập hợp các file dữ liệu số, chưa được tổ chức trong CSDL. Quá trình xử lý tích hợp hệ thống là liên kết các file dữ liệu số và thiết đặt CSDL HTTTĐL trong dạng sẽ cĩ ích cho người sử dụng. Một số điều cần cân nhắc bao gồm là cấu trúc CSDL, tích hợp HTTTĐL, bảo trì và sử dụng. (hình 4.11). Quá trình nhập dữ liệu địa lý vào CSDL HTTTĐL bao gồm các buớc sau: 82
  88. DỮ LIỆU THỰC TẾ PHI KHÔNG GIAN DỮ LIỆU KHÔNG GIAN (Thuộc tính) Chuẩn bị số Quét ảnh (Scan) (Manual digitizing) (tạo ảnh số) Số hóa Quét ảnh và sô hóa (digitize) Hiển thị kiểm tra Làm sạch đường & những đầu nối Nhập file văn bản Loại bỏ những tọa độ dư thừa Hiệu chỉnh tỉ lệ và độ méo Xây dựng cấu trúc VÙNG-Polygon Gán mã nhận diện Liên kết dữ liệu KHÔNG GIAN-PHI KHÔNG GIAN Hoàn chỉnh quan hệ hình học dữ liệu VECTOR Polygon Hình 4.12 Các bước tạo, sửa chữa dữ liệu Vector polygon 83
  89. 2.1 Nhập dữ liệu Nhập dữ liệu địa lý Trong các hệ tự động hĩa vẽ bản đồ, thuộc tính của các đối tượng hình học được thể hiện thơng qua màu sắc, kiểu đường, kiểu tơ màu vv Nhưng trong HTTTĐL, các dữ liệu thuộc tính phi khơng gian được lưu trữ một cách định lượng và được tổ chức quản lý theo các tiêu chuẩn chặt chẽ của một CSDL. Cĩ thể được phân tách thành ba cơng việc: Ê Nhập dữ liệu khơng gian Ê Nhập dữ liệu thuộc tính Ê Kết nối hai loại dữ liệu trên Dữ liệu được đưa vào CSDL thơng qua các chức năng đầu vào của HTTTĐL. Nhập dữ liệu là một quá trình mã hĩa, lưu trữ và tổ chức dữ liệu thành CSDL. Đây là một quá trình rất quan trọng của hệ thống. Nĩ ảnh hưởng đến độ chính xác và tính logic của dữ liệu trong CSDL, do đĩ các thiết bị nhập số liệu cũng như các phần mềm nhập số liệu phải đảm bảo độ chính xác. Cĩ 5 phương pháp nhập dữ liệu thường dùng trong GIS: Ê Nhập từ bàn phím Ê Nhập từ bàn số hĩa (digitizer) Ê Nhập bằng máy quét (scanner) Ê Nhập trực tiếp từ tập tin hiện hữu Ê Từ các dữ liệu viễn thám 2.1.1 Nhập dữ liệu khơng gian 84
  90. Cĩ nhiều phương pháp để nhập dữ liệu khơng gian vào HTTTĐL. Dữ liệu đầu vào thường là các bản đồ giấy, các bản vẽ tay, các ảnh hàng khơng, ảnh vũ trụ, điểm lấy mẫu và các dữ liệu khác đo được gián tiếp bằng các thiết bị cảm ứng. Phương pháp nhập số liệu phụ thuộc vào cấu trúc dữ liệu và phần mềm CSDL của HTTTĐL sử dụng. Các phương pháp sau: Nhập dữ liệu thủ cơng từ bàn phím: Vector: Dữ liệu này thể hiện là điểm, đường hay vùng được nhập từ bàn phím, theo các tọa độ chính xác hoặc nhập vào tệp dữ liệu ASCII. Raster: Đối với hệ thống này, mọi điểm, đường, vùng đều được biến thành các cell. Phương pháp thơng dụng nhất được diễn ra như sau: Đầu tiên chọn kích cỡ luới ơ, sau đĩ chồng lên bản đồ. Giá trị tại từng ơ nhận được từ bản đồ sẽ được ghi lại vào máy tính. Số hĩa thủ cơng (Số hĩa bằng bàn số hĩa) 85
  91. Hình 5.2 Tệp tin chứa tọa độ x, y chuyển từ bản đồ vào Số hĩa thủ cơng tiến hành sử dụng bàn số hĩa và cơng cụ con trỏ mã hĩa những điểm trên bản đồ. Để số hĩa được dữ liệu bản đồ giấy, đặt bản đồ lên bàn số hĩa, khai báo các mốc tọa độ khống chế và kích chuột vào các đối tượng trên bản đồ để nhận được tọa độ. Bàn số hĩa sẽ cho phép nhập 3 kiểu dữ liệu chính (Điểm, Đường, Text). Các đối tượng vùng được xây dựng trên cơ sở cấu trúc topo mạng đa giác. Cơng việc này địi hỏi nhiều thời gian và tập trung cao độ. Kết hợp giữa kỹ năng và sự nhanh nhạy, mắt giữ chữ thập ở vị trí chính xác và đầy đủ yếu tố bản đồ. Theo thơng thường sự chuyển đổi dữ liệu vector thực hiện số hĩa thủ cơng những bản đồ giấy. Xây dựng dữ liệu Vector thường tiến hành với chi phí cao. Nhập bằng máy quét Nhập bằng máy quét (scanner) Dùng scanner để nhập dữ liệu vàp máy tính sẽ nhanh hơn dùng bàn số hĩa, đầu ra của scanner là ảnh số (digital image) dạng raster, kích thước của điểm ảnh (pixel) thường dùng là 0.02mm. Ảnh raster được xử lý để nâng cao chất lượng hình ảnh. Để sản xuất dữ liệu dưới dạng vector phải thực hiện quá trình vector hĩa. Các thiết bị này chuyển đổi tín hiệu ánh sáng phản xạ từ bản đồ thành giá trị pixel và ghi chúng lại theo một khuơn dạng nhất định. Chất lượng dữ liệu raster quét phụ thuộc vào thiết bị quét, về độ phân giải theo mỗi chiều của mặt phẳng quét và độ phân giải theo tín hiệu phản xạ từ bản đồ. Thơng thường trên thị truờng Việt nam hiện cĩ các máy quét với độ phân giải từ 600-2400 dpi (dot per inch), nghĩa là cĩ thể phân biệt được từ 0.05-0.01 mm trong khi đĩ mắt thường chỉ phân biệt được 0.1 mm. Cĩ 2 loại scanner chính: Loại scanner đen trắng và loại scanner màu. Loại đen trắng chỉ nhận được mức năng lượng phản xạ lại từ bản đồ, loại kia thì cĩ bộ phận phân tích thành 3 dải 86
  92. màu cơ bản và ghi chúng thành các cấp độ khác nhau. Thường thì mỗi dải màu được phân biệt 256-1024 cấp độ. Thiết bị quét ảnh là thiết bị rất chính xác, do đĩ các scanner khổ lớn cĩ cơng nghệ quét và hiệu chỉnh sai số hồn tồn khác so với các scanner khổ nhỏ. Trong quá trình phân tích, scanner thường được cài đặt chương trình phần mềm làm tăng cường chất lượng của ảnh quét. Chuyển đổi Vector sang Raster Các dữ liệu bản đồ lưu trữ trong CSDL HTTTĐL thường được lưu dạng cấu trúc vector. Nguyên nhân chính của cách là này là độ chính xác, cập nhật dễ dàng và chiếm ít khơng gian lưu trữ. Số hĩa trực tiếp từ bản đồ thành raster khĩ sửa chữa và phụ thuộc rất nhiều vào độ phân giải của chúng. Sử dụng cấu trúc dữ liệu raster thì dữ liệu phụ thuộc kích thuớc cell trong luới ơ kết quả. Nếu chọn kích cỡ cell lớn thì tiết kiệm khơng gian lưu trữ dữ liệu nhưng dữ liệu sẽ kém chính xác, cần độ chính xác dữ liệu cao thì luới ơ kết quả sẽ cĩ dung lượng lớn. Cĩ rất nhiều thuật tốn để chuyển đổi dữ liệu raster sang vector. Nhận dạng vùng Nhận dạng vùng thường được ứng dụng để chuyển raster sang vector. Với mục đích lưu trữ, tra cứu và in ấn, khơng cần phải xây dựng topology cho dữ liệu. Để xây dựng thành những lớp dữ liệu vector dạng vùng cần xây dựng cấu trúc topology cho dữ liệu (theo hình 4.12). Nhận dạng Đường Nhận dạng Đường thường được ứng dụng để nhập số liệu từ bản đồ quét thành dữ liệu vector. Quá trình nhận dạng này bao giờ cũng bắt đầu từ ảnh quét. Cĩ 2 kiểu nhận dạng đường: Ê Nhận dạng tự động: Nhận dạng tự động là quá trình nhận dạng ảnh quét trong đĩ khơng cĩ sự tham gia chỉnh sửa của con người. Kiểu nhận dạng này thường dùng để nhận dạng các bản đồ quét cĩ chất 87
  93. lượng tương đối tốt, khơng cần sự để tâm đặc biệt của con người. Qui trình nhận dạng như sau: Ê Làm tăng cường chất lượng ảnh quét (xố các pixel thừa, làm trơn ảnh, ), Ê Lọc xương ảnh để nhận dạng Đường, Ê Chuyển đổi xương ảnh thành vector. Ê Nhận dạng các ký tự. Ê Nhận dạng ký hiệu bao hàm cả nhận dạng ký tự, chủ yếu dùng để nhận dạng các bảng số, văn bản. Nhận dạng ký hiệu ít khi được dùng để nhận dạng các ký hiệu hay ký tự trên bản đồ. Nhận dạng tự động cĩ 2 nhược điểm chính: Ê Yêu cầu chất lượng ảnh quét cao, địi hỏi quá trình sơ xử lý cơng phu, Ê Khơng cho phép hiệu chỉnh thơng số trong quá trình xử lý nhận dạng, do đĩ vẫn phải kiểm tra, sửa chữa trên kết quả nhận dạng. Ê Để khắc phục các nhược điểm trên, người ta thường dùng phương pháp nhận dạng bán tự động, cụ thể người ta số hĩa trực tiếp trên ảnh quét. Nhận dạng bán tự động: Quá trình số hĩa trên ảnh quét được trợ giúp bởi một số cơng cụ phần mềm nhận dạng. Người dùng hiển thị ảnh bản đồ quét lên trên màn hình và kích chuột vào Đường trên bản đồ ảnh, phần mềm sẽ tự động số hĩa dọc theo Đường đĩ đến khi nào cắt Đường khác thì dừng lại. Lúc đĩ người dùng chỉ hướng cho chương trình tiếp tục nhận dạng. 4. Dữ liệu viễn thám Tư liệu ảnh chụp từ vệ tinh và ảnh máy bay được sử dụng để sản xuất bản đồ Ảnh máy bay: Ê Dùng làm bản đồ địa hình. 88
  94. Ê Sử dụng các thiết bị trắc địa ảnh để vẽ đường đồng mức địa hình. Ê Lập bản đồ tài nguyên thiên nhiên như: bản đồ đất, rừng, địa chất, hiện trạng sử dụng đất và lớp phủ đất. Ảnh vệ tinh: Ê Các vệ tinh viễn thám như: Landsat MSS, TM; SPOT, ERS Ê Dữ liệu ảnh vệ tinh thường ở dạng số. Ê Dùng lập bản đồ sử dụng đất, ngập lụt, chất lương nước, rừng Ê Ảnh vệ tinh SPOT cĩ thể dùng để lập mơ hình số độ cao, bản đồ địa hình tỉ lệ 1:50.000. 2.2.2 Nhập dữ liệu thuộc tính phi khơng gian Dữ liệu thuộc tính phi khơng gian (cịn gọi là thuộc tính đối tượng) là những tính chất, đặc điểm riêng của thực thể khơng gian, nĩ cần lưu trữ và thể hiện trong HTTTĐL. Ví dụ: một con Đường cần được số hĩa như một tập các pixel nối với nhau trong cấu trúc dữ liệu raster hoặc là một thực thể dạng đường trong cấu trúc vector. Đường trong HTTTĐL lại được thể hiện với một màu nào đĩ hoặc ký hiệu hoặc những thơng tin kèm theo (kiểu của Đường, dạng bề mặt Đường, phương pháp xây dựng, ngày xây dựng). Tất cả các số liệu này đều được gán cho thực thể. Các dữ liệu này được gán mã khĩa mà khi cần, lần theo mã khĩa đĩ, người ta sẽ cĩ tồn bộ số liệu về thực thể. Dữ liệu thuộc tính phi khơng gian thơng thường được các Hệ quản trị CSDL (HQTCSDL) quản lý như: phần mềm MapInfo, ORACLE, DB2, INFORMIX, SYSBASE, SQL SERVER, ACCESS để quản lý số liệu thuộc tính phi khơng gian của mình. Đối với các HQTCSDL quan hệ, người dùng sẽ nhập số liệu tuân thủ các qui tắc của một HQTCSDL quan hệ. Quá trình nhập số liệu diễn ra như sau: 89
  95. Ê Thiết lập CSDL mới nếu chưa cĩ CSDL. Nếu đã cĩ CSDL, khởi động CSDL, Ê Mở các bảng tương ứng để nhập số liệu, Ê Kiểm tra và cập nhật các mã khĩa, Ê Cập nhật kết nối (nếu phát sinh). Dữ liệu dạng số Ở các nước tiên tiến như Canada, Mỹ các dữ liệu dạng số rất đa dạng: Ê Thơng tin dạng số đã được thiết lập cho mục đích thương mại Ê Thơng tin địa lý Liên bang được sản xuất bởi cơ quan bản đồ quốc gia và cơ quan dân số và thống kê. Ê Ở cấp bang và tỉnh thành, chương trình số hĩa thơng tin địa chính al ưu tiên hàng đầu. Ê Thơng tin tài nguyên thiên nhiên được chuyển sang dạng số ở cấp Liên bang, bang và tỉnh thành. Ê Ở cấp quận huyện, thơng tin oh sơ thửa đất dạng số al thành phần trung tâm của CSDL GIS. Dữ liệu địa lý được phân chia thành 4 nhĩm chính: Ê Dữ liệu bản đồ nền. Ê Dữ liệu tài nguyên thiên nhiên. Ê Dữ liệu độ cao số. Ê Dữ liệu thống kê. Dạng dữ liệu cần được chuẩn hĩa cho mục đích sử dụng rộng rãi. Quản trị dữ liệu. 90
  96. 1. Nối kết dữ liệu khơng gian và phi khơng gian Nguyên tắc chung kết nối hai loại dữ liệu này là: Ê Với dữ liệu khơng gian: trong quá trình số hĩa hay biên tập dữ liệu mỗi đối tượng được gán mã thuộc tính, người dùng sẽ phải nhập các mã khĩa một cách trực tiếp cho từng đối tượng. Ê Với dữ liệu thuộc tính: được cấu trúc thơng tin và nhập mã cho từng mã này. Đối với dữ liệu thuộc tính phi khơng gian thì người dùng nhập mã khĩa Ê Sử dụng phần mềm HTTTĐL nối kết thơng tin thuộc tính. 2. Kiểm tra sai số và làm chính xác dữ liệu. Dữ liệu khơng gian và phi khơng gian đều cĩ sai số. Việc thao tác nối kết chúng là cách tốt nhất để kiểm tra chúng. Ê Đặc điểm khơng gian cĩ thể sai về vị trí hoặc hình dạng. Ê Sự thiếu cung và vùng hở dẫn đến polygon cĩ hai nhãn. Ê Dữ liệu khơng gian liên kết sai với dữ liệu phi khơng gian. Ê Dữ liệu phi khơng gian chưa hồn thành. 3. Tiền xử lý dữ liệu khơng gian Ê Tiền xử lý topology và định vị tâm hoặc nhãn của polygon Ê Vector hĩa và làm sạch các dữ liệu quét Ê Chuyển cấu trúc dữ liệu từ raster sang vector và ngược lại Ê Chuyển các dạng format dữ liệu Dữ liệu trong GIS bao gồm nhiều dạng khác nhau. Những tập tin dữ liệu này phải được chuyển đổi thành cấu trúc dữ liệu và dạng tập tin phù hợp với các hệ GIS. 91
  97. Tập tin raster được nhập vào hệ GIS raster cĩ thể khơng địi hỏi định dạng lại, chỉ cần thay đổi dữ liệu gốc một số thơng tin (header) để xác định lại tên, gốc, kích thước và những thơng số khác được dùng với hệ thống. Trong trường hợp GIS vertor cĩ cấu trúc topology, quá trình chuyển đổi định dạng dữ liệu cĩ thể tốn kém và mất nhiều thời gian và tùy thuộc vào lượng dữ liệu, khả năng phần cứng và phần mềm nếu dữ liệu thu tập khơng phù hợp với hệ thống GIS. Ví dụ: thơng tin bản đồ số hĩa bằng các phầnmềm thiết kế (CAD) trong cấu trúc phi topology thường rất khĩ khăn khi chuyển đổi sang cấu trúc topology. Ê Thao tác hình học: tịnh tiến, quay, thay đổi tỉ lệ, thay đổi hệ thống lưới chiếu. Các lớp dữ liệu trong GIS được hiển thị cùng hệ tọa độ. Các phần mềm GIS thường cho phép chuyển dữ liệu từ lưới chiếu này sang lưới chiếu khác. Ví dụ; cĩ thể chuyển bản đồ Việt nam từ hệ toạ độ địa lý samg lưới chiếu Gauss. Ê Nắn chỉnh (chủ yếu tài liệu ảnh). Chuyển đổi hình học được dùng để gán tọa độ mặt đất vào lớp dữ liệu hoặc bản đồ trong GIS hoặc hiệu chỉnh hình học của một lớp dữ liệu trong một lớp khác cùng khu vực. Cĩ hai cách dùng để chuyển đổi. - Chuyển đổi dùng vị trí tương đối: một lớp dữ liệu (slave) được chuyển đổi theo lớp dữ liệu khác (master) dựa trên những địa vật cố định như ngã tư đường, điểm giao nhau của hai con suối. - Chuyển đổi dùng vị trí tuyệt đối: một phương pháp khác để chuyển đổi hình học của các lớp dữ liệu để hiệu chỉnh đến vị trí tuyệt đối của từng lớp. Ví dụ; như hệ tọa độ UTM. Ê Chức năng làm trùng khít (Conflation) Việc làm trùng khít là quá trình làm trùng tọa độ của các đối tượng tương ứng trong các lớp dữ liệu khác nhau. Ví dụ; sai số nhỏ gây ra trong quá trình nhập 92
  98. dữ liệu vị trí địa lý của đối tượng trên bản đồ. Khi chồng hai lớp giữ liệu, cùng một đối tượng sẽ khơng trùng nhau một cách chính xác (sliver). Chức năng này nhằm sửa chữa (chỉnh, thêm, bớt, thay đổi ) vị trí địa lý của đối tượng. Một số phần mềm (ARC/INFO) cĩ khả năng xĩa các sliver. (Xem hình 6.2). Hình 6.2 Slivers cĩ thể tạo ra trong quá trình số hĩa Ê Ghép biên (Edge matching) Điều chỉnh các sai số nhỏ tại biên các mảnh bản đồ. Sai số cĩ thể do bản đồ gốc bị co giãn hoặc do số hĩa. Xem hình 6.1 93
  99. Khi khu vực nghiên cứu nằm trên nhiều mảnh bản đồ khác nhau thì thơng tin nên được lữu giữ như những khoanh vị địa lý liên tục. Về mặt lý thuyết, dữ liệu từ những bản đồ tiếp giáp nên gặp nhau một cách chính xác tại biên của bản đồ. Tuy nhiên những đặc tính cắt qua ranh giới cĩ thể cĩ sự gián đoạn nhỏ ( xem hình 7). Phần khơng tương ứng của các đặc tính nên được gắn một cách hồn hảo với nhau tạo ra cơ sở dữ liệu khơng gian phù hợp. Quá trình này được gọi là "tiếp biên" hoặc " kéo" và sẽ được thực hiện một cách tự động. Khi tổ hợp các đối tượng từ các lớp dữ liệu khác nhau được lữu trữ trên một hệ quy chiếu chung và mơ hình dữ liệu, vấn đề về sự gián đoạn sẽ nảy sinh. Hình 7: Tiếp bên Chỉnh khớp là thủ tục khớp các đối tượng trên các lớp dữ liệu khác nhau. Ví dụ cùng một nhà thờ được lưu trữ trên 2 lớp dữ liệu khác nhau sẽ cĩ thể được xác định trên 2 vị trí khác nhau vì lỗi do số hố. Vẽ lại một vài đặc tính trên các lớp là phương pháp thủ cơng để giảm thiểu những lỗi này. Điều này được thực hiện bằng cách sử dụng một lớp tham chiếu làm mẫu vẽ trên các lớp khác. Những đối tượng khơng tương thích cĩ thể được vẽ lại từ nền của bản đồ cơ sở, những đặc tính cần giữ lại cĩ thể được sao chép từ bản đồ cơ sở sang các lớp khác. Một vài hệ thơng tin địa lý cung cấp chức năng bán tự động để giải quyết vấn đề này. Sự tổ hợp dữ liệu trong các lớp khác nhau cĩ thể đưa tới Slivers khi hai ranh giới tương ứng cĩ một sự sai lệch nhỏ. Những sai lệch này sẽ được nhận biết và được sửa một cách tự động (Aronof 1989). Ê Biên tập (Editing of graphic elements) 94
  100. Ê Làm thưa tọa độ (Line coordinate thinning) Thường tọa độ khi số hĩa được nhập vào nhiều hơn cần thiết để xác định các đối tượng đường hoặc vùng. Một số phần mềm cĩ chức năng làm giảm lượng tọa độ được lưu trữ trong hệ GIS. Xem hình 6.3. 4. Lưu trữ dữ liệu Dữ liệu bản đồ số (digital map) gồm hai kiểu thơng tin: về khơng gian và dữ liệu mơ tả. Chúng được lưu trữ bằng một loạt File chứa đựng cả hai (dữ liệu khơng gian) và (mơ tả về các đối tượng bản đồ) trong máy tính. Sức mạnh của GIS là sự liên kết hai kiểu dữ liệu và duy trì mối liên kết giữa các yếu tố. Hình 5.3 Thơng tin địa lý tổ chức theo lớp (nối kết dữ liệu khơng gian và thuộc tính) 95
  101. 5. Tổ chức dữ liệu Các yếu tố bản đồ được tổ chức logic bằng một tập hợp các lớp. Một bản đồ được tổ chức thành các lớp thể hiện một thuộc tính giống nhau, như sơng, địa chất, thổ nhưỡng, ơ nhiễm nước vv thêm vào những khu vực cĩ diện tích nhỏ được phối hợp vào khu vực cĩ diện tích lớn hơn như. Tổ chức các lớp một cách khoa học sẽ giúp cho việc lưu trữ đơn giản, các File dữ liệu sẽ gọn hơn, máy tính sẽ chạy nhanh hơn, tổ chức phân tích và chất vấn dữ liệu đơn giản hơn. Việc tổ chức các lớp thơng tin nĩi riêng, hay nĩi rộng ra là tổ chức một hệ thống cơ sở dữ liệu bản đồ theo từng chuyên đề là hết sức cơng phu, địi hỏi nhiều kiến thức chuyên gia. Nhưng nĩ sẽ đem lại một hiệu quả to lớn cho người sử dụng. Khi nhấn vào một đối tượng quan tâm, ta sẽ cĩ những thơng tin cần thiết (cả hình ảnh, âm thanh, đoạn phim mơ tả) vv Chất vấn dữ liệu (SQL) tạo ra các bản đồ dẫn xuất: Trên cơ sở dữ liệu đã được xây dựng, cụ thể là bản đồ sẽ được thể hiện trên màn hình máy tính, gồm các lớp, các yếu tố, và các bảng thơng tin mơ tả. Người sử dụng cĩ thể tìm hiểu các thơng tin đầy đủ chỉ bằng cách nhấn mũi tên vào đối tượng hay đo khoảng cách, xem diện tích một hồ vv Đây là những thơng tin đơn giản. Đơn giản : Tìm tổng Số người làm việc với GIS ở Việt Nam. Phức tạp hơn: (cĩ điều kiện) tìm tất cả các điểm mỏ vật liệu xây dựng ở Tp. Hồ Chí Minh, cĩ vĩ độ lớn hơn 10o15'(?). Tìm những đơ thị cĩ diện tích lớn hơn 100km2(?)v v Để trả lời những câu hỏi này, máy tính sẽ phải loại bỏ các đối tượng trên cơ sở điều kiện đã nêu ra và tạo ra những bản đồ dẫn xuất. Câu hỏi mơ hình: Vẽ khu vực xung quanh con sơng và cách bờ sơng 1km, và tính diện tích khu vực đĩ. Trên đây là một số câu hỏi và cịn rất nhiều chất vấn khác ta cĩ thể xây dựng các sản phẩm riêng, tùy vào phần mềm, và cách giải quyết vấn đề sẽ đem lại kết quả to lớn nhờ sự trợ giúp của GIS. 6. Cập nhật dữ liệu 96
  102. Nhiều thơng tin địa lý thay đổi theo thời gian như: ranh giới hành chính, biên sử dụng đất, đường giao thơng, cơ sở hạ tầng Tùy thuộc vào mức độ thay đổi dữ liệu trong khơng gian và tầm quan trọng của sự sửa đổi mà việc cập nhật sẽ được thực hiện. Ảnh máy bay và ảnh vệ tinh sẽ giúp ích nhiều trong quá trình cập nhật. 7. Thao tác dữ liệu Bao gồm việc đo đạc (khoảng cách giữa hai điểm, chu vi, diện tích, khối lượng). Phân tích thống kê (đường đi tối ưu, các phép nội suy). Chồng ghép bản đồ. Xem chương 8 Phân tích địa lý. Xuất dữ liệu Thành phần modul đầu ra của GIS Ê Cửa sổ (lựa chọn các diện tích để in bản đồ) Ê Điều chỉnh tỷ lệ Ê Tạo và sửa chữa ký hiệu Ê Lựa chọn màu Ê Làm chỉ dẫn Ê Trình bày các bản vẽ Thiết bị và sản phẩm đầu ra của GIS Thiết bị đầu ra gồm màn hình, máy in và máy vẽ. Sản phẩm đặc trưng của GIS là tài liệu mà người dùng sử dụng trực tiếp bao gồm. Ê Các bảng tài liệu Ê Đồ Thị Ê Bản đồ 97
  103. Ê Ảnh Ê Các mơ hình 3D Ê Dữ liệu xuất ra từ CSDL GIS trong dạng thích hợp đối với người sử dụng, cĩ ba dạng sau: Ê Hardcopy: thơng tin được in ra giấy, film, Ê Softcopy: thơng tin được xem trên màn hình máy tính (văn bản, đồ họa đơn sắc hoặc màu), softcopy cĩ thể thay đổi nhưng việc xem thơng tin bị hạn chế do kích thước màn hình. Ê Thơng tin xuất trong dạng điện tử: gồm những tập tin máy tính. Thiết bị xuất hardcopy gồm: Ê Pen plotter- máy vẽ dùng bút. Ê Ink jet plotter – máy vẽ phun mực. Ê Themal plotter – máy vẽ nhiệt. Ê Electrostatic plotter – máy vẽ tĩnh điện. Ê Dot matrix printer – máy in kim. Ê Lazer printer – máy in Lazer. Ê Optical film writer – thiết bị ghi film. Ê Screen copy device – thiết bị copy màn hình 98
  104. Chương 8 PHÂN TÍCH ĐỊA LÝ Phân tích địa lý là một trong những sức mạnh của hệ thống thơng tin địa lý, mục đích phân tích địa lý là đưa ra lời giải cho các câu hỏi khơng gian và các vấn đề khơng gian. Để làm việc này, một tập hợp của các chức năng khơng gian được xây dựng. Điển hình, sự tổ hợp của những chức năng này thật sự cần thiết để giải quyết các vấn đề của thế giới thực. Trong chương này sẽ đưa ra tổng quan về mối quan hệ các đối tượng địa lý và các chức năng phân tích địa lý và các khái niệm của chúng. Phần lớn các chức năng này sẽ được sử dụng trong hệ thống vector cũng như trong hệ thống raster. Mặc dù vậy một vài chức năng chỉ cĩ thể cĩ hoặc ở hệ thống vector hay raster do cấu trúc dữ liệu địi hỏi. 120
  105. Những mối quan hệ khơng gian Những mối quan hệ trong GIS thường được nghiên cứu bởi xem xét quan hệ những đối tượng hình học đơn giản - những điểm, những đường, những polygon. Một số mối quan hệ cĩ thể tính tốn từ những tọa độ của đối tượng: Cĩ ba kiểu mối quan hệ Những mối quan hệ sử dụng cấu trúc nên đối tượng phức tạp từ những gốc đơn giản. Ê Mối quan hệ giữa đường (chain) và tập thứ tự những điểm tạo nên nĩ. Ê Mối quan hệ giữa một diện tích (polygon) và tập hợp thứ tự các đường tạo nên nĩ. Những mối quan hệ cĩ thể tính tốn từ những tọa độ của những đối tượng. Ê Hai đường cĩ thể kiểm tra xem nếu chúng bắt chéo nhau thì mối quan hệ - “chéo” "crosses" cĩ thể tính tốn được. Ê Những diện tích cĩ thể kiểm tra xem nĩ cĩ bao quanh một điểm nào đĩ- mối quan hệ "is contained in" cĩ thể được tính tốn. Ê Những diện tích cĩ thể kiểm tra xem nếu chúng chồng lên nhau (overlap) - mối quan hệ "overlaps". Những mối quan hệ khơng thể tính tốn từ những tọa độ - mà nhất thiết phải được mã hĩa trong CSDL trong đầu vào. Ê Hai đường biểu diễn cắt nhau, nhưng trên thực tế chúng khơng cắt nhau (đường cao tốc biểu diễn cắt nhau, những nĩ cĩ thể vượt qua nhau) Ê Một số CSDL cho phép những thực thể gọi là "đối tượng phức tạp", bao gồm một số "đối tượng đơn giản". 121
  106. Quan hệ hình học các đối tượng Những mối quan hệ giữa những đối tượng hình học đơn giản, với những ví dụ ứng dụng thực tế của chúng: Điểm-Điểm (Point-point ) Ê "is within": tìm tất cả những điểm lấy mẫu trong phạm vi 1 km từ vị trí trạm quan trắc. Ê "is nearest to": tìm những vị trí điểm rác thải nguy hiểm gần nhất lỗ khoan nước ngầm. Điểm-Đường (Point-line) Ê "ends at": tìm điểm cắt tại cuối con đường. Ê "is nearest to": tìm con đường gần nhất vị trí xảy ra núi lửa. Điểm-diện tích (Point-area) Ê "is contained in": tìm tất cả trạm quan trắc khơng khí trong thành phố Hồ Chí Minh. Ê "can be seen from": xác định những hồ nước thấy được từ một vị trí xác định. Đường-Đường (Line-line) Ê "crosses": xác định con đường cắt qua sơng. Ê "comes within": tìm những con đường đến ga trong khoảng 1km. Ê "flows into": tìm dịng cháy cĩ đổ vào sơng khơng. Đường-Diện tích (Line-area) Ê "crosses": tìm tất cả loại đất cắt qua tuyến đường sắp làm. 122
  107. Ê "borders": tìm con đường là một phần đường biên của cơng viên. Diện tích-Diện tích (Area-area) Ê "overlaps": xác định phần chồng nhau giữa những kiểu đất trên bản đồ A, và những kiểu sử dụng đất trên bản đồ B. Ê "is nearest to": tìm hồ nước gần nhất một đám cháy rừng. Ê "is adjacent to": khám phá những diện tích cĩ chung đường biên. Mã hĩa mối quan hệ như là những thuộc tính Trong CSDL, chúng ta thường mã hĩa mối quan hệ như những thuộc tính thêm vào. Xem xét hai ví dụ: Ví dụ 1: mối quan hệ A là "flows into", giữa những đoạn mạng sơng: Lựa chọn A: mỗi mối liên kết trong mạng sơng được qui cho ID với mối liên kết xuơi dịng cĩ dịng chảy vào. Dịng chảy xác định từ liên kết này tới liên kết khác theo các điểm dẫn. Lựa chọn B: Thay thế mạng lưới bằng mã như hai tập hợp {entities – links} và {node}. những liên kết chỉ tới những node xuơi dịng, những node chỉ tới liên kết xuơi dịng. Ví dụ 2: Mối quan hệ "is contained in". Giả sử chúng ta cĩ vị trí 4 lỗ khoan nước, với những thuộc tính về độ sâu và lưu lượng. Những lỗ khoan này nằm trong hai xã khác nhau, mỗi với giá trị thuộc tính "population". Chúng ta cần xác định độ lớn lưu lượng mỗi xã. Tìm xã cĩ những lỗ khoan, bằng tính tốn quan hệ "is contained in", và chứa đựng kết quả như một thuộc tính mới, Xã, cho mỗi lỗ khoan. Sử dụng bảng thuộc tính tính tổng lưu lượng cho mỗi Xã và thêm kết quả vào bảng dữ liệu. 123
  108. XA Population Lưu lượng A 20,000 4,500 B 35,000 5,500 124
  109. Những chức năng phân tích địa lý trong GIS Sử dụng vùng đệm (USING BUFFERS) Sử dụng vùng đệm là một kỹ thuật quan trọng trong quá trình tiền phân tích dữ liệu khi cần tạo ra khơng gian quanh những yếu tố trên mặt đất. Nĩ phối hợp những kỹ thuật tìm kiếm dữ liệu khơng gian và mơ hình hĩa bản đồ. Nĩ tổng quát sử dụng để định nghĩa tất cả những phần khơng gian nằm trong một khoảng cách nào đĩ của kiểu yếu tố, hay một phần của các yếu tố đã được chọn ra tùy thuộc vào giá trị thuộc tính. Những khoảng cách vùng đệm bắt buộc thiết đặt bởi người sử dụng. Những điểm, đường, polygon cĩ thể tạo vùng đệm cũng như những điểm ảnh (raster pixels) hay nhĩm những điểm ảnh. Những lệnh cĩ thể khác nhau bởi các phần mềm, nhưng trong khái niệm, thao tác tạo vùng đệm là một cơng cụ cơ bản của GIS. Những đường cĩ thể tạo vùng đệm một bên cũng như hai bên khoảng cách bằng nhau (phải, trái, và cả hai bên) của đối tượng đường, Trong khi đĩ những polygon cĩ thể vùng đệm trong hay vùng đệm ngồi hay cả hai bên đường biên polygon. Ví dụ: 125
  110. Những chức năng chồng lớp (Overlay Operators) 126
  111. Những chức năng chồng lớp là những cơng cụ phân tích khơng gian mạnh mẽ thường sử dụng phối hợp các lớp dữ liệu. Chúng theo thơng thường sử dụng xác định những yếu tố trong một lớp nằm trong (within) những yếu tố polygon của một lớp khác. Những phép tốn khác nhau cho phép người sử dụng cộng (hay trừ) tất cả hay phần của những yếu tố trong lớp tới (hay từ) lớp khác. Các chức năng chồng lớp số học và logic là một bộ phận trong các phần mềm GIS. Ê Chồng lớp số học bao gồm các phép tốn như cộng, trừ, nhân chia từng giá trị trong lớp dữ liệu với một giá trị trong vị trí tương ứng của lớp thứ hai. Ê Chồng lớp logic liên quan với việc tìm ra những vùng thoả mãn (hoặc khơng thỏa mãn) một số điều kiện đặt ra. Ví dụ; tìm vùng thích hợp để bố trí các khu cơng nghiệp. Hình 6.6 minh họa chức năng số học của một lớp dữ liệu. Hình 6.6 ; 6.7 và 6.8 minh họa chức năng số học của hai lớp dữ liệu. 127
  112. Hình 6.6 Chồng lớp số học của một lớp dữ liệu raster và vector Hình 6.7 Chồng lớp số học của hai lớp dữ liệu raster Thực hiện những phân tích thống kê (performing statistical analyses) Sử dụng GIS để trả lời những câu hỏi tổng quát điển hình liên quan kiểu khác nhau. Sự khái quát hĩa cĩ thể liên quan khác nhau tới những câu hỏi về tự nhiên hay liên quan tới con người quanh chúng ta. Ví dụ: Ê Nhiệt độ trung bình tại Thành phố Hồ chí Minh trong tháng ba bao nhiêu? Ê Hay ở Hà Nội bao nhiêu trong tháng tám? Ê Khoảng cách trung bình từ các hộ gia đình là bao nhiêu đến một siêu thị? Ê Lượng mưa trung bình khác nhau Tỉnh này với Tỉnh khác ở Việt Nam? Những chuyên gia GIS thường tạo ra những câu hỏi ngắn gọn. Những câu trả 128
  113. lời kiểu này thường yêu cầu một số hiểu biết về thống kê Sử dụng các phép tốn phân loại (using reclassification operators) Thủ tục gán các đối tượng vào một nhĩm nào đĩ được gọi là sự phân loại. Thường thì quá trình này được áp dụng để làm đơn giản một tập hợp dữ liệu chi tiết để cĩ thể trình bày chúng trên bản đồ, để truy cứu cấu trúc khơng gian hoặc để tách các đối tượng với các tính chất nào đĩ. áp dụng của sự tách biệt sẽ thích hợp cho những nhiệm vụ phân tích về sau (Berhardsen, 1999). Vì nĩ sẽ là một đám hỗn độn khi trình bày một tập hợp với 100 phần tử và 50 giá trị dữ liệu khác nhau bằng 50 màu sắc hoặc hình vẽ, sự phân loại lúc đĩ thực sự cần thiết để bố trí trình bày một cách thuận tiện nhất. Ví dụ: Sự biểu diễn phần trăm của dân số trẻ trên bản đồ sẽ rõ ràng hơn khi những giá trị lân cận được xếp vào các miền của những giá trị (xem hình 10). Một thuộc tính mới cĩ thể được thêm vào bảng dữ liệu cùng với kết quả của sự phân loại này. Mục tiêu quan trọng của phân loại khơng gian là nhận biết được loại hình khơng gian. Điều này sẽ được trang bị bơỉ sự phân loại. Khi loại hình khơng gian khơng rõ ràng lắm sau khi phân loại dữ liệu thì phân loại cĩ thể thực hiện theo cách tổng quát hơn để tạo cho loại hình thêm rõ ràng. Quá trình này được gọi là tổng quá hố (aronoff, 1989). Ví dụ biến phần trăm dân số trẻ được xếp vào 5 lớp (xem hình 10). Khi bản đồ được thành lập để chỉ rõ những vùng với phần trăm dân số trẻ cao, sự phân loại cĩ thể khái quát vào 2 lớp dưới 30% và trên 30%. Tách biệt những vùng địa chất thích hợp cho xây dựng những ngơi nhà địi hỏi sự tái phân loại của dữ liệu địa chất gốc. Phân loại dữ liệu thành những khu vực thích hợp và khơng thích hợp cho mục đích xây dựng chắc chắn hiệu quả hơn khi làm việc với bản đồ địa chất chi tiết. Ranh giới giữa những vùng được phân vào cùng một nhĩm cĩ thể trở nên dư thừa và cĩ thể được loại bỏ để tổ hợp chúng thành những đơn vị lớn hơn (Star, 1990) 129
  114. Hình 10: Bản đồ % dân số trẻ ở Brussel năm 1991 130
  115. Sử dụng các phép tốn tìm kiếm logic (Using Boolean Search Techniques) Ra câu hỏi là quá trình lựa chọn thơng tin từ tập hợp dữ liệu dựa trên những điều kiện được định rõ trước mà khơng làm thay đổi tập hợp dữ liệu gốc. Sự lựa chọn được báo cáo và /hoặc một vài tính chất của sự lựa chọn được tính tốn. Hỏi đáp cĩ thể thực hiện trên tính chất chuyên đề, hình học hoặc topology (Hendrriks, 1997). Một sự hỏi đáp trên dữ liệu chuyên đề cĩ thể được thực hiện trên một hoặc nhiều tính chất của các đối tượng. Trong trường hợp lựa chọn một tính chất ( điều kiện đơn) phép tính đại số được sử dụng để cấu thành sự lựa chọn. Tập hợp đại số sử dụng, các thao tác bằng, lớn hơn, nhỏ hơn và tổ hợp của 3 cái đĩ ( =, >, , >=, 30%). Khi điều kiện đơn được tổ hợp để tạo thành những điều kiện phức tạp ( lựa chọn nhiều hơn 1 tính chất của đối tượng) thao tác logic được sử dụng - tốn từ Boolean dùng thao tác logic AND, OR, XOR, NOT để thiết lập sự lựa chọn phức tạp. Kiểu đặt vấn đề này cĩ thể được minh hoạ trên sơ đồ Venn (xem hình (8). Những vùng đánh bĩng diễn biến kết quả lựa chọn ( Bernhard sen 1999). Ví dụ lựa chọn những vùng lân cận nơi mà % của người nước ngồi lớn hơn 30% và cĩ cơng viên. A = chọn các vùng lân cận nơi mà % người nước ngồi >30%. B = lựa chọn vùng lân cận cĩ cơng viên. 131
  116. Hình 8: Sơ đồ Venn Hỏi đáp về dữ liệu hình học là chức năng riêng của GIS. Một hệ GIS lưu trữ vị trí và ranh giới của mỗi đối tượng. Điều này tạo cho nĩ khả năng truy nhập thơng tin dựa trên thơng tin vị trí và hồn cảnh (ví dụ độ dài, chu vi và diện tích, và thậm chí dựa trên cả hình dạng của đối tượng. Trong trường hợp này, điều kiện để chọn dữ liệu là tính chất hình học. Các câu hỏi về dữ liệu hình học sử dụng chức năng đo đạc (xem dưới đây) để cĩ được những thơng tin yêu cầu. Ví dụ lựa chọn tất cả các vùng lớn hơn 300m2 và tính tốn tổng chu vi của chúng (Hendrrik 1997). Đặt câu hỏi về đặc tính (topology) cũng là chức năng riêng của GIS. Những hỏi đáp về vị trí của thực thể khơng gian với mối quan tâm tới các đối tượng khác là câu hỏi về topology. Ví dụ lựa chọn tất cả các vùng tại đĩ cĩ các vùng cơng nghiệp nằm kề với khu vực dân cư (Hendnks 1997). Các phép tính số học ( +, -, x, /, xn, sin, cos, tg v.v ) và các phép tính thống kê (trung bình, cực tiểu, cực đại, độ lệch chuẩn v.v ) được sử dụng trong chức 132
  117. năng hỏi đáp để tính tốn các tính chất cho các đối tượng được lựa chọn (Bernhard sen 1999). Ví dụ lựa chọn tất cả các cơng viên trong thành phố và tính tốn tổng diện tích, diện tích trung bình của chúng. Để lựa chọn các cơng viên, phép tính đại số được sử dụng. Với sự hỏi đáp về dữ liệu hình học của những phần tử được lựa chọn, những diện tích của chúng sẽ được lấy ra. Sự liệt kê các vùng diện tích được vận dụng để tính tốn tổng độ lớn và độ lớn trung bình bằng các phép tính số học và thống kê. Hình 9 minh hoạ cho phần hỏi đáp trước đĩ. Sử dụng bản đồ đại số (Using Map Algebra) Bản đồ đại số là một trong những loại bản đồ dẫn xuất; Những lớp dữ liệu mới cĩ nguồn gốc từ những lớp dữ liệu cĩ sẵn thơng qua phối hợp (combination) và biến đổi (transformation). Những hệ thống GIS điển hình cung cấp cung cấp những cơng cụ tốn học để phối hợp/hay chuyển đổi những lớp bản đồ. Chúng ta thấy rằng rất cần thiết vì trong phân tích chúng ta sử dụng những giá trị dữ liệu yêu cầu từ một hay nhiều lớp dữ liệu để xử lý những con số (numerically processed) và /hay phối hợp tùy vào một số cơng thức tốn. Ví dụ: Ê Ta cĩ cơng thức tốn nhiệt độ như là một hàm số của độ cao, như vậy chúng ta cĩ thể nhận được bản đồ nhiệt độ từ mơ hình số độ cao (DEM)-(xem chi tiết chương 7). Ê Khi xem xét khả năng tạo ra “bản đồ tiềm năng xĩi mịn đất - a soil erosion potential map” dựa vào những lớp dữ liệu về khả năng xĩi mịn, độ dốc, và cường độ mưa và cơng thức liên quan tới xĩi mịn tới những hệ số này. Rõ ràng chúng ta cần khả năng tính tốn những giá trị dữ liệu trong những lớp bản đồ bằng những phép tốn và phép biến đổi khác nhau và kết những lớp dữ liệu tốn tạo ra sản phẩm cuối cùng. 133