Trong bài viết này chúng tôi giới thiệu tiếp Metadata trong GIS, phần Thông tin chất lượng dữ liệu
Các đặc điểm chất lượng dữ liệu có tác động tổng thể đến tính hữu ích của dữ liệu, bao gồm các đặc điểm như độ chính xác vị trí, độ chính xác thuộc tính, tính hợp lý, tính toàn vẹn, tính thời gian, nguồn gốc, khả năng truy cập và chi phí trực tiếp, gián tiếp.
Hầu hết các yếu tố nội dung của Metadata đều liên quan đến chất lượng. Cần phải tạo cho người sử dụng dữ liệu sự tin tưởng rằng dữ liệu sẽ đáp ứng được những nhu cầu của họ và phù hợp với các tiêu chuẩn của họ.
Chất lượng dữ liệu là nhân tố quan trọng để thấy được giá trị của sự đầu tư vào dữ liệu. Sự hiểu biết đầy đủ và chính xác dữ liệu không gian trong GIS là rất quan trọng để có thể sử dụng dữ liệu cho công việc. Tiêu chuẩn chất lượng dữ liệu của tổ chức luôn phải ở mức độ chính xác có thể chấp nhận được trong suốt quá trình thu thập, chuyển đổi và phân tích dữ liệu.
Độ chính xác dữ liệu là thành phần quan trọng bậc nhất của những tiêu chuẩn chất lượng dữ liệu. Độ chính xác được phân thành 3 loại cơ bản sau:
Độ chính xác thuộc tính là độ chính xác của các thuộc tính phi không gian như tên tỉnh, huyện, xã hay giá trị tọa độ, độ cao… Đánh giá độ chính xác của những thực thể, thuộc tính và những giá trị thuộc tính trong tập dữ liệu. Việc đánh giá này được thực hiện thông quan việc nhận dạng và phân lớp các đối tượng thể hiện trên bản đồ.
Độ chính xác vị trí là độ sai lệch về vị trí của một đối tượng không gian trong tập dữ liệu so với vị trí thật của nó trên mặt đất. Độ tin cậy về vị trí của các đối tượng không gian là điều quan trọng đối với tất cả những người sử dụng dữ liệu không gian. Độ chính xác của dữ liệu liên quan đến lưới chiếu, hệ thống tọa độ (toàn cầu hay cục bộ địa phương), tỉ lệ, đơn vị đo, …
Hai yếu tố để đánh giá độ chính xác vị trí là độ sai lệch hệ thống và độ sai lệch ngẫu nhiên. Thông thường độ sai lệch hệ thống phải bằng không, nghĩa là tập dữ liệu không có khuynh hướng sai lệch một cách hệ thống so với vị trí thực. Trong khi đó, độ sai lệch ngẫu nhiên ảnh hưởng trên từng vị trí và được đánh giá bằng cách tính độ lệch chuẩn của những điểm được chọn để kiểm tra.
- Độ chính xác vị trí gián tiếp
Độ chính xác vị trí gián tiếp của các đối tượng không gian (như địa chỉ, cột mốc cây số) cũng phải được chú ý và đánh giá.
Thông tin liên quan đến nguồn gốc dữ liệu, các qui trình xử lý để tạo ra dữ liệu. Bao gồm việc mô tả những thông tin về nguyên liệu đầu vào (nguồn gốc, thời gian tạo ra, cơ quan tạo ra) để có thể xác định được mức độ tin cậy của nguồn dữ liệu, phương pháp số hóa tạo dữ liệu (chuyển đổi lưới chiếu, ghép biên, …). Đây là một yếu tố then chốt của Metadata trong việc đánh giá sự thích hợp để sử dụng của tập dữ liệu.
Tính toàn vẹn của tập dữ liệu cần phải được đánh giá, những thiếu sót bất kỳ trong dữ liệu đều phải được ghi chú cẩn thận.
|