Tìm vết nguồn gốc dữ liệu
Email tác giả liên hệ:
tapchikhgkdt@hcmute.edu.vnTừ khóa:
dữ liệu tích hợp, khai khoáng, phân tích thông tin tích hợpTóm tắt
Các hệ thống nhà kho dữ liệu tích hợp thông tin dữ liệu từ các nguồn dữ liệu thao tác, hỗn hợp, phân tán và từ xa vào kho trung tâm để khai khoáng và phân tích thông tin tích hợp ([1],[2],[4],[7]). Nhưng trong suốt quá trình tích hợp, nguồn dữ liệu trải qua hàng loạt các biến đổi có thể thay đổi từ các thao tác hay các kết hợp đại số đơn giản đến các thủ tục làm sạch dữ liệu phức tạp. Vậy trong môi trường nhà kho dữ liệu, vấn đề truy vết nguồn gốc có nghĩa là truy tìm lại nguồn gốc dữ liệu mà nó xuất phát. Trong bài báo này, chúng tôi nghiên cứu về phép biến đổi tổng quát dựa vào các thuộc tính biến đổi và ánh xạ lược đồ. Ngoài ra, chúng tôi nghiên cứu các thuật giải theo vết nguồn gốc dữ liệu qua phép biến đổi tổng quát. Ứng dụng kết quả nghiên cứu trên chúng tôi đã thực hiện truy vết nguồn gốc trong nhà kho tuyển sinh của trường Cao Đẳng Công Nghệ Thông Tin TP.HCM và cho nhiều kết quả lý thú.
Tải xuống: 0
Tài liệu tham khảo
Erhard Rahm và Hong Hai Do (2000). Data cleaning: problems and current approaches. University of Leipzip, Germany.
Felix Naumann (2004). Information ETL & data lineage.
H.Galhardas, D.Florescu, D.Shasha, E.Simon, và C.Saita (2001). Improving data cleaning quality using a data line facility. In Proc. of the third International Workshop on Design and Management of Data Warehouses, Interlaken, Switzerland.
Hao Fan and Alexandra Poulovassilis. Tracing Data Lineage Using Schema Transformation Pathways. School of Computer Science and Information Systems, Birkbeck College, University of London.
Hao Fan (11-2005). Investigating a Heterogeneous Data Integration Approach for Data Warehouse. School of Computer Science and Information Systems, Birkbeck College.
Jennifier Widom (1995). Research problems in data warehousing. Standford University.
Jefferey D. Ullman, biên dịch Trần Đức Quang (2002). Nguyên lý các hệ Cơ Sở Dữ Liệu và Cơ Sở Tri Thức. NXB Thống kê.
Peter Buneman, Sanjeev Khanna, Wang- Chiew Tan (2001). Why and where: a characterization of data provenance, University of Pennsylvania.
Peter Buneman, Sanjeev Khanna, Wang - Chiew Tan (2001). Data provenance: Some basic Ussues. University of Pennsylvania.
Yingwei Cui and Jennifier Widom (2000). Lineage the tracing of view data in a warehousing Environtment. Standford University.
Yingwei Cui and Jennifier Widom (2001). Lineage Tracing for General Data Warehouse Transformation. Standford University.
Infobiogen. DBCAT, The Public Catalog of Databases. http://www.infobiogen.fr/ services/bdcat/, 5 June 2000.
Tải xuống
Đã Xuất bản
Cách trích dẫn
Số
Chuyên mục
Categories
Giấy phép
Tác phẩm này được cấp phép theo Giấy phép quốc tế Creative Commons Attribution-NonCommercial 4.0 .
Bản quyền thuộc về JTE.


