Tìm hiểu về Data Warehouse, Data Mart và Data Lake

Một số notes rút ra sau khi học course Introduction to Data Engineering tại Coursera Các data repositories (kho dữ liệu) đều có một mục tiêu, đó là lưu trữ dữ liệu để báo cáo, phân tích và rút ra thông tin. Tuy nhiên, mỗi data repository sẽ có mục đích, loại dữ liệu được lưu trữ và cách truy cập dữ liệu khác nhau. Bài viết sẽ giới thiệu các data repositories phổ biến…

Continue ReadingTìm hiểu về Data Warehouse, Data Mart và Data Lake

Modern Data Ecosystem

Một số notes rút ra sau khi học course Introduction to Data Engineering tại Coursera Modern Data Ecosystem là gì? Morden Data Ecosystem (hệ sinh thái dữ liệu hiện đại) bao gồm một mạng lưới toàn diện của các thực thể liên kết, độc lập và liên tục thay đổi, gồm: Dữ liệu được tích hợp từ các nguồn không đồng nhất. Các kỹ thuật phân tích và kỹ năng khác nhau để tạo ra…

Continue ReadingModern Data Ecosystem