Data Warehouse Overview

Data Warehouse là gì? Data Warehouse (kho dữ liệu) là một hệ thống tổng hợp dữ liệu từ một hoặc nhiều nguồn thành một kho dữ liệu duy nhất, nhằm hỗ trợ các yêu cầu phân tích dữ liệu khác nhau như data mining, AI, machine learning, front-end reporting và online analytical processing (OLAP). Data warehouse là một phần không thể thiếu trong hầu hết các ngành công nghiệp, bao gồm thương mại điện tử,…

Continue ReadingData Warehouse Overview

Monitoring and Optimizing Databases

Một số notes rút ra sau khi học course Relational Database Administration (DBA) tại Coursera. Giám sát và tối ưu (monitoring & optimizing) cơ sở dữ liệu là một trong những công việc quan trọng nhất của quản trị viên cơ sở dữ liệu (database admintrators - DBAs). Monitoring database bao gồm các nhiệm vụ liên quan đến việc theo dõi tình trạng hoạt động hàng ngày của cơ sở dữ liệu nhằm duy trì…

Continue ReadingMonitoring and Optimizing Databases

Backup and Restore Databases

Một số notes rút ra sau khi học course Relational Database Administration (DBA) tại Coursera. Backup and restore là một thuật ngữ chỉ quá trình sao lưu dữ liệu vì mục đích bảo vệ - khôi phục sau khi mất mát dữ liệu hoặc di chuyển dữ liệu từ cơ sở dữ liệu này sang cơ sở dữ liệu khác, nhằm phục vụ mục đích việc thay đổi hệ quản trị cơ sở dữ liệu…

Continue ReadingBackup and Restore Databases

Data wrangling

Một số notes rút ra sau khi học course Introduction to Data Engineering tại Coursera. Dữ liệu gốc cần trải qua một loạt các biến đổi (transformations) và làm sạch (cleaning) để sẵn sàng cho việc phân tích. Data wrangling, còn được gọi là data munging, là quá trình bao gồm khám phá dữ liệu, biến đổi và làm cho dữ liệu sẵn sàng để được phân tích một cách đáng tin cậy và có ý nghĩa.…

Continue ReadingData wrangling

Tìm hiểu về Data Warehouse, Data Mart và Data Lake

Một số notes rút ra sau khi học course Introduction to Data Engineering tại Coursera Các data repositories (kho dữ liệu) đều có một mục tiêu, đó là lưu trữ dữ liệu để báo cáo, phân tích và rút ra thông tin. Tuy nhiên, mỗi data repository sẽ có mục đích, loại dữ liệu được lưu trữ và cách truy cập dữ liệu khác nhau. Bài viết sẽ giới thiệu các data repositories phổ biến…

Continue ReadingTìm hiểu về Data Warehouse, Data Mart và Data Lake