Skip to content
Mô tả công việc
- Thiết kế và phát triển kiến trúc dữ liệu tổng thể (Data Ingestion → Processing → Storage → Serving) phục vụ Analytics, BI và AI/ML.
- Xây dựng và tối ưu mô hình Data Lake / Lakehouse / Data Warehouse theo chiến lược doanh nghiệp.
- Thiết kế conceptual, logical và physical data models cho các domain nghiệp vụ.
- Xây dựng tiêu chuẩn dữ liệu: naming convention, modeling standards, SCD, CDC, partitioning, schema evolution, data contracts.
- Thiết kế và triển khai tích hợp dữ liệu real-time và batch (Streaming, APIs, ELT/ETL).
- Lựa chọn và định hướng triển khai các nền tảng dữ liệu như Databricks, Amazon Redshift, Google BigQuery.
- Phối hợp với Data Engineering team xây dựng pipeline mở rộng, orchestration và CI/CD cho dữ liệu.
- Thiết lập và giám sát Data Governance: data catalog, lineage, data quality, SLA, metadata management.
- Thiết kế cơ chế bảo mật và kiểm soát truy cập (RBAC/ABAC, masking, encryption, compliance).
- Tối ưu hiệu năng, chi phí và độ ổn định của hệ thống dữ liệu trên cloud.
- Định hướng roadmap kiến trúc dữ liệu phù hợp với mục tiêu kinh doanh và chuyển đổi số.
- Review thiết kế kỹ thuật, mentoring và hỗ trợ xử lý các vấn đề phức tạp.
Yêu cầu công việc
- Tốt nghiệp Đại học trở lên chuyên ngành CNTT, Khoa học máy tính, Hệ thống thông tin hoặc tương đương.
- Tối thiểu 10+ năm kinh nghiệm trong Data Architecture, Data Engineering hoặc Database Design ở môi trường enterprise-scale.
Kỹ năng chuyên môn:
Data Modeling
- Thành thạo dimensional modeling, Data Vault, 3NF, semantic layer, MDM, metadata management.
Database & Query
- SQL nâng cao và performance tuning với các hệ quản trị CSDL như Microsoft SQL Server, PostgreSQL, Oracle Database.
- Kinh nghiệm với NoSQL như MongoDB hoặc Apache Cassandra.
Data Pipelines & Tools
- Kinh nghiệm với ETL/ELT và orchestration như Azure Data Factory, Apache Airflow, dbt.
- Làm việc với Spark, Delta Lake, Iceberg hoặc kiến trúc Lakehouse.
Cloud
- Có kinh nghiệm thực tế với ít nhất một nền tảng Cloud: Amazon Web Services hoặc Google Cloud Platform.
Governance & Security
- Hiểu và triển khai data catalog, lineage, data quality framework
- Kiến thức về bảo mật dữ liệu: RBAC/ABAC, masking, encryption, compliance
Programming
- SQL nâng cao
- Python hoặc Scala.