Ekstraksi, Transformasi dan Loading (ETL)

Slides:



Advertisements
Presentasi serupa
Partisi dalam Data Warehouse ( Lanjutan )
Advertisements

Taukhid Wisnu Broto, S.Kom, MT Tim Informatika ITB
Continous DBMS DATA MODELS
INDEXES Wiratmoko Yuwono.
Pengantar Teknologi Informasi
MYSQL.
PEMROSESAN FILE DAN KONSEP MANAJEMEN DATA
CHAPTER 7 DATA EXTRACTION
Desain Web R0312 – Grafik Komputer.
Proses-proses Perangkat Lunak
PAKET PROGRAM PENGOLAHAN DATA STATISTIK
Software Requirement Specification
Pertemuan Petugas Pengolah Data
DATA FLOW DIAGRAM.
DATABASE ADMINISTRATION Pertemuan ke-10. Data Movement and Distribution source : Database Administration the complete guide to practices and procedures.
Data Warehouse dan Decision Support
Oleh : Kholid Fathoni, S.Kom., M.T.
Data Mart dan Metadata Data Warehouse
Database Backups and Recovery
Data Mart dan Metadata Data Warehouse
BASIS DATA TERDISTRIBUSI 2 – DBMS, MYSQL & SQL
Arsitektur Data Warehouse
Komponen Data warehouse
Arsitektur DWH Pertemuan ke-2.
ONLINE ANALYTICAL PROCESSING (OLAP)
Manajemen Sumber Daya Data
Konsep Database Management System (DBMS)
Database Snapshot dfd, Pengantar dfd, 2012 Database Snapshot adalah database yang bersifat read-only yang dapat digunakan untuk mengambil data pada.
Data Types Data Definition Language Referential Constraint SQL Query
DATA WAREHOUSE (The Building Blocks)
Pemrograman Berorientasi Obyek Lanjut (IT251) Ramos Somya, S.Kom., M.Cs.
Pengenalan Database MySQL
Pengelolaan Database Kependudukan
BAB VI SISTEM BASIS DATA DAN SISTEM BERORIENTASI OBJEK
PENGANTAR KOMPUTER & TI 2A
Data Manipulation Languange (DML) Perintah INSERT dan DELETE
Data Movement & Distribution Database
Vega Valentine, ST, MMSI, MSc
SQL pada basis data client-server
SQL OVERVIEW.
04 Datawarehouse Transformasi Data Febrianti Supardinah, ST.MM.
DATA MART Pertemuan ke-3.
Proses ETL (Extract-Transform-Load)
Management Information System
ARSITEKTUR DATA WAREHOUSE
Proses ETL (Extract, Transform and Loading)
Database & Data Handling
Prinsip Data Warehouse
Pengantar Seputar sistem basisdata Cara pandang Data Model Data
Java Database Programming
PERTEMUAN I “EHAT PERMANA”
Tora Fahrudin (TRF) Slide 9 Migrasi Data dari MySQL Offline ke Oracle Online (Sumber Database Offline Target.
Perancangan Data Logis dan Fisik
Pengantar Seputar sistem basisdata Cara pandang Data Model Data
Biodata…… Nama : Muhammad Yunus Alamat : Getap Asal : Sakra Lotim
Aplikasi Database Dosen : Sarwo, Skom,.Mkom Url :
Pengantar Teknologi Informasi
Pengenalan mySQL database
Pengantar Teknologi Informasi
ETL (Extract-Transform-Load)
Pengantar Teknologi Informasi
5 MANAJEMEN SUMBER DAYA DATA CHAPTER
Building Data Warehouse
Sistem Pengolahan Data
Penjelasan : Tingkat/level abstraksi data
OLTP & ETL Data integration.
Rekayasa Perangkat Lunak
Membuat Query ACCESS Query adalah fasilitas untuk mengakses data dengan cara  yang memungkin bagi kita untuk menampilkan data-data dari database dalam.
Java Database Connectivity (JDBC)
SUB QUERY DAN VIEW Praktikum SBD – 7 & 8.
Transcript presentasi:

Ekstraksi, Transformasi dan Loading (ETL) Wiratmoko Yuwono

Pengantar Tiga fungsi utama yang perlu dilakukan untuk membuat data siap digunakan pada datawarehouse adalah extraction, transformation dan loading. Ketiga fungsi ini terdapat pada staging area. Pada data staging ini, disediakan tempat dan area dengan beberapa fungsi seperti data cleansing, change, convert, dan menyiapkan data untuk disimpan serta digunakan oleh datawarehouse.

Extraction Data Extraction adalah proses pengambilan data yang diperlukan dari sumber datawarehouse dan selanjutnya dimasukkan pada staging area untuk diproses pada tahap berikutnya . Pada fungsi ini, kita akan banyak berhubungan dengan berbagai tipe sumberdata. Format data, mesin yang berbeda, software dan arsitektur yang tidak sama. Sehingga sebelum proses ini kita lakukan, sebaiknya perlu kita definisikan requirement terhadap sumber data yang akan kita butuhkan untuk lebih memudahkan pada extraction data ini.

Extraction Tipe Ekstraksi Data secara logika 1. Full Extraction Extraksi data dilakukan secara menyeluruh dari sumber data, biasanya dilakukan pada saat create pertama kali datawarehouse, dimana data dalam datawarehouse belum ada sama sekali. 2. Incremental Extraction Ekstraksi data dilakukan secara sebagian, data yang diekstraksi adalah data yang mengalami perubahan saja, dilakukan pada saat datawarehouse sudah berjalan.

Extraction Tipe Ekstraksi Data secara physical 1. Online Extraction Data yang diekstrak langsung berasal dari sumber data (dapat memakai snapshot log ataupun dapat memakai trigger database) 2. Offline Extraction Data yang diekstrak tidak langsung berasal dari sumber data. (contoh dapat memakai Flat File, Dump File, Redo Log, Archive Log atau Transportable Tabelspace)

Extraction (Change Data Capture) Digunakan pada metode Incremental Extraction. Dapat menggunakan timestamp, Partitioning dan Database Trigger Contoh TimeStamp : SELECT * FROM orders WHERE TRUNC(CAST(order_date AS date),'dd') =TO_DATE(SYSDATE,'dd-mon-yyyy');

Transformation Pada kenyataannya, pada proses transaksional data disimpan dalam berbagai format sehingga jarang kita temui data yang konsisten antara aplikasi-aplikasi yang ada. Transformasi data ditujukan untuk mengatasi masalah ini. Dengan proses transformasi data ini, kita melakukan standarisasi terhadap data pada satu format yang konsisten. Beberapa contoh ketidakkonsistenan data tersenut dapat diakibatkan oleh tipe data yang berbeda, data length dan lain sebagainya.

Transformation Untuk lebih jelasnya dapat dilihat pada tabel 2.1 yang menunjukkan permasalahan dasar pada proses pengintegrasian data.

Transformation Keterangan : Format, Pada transaksional data dapat disimpan dalam berbagai format. Elemen data tersebut dapat tersimpan dalam format text, integer dan sebagainya. Untuk itu standarisasi perlu dilakukan dengan melihat kegunaan pokok dari elemen data pada proses transaksinal dan datawarehouse. Description, Pada tabel terlihat representasi ketiga nama pelanggan adalah sama. Namun dengan penulisan yang beda terlihat adanya perbedaan format pada data. Oleh karena itu perlu diambil salah satu dari deskripsi tersebut untuk konsistensi data.

Transformation Unit, Adanya perbedaan satuan ukuran dapat menimbulkan permasalahan yang komplek. Jika user tidak mengetahui adanya perbedaan ini dan menganggap sama, maka akan terjadi kesalahan ketika kita melakukan penghitungan matematis. Encoding, huruf atau nomor dapat dijadikan label sebagi identifikasi suatu objek. Seperti pada tabel diatas, kesalahan dapat terjadi karenanya.

Transformation Cara Mentransformasi Data : MultiStage DataTransformation Data ditransformasi dengan beberapa tahapan, dengan bantuan staging table

Transformation 2. PipeLined DataTransformation Data ditransformasi dan langsung dimasukkan ke datawarehouse tanpa bantuan table staging

Loading Data loading adalah memindahkan data ke datawarehouse. Banyak cara yang dapat anda lakukan untuk melakukan loading data, spt : Loading data dengan SQL Loader Loading data dengan External Table Loading data dengan OCI Loading data dengan Export/Import