PERTEMUAN V INFRASTRUKTUR DAN ARSITEKTUR DATA WAREHOUSE
INFRASTRUKTUR DATA WAREHOUSE
Infrastructure Supporting Architecture
KATEGORI INFRASTRUKTUR DATA WAREHOUSE Infrastruktur operasional Infrastruktur fisik
Infrastruktur Operasional Orang-Orang Prosedur Pelatihan Manajemen perangkat lunak
Infrastruktur Fisik Hardware Operating Sistem DBMS Network Software
Physical Infrastructure
Perangkat keras/Hardware dan Sistem operasi menyusun lingkungan untuk data warehouse. Semua penyaringan data, transformasi, integrasi, dan penjadwalan kerja, pada hardware terpilih dijalankan di bawah sistem operasi pilihan.
POINT PENTING DLM MEMILIH HARDWARE Skalabilitas (bisa mengimbangi) Support Vendor reference Stabilitas Vendor Keamanan Keandalan/realiability Availability/ Ketersediaan Preemptive Multitasking Multithreaded (beberapa urutan terjadi dalam sebuah proses, tetapi dapat dijalankan secara independen.) Protection Memori
PILIHAN UMUM HARDWARE DATA WAREHOUSE Mainframe Server Open System NT Server
Mainframe komputer berskala besar yang digunakan untuk memproses data dan aplikasi yang besar juga. Mainframe pada umumnya digunakan dalam Perusahaan atau Organisasi yang menangani data, seperti sensus, riset penelitian, keperluan militer atau transaksi finansial.
Server UNIX, pilihan medium untuk kebanyakan data warehouse Server Open System Server UNIX, pilihan medium untuk kebanyakan data warehouse Sesuai untuk pengolahan paralel
NT Server / Mini Mendukung data warehouse ukuran menengah Kemampuan proses paralel yang terbatas Hemat biaya untuk data warehouse kecil dan ukuran menengah
Multiple Platform in a Typical Corporation
Pilihan Platform Suatu platform komputasi adalah satuan komponen perangkat keras, sistem operasi, jaringan, dan jaringan perangkat lunak.
Single Platform Ini merupakan pilihan yang paling sederhana dan secara langsung untuk implementasi arsitektur data warehouse. Dalam pilihan ini, semua fungsi dari backend penyaringan data pada front-end pengolahan query dilakukan pada komputasi platform tunggal.
Pilihan Platform selain Single Platform Option Hybrid Platform Pilihan Platform selain Single Platform Option
Platform Options as the Data Warehouse Matures
ARSITEKTUR DATA WAREHOUSE
Arsitektur adalah sekumpulan atau struktur yang memberikan kerangka untuk keseluruhan rancangan suatu sistem atau produk.
Macam-macam arsitektur data warehouse
Symmetric Multi Processing (SMP) Ciri – ciri : suatu arsitektur yang shared-everything, Mesin olah paralel yang paling sederhana. Masing-Masing processor mempunyai akses penuh kepada memori secara bersama melalui suatu common bus. Komunikasi antara processor terjadi melalui memori umum. Disk dapat dikontrol oleh semua procesor
Server Hardware Option: SMP
Clusters Ciri – ciri : Masing-Masing node terdiri dari satu atau lebih processor dan berhubungan dengan memori. Memori tidak shared di antara node tapi shared hanya di dalam masing-masing node. Komunikasi terjadi dalam kecepatan tinggi. Masing-Masing node mempunyai akses umum ke setiap disk. Arsitektur ini adalah suatu cluster dari node.
Server Hardware Option: Cluster
Massively Parallel Processing (MPP) Ciri - ciri: Ini adalah suatu arsitektur yang shared-nothing. Arsitektur ini lebih terkait dengan mengakses disk dibanding akses memori. Bekerja secara baik dengan suatu sistem operasi yang mendukung akses disk transparan. Jika suatu table database ditempatkan pada disk tertentu , akses ke disk itu tergantung seluruhnya pada processor yang memiliki disk Internode komunikasi adalah dengan koneksi antar processor ke processor lainnya.
Server Hardware Option : MPP
Non Uniform Memory Architecture (NUMA) Ciri-Ciri Ini adalah arsitektur yang dikembangkan pada awal 1990an. Sistem mempunyai memori tunggal menunjuk pada keseluruhan alamat memori mesin dimulai dengan node yang pertama dan berlanjut ke node berikutnya. Masing-Masing node berisi suatu direktori alamat memori di dalam node tersebut. Di dalam arsitektur ini, jumlah waktu yang diperlukan untuk mendapatkan kembali suatu nilai memori bervariasi sebab node yang pertama mungkin memerlukan nilai yang berada di memori dari node lainnya. Hal inilah yang merupakan alasan mengapa arsitektur ini disebut arsitektur akses memori non uniform
Server Hardware Option : NUMA
Parallel Processing Options Pemilihan DBMS Collection Tools SOFTWARE DATABASE Parallel Processing Options Pemilihan DBMS Collection Tools
Paralel Processing Options Interquery Parallelization Intraquery Parallelization
Horizontal Parallelism Vertical Parallelism Hybrid Method
Intra and inter query parallelization by DBMS
Pemilihan DBMS Query optimizer Query management Load utility Metadata management Scalability Extensibility Portability Administration
Collection Tools for Data Warehouse
Prinsip Data Warehouse
Sumber Data untuk Data Warehouse Data operasional dalam organisasi, misalnya basis data pelanggan dan produk. Sumber eksternal yang diperoleh misalnya melalui Internet, basis data komersial, basis data pemasok atau pelanggan
Terima Kasih…