Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

BASIS DATA LANJUTAN. Distributed Database Basis data terdistribusi adalah kumpulan database yang disimpan di banyak komputer pada lokasi yang berbeda-beda.

Presentasi serupa


Presentasi berjudul: "BASIS DATA LANJUTAN. Distributed Database Basis data terdistribusi adalah kumpulan database yang disimpan di banyak komputer pada lokasi yang berbeda-beda."— Transcript presentasi:

1 BASIS DATA LANJUTAN

2 Distributed Database Basis data terdistribusi adalah kumpulan database yang disimpan di banyak komputer pada lokasi yang berbeda-beda dan menampilkan ke user sebagai single database Basis data terdistribusi adalah kumpulan database yang disimpan di banyak komputer pada lokasi yang berbeda-beda dan menampilkan ke user sebagai single database Komputer-komputer tersebut terhubung dengan jaringan dan user dapat mengkases, mengupdate dan memodifikasi data pada database melalui jaringan Komputer-komputer tersebut terhubung dengan jaringan dan user dapat mengkases, mengupdate dan memodifikasi data pada database melalui jaringan

3 Why A Distributed Database? Distribution and autonomy of business units Distribution and autonomy of business units divisi dan departemen dari suatu organisasi tersebar secara geografis Data sharing Data sharing proses sharing data harus dilakukan secara mudah dan tepat Data communications costs and reliability Data communications costs and reliability proses pertukaran data dalam jumlah yang besar melalui jaringan membutuhkan biaya yang besar dan berpengaruh pada performance jaringan

4 Homogenous Distributed Database

5 Homogenous Distributed Database (2) Menggambarkan sistem terdistribusi yang mengkoneksikan 3 database hq, mfg, dan sales Menggambarkan sistem terdistribusi yang mengkoneksikan 3 database hq, mfg, dan sales User dapat mengakses atau memodifikasi data pada beberapa database pada suatu lingkungan terdistribusi User dapat mengakses atau memodifikasi data pada beberapa database pada suatu lingkungan terdistribusi Misalnya manufacturing melakukan join antara tabel yang ada di local database mfg dengan tabel yang berada di database hq (remote access) Misalnya manufacturing melakukan join antara tabel yang ada di local database mfg dengan tabel yang berada di database hq (remote access)

6 Heterogeneous Distributed Database Oracle Database server mengakses non-Oracle Database system menggunakan Oracle Heterogeneous Services: Oracle Database server mengakses non-Oracle Database system menggunakan Oracle Heterogeneous Services: - Oracle Transparent Gateway - Oracle Transparent Gateway - Generic Connectivity (ODBC,OLEDB)

7 Data Warehouse Data warehouse adalah relasional database yang didesain untuk proses query dan analisa Data warehouse adalah relasional database yang didesain untuk proses query dan analisa Meliputi: extraction, transportation, transformation, loading solution, online analytical processing (OLAP),client analysis tool, dan aplikasi lain yang mengatur proses pengumpulan data dan mengirimkan ke business user Meliputi: extraction, transportation, transformation, loading solution, online analytical processing (OLAP),client analysis tool, dan aplikasi lain yang mengatur proses pengumpulan data dan mengirimkan ke business user

8 Data Warehouse Data warehouse didesain untuk proses analisa data Data warehouse didesain untuk proses analisa data Contoh: data penjualan pada suatu perusahaan. Dengan data warehouse maka dapat menjawab pertanyaan “siapakah customer terbesar pada akhir pada akhir tahun?” Contoh: data penjualan pada suatu perusahaan. Dengan data warehouse maka dapat menjawab pertanyaan “siapakah customer terbesar pada akhir pada akhir tahun?”

9 Data warehouve vs OLTP (Online Transaction Processing) Salah satu perbedaan utama data warehouse dengan OLTP adalah data warehouse tidak selalu dalam bentuk normal ketiga (3NF), sedangkan OLTP biasanya dalam bentuk normal ketiga (3NF)

10 Data warehouve vs OLTP Data modification Data modification  Data warehouse biasanya ternormalisai secara sebagian bahkan dalam keadaan tidak ternormalisasi  OLTP ternormalisasi penuh untuk meningkatkan proses update/insert/delete dan meningkatkan konsistensi data Workload Workload  Data warehouse diupdate data secara regular (setiap minggu atau setiap hari) menggunakan teknik modifikasi data sehingga user tidak secara langsung mengupdate data warehouse  Pada OLTP, user melakukan proses update data secara rutin dan langsung Schema Design Schema Design  Data warehouse didesain untuk menampung query dalam jumlah yang besar  OLTP hanya mendukung operasi tertentu

11 Data warehouve vs OLTP Typical operation Typical operation  Data warehouse menjalankan query yang memproses banyak baris (ratusan atau milyaran), contoh :total penjualan semua customer pada akhir bulan  OLTP hanya mengkases record tertentu, contoh :mencari data order untuk customer tertentu Historical data Historical data  Data warehouse menyimpan data selama beberapa bulan atau tahun. Hal ini mendukung proses historical analysis  OLTP menyimpan data hanya beberapa minggu atau bulan

12 Arsitektur data warehouse End user secara langsung mengakses data dari beberapa sistem melalui data warehouse

13 Data Mining Suatu metode yang digunakan untuk mengekstrak pola dari suatu data Suatu metode yang digunakan untuk mengekstrak pola dari suatu data Nama lain: Knowledge Discovery in Database (KDD) Nama lain: Knowledge Discovery in Database (KDD) Proses KDD: Proses KDD:  Identifikasi masalah  Menyiapkan data  Membangun model data (data mining)  Menggunakan dan memonitoring model

14 Application Data Mining Data analysis and decision support Data analysis and decision support Managemen dan analisa pasar Managemen dan analisa pasar Target marketing, customer relationship management (CRM), market basket analysis, cross selling, market segmentation Target marketing, customer relationship management (CRM), market basket analysis, cross selling, market segmentation Managemen dan analisa resiko Managemen dan analisa resiko Forecasting, improved underwriting, quality control, competitive analysis Forecasting, improved underwriting, quality control, competitive analysis Other Applications Other Applications Text mining (news group, , documents) and Web mining Text mining (news group, , documents) and Web mining Stream data mining Stream data mining DNA and bio-data analysis DNA and bio-data analysis

15 Data Mining Task’s Association, menemukan hubungan dan korelasi antara berbagai data item Association, menemukan hubungan dan korelasi antara berbagai data item Classification, menganalisa data percobaan dan membangun model berdasarkan fitur dari data Classification, menganalisa data percobaan dan membangun model berdasarkan fitur dari data Prediction, memprediksi nilai-nilai yang mungkin terjadi dari data yang hilang atau distribusi nilai dari atribut tertentu dalam kumpulan obyek Prediction, memprediksi nilai-nilai yang mungkin terjadi dari data yang hilang atau distribusi nilai dari atribut tertentu dalam kumpulan obyek Clustering, mengidentifikasi cluster yang tersimpan dalam data, dimana cluster tersebut merupakan kumpulan data yang memiliki kesamaan dengan yang lain Clustering, mengidentifikasi cluster yang tersimpan dalam data, dimana cluster tersebut merupakan kumpulan data yang memiliki kesamaan dengan yang lain Time-series analysis, mencari urutan kesamaan, pola (pattern), periode dan deviasi Time-series analysis, mencari urutan kesamaan, pola (pattern), periode dan deviasi

16 Data Mining Method’s Classification and regression Classification and regression classification menghasilkan data categorical dan regression menghasilkan data numeric Clustering Clustering menggunakan algoritma k-mean, k-median Association Association menemukan pola pada data transaksional. Berhubungan dengan market basket analysis

17 What Kind of Output? Rules Rules Decision Trees Decision Trees Web Web

18 Keunggulan penyimpanan database besar, dalam hitungan megabyte, gigabyte, terabyte penyimpanan database besar, dalam hitungan megabyte, gigabyte, terabyte Relationship yang komplek antar field. Gabungan antara data numerical dan categorical Relationship yang komplek antar field. Gabungan antara data numerical dan categorical Skalabilitas tinggi. Skalabilitas tinggi.


Download ppt "BASIS DATA LANJUTAN. Distributed Database Basis data terdistribusi adalah kumpulan database yang disimpan di banyak komputer pada lokasi yang berbeda-beda."

Presentasi serupa


Iklan oleh Google