Normalisasi Basis Data Dewi Arianti Wulandari,SKom.,MMSI
NORMALISASI Definisi Normalisasi adalah suatu teknik untuk mengorganisasikan data ke dalam tabel- tabel untuk memenuhi kebutuhan pemakai di dalam suatu ogranisasi. Tujuan dari Normalisasi Untuk menghilang kerangkapan data Untuk mengurangi kompleksitas Untuk mempermudah pemodifikasian data
Normalisasi Normalisasi adalah proses pembentukan struktur basis data sehingga sebagian besar ambiguity bisa dihilangkan. Tahap Normalisasi dimulai dari tahap paling ringan (1NF) hingga paling ketat (5NF) Biasanya hanya sampai pada tingkat 3NF atau BCNF karena sudah cukup memadai untuk menghasilkan tabel-tabel yang berkualitas baik.
Proses Normalisasi Data diuraikan dalam bentuk tabel, selanjutnya dianalisis berdasarkan persyaratan tertentu ke beberapa tingkat. Apabila tabel yang diuji belum memenuhi persyaratan tertentu, maka tabel tersebut perlu dipecah menjadi beberapa tabel yang lebih sederhana sampai memenuhi bentuk yang optimal.
Tahapan Normalisasi Bentuk Tidak Normal Menghilangkan perulangan group Bentuk Normal Pertama (1 NF) Menghilangkan Ketergantungan sebagian Bentuk Normal Kedua (2NF) Menghilangkan Ketergantungan Transitif Bentuk Normal Ketiga (3NF) Menghilangkan anomali-anomali hasil dari ketergantungan fungsional Bentuk Normal Boyce-Codd (BCNF) Menghilangkan ketergantungan Multivalue Bentuk Normal Keempat (4NF) Menghilangkan anomaly-anomali yang tersisa Bentuk Normal Kelima
Ketergantungan Fungsional Definisi : Atribut Y pada relasi R dikatakan tergantung fungsional pada atribut X (R.X R.Y), jika dan hanya jika setiap nilai X pada relasi R mempunyai tepat satu nilai Y pada R. Misal, terdapat skema database Pemasok-Barang : Pemasok (No-pem, Na-pem) Tabel PEMASOK-BARANG No-pem Na-pem P01 Baharu P02 Sinar P03 Harapan Ketergantungan fungsional dari tabel PEMASOK- BARANG adalah : No-pem Na-pem
Ketergantungan Fungsional Penuh Definisi : Atribut Y pada relasi R dikatakan tergantung fungsional penuh pada atribut X pada relasi R, jika Y tidak tergantung pada subset dari X (bila X adalah key gabungan) Contoh : KIRIM BARANG (No-pem, Na-pem,No-bar, Jumlah) No-pem Na-pem No-bar Jumlah P01 Baharu B01 1000 P01 Baharu B02 1500 P01 Baharu B03 2000 P02 Sinar B03 1000 P03 Harapan B02 2000 Ketergantungan fungsional : No-pem Na-pem No-bar, No-pem Jumlah (Tergantung penuh thd keynya)
Ketergantungan Transitif : Definisi : Atribut Z pada relasi R dikatakan tergantung transitif pada atribut X, jika atribut Y tergantung pada atribut X pada relasi R dan atribut Z tergantung pada atribut Y pada relasi R. (X Y, Y Z, maka X Z ) Contoh : No-pem Kode Kota Kota No-bar Jumlah P01 1 Jakarta B01 1000 P01 1 Jakarta B02 1500 P01 1 Jakarta B03 2000 P02 3 Bandung B03 1000 P03 2 Surabaya B02 2000 Ketergantungan Fungsional : No-pem Kode-kota Kode-kota Kota, maka No-pem Kota
Bentuk UnNormal Suatu relasi dikatakan sudah memenuhi Bentuk Normal Kesatu bila setiap data bersifat atomik yaitu setiap irisan baris dan kolom hanya mempunyai satu nilai data. Tabel KIRIM-1 (Unnormal) No-pe Kode Kota Kota No-bar Jumlah P01 1 Jakarta B01 1000 B02 1500 B03 2000 P02 3 Bandung B03 1000 P03 2 Surabaya B02 2000
Bentuk Normal Kesatu (1 NF) Tabel KIRIM-2 (1 NF) No-pe Kode Kota Kota No-bar Jumlah P01 1 Jakarta B01 1000 P01 1 Jakarta B02 1500 P01 1 Jakarta B03 2000 P02 3 Bandung B03 1000 P03 2 SurabayaB02 2000
Bentuk Normal Kedua (2 NF) Suatu relasi dikatakan sudah memenuhi Bentuk Normal Kedua bila relasi tersebut sudah memenuhi bentuk Normal kesatu, dan atribut yang bukan key sudah tergantung penuh terhadap keynya. Tabel PEMASOK-1 (2 NF) No-pem Kode-kota Kota P01 1 Jakarta P02 3 Bandung P03 2 Surabaya
Bentuk Normal Ketiga (3 NF) Suatu relasi dikatakan sudah memenuhi Bentuk Normal ketiga bila relasi tersebut sudah memenuhi bentuk Normal kedua dan atribut yang bukan key tidak tergantung transitif terhadap keynya. Tabel KIRIM-3 (3 NF) No-pem No-bar Jumlah P01 B01 1000 P01 B02 1500 P01 B03 2000 P02 B03 1000 P03 B02 2000
Bentuk Normal Ketiga (3 NF) Tabel PEMASOK-2 (3 NF) No-pem Kode-kota P01 1 P02 3 P03 2 Tabel PEMASOK-3 (3 NF) Kode-kota Kota 1 Jakarta 2 Surabaya 3 Bandung
Normalisasi Sebuah tabel dikatakan baik (efisien) atau normal jika memenuhi 3 kriteria sbb: Jika ada dekomposisi (penguraian) tabel, maka dekomposisinya harus dijamin aman (Lossless-Join Decomposition). Artinya, setelah tabel tersebut diuraikan / didekomposisi menjadi tabel-tabel baru, tabel-tabel baru tersebut bisa menghasilkan tabel semula dengan sama persis. Terpeliharanya ketergantungan fungsional pada saat perubahan data (Dependency Preservation). Tidak melanggar Boyce-Code Normal Form (BCNF) (-akan dijelaskan kemudian-)
Normalisasi Jika kriteria ketiga (BCNF) tidak dapat terpenuhi, maka paling tidak tabel tersebut tidak melanggar Bentuk Normal tahap ketiga (3rd Normal Form / 3NF).
Tabel Universal Tabel Universal (Universal / Star Table) sebuah tabel yang merangkum semua kelompok data yang saling berhubungan, bukan merupakan tabel yang baik. Misalnya:
REKAPITULASI MAHASISWA TABEL UNIVERSAL REKAPITULASI MAHASISWA TAHUN AJARAN 2007-2008 NIM NAMA JURUSAN KODE MATAKULIAH NAMA MATAKULIAH SKS SEMESTER NAMA DOSEN HARI JAM NILAI TOTAL 2009-31-001 KRISHNA INFORMATIKA KIF01 ALGORITMA & PEMROGRAMAN 1 2 1 SHINTA SENIN 08.00-09.40 A 8 2009-31-002 DAIVA 11.00-12.40 B 6 2009-11-003 HANIFA ELEKTRO EL01 RANGKAIAN LISTRIK TONY 2009-21-004 SALMA SIPIL SP02 STRUKTUR BANGUNAN 3 PUSPITA 2009-31-005 BAYU KIF02 BAHASA PEMROGRAMAN DONY SELASA 09.00-10.40 C 4 2009-31-006 TATA TIAS 2009-31-007 DARMA KIF03 BAHASA RAKITAN FERDY RABU 07.30-09.10 2009-31-008 TAZA 10.00-11.40 2009-12-009 AISYAH MESIN MS01 MESIN TURBIN 5 SETIAWAN 2009-12-010 RARA BUDIMAN 2009-11-011 AKBAR AGUS 2009-11-012 NADIA EL02 FISIKA LISTRIK RANI KAMIS 2009-21-013 TALITHA ARMAN 2009-11-014 GABY DEWA JUM'AT 2009-31-015 ALFIN UMAR
Functional Dependency Notasi: A B A dan B adalah atribut dari sebuah tabel. Berarti secara fungsional A menentukan B atau B tergantung pada A, jika dan hanya jika ada 2 baris data dengan nilai A yang sama, maka nilai B juga sama Notasi: A B atau A x B Adalah kebalikan dari notasi sebelumnya.
Functional Dependency Contoh tabel nilai
Functional Dependency Functional Dependency dari tabel nilai Nrp namaMhs Karena untuk setiap nilai nrp yang sama, maka nilai namaMhs juga sama. {Namakul, nrp} NiHuruf Karena attribut Nihuruf tergantung pada Namakul dan nrp secara bersama-sama. Dalam arti lain untuk Namakul dan nrp yang sama, maka NiHuruf juga sama, karena Namakul dan nrp merupakan key (bersifat unik). NamaKul nrp Nrp NiHuruf
Simple Attribute adalah attribut terkecil yang tidak bisa dipilah lagi Composite Attribute adalah attribut yang dipilah-pilah lagi menjadi sub attribut yang masing-masing memiliki makna
Single Valued Attribute merupakan attribut-attribut yang hanya memiliki sebuah nilai untuk sebuah data tunggal Multi Valued Attribute merupakan attribut-attribut yang bisa memiliki lebih dari satu nilai yang jenisnya sama dari sebuah data tunggal
Mandatory attribute adalah attribut yang harus berisi data yang ada nilainya (tidak boleh kosong / NOT NULL) Derived Attribute adalah atribut yang nilai-nilainya diperoleh dari pengolahan atau dapat diturunkan dari atribut atau tabel lain yang berhubungan
Bentuk-bentuk Normal Bentuk Normal Tahap Pertama (1st Normal Form / 1NF) Bentuk Normal Tahap Kedua (2nd Normal Form / 2NF) Bentuk Normal Tahap (3rd Normal Form / 3NF) Boyce-Code Normal Form (BCNF) Bentuk Normal Tahap (4th Normal Form / 4NF) Bentuk Normal Tahap (5th Normal Form / 5NF)
Bentuk Normal Tahap Pertama (1st Normal Form / 1NF) Bentuk normal 1NF terpenuhi jika sebuah tabel tidak memiliki atribut bernilai banyak (multivalued attribute), atribut composite atau kombinasinya dalam domain data yang sama. Setiap atribut dalam tabel tersebut harus bernilai atomic (tidak dapat dibagi-bagi lagi)
Contoh 1 Atau: Tabel-tabel di atas tidak memenuhi syarat 1NF Misal data mahasiswa sbb: Atau: Tabel-tabel di atas tidak memenuhi syarat 1NF
Contoh 1 Didekomposisi menjadi: Tabel Mahasiswa Tabel Hobi
Contoh 2 (composite) JadwalKuliah Kodekul NamaKul Dosen Kelas Jadwal Dimana nilai pada atribut jadwal berisi gabungan antara Hari dan Jam. Jika asumsi hari dan jam memegang peranan penting dalam sistem basis data, maka atribut Jadwal perlu dipisah sehingga menjadi JadwalHari dan JadwalJam sbb: JadwalKuliah Kodekul NamaKul Dosen Kelas JadwalHari JadwalJam
Bentuk Normal Tahap Kedua (2nd Normal Form) Bentuk normal 2NF terpenuhi dalam sebuah tabel jika telah memenuhi bentuk 1NF, dan semua atribut selain primary key, secara utuh memiliki Functional Dependency pada primary key Sebuah tabel tidak memenuhi 2NF, jika ada atribut yang ketergantungannya (Functional Dependency) hanya bersifat parsial saja (hanya tergantung pada sebagian dari primary key) Jika terdapat atribut yang tidak memiliki ketergantungan terhadap primary key, maka atribut tersebut harus dipindah atau dihilangkan
Contoh Tabel berikut memenuhi 1NF tapi tidak termasuk 2NF: Mhs_nrp mhs_nama mhs_alamat mk_kode mk_nama mk_sks nihuruf Tidak memenuhi 2NF, karena {Mhs_nrp, mk_kode} yang dianggap sebagai primary key sedangkan: {Mhs_nrp, mk_kode} mhs_nama {Mhs_nrp, mk_kode} mhs_alamat {Mhs_nrp, mk_kode} mk_nama {Mhs_nrp, mk_kode} mk_sks {Mhs_nrp, mk_kode} nihuruf Tabel di atas perlu didekomposisi menjadi beberapa tabel yang memenuhi syarat 2NF
Contoh Functional dependencynya sbb: {Mhs_nrp, mk_kode} nihuruf (fd1) Mhs_nrp {mhs_nama, mhs_alamat} (fd2) Mk_kode {mk_nama, mk_sks} (fd3) fd1 (mhs_nrp, mk_kode, nihuruf) Tabel Nilai fd2 (Mhs_nrp, mhs_nama, mhs_alamat) Tabel Mahasiswa fd3 (mk_kode, mk_nama, mk_sks) Tabel MataKuliah
Bentuk Normal Tahap Ketiga (3rd Normal Form /3NF) Bentuk normal 3NF terpenuhi jika telah memenuhi bentuk 2NF, dan jika tidak ada atribut non primary key yang memiliki ketergantungan terhadap atribut non primary key yang lainnya. Untuk setiap Functional Dependency dengan notasi X A, maka: X harus menjadi superkey pada tabel tsb. Atau A merupakan bagian dari primary key pada tabel tsb.
Contoh alm_kodepos {alm_Provinsi, alm_kota} Tabel berikut memenuhi 2NF, tapi tidak memenuhi 3NF: Mahasiswa Nrp Nama Alm_Jalan Alm_Kota Alm_Provinsi Alm_Kodepos karena masih terdapat atribut non primary key (yakni alm_kota dan alm_Provinsi) yang memiliki ketergantungan terhadap atribut non primary key yang lain (yakni alm_kodepos): alm_kodepos {alm_Provinsi, alm_kota} Sehingga tabel tersebut perlu didekomposisi menjadi: Mahasiswa (Nrp, nama, alm_jalan, alm_kodepos) Kodepos (alm_kodepos, alm_provinsi, alm_kota)
Boyce-Code Normal Form (BCNF) Bentuk BCNF terpenuhi dalam sebuah tabel, jika untuk setiap functional dependency terhadap setiap atribut atau gabungan atribut dalam bentuk: X Y maka X adalah super key tabel tersebut harus di-dekomposisi berdasarkan functional dependency yang ada, sehingga X menjadi super key dari tabel-tabel hasil dekomposisi Setiap tabel dalam BCNF merupakan 3NF. Akan tetapi setiap 3NF belum tentu termasuk BCNF . Perbedaannya, untuk functional dependency X A, BCNF tidak membolehkan A sebagai bagian dari primary key.
Bentuk Normal Tahap Keempat (4th Normal Form /4NF) Bentuk normal 4NF terpenuhi dalam sebuah tabel jika telah memenuhi bentuk BCNF, dan tabel tersebut tidak boleh memiliki lebih dari sebuah multivalued atribute Untuk setiap multivalued dependencies (MVD) juga harus merupakan functional dependencies
Contoh Misal, tabel berikut tidak memenuhi 4NF: Setiap employee dapat bekerja di lebih dari project dan dapat memiliki lebih dari satu skill. Untuk kasus seperti ini tabel tersebut harus di-dekomposisi menjadi: (Employee, Project) (Employee, Skill)
Bentuk Normal Tahap Keempat (5th Normal Form /5NF) Bentuk normal 5NF terpenuhi jika tidak dapat memiliki sebuah lossless decomposition menjadi tabel-tabel yg lebih kecil. Jika 4 bentuk normal sebelumnya dibentuk berdasarkan functional dependency, 5NF dibentuk berdasarkan konsep join dependence. Yakni apabila sebuah tabel telah di-dekomposisi menjadi tabel-tabel lebih kecil, harus bisa digabungkan lagi (join) untuk membentuk tabel semula