Sistem Berkas 2. ORGANISASI FILE
Organisasi Data dan Pengolahan File Istilah-Istilah Yang digunakan dalam Sistem Berkas Entitas Atribut Field Record File
Entitas Sekumpulan objek yang terbatas/terdefinisikan, mempunyai karakteristik sama dan bisa dibedakan dari lainnya Objek dapat berupa barang, orang, tempat atau kejadian Contoh entitas: mobil, mahasiswa, pegawai, dan lain sebagainya Atribut Deskripsi data yang bisa mengidentifikasikan entitas Seluruh atribut harus cukup untuk menyatakan identitas objek Kumpulan atribut dari setiap entitas dapat mengidentifikasikan keunikan suatu individu
Field Record File Lokasi penyimpanan untuk salah satu elemen data Contoh: ruang penyimpanan untuk identifikasi no. mahasiswa Suatu elemen yang memiliki atribut dan nilai dan merupakan informasi terkecil yang bisa di akses Record Lokasi penyimpanan yang terbuat dari rangkaian field yang berisi elemen-elemen data yang menggambarkan beberapa entitas Contoh: area penyimpanan membutuhkan isi dari identifikasi nomor, nama dan alamat dari salah satu siswa File Sekumpulan record yang saling berhubungan yang dikenal sebagai data file. Contoh: file daftar gaji berisi record2 daftar gaji untuk semua karyawan di suatu perusahaan
Hubungan antara field, record dan file
ORGANISASI FILE Adalah suatu teknik atau cara yang digunakan menyatakan dan menyimpan record-record dalam sebuah file. Metode penyimpanan/pencarian yang efisien dan efektif Algoritma yang dipakai Kompleksitas kecepatan : banyak langkah Efisien: memungkinkan bahwa semua data yang akan disimpan menjadi tersimpan Efektif pencarian: jika data ada, maka akan ketemu
ORGANISASI FILE Merupakan metode penyimpanan data ke dalam memori / storage Memori divisualisasikan sebagai array yang berisi data dan indeks sebagai alamat / address Memori berukuran P mempunyai alamat 0 – (P-1), disajikan dengan M(0 – (P-1)) Data yang disimpan berupa record dalam basis data Setiap record disimpan dalam 1 blok area, dan 1 blok diasumsikan dalam 1 alamat dan sebaliknya Karena setiap record dapat diwakili oleh kunci, maka data yang dibahas adalah kunci (kebanyakan terdiri dari 1 atribut) Dari asumsi-asumsi tersebut, permasalahan menjadi bagaimana menyimpan kunci ke dalam memori M(0 – (P-1))
Maka terdapat 3 aspek dalam organisasi file: Penentuan ukuran memori Metode penyimpanan Metode pencarian (akses) Yang harus efektif dan efisien Efisien: Menghemat Sesuai dengan kebutuhan atau ukuran data yang disimpan Sesedikit mungkin Efektif: Berguna Memungkinkan bahwa semua data yang akan disimpan menjadi tersimpan
Organisasi File Secara umum cara pengaksesan file yaitu : Direct Access Sequential Access
Direct Access Adalah suatu cara pengaksesan record yang langsung, tanpa mengakses seluruh record yang ada. Contoh : Magnetic Disk.
Sequential Access Adalah suatu cara pengaksesan record, yang didahului pengaksesan record-record di depannya. Contoh : Magnetic Tape.
Faktor-faktor yang mempengaruhi dalam proses pemilihan organisasi file Karakteristik dari media penyimpanan yang digunakan Volume dan frekuensi dari transaksi yang diproses Respontime yang diperlukan
Tugas dari sistem file Memelihara direktori dari identifikasi file dan lokasi informasi. Menetukan jalan (pathway) bagi aliran data antara main memory dan alat penyimpan sekunder. Mengkoordinasi komunikasi antara CPU dan alat penyimpan sekunder dan sebaliknya. Menyiapkan file penggunaan input atau output. Mengatur file, bila penggunaan input atau output telah selesai.
Penentuan Ukuran Memori Supaya penentuan ukuran memori efisien dan efektif digunakan kriteria-kriteria sbb: Banyaknya data yang akan disimpan dapat diketahui / diprediksi Misalkan banyaknya data yang akan disimpan = N, dan ukuran memori P, maka: Wajib : P > N Pilihan: P bilangan prima yang terdekat dengan N Menggunakan faktor muatan: f = N/P yang nilainya berkisar 60% - 90% Kombinasi 1 dan 2 Bebas
Metode Penyimpanan Sekuensial Data disimpan mulai dari alamat awal ke alamat berikut. Algoritmanya sbb.: Contoh: misalnya ada data: 25,10,15,30,20,40,45 Akan disimpan kurang lebih sbb.:
Metode Penyimpanan Sekuensial Algoritma dapat dimodifikasi sehingga data yang tersimpan menjadi terurut (buble sort, insertion sort, selection sort, dll)
Metode Akses Sekuensial Metode pencarian berikut menggunakan asumsi data yang tersimpan sudah terurut secara ascending, dan misalkan alamat terakhir yang terisi adalah P1, dengan 0P1P-1
Pencarian Biner Prinsip: membandingkan kunci dengan elemen tengah untuk mempersempit ruang pencarian Kemungkinan hasil perbandingan: Ketemu Kunci < elemen tengah ->eliminasi separuh ruang pencarian kunci yang > kunci Kunci > elemen tengan -> eliminasi separuh ruang pencarian yang < kunci Diterapkan pada file terurut Algoritma: Contoh: Diketahui data: 1, 2, 3, 4, 5, 6, 7, 10000, akan dicari key = 7 Kompleksitas waktu? Apa kelebihan dan kekurangan pencarian biner? Latihan soal: apabila diketahui data terurut sbb: 5, 10, 20, 28, 40, 42, 50, 60, 80, 100, 1000, carilah key 100 dengan cara binary search!
Pengukuran Kuantatif File TF : waktu yang dibutuhkan untuk mengambil satu rekord TN : waktu untuk mendapatkan satu rekord berikutnya TI : waktu insert satu rekord TU : waktu update satu rekord Tx : waktu pembacaan seluruh rekord TY : waktu reorganisasi file
PengukuraPengukuran Kinerja File Record Size (R) , rekord size rata-rata R = a’(A+V+2) a’ = rata-rata jumlah atribut A = ukuran rata-rata atribut (field) V = ukuran rata-rata nilai Fetch Record (TF) Data tidak tersusun baik, maka TF relatif tinggi Rekord dicari secara serial, blok per blok TF = 1/2b (B/t’) Get next Record (TN) Tidak ada pengurutan dalam File, TN = TF