Data, Text, and Document Management Part 3 Data, Text, and Document Management System Information of Technology Wulan Dari – 372997 Dosen: Syaiful Ali, MIS.,Ph.D. Magister Akuntansi – FEB UGM Kelas Paruh Waktu ANGKT.17
DATA MANAGEMENT Data Data Management Sekumpulan fakta, bilangan, angka dan simbol yang dibentuk dan diolah menjadi informasi (Scott) Gambaran / Fakta secara relatif belum berarti bagi si penerima (Davis) Penggambaran fakta, pengertian atau instruksi yang disampaikan, dimengerti dan diolah oleh manusia atau peralatan yang digunakan. Data Management Data Management adalah suatu pendekatan yang terstruktur untuk menangkap data, menyimpan, memproses, mengintegrasikan, mendistribusikan, mengamankan dan mengarsipkan data secara keseluruhan dalam suatu siklus. Contoh solusi yaitu dengan membuat data warehouse. Tujuan dari data management Memberikan sarana dan alat untuk merubah raw data menjadi informasi yang berkualitas bagi perusahaan. Aset informasi Teknologi manejemen data pada prinsipnya bertujuan untuk memaksimalkan laba dengan cara meningkatkan penjualan dan menekan biaya. Adanya keterbatasan para manager karena para pegawai memberikan data yang tidak lengkap, tidak relevan, usang, tidak akurat, tidak bisa diakes sehingga tidak dapat dianalisa dengan baik.
MASTER DATA MANAGEMENT (MDM) MDM adalah proses dimana perusahaan mengintegrasikan data yang berasal dari berbagai sumber data yang berbeda untuk menyatukan data tersebut. Penyatuan data tersebut menjadi Master Reference File. Master Reference File dibuat berdasarkan Data Entitas. Data Entitas adalah sesuatu yang nyata atau abstrak dimana perusahaan akan mengumpulkan dan menyimpan data.
TRANSFORMING DATA INTO KNOWLEDGE Data diekstrak dari database dan diproses dalam data warehouse atau data mart. Data mart adalah data warehouse kecil yang dirancang untuk Strategic Business Unit (SBU) atau divisi tunggal. Proses yang dilakukan extract, transform and loan (ETL). ETL memindahkan data dari berbagai sumber, kemudian dilakukan reformat, dibersihkan dan ditempatkan pada data warehouse atau data mart untuk dianalisis atau dimasukkan pada sistem operasi lainnya untuk mendukung proses bisnis. Pengguna mengakses data warehouse dan meng copy data untuk dianalisis. Data yang tersimpan dilihat dengan analisis data dan data mining. Alat Data Mining merupakan software khusus untuk menganalisa agar dapat dicari pola, korelasi, tren dan hubungan lainnya. Software Data Mining membantu pengguna untuk menganalisa data dalam dalam berbagai perspektif dan sudut yang berbeda untuk mencari pola hubungan antar data dalam data warehouse. Aktivitas tersebut secara umum menghasilkan informasi data dan knowledge yang lebih bermakna. Data dan knowledge disajikan dengan alat visualisasi. Visualisasi data bisa dalam bentuk gambar, tabel atau grafik.
DATA QUALITY AND INTEGRITY Kualitas data mencakup 5 dimensi yaitu: akurasi, aksebilitas, relevan, tepat waktu dan lengkap. TEXT MINING Text mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks Proses penganalisisan teks guna menyarikan informasi yang bermanfaat untuk tujuan tertentu. Proses data mining untuk data dokumen atau teks memerlukan lebih banyak tahapan, mengingat data teks memiliki karakteristik yang lebih kompleks daripada data biasa. PROSES TEXT ANALYTICS Eksplorasi Menggali data disesuaikan dengan topik permasalahan yang ada. Preprocessing Menyiapkan data untuk diolah sesuai dengan standarisasi seperti ejaan, singkatan dan bahasa slang. Categorizing and Modeling Setelah dilakukan preprocessing selanjutnya dikategorikan dengan menggunakan statistik dan peraturan bisnis. Dokumen tambahan diproses untuk validasi keakuratan dan ketepatan model yang digunakan. Dokumen baru dievaluasi menggunakan final model. Model dapat menempatkan dokumen dalam produksi untuk otomatisasi dokumen baru yang ada.
DOCUMENTATION MANAGEMENT & DOCUMENT MANAGEMENT SYSTEM (DMS) Manajemen dokumen adalah pengendalian atas image and electronic documents, page images, spreadsheets, voice and email message, word processing documents dan dokumen lain selama life cycle sampai pengarsipan akhir atau dihancurkan. DMS terdiri dari hardware dan software yang mengelola dan mengarsipkan dokumen elektronik, mengkonversi paper document menjadi e-document, memberi indeks dan menyimpan sesuai dengan kebijakan perusahaan. Database merupakan kumpulan file-file yang berhubungan secara logis dan digunakan secara rutin pada operasi-operasi sistem informasi manajemen. Semua database umumnya berisi elemen-elemen data yang disusun ke dalam file-file yang diorganisasikan berdasarkan sebuah skema atau struktur tertentu, tersimpan di hardware komputer dan dengan software untuk melakukan manipulasi data untuk kegunaan tertentu. Contoh suatu database adalah database akademik yang berisi file-file: mahasiswa, dosen, kurikulum, dan jadwal yang diperlukan untuk mendukung operasi sistim informasi akademik. HIRARKI DATA KOMPUTER File Record Field Byte Bit
HIRARKI DATA MENGAKSES RECORD DARI FILE COMPUTER Field atau kolom Byte Bit Field atau kolom adalah unit terkecil yang disebut data. Field merupakan sekumpulan byte yang mempunyai makna. Contoh: Joni yang merupakan field nama. Jadi field ibarat kumpulan karakter yang membentuk suatu kata. Byte adalah bagian terkecil yang dapat dialamatkan dalam memori. Byte merupakan sekumpulan bit yang secara konvensional terdiri atas kombinasi delapan bit. Satu byte digunakan untuk mengkodekan satu buah karakter dalam memori. Contoh: Kode Ascii untuk J ialah 10101010. Jadi byte adalah kumpulan bit yang membentuk satu karakter (huruf, angka, atau tanda). Dengan kombinasi 8 bit, dapat diperoleh 256 karakter (= 2 pangkat 8). Bit adalah suatu sistem angka biner yang terdiri atas dua macam nilai saja, yaitu 0 dan 1. Sistem angka biner merupakan dasar dasar yang dapat digunakan untuk komunikasi antara manusia dan mesin (komputer) yang merupakan sekumpulan komponen elektronik dan hanya dapat membedakan dua keadaan saja (on dan off). Jadi bit adalah unit terkecil dari pembentuk data. MENGAKSES RECORD DARI FILE COMPUTER Sequential file organization Direct file organization atau random file oraganization Indeks sequential access method (ISAM)
KELEMAHAN FILE ENVIRONMENT Data Redundancy menghabiskan banyak media penyimpanan Sulit untuk memperoleh gambaran yang komprehensif Membutuhkan lebih banyak biaya untuk input dan pemeliharaan data Data inconsistency Ketidakkonsistenan dengan berbagai data yang ada Data isolation Adanya pemisahan data sehingga harus ada pengintegrasian data pada saat digunakan. Data security Pengamanan data sulit dilakukan karena tidak terintegrasi, penanggung jawab partial. Untuk mengurangi kelemahan tersebut maka dibutuhkan Data Management Systems.
TIPE DATABASE Centralized Database Distributed Database
DATABASE MANAGEMENT SYSTEMS (DBMS) Fungsi DBMS Advantages & Capability DBMS Permanen Querying Concurrency Backup dan replication Rule enforcement Security Computation Change and access logging Automated optimization Data filtering dan profiling Mendeteksi adanya kesalahan data, inkonsistensi, redundansi dan informasi yang tidak lengkap. Data quality Mengkoreksi, standarisasi dan verifikasi keandalan data Data synchronization Mengintegrasikan, menyesuaikan dan menghubungkan berbagai sumber yang berbeda Data enrichment Memperkaya data dengan menggunakan informasi dari sumber internal atau eksternal Data maintenance Melakukan checking dan controlling keandalan data
DATABASE VS DATA WAREHOUSES Database adalah online transaction processing system (OLTP), dirancang untuk mengotimalkan penyimpanan data. Data warehouse adalah online analytical processing system (OLAP), dirancang untuk mengoptimalkan kebutuhan analisis data berkaitan dengan hal-hal penting dalam perusahaan. KARAKTERISTIK DATA WAREHOUSE TIPE ORGANISASI YANG COCOK MENGGUNAKAN DATA WAREHOUSE Organization Data diorganisasikan per subjek dan hanya terdiri dari data yang mendukung keputusan organisasi Consitency Data yang bersumber dari database yang berbeda diberikan kode yang berbeda Time Variant Penyimpanan data dalam beberapa tahun dapat memenuhi kebutuhan untuk menganalisis trend, forecasting dan perbandingan. Nonvolatile Data yang masuk di warehouse tidak akan berubah Relational Data warehouse menggunakan struktur yang saling berkaitan Client/server Menggunakan main server untuk memberikan kemudahan akses data oleh user Web based Berdasarkan web supaya lebih efisien Integration Data dari berbagai sumber diintegrasikan dengan menggunakan bantuan web Real time Dapat digunakan untuk memperoleh dan memproses data dengan tepat waktu Pengguna akhir membutuhkan data dalam jumlah banyak Data operasional disimpan diberbagai sistem yang berbeda Pegawai menggunakan pendekatan manajemen berbasis informasi Organisasi mempunyai bisnis yang luas dengan beragam pelanggan Data yang sama diproses oleh sistem informasi yang berbeda Data disimpan dengan format teknologi tinggi sehingga sulit untuk diuraikan. Extensive end user computing is perfomed
ENTERPRISE CONTENT MANAGEMENT (ECM) DATA CENTER Data center berfungsi menyimpan dan mengintegrasikan jaringan, sistem komputer dan media penyimpan, sehingga menjamin ketersediaan power, penyediaan fisik dan keamanan data. Data center terbaru sangat besar dan mencakup suhu dan pengendalian kebakaran, keamanan fisik dan digital, supply power ganda sehingga tidak bisa diamankan dengan UPS dan hubungan komunikasi data yang berulang. ENTERPRISE CONTENT MANAGEMENT (ECM) ECM meliputi manajemen dokumen elektronik, manajemen web content, manajemen aset digital danelectronic record management (ERM). ERM membantu mengurangi biaya, mudah dalam membagi data, mengurangi risiko, mengurangi proses manual dan mengkonsolidasikan banyak web ke dalam single platform.
Terimakasih