Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

HEALTHCARE DATAMINING JUNTA ZENIARJA, M.KOM, M.CS.

Presentasi serupa


Presentasi berjudul: "HEALTHCARE DATAMINING JUNTA ZENIARJA, M.KOM, M.CS."— Transcript presentasi:

1 HEALTHCARE DATAMINING JUNTA ZENIARJA, M.KOM, M.CS

2 Outline 1. Pengenalan Data Mining a. Data Mining b. Peran Utama Data Mining c. Mengenal Rapidminer 6 Studio d. Algoritma Data Mining

3 Mengenal Rapidminer Studio 6.0.8

4 Rapidminer  Sebuah lingkungan untuk machine learning, data mining, text mining dan predictive analytics.  Machine learning  Salah satu disiplin ilmu dari Computer Science yang mempelajari bagaimana membuat komputer/mesin mempunyai suatu kecerdasan.  Data mining  Proses mengekstrak pola-pola dari data set yang besar dengan mengombinasikan metoda statistika, kecerdasan buatan dan database.

5 Rapidminer  Text mining  Mirip dengan text analytics, yaitu proses untuk mendapatkan informasi bermutu tinggi dari teks.  Predictive analytics  Teknik-teknik statistika yang menganalisa fakta masa kini dan masa lalu untuk memprediksi kejadian di masa depan.

6 Rapidminer  Open source berlisensi AGPL (GNU Affero General Public License) versi 3.  Dimulai pada 2001 oleh Ralf Klinkenberg, Ingo Mierswa, dan Simon Fischer di Artificial Intelligence Unit dari University of Dortmund.  Di-host oleh SourceForge sejak  Peringkat satu sebagai tool data mining untuk proyek nyata pada poll oleh KDnuggets, sebuah koran data-mining, pada

7 Rapidminer  Menyediakan prosedur data mining dan machine learning termasuk: ETL (extraction, transformation, loading), data preprocessing, visualisasi, modelling dan evaluasi.  Proses data mining tersusun atas operator-operator yang nestable, dideskripsikan dengan XML, dan dibuat dengan GUI.  Ditulis dalam bahasa pemrograman Java.  Mengintegrasikan proyek data mining Weka dan statistika R.

8 Instalasi  Rapidminer :  Rapidminer Studio  Rapidminer Server  Registrasi sebagai member / akun baru untuk mendownload :  Yang belum registrasi => https://rapidminer.com/download-rapidminer/  Yang sudah registrasi => https://rapidminer.com/my-account/

9 Fitur Rapidminer Studio Open and Extensible Advanced analytics for big data Predictions with application templates Runs on all major platforms and operating systems.

10 Terminologi Dasar  Atribut dan atribut target  Atribut: karakteristik atau fitur dari data yang menggambarkan sebuah proses atau situasi.  ID, atribut biasa.  Atribut target: atribut yang menjadi tujuan untuk diisi oleh proses data mining.  Label, cluster, weight.  Peran atribut (attribute role)  Label, cluster, weight, ID, biasa

11 Terminologi Dasar  Tipe nilai (value type)  nominal: nilai secara kategori  numeric: nilai numerik secara umum  integer: bilangan bulat  real: bilangan nyata  text: teks bebas tanpa struktur  binominal: nominal dua nilai  polynominal: nominal lebih dari dua nilai  date_time: tanggal dan waktu  date: hanya tanggal  time: hanya waktu

12 Terminologi Dasar  Data dan metadata  Data menyebutkan obyek-obyek dari sebuah konsep.  Ditunjukkan sebagai baris dari tabel.  Metadata menggambarkan karakteristik dari konsep tersebut.  Ditunjukkan sebagai kolom dari tabel.  Modelling  Penggunaan metoda data mining terhadap data.  Hasilnya disebut model.

13 Desain Proses Analisa  Fleksibilitas dan fungsionalitas  Sangat fleksibel untuk mendefinisikan proses analisa secara visual dengan GUI.  Meliputi lebih dari 500 fungsionalitas data mining dalam bentuk operator- operator.  Skalabilitas  Mulai versi 4.6 ~.. fokus utama pada skalabilitas untuk data ukuran besar.  Konsep view untuk data mirip seperti database.  Transformasi data on-the-fly tanpa copy.  100 juta data set bukanlah data yang besar.

14 Desain Proses Analisa  Format data  Terhubung sangat baik dengan berbagai sumber data: Oracle, IBM DB2, Microsoft SQL Server, MySQL, PostgreSQL, Ingres, Excel, Access, SPSS, CSV files dan berbagai format lain.  Bersama-sama dengan operator-operator untuk data preprocessing, bisa digunakan juga sebagai tool ETL (extraction, transformation, loading) dengan hasil yang menakjubkan.

15 Perspektif dan View  Sebuah perspektif berisi pilihan elemen-elemen GUI, yang disebut view, yang dapat dikonfigurasi secara bebas.  Elemen-elemen ini dapat diatur bagaimanapun juga sesuka kita.  Tiga perspektif:  Perspektif selamat datang (welcome perspective).  Perspektif desain (design perspective).  Perspektif hasil (result perspective).

16 Perspektif dan View

17 Referensi 1. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning Tools and Techniques 3rd Edition, Elsevier, Santosa Budi, Teknik Pemanfaatan Data Untuk Keperluan Bisnis, Graha Ilmu, Slide Materi Romi Satrio Wahono (www.ilmukomputer.com)

18 18


Download ppt "HEALTHCARE DATAMINING JUNTA ZENIARJA, M.KOM, M.CS."

Presentasi serupa


Iklan oleh Google