Text Mining ..

Slides:



Advertisements
Presentasi serupa
KNOWLEGDE DISCOVERY in DATABASE (KDD)
Advertisements

Proses bisnis dalam kerangka e-commerce
Sistem Basis Data Lanjut
Oleh : Weny Pravita sari
BASIS DATA LANJUTAN.
KNOWLEDGE TRANSFER IN THE e - WORLD
Topik-Topik Lanjutan Sistem Informasi Johanes Kevin Lumadi Deny Setiawan Machliza Devi Sasmita Silvia Line Billie.
Data mining Pengantar data mining.
Oleh I Putu Agus Hendra Krisnawan
Pengenalan Data Warehouse
Pengenalan Datawarehouse
Manajemen Sumber Daya Data
IMPLEMENTASI SOLUSI INFORMASI BISNIS
Text Mining.
PERANGKAT MANAJEMEN PENGETAHUAN
M ANAJEMEN D ATA “Pengaksesan Data”. P ENDAHULUAN Selama beberapa waktu, teknologi informasi berkonsentrasi pada pembangunan sistem bermisi kritis,- sistem.
SISTEM INFORMASI Pertemuan 5.
Information Retrieval
Modul 2 : Teknologi Informasi Lecture Note: Inayatullah, S.Kom., M.Si. Yoannita, S.Kom Hardware Komputer Software Komputer Manajemen Sumber Daya Data Telekomunikasi.
12 Oktober 2006Data Mining : Konsep dan Teknologi1 Aplikasi dan Kecenderungan dalam Data Mining ■Aplikasi data mining ■Sistem produk dan protetipe riset.
1 Pertemuan > > Matakuliah: >/ > Tahun: > Versi: >
Manajemen Sumber Daya Data
PENGANTAR DATA MINING.
Pengenalan Data Mining
DATA MINING 25 Januari 2008.
Penambangan data Pertemuan 2.
CRM CRM kependekan dari Customer Relationship Management. Dalam bahasa indonesia dapat kita artikan sebagai Manajemen Hubungan Pelanggan. Merupakan strategi.
Mengelola Siklus Hidup Pelanggan
SEARCH ENGINE.
Rekayasa Perangkat Lunak Model Proses PL
Text Mining and Information Retrieval
E - Business “CRM” Sistem Informasi STMIK AMIKOM Purwokerto 2013.
DATABASE ADMINISTRATION
KECERDASAN BISNIS Data Warehouse, Data Mart, OLAP, dan Data Mining
Presentasi Knowledge Management
Perangkat Manajemen Pengetahuan
Data dan Informasi Daurat Sinaga, M.Kom.
SISTEM TEMU KEMBALI INFORMASI
Data Warehouse, Data Mart, OLAP, dan Data Mining
Inovasi SI & New technology
Konsep Data Mining Ana Kurniawati.
TEMU BALIK INFORMASI TI 14 A.
Database Change Management source : Database Administration the complete guide to practices and procedures chapter 7 by. Craig S. Mullins.
ARSITEKTUR DATA WAREHOUSE
E-Marketing Research.
KECERDASAN BISNIS (Data Warehouse, Data Mart, OLAP, dan Data Mining)
KEUNGGULAN KOMPETITIF TEKNOLOGI INFORMASI
Aplikasi Business Intelligence & Data Mining
Automasi Perpustakaan Vs Digital library
Business Intelligent Ramos Somya, S.Kom., M.Cs.
DATABASE ADMINISTRATION
BUSINESS INTELLIGENCE
KELOMPOK 6 Nama Kelompok: Lulus Irmawati ( )
TEXT OPERATION Muhammad Yusuf Teknik Multimedia dan Jaringan
Meminta pendapat para pengguna dan para ahli
Pengantar Business Intelligence
MATA KULIAH : PENGENALAN TEKNOLOGI INFORMASI KELAS F
Pengantar Business Intelligence
CRM CRM kependekan dari Customer Relationship Management. Dalam bahasa indonesia dapat kita artikan sebagai Manajemen Hubungan Pelanggan. Merupakan strategi.
WebMining ..
SEARCH ENGINE.
Arsitektur dan Model Data Mining
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
Apa dan untuk apa data mining
Konsep Data Mining Ana Kurniawati.
TEXT MINING.
ADI PRIHANDONO, SKOM, MKOM
Cross-Language Information Retrieval (CLIR)
Perkenalan Nama : Edy Mulyanto Hp/WA :
SISTEM INFORMASI AKUNTANSI
Transcript presentasi:

Text Mining .

Definisi Text Mining Text Mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antar dokumen.

Menurut kajian dari Merrill Lynch dan gartner, 85 hingga 90 persen dari semua data korporat diambil dan disipan dalam bentuk data tak terstruktur (McKnight, 2005). Dituliskan bahwa data takterstruktur ini selalu menjadi dua kali lipat dalam hal size setiap 18 bulansekali.

Karena knowledge adalah power dalam dunia bisnis saat ini, dan knowledge diturunkan dari data dan informasi, organisasi bisnis yang bisa secar efektif dan efisien masuk ke beragam sumber data teks mereka akan memiliki knowledge yang diperlukan untuk membuat keputusan yang lebiih baik, yang membawa ke keuntungan kompetitif. Inilah yang mengakibatkan kebutuhan terhadap text mining cocok dengan gambaran besar bisnis hari ini.

Text mining (juga disebut dengan text data mining, atau knowledge discovery in textual database) adalah proses semi-otomatis dalam mengekstrak berbagai pola data (informasi dan database yang bermanfaat) dari sumber data tak-terstruktur.  

Bidang penerapan text mining yang paling popular Information extraction (ekstraksi informasi). Identifikasi terhadap hubungan dan frase-frase kunci dalam text dengan mencari urutan yang sudah ditetapkan dalam text menggunakan pencocokan pola. Topic tracking (pelacakan topic). Berdasarkan pada profil user dan berbagai dokumen yang dilihat user, text mining bisa memprediksi dokumen-dokumen lain yang menjadi perhatian/minat user tersebut.

Summarization (peringkasan) Summarization (peringkasan). Meringkas suatu dokumen untuk menghemat waktu dari sis si pembaca. Clustering. Mengelompokkan dokumen-dokumen yang mirip tanpa memiliki kategori yang sudah ditetapkan sebelumnya.

Concept linking. Menghubungkan berbagai dokumen terkait dengan mengidentifikasi konsep yang digunakan berbsama dan dengan demikian membantu para user untuk menemukan informasi yang barangkali mereka tidak akan temukan dengan menggunakan metode-metode pencarian tradisional. Question answering. Menemukan jawaban terbaik pada pertanyaan yang diberikan melalui pencocokan pola berbasis knowledge

Penerapan-penerapan Text Mining Penerapan Bidang Marketing Coussement dan Van den Poel (peneliti text mining) telah berhasil menerapkan text mining untuk meningkatkan secara signifikan kemampuan suatu model (text mining) untuk memprediksi loyalitas pelanggan (mislanya, pelanggan yang mau pindah ke kompetitor) sehingga pelanggan yang cenderung pindah ke kompetiror bisa diidentifikasi dengan akurat untuk menyiapkan berbagai taktik retensi.

Penerapan Bidang Keamanan Salah satu penerapan text mining yang terbesar dan paling terkenal dalam bidang keamanan barangkali adalah system pengawasan ECHELON yang sangat rahasia. Seperti rumornya, ECHELON dianggap mampu mengidentifikasi isi panggilan telepon, faks, email, dan jenis-jenis data lainnya, dengan mengambil informasi di tengah yang dikirim lewat satelit, jaringan telepon public, dan link microwave.

Penerapan text mining terkait bidang keamanan lainnya adalah bidang deteksi kebohongan. Dengan menerapkan text mining ke banyak data tentang pernyataan penjahat di dunia nyata, Fuller (peneliti text mining) telah mengembangkan model prediksi untuk membedakan pernyataan yang bohong dengan yang jujur.

Penerapa Bidang Akademik Isu tentang text mining merupakan hal yang sangat penting bagi para penerbit yang memiliki banyak database yang sangat besar tentang informasi yang memerlukan ‘indexing’ untuk pencarian informasi yang lebih baik. Hal ini memang betul dalam bidan ilmu pengetahuan, dimana informasi yang sangat khusus seringkali berada di dalam tulisan teks.

Berbagai Software Text Mining Software komersial ClearForest, IBM Intelligent Miner Data Mining Suite, Megaputer Text Analyst, SAS Text Miner, SPSS Text Mining for Clementine, The Statistica Text Mining , VantagePoint, The WordStat (analysis module dari Provalis Research) menganilsa informasi teks seperti berbagai response atau jawaban yang berasal dari berbagai pertanyaan terbuka, interview, dll.

Software Free GATE adalah piranti (toolkit) open source yang paling unggul untuk text mining. LingPipe adalah paket libari dari Java untuk analisa linguistic dari bahasa manusia S-EM (Spy-EM) adalah system klasifikasi teks yang belajar dari sampel-sampel yang positif dan tak-berlabel. Vivisimo/Clusty adalah mesin pencari web dan clustering teks

selesai