Aditi Agrawal1, Dr. A. J. Agrawal2

Slides:



Advertisements
Presentasi serupa
Konsep Dasar Sistem Temu Kembali Informasi
Advertisements

PENGANTAR TEKNOLOGI INFORMASI
Pembangunan / Pengembangan Sistem Informasi
Bagaimana Memanfaatkan Komputer dalam Pembelajaran?
DOKUMENTASI PROSES Mahendrawathi ER, Ph.D Purchasing Department
MERANGKUM SELURUH ISI INFORMASI TEKS BUKU KE DALAM BEBERAPA KALIMAT
Langkah-Langkah Dalam Proses Penelitian
Requirement.
Penilaian Relevansi Penilaian relevansi bertujuan untuk menentukan dokumen yang relevan (sesuai; cocok) dari antara sejumlah dokumen yang ditemukan (terpanggil)
Prototyping Aplikasi Teknologi Informasi
Proposal Penelitian (Langkah-Langkah)
SISTEM PAKAR & KECERDASAN BUATAN
Information Retrieval
Pengantar Teknologi Informasi Akuntansi Dan Solusi Bisnis
DOKUMENTASI PROSES Mahendrawathi ER, Ph.D Purchasing Department
E-Learning SMKN 2 Kediri
Final Project Temu Balik Informasi
Review Jurnal Nasional
Rifky Kurniawan, S.Kom, MTI
Temu Balik Informasi BY : Taufik Ari Arnandan ( )
Anggota Kelompok Dian Santosa (KETUA)
TEMU BALIK INFORMASI.
SEARCH ENGINE.
TEMU BALIK INFORMASI ANGGOTA KELOMPOK BAYU ANDRIANTO 21
Konsep dan Model-model Sistem Temu Balik Informasi
Anggota : Nama Nim Wahyu Septi Anjar Patria Adhyaksa Dian Restiani
Physical Database Design
Sistem Temu Kembali Informasi Multimedia
Proposal Penelitian Sri Hermawati.
TEMU BALIK INFORMASI Multimedia Dalam Temu Balik Informasi.
Konsep, Metode dan Model Temu Kembali Informasi
TEMU BALIK INFORMASI.
Review Jurnal Internasional
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
Temu Balik Informasi Materi Pertemuan Ke – 3 Stoplist dan Stemming
PERSPEKTIF DAN PROSPEKTIF SISTEM INFORMASI Pertemuan Minggu-2
Anggota Kelompok : Kurniawan Novi Pambudi
Review Jurnal Temu Balik Informasi
DOKUMENTASI PROSES Purchasing Department Manufacturing Department
PROTOTIPE (Berkerja dengan Model Pertama)
DOKUMENTASI PROSES Mahendrawathi ER, Ph.D Purchasing Department
Jaminan Mutu dalam Kebutuhan Rekayasa
Proses Design Interface (Perancangan Tampilan)
Pengenalan Microsoft Access
TEMU BALIK INFORMASI TI 14 A.
Pengantar Teknologi Informasi Akuntansi Dan Solusi Bisnis
Ir. Julio Adisantoso, M.Kom.
SISTEM PAKAR & KECERDASAN BUATAN
STOPWORDLIST dan STEMMING
DOKUMENTASI DAN KEARSIPAN KELAS A Sistem Temu Kembali Informasi
BAB 21 SISTEM INFORMASI MANAJEMEN
INTERAKSI MANUSIA DAN KOMPUTER
By bahrul ulumi SAINS.
Analisa [Kebutuhan] Sistem
Oleh : Rahmat Robi Waliyansyah, M.Kom.
DOKUMENTASI PROSES Mahendrawathi ER, Ph.D Purchasing Department
Sistem TEMU KEMBALI INFORMASI
Penilaian Relevansi Penilaian relevansi bertujuan untuk menentukan dokumen yang relevan (sesuai; cocok) dari antara sejumlah dokumen yang ditemukan (terpanggil)
CROSS LANGUAGE INFORMATION RETRIEVAL (CLIR)
KONSEP TEKNOLOGI INFORMASI
HAKIKAT MAKALAH Kelompok 3: DEVRIE ADITYA PURNAMA GINA ARTHA
Penggunaan Dimensi Belajar
SWASUNTING ARTIKEL ILMIAH untuk Publikasi
DOKUMENTASI PROSES Mahendrawathi ER, Ph.D Purchasing Department
SISTEM PAKAR & KECERDASAN BUATAN
Pengenalan Temu Balik Informasi.
SISTEM INFORMASI PENJUALAN BERBASIS WEB PADA PT. TRI ARJUNA DINAMIKA
SEARCH ENGINE.
REVIEW JURNAL ILMIAH / PAPER. TUJUAN REVIEW PAPER Tujuan dari review paper adalah untuk mempermudah dalam membahas inti dari hasil penelitian.
Cross-Language Information Retrieval (CLIR)
Transcript presentasi:

Aditi Agrawal1, Dr. A. J. Agrawal2 Perancangan Sistem Retrieval Informasi Lintas Bahasa menggunakan berbagai macamTeknik Query Expansion dan Indexing untuk PeningkatanKinerja Aditi Agrawal1, Dr. A. J. Agrawal2 1Student M.Tech, CSE Department, Shri Ramdeobaba College of Engineering and Management, Nagpur, India. 2 Professor, CSE Department, Shri Ramdeobaba College of Engineering and Management, Nagpur, India

Anggota kelompok : Dian Santosa 14.11.0134 (KETUA) Yayan Andriyana 14.11.0049 Taufik Hidayat N 14.11.0108 Khoerul Azni 14.11.0131 Agung Tri C 14.11.0132 Muhamad Margie A 14.11.0133 Rico Haviananto 12.11.- - - -

1. Introduction Dengan ledakan pengetahuan di web, jadilah diperlukan untuk memecahkan hambatan bahasa bagi IRSistem, CLIR mengisi celah penghalang linguistik dengan memungkinkan pengguna untuk mencari dokumen dalam bahasa yang berbeda dari pada kueri. Bahasa-bahasa India telah menjadi evaluasi penting baru-baru ini; Pengguna menginginkan informasi di bahasa negara asalnya. Di India, sekitar 70% orang mengenal bahasa Hindi sebagai bahasa utama sementara berdasarkan manusia baru-baru ini Survei pembangunan; Hanya ada 10,35% orang di India yaang berbicara bahasa inggris. Tujuan utama untuk mengembangkan Pendekatan baru dan melihat keterbatasan yang ada Pendekatannya untuk mengetahui semua informasi yang relevan dari CLIR dengan daya ingat yang lebih tinggi dan dengan jumlah tidak atau sangat sedikit Informasi yang tidak relevan diambil oleh kueri yang diberikan oleh pengguna.

2. Literature Review Makalah pertama adalah "Query Expansion for Cross Language Information Retrieval Improvement "yang ditulis oleh BenoitGaillard, Jean-Leon Bouraoui, Emilie Guimier de Neef danMalek Boualem di tahun 2010. Usulan makalah ini adalah untuk mengatasi masalah perbedaan antara terjemahkandata dan bahasa manusia yang disebabkan oleh terjemahan software dengan menggunakan Query Expansion (QE). QE terdiri darimenambahkan kata baru ke kueri awal. Syarat itu yang terkandung dalam query awal dicocokkan dengan dokumen.

Modul CLIR Modul CLIR: Modul CLIR menambahkan layanan terjemahan kemesin IR Model yang mendasari makalah ini melibatkan menerjemahkan isi sebelum mengindeksnya. Itu teks asli disimpan dalam memori mesin; Hanya terjemahan diindeks untuk menyajikan versi aslinya teks kepada pengguna.

Modul QE Ini didasarkan pada platform TiLT4. Tujuannya adalah untuk menyediakan, untuk istilah query, beberapa ekspansi yang sesuai istilah. Ini bisa melakukan QE sesuai lima mode. Itu sistem melakukan tugas pencarian melalui dokumen dan mengindeksnya. Ini menerima pertanyaan sederhana namun juga kompleks.

Literature Review Jurnal review kedua adalah "Enhanced Query Expansion di CLIR Inggris-Arab "yang ditulis oleh Abdelghani Bellaachia dan Ghita Amor- Tijani di Tahun 2008. Makalah tersebut mengatakan bahwa Query Ekspansi terbukti efektif. Menggunakan bagian atas diambil mendokumentasikan konsep kueri ditingkatkan dengan menambahkan ke konteksnya terkait istilahnya. . Efektivitas optimal bisa dicapai dengan menerapkan Disambiguasi. Menggunakan DQE Teknik, Pendekatan QE ditingkatkan dengan ujiauran disambiguasi, diadili atas dasar pertimbangan bahwa tidak semua persyaratan yang diperluas tentu saja terkait dengan kueri. Kata-kata yang saling terkait dengan kueri istilah dalam set dokumen peringkat teratas ditambahkan ke kueri yang diterjemahkan menggunakan QE.

Gambar-1: Grafik Rekor Presisi Mono, DQE, QE, eQE, dan eDQE Berjalan. (Rujukan Gambar: - "Ekspansi Permintaan yang Disempurnakan dalam Bahasa InggrisBrabic CLIR" yang ditulis oleh Abdelghani Bellaachia dan Ghita Amor-Tijani di Tahun 2008.)

Literature Review Makalah review ketiga adalah "Sistem Retrieval Informasi Lintas Bahasa Inggris untuk Bahasa Hindi" Penulis Vivek Pemawat, Abhinav Saund dan Anupam Agrawal yang ditulis pada tahun 2010, Makalah ini membahas tentang sistem yang dikembangkan untuk CLIR. Dokumen dan gambar untuk pemrosesan kueri berhubungan dengan museum Allahabad. Bahasa yang digunakan adalah bahasa Hindi dan bahasa Inggris. Dokumen-dokumen itu disimpan dalam bahasa Inggris. Pengguna memiliki pilihan untuk memasukkan kata kunci kueri dalam bahasa Hindi atau Inggris. Sistem mengambil dokumen yang relevan dan menampilkannya dalam bahasa yang diinginkan. Pengguna bisa mendapatkan informasi yang relevan dari dokumen yang dalam format teks bebas.

Literature Review Makalah keempat adalah "Retrieval Informasi Lintas Bahasa: Perspektif Bahasa Indonesia" yang ditulis oleh Penulis Pratibha Bajpai dan Parul Verma pada Tahun 2014. Melalui kajian paper ini, karya yang dilakukan di bidang bahasa India oleh berbagai peneliti untuk sistem CLIR disediakan. Analisis pendekatan CLIR untuk bahasa- bahasa India: Tabel menganalisis kinerja berbagai metode yang digunakan oleh peneliti untuk bahasa-bahasa India.

3. PERNYATAAN PROBLEM Diskusi Kini, Retribusi Informasi Lintas Bahasa telah menjadi bagian yang krusial. Pengguna ingin membaca dokumen dalam bahasa yang paling mereka pahami. Oleh karena itu, kami perlu mengembangkan pendekatan ini untuk memberikan hasil yang akurat dan lebih baik. Khusus untuk bahasa Hindi tidak banyak pekerjaan yang telah dilakukan dan ada banyak keterbatasan dengan pendekatan yang diajukan.

Masalah Sistem CLIR yang ada untuk bahasa Hindi Inggris memiliki beberapa keterbatasan berikut Terjemahan Disambiguasi Masalah Out-of-Kosakata Menerjemahkan frasa entitas bernama Dalam sistem kami, kami akan mencoba mengembangkan sistem untuk CLIR yang akan mengatasi keterbatasan yang ada dan memberikan hasil yang lebih baik.

4. PENDEKATAN YANG DIUSULKAN Proyek ini terbagi dalam dua bagian First Processing the query dan second Building the Index. Sistem ini akan mencakup kamus berdasarkan domain tertentu. Modul pertama terdiri dari indeks yang berisi kata-kata bahasa Inggris dan kata-kata dan hubungan Hindi yang sesuai. Kami akan memetakan indeks dengan cara yang dokumen yang akan diambil akurat Dokumen akan diproses dan disimpan dalam indeks.

5. KESIMPULAN Untuk query input untuk domain tertentu dalam bahasa Hindi atau Inggris, dokumen akan diambil. Dokumennya bisa berbahasa Inggris dan bahasa Hindi. Skor untuk indeks individu akan dihitung dengan menggunakan tf-idf dan jumlah skor akan disimpan dalam tabel skor okumen. Kueri yang diproses akan diberikan sebagai indeks ke mana indeks Hindi ke Inggris berada tersedia dokumen id yang akan didapat dan dokumen bisa diambil dari tabel skor tergantung skor Hindi English word count akan digunakan untuk ranking dokumen. Precision dan Recall akan digunakan sebagai akurasilangkah- langkah untuk mengevaluasi sistem.

Daftar Pustaka 6. REFERENCES [1] Pratibha Bajpai, Parul Verma “Cross Language Information Retrieval: In Indian Language Perspective” International Journal of Research in Engineering and Technology (IJRET) Jun-2014. [2] Benoit Gaillard, Jean-Leon Bouraoui, Emilie Guimier de Neef, Malek Boualem “Query Expansion for Cross Language Information Retrieval Improvement” 2010 IEEE [3] Vivek Pemawat, Abhinav Saund, Anupam Agrawal “Hindi - English Based Cross Language Information Retrieval System for Allahabad Museum” 2010 International Conference on Signal and Image Processing [4] Abdelghani Bellaachia and Ghita Amor-Tijani “Enhanced Query Expansion in English-Arabic CLIR” 19th international conference of database and expert systemapplication.