Aditi Agrawal1, Dr. A. J. Agrawal2

Aditi Agrawal1, Dr. A. J. Agrawal2
Perancangan Sistem Retrieval Informasi Lintas Bahasa menggunakan berbagai macamTeknik Query Expansion dan Indexing untuk PeningkatanKinerja Aditi Agrawal1, Dr. A. J. Agrawal2 1Student M.Tech, CSE Department, Shri Ramdeobaba College of Engineering and Management, Nagpur, India. 2 Professor, CSE Department, Shri Ramdeobaba College of Engineering and Management, Nagpur, India

Anggota kelompok : Dian Santosa 14.11.0134 (KETUA)
Yayan Andriyana Taufik Hidayat N Khoerul Azni Agung Tri C Muhamad Margie A Rico Haviananto

1. Introduction Dengan ledakan pengetahuan di web, jadilah diperlukan untuk memecahkan hambatan bahasa bagi IRSistem, CLIR mengisi celah penghalang linguistik dengan memungkinkan pengguna untuk mencari dokumen dalam bahasa yang berbeda dari pada kueri. Bahasa-bahasa India telah menjadi evaluasi penting baru-baru ini; Pengguna menginginkan informasi di bahasa negara asalnya. Di India, sekitar 70% orang mengenal bahasa Hindi sebagai bahasa utama sementara berdasarkan manusia baru-baru ini Survei pembangunan; Hanya ada 10,35% orang di India yaang berbicara bahasa inggris. Tujuan utama untuk mengembangkan Pendekatan baru dan melihat keterbatasan yang ada Pendekatannya untuk mengetahui semua informasi yang relevan dari CLIR dengan daya ingat yang lebih tinggi dan dengan jumlah tidak atau sangat sedikit Informasi yang tidak relevan diambil oleh kueri yang diberikan oleh pengguna.

2. Literature Review Makalah pertama adalah "Query Expansion for Cross Language Information Retrieval Improvement "yang ditulis oleh BenoitGaillard, Jean-Leon Bouraoui, Emilie Guimier de Neef danMalek Boualem di tahun Usulan makalah ini adalah untuk mengatasi masalah perbedaan antara terjemahkandata dan bahasa manusia yang disebabkan oleh terjemahan software dengan menggunakan Query Expansion (QE). QE terdiri darimenambahkan kata baru ke kueri awal. Syarat itu yang terkandung dalam query awal dicocokkan dengan dokumen.

Modul CLIR Modul CLIR: Modul CLIR menambahkan layanan terjemahan kemesin IR Model yang mendasari makalah ini melibatkan menerjemahkan isi sebelum mengindeksnya. Itu teks asli disimpan dalam memori mesin; Hanya terjemahan diindeks untuk menyajikan versi aslinya teks kepada pengguna.

Modul QE Ini didasarkan pada platform TiLT4. Tujuannya adalah untuk menyediakan, untuk istilah query, beberapa ekspansi yang sesuai istilah. Ini bisa melakukan QE sesuai lima mode. Itu sistem melakukan tugas pencarian melalui dokumen dan mengindeksnya. Ini menerima pertanyaan sederhana namun juga kompleks.

Literature Review Jurnal review kedua adalah "Enhanced Query Expansion di CLIR Inggris-Arab "yang ditulis oleh Abdelghani Bellaachia dan Ghita Amor- Tijani di Tahun Makalah tersebut mengatakan bahwa Query Ekspansi terbukti efektif. Menggunakan bagian atas diambil mendokumentasikan konsep kueri ditingkatkan dengan menambahkan ke konteksnya terkait istilahnya. . Efektivitas optimal bisa dicapai dengan menerapkan Disambiguasi. Menggunakan DQE Teknik, Pendekatan QE ditingkatkan dengan ujiauran disambiguasi, diadili atas dasar pertimbangan bahwa tidak semua persyaratan yang diperluas tentu saja terkait dengan kueri. Kata-kata yang saling terkait dengan kueri istilah dalam set dokumen peringkat teratas ditambahkan ke kueri yang diterjemahkan menggunakan QE.

Gambar-1: Grafik Rekor Presisi Mono, DQE, QE, eQE, dan eDQE Berjalan.
(Rujukan Gambar: - "Ekspansi Permintaan yang Disempurnakan dalam Bahasa InggrisBrabic CLIR" yang ditulis oleh Abdelghani Bellaachia dan Ghita Amor-Tijani di Tahun 2008.)

Literature Review Makalah review ketiga adalah "Sistem Retrieval Informasi Lintas Bahasa Inggris untuk Bahasa Hindi" Penulis Vivek Pemawat, Abhinav Saund dan Anupam Agrawal yang ditulis pada tahun 2010, Makalah ini membahas tentang sistem yang dikembangkan untuk CLIR. Dokumen dan gambar untuk pemrosesan kueri berhubungan dengan museum Allahabad. Bahasa yang digunakan adalah bahasa Hindi dan bahasa Inggris. Dokumen-dokumen itu disimpan dalam bahasa Inggris. Pengguna memiliki pilihan untuk memasukkan kata kunci kueri dalam bahasa Hindi atau Inggris. Sistem mengambil dokumen yang relevan dan menampilkannya dalam bahasa yang diinginkan. Pengguna bisa mendapatkan informasi yang relevan dari dokumen yang dalam format teks bebas.

Literature Review Makalah keempat adalah "Retrieval Informasi Lintas Bahasa: Perspektif Bahasa Indonesia" yang ditulis oleh Penulis Pratibha Bajpai dan Parul Verma pada Tahun Melalui kajian paper ini, karya yang dilakukan di bidang bahasa India oleh berbagai peneliti untuk sistem CLIR disediakan. Analisis pendekatan CLIR untuk bahasa- bahasa India: Tabel menganalisis kinerja berbagai metode yang digunakan oleh peneliti untuk bahasa-bahasa India.

3. PERNYATAAN PROBLEM Diskusi Kini, Retribusi Informasi Lintas Bahasa telah menjadi bagian yang krusial. Pengguna ingin membaca dokumen dalam bahasa yang paling mereka pahami. Oleh karena itu, kami perlu mengembangkan pendekatan ini untuk memberikan hasil yang akurat dan lebih baik. Khusus untuk bahasa Hindi tidak banyak pekerjaan yang telah dilakukan dan ada banyak keterbatasan dengan pendekatan yang diajukan.

Masalah Sistem CLIR yang ada untuk bahasa Hindi Inggris memiliki beberapa keterbatasan berikut Terjemahan Disambiguasi Masalah Out-of-Kosakata Menerjemahkan frasa entitas bernama Dalam sistem kami, kami akan mencoba mengembangkan sistem untuk CLIR yang akan mengatasi keterbatasan yang ada dan memberikan hasil yang lebih baik.

4. PENDEKATAN YANG DIUSULKAN
Proyek ini terbagi dalam dua bagian First Processing the query dan second Building the Index. Sistem ini akan mencakup kamus berdasarkan domain tertentu. Modul pertama terdiri dari indeks yang berisi kata-kata bahasa Inggris dan kata-kata dan hubungan Hindi yang sesuai. Kami akan memetakan indeks dengan cara yang dokumen yang akan diambil akurat Dokumen akan diproses dan disimpan dalam indeks.

5. KESIMPULAN Untuk query input untuk domain tertentu dalam bahasa Hindi atau Inggris, dokumen akan diambil. Dokumennya bisa berbahasa Inggris dan bahasa Hindi. Skor untuk indeks individu akan dihitung dengan menggunakan tf-idf dan jumlah skor akan disimpan dalam tabel skor okumen. Kueri yang diproses akan diberikan sebagai indeks ke mana indeks Hindi ke Inggris berada tersedia dokumen id yang akan didapat dan dokumen bisa diambil dari tabel skor tergantung skor Hindi English word count akan digunakan untuk ranking dokumen. Precision dan Recall akan digunakan sebagai akurasilangkah- langkah untuk mengevaluasi sistem.

Daftar Pustaka 6. REFERENCES [1] Pratibha Bajpai, Parul Verma “Cross Language Information Retrieval: In Indian Language Perspective” International Journal of Research in Engineering and Technology (IJRET) Jun [2] Benoit Gaillard, Jean-Leon Bouraoui, Emilie Guimier de Neef, Malek Boualem “Query Expansion for Cross Language Information Retrieval Improvement” 2010 IEEE [3] Vivek Pemawat, Abhinav Saund, Anupam Agrawal “Hindi - English Based Cross Language Information Retrieval System for Allahabad Museum” 2010 International Conference on Signal and Image Processing [4] Abdelghani Bellaachia and Ghita Amor-Tijani “Enhanced Query Expansion in English-Arabic CLIR” 19th international conference of database and expert systemapplication.

Aditi Agrawal1, Dr. A. J. Agrawal2

Presentasi serupa

Presentasi berjudul: "Aditi Agrawal1, Dr. A. J. Agrawal2"— Transcript presentasi:

Presentasi serupa

Tentang proyek

Tanggapan

Masuk

Otorisasi melalui jaringan sosial:

Aditi Agrawal1, Dr. A. J. Agrawal2

Presentasi serupa

Presentasi berjudul: "Aditi Agrawal1, Dr. A. J. Agrawal2"— Transcript presentasi:

Presentasi serupa

Tentang proyek

Tanggapan