Praktikum Speech Processing

Slides:

Advertisements

Presentasi serupa

start Search Mozilla My Computer Getaran pada pendulum

Advertisements

Membuat resume dari artikel

Aplikasi Kuliah Online dengan Penerapan Live Video Conferencing dan Streaming Berbasis Komponen dengan Visual Basic 6.0 Rinanda Rianti

Kompresi JPEG,MPEG, dan Video Streaming

STRATEGI BELAJAR EFEKTIF

Daniel Richard Andriessen S1 Sistem Komputer

Jaringan Komputer Dasar Transmisi Data.

KANTOR MAYA (VIRTUAL OFFICE)

Pengantar Sinyal dan Rangkaian

Apakah Otomatisasi Kantor ?

PEMODELAN SISTEM PENGOLAHAN MANUSIA

Wiwied isti nursyah 31 XI TKJ

MENGOPERASIKAN PERALATAN REKAM Kompetensi : Membuat Rekaman Audio Di Studio.

Teori Konvolusi dan Fourier Transform

Pengenalan AULA Tim e-Learning LP3UA

Basics in Telecommunication Technology. The fundamental problem of communication is that of reproducing at one point either exactly or approximately a.

Aplikasi pengenalan ucapan kata bahasa inggris menggunakan linear predictive coding (lpc) dan hidden markov model (hmm) OLEH : JUNIAR LESTARY.

Digital Signal Processing (DSP)

Perancangan umum Sistem Informasi

SPEAKER Oleh: Dinor Kahfi ( )

Digital Image Processing

Tugas bahasa indonesia 2 universitas gunadarma

Bab #2 – Dasar Transmisi Sinyal

SPEECH PROCESSING.

ALHURIYAH :Aplikasi Pengenalan Huruf Hijaiyah Berbasis speech recognition Menggunakan Mel Frequency Cepstral Coefficients (MFCC) Kelompok 10 Dian.

Elektronika Digital Data analog, suatu besaran dinyatakan di dalam angka desimal, suatu sistem bilangan yang terdiri dari angka nol sampai sembilan. Data.

Dasar Audio Processing

Penggalian Kebutuhan; Modul Elisitasi

Intro Kelas Sistem Multimedia.

Proses Pembentukan dan Karakteristik Sinyal Ucapan

PENGOLAHAN SINYAL DIGITAL (PSD)

Interaksi Manusia & Komputer Audio dan Agent

SISTEM AUDIO DAN VIDEO.

SISTEM AUDIO DAN VIDEO.

Praktikum Video Processing

Praktek Audio Processing

LANGKAH-LANGKAH BELANJA BARANG Bulan Juni 2015 & Update Aplikasi

MENGOPERASIKAN PERALATAN REKAM

Dasar Audio Processing

Kompetensi : Membuat Rekaman Audio Di Studio

Spektrum dan Domain Sinyal

Sinyal Suara Kelompok 1 Risky Radjamuda Supardi Jamali

Speech Processing.

Mata Praktikum Pemrograman WEB

Pengenalan Jenis Kelamin Melalui Suara Menggunakan MFCC dan K-Means

Analog dan Digital.

Praktikum Speech Processing

KONVOLUSI DAN TRANSFORMASI FOURIER

SISTEM PAKAR BERBASIS WEB DALAM TROUBLESHOOTING PADA JARINGAN NIRKABEL

Praktikum Pemrograman Dasar

Praktikum Speech Processing

Praktikum TEKNIK DIGITAL MODUL 2

Animasi dan Suara Pertemuan 02

Sinyal Analog dan Digital

ANALISA DAN PERANCANGAN

Pengantar teknologi informasi

FAKTOR MANUSIA.

Apakah Otomatisasi Kantor ?

Nama : SUPRIANSYAH NIM :

Bab #2 – Dasar Transmisi Sinyal

Komunikasi Data Transmisi Data.

Apakah Otomatisasi Kantor ?

RANGKAIAN DIGITAL ENCODER & Decoder.

Apakah Otomatisasi Kantor ?

Pemrograman Terstruktur

Oleh : Rahmat Robi Waliyansyah, M.Kom

Apakah Otomatisasi Kantor ?

William Stallings Data and Computer Communications

Teknologi Pengolahan signal pada kedokteran gigi Militer Dipresentasikan untuk IPADOGIMIL Bandung, 5 Juli 2019 Oleh : Ketua Peneliti : Dr. Ir. Bambang.

Transcript presentasi:

Praktikum Speech Processing

Petunjuk Praktikum Praktikum terdiri dari 6 modul. Dilaksanakan dalam waktu 120 menit. Akses kontribusi Speech Processing pada MathWorks dengan link : https://www.mathworks.com/matlabcentral/profile/authors/4428430-speech-processing Simulasi Speech processing di atas didesain oleh tim yang terdiri dari rof. Lawrence Rabiner (Rutgers University and University of California, Santa Barbara), Prof. Ronald Schafer (Stanford University), Kirty Vedula dan Siva Yedithi (Rutgers University). Simulasi ini ditujukan untuk mensuplemen kuliah Digital Speech Processing yang diampu oleh L R Rabiner and R W Schafer. Selesai praktikum, Buat laporan, kirim ke anbarsanti@yahoo.com paling lambat pukul 23:59. Yang perlu dianalisis : Apa tujuan dari program tersebut? Bagaimana cara kerja program tersebut? Bagaimana output dari program tersebut untuk input audio yang berbeda-beda??

Modul 1 Speech Files Download Speech Files untuk mendapat sekumpulan file speech, atau rekam file audio sendiri.

Modul 2 Spectrogram Download file simulasi “Spectrogram” dari Team Speech Processing Simulasikan. Apa yang dimaksud dengan Spectrogram? Jelaskan hasil dari spectogram untuk 3 buah file speech yang berbeda.

Modul 3 Three Tube Vocal Tract Download file simulasi “Three Tube Vocal Tract” dari Team Speech Processing Simulasikan untuk 4 konfigurasi length of tube di samping ini. Catat frekuensi formant untuk masing-masing konfigurasi. Diameter kecil : 1 cm. Diameter besar : 5 cm Jelaskan dan Analisis hasilnya.

Modul 4 Formant Estimation Download file simulasi “Formant Estimation” dari Team Speech Processing Ambil rekaman suara “aiueo” dari praktikum audio processing sebelumnya. Simulasikan file audio “aiueo” dengan menggunakan formant estimation. Catat nilai-nilai frekuensi formant estimation untuk masing2 vokal “a”, “i” “u”, “e”, “o”. Bandingkan dengan tabel di samping ini. Apa yang dimaksud dengan formant? Jelaskan dan Analisis hasilnya.

Modul 5 Pitch Detector Download file simulasi “Play Pitch Period Contour” dari Team Speech Processing (atau simulasi pitch detector lainnya). Simulasikan untuk 4 buah file audio yang berbeda. Apa yang dimaksud dengan pitch? Jelaskan dan analisis hasilnya.

Modul 6 Endpoint Detector Download file simulasi “Endpoint Detector” dari Team Speech Processing (atau simulasi pitch detector lainnya). Simulasikan untuk 4 buah file audio (yang terdiri dari >2 rekaman kata) yang berbeda. Endpoint detector dapat digunakan untuk aplikasi speech processing apa saja? Bagaimana program mendeteksi endpoint? Jelaskan dan analisis hasilnya.

Pembahasan

Modul 2 Spectrogram Three Spectrogram adalah representasi visual dari spektrum frekuensi dari suara/sinyal yang berubah terhadap waktu (atau variable lain). Frekuensi rendah lebih tebal karena ini adalah suara pria. Kenaikan intensitas warna menunjukkan kenaikan kepadatan frekuensi. Two One

Modul 3 Three Tube Vocal Tract 1 2 Bandingkan Range Formant-nya 3 4

Modul 4 Formant Estimation Formant adalah frekuensi-frekuensi resonansi yang keluar dari vocal tract.

Modul 4 Formant Estimation

Modul 5 Pitch Detector Pitch adalah frekuensi vibrasi (frekuensi fundamental saat vibrasi diproduksi, satuan Hz) Six Seven Eight Nine

Modul 6 Endpoint Detector Program mencari bagian dari audio yang terdiri dari periode sinyal background, diikuti periode ucapan, diikuti periode sinyal background. Analisis dilakukan berbasis frame-to-frame, kemudian dihitung himpunan log energi waktu pendek. Setelah itu program menentukan frame mana yang terbaik dari awal ucapan sampai akhir ucapan. Endpoint detector dapat digunakan untuk speech recognition dan speech-to-text.