Praktikum Speech Processing

Slides:



Advertisements
Presentasi serupa
start Search Mozilla My Computer Getaran pada pendulum
Advertisements

Membuat resume dari artikel
Aplikasi Kuliah Online dengan Penerapan Live Video Conferencing dan Streaming Berbasis Komponen dengan Visual Basic 6.0 Rinanda Rianti
Kompresi JPEG,MPEG, dan Video Streaming
STRATEGI BELAJAR EFEKTIF
Daniel Richard Andriessen S1 Sistem Komputer
Jaringan Komputer Dasar Transmisi Data.
KANTOR MAYA (VIRTUAL OFFICE)
Pengantar Sinyal dan Rangkaian
Apakah Otomatisasi Kantor ?
Wiwied isti nursyah 31 XI TKJ
Form.
MENGOPERASIKAN PERALATAN REKAM Kompetensi : Membuat Rekaman Audio Di Studio.
Teknologi Informasi.
Teori Konvolusi dan Fourier Transform
VISION.
Pengenalan AULA Tim e-Learning LP3UA
Basics in Telecommunication Technology. The fundamental problem of communication is that of reproducing at one point either exactly or approximately a.
Aplikasi pengenalan ucapan kata bahasa inggris menggunakan linear predictive coding (lpc) dan hidden markov model (hmm) OLEH : JUNIAR LESTARY.
Digital Signal Processing (DSP)
Perancangan umum Sistem Informasi
SPEAKER Oleh: Dinor Kahfi ( )
Digital Image Processing
Tugas bahasa indonesia 2 universitas gunadarma
Bab #2 – Dasar Transmisi Sinyal
SPEECH PROCESSING.
ALHURIYAH :Aplikasi Pengenalan Huruf Hijaiyah Berbasis speech recognition Menggunakan Mel Frequency Cepstral Coefficients (MFCC) Kelompok 10 Dian.
Elektronika Digital Data analog, suatu besaran dinyatakan di dalam angka desimal, suatu sistem bilangan yang terdiri dari angka nol sampai sembilan. Data.
Dasar Audio Processing
Penggalian Kebutuhan; Modul Elisitasi
Intro Kelas Sistem Multimedia.
Proses Pembentukan dan Karakteristik Sinyal Ucapan
PENGOLAHAN SINYAL DIGITAL (PSD)
Interaksi Manusia & Komputer Audio dan Agent
SISTEM AUDIO DAN VIDEO.
SISTEM AUDIO DAN VIDEO.
Praktikum Video Processing
Praktek Audio Processing
LANGKAH-LANGKAH BELANJA BARANG Bulan Juni 2015 & Update Aplikasi
MENGOPERASIKAN PERALATAN REKAM
Dasar Audio Processing
Kompetensi : Membuat Rekaman Audio Di Studio
Spektrum dan Domain Sinyal
Sinyal Suara Kelompok 1 Risky Radjamuda Supardi Jamali
Analisis dan Perancangan Sistem Informasi Erik Kurniadi
Speech Processing.
Mata Praktikum Pemrograman WEB
Pengenalan Jenis Kelamin Melalui Suara Menggunakan MFCC dan K-Means
Analog dan Digital.
Praktikum Speech Processing
Praktikum Speech Processing
KONVOLUSI DAN TRANSFORMASI FOURIER
SISTEM PAKAR BERBASIS WEB DALAM TROUBLESHOOTING PADA JARINGAN NIRKABEL
Animasi dan Suara Pertemuan 02
Sinyal Analog dan Digital
ANALISA DAN PERANCANGAN
Pengantar teknologi informasi
FAKTOR MANUSIA.
Apakah Otomatisasi Kantor ?
Nama : SUPRIANSYAH NIM :
Bab #2 – Dasar Transmisi Sinyal
Komunikasi Data Transmisi Data.
Apakah Otomatisasi Kantor ?
RANGKAIAN DIGITAL ENCODER & Decoder.
Apakah Otomatisasi Kantor ?
Pemrograman Terstruktur
Oleh : Rahmat Robi Waliyansyah, M.Kom
Apakah Otomatisasi Kantor ?
William Stallings Data and Computer Communications
Teknologi Pengolahan signal pada kedokteran gigi Militer Dipresentasikan untuk IPADOGIMIL Bandung, 5 Juli 2019 Oleh : Ketua Peneliti : Dr. Ir. Bambang.
Transcript presentasi:

Praktikum Speech Processing

Petunjuk Praktikum Praktikum terdiri dari 6 modul. Dilaksanakan dalam waktu 120 menit. Akses kontribusi Speech Processing pada MathWorks dengan link : https://www.mathworks.com/matlabcentral/profile/authors/4428430-speech-processing Simulasi Speech processing di atas didesain oleh tim yang terdiri dari rof. Lawrence Rabiner (Rutgers University and University of California, Santa Barbara), Prof. Ronald Schafer (Stanford University), Kirty Vedula dan Siva Yedithi (Rutgers University). Simulasi ini ditujukan untuk mensuplemen kuliah Digital Speech Processing yang diampu oleh L R Rabiner and R W Schafer. Selesai praktikum, Buat laporan, kirim ke casie.sn@gmail.com dengan subject PRAKSISMUL_[KELAS]. Yang perlu dianalisis : Apa tujuan dari program tersebut? Bagaimana cara kerja program tersebut? Bagaimana output dari program tersebut untuk input audio yang berbeda-beda??

Modul 1 Speech Files Download Speech Files untuk mendapat sekumpulan file speech, atau rekam file audio sendiri.

Modul 2 Spectrogram Download file simulasi “Spectrogram” dari Team Speech Processing Simulasikan. Apa yang dimaksud dengan Spectrogram? Jelaskan hasil dari spectogram untuk 3 buah file speech yang berbeda.

Modul 3 Three Tube Vocal Tract Download file simulasi “Three Tube Vocal Tract” dari Team Speech Processing Simulasikan untuk 4 konfigurasi length of tube di samping ini. Catat frekuensi formant untuk masing-masing konfigurasi. Diameter kecil : 1 cm. Diameter besar : 5 cm Jelaskan dan Analisis hasilnya.

Modul 4 Formant Estimation Download file simulasi “Formant Estimation” dari Team Speech Processing Ambil rekaman suara “aiueo” dari praktikum audio processing sebelumnya. Simulasikan file audio “aiueo” dengan menggunakan formant estimation. Catat nilai-nilai frekuensi formant estimation untuk masing2 vokal “a”, “i” “u”, “e”, “o”. Bandingkan dengan tabel di samping ini. Apa yang dimaksud dengan formant? Jelaskan dan Analisis hasilnya.

Modul 5 Pitch Detector Download file simulasi “Play Pitch Period Contour” dari Team Speech Processing (atau simulasi pitch detector lainnya). Simulasikan untuk 4 buah file audio yang berbeda. Apa yang dimaksud dengan pitch? Jelaskan dan analisis hasilnya.

Modul 6 Endpoint Detector Download file simulasi “Endpoint Detector” dari Team Speech Processing (atau simulasi pitch detector lainnya). Simulasikan untuk 4 buah file audio (yang terdiri dari >2 rekaman kata) yang berbeda. Endpoint detector dapat digunakan untuk aplikasi speech processing apa saja? Bagaimana program mendeteksi endpoint? Jelaskan dan analisis hasilnya.

Pembahasan

Modul 2 Spectrogram Three Spectrogram adalah representasi visual dari spektrum frekuensi dari suara/sinyal yang berubah terhadap waktu (atau variable lain). Frekuensi rendah lebih tebal karena ini adalah suara pria. Kenaikan intensitas warna menunjukkan kenaikan kepadatan frekuensi. Two One

Modul 3 Three Tube Vocal Tract 1 2 Bandingkan Range Formant-nya 3 4

Modul 4 Formant Estimation Formant adalah frekuensi-frekuensi resonansi yang keluar dari vocal tract.

Modul 4 Formant Estimation

Modul 5 Pitch Detector Pitch adalah frekuensi vibrasi (frekuensi fundamental saat vibrasi diproduksi, satuan Hz) Six Seven Eight Nine

Modul 6 Endpoint Detector Program mencari bagian dari audio yang terdiri dari periode sinyal background, diikuti periode ucapan. Analisis dilakukan berbasis frame-to-frame, kemudian dihitung himpunan log energi waktu pendek. Setelah itu program menentukan frame mana yang terbaik dari awal ucapan sampai akhir ucapan. Endpoint detector dapat digunakan untuk speech recognition dan speech-to-text.