Langkah Praktis Membangun Sistem Pengenalan Suara dengan HTK

Zulkarnaen Hatala

doi:10.36085/jsai.v2i2.314

Authors

Zulkarnaen Hatala Politeknik Negeri Ambon

DOI:

https://doi.org/10.36085/jsai.v2i2.314

Abstract

Dipaparkan prosedur untuk mengembangkan Sistem Pengenalan Suara otomatis, Automatic Speech Recognition System (ASR) untuk kasus online recognition. Prosedur ini Â secara cepat dan efisien membangun ASR menggunakan Hidden Markov Toolkit (HTK). Langkah-langkah praktis ini dipaparkan secara jelas untuk mengimplementasikan ASR dengan daftar kata sedikit (Small Vocabulary) dalam contoh kasus pengenalan digit Bahasa Indonesia. Dijelaskan beberapa teknik meningkatkan performansi seperti cara mengatasi noise, pengejaan ganda dan penerapan Principle Component Analysis. Hasil akhir berupa Word Error Rate

Author Biography

Zulkarnaen Hatala, Politeknik Negeri Ambon

Jurusan Teknik Elektro

References

S. Young, E. Gunnar, G. Mark, T. Hain, and D. Kershaw, â€œThe HTK Book version 3.5 alpha,â€ Cambridge University, 2015.

C. D. Soderberg and K. S. Olson, â€œIllustration of the IPA: Indonesian,â€ J. Int. Phon. Assoc., vol. 38, no. 2, pp. 209â€“213, 2008.

C. Lopes and F. PerdigÃ£o, â€œPhone Recognition on the TIMIT Database,â€ 2009.

K. Lee and H.-W. Hon, â€œSpeaker-Independent Phone Recognition Using Hidden Markov Models,â€ IEEE Trans. Acoust., vol. 37, no. 11, pp. 1641â€“1648, 1989.

M. A. Huckvale, D. M. Brookes, L. T. Dworkin, M. E. Johnson, D. J. Pearce, and L. Whitaker, â€œThe SPAR Speech Filing System,â€ Eur. Conf. Speech Technol., pp. 305â€“308, 1987.

P. Boersma and V. van Heuven, â€œSpeak and unSpeak with Praat,â€ Glot Int., vol. 5, no. 9â€“10, pp. 341â€“347, 2001.

K. John and A. W. Black, â€œThe CMU ARCTIC Speech Databases,â€ in 5th ICSA Speech Synthesis Workshop - Pittsburg, 2004, pp. 223â€“224.

S. B. Davis and P. Mermelstein, â€œComparison of Parametric Representations for Monosyllabic Word Recognition in Continuously Spoken Sentences,â€ IEEE Trans. Acoust., vol. 28, no. 4, pp. 357â€“366, 1980.

L. I. Smith, â€œA tutorial on Principal Components Analysis,â€ 2002.

T. Takiguchi and Y. Ariki, â€œPCA-Based Speech Enhancement for Distorted Speech Recognition,â€ J. Multimed., vol. 2, no. 5, pp. 13â€“18, 2007.

L. R. Rabiner, â€œA Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition,â€ Proc. IEEE, vol. 77, no. 2, 1989.

Langkah Praktis Membangun Sistem Pengenalan Suara dengan HTK

Authors

DOI:

Abstract

Author Biography

Zulkarnaen Hatala, Politeknik Negeri Ambon

References

Downloads

Published

Issue

Section

Menu