Pengenalan Pola Fonem Vokal menggunakan Short Time Fourier Transform (STFT) dan Fitur Mel Frequency Cepstral Coefficient (MFCC)
DOI:
https://doi.org/10.54914/jtt.v7i1.298Kata Kunci:
klasifikasi fonem, fonem vokal, STFT, MFCCAbstrak
Fonem adalah bagian yang menyusun semua bahasa lisan. Setiap kata dan kalimat yang diutarakan terdiri dari satu fonem atau lebih. Untuk meningkatkan akurasi dari model akustik, peneliti mencoba mengidentifikasi pola fonem vokal dalam bahasa Indonesia menggunakan STFT dan Fitur MFCC. Dalam penelitian ini, peneliti menganalisis data dari 398 file suara yang bersumber dari 51 orang partisipan dan mengeksplorasi perbedaan pola dari fonem vokal a,i,u,e,o. Dengan menggunakan SVM dan JST, fitur tersebut diklasifikasikan dan diuji. Hasil pengujian memberikan akurasi 93,8% menggunakan SVM dengan kernel radial.
Unduhan
Referensi
N. K. b. A. M. R. Alim Sabur Ajibola, "Some Commonly Used Speech Feature Extraction Algorithms," 2018.
N. v. d. Velde, 25 October 2018. [Online]. Available: https://www.globalme.net/blog/speech-recognition-software-history-future/.
G. L. Song Wang, "Overview of End-To-End Speech Recognition," in Journal of Physics: Conference Series, 2019.
J. Verhaar, "Asas-Asas Linguistik Umum," Yogyakarta: UGM Press, 1996.
Marsono, "Fonetik," Yogyakarta: UGM Press, 1986.
R. W. Primasari Wahyuni, "Kajian Fonetik Bunyi Vokal Bahasa Indonesia oleh Penutur Bahasa Indonesia di Wilayah Timur," in PIBSI XXXIX, Semarang, 2017.
N. Kehtarnavaz, "Frequency Domain Processing," in Digital Signal Processing System Design (Second Edition), Academic Press, 2008.
W. A. Sethares, "Rhythm and Transforms, Perception and Mathematics," 2007.
V. T. Urmila Shrawankar, "Techniques for Feature Extraction In Speech Recognition System: A Comparative Study," 2013.
O. S. S. Heriyanto, "Identifikasi Suara Hukum Bacaan Gunnah menggunakan MFCC," in Prosiding LPPM UPN Veteran, Yogyakarta, 2016.
M. N. A. M. S. M. W. U. N. a. F. N. Adiwijaya, "A Comparative Study of MFCC-KNN and LPC-KNN for Hijaiyyah Letters Pronounciation Classification System," in 5th International Conference on Information and Communication Technology (ICoIC7), Melaka, Malaysia, 2017.
R. H. T. B. A. Syahroni Hidayat, "Sistem Pengenal Tutur Bahasa Indonesia berbasis Suku Kata menggunakan MFCC, Wavelet, dan HMM," Yogyakarta, 2015.
S. H. Zaurarista Dyarbirru, "Metode Wavelet-MFCC dan Korelasi dalam Pengenalan Suara Digit," Jurnal Teknologi Informasi dan Multimedia, vol. 2, no. 2, pp. 100-108, 2020.
M. M. Effendi, "Pengenalan Pengaruh Suara Konsonan terhadap Vokal menggunakan MFCC dan SVM," IT For Society, vol. 3, no. 2, 2018.
T. H. G. H. K. S. a. K. L. A. Waibel, "Phoneme Recognition using Time-delay Neural Networks," IEEE Transactions on Acoustics, Speech and Signal Processing, vol. 37, no. 3, p. 328–339, 1989.
A. J. B. S. Fabian Triefenbach, "Phoneme Recognition with Large Hierarchical Reservoirs," in Advances in Neural Information Processing Systems, Vancouver, British Columbia, Canada, 2010.
R. C. M. M.-D. Dimitri Palaz, "End-to-end Phoneme Sequence Recognition using Convolutional Neural Networks," 2013.
J. W. G. C. N. D. N. C. Cornelius Glackin, "Convolutional Neural Networks for Phoneme Recognition," in 7th International Conference on Pattern Recognition Applications and Methods, 2018.
C. D. P. B. Hagen A., "The Analysis and Design of Architecture Systems for Speech Recognition on Modern Handheld Computing Devices," 2003.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2021 Ahmad rio Adriansyah, Kurniawan Dwi Prasetyo, Hamdan Ainul Atmam Al Faruqi
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.