การพัฒนาระบบรู้จำเสียงพูดตัวเลขภาษาไทย

ชื่อผู้จัดทำโครงงานวิทยาศาสตร์
  • อังคนา จันทร์รุ่งอุทัย

อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์
  • กัลยา นฤดมกุล

สถาบันการศึกษาที่กำกับดูแลโครงงานวิทยาศาสตร์

คณะวิทยาศาสตร์ มหาวิทยาลัยมหิดล

ระดับการศึกษา

โครงงานในระดับการศึกษาปริญญาโทขึ้นไป

หมวดวิชา

โครงงานในสาขาวิชาคณิตศาสตร์

วันที่จัดทำโครงงานวิทยาศาสตร์

01 มกราคม 2541

บทคัดย่อโครงงานวิทยาศาสตร์

โครงงานนี้มีจุดประสงค์เพื่อพัฒนาระบบรู้จำเสียงพูดตัวเลขภาษาไทย ซึ่งเป็นระบบที่รับ Input เป็นไฟล์เสียงพูดตัวเลขภาษาไทย แล้วทำการรู้จำเพื่อให้ได้ Output เป็นตัวเลขที่ตรงกับเสียงพูดนั้น โดยระบบนี้จะแบ่งขั้นตอนการพัฒนาเป็นการวิเคราะห์ลักษณะของเสียงตัวเลขในภาษาไทย เช่น ความยาวของคำ ความแตกต่างของเสียงพยัญชนะ สระ และวรรณยุกต์ในแต่ละคำ การศึกษาพื้นฐานการออกเสียง การศึกษารูปแบบของคลื่นเสียงในเชิงโดเมนความถี่ โดยใช้การแปลงแบบ Fast Fourier Transform (FFT) และการกำหนดรายละเอียดของวิธีการเพื่อนำไป Implement ด้วย Microsoft Visual C++ ซึ่งการพัฒนาระบบดังกล่าวนี้จะเป็นพื้นฐานของการพัฒนาเป็นระบบแปลงเสียงพูดภาษาไทยเป็นตัวอักษรต่อไป

In this project, we propose the central idea behide the development of Thai number speech recognition system. This system is able to recognize the number which is input to the system in speech format. It was designed to receive an input wave file and display in figure format output. In developing this system, our tasks include analyzing the feature of Thai number speech (e.g. the length of word, the differences of consonants, vowels, and levels of each word), studying the basic of pronunciation,studying the form of sound wave in term of frequency domain that is transformed by the Fast Fourier Transform (FFT), and determining details of procedure to be implemented by Microsoft Visual C++. This project should be useful to other speech recognition research projects.