ซอฟต์แวร์ช่วยผู้พิการทางการได้ยินในการฝึกฝนการออกเสียงพยางค์โดยใช้เครื่องรู้จำเสียงพูดและภาพเคลื่อนไหวสามมิติ

ชื่อผู้จัดทำโครงงานวิทยาศาสตร์

สิรธาร ภควลีธร
อิศรัญ แจ่มเวหา
สุกฤษฎิ์ ศรีสุวรรณภรณ์

อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์

อติวงศ์ สุชาโต
โปรดปราน บุณยพุกกณะ

สถาบันการศึกษาที่กำกับดูแลโครงงานวิทยาศาสตร์

จุฬาลงกรณ์มหาวิทยาลัย

ระดับการศึกษา

โครงงานวิทยาศาสตร์ในระดับการศึกษาปริญญาโทขึ้นไป

หมวดวิชา

โครงงานวิทยาศาสตร์ในสาขาวิชาคอมพิวเตอร์

วันที่จัดทำโครงงานวิทยาศาสตร์

01 มกราคม 2541

บทคัดย่อโครงงานวิทยาศาสตร์

การฝึกฝนการออกเสียงนั้นเป็นกิจกรรมต้องการผู้เชี่ยวชาญ เนื่องจากการฝึกฝนที่ดีนั้นต้องอาศัยการสาธิตวิธีการออกเสียงแบบตัวต่อตัวเพื่อให้ผู้ฝึกสามารถเข้าใจขั้นตอนการออกเสียงได้อย่างชัดเจน อย่างไรก็ตามเราสามารถนำเทคโนโลยีสมัยใหม่เข้ามาช่วยเหลือในการฝึกฝนได้ ปัญหาหนึ่งของการฝึกออกเสียงคือ การที่ผู้ฝึกไม่สามารถแยกแยะการออกเสียงคำบางคำในภาษาไทยโดยอาศัยการอ่านริมฝีปากเพียงอย่างเดียว เนื่องจากผู้ฝึกไม่สามารถมองเห็นอวัยวะอื่นๆ ที่ใช้ในการออกเสียงที่อยู่ภายในปาก เช่น ลิ้น หรือ ฟัน เป็นต้น สำหรับบุคคลทั่วๆ ไป ปัญหาเหล่านี้สามารถแก้ไขได้โดยอาศัยการฟังประกอบเข้ามาเพื่อช่วยในการออกเสียงให้ถูกต้อง แต่สำหรับผู้พิการทางการได้ยินที่ต้องเรียนรู้วิธีการออกเสียงโดยอาศัยการอ่านริมฝีปากอย่างเดียวนั้น ปัญหาที่กล่าวมาถือเป็นอุปสรรคที่สำคัญในการเรียนรู้ ซึ่งเราสามารถแก้ไขปัญหาดังกล่าวได้โดยอาศัยเทคโนโลยีรูปการเคลื่อนไหวสามมิติ และเทคนิคการรู้จำเสียง โปรแกรมที่พัฒนาขึ้นมาจะเริ่มจากการแสดงรูปการเคลื่อนไหวสามมิติของอวัยวะในการออกเสียงต่างๆ เพื่อแสดงการออกเสียงพยางค์เดียวในภาษาไทย ทำให้ผู้ฝึกสามารถมองเห็นการเคลื่อนไหวและตำแหน่งของการอวัยวะต่างๆ ที่ใช้ในการออกเสียงได้ชัดเจนยิ่งขึ้น หลังจากที่ผู้ฝึกทำการฝึกออกเสียงโปรแกรมจะใช้เทคนิคการรู้จำเสียงทำการวิเคราะห์ว่าผู้ฝึกสามารถออกเสียงได้ถูกต้องหรือไม่ การใช้โปรแกรมดังกล่าวนอกจากจะเป็นการนำเสนอแนวทางใหม่ในการฝึกฝนการออกแล้ว ยังสามารถแก้ไขปัญหาการขาดแคลนผู้เชี่ยวชาญการฝึกฝนการออกเสียงในประเทศไทยอีกด้วย Speech training is a demanding task that calls for specialists. Though the training is best done by person in order to demonstrate how to speak correctly, there are still some issues that can be enhanced by the help of the Information Technology. In this work, we focus on the problem that some Thai words are pronounced differently, but the trainee may not be able to tell the difference from lip reading as some facial components, like cheek and lip, block the view of other articulatory mechanisms inside the speaker’s mouth, like tongue and teeth. This problem is particularly important for those trainees who are unable to hear well, like the hard of hearing who learns oral language and depend on lip reading alone. This problem can be solved by the use of computer animation and speech recognition. Our software starts by using the 3D animation to illustrate how a chosen single Thai word is uttered. It allows a trainee to examine how to place and move his or her articulatory parts to produce a word. After a word is uttered, our application then analyzes if the uttered word is correct using our speech recognizer and returns the result to the trainee. This solution is also useful with scarce resource of speech training specialists in Thailand.