แบบจำลองผสมแบบแยกแยะสำหรับการแบ่งคำไทย
- ชื่อผู้จัดทำโครงงานวิทยาศาสตร์
ฆนาศัย กรึงไกร
ชุลีรัตน์ จรัสกุลชัย
Jun ichi kazama
- อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์
ไม่มี
- สถาบันการศึกษาที่กำกับดูแลโครงงานวิทยาศาสตร์
ไม่มี
- ระดับการศึกษา
ไม่มี
- หมวดวิชา
- วันที่จัดทำโครงงานวิทยาศาสตร์
01 มกราคม 2541
บทคัดย่อโครงงานวิทยาศาสตร์
การแบ่งคำเป็นงานพื้นฐานในการประมวลผลภาาาไทยด้วยคอมพิวเตอร์ ความกำกวมของขอบเขตคำและคำที่ระบบไม่รู้จัก(ไม่ปรากฏในพจนานุกรมของระบบ) เป็นสาเหตุหลักที่สำคัญทำให้การแบ่งคำยาก ในงานวิจัยนี้ เรานำเสนอแบบจำลองผสมแบบแยกแยะ ซึ่งแทน "เสิร์จเสปซ"ด้วย"แลททิส" ที่ประกอบไปด้วย "โหนด" ในระดับคำและระดับกลุ่มอักขระ และสามารถใช้ประโยชน์ของข้อมูลบนพื้นฐานของการเรียนรู้แบบ "ออนไลน์ลาร์จมาร์จิน"ที่เรียกว่า MIRA (Margin infused Relaxed Algorithm) เราได้นำเสนอการทดลองบนคลังข้อความของ Best(ชุดที่1 5) เพื่อแสดงความเป็นไปได้แลพประสิทธิภาพของวิธีที่นำเสนอ