แบบจำลองผสมแบบแยกแยะสำหรับการแบ่งคำไทย

ชื่อผู้จัดทำโครงงานวิทยาศาสตร์
  • ฆนาศัย กรึงไกร

  • ชุลีรัตน์ จรัสกุลชัย

  • Jun ichi kazama

อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์

ไม่มี

สถาบันการศึกษาที่กำกับดูแลโครงงานวิทยาศาสตร์

ไม่มี

ระดับการศึกษา

ไม่มี

หมวดวิชา

โครงงานในสาขาวิชาคอมพิวเตอร์

วันที่จัดทำโครงงานวิทยาศาสตร์

01 มกราคม 2541

บทคัดย่อโครงงานวิทยาศาสตร์

การแบ่งคำเป็นงานพื้นฐานในการประมวลผลภาาาไทยด้วยคอมพิวเตอร์ ความกำกวมของขอบเขตคำและคำที่ระบบไม่รู้จัก(ไม่ปรากฏในพจนานุกรมของระบบ) เป็นสาเหตุหลักที่สำคัญทำให้การแบ่งคำยาก ในงานวิจัยนี้ เรานำเสนอแบบจำลองผสมแบบแยกแยะ ซึ่งแทน "เสิร์จเสปซ"ด้วย"แลททิส" ที่ประกอบไปด้วย "โหนด" ในระดับคำและระดับกลุ่มอักขระ และสามารถใช้ประโยชน์ของข้อมูลบนพื้นฐานของการเรียนรู้แบบ "ออนไลน์ลาร์จมาร์จิน"ที่เรียกว่า MIRA (Margin infused Relaxed Algorithm) เราได้นำเสนอการทดลองบนคลังข้อความของ Best(ชุดที่1 5) เพื่อแสดงความเป็นไปได้แลพประสิทธิภาพของวิธีที่นำเสนอ