Thai Summarizer
- ชื่อผู้จัดทำโครงงานวิทยาศาสตร์
เพ็ญพร กออนันตกูล
- อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์
อัศนีย์ ก่อตระกูล
- สถาบันการศึกษาที่กำกับดูแลโครงงานวิทยาศาสตร์
โรงเรียนสาธิตแห่งมหาวิทยาลัยเกษตรศาสตร์ ศูนย์วิจัยและพัฒนาการศึกษา
- ระดับการศึกษา
- หมวดวิชา
- วันที่จัดทำโครงงานวิทยาศาสตร์
01 มกราคม 2541
บทคัดย่อโครงงานวิทยาศาสตร์
โปรแกรมย่อใจความสำคัญ (Summarizer) เป็นโปรแกรมที่มีการค้นคว้าวิจัยมานาน และปัจจุบันเริ่มมีโปรแกรมประเภทนี้ให้ใช้กันทั่วไปแล้ว เช่น เครื่องมือ AutoSummarize ในโปรแกรม Microsoft Word, โปรแกรม Copernic Summarizer เป็นต้น แต่ยังไม่มีโปรแกรมใดที่สนับสนุการใช้งานภาษาไทย มีงานวิจัยที่เกี่ยวข้องกับโปรแกรมประเภทนี้อยู่บ้าง เช่น โปรแกรมยกข้อความจากย่อหน้าสำคัญทั้งย่อหน้า ของ ผศ.ดร.ชุลีรัตน์ จรัสกุลชัย แต่ยังสรุปใจความสำคัญได้ไม่ละเอียดนัก เนื่องจากการทำงานอยู่ในระดับของย่อหน้า โครงงานนี้มีจุดประสงค์เพื่อพัฒนาโปรแกรมย่อใจความสำคัญสำหรับเอกสารภาษาไทย (Thai Summarizer) โดยใช้วิธีการทางสถิติ (Stat Based Algorithm) แบบให้น้ำหนักคำและรวมน้ำหนักของประโยคในรูปของสมการเชิงเส้น (Liner Combination) และสรุปใจความสำคัญในระดับของประโยค เนื่องจากภาษาไทยมีลักษณะการเขียนเอกสารที่เป็นอุปสรรคกับการแบ่งคำและประโยคด้วยคอมพิวเตอร์ จึงจะขอให้เครื่องมือตัดคำ จากห้องปฏิบัติการภาษาธรรมชาติและเทคโนโลยีสารสนเทศอัจฉริยะ มหาวิทยาลัยเกษตรศาสตร์ ในกระบวนการเตรียมเอกสาร ก่อนจะทำการให้น้ำหนักความสำคัญเพื่อสรุปย่อใจความด้วยวิธีทางสถิติ ขณะนี้ผู้จัดทำกำลังทำการค้นคว้าข้อมูลเพิ่มเติม และกำลังจะเริ่มเขียนโปรแกรม โดยใช้เครื่องมือตัดคำดังกล่าวช่วย ลักษณะโปรแกรมอาจจะเป็น Macro แบบเครื่องมือ AutoSummarize ในโปรแกรม Microsoft Word หรือเป็นโปรแกรม Standalone ซึ่งจะนำเสนอใจความสำคัญที่ย่อแล้วด้วยการเน้น (Highlight) ข้อความเดิมในเอกสาร