Thai Summarizer

ชื่อผู้จัดทำโครงงานวิทยาศาสตร์
  • เพ็ญพร กออนันตกูล

อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์
  • อัศนีย์ ก่อตระกูล

สถาบันการศึกษาที่กำกับดูแลโครงงานวิทยาศาสตร์

โรงเรียนสาธิตแห่งมหาวิทยาลัยเกษตรศาสตร์ ศูนย์วิจัยและพัฒนาการศึกษา

ระดับการศึกษา

โครงงานในระดับการศึกษาประกาศนียบัตรวิชาชีพ

หมวดวิชา

โครงงานในสาขาวิชาคอมพิวเตอร์

วันที่จัดทำโครงงานวิทยาศาสตร์

01 มกราคม 2541

บทคัดย่อโครงงานวิทยาศาสตร์

โปรแกรมย่อใจความสำคัญ (Summarizer) เป็นโปรแกรมที่มีการค้นคว้าวิจัยมานาน และปัจจุบันเริ่มมีโปรแกรมประเภทนี้ให้ใช้กันทั่วไปแล้ว เช่น เครื่องมือ AutoSummarize ในโปรแกรม Microsoft Word, โปรแกรม Copernic Summarizer เป็นต้น แต่ยังไม่มีโปรแกรมใดที่สนับสนุการใช้งานภาษาไทย มีงานวิจัยที่เกี่ยวข้องกับโปรแกรมประเภทนี้อยู่บ้าง เช่น โปรแกรมยกข้อความจากย่อหน้าสำคัญทั้งย่อหน้า ของ ผศ.ดร.ชุลีรัตน์ จรัสกุลชัย แต่ยังสรุปใจความสำคัญได้ไม่ละเอียดนัก เนื่องจากการทำงานอยู่ในระดับของย่อหน้า โครงงานนี้มีจุดประสงค์เพื่อพัฒนาโปรแกรมย่อใจความสำคัญสำหรับเอกสารภาษาไทย (Thai Summarizer) โดยใช้วิธีการทางสถิติ (Stat Based Algorithm) แบบให้น้ำหนักคำและรวมน้ำหนักของประโยคในรูปของสมการเชิงเส้น (Liner Combination) และสรุปใจความสำคัญในระดับของประโยค เนื่องจากภาษาไทยมีลักษณะการเขียนเอกสารที่เป็นอุปสรรคกับการแบ่งคำและประโยคด้วยคอมพิวเตอร์ จึงจะขอให้เครื่องมือตัดคำ จากห้องปฏิบัติการภาษาธรรมชาติและเทคโนโลยีสารสนเทศอัจฉริยะ มหาวิทยาลัยเกษตรศาสตร์ ในกระบวนการเตรียมเอกสาร ก่อนจะทำการให้น้ำหนักความสำคัญเพื่อสรุปย่อใจความด้วยวิธีทางสถิติ ขณะนี้ผู้จัดทำกำลังทำการค้นคว้าข้อมูลเพิ่มเติม และกำลังจะเริ่มเขียนโปรแกรม โดยใช้เครื่องมือตัดคำดังกล่าวช่วย ลักษณะโปรแกรมอาจจะเป็น Macro แบบเครื่องมือ AutoSummarize ในโปรแกรม Microsoft Word หรือเป็นโปรแกรม Standalone ซึ่งจะนำเสนอใจความสำคัญที่ย่อแล้วด้วยการเน้น (Highlight) ข้อความเดิมในเอกสาร