ศึกษาและพัฒนา Hand - Written OCR

ชื่อผู้จัดทำโครงงานวิทยาศาสตร์
  • ธัญญพร เรือนโรจน์รุ่ง

อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์
  • สุรพันธ์ เมฆนาวิน

สถาบันการศึกษาที่กำกับดูแลโครงงานวิทยาศาสตร์

นักเรียนระดับมัธยมศึกษาปีที่ 5 โรงเรียนสตรีนครสวรรค์

ระดับการศึกษา

โครงงานวิทยาศาสตร์ในระดับการศึกษาประกาศนียบัตรวิชาชีพ

หมวดวิชา

โครงงานวิทยาศาสตร์ในสาขาวิชาคอมพิวเตอร์

วันที่จัดทำโครงงานวิทยาศาสตร์

01 มกราคม 2541

บทคัดย่อโครงงานวิทยาศาสตร์

การศึกษารวบรวมข้อมูลที่เกี่ยวข้องกับการทำ OCR (Optical Character Recognition) และรวบรวมตัวอย่างลายมือจากแหล่งต่างๆ เพื่อนำมาศึกษาสภาพปัญหา พบปัญหาที่สำคัญ ได้แก่ ปัญหาในการตัดตัวอักษร รูปแบบของตัวอักษรที่คล้ายกันมาก เช่น ด ค ต , ก ถ ภ , ผ ฝ พ ฟ การเขียน ผิดรูปซึ่งมีผลให้ตัวอักษรที่ต่างกันมีลักษณะคล้ายกัน เช่น ย ผ , ร ช , พ ม และความหลากหลายของ ลายมือ ดังนั้นการจะจดจำลักษณะตัวอักษรแต่ละตัวได้ ควรจะเน้นที่การจดจำลักษณะร่วมหรือลักษณะเด่น ของตัวอักษรนั้น จากลายมือที่ต่างกัน โดยการพิจารณาว่าตัวอักษร คือ กราฟที่ประกอบด้วยจุดยอดและขอบที่ลากเชื่อมจุด แล้วแทนอักษรแต่ละตัวด้วยจุด แต่เกิดปัญหาว่าไม่สามารถระบุได้ชัดเจน ว่า ลักษณะของจุดนั้นจะใช้แทนตัวอักษรตัวใด จึงเพิ่มแฟกเตอร์บางอย่างเข้าไป คือ เพิ่มจำนวนจุดในบริเวณ จุดตัด จุดปลายและจุดสุดขอบด้านต่าง ๆ กำหนดลำดับของจุด อักษรที่คล้ายกันมากและใช้ลักษณะเด่น ของตัวนั้นแทนจุดในบางตำแหน่ง ทำให้ความชัดเจนมากขึ้นและจะได้พิจารณาวิธีการอื่น ๆ เช่น การใช้อัตราส่วนของระยะระหว่างจุด การพิจารณาจุดเริ่มต้นและจุดสุดท้ายของตัวอักษรในการแบ่งกลุ่มตัวอักษรให้เหลือตัวที่พิจารณาน้อยลง แต่เนื่องจากตัวอักษรภาษาไทยมีความซับซ้อนและมีรายละเอียดค่อนข้างมาก จึงมุ่งเน้นให้สามารถรู้จำตัวเลข 0 9 ให้ได้ก่อน เพื่อนำไปใช้ในการคัดแยกจดหมาย เนื่องจากรูปแบบลายมือที่พบบ่อยในการเขียนตัวเลขมีไม่มากนัก เมื่อแทนตัวเลขด้วยจุดที่มีการกำหนดลำดับ พิจารณาจุดเริ่มต้นและจุดสุดท้ายของตัวเลขแล้ว ก็สามารถแยกความแยกต่างของตัวเลขแต่ละตัวได้ค่อนข้างมาก นอกจากนี้จะใช้วิธีต่าง ๆ มาประกอบเพื่อเพิ่มความถูกต้อง ได้แก่ การพิจารณาตำแหน่งของจุดโดยให้ความสำคัญกับทิศทางมากกว่าระยะทาง โดยกำหนดทิศทางเพียง 8 ทิศ ถ้ามีทิศต่างไปจากทิศที่กำหนด จะหาว่ามีทิศใกล้เคียงกับทิศใดที่มกที่สุดและกำหนดให้เป็นทิศนั้น พิจารณาจากจำนวนจุดที่ใกล้เคียงกัน และพิจารณาจากลักษณะเด่ของตัวเลข ก็จะเพิ่มความถูกต้องได้ในระดับหนึ่ง สำหรับปัญหาในการอ่านตัวเลขซึ่งอาจพบได้ เช่น การเขียนตัวเลขสองตัวติดกัน หรือการเขียนตัวเลขตัวเดียวแต่เส้นไม่ต่อเนื่องอาจทำให้เกิดความสับสนได้ และปัญหาที่สำคัญอีกประการหนึ่งคือ การเขียนผิดรูปซึ่งทำให้ยากแก่การจำแนกว่าตัวเลขตัวใด ซึ่งยังจะต้องศึกษาและพัฒนาต่อไป