การสร้างโมเดลการพยากรณ์โอกาสการเกิดน้ำท่วมบนท้องถนนในแต่ละพื้นที่เพื่อตอบสนองการสัญจรในชีวิตประจำวันโดยใช้อัลกอริทึม K-Nearest Neighbors

ชื่อนักเรียนผู้จัดทำโครงงานวิทยาศาสตร์: วงศ์ไกรวิชชญ์ ชื่นชมภู, เดชานนท์ ม่านมูล, นนทพัทธ์ ชะนะมา
อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์: วรงรอง ศรีศิริรุ่ง
โรงเรียนที่กำกับดูแลโครงงานวิทยาศาสตร์: โรงเรียนสาธิตสถาบันการจัดการปัญญาภิวัฒน์ (สาธิตพีไอเอ็ม)
ปีที่จัดทำโครงงานวิทยาศาสตร์: พ.ศ. 2565

บทคัดย่อโครงงานวิทยาศาสตร์

เนื่องจากผลกระทบด้านเศรษฐกิจและความปลอดภัยในทรัพย์สิน อันเนื่องมาจากอุทกภัยในพื้นที่กรุงเทพมหานครและปริมณฑล มีอัตราที่เพิ่มสูงขึ้นในทุกๆ ปี เนื่องจากการไม่ได้รับข้อมูลความเสี่ยงที่จำเป็น และทันกาล เพื่อการวางแผนรับมือล่วงหน้าและการใช้ชีวิตประจำวัน ซึ่งการพัฒนาโมเดลปัญญาประดิษฐ์ในโครงงานนี้เป็นระบบประมวลผลข้อมูลและคาดการณ์โอกาสการเกิดน้ำท่วมบนท้องถนนในแต่ละพื้นที่ โดยใช้อัลกอริทึม K-Nearest Neighbors ในการพยากรณ์ ซึ่งจะเป็นประโยชน์ต่อหลายภาคส่วน ทั้งประโยชน์แก่ภาคประชาชนในแง่ของการลดอุบัติเหตุบนท้องถนน รวมถึงลดความเสี่ยงต่อชีวิตและทรัพย์สิน ประโยชน์แก่ภาคธุรกิจ ในด้านของการวางแผนและเลือกเส้นทางที่เหมาะสมที่สุดในการขนส่งสินค้า ซึ่งเป็นส่วนช่วยในการลดความเสี่ยงการเกิดอุบัติเหตุระหว่างการขนส่งสินค้าอีกด้วย ประโยชน์แก่ภาครัฐ ในด้านของการวางแผนการพัฒนาและก่อสร้างเส้นทางคมนาคม ทั้งยังช่วยให้หน่วยงานภาครัฐได้รับรู้ถึงพื้นที่หรือถนนส่วนใดที่มีปัญหาด้านการระบายน้ำ และต้องการการพัฒนาด้านระบบระบายน้ำเป็นพิเศษ ผู้พัฒนาจึงมีความคิดที่จะสร้างโมเดลการพยากรณ์โอกาสการเกิดน้ำท่วมบนท้องถนนในแต่ละพื้นที่เพื่อตอบสนองการสัญจรในชีวิตประจำวันโดยใช้อัลกอริทึม K-Nearest Neighbors

ในส่วนของกระบวนการทดลอง ผู้พัฒนาได้ใช้ภาษา Python เป็นภาษาในการพัฒนาโมเดล โดยใช้ Library Repositories ในการทำวิทยาการข้อมูล และทำการค้นคว้าหาข้อมูลเกี่ยวกับอัลกอริทึมที่มีความเหมาะสมที่สุดกับการทดลอง โดยทีมพัฒนาได้เลือกอัลกอริทึม K-Nearest Neighbors เป็นอัลกอริทึมหลักในการทดลองเนื่องจากปัจจัยด้านชุดข้อมูล โดยอัลกอริทึมนี้มีความสามารถในการพยากรณ์ข้อมูลที่มีปริมาณน้อยและไม่ซับซ้อน ซึ่งผลลัพธ์จากการพยากรณ์ (Output) จะออกมาเป็นค่า 0 และ 1 โดย 0 คือน้ำไม่ท่วม และ 1 คือน้ำท่วม และหลังจากการฝึกโมเดลเสร็จสิ้น จะมีการพัฒนาโมเดลให้มีประสิทธิภาพเพิ่มมากขึ้น และทำการทดสอบโมเดลจากนั้นบันทึกผลออกมาเป็น Confusion Matrix จากนั้นคำนวณค่าที่ได้ออกมาเป็นค่า Accuracy, Balanced accuracy และ F-score

จากผลการทดลองพบว่า อัลกอริทึมประเภท KNN (K-Nearest Neighbors) เป็นอัลกอริทึมที่มีประสิทธิภาพและมีความเหมาะสมมากที่สุดกับการทดลองนี้ ทั้งประสิทธิภาพการประมวลผลและคุณภาพของผลลัพธ์ที่ได้ ถึงแม้ผลการทดลองข้างต้นที่แสดงให้เห็นว่าอัลกอริทึม SVM (Support Vector Machine) เป็นอัลกอริทึมที่ให้ค่า Accuracy, Balance Accuracy และ F-score ได้ดีที่สุด แต่อาจไม่ใช่อัลกอริทึมที่ดีที่สุดสำหรับโมเดลนี้ เนื่องจากโมเดล SVM เกิดปัญหาการ overfit บ่อยครั้งโดยมีสาเหตุมาจากการที่จำนวนและมิติของข้อมูลไม่เพียงพอต่อการฝึกฝนโมเดล ซึ่งส่งผลให้ค่าที่ได้สูงเกินความเป็นจริง โดยสรุปจากการทดลองใช้อัลกอริทึมทั้ง 3 รูปแบบในการสร้างโมเดลพบว่า KNN เป็นอัลกอริทึมที่เหมาะสมที่สุด