การวิเคราะห์ข้อมูลการเติมหมู่เมทิลของดีเอ็นเอเพื่อจำแนกและตรวจหามะเร็งปอดระยะแรกโดยใช้การเรียนรู้ของเครื่อง

ชื่อนักเรียนผู้จัดทำโครงงานวิทยาศาสตร์

วิรากานต์ บุญฟ้าประทาน, ชนันรัตน์ ตีรณัมพงศ์วนิช

อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์

คเณศ สุเมธพิพัธน์, ธนศานต์ นิลสุ

โรงเรียนที่กำกับดูแลโครงงานวิทยาศาสตร์

โรงเรียนกำเนิดวิทย์

ปีที่จัดทำโครงงานวิทยาศาสตร์

พ.ศ. 2566

บทคัดย่อโครงงานวิทยาศาสตร์

มะเร็งเป็นโรคที่เกี่ยวข้องกับการเปลี่ยนแปลงในระดับพันธุกรรม การเติมหมู่เมทิลของดีเอ็นเอ (DNA methylation) เป็นกระบวนการหนึ่งที่ทำให้การแสดงออกของยีนเปลี่ยนแปลงและสามารถก่อให้เกิดมะเร็งได้ หนึ่งในมะเร็งที่มีอัตราการเสียชีวิตที่สูงที่สุดคือ มะเร็งปอด เนื่องจากการแสดงออกของอาการในระยะแรกไม่มีความชัดเจน คนไข้จึงมักตรวจพบมะเร็งปอดในระยะท้าย โดยมะเร็งปอดแบ่งออกเป็น 4 ชนิดที่พบเจอมาก ได้แก่ small cell lung cancer (SCLC), lung adenocarcinoma (LUAD), lung squamous cell carcinoma (LUSC) และ large cell lung carcinoma (LCLC) การตรวจหามะเร็งปอดในระยะแรกและจัดจำแนกออกเป็นชนิดย่อยสามารถทำได้โดยการวิเคราะห์ข้อมูลการเติมหมู่เมทิลของดีเอ็นเอที่หลุดลอยมากจากเซลล์มะเร็งต้นกำเนิด ซึ่งสามารถตรวจพบได้ในของเหลวภายในร่างกาย วิธีนี้จึงเป็นวิธีการตรวจหามะเร็งที่สะดวก ปลอดภัย และเหมาะสำหรับการต่อยอดในอนาคต อย่างไรก็ตามข้อมูลในระดับพันธุกรรมมีปริมาณมากและซับซ้อน จึงต้องอาศัยการเรียนรู้ของเครื่องมาช่วยในการจัดจำแนกและวิเคราะห์ข้อมูล จากการศึกษาที่ผ่านมาพบว่า มีงานวิจัยเพียงส่วนน้อยที่จัดจำแนกมะเร็งปอดทั้ง 4 ชนิด อีกทั้งประสิทธิภาพของโมเดลจัดจำแนกที่สร้างด้วยการเรียนรู้ของเครื่องยังสามารถพัฒนาได้ด้วยการปรับปรุงอัลกอริทึม คณะผู้จัดทำจึงต้องการวิเคราะห์ตำแหน่งการเติมหมู่เมทิลของดีเอ็นเอ เพื่อสร้างโมเดลในการจำแนกชนิดย่อยของมะเร็งปอดและตรวจหามะเร็งปอดในระยะเริ่มต้น โดยใช้ข้อมูลการเติมหมู่เมทิลของดีเอ็นเอจากฐานข้อมูล TCGA และสร้างโมเดลจัดจำแนกหลากหลายรูปแบบ เพื่อหาโมเดลที่ให้การทำนายได้ดีที่สุด