การทำนายความไวต่อยาด้วยเทคนิคผสมผสาน Graph Attention Networks เพื่อเป็นทางเลือกสำหรับการรักษาโรคมะเร็งด้วยการแพทย์แบบแม่นยำ โดยใช้โครงสร้างโมเลกุลยาร่วมกับข้อมูลทางเภสัชพันธุศาสตร์
- ชื่อนักเรียนผู้จัดทำโครงงานวิทยาศาสตร์
ภาวิต แก้วนุรัชดาสร, ณัฐวินทร์ แย้มประเสริฐ, วุฒิพงศ์ จงเจริญสันติ
- อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์
บัณฑิต บุญยฤทธิ์, สาโรจน์ บุญเส็ง
- โรงเรียนที่กำกับดูแลโครงงานวิทยาศาสตร์
- ปีที่จัดทำโครงงานวิทยาศาสตร์
บทคัดย่อโครงงานวิทยาศาสตร์
โรคมะเร็งเป็นโรคไม่ติดต่อเรื้อรังที่เกิดจากการเจริญเติบโตของเซลล์อย่างผิดปกติ ในปี ค.ศ. 2020 พบว่ามีผู้ป่วยโรคมะเร็งรายใหม่ประมาณ 19.3 ล้านคน และมีผู้เสียชีวิตจากโรคมะเร็งเกือบ 10 ล้านคนทั่วโลก ปัจจุบันการแพทย์แม่นยำ (precision medicine) ซึ่งเป็นการรักษาในรูปแบบที่จำเพาะเจาะจงกับพันธุกรรมของผู้ป่วย ได้เข้ามามีบทบาทสำคัญในการรักษาโรคมะเร็ง เนื่องจากผู้ป่วยที่แตกต่างกันย่อมมีข้อมูลทางพันธุกรรมที่ไม่เหมือนกัน ส่งผลให้การตอบสนองต่อยาเป็นไปตามปัจเจกในแต่ละบุคคล สำหรับการรักษามะเร็งด้วยการแพทย์แบบแม่นยำจะอาศัยข้อมูลพันธุกรรมของผู้ป่วยที่นำไปทดสอบด้วยตัวยาต่างชนิดเพื่อคัดเลือกยาที่มีประสิทธิภาพมากที่สุดให้แก่ผู้ป่วย แต่อย่างไรก็ตาม เทคนิคนี้ยังอาศัยเครื่องมือขั้นสูง ระยะเวลา และต้นทุนเป็นจำนวนมาก ดังนั้น การเรียนรู้เชิงลึก (deep learning) จึงเข้ามามีบทบาทสำคัญ โดยช่วยลดข้อผิดพลาดที่เกิดขึ้น อีกทั้งยังช่วยลดค่าใช้จ่าย และระยะเวลา เพื่อการเลือกยาให้เหมาะสมกับผู้ป่วยในระหว่างการรักษา ในปัจจุบันมีโมเดลการเรียนรู้เชิงลึกหลากหลายรูปแบบที่สามารถทำนายค่าการตอบสนองต่อยาโดยใช้โครงสร้างทางโมเลกุลร่วมกับข้อมูลโอมิกส์ แต่อย่างไรก็ตาม โมเดลเหล่านี้ยังขาดการพิจารณาหมู่ฟังก์ชันทางเคมีของยาซึ่งเป็นหลักที่สำคัญในการออกแบบและพัฒนายา จากปัญหาที่ได้กล่าวมาข้างต้น ผู้พัฒนาจึงสนใจพัฒนาโมเดล CANDraGAT ซึ่งเป็นโมเดลการเรียนรู้เชิงลึกสำหรับการทำนายค่าการตอบสนองต่อยาผ่านค่า IC50 ที่มีการเรียนรู้โดยใช้โครงสร้างทางโมเลกุลของยาที่มีการพิจารณาส่วนย่อยในโมเลกุล (motif) ร่วมกับข้อมูลพหุโอมิกส์ โดยใช้เทคนิคผสมผสาน Graph Attention Networks (GAT)
จากการศึกษาพบว่า โมเดล CANDraGAT ที่มีการพิจารณาเพียงปัจจัยโอมิกส์ชนิด gene mutation มีประสิทธิภาพการทำนายค่าการตอบสนองต่อยาที่ดีกว่าโมเดล state-of-the-art และโมเดลมาตรฐาน ได้แก่ GCN GAT และ DeepCDR (Root-Mean-Square-Error (RMSE) = 1.4399 ± 0.0011 และ Pearson correlation coefficient = 0.8988 ± 0.0002) และยังมีความสามารถในการทำนายค่าการตอบสนองต่อยาที่ยังไม่มีการศึกษา โดยให้ผลที่สอดคล้องกับข้อมูล protein-protein interaction และข้อมูลจากการวิเคราะห์ gene set enrichment (GSEA) ที่เกี่ยวข้องกับโรคมะเร็ง โมเดลที่พัฒนาขึ้นนี้จะช่วยให้แพทย์สามารถเลือกใช้ยารักษาโรคมะเร็งในรูปแบบการแพทย์แม่นยำได้ดีขึ้น ซึ่งจะช่วยลดต้นทุนและระยะเวลา ส่งผลให้ผู้ป่วยสามารถเข้าถึงการรักษาที่มีคุณภาพได้มากขึ้น และช่วยลดปัญหาความเหลื่อมล้ำในการรักษาโรคมะเร็ง (cancer disparities) อีกทั้งยังเป็นโมเดลต้นแบบที่จะนำไปสู่การออกแบบและพัฒนายาที่เฉพาะเจาะจงกับข้อมูลพันธุกรรมของผู้ป่วย