การเรียนรู้โครงสร้างและคุณสมบัติของโมเลกุลด้วยเทคนิคผสมผสาน Multi-Task Learning และ Transfer Learning ที่นำไปสู่การค้นหายาเพื่อเป็นตัวยับยั้งสำหรับเอนไซม์โปรตีเอส ในกลุ่มไวรัสเอชไอวี และตับอักเสบซี
- ชื่อนักเรียนผู้จัดทำโครงงานวิทยาศาสตร์
ธีรดณย์ ศักดิ์เพชร, พัณณ์เดชน์ สร้อยสมุทร
- อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์
ธนศานต์ นิลสุ, บัณฑิต บุญยฤทธิ์
- โรงเรียนที่กำกับดูแลโครงงานวิทยาศาสตร์
- ปีที่จัดทำโครงงานวิทยาศาสตร์
บทคัดย่อโครงงานวิทยาศาสตร์
ในปัจจุบัน มีผู้ป่วยภาวะติดเชื้อเอชไอวี (HIV: human immunodeficiency virus) และผู้ป่วยภาวะติดเชื้อไวรัสตับอักเสบซี (HCV: hepatitis C virus) เป็นจำนวนมาก ในปี พ.ศ. 2562 ทั่วโลกมีผู้ติดเชื้อ HIV ประมาณ 38 ล้านคน และในปี พ.ศ. 2563 ทั่วโลกมีผู้ติดเชื้อ HCV สูงถึง 71 ล้านคน วิธีการรักษาหรือบรรเทาอาการภาวะติดเชื้อไวรัสที่นิยมใช้กันในปัจจุบัน คือ การใช้ยาต้านไวรัสเพื่อยับยั้งการทำงานของเอนไซม์ที่มีความสำคัญต่อการเพิ่มจำนวนของไวรัส เอนไซม์โปรตีเอส (protease) เป็นเอนไซม์ที่จำเป็นต่อวัฏจักรการจำลองตัวเองของเชื้อ HIV และ HCV อย่างไรก็ตามการใช้ยาต้านไวรัสดังกล่าว มักทำให้ไวรัสเกิดการกลายพันธุ์ดื้อยา ส่งผลให้ยาต้านไวรัสที่มีในปัจจุบันอาจไม่สามารถใช้รักษาได้ ความต้องการยาที่หลากหลายเพื่อรองรับการดื้อยาในอนาคตจึงมีความสำคัญเป็นอย่างยิ่ง แต่กระบวนการค้นหาและพัฒนายาโดยปกติต้องใช้เวลาโดยเฉลี่ย 11-16 ปี และมีค่าใช้จ่ายสูงถึง 2,800 ล้านเหรียญสหรัฐ อีกทั้งการพัฒนายาอาจล้มเหลวก่อนนำมาใช้รักษาได้จริง ในโครงงานนี้ผู้พัฒนาจึงสนใจพัฒนาโมเดลด้วยเทคนิคการเรียนรู้แบบผสมผสานระหว่าง multi-task learning และ transfer learning บนอัลกอริทึม graph convolutional network (GCN) และ deep neural network (DNN) สำหรับการทำนายค่า pIC50 ของลิแกนด์ เพื่อนำไปประยุกต์ใช้ในกระบวนการค้นหาและพัฒนายาที่สามารถยับยั้งการทำงานของเอนไซม์โปรตีเอสใน HIV และ HCV โดยใช้ชุดข้อมูล aspartic protease และ serine protease ตามลำดับ
จากการทดลองพบว่า เทคนิคการเรียนรู้แบบผสมผสานระหว่าง multi-task และ transfer learning สามารถช่วยเพิ่มประสิทธิภาพให้กับโมเดลการเรียนรู้เชิงลึกในการทำนายค่า pIC50 สำหรับลิแกนด์ที่มีการยับยั้งเอนไซม์โปรตีเอสของไวรัสเอชไอวีและไวรัสตับอักเสบซี ได้เป็นอย่างดี โดยให้ค่า R2 และ RMSE เท่ากับ 0.780 และ 0.864 ในชุดข้อมูล HIV (n=2,130) และ 0.814 และ 0.452 ในชุดข้อมูล HCV (n=1,644) ตามลำดับ โมเดลการเรียนรู้เชิงลึกที่พัฒนาขึ้นมานี้ จะสามารถช่วยลดปัญหาที่เกิดจากกระบวนการค้นหาและพัฒนายาที่ใช้ในการยับยั้งการทำงานของเอนไซม์โปรตีเอสใน HIV และ HCV ได้ และยังช่วยลดข้อผิดพลาดที่เกิดขึ้นจากการใช้เทคนิคการค้นหายาโดยใช้คอมพิวเตอร์แบบดั้งเดิม ถือเป็นการเพิ่มทางเลือกในการค้นหาและพัฒนายารักษาโรคที่เกิดจากกลุ่มไวรัสดังกล่าวซึ่งมีอัตราการกลายพันธุ์สูง