เทคนิคการตอบเชิงสุ่มสำหรับแบบสอบถามที่มีระดับและวิธีเลื่อนเชิงเส้นที่ดีที่สุด

ชื่อนักเรียนผู้จัดทำโครงงานวิทยาศาสตร์

ตนุภัทร ตระกูลธงชัย, กันตินันท์ ไหลประเสริฐ, กรชวัลร์ ตันติวิเศษศักดิ์

อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์

พรรษ วติวุฒิพงศ์, วสนนท์ พงษ์สวัสดิ์

โรงเรียนที่กำกับดูแลโครงงานวิทยาศาสตร์

โรงเรียนกำเนิดวิทย์

ปีที่จัดทำโครงงานวิทยาศาสตร์

พ.ศ. 2565

บทคัดย่อโครงงานวิทยาศาสตร์

วิธีการตอบเชิงสุ่ม (randomized response) เป็นวิธีการทำแบบสอบถามที่เพิ่มความเป็นส่วนตัวให้กับผู้ตอบแบบสอบถาม และทำให้ผู้ตอบแบบสอบถามที่มีความอ่อนไหวตามความเป็นจริงมากขึ้น วิธีการตอบเชิงสุ่มได้รับการพัฒนาจากแบบคำถามทวิภาค ไปยังคำถามที่มีหลายคำตอบ และคำถามเชิงปริมาณ แต่ยังไม่มีผู้ศึกษาวิธีการตอบเชิงสุ่มสำหรับคำถามที่มีคำตอบหลายระดับ โครงงานนี้จัดทำขึ้นเพื่อศึกษาวิธีการตอบเชิงสุ่มในแบบสอบถามที่มีคำตอบ K+1 ระดับ เมื่อ K>0 หาวิธีการเลื่อนเชิงเส้นที่ดีที่สุดสำหรับแต่ละสถานการณ์ และศึกษาการรักษาความสัมพันธ์ของตัวแปรสุ่มก่อนและหลังใช้วิธีการสุ่ม วิธีการสุ่มที่เรานำเสนอ คือ วิธีการเลื่อนเชิงเส้น (linear shifting) เนื่องจากเป็นวิธีที่สามารถนำไปใช้งานกับการทำแบบสอบถามในชีวิตจริงได้ง่าย ซึ่งวิธีการเลื่อนเชิงเส้นคือวิธีการสุ่มที่มีความน่าจะเป็น p ที่จะเปลี่ยนคำตอบจริง x เป็นคำตอบสุ่ม f(x) เมื่อ f เป็นฟังก์ชันเชิงเส้นในมอดุโล K+1 และมีความน่าจะเป็น 1-p ที่คำตอบจะไม่ถูกเปลี่ยน ในทางทฤษฎี เราได้สร้างฟังก์ชันค่าความแม่นยำและฟังก์ชันค่าความเป็นส่วนตัวเพื่อนำมาใช้หาวิธีการสุ่มที่ดีที่สุดผ่านการสร้างฟังก์ชันอรรถประโยชน์ และพัฒนาวิธีการวิเคราะห์การถดถอยเชิงเส้น (linear regression) สำหรับข้อมูลที่เป็นคำตอบสุ่ม เราทำการทดลองที่ 1 เพื่อหาค่าความแม่นยำ ค่าความเป็นส่วนตัว และค่าอรรถประโยชน์ของวิธีการเลื่อนเชิงเส้นแต่ละวิธี สำหรับ K+1=5 และ K+1=6 ด้วยวิธีมอนติคาโล โดยได้ผลว่าในกรณี K+1=5 ฟังก์ชัน f ที่ดีที่สุดคือ f(x)=4x+4 และกรณี K+1=6 ฟังก์ชัน f ที่ดีที่สุดคือ f(x)=5x+5 สำหรับกรณีที่เน้นความเป็นส่วนตัว และ f(x)=x+4 สำหรับกรณีที่เน้นความแม่นยำ ต่อมาเราทำการทดลองตอนที่ 2 ด้วยการใช้ข้อมูลสังเคราะห์และข้อมูลจริงจากการสำรวจประสิทธิภาพของการเรียนออนไลน์ในช่วงการแพร่ระบาดของโรคโควิด-19 หาค่า R squared ของฟังก์ชันที่ได้จากการถดถอยเชิงเส้นด้วยคำตอบจริง และเปรียบเทียบกับค่า R squared ของฟังก์ชันที่ได้จากการถดถอยเชิงเส้นด้วยคำตอบสุ่ม พบว่สำหรับข้อมูลจริง เมื่อ 0