เทคนิคการตอบเชิงสุ่มสำหรับแบบสอบถามที่มีระดับและวิธีเลื่อนเชิงเส้นที่ดีที่สุด
- ชื่อนักเรียนผู้จัดทำโครงงานวิทยาศาสตร์
ตนุภัทร ตระกูลธงชัย, กันตินันท์ ไหลประเสริฐ, กรชวัลร์ ตันติวิเศษศักดิ์
- อาจารย์ที่ปรึกษาโครงงานวิทยาศาสตร์
พรรษ วติวุฒิพงศ์, วสนนท์ พงษ์สวัสดิ์
- โรงเรียนที่กำกับดูแลโครงงานวิทยาศาสตร์
- ปีที่จัดทำโครงงานวิทยาศาสตร์
บทคัดย่อโครงงานวิทยาศาสตร์
วิธีการตอบเชิงสุ่ม (randomized response) เป็นวิธีการทำแบบสอบถามที่เพิ่มความเป็นส่วนตัวให้กับผู้ตอบแบบสอบถาม และทำให้ผู้ตอบแบบสอบถามที่มีความอ่อนไหวตามความเป็นจริงมากขึ้น วิธีการตอบเชิงสุ่มได้รับการพัฒนาจากแบบคำถามทวิภาค ไปยังคำถามที่มีหลายคำตอบ และคำถามเชิงปริมาณ แต่ยังไม่มีผู้ศึกษาวิธีการตอบเชิงสุ่มสำหรับคำถามที่มีคำตอบหลายระดับ โครงงานนี้จัดทำขึ้นเพื่อศึกษาวิธีการตอบเชิงสุ่มในแบบสอบถามที่มีคำตอบ K+1 ระดับ เมื่อ K>0 หาวิธีการเลื่อนเชิงเส้นที่ดีที่สุดสำหรับแต่ละสถานการณ์ และศึกษาการรักษาความสัมพันธ์ของตัวแปรสุ่มก่อนและหลังใช้วิธีการสุ่ม วิธีการสุ่มที่เรานำเสนอ คือ วิธีการเลื่อนเชิงเส้น (linear shifting) เนื่องจากเป็นวิธีที่สามารถนำไปใช้งานกับการทำแบบสอบถามในชีวิตจริงได้ง่าย ซึ่งวิธีการเลื่อนเชิงเส้นคือวิธีการสุ่มที่มีความน่าจะเป็น p ที่จะเปลี่ยนคำตอบจริง x เป็นคำตอบสุ่ม f(x) เมื่อ f เป็นฟังก์ชันเชิงเส้นในมอดุโล K+1 และมีความน่าจะเป็น 1-p ที่คำตอบจะไม่ถูกเปลี่ยน ในทางทฤษฎี เราได้สร้างฟังก์ชันค่าความแม่นยำและฟังก์ชันค่าความเป็นส่วนตัวเพื่อนำมาใช้หาวิธีการสุ่มที่ดีที่สุดผ่านการสร้างฟังก์ชันอรรถประโยชน์ และพัฒนาวิธีการวิเคราะห์การถดถอยเชิงเส้น (linear regression) สำหรับข้อมูลที่เป็นคำตอบสุ่ม เราทำการทดลองที่ 1 เพื่อหาค่าความแม่นยำ ค่าความเป็นส่วนตัว และค่าอรรถประโยชน์ของวิธีการเลื่อนเชิงเส้นแต่ละวิธี สำหรับ K+1=5 และ K+1=6 ด้วยวิธีมอนติคาโล โดยได้ผลว่าในกรณี K+1=5 ฟังก์ชัน f ที่ดีที่สุดคือ f(x)=4x+4 และกรณี K+1=6 ฟังก์ชัน f ที่ดีที่สุดคือ f(x)=5x+5 สำหรับกรณีที่เน้นความเป็นส่วนตัว และ f(x)=x+4 สำหรับกรณีที่เน้นความแม่นยำ ต่อมาเราทำการทดลองตอนที่ 2 ด้วยการใช้ข้อมูลสังเคราะห์และข้อมูลจริงจากการสำรวจประสิทธิภาพของการเรียนออนไลน์ในช่วงการแพร่ระบาดของโรคโควิด-19 หาค่า R squared ของฟังก์ชันที่ได้จากการถดถอยเชิงเส้นด้วยคำตอบจริง และเปรียบเทียบกับค่า R squared ของฟังก์ชันที่ได้จากการถดถอยเชิงเส้นด้วยคำตอบสุ่ม พบว่สำหรับข้อมูลจริง เมื่อ 0