การใช้งานทฤษฎีเบย์ (Bayes’s Theorem) ในการแก้โจทย์ปัญหาพันธุศาสตร์
การใช้งานทฤษฎีเบย์ (Bayes’s Theorem)
ในการแก้โจทย์ปัญหาพันธุศาสตร์
โดย นายสิทธิชาติ สิทธิ (ครูโรงเรียนหนองบัวพิทยาคาร)
เจ้าของเว็บไซต์ : www.krupbank.com
CREDIT : Engkarat Techapanurak (Ph.D. Student in Computer Vision)
__________
ทฤษฎีความน่าจะเป็นแบบเบย์
ความน่าจะเป็นแบบเบย์ เป็นทฤษฎีที่พูดถึงความน่าจะเป็นในการเกิดสิ่งหนึ่ง ก็ต่อเมื่ออีกสิ่งที่ได้เกิดขึ้น หรือที่เรียกกันว่า “Given” ซึ่งลักษณะของการเขียนสัญลักษณ์ คือ P(A|B) อ่านว่า ความน่าจะเป็นของเหตุการณ์ A เมื่อเกิดเหตุการณ์ B แล้ว
ตัวอย่าง
สมมุติว่า เราได้ไปร่วมงานวันเกิดของเพื่อนเรา ซึ่งมีคนมาร่วมทั้งหมด 20 คน แล้วมีความจับสลากแจกตั๋วล่องเรือสำราญ 5 ใบสำหรับแขกที่มาในงานผู้จัดงานเลยทำสลากใส่กล่อง 2 ใบ จากนี้ไปเราจะขอเรียกมันว่ากล่อง X และ Y
จากสถานการณ์ข้างต้น ถ้าเรากำหนดตัวแปร คือ
กำหนดให้ เหตุการณ์ A คือ การเลือกกล่อง ซึ่งมีสมาชิกคือ A = {กล่อง X, กล่อง Y}
กำหนดให้ เหตุการณ์ B คือ การเลือกจับสลาก ซึ่งมีสมาชิกคือ B = {ได้ตั๋วเรือ, ไม่ได้ตั๋วเรือ}
เราสามารถสรุปความน่าจะเป็นได้ดังนี้
ความน่าจะเป็นของการเลือกกล่อง X และกล่อง Y คือ 1/2 และ 1/2 ตามลำดับ
ความน่าจะเป็นของการได้ตั๋วเรือ และไม่ได้ตั๋วเรือ คือ 5/20 และ 15/20 ตามลำดับ
เขียนเป็นสัญลักษณ์ได้ดังนี้
P(เลือกกล่อง X) = 1/2
P(เลือกกล่อง Y) = 1/2
P(ได้ตั๋วเรือ) = 5/20
P(ไม่ได้ตั๋วเรือ) = 15/20
แต่ทีนี้ หลังจากที่เราได้จับสลากแล้ว ผลปรากฎว่าไม่ได้ตั๋ว ตอนท้ายงานก็เลยไปคุยกับเพื่อนที่เป็นคนจัดงาน ทำให้รู้ว่ากล่อง X และกล่อง Y มีการใส่ตั๋วเรือเอาไว้ไม่เท่ากัน กล่อง X มีตั๋วอยู่ 3 ใบ จากสลาก 10 ใบ และกล่อง Y มีตั๋ว 2 ใบจาก 10 ใบ ซึ่งจากข้อมูลนี้ จะเขียนเป็นสัญลักษณ์ได้ใหม่ดังนี้
ความน่าจะเป็นของการได้ตั๋วเรือ เมื่อเลือกกล่อง X คือ P(ได้ตั๋วเรือ|เลือกกล่อง X) = 3/10
ความน่าจะเป็นของการไม่ได้ตั๋วเรือ เมื่อเลือกกล่อง X คือ P(ไม่ได้ตั๋วเรือ|เลือกกล่อง X) = 7/10
ความน่าจะเป็นของการได้ตั๋วเรือ เมื่อเลือกกล่อง Y คือ P(ได้ตั๋วเรือ|เลือกกล่อง Y) = 2/10
ความน่าจะเป็นของการไม่ได้ตั๋วเรือ เมื่อเลือกกล่อง Y คือ P(ไม่ได้ตั๋วเรือ|เลือกกล่อง Y) = 8/10
ถ้าเรามาสรุปความน่าจะเป็นในภาพรวมแล้วเราจะสามารถแบ่งออกเป็นกรณีต่างๆ โดยใช้เงื่อนไขจากเหตุการณ์ A และ B พร้อมๆ กัน (Joint Probability) ได้ดังต่อไปนี้
ได้ตั๋วเรือ และมาจากกล่อง X : P(B=ได้ตั๋วเรือ, A=กล่อง X) = 3/20
ไม่ได้ตั๋วเรือ และมาจากกล่อง X : P(B=ไม่ได้ตั๋วเรือ, A=กล่อง X) = 7/20
ได้ตั๋วเรือ และมาจากกล่อง Y : P(B=ได้ตั๋วเรือ, A=กล่อง Y) = 2/20
ไม่ได้ตั๋วเรือ และมาจากกล่อง Y : P(B=ไม่ได้ตั๋วเรือ, A=กล่อง Y) = 8/20
จะเห็นว่า Joint Probability จะเขียนด้วยเครื่องหมาย “,” (comma) ซึ่งไม่เหมือนกับความน่าจะเป็นแบบมีเงื่อนไขที่ใช้ “|” (อ่านว่า Given)
ซึ่งจากเหตุการณ์ทั้งหมด เบย์ได้ทำการสรุปความสัมพันธ์เอาไว้ดังนี้
P(A, B) = P(A|B) x P(B)
P(B, A) = P(B|A) x P(A)
เมื่อ P(A, B) = P(B, A)
ดังนั้น P(A, B) = P(A|B) x P(B) = P(B|A) x P(A)
และเมื่อ P(A|B) x P(B) = P(B|A) x P(A) เมื่อย้ายข้างสมการ จะได้
P(A|B) = P(B|A) x P(A) / P(B)
กลับมาถึงเหตุการณ์ปาร์ตี้วันเกิดในตอนแรก หลังจากที่เราได้รู้ข่าวว่ามีเพื่อนคนหนึ่ง ชื่อไอ้เบลล์ ซึ่งได้ตั๋วเรือไปจากการจับสลาก ก็เลยสงสัยว่าไอ้เบลล์น่าจะเลือกหยิบสลากจากกล่องไหนนะ
เพื่อนเจ้าของวันเกิดเลยท้าให้เดา มีตั๋วอยู่อีกใบนึง ถ้าเราเดาถูกจะเอาตั๋วใบนี้ให้เรา
เรามาสรุปความน่าจะเป็นตอนนี้ คือ
P(เลือกกล่อง X|ได้ตั๋วเรือ) = P(ได้ตั๋วเรือ|เลือกกล่อง X) x P(เลือกกล่อง X) / P(ได้ตั๋วเรือ)
= (3/10 x 1/2) / 5/20 = 3/5 = 0.6
P(เลือกกล่อง Y|ได้ตั๋วเรือ) = P(ได้ตั๋วเรือ|เลือกกล่อง Y) x P(เลือกกล่อง X) / P(ได้ตั๋วเรือ)
= (2/10 x 1/2) / 5/20 = ⅖ = 0.4
ดังนั้น ไอ้เบลล์ มีโอกาสได้ตั๋วเรือจากการเลือกจากกล่อง X เท่ากับ 60% และมีโอกาสได้ตั๋วเรือจากการเลือกจากกล่อง Y เท่ากับ 40%
ตัวอย่างการคิดโจทย์ Pat 2 ปี 2562 ด้วยทฤษฎีเบย์
จากพันธุประวัติข้างต้น เป็นโรคที่อยู่บนยีนด้อยของโครโซมร่างกาย
- มีการข้ามรุ่น (ผ่าเหล่า)
- พ่อไม่เป็นโรค (I-2) แต่ลูกสาวเป็นโรค (II-1)
(พ่อเป็นพาหะของโรคได้ต้องเป็นโรคที่อยู่บนยีนด้อยของโครโซมร่างกาย)
เทคนิคการดูพันธุประวัติ ภานใน 10 วินาที
ดังนั้นเมื่อเขียน Genotype ทั้งหมดออกมาจะได้ดังนี้
จากนั้น โจทย์ถามว่า ถ้า III-4 แต่งงานกับ คนที่เป็น Heterozygous ลูกจะมีโอกาสเป็นโรคเท่าใด
ปัญหาคือเราไม่สามารถสรุปได้ว่า III-4 มี Genotype เป็นอะไร
จุดนี้เลยต้องนำทฤษฎีเบย์มาช่วยอธิบาย
แต่สิ่งที่เรารู้แน่นอนคือ III-4 ต้องมี A อย่างน้อย 1 อัลลีล
ซึ่งมีโอกาสที่เกิดขึ้น 3 เหตุการณ์ คือ AA, Aa, Aa
ส่วน aa (เกิดขึ้นไม่ได้ เพราะพันธุประวัติ III-4 ไม่ได้เป็นโรค)
ดังนั้นหตุการณ์ A_ มีทั้งหมด 3 เหตุการณ์ เขียนเป็นสัญลักษณ์คือ P(A_) = 3
และ P(Aa | A_) = 2/3 (อ่านว่าความน่าจะเป็นที่จะเกิด Aa เมื่อเกิดเหตุการณ์ A_ แล้ว)
และ P(AA | A_) = 1/3 (อ่านว่าความน่าจะเป็นที่จะเกิด AA เมื่อเกิดเหตุการณ์ A_ แล้ว)
ไม่มีความคิดเห็น: