BoxPlot คือ กราฟชนิดหนึ่ง คิดค้นขึ้นเมื่อปี 1977 โดยนักสถิติชาวอังกฤษชื่อ N A Sheldon ใช้แสดงสาระที่สำคัญของข้อมูลคือ
ค่ากลาง ค่าการกระจาย สัดส่วนข้อมูลที่มากหรือน้อยกว่าค่ากลาง
(Symmetry ) รวมทั้งข้อมูลที่อยู่ห่างจากกลุ่มมากๆ
(Outlier)
Box
plot จะแสดงข้อมูลทั้งหมดออกมา 3 Quartiles โดยมีการจัดเรียงอันดับของข้อมูลแล้ว
ข้อมูลที่ตกอยู่ภายใต้ Q1 (Quartile 1) คือข้อมูล 25%
แรกจากค่าต่ำขึ้นมา จะแสดงในรูปเส้นตรง หนึ่งเส้น (Whisker)
ข้อมูลที่ตกอยู่ภายใต้ Q2 คือข้อมูลตัวที่มากกว่า
25% จนถึงตัวที่ 75% โดยแสดงออกมาในรูป
สี่เหลี่ยมผืนผ้า ภายใน Q3 นี้ จะมีค่าที่ 50% ของข้อมูลอยู่ เขียนแทนด้วยเส้นตรงอยู่ภายในรูปสี่เหลี่ยมผืนผ้า
ค่านี้คือค่าค่ากลางของข้อมูลทั้งหมด (Median) และตรงค่า
เฉลี่ย (Mean) จะแทนด้วย เครื่องหมายบวก
โดยที่ค่าอาจจะเท่าหรือต่างกับค่า Median ก็ได้
ส่วนค่าที่ตกอยู่ภายใต้ Q3 คือตัวที่มากกว่า 75%
ขึ้นไป จะเขียนแทนด้วยเส้นตรง เช่นเดียวกับ Q1
วิธีหาจุดเริ่มต้นของ Q1 และจุดสุดท้ายของ Q3 จะหามาจากสมการตามที่ปรากฏ อยู่ในรูป ดังนั้น ค่าที่ต่ำกว่า ค่าเริ่มต้นของ Q1 และค่าสุดท้ายของ Q3 จะเรียกว่า Outlier เขียนสัญญลักญ์แทนด้วย *
ถ้าสังเกตดูเราจะพบว่า เส้นค่ากลางจะแบ่งจำนวนขอ้มูลใน Q2 ออกเป็นสองส่วนเท่าๆกัน ดังนั้นถ้า ค่ากลางนี้ไม่ได้อยู่ตรงกลางรูปสี่เหลี่ยมผืนผ้า นั่นหมายถึงรูปกราฟจะเบ้ ไป หรือความหนาแน่นของข้อมูลจะไม่เท่ากัน แต่โดยทั่วไปโปรแกรมทางสถิติจะมีคำสั่งให้ทำ Box plot ให้ใช้
วิธีหาจุดเริ่มต้นของ Q1 และจุดสุดท้ายของ Q3 จะหามาจากสมการตามที่ปรากฏ อยู่ในรูป ดังนั้น ค่าที่ต่ำกว่า ค่าเริ่มต้นของ Q1 และค่าสุดท้ายของ Q3 จะเรียกว่า Outlier เขียนสัญญลักญ์แทนด้วย *
ถ้าสังเกตดูเราจะพบว่า เส้นค่ากลางจะแบ่งจำนวนขอ้มูลใน Q2 ออกเป็นสองส่วนเท่าๆกัน ดังนั้นถ้า ค่ากลางนี้ไม่ได้อยู่ตรงกลางรูปสี่เหลี่ยมผืนผ้า นั่นหมายถึงรูปกราฟจะเบ้ ไป หรือความหนาแน่นของข้อมูลจะไม่เท่ากัน แต่โดยทั่วไปโปรแกรมทางสถิติจะมีคำสั่งให้ทำ Box plot ให้ใช้
No comments:
Post a Comment