Khoảng tứ phân vị là gì? Công thức tính và ý nghĩa thống kê

Khoảng tứ phân vị là gì? Công thức tính và ý nghĩa thống kê

Khoảng tứ phân vị (ký hiệu ΔQ hoặc IQR — Interquartile Range) là hiệu giữa tứ phân vị thứ ba (Q3) và tứ phân vị thứ nhất (Q1) của một tập dữ liệu. Đây là đại lượng thống kê đo mức độ phân tán của 50% dữ liệu ở phần giữa, không bị ảnh hưởng bởi các giá trị bất thường.

Khoảng tứ phân vị là gì?

Khoảng tứ phân vị là đại lượng thống kê đo lường mức độ phân tán của dữ liệu bằng cách xác định phạm vi giữa tứ phân vị thứ ba (Q3) và tứ phân vị thứ nhất (Q1). Công thức tính: ΔQ = Q3 − Q1. Kết quả cho biết độ rộng của khoảng mà 50% dữ liệu trung tâm tập trung trong đó.

Khoảng tứ phân vị là gì?
Khoảng tứ phân vị là gì?

Khoảng tứ phân vị càng lớn, dữ liệu càng phân tán. Khoảng tứ phân vị càng nhỏ, dữ liệu càng tập trung gần nhau. Đây là một trong những đại lượng đo độ phân tán phổ biến nhất trong thống kê mô tả, được giảng dạy trong chương trình Toán lớp 9 và Toán lớp 12 theo sách giáo khoa của Bộ Giáo dục và Đào tạo Việt Nam.

Tứ phân vị Q1, Q2, Q3 là gì? Nền tảng để hiểu khoảng tứ phân vị

Trước khi tính khoảng tứ phân vị, cần nắm rõ ba điểm tứ phân vị — là ba giá trị chia tập dữ liệu đã sắp xếp theo thứ tự tăng dần thành bốn phần bằng nhau, mỗi phần chiếm 25% tổng số quan sát.

  • Q1 (Tứ phân vị thứ nhất): Giá trị nằm ở vị trí 25% — là trung vị của nửa dưới tập dữ liệu. 25% giá trị nhỏ nhất nằm dưới Q1.
  • Q2 (Tứ phân vị thứ hai): Chính là trung vị của toàn bộ tập dữ liệu, chia dữ liệu thành hai nửa bằng nhau. 50% giá trị nằm dưới Q2.
  • Q3 (Tứ phân vị thứ ba): Giá trị nằm ở vị trí 75% — là trung vị của nửa trên tập dữ liệu. 75% giá trị nhỏ hơn Q3.

Khoảng tứ phân vị ΔQ = Q3 − Q1 chính là độ rộng của “hộp giữa” — phần dữ liệu nằm giữa Q1 và Q3, đại diện cho nhóm 50% quan sát có tính đại diện cao nhất của tập hợp.

Công thức tính khoảng tứ phân vị và các bước thực hiện

Để tính khoảng tứ phân vị của một mẫu số liệu không ghép nhóm, thực hiện lần lượt theo các bước sau:

  1. Sắp xếp dữ liệu: Liệt kê toàn bộ các giá trị theo thứ tự tăng dần (không giảm).
  2. Tìm Q2 (trung vị): Xác định giá trị ở giữa tập dữ liệu. Nếu n lẻ, Q2 là giá trị thứ (n+1)/2. Nếu n chẵn, Q2 là trung bình cộng của hai giá trị ở giữa.
  3. Tìm Q1: Tính trung vị của nửa dữ liệu phía dưới Q2 (không bao gồm Q2 nếu n lẻ).
  4. Tìm Q3: Tính trung vị của nửa dữ liệu phía trên Q2 (không bao gồm Q2 nếu n lẻ).
  5. Tính khoảng tứ phân vị: ΔQ = Q3 − Q1.

Đối với mẫu số liệu ghép nhóm (chương trình Toán 12), Q1 và Q3 được xác định thông qua công thức nội suy dựa trên tần số tích lũy của từng nhóm, sau đó áp dụng cùng công thức ΔQ = Q3 − Q1.

So sánh khoảng tứ phân vị và khoảng biến thiên trong thống kê

Hai đại lượng đo độ phân tán phổ biến nhất trong thống kê là khoảng biến thiên (R) và khoảng tứ phân vị (ΔQ). Lựa chọn đúng đại lượng giúp phân tích dữ liệu chính xác hơn, đặc biệt khi tập dữ liệu có giá trị bất thường.

Tiêu chí Khoảng biến thiên (R) Khoảng tứ phân vị (ΔQ)
Công thức R = Giá trị max − Giá trị min ΔQ = Q3 − Q1
Phần dữ liệu sử dụng Chỉ 2 giá trị ở 2 đầu 50% dữ liệu ở giữa
Ảnh hưởng của giá trị ngoại lệ Rất dễ bị ảnh hưởng Không bị ảnh hưởng
Độ tin cậy Thấp hơn với dữ liệu lớn Ổn định hơn với mọi cỡ mẫu
Khi nên dùng Tập dữ liệu nhỏ, không có ngoại lệ Tập dữ liệu có giá trị bất thường

Ứng dụng khoảng tứ phân vị để phát hiện giá trị ngoại lệ (outlier)

Một trong những ứng dụng quan trọng nhất của khoảng tứ phân vị là phát hiện giá trị ngoại lệ (outlier) — những điểm dữ liệu lệch quá xa so với phần còn lại của tập hợp. Phương pháp này được áp dụng rộng rãi trong phân tích dữ liệu, học máy (machine learning), và nghiên cứu khoa học.

Theo Wikipedia tiếng Việt về Điểm bất thường (thống kê), khoảng tứ phân vị (IQR) là tiêu chuẩn thường được sử dụng để phát hiện giá trị ngoại lệ: một giá trị được coi là ngoại lệ nếu nhỏ hơn Q1 − 1,5 × IQR hoặc lớn hơn Q3 + 1,5 × IQR.

Cụ thể, ngưỡng phát hiện ngoại lệ được tính như sau: Giới hạn dưới = Q1 − 1,5 × ΔQGiới hạn trên = Q3 + 1,5 × ΔQ. Bất kỳ giá trị nào nằm ngoài hai giới hạn này được xếp vào nhóm ngoại lệ, cần kiểm tra lại hoặc xử lý trước khi phân tích. Với ngoại lệ cực đoan, ngưỡng được mở rộng thành 3 × ΔQ thay vì 1,5 × ΔQ.

Ví dụ tính khoảng tứ phân vị có lời giải chi tiết

Hai ví dụ dưới đây minh họa cách tính khoảng tứ phân vị cho mẫu số liệu không ghép nhóm, từ đơn giản đến có giá trị ngoại lệ cần kiểm tra.

Ví dụ 1 — Tập dữ liệu 10 giá trị:

Điểm Toán của 10 học sinh: 10; 9; 5; 6; 1; 5; 7; 9; 5; 6. Sắp xếp tăng dần: 1; 5; 5; 5; 6; 6; 7; 9; 9; 10 (n = 10, số chẵn). Q2 = (6 + 6)/2 = 6. Nửa dưới: {1; 5; 5; 5; 6} → Q1 = 5. Nửa trên: {6; 7; 9; 9; 10} → Q3 = 9. ΔQ = 9 − 5 = 4.

Ví dụ 2 — Kiểm tra giá trị ngoại lệ:

Tập dữ liệu: {1; 2; 5; 6; 7; 8; 12; 13; 14; 15; 200}. Q1 = 5, Q3 = 14, ΔQ = 9. Giới hạn trên = 14 + 1,5 × 9 = 27,5. Giá trị 200 lớn hơn 27,5 → 200 là giá trị ngoại lệ, cần kiểm tra lại nguồn gốc dữ liệu trước khi phân tích.

Câu hỏi thường gặp về khoảng tứ phân vị là gì

Khoảng tứ phân vị ký hiệu là gì?

Khoảng tứ phân vị ký hiệu là ΔQ (trong SGK Toán Việt Nam) hoặc IQR (trong thống kê quốc tế).

Khoảng tứ phân vị được học ở lớp mấy?

Kiến thức nền (Q1, Q2, Q3) xuất hiện từ lớp 9. Khoảng tứ phân vị của mẫu số liệu ghép nhóm được học chính thức trong Toán 12.

Khoảng tứ phân vị có thể bằng 0 không?

Có. Khi Q1 = Q3, tức là ít nhất 50% dữ liệu có cùng giá trị, khoảng tứ phân vị bằng 0.

IQR và ΔQ có phải là một không?

Có, IQR (Interquartile Range) và ΔQ đều chỉ cùng một đại lượng: hiệu Q3 − Q1.

Tại sao khoảng tứ phân vị không bị ảnh hưởng bởi giá trị ngoại lệ?

Vì ΔQ chỉ dùng Q1 và Q3 — hai điểm nằm ở 25% và 75% — hoàn toàn bỏ qua các giá trị ở hai đầu cực.

Tóm lại, khoảng tứ phân vị là gì đã có câu trả lời rõ ràng: đây là hiệu Q3 − Q1, đo mức độ phân tán của 50% dữ liệu trung tâm trong một tập hợp quan sát. Ưu điểm lớn nhất của ΔQ là tính ổn định trước giá trị ngoại lệ — điều mà khoảng biến thiên không có được. Trong phân tích dữ liệu thực tế cũng như trong các bài toán Toán 9 và Toán 12, nắm vững cách tính và ý nghĩa của khoảng tứ phân vị giúp đánh giá và mô tả phân bố dữ liệu một cách chính xác và khách quan hơn.

Fenwick Trần

Fenwick Trần

Fenwick Trần là tác giả VJOL - Tạp chí Khoa học Việt Nam Trực tuyến. Ông cống hiến cho sứ mệnh lan tỏa tri thức đến cộng đồng học thuật.
https://fly88h.com/
vào m88
trực tiếp bóng đá
trực tiếp bóng đá
luongson tv