Khoảng biến thiên của mẫu số liệu: Cách tính, khoảng tứ phân vị

Khoảng biến thiên của mẫu số liệu: Cách tính, khoảng tứ phân vị

Khoảng biến thiên của mẫu số liệu là một trong những số đo độ phân tán đơn giản và cơ bản nhất trong thống kê, giúp đánh giá mức độ phân tán của dữ liệu. Bài viết này sẽ trình bày chi tiết định nghĩa, công thức tính khoảng biến thiên, ý nghĩa thực tế cùng nhiều ví dụ và bài tập có lời giải chi tiết.

Khoảng biến thiên của mẫu số liệu là gì?

Trong thống kê mô tả, bên cạnh các số đo xu thế trung tâm (trung bình, trung vị, mốt), chúng ta cần các số đo độ phân tán để đánh giá mức độ dao động của dữ liệu. Khoảng biến thiên của mẫu số liệu là số đo đơn giản nhất trong nhóm này.

Định nghĩa

Khoảng biến thiên (Range) của mẫu số liệu là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của mẫu.

Khoảng biến thiên = Giá trị lớn nhất − Giá trị nhỏ nhất

Ký hiệu

Khoảng biến thiên thường được ký hiệu là:

  • R (viết tắt của Range)
  • Hoặc \( x_{max} – x_{min} \)

Công thức tính khoảng biến thiên

Dưới đây là công thức tính khoảng biến thiên của mẫu số liệu và các bước thực hiện:

Công thức cơ bản

\( R = x_{max} – x_{min} \)

Trong đó:

Ký hiệu Ý nghĩa
\( R \) Khoảng biến thiên của mẫu số liệu
\( x_{max} \) Giá trị lớn nhất trong mẫu số liệu
\( x_{min} \) Giá trị nhỏ nhất trong mẫu số liệu

Các bước tính khoảng biến thiên

  1. Bước 1: Xác định giá trị lớn nhất \( x_{max} \) trong mẫu số liệu
  2. Bước 2: Xác định giá trị nhỏ nhất \( x_{min} \) trong mẫu số liệu
  3. Bước 3: Tính hiệu \( R = x_{max} – x_{min} \)

Lưu ý quan trọng

  • Khoảng biến thiên luôn không âm: \( R \geq 0 \)
  • \( R = 0 \) khi và chỉ khi tất cả các giá trị trong mẫu bằng nhau
  • Khoảng biến thiên có cùng đơn vị với dữ liệu gốc

Ý nghĩa của khoảng biến thiên

Khoảng biến thiên của mẫu số liệu cho ta biết nhiều thông tin hữu ích về độ phân tán của dữ liệu:

Ý nghĩa thống kê

Giá trị khoảng biến thiên Ý nghĩa
R nhỏ Dữ liệu tập trung, ít phân tán, các giá trị gần nhau
R lớn Dữ liệu phân tán rộng, các giá trị cách xa nhau
R = 0 Tất cả các giá trị trong mẫu đều bằng nhau

Ứng dụng thực tế

  • So sánh độ ổn định: Hai mẫu có cùng trung bình nhưng khoảng biến thiên khác nhau cho thấy mức độ ổn định khác nhau
  • Kiểm soát chất lượng: Trong sản xuất, khoảng biến thiên nhỏ cho thấy sản phẩm đồng đều
  • Phân tích điểm số: Đánh giá mức độ chênh lệch năng lực trong lớp học

Ưu điểm và nhược điểm của khoảng biến thiên

Để sử dụng khoảng biến thiên của mẫu số liệu hiệu quả, cần hiểu rõ ưu và nhược điểm của nó:

Ưu điểm

  • Đơn giản, dễ tính: Chỉ cần xác định giá trị lớn nhất và nhỏ nhất
  • Dễ hiểu: Ý nghĩa trực quan, dễ giải thích cho người không chuyên
  • Tính toán nhanh: Phù hợp khi cần đánh giá sơ bộ độ phân tán
  • Không cần sắp xếp dữ liệu: Chỉ cần tìm max và min

Nhược điểm

  • Chỉ sử dụng 2 giá trị: Bỏ qua thông tin từ các giá trị còn lại trong mẫu
  • Nhạy cảm với giá trị ngoại lai: Một giá trị bất thường có thể làm khoảng biến thiên tăng đột biến
  • Không phản ánh phân bố: Hai mẫu có cùng khoảng biến thiên nhưng phân bố rất khác nhau
  • Tăng theo cỡ mẫu: Mẫu càng lớn, khả năng xuất hiện giá trị cực trị càng cao

So sánh khoảng biến thiên với các số đo độ phân tán khác

Ngoài khoảng biến thiên của mẫu số liệu, còn có nhiều số đo độ phân tán khác:

Số đo Công thức/Cách tính Đặc điểm
Khoảng biến thiên (R) \( R = x_{max} – x_{min} \) Đơn giản nhất, nhạy cảm với ngoại lai
Khoảng tứ phân vị (IQR) \( IQR = Q_3 – Q_1 \) Ít nhạy cảm với ngoại lai hơn
Phương sai (\( s^2 \)) \( s^2 = \frac{\sum(x_i – \bar{x})^2}{n-1} \) Sử dụng tất cả dữ liệu
Độ lệch chuẩn (s) \( s = \sqrt{s^2} \) Cùng đơn vị với dữ liệu, phổ biến nhất

Khi nào nên dùng khoảng biến thiên?

  • Khi cần đánh giá nhanh, sơ bộ về độ phân tán
  • Khi dữ liệu không có giá trị ngoại lai
  • Khi cỡ mẫu nhỏ
  • Khi cần trình bày đơn giản, dễ hiểu

Ví dụ minh họa khoảng biến thiên của mẫu số liệu

Dưới đây là các ví dụ giúp bạn hiểu rõ cách tính khoảng biến thiên của mẫu số liệu:

Ví dụ 1: Tính khoảng biến thiên cơ bản

Đề bài: Điểm kiểm tra Toán của 10 học sinh: 7, 8, 6, 9, 5, 8, 7, 10, 6, 9. Tính khoảng biến thiên của mẫu số liệu trên.

Lời giải:

Xác định giá trị lớn nhất và nhỏ nhất:

  • Giá trị lớn nhất: \( x_{max} = 10 \)
  • Giá trị nhỏ nhất: \( x_{min} = 5 \)

Áp dụng công thức khoảng biến thiên:

\( R = x_{max} – x_{min} = 10 – 5 = 5 \)

Đáp số: Khoảng biến thiên là 5 (điểm)

Nhận xét: Điểm số trong lớp dao động trong khoảng 5 điểm, từ 5 đến 10.

Ví dụ 2: So sánh khoảng biến thiên của hai mẫu

Đề bài: Cho điểm thi của hai lớp:

  • Lớp A: 6, 7, 7, 8, 8, 8, 9, 9
  • Lớp B: 4, 5, 7, 8, 8, 9, 10, 10

Tính khoảng biến thiên của mỗi lớp và so sánh.

Lời giải:

Lớp A:

  • \( x_{max} = 9 \), \( x_{min} = 6 \)
  • \( R_A = 9 – 6 = 3 \)

Lớp B:

  • \( x_{max} = 10 \), \( x_{min} = 4 \)
  • \( R_B = 10 – 4 = 6 \)

So sánh: \( R_A < R_B \) (3 < 6)

Kết luận: Điểm số lớp A tập trung hơn, ít phân tán hơn so với lớp B. Lớp B có sự chênh lệch năng lực giữa các học sinh lớn hơn.

Ví dụ 3: Khoảng biến thiên với bảng tần số

Đề bài: Số sản phẩm bán được trong 20 ngày của một cửa hàng được ghi lại trong bảng sau:

Số sản phẩm 15 18 20 22 25
Số ngày (tần số) 2 5 7 4 2

Tính khoảng biến thiên của mẫu số liệu.

Lời giải:

Từ bảng tần số:

  • Giá trị lớn nhất: \( x_{max} = 25 \)
  • Giá trị nhỏ nhất: \( x_{min} = 15 \)

Khoảng biến thiên:

\( R = 25 – 15 = 10 \)

Đáp số: Khoảng biến thiên là 10 (sản phẩm)

Ví dụ 4: Ảnh hưởng của giá trị ngoại lai

Đề bài: Thu nhập hàng tháng (triệu đồng) của 8 nhân viên: 10, 12, 11, 13, 12, 11, 14, 50. Tính khoảng biến thiên và nhận xét.

Lời giải:

\( x_{max} = 50 \), \( x_{min} = 10 \)

\( R = 50 – 10 = 40 \) (triệu đồng)

Nhận xét: Giá trị 50 là giá trị ngoại lai (bất thường so với các giá trị còn lại từ 10-14). Khoảng biến thiên R = 40 không phản ánh đúng độ phân tán thực sự của đa số dữ liệu. Nếu bỏ giá trị ngoại lai, khoảng biến thiên chỉ là \( 14 – 10 = 4 \).

Bài tập khoảng biến thiên có lời giải chi tiết

Hãy luyện tập với các bài tập sau để thành thạo cách tính khoảng biến thiên của mẫu số liệu:

Bài tập 1

Đề bài: Chiều cao (cm) của 12 học sinh: 158, 162, 155, 170, 165, 160, 168, 157, 163, 172, 159, 166. Tính khoảng biến thiên.

Lời giải:

Xác định các giá trị cực trị:

  • \( x_{max} = 172 \) cm
  • \( x_{min} = 155 \) cm

Khoảng biến thiên:

\( R = 172 – 155 = 17 \) cm

Đáp số: Khoảng biến thiên là 17 cm

Bài tập 2

Đề bài: Nhiệt độ (°C) đo được trong 7 ngày: 28, 30, 27, 31, 29, 26, 32. Tính khoảng biến thiên của nhiệt độ.

Lời giải:

  • \( x_{max} = 32°C \)
  • \( x_{min} = 26°C \)

\( R = 32 – 26 = 6°C \)

Đáp số: Khoảng biến thiên là 6°C

Bài tập 3

Đề bài: Cho mẫu số liệu có khoảng biến thiên bằng 12. Biết giá trị nhỏ nhất là 15. Tìm giá trị lớn nhất.

Lời giải:

Từ công thức: \( R = x_{max} – x_{min} \)

Suy ra: \( x_{max} = R + x_{min} = 12 + 15 = 27 \)

Đáp số: Giá trị lớn nhất là 27

Bài tập 4

Đề bài: Thời gian (phút) hoàn thành bài tập của 15 học sinh được ghi trong bảng:

Thời gian (phút) 10 12 15 18 20
Số học sinh 1 3 6 4 1

Tính khoảng biến thiên và nhận xét.

Lời giải:

  • \( x_{max} = 20 \) phút
  • \( x_{min} = 10 \) phút

\( R = 20 – 10 = 10 \) phút

Nhận xét: Thời gian hoàn thành bài tập dao động trong khoảng 10 phút. Đa số học sinh (6/15) hoàn thành trong 15 phút, cho thấy độ phân tán không quá lớn.

Đáp số: Khoảng biến thiên là 10 phút

Bài tập 5

Đề bài: Điểm thi của hai nhóm học sinh:

  • Nhóm 1: 5, 6, 6, 7, 7, 7, 8, 8, 9
  • Nhóm 2: 3, 5, 6, 7, 7, 8, 9, 10, 10

a) Tính khoảng biến thiên của mỗi nhóm.

b) Nhóm nào có điểm số đồng đều hơn?

Lời giải:

a) Tính khoảng biến thiên:

Nhóm 1:

  • \( x_{max} = 9 \), \( x_{min} = 5 \)
  • \( R_1 = 9 – 5 = 4 \)

Nhóm 2:

  • \( x_{max} = 10 \), \( x_{min} = 3 \)
  • \( R_2 = 10 – 3 = 7 \)

b) So sánh:

Vì \( R_1 = 4 < R_2 = 7 \), nên Nhóm 1 có điểm số đồng đều hơn (ít phân tán hơn).

Bài tập 6

Đề bài: Một mẫu số liệu gồm các giá trị: \( a, a+2, a+5, a+7, a+10 \). Tính khoảng biến thiên của mẫu.

Lời giải:

Sắp xếp theo thứ tự tăng dần: \( a < a+2 < a+5 < a+7 < a+10 \)

  • \( x_{max} = a + 10 \)
  • \( x_{min} = a \)

Khoảng biến thiên:

\( R = (a + 10) – a = 10 \)

Đáp số: Khoảng biến thiên là 10 (không phụ thuộc vào a)

Bài tập 7

Đề bài: Cân nặng (kg) của 10 học sinh: 42, 45, 48, 43, 47, 50, 44, 46, 49, 45. Sau khi đo lại, phát hiện một học sinh có cân nặng 50 kg thực tế là 55 kg. Tính khoảng biến thiên trước và sau khi sửa.

Lời giải:

Trước khi sửa:

  • \( x_{max} = 50 \), \( x_{min} = 42 \)
  • \( R_{trước} = 50 – 42 = 8 \) kg

Sau khi sửa: Mẫu mới: 42, 45, 48, 43, 47, 55, 44, 46, 49, 45

  • \( x_{max} = 55 \), \( x_{min} = 42 \)
  • \( R_{sau} = 55 – 42 = 13 \) kg

Đáp số: Khoảng biến thiên trước khi sửa là 8 kg, sau khi sửa là 13 kg. Sự thay đổi một giá trị cực trị làm khoảng biến thiên tăng 5 kg.

Bài tập 8

Đề bài: Cho mẫu số liệu: 12, 15, x, 20, 25. Biết khoảng biến thiên của mẫu là 15. Tìm các giá trị có thể của x.

Lời giải:

Khoảng biến thiên \( R = x_{max} – x_{min} = 15 \)

Trường hợp 1: x không phải là giá trị cực trị

Khi đó: \( x_{max} = 25 \), \( x_{min} = 12 \)

\( R = 25 – 12 = 13 \neq 15 \) → Không thỏa mãn

Trường hợp 2: x là giá trị lớn nhất (\( x > 25 \))

\( x – 12 = 15 \Rightarrow x = 27 \)

Kiểm tra: \( 27 > 25 \) ✓

Trường hợp 3: x là giá trị nhỏ nhất (\( x < 12 \))

\( 25 – x = 15 \Rightarrow x = 10 \)

Kiểm tra: \( 10 < 12 \) ✓

Đáp số: \( x = 10 \) hoặc \( x = 27 \)

Kết luận

Khoảng biến thiên của mẫu số liệu là số đo độ phân tán đơn giản và dễ tính nhất trong thống kê. Qua bài viết này, chúng ta đã tìm hiểu:

  • Định nghĩa: Khoảng biến thiên là hiệu giữa giá trị lớn nhất và nhỏ nhất
  • Công thức: \( R = x_{max} – x_{min} \)
  • Ý nghĩa: Đo lường mức độ phân tán của dữ liệu
  • Ưu điểm: Đơn giản, dễ tính, dễ hiểu
  • Nhược điểm: Nhạy cảm với giá trị ngoại lai, chỉ dùng 2 giá trị

Việc nắm vững khoảng biến thiên của mẫu số liệu giúp bạn có cái nhìn ban đầu về độ phân tán của dữ liệu, từ đó có thể kết hợp với các số đo khác như phương sai, độ lệch chuẩn để phân tích dữ liệu toàn diện hơn.

Fenwick Trần

Fenwick Trần

Fenwick Trần là tác giả VJOL - Tạp chí Khoa học Việt Nam Trực tuyến. Ông cống hiến cho sứ mệnh lan tỏa tri thức đến cộng đồng học thuật.