Bài 17.
a) Tính số trung bình và độ lệch chuẩn của mẫu số liệu ghép nhóm trên.
Trước tiên, ta tính số trung bình của mỗi nhóm:
- Nhóm [4,5; 5): Trung bình là $\frac{4,5 + 5}{2} = 4,75$
- Nhóm [5; 5,5): Trung bình là $\frac{5 + 5,5}{2} = 5,25$
- Nhóm [5,5; 6): Trung bình là $\frac{5,5 + 6}{2} = 5,75$
- Nhóm [6; 6,5): Trung bình là $\frac{6 + 6,5}{2} = 6,25$
Bây giờ, ta tính số trung bình của mẫu số liệu ghép nhóm:
\[
\bar{x} = \frac{(4,75 \times 3) + (5,25 \times 8) + (5,75 \times 7) + (6,25 \times 2)}{20}
\]
\[
\bar{x} = \frac{14,25 + 42 + 40,25 + 12,5}{20} = \frac{109}{20} = 5,45
\]
Tiếp theo, ta tính độ lệch chuẩn của mẫu số liệu ghép nhóm:
\[
s = \sqrt{\frac{\sum_{i=1}^{n} f_i (x_i - \bar{x})^2}{n}}
\]
Trong đó, \(f_i\) là tần số của nhóm thứ i, \(x_i\) là trung bình của nhóm thứ i, và \(\bar{x}\) là số trung bình của mẫu số liệu.
Ta tính từng phần:
\[
(4,75 - 5,45)^2 = (-0,7)^2 = 0,49
\]
\[
(5,25 - 5,45)^2 = (-0,2)^2 = 0,04
\]
\[
(5,75 - 5,45)^2 = (0,3)^2 = 0,09
\]
\[
(6,25 - 5,45)^2 = (0,8)^2 = 0,64
\]
Bây giờ, ta tính tổng:
\[
\sum_{i=1}^{n} f_i (x_i - \bar{x})^2 = (3 \times 0,49) + (8 \times 0,04) + (7 \times 0,09) + (2 \times 0,64)
\]
\[
= 1,47 + 0,32 + 0,63 + 1,28 = 3,7
\]
Cuối cùng, ta tính độ lệch chuẩn:
\[
s = \sqrt{\frac{3,7}{20}} = \sqrt{0,185} \approx 0,43
\]
Vậy, số trung bình của mẫu số liệu ghép nhóm là 5,45 và độ lệch chuẩn là khoảng 0,43.
b) Số trung bình và độ lệch chuẩn cho biết thông tin gì?
- Số trung bình cho biết giá trị trung tâm của dữ liệu, tức là giá trị đại diện cho cả nhóm dữ liệu. Trong trường hợp này, giá trị trung bình của đường kính nhân tế bào là 5,45 μm.
- Độ lệch chuẩn cho biết mức độ phân tán của dữ liệu xung quanh giá trị trung bình. Độ lệch chuẩn càng nhỏ, dữ liệu càng tập trung gần với giá trị trung bình. Trong trường hợp này, độ lệch chuẩn là khoảng 0,43, cho thấy các kết quả đo lường đường kính nhân tế bào có sự phân tán không lớn, chủ yếu tập trung gần giá trị trung bình 5,45 μm.
Bài 18.
Để xác định vận động viên nào có thành tích luyện tập ổn định hơn, ta sẽ tính độ lệch chuẩn của thời gian chạy của hai vận động viên A và B. Độ lệch chuẩn càng nhỏ thì thành tích luyện tập càng ổn định.
Bước 1: Tính trung bình cộng của thời gian chạy của mỗi vận động viên
Vận động viên A:
- Thời gian trung bình:
\[
\bar{x}_A = \frac{(10 + 10,3) \times 2 + (10,3 + 10,6) \times 10 + (10,6 + 10,9) \times 5 + (10,9 + 11,2) \times 3}{2 + 10 + 5 + 3}
\]
\[
= \frac{(20,3 \times 2) + (20,9 \times 10) + (21,5 \times 5) + (22,1 \times 3)}{20}
\]
\[
= \frac{40,6 + 209 + 107,5 + 66,3}{20} = \frac{423,4}{20} = 21,17 \text{ giây}
\]
Vận động viên B:
- Thời gian trung bình:
\[
\bar{x}_B = \frac{(10 + 10,3) \times 3 + (10,3 + 10,6) \times 7 + (10,6 + 10,9) \times 9 + (10,9 + 11,2) \times 6}{3 + 7 + 9 + 6}
\]
\[
= \frac{(20,3 \times 3) + (20,9 \times 7) + (21,5 \times 9) + (22,1 \times 6)}{25}
\]
\[
= \frac{60,9 + 146,3 + 193,5 + 132,6}{25} = \frac{533,3}{25} = 21,332 \text{ giây}
\]
Bước 2: Tính phương sai và độ lệch chuẩn của thời gian chạy của mỗi vận động viên
Vận động viên A:
- Phương sai:
\[
s_A^2 = \frac{\sum_{i=1}^{n} f_i (x_i - \bar{x}_A)^2}{n}
\]
\[
= \frac{2(10,15 - 21,17)^2 + 10(10,45 - 21,17)^2 + 5(10,75 - 21,17)^2 + 3(11,05 - 21,17)^2}{20}
\]
\[
= \frac{2(-11,02)^2 + 10(-10,72)^2 + 5(-10,42)^2 + 3(-10,12)^2}{20}
\]
\[
= \frac{2(121,4404) + 10(114,9184) + 5(108,5764) + 3(102,4144)}{20}
\]
\[
= \frac{242,8808 + 1149,184 + 542,882 + 307,2432}{20} = \frac{2242,18}{20} = 112,109
\]
- Độ lệch chuẩn:
\[
s_A = \sqrt{112,109} \approx 10,59
\]
Vận động viên B:
- Phương sai:
\[
s_B^2 = \frac{\sum_{i=1}^{n} f_i (x_i - \bar{x}_B)^2}{n}
\]
\[
= \frac{3(10,15 - 21,332)^2 + 7(10,45 - 21,332)^2 + 9(10,75 - 21,332)^2 + 6(11,05 - 21,332)^2}{25}
\]
\[
= \frac{3(-11,182)^2 + 7(-10,882)^2 + 9(-10,582)^2 + 6(-10,282)^2}{25}
\]
\[
= \frac{3(124,999) + 7(118,419) + 9(112,006) + 6(105,727)}{25}
\]
\[
= \frac{374,997 + 828,933 + 1008,054 + 634,362}{25} = \frac{2846,346}{25} = 113,85384
\]
- Độ lệch chuẩn:
\[
s_B = \sqrt{113,85384} \approx 10,67
\]
Kết luận:
Vận động viên A có độ lệch chuẩn nhỏ hơn (10,59 < 10,67), do đó vận động viên A có thành tích luyện tập ổn định hơn.
Bài 19.
Để tính khoảng biến thiên, khoảng tứ phân vị và độ lệch chuẩn của mẫu số liệu ghép nhóm, chúng ta sẽ thực hiện các bước sau:
Bước 1: Xác định khoảng biến thiên
Khoảng biến thiên là hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất trong dãy số.
Trong bảng dữ liệu, thời gian nghe nhạc liên tục từ 5 giờ đến 7,5 giờ. Do đó, khoảng biến thiên là:
\[
Khoảng biến thiên = 7,5 - 5 = 2,5 \text{ giờ}
\]
Bước 2: Xác định khoảng tứ phân vị
Khoảng tứ phân vị là hiệu giữa giá trị Q3 (quartile thứ ba) và giá trị Q1 (quartile thứ nhất).
Tìm Q1 (quartile thứ nhất)
Q1 là giá trị ở vị trí $\frac{n}{4}$ trong dãy số đã sắp xếp. Với n = 40 (tổng số điện thoại), ta có:
\[
\frac{40}{4} = 10
\]
Vị trí thứ 10 nằm trong nhóm [6; 6,5). Do đó, Q1 là trung bình cộng của giới hạn dưới và giới hạn trên của nhóm này:
\[
Q1 = \frac{6 + 6,5}{2} = 6,25 \text{ giờ}
\]
Tìm Q3 (quartile thứ ba)
Q3 là giá trị ở vị trí $\frac{3n}{4}$ trong dãy số đã sắp xếp. Với n = 40, ta có:
\[
\frac{3 \times 40}{4} = 30
\]
Vị trí thứ 30 nằm trong nhóm [6,5; 7). Do đó, Q3 là trung bình cộng của giới hạn dưới và giới hạn trên của nhóm này:
\[
Q3 = \frac{6,5 + 7}{2} = 6,75 \text{ giờ}
\]
Khoảng tứ phân vị là:
\[
Khoảng tứ phân vị = Q3 - Q1 = 6,75 - 6,25 = 0,5 \text{ giờ}
\]
Bước 3: Xác định độ lệch chuẩn
Độ lệch chuẩn là một phép đo độ phân tán của các giá trị trong dãy số. Chúng ta sẽ tính trung bình cộng và phương sai trước, sau đó tìm độ lệch chuẩn.
Tính trung bình cộng
Trung bình cộng là tổng các giá trị nhân với tần số chia cho tổng số lượng:
\[
\bar{x} = \frac{\sum_{i=1}^{k} f_i x_i}{n}
\]
Trong đó, \(f_i\) là tần số của nhóm thứ i, \(x_i\) là giá trị trung tâm của nhóm thứ i, và n là tổng số lượng.
Giá trị trung tâm của mỗi nhóm là trung bình cộng của giới hạn dưới và giới hạn trên của nhóm đó:
- Nhóm [5; 5,5): Giá trị trung tâm là 5,25
- Nhóm [5,5; 6): Giá trị trung tâm là 5,75
- Nhóm [6; 6,5): Giá trị trung tâm là 6,25
- Nhóm [6,5; 7): Giá trị trung tâm là 6,75
- Nhóm [7; 7,5): Giá trị trung tâm là 7,25
Tính trung bình cộng:
\[
\bar{x} = \frac{(2 \times 5,25) + (8 \times 5,75) + (15 \times 6,25) + (10 \times 6,75) + (5 \times 7,25)}{40}
\]
\[
\bar{x} = \frac{10,5 + 46 + 93,75 + 67,5 + 36,25}{40} = \frac{253,5}{40} = 6,3375 \text{ giờ}
\]
Tính phương sai
Phương sai là trung bình cộng của bình phương các độ lệch từ trung bình cộng:
\[
s^2 = \frac{\sum_{i=1}^{k} f_i (x_i - \bar{x})^2}{n}
\]
Tính phương sai:
\[
s^2 = \frac{(2 \times (5,25 - 6,3375)^2) + (8 \times (5,75 - 6,3375)^2) + (15 \times (6,25 - 6,3375)^2) + (10 \times (6,75 - 6,3375)^2) + (5 \times (7,25 - 6,3375)^2)}{40}
\]
\[
s^2 = \frac{(2 \times (-1,0875)^2) + (8 \times (-0,5875)^2) + (15 \times (-0,0875)^2) + (10 \times (0,4125)^2) + (5 \times (0,9125)^2)}{40}
\]
\[
s^2 = \frac{(2 \times 1,18265625) + (8 \times 0,34515625) + (15 \times 0,00765625) + (10 \times 0,17015625) + (5 \times 0,83265625)}{40}
\]
\[
s^2 = \frac{2,3653125 + 2,76125 + 0,11484375 + 1,7015625 + 4,16328125}{40} = \frac{10,10625}{40} = 0,25265625
\]
Tính độ lệch chuẩn
Độ lệch chuẩn là căn bậc hai của phương sai:
\[
s = \sqrt{s^2} = \sqrt{0,25265625} \approx 0,5026 \text{ giờ}
\]
Kết luận
- Khoảng biến thiên: 2,5 giờ
- Khoảng tứ phân vị: 0,5 giờ
- Độ lệch chuẩn: 0,5026 giờ
Bài 20.
Để giải quyết câu hỏi trên, chúng ta sẽ thực hiện các bước sau:
a) Về trung bình, đầu tư vào lĩnh vực nào đem lại tiền lãi cao hơn?
Bước 1: Tính trung bình cộng của tiền lãi cho mỗi lĩnh vực.
Lĩnh vực A:
\[
\text{Trung bình cộng} = \frac{(7.5 \times 2) + (12.5 \times 5) + (17.5 \times 8) + (22.5 \times 6) + (27.5 \times 4)}{2 + 5 + 8 + 6 + 4}
\]
\[
= \frac{(15) + (62.5) + (140) + (135) + (110)}{25}
\]
\[
= \frac{462.5}{25} = 18.5 \text{ (triệu đồng)}
\]
Lĩnh vực B:
\[
\text{Trung bình cộng} = \frac{(7.5 \times 8) + (12.5 \times 4) + (17.5 \times 2) + (22.5 \times 5) + (27.5 \times 6)}{8 + 4 + 2 + 5 + 6}
\]
\[
= \frac{(60) + (50) + (35) + (112.5) + (165)}{25}
\]
\[
= \frac{422.5}{25} = 16.9 \text{ (triệu đồng)}
\]
Vậy, về trung bình, đầu tư vào lĩnh vực A đem lại tiền lãi cao hơn.
b) Tính độ lệch chuẩn cho các mẫu số liệu về tiền lãi của các nhà đầu tư ở hai lĩnh vực này và giải thích ý nghĩa của các số thu được.
Bước 2: Tính phương sai và độ lệch chuẩn cho mỗi lĩnh vực.
Lĩnh vực A:
Phương sai:
\[
s^2_A = \frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n}
\]
\[
= \frac{(7.5 - 18.5)^2 \times 2 + (12.5 - 18.5)^2 \times 5 + (17.5 - 18.5)^2 \times 8 + (22.5 - 18.5)^2 \times 6 + (27.5 - 18.5)^2 \times 4}{25}
\]
\[
= \frac{(11)^2 \times 2 + (6)^2 \times 5 + (1)^2 \times 8 + (4)^2 \times 6 + (9)^2 \times 4}{25}
\]
\[
= \frac{(121 \times 2) + (36 \times 5) + (1 \times 8) + (16 \times 6) + (81 \times 4)}{25}
\]
\[
= \frac{242 + 180 + 8 + 96 + 324}{25} = \frac{840}{25} = 33.6
\]
Độ lệch chuẩn:
\[
s_A = \sqrt{33.6} \approx 5.8
\]
Lĩnh vực B:
Phương sai:
\[
s^2_B = \frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n}
\]
\[
= \frac{(7.5 - 16.9)^2 \times 8 + (12.5 - 16.9)^2 \times 4 + (17.5 - 16.9)^2 \times 2 + (22.5 - 16.9)^2 \times 5 + (27.5 - 16.9)^2 \times 6}{25}
\]
\[
= \frac{(9.4)^2 \times 8 + (4.4)^2 \times 4 + (0.6)^2 \times 2 + (5.6)^2 \times 5 + (10.6)^2 \times 6}{25}
\]
\[
= \frac{(88.36 \times 8) + (19.36 \times 4) + (0.36 \times 2) + (31.36 \times 5) + (112.36 \times 6)}{25}
\]
\[
= \frac{706.88 + 77.44 + 0.72 + 156.8 + 674.16}{25} = \frac{1615.96}{25} = 64.64
\]
Độ lệch chuẩn:
\[
s_B = \sqrt{64.64} \approx 8.04
\]
Giải thích ý nghĩa:
- Độ lệch chuẩn của lĩnh vực A là khoảng 5.8 triệu đồng, trong khi đó của lĩnh vực B là khoảng 8.04 triệu đồng.
- Điều này cho thấy rằng mức độ phân tán của tiền lãi trong lĩnh vực B lớn hơn so với lĩnh vực A. Nghĩa là, các nhà đầu tư trong lĩnh vực B có sự chênh lệch lớn hơn về tiền lãi so với trung bình cộng, trong khi các nhà đầu tư trong lĩnh vực A có sự ổn định hơn về tiền lãi.
Vậy, đầu tư vào lĩnh vực A đem lại tiền lãi cao hơn và ổn định hơn so với lĩnh vực B.
Bài 21.
a) Tính các số đặc trưng đo mức độ phân tán của mẫu số liệu ghép nhóm trên.
- Tìm khoảng cách giữa hai giá trị lớn nhất và nhỏ nhất:
\begin{align}
180 - 170 &= 10 \text{ (cm)}
\end{align}
- Tìm khoảng cách giữa các nhóm liên tiếp:
\begin{align}
172 - 170 &= 2 \text{ (cm)} \\
174 - 172 &= 2 \text{ (cm)} \\
176 - 174 &= 2 \text{ (cm)} \\
180 - 176 &= 4 \text{ (cm)}
\end{align}
- Tìm trung vị:
\begin{align}
\text{Số lượng vận động viên} &= 3 + 10 + 6 + 1 = 20 \\
\text{Vị trí trung vị} &= \frac{20 + 1}{2} = 10.5 \\
\text{Trung vị nằm trong nhóm} &[172; 174) \\
\text{Giá trị trung vị} &= 172 + \left( \frac{10.5 - 3}{10} \right) \times 2 = 172 + 1.5 = 173.5 \text{ (cm)}
\end{align}
- Tìm phương sai:
\begin{align}
\text{Giá trị trung bình} &= \frac{(171 \times 3) + (173 \times 10) + (175 \times 6) + (178 \times 1)}{20} = \frac{513 + 1730 + 1050 + 178}{20} = \frac{3471}{20} = 173.55 \text{ (cm)} \\
\text{Phương sai} &= \frac{(171 - 173.55)^2 \times 3 + (173 - 173.55)^2 \times 10 + (175 - 173.55)^2 \times 6 + (178 - 173.55)^2 \times 1}{20} \\
&= \frac{(-2.55)^2 \times 3 + (-0.55)^2 \times 10 + (1.45)^2 \times 6 + (4.45)^2 \times 1}{20} \\
&= \frac{19.5075 + 3.025 + 12.615 + 19.8025}{20} = \frac{54.95}{20} = 2.7475 \text{ (cm}^2\text{)}
\end{align}
- Tìm độ lệch chuẩn:
\begin{align}
\text{Độ lệch chuẩn} &= \sqrt{2.7475} \approx 1.66 \text{ (cm)}
\end{align}
b) Độ phân tán của mẫu số liệu cho biết điều gì?
Độ phân tán của mẫu số liệu cho biết mức độ khác biệt giữa các thành phần trong mẫu số liệu. Trong trường hợp này, độ phân tán thấp cho thấy các vận động viên có thành tích nhảy cao khá đồng đều, chủ yếu tập trung trong khoảng từ 172 cm đến 174 cm.