Kiểm định tham số – HKT Consultant

1. Kiểm định trung bình tổng thể

Để thực hiện kiểm định này giả sử ta có một mẫu ngẫu nhiên n quan sát x₁, x₂,… x_ntừ tổng thể X có trung bình là p, phương sai ơ², trung bình mẫu là x, phương sai mẫu S², mức ý nghĩa kiểm định a và giá trị cho trước là p₀.

Kiểm định giả thuyết được thực hiện như sau:

a) Trường hợp đã biết phương sai tổng thể:

Điều kiện áp dụng cho trường hợp này là tổng thể X có phân phối chuẩn hoặc có cỡ mẫu n>30, các bước kiểm định như sau:

Ví dụ 5.1: Một nghiên cứu được thực hiện để xác định mức độ hài lòng của khách hàng sau khi công ty điện thoại, cải tiến một số dịch vụ khách hàng. Trước khi thay đổi, mức độ hài lòng của khách hàng tính trung bình là 77 điểm, theo thang điểm từ 0 đến 100. 20 khách hàng được chọn ngẫu nhiên để gởi bảng điều tra xin ý kiến sau khi các thay đổi được thực hiện, mức độ hài lòng trung bình tính được là 80. Có thể kết luận khách hàng đã được làm hài lòng ở mức độ cao hơn hay không với mức ý nghĩa 1%. Cho biết tổng thể có phân phối chuẩn với độ lệch chuẩn là 8.

Gọi p là điểm trung bình về mức độ hài lòng của khách hàng.

Trường hợp có n<30:

Trong trường hợp này điều kiện tổng thể phải có phân phối chuẩn. Ta có dạng tổng quát kiểm định như sau:

2. Kiểm đính tỷ lệ p tổng thể

3. Kiểm đinh phương sai

Nếu p quá nhỏ (p«0): Giả thuyết Ho sẽ bị bác bỏ hoàn toàn
Nếu p quá lớn (p>10%): Giả thuyết H₀ sẽ được chấp nhận hoàn toàn.

Trong trường hợp p quá lớn hoặc quá nhỏ chúng ra kết luận kiểm định thống kê có thể không cần đề cập đến mức ý nghĩa.

5. Kiểm định sự khác nhau của 2 phương sai tổng thể

6. Kiểm đinh sự khác nhau của hai trung bình tổng thể

6.1. Kiểm định dựa trên phối hợp từng cặp:

Chọn một mẫu ngẫu nhiên có n cặp quan sát (xi,yi) từ hai tổng thể X, Y có phân phối chuẩn. D₀ là một giá trị cho trước, ta thực hiện các bước kiểm định như sau:

Ví dụ 5.6: Một công ty nước giải khát muốn xem xét ảnh hưởng của chiến dịch khuyến mãi đến việc tăng doanh số. 15 cửa hàng trong hệ thống phân phối sản phẩm của công ty được chọn ngẫu nhiên với số liệu về doanh số bán trong tuần lễ trước và sau chiến dịch khuyến mãi được ghi nhận ở bảng sau. Ở mức ý nghĩa 0,05, có thể kết luận chiến dịch khuyến mãi làm tăng doanh số hay không? Cho biết doanh số bán có phân phối chuẩn.

6.2. Kiểm định dựa trên mẫu độc lập:

Gọi n_x, n_y là số quan sát của các mẫu ngẫu nhiên độc lập Xi, x₂, … X_nx, Ỵ!, y₂, … y_nytừ hai tổng thể X và Y có trung bình p_x, p_y và phương sai Ơ²_X, ơ²_y. Với trung bình mẫu x, y, phương sai mẫu là S²_X, S²_y, với mức ý nghĩa a.

6.2.1. Nếu biết phương sai tổng thể:

6.2.2. Nếu chưa biết phương sai tổng thể, giả sử 2 phương sai khác nhau:

a) Trường hợp có cỡ mẫu lớn (n_x, n_y > 30): ta vẫn sử dụng công thức trên vớiphương sai mẫu thay cho phương sai tổng thể và không cần điều kiện phân phối chuẩn.

Dựa vào định lý giới hạn trung tâm ta không cần điều kiện phân phối chuẩn của tổng thể, khi chưa biết phương sai của tổng thể ta sử dụng phương sai của mẫu để tính giá trị kiểm định.

Ta có kiểm định Z:

b) Trường hợp mẫu nhỏ (n_x < 30 hoặc n_y < 30), với giả định cả hai tổng thể X và Y đều có phân phối chuẩn, ta vẫn sử dụng phương sai mẫu thay cho phương sai tổng thể, nhưng khi đó tiêu chuẩn kiểm định theo phân phối Student với bậc tự do được xác định bởi công thức sau:

Trong trường hợp này máy tính không phân biệt giữa mẫu lớn và mẫu nhỏ và đều sử dụng phân phối Student để kiểm định, bởi vì khi mẫu lớn thì phân phối Student và phân phối chuẩn xấp xỉ nhau.

6.2.3. Giả sử 2 phương sai bằng nhau:

Xử lý trên Excel: Tools ^ Data Analysis ^ t-Test: Two-Sample Assuming Equal Variances.

Ví dụ 5.7: Một nghiên cứu về hai nhãn hiệu pin X và Y (cùng chủng loại) của hai nhà sản xuất khác nhau được thực hiện. Chọn ngẫu nhiên mỗi nhãn hiệu 100 pin, kết quả được ghi nhận như sau: Pin X có thời gian sử dụng trung bình là 308 phút, độ lệch chuẩn 84 phút; các chỉ số tương ứng của pin Y lần lượt là 254 phút và 67 phút. Có thể kết luận thời gian sử dụng trung bình của pin X lớn hơn pin Y ít nhất là 45 phút được không với mức ý nghĩa a=0,1.

Trong bài toán này chưa đề cập đến việc phương sai của hai tổng thể này có phương sai giống nhau hay khác nhau. Để giải quyết trường hợp này nếu chúng ta đã có thông tin trước về phương sai của tổng thể thì ta căn cứ vào đó để lựa chọn công thức phù hợp. Cụ thể trong trường hợp này nếu chưa biết, chúng ta có thể thực hiện kiểm định về phương sai trước:

7. Kiểm định sự khác biệt của hai tỷ lệ tổng thể (với cỡ mẫu lớn > 40)

Ví dụ 5.8: Một công ty nước giải khát đang nghiên cứu việc đưa vào một công thức mới để cải tiến sản phẩm của mình. Với công thức cũ, khi cho 500 người dùng thử thì có 120 người tỏ ra ưa thích nó. Với công thức mới, khi cho 1000 người khác dùng thử thì có 300 người tỏ ra ưa thích nó. Hãy kiểm định xem công thức mới đưa vào có làm tăng tỷ lệ những người ưa thích nước giải khát hay không với a=5%?