Một số khái niệm Kiểm định giả thuyết

1. Các loại giả thuyết trong thống kê

2. Các loại sai lầm trong kiểm định giả thuyết

. Sai lầm loại 1 : Giả thuyết H0đúng nhưng qua kiểm định ta lại kết luận giả thuyết sai, và do vậy bác bỏ giả thuyết H₀ ở mức ý nghĩa a nào đó. Có nghĩa là ta bác bỏ giả thuyết đúng.
. Sai lầm loại 2: Giả thuyết H0 sai nhưng qua kiểm định, ta lại kết luận giả thuyết đúng, và do vậy chấp nhận giả thuyết H₀ ở mức ý nghĩa a nào đó. Có nghĩa là ta chấp nhận một giả thuyết sai.

Tùy theo qua điểm và tính chất mà người ta cho sai lầm loại 1 hoặc loại 2 là nghiêm trọng hơn. Tuy nhiên, thông thường thì người ta sẽ cho rằng sai lầm loại 1 là nghiêm trọng hơn mà thống kê cần tránh.

3. Qui trình tổng quát trong kiểm định giả thuyết

Mục đích chúng ta trong việc giới thiệu về phương thức kiểm định giả thuyết tổng quát là nhằm đi tìm hiểu nội dung cơ bản trong phép suy diễn thống kê. Để đạt đến quyết định cuối cùng, một phương thức có hệ thống sẽ được lập ra với các bước như sau:

Bước 1: Xây dựng giả thuyết. Ta bắt đầu kiểm định giả thuyết với một giả định về một vài tham số tổng thể và sử dụng dữ liệu mẫu để kiểm tra tính logic của giả định đó. Nói cách khác, ta bắt đầu bằng cách giả định có một giá trị tổng thể nào đó và kết luận bằng quyết định bác bỏ hay không bác bỏ giả định đó theo các số liệu mẫu. Việc thiết lập giả thuyết tùy thuộc vào bản chất của tình huống có định hướng hay không định hướng. Nếu tình huống không có định hướng sai biệt, thì giả thuyết là 2 đuôi, nếu có tính định hướng thì ta có giả thuyết 1 đuôi. Để xác định giả thuyết 1 đuôi phải hay 1 đuôi trái chúng ta dựa vào nguyên tắc tránh sai lầm loại 1.

Tuy nhiên cần nhớ rằng sự thất bại trong việc loại Ho không đồng nghĩa với việc bạn đã chứng minh được Ho đúng, mà chỉ là bạn không đủ bằng chứng thống kê để loại bỏ mà thôi.

Bước 2: Chọn mức ý nghĩa mong muốn. Khả năng phạm sai lầm loại 1 như ta đã trình bày được gọi là mức ý nghĩa và được ký hiệu là a. Trên thực tế, có 3 mức ý nghĩa thường dùng nhất là 0,1, 0,05 và 0,01 tương ứng với độ tin cậy là 0,90, 0,95, 0,99. Việc lựa chọn a là bao nhiêu phụ thuộc vào tính chủ quan của người nghiên cứu chấp nhận rủi ro ở mức nào. Có một ý có tính chất kinh nghiệm để chúng ta tham khảo:

Nếu nội dung nghiên cứu đòi hỏi độ chính xác cao thì nên chọn mức a nhỏ, thông thường là 1%.
Nếu nội dung nghiên cứu số liệu biến động lớn, thu thập thông tin khó chính xác thì ta nên chọn a lớn, tuy nhiên ta không nên tăng a quá lớn sẽ làm tăng khả năng bị sai lầm loại 2 và thông thường theo sự thống nhất chung của các nhà thống kê mức ý nghĩa tối đa là 10%.
Nếu không quan tâm quá nhiều đến mức ý nghĩa thì ta nên chọn theo mức thông thường là 5%.

Bước 3: Tính trị số thông kê hay giá trị thực tế của kiểm định. Trong bước này, dựa vào các lý thuyết thống kê mà chúng ta lựa chọn công thức phù hợp để qui phân phối mẫu về phân phối nào đó. Một số phân phối thường gặp là phân phối chuẩn, phân phối Student, phân phối Chi bình phương, phân phối Fisher,… Giá trị thực tế của kiểm định là cơ sở để quyết định chấp nhận hay bác bỏ giả thuyết không.

Bước 4: Rút ra kết luận liên quan đến giả thuyết không. Tương ứng với mức ý nghĩa a và phân phối được xác định ở bước 3 ta tìm được giá trị lý thuyết của kiểm định, thông thường là ta tra bảng hoặc sử dụng phần mềm máy tính để tìm được (Z_a, t_df,_a, F_v1_v2a,….). Sau đó chúng ta so sánh giữa giá trị thực tế và giá trị lý thuyết của kiểm định để có kết luận phù hợp với giả thuyết không.

Bước 5: Kết luận.Tùy thuộc vào nội dung nghiên cứu chúng ta sẽ đưa ra kết luận phù hợp với mục đích và yêu cầu của vấn đề đặt ra.