Phân tích phương sai (ANOVA)

1. Phân tích phương sai một chiều:

Đẳng thức trên thể hiện tinh thần của bài toán phân tích phương sai:

SST: Thể hiện sự biến thiên của hiện tượng nghiên cứu SSG: Thể hiện sự biến thiên do yếu tố cột tạo ra SSW: Thể hiện sự biến thiên do các yếu tố khác.

Như vậy hiện tượng nghiên cứu phụ thuộc vào hai phần: do yếu tố đang xem xét và những yếu tố khác tác động. Nếu như sự tác động của yếu đang nghiên cứu cũng như các

yếu tố khác tác động thì ta có thể kết luận hiện tượng nghiên cứu không phụ thuộc vào yếu tố đang xem xét. Điều này dẫn đến trung bình theo cột bằng nhau.

Ví dụ 5.14: Một nghiên cứu được thực hiện nhằm xem xét năng suất lúa trung bình của 3 giống lúa có bằng nhau hay không. Kết quả thu thập qua 4 năm như sau:

  • Grouped By: Dữ liệu được nhập theo cột/hàng
  • Labels in First Row: Vùng dữ liệu có tên biến không.

2. Phân tích phương sai hai chiều

Phân tích phương sai hai chiều là xét đến hai yếu tố ảnh hưởng đến hiện tượng nghiên cứu.

2.1. Trường hợp có một quan sát trong cùng một ô:

Trường hợp này  tương ứng với  sự tác động của yếu tố cột và yếu tố hàng chúng ta chỉ chọn một quan sát. Đây là trường hợp mở rộng của phân tích phương sai một yếu tố, có nghĩa là ta vừa kiểm định giả thuyết trung bình theo cột bằng nhau vừa kiểm định trung bình theo hàng bằng nhau.

Tương tự    như đối  với  phân tích phương sai một chiều nhưng bây giờ hiện tượng nghiên cứu phụ thuộc vào yếu tố cột, yếu tố hàng và các yếu tố ngẫu nhiên khác. Nếu sự biến động của yếu tố cột cũng như đối với những biến động ngẫu nhiên khác thì ta kết luật hiện tượng nghiên cứu không phụ thuộc vào yếu tố cột và dẫn đến trung bình theo cột bằng nhau. Tương tự như vậy, ta sẽ có kết luận đối với yếu tố hàng.

Bảng tổng quát phân tích ANOVA

Hãy cho nhận xét với mức ý nghĩa 5%.

  • Thực hiện bằng Excel:

Kết quả phân tích ANOVA từ Excel a=5% như sau:

Anova: Two-Factor Without Replication

3. Trường hợp có hơn một tham số trong một ô

Trường hợp tương ứng với mỗi yếu tố cột và yếu hàng ta có thể chọn nhiều qua sát. Trong bài toán này, ngoài việc kiểm định về trung bình theo cột bằng nhau, trung bình theo hàng bằng nhau mà chúng ta còn xem xét sự tương tác giữa yếu tố hàng và yếu tố cột có ảnh hưởng đến hiện tượng nghiên cứu hay không.

Ví dụ 5.12: Một nghiên cứu được thực hiện nhằm xem xét sự liên hệ giữa loại phân bón, giống lúa và năng suất. Năng suất lúa được ghi nhận từ các thực nghiệm sau:

  • Nhập số liệu cũng như phân tích phương sai hai yếu tố có một quan sát nhưng phải nhập số liệu theo cột và phải có tiêu đề hàng, cột.
  • Input Range: Chọn tất cả hàng, cột đưa vào vùng xử lý bao gồm tên tiêu đề.
  • Grouped By: Dữ liệu được nhập theo cột/hàng
  • Rows per sample: Số quan sát trong một ô.

Thực hành trên Exel:

  • . Kết luận: Có sự tương tác giữa yếu tố giống và phân bón đến năng suất.

Có sự tương tác có thế giải thích rằng không phải khi sử dụng giống tốt nhất, phân tốt nhất thì có thế cho năng suất bởi vì có thế phân bón này sẽ không phù hợp cho giống nào đó.

[1]   . Giả thuyết : Giả thuyết ta có thể trình bày một trong 3 cách sau:

Ho: Năng suất trung bình của các giống lúa bằng nhau Ho: Pa=Mb=Mc

H0: Năng suất không phụ thuộc vào giống lúa

[2]  . Giá trị kiểm định: Trong trường hợp này máy tính đã cho chúng ta giá trị p do đó chúng ta có thể không cần quan tâm đến các giá trị F. Chính vì vậy ta có thể bỏ qua bước 2.

[3] . Quyết định: p=71,1%, quá lớn => Chấp nhận H0 hoàn toàn.

[4] . Kết luận: Năng suất trung bình của 3 giống lúa là như nhau.