1. Các hình thức thu thập số liệu thống kê:
a) Chọn mẫu phi xác suất:
- Chọn mẫu thuận tiện: Các đơn vị mẫu được chọn ở tại một địa điểm và vào một thời gian nhất định.
Ví dụ: Chọn mẫu những người đi mua sắm ở siêu thị METRO Cần Thơ và tiếp cận họ khi họ bước vào siêu thị hoặc khi họ vừa mua sắm món hàng mà ta muốn khảo sát.
Cách chọn mẫu này là không ngẫu nhiên vì không phải tất cả mọi người dân Cần Thơ đều có xác suất như nhau để được chọn vào mẫu.
Ví dụ: Chọn mẫu một số ít liên doanh lớn có thể chiếm phần lớn tổng sản lượng ngành công nghiệp cả nước.
Cách chọn mẫu này được dùng phổ biến khi nghiên cứu định tính (nghiên cứu khách hàng công nghiệp hay kênh phân phối).
- Ưu điểm: Chọn được đúng một số phần tử rất quan trọng của tổng thể vào trong mẫu.
- Nhược điểm: Có khả năng phát sinh những sai lệch lớn.
- Chọn mẫu chỉ định: Là chọn mẫu theo tỷ lệ gần đúng của các nhóm đại diện trong tổng thể hoặc theo số mẫu được chỉ định cho mỗi nhóm.
Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải khát để so sánh kết quả thống kê về thái độ khách hàng. Hoặc tổng thể nghiên cứu bao gồm 1.000 công ty, trong đó 600 công ty vừa và nhỏ, 300 trung bình và 100 qui mô lớn. Số mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60 công ty vừa và nhỏ, 30 trung bình và 10 công ty lớn.
- Ưu điểm: Đảm bảo được số mẫu cần thiết cho từng nhóm trong tổng thể phục vụ cho phân tích.
- Nhược điểm: Có thể cho kết quả sai lệch.
- Chọn mẫu theo mạng quan hệ: Người nghiên cứu sẽ thông qua người trả lời đầu tiên để tiếp cận những người trả lời kế tiếp.
Ví dụ: Phỏng vấn An, khoảng gần kết thúc phỏng vấn có thể đề nghị An giới thiệu một hoặc hai người nữa có thể am hiểu về chủ đề khảo sát.
+ Ưu điểm: giúp cho người nghiên cứu chọn được các mẫu mà họ cần nghiên cứu.
b) Chọn mẫu xác suất: Dựa vào lý thuyết xác suất để lấy mẫu ngẫu nhiên.
– Chọn mẫu ngẫu nhiên đon giản: Là cách chọn mẫu mà mỗi phần tử trong tổng thể có cùng cơ hội được chọn với xác suất như nhau. Để chọn được mẫu, người nghiên cứu phải có danh sách tổng thể nghiên cứu.
Ví dụ: Chọn 100 mẫu sinh viên trong tổng số 4.000 sinh viên khoa kinh tế & QTKD. Sử dụng máy tính gieo một số gồm 4 chữ số. Mỗi lần gieo, số nào xuất hiện sẽ được chọn vào mẫu.
- Chọn mẫu có hệ thống: Là cách chọn mẫu mà mẫu đầu tiên là ngẫu nhiên, sau đó cứ cách k đơn vị ta lại chọn một phần tử. Với k = N/n (N: độ lớn tổng thể và n kích cở mẫu).
Ví dụ: Như ví dụ chọn mẫu ngẫu nhiên đơn giản, danh sách sinh viên không san có trên máy tính, ta sẽ sử dụng cách chọn mẫu hệ thống. Tính k = 4.000/100 = 40. Ta sẽ gieo số ngẫu nhiên trong khoảng 1 đến 40. Ví dụ được số 18. Mẫu được chọn là 18. Các mẫu tiếp theo sẽ là 18 + 40 = 58, 58 + 40 = 98 …
- Chọn mẫu ngẫu nhiên phân tầng: Là phân chia các đối tượng nghiên cứu thành các nhóm, tầng theo các đặc tính, sau đó lấy mẫu theo tầng, nhóm.
Ví dụ: Chúng ta muốn biết chi tiêu cho nước giải khát giữa sinh viên và giảng viên trong khoa KT & QTKD. Chúng ta cần ấn định trước số mẫu cho mỗi nhóm. Chẳng hạn, số mẫu gồm 70 sinh viên và 30 giảng viên. Sau đó ta sẽ chọn mẫu theo phương pháp ngẫu nhiên đơn giản từ 2 nhóm độc lập
2. Các phương pháp chọn mẫu thường được sử dụng:
a) Phương pháp chọn mẫu ngẫu nhiên (Probability Sampling Methods):
- Chọn mẫu ngẫu nhiên đơn giản: Chọn mẫu ngẫu nhiên đơn giản là chọn các đơn vị từ tổng thể vào mẫu hoàn toàn hú hoạ. Cách đơn giản nhất của chọn mẫu ngẫu nhiên là rút thăm hoặc sử dụng bảng số ngẫu nhiên.
- Chọn mẫu hệ thống (Systematic Sampling): Chọn mẫu hệ thống là chọn các đơn vị từ tổng thể vào mẫu theo một khoảng cách cố định sau khi đã chọn ngẫu nhiên một nhóm nào đó trên cơ sở các đơn vị điều tra được sắp xếp thứ tự theo một tiêu thức nhất định.
Tuy nhiên, phương pháp lấy mẫu có hệ thống có thể tạo ra một mẫu ngẫu nhiên đơn giản. Nó sẽ đảm bảo có sự đại diện từ các khoảng cao nhất đến thấp nhất (nếu dàn chọn mẫu đã được sắp xếp thứ tự theo một tiêu chí nào đó). Một mẫu ngẫu nhiên đơn giản khó thực hiện được như vậy.
- Chọn mẫu theo tổ: Để thực hiện theo phương pháp này, trước hết phải phân tổ các đơn vị tổng thể chung thành nhiều tổ theo tiêu thức có liên quan trực tiếp đến nội dung nghiên cứu. Sau đó, sau đó xác định cỡ mẫu cho từng tổ. Việc phân chia này được thực hiện một trong ba phương pháp:
- Số quan sát điều tra trong từng tổ được chia đều, tức là cỡ mẫu bằng nhau ở các tổ.
- Số quan sát được chia theo tỷ lệ số lượng đơn vị tổng thể của từng tổ trong tổng thể chung.
- Số quan sát được chia theo tỷ lệ số lượng đơn vị tổng thể của từng tổ trong tổng thể chung và độ lệch chuẩn của từng tổ.
- Chọn mẫu theo khối (chùm) (Cluster Sampling): Theo phương pháp tổ chức chọn mẫu này thì trước tiến các đơn vị của tổng thể được chia thành R khối với số lượng đơn vị bằng nhau hoặc không bằng nhau. Từ R khối chọn ra r khối ngẫu nhiên theo phương pháp ngẫu nhiên đơn giản hoặc hệ thống và điều tra tất cả các đơn vị của r khối. Chọn cả khối có ưu điểm là tổ chức gọn nhẹ, giảm được kinh phí. Song vì số đơn vị được chọn để điều tra chỉ tập trung vào một số khối nên có thể có sai số lớn nếu giữa các khối có sự khác biệt nhau.
- Chọn mẫu ngẫu nhiên phân tầng (Stratified Random Sampling): Phương pháp chọn mẫu phân tầng (còn được gọi là chọn mẫu nhiều cấp) là phương pháp chọn mẫu phải thông qua ít nhất hai cấp chọn trung gian. Đầu tiên cần phải xác định các đơn vị mẫu cấp 1, sau đó là các đơn vị mẫu cấp 1 lại được chia thành các đơn vị chọn mẫu cấp 2 và cứ như thế cho đến cấp cuối cùng. Về bản chất, phương pháp này là sự biến thể của phương pháp chọn mẫu khối. Thật vậy, nếu điều tra chọn mẫu hai cấp thì ở cấp 1, tổng thể được chia thành các khối, sau đó chọn mẫu ngẫu nhiên một số khối nhất định. Ở cấp 2, thay vì điều tra toàn bộ các đơn vị của các chùm được chọn ra, người ta chỉ chọn và điều tra một số đơn vị của các chùm đó mà thôi. Kết quả chọn được 100 sinh viên như vậy được gọi là chọn hệ thống.
- Chọn mẫu theo phương pháp phân tích chuyên gia là chọn mẫu trên cơ sở phân tích xem xét chủ quan của người điều tra. Cách chọn này thường áp dụng cho tổng thể có ít đơn vị mẫu hoặc trị số của chỉ tiêu nghiên cứu giữa các đơn vị mẫu chênh lệch nhau nhiều.
b) Phương pháp chọn mẫu phi ngẫu nhiên (Nonprobability Sampling Methods):
Điều tra chọn mẫu phi ngẫu nhiên là điều tra chọn mẫu mà trong đó các đơn vị của tổng thể được chọn ra trên cơ sở phân tích đặc điểm của hiện tượng và kinh nghiệm thực tế. Do đó, để đảm bảo chất lượng của tài liệu điều tra, cần phải giải quyết tốt các vấn đề sau đây:
- Phân tích chính xác hiện tượng nghiên cứu: Hiện tượng nghiên cứu thường có kết cấu phức tạp, gồm nhiều tổ, nhiều bộ phận và tính chất khác nhau. Trên cơ sở phân tổ chính xác hiện tượng nghiên cứu, các đơn vị có đặc điểm và tính chất giống nhau (hoặc gần giống nhau) sẽ được đưa vào một tổ. Từ mỗi tổ sẽ chọn ra các đơn vị đại diện (còn gọi là điển hình) cho tổ đó. Tập hợp các đơn vị đại diện của các tổ tạo thành tổng thể mẫu.
- Lựa chọn các đơn vị điều tra: Các đơn vị được lựa chọn để điều tra thực tế thường là những đơn vị có mức độ của tiêu thức xấp xỉ với mức độ trung bình của tổ. Khi lựa chọn các đơn vị để điều tra thực tế cần phải thông qua việc phân tích, bàn bạc tập thể của những người có kinh nghiệm, am hiểu tình hình thức tế.
- Suy rộng kết quả điều tra: Sau khi thu thập được dữ liệu ở các đơn vị điều tra thì tiến hành tính toán suy rộng trực tiếp cho toàn bộ hiệu tượng. Vì các đơn vị điều tra được lựa chọn đại diện cho từng tổ nên khi suy rộng phải chú ý đến tỷ trọng của mỗi tổ chiếm trong toàn bộ hiện tượng.
3. Các phương pháp to chức chọn mẫu:
Có nhiều phương pháp, tổ chức chọn mẫu khác nhau. Mỗi phương pháp có những ưu, nhược điểm riêng và được áp dụng trong những điều kiện nhất định. Tuy nhiên gọi là phương pháp này hay phương pháp kia là đứng trên những giác độ khác nhau và cũng chỉ có ý nghĩa tương đối.
a. Xét theo cấp chọn mẫu:
Có phương pháp tổ chức chọn mẫu một cấp và tổ chức chọn mẫu hai cấp hay nhiều cấp:
- Chọn mẫu một cấp: Là từ một loại danh sách của tất cả các đơn vị thuộc tổng thể, tiến hành chọn mẫu một lần trực tiếp đến các đơn vị điều tra không qua một phân đoạn nào khác. Chọn mẫu một cấp chỉ có một loại đơn vị chọn mẫu và một dàn chọn mẫu. Đối với mẫu một cấp có thể dùng cách chọn ngẫu nhiên, nhưng cũng có thể dùng cách chọn hệ thống hoặc chọn theo phương pháp chuyên gia. Tuy nhiên, trong thực tế nếu là điều tra mẫu một cấp thì phổ biến là dùng cách chọn ngẫu nhiên và thường được gọi tắt là chọn mẫu ngẫu nhiên đơn giản. Chọn mẫu ngẫu nhiên đơn giản đảm bảo số mẫu được rải trên toàn địa bàn điều tra nên sai số chọn mẫu sẽ nhỏ. Song khó khăn là việc lập danh sách các đơn vị (dàn chọn mẫu) để tiến hành chọn mẫu khá lớn, tốn nhiều thời gian và công sức. Hơn nữa khi tổ chức điều tra phải thực hiện ở địa bàn rất rộng.
- Chọn mẫu nhiều cấp: Là tiến hành điều tra theo nhiều công đoạn, trong đó mỗi công đoạn là một cấp chọn mẫu. Có bao nhiêu cấp điều tra thì có bấy nhiêu loại đơn vị chọn mẫu cũng như có bấy nhiêu loại dàn chọn mẫu. Phương pháp tổ chức chọn mẫu nhiều cấp thuận tiện cho việc lập dàn chọn mẫu và tổ chức điều tra: Ở cấp sau chỉ phải lập dàn chọn mẫu cho cấp đó trong phạm vi mẫu cấp trước được chọn, phạm vi điều tra được thu hẹp sau mỗi cấp điều tra. Tuy nhiên, với phương pháp tổ chức chọn mẫu nhiều cấp số liệu thu thập được thường có độ tin cậy thấp hơn so với chọn mẫu ngẫu nhiên đơn giản.
b. Xét theo chọn mẫu phân tổ:
Nếu trước khi chọn mẫu, tiến hành phân chia tổng thể thành những tổ khác nhau theo một hay một số tiêu thức nào đó liên quan đến tiêu thức điều tra, sau đó phân bổ cỡ mẫu cho từng tổ và trong mỗi tổ lập một danh sách riêng và chọn đủ số mẫu phân bổ cho tổ đó. Cách chọn như vậy gọi là chọn mẫu phân tổ:
Phương pháp chọn mẫu phân tổ: Nếu việc phân tổ được tiến hành khoa học thì tổng thể mẫu sẽ có kết cấu gần tổng thể, do đó sai số chọn mẫu sẽ giảm đi, tính chất đại diện của tổng thể mẫu được nâng cao.
Tuy nhiên, chọn mẫu phân tổ cũng khó khăn trong việc lập dàn chọn mẫu như chọn mẫu ngẫu nhiên đơn giản. Hơn nữa tổ chức điều tra phải tiến hành trên địa bàn rộng, thậm chí còn phức tạp hơn cả chọn mẫu ngẫu nhiên đơn giản.
Nếu điều tra chia thành nhiều cấp, các cấp tiến hành trước thì chọn từng đơn vị mẫu, nhưng ở cấp cuối cùng không chọn ra từng đơn vị, mà chọn cả nhóm các đơn vị để điều tra. Cách chọn như vậy gọi là chọn mẫu chùm (hay chọn mẫu cả khối).
Nếu cùng cỡ mẫu như nhau, chọn mẫu chùm so với các phương pháp tổ chức chọn mẫu nêu trên sẽ thuận tiện nhất cho việc lập dàn chọn mẫu và tổ chức điều tra. Tuy nhiên, độ tin cậy của số liệu thu thập được sẽ thấp hơn; tức là có sai số chọn mẫu lớn nhất.