Mã hóa, nhập liệu câu hỏi khảo sát trong SPSS

Từ kết quả khảo sát thô thu được trên các phiếu khảo sát giấy hoặc khảo sát online. Chúng ta cần xử lý chúng để có được các con số, văn bản có thể thực hiện phân tích được. Việc làm này gọi là mã hóa và nhập liệu.

1. Câu hỏi định tính một trả lời

Ví dụ với một tập data gồm các biến bên dưới, chúng ta có câu hỏi phần thông tin cá nhân như phòng ban làm việc, trình độ học vấn, độ tuổi… là điển hình cho dạng câu hỏi định tính 1 trả lời.

Mã hóa nhập liệu câu hỏi spss

Ở bước tạo khuôn dữ liệu Variable View, đối với câu hỏi định tính một trả lời, các bạn chỉ tạo 1 biến cho 1 câu hỏi. Bảng khảo sát có 6 câu hỏi định tính một trả lời nên tác giả tạo tương ứng 6 biến như hình trên. Các bạn nhập các mục Type, Values, Missing, Measure… bình thường cho các biến.

Ví dụ, người thứ nhất và người thứ hai trả lời các đáp án như hình ảnh bên dưới:

Người 1: Đáp án 6 câu lần lượt là 2 1 3 3 2 2

Người 2: Đáp án 6 câu lần lượt là 2 2 3 4 2 1

Chuyển sang giao diện nhập liệu Data View, tiến hành nhập liệu với mỗi hàng tương ứng với 1 người trả lời (1 phiếu khảo sát).

Mã hóa nhập liệu câu hỏi spss

Tóm tắt:

Đối với dạng câu hỏi định tính một trả lời các bạn cần chú ý những điểm dưới đây:

  • Số biến: Một câu hỏi tương ứng với 1 biến.
  • Giá trị (Values): Mỗi lựa chọn trong đáp áp tương ứng với một giá trị.
  • Thang đo (Measure): Thường là Nominal.

2. Câu hỏi định tính nhiều trả lời

Đối với câu hỏi nhiều trả lời, các bạn có 2 cách mã hóa. Trong tệp dữ liệu mẫu không có dạng câu hỏi định tính nhiều trả lời nên tác giả sẽ sử dụng một ví dụ ở ngoài như sau:

Ví dụ: Anh chị đã và đang dùng điện thoại thương hiệu gì?

  1. iPhone
  2. Samsung
  3. Sony
  4. Oppo
  5. Huawei
  6. Nokia
  7. Khác

Cách mã hóa 1:

Ở bước tạo khuôn dữ liệu Variable View, câu hỏi này có 7 đáp án, chúng ta tạo 7 câu hỏi nhỏ từ C1.1 đến C1.7.

Mã hóa nhập liệu câu hỏi spss

Các mục Type, Missing, Measure (nên chọn Nominal)… các bạn vẫn nhập bình thường, mục Values các bạn nhập 7 giá trị tương ứng với 7 đáp án.

Mã hóa nhập liệu câu hỏi spss

Chúng ta tạo 7 câu nhỏ trong câu hỏi của ví dụ 1 để phòng cho trường hợp có những người họ đã/đang sử dụng cả 7 thương hiệu máy kể trên. Khi đó câu C1.1 họ sẽ chọn máy số 1, câu C1.2 họ chọn máy số 2,… câu C1.7 họ chọn máy số 7. Giả sử chúng ta chỉ tạo 6 câu C1.1 đến C1.6 thì khi đó, đến máy số 7 họ không có mục nào để điền vào.

Có 4 người tương ứng chọn như sau:

– Người 1 chọn: 1, 2, 5 (iPhone, Samsung, Huawei)

– Người 2 chọn: 1, 3, 4, 5, 6

– Người 3 chọn: 1, 2, 3, 4, 5, 6, 7

– Người 4 chọn: 2, 3 ,7

Chuyển sang giao diện nhập liệu Data View, tiến hành nhập liệu như hình:

Mã hóa nhập liệu câu hỏi spss

Người đầu tiên chỉ chọn 3 dòng máy, chúng ta nhập vào 3 câu đầu từ C1.1 đến C1.3, phần còn lại để trống, không nhập liệu. Cho hiển thị chế độ Value/Label thì giao diện sẽ thế này:

Mã hóa nhập liệu câu hỏi spss

Nếu bạn thấy kiểu mã hóa và nhập liệu như ví dụ 1 khó hiểu, chúng ta sẽ đi đến kiểu mã hóa số 2.

Cách mã hóa 2:

Ở bước tạo khuôn dữ liệu Variable View, chúng ta cũng cần tạo 7 câu hỏi nhỏ từ C1.1 đến C1.7 bởi câu hỏi ví dụ có 7 đáp án trả lời. Nếu các đáp án của bạn ngắn, bạn có thể lồng tên đáp án vào ngay tên biến như hình. Lý do tại sao nên chèn đáp án vào tên biến làm kéo dài tên biến mất thẩm mỹ như vậy, tác giả sẽ giải thích ở phần dưới.

Mã hóa nhập liệu câu hỏi spss

Các mục Type, Missing, Measure… các bạn vẫn nhập bình thường, mục Values các bạn nhập 2 giá trị là 0 (không sử dụng) và 1 (có sử dụng).

Mã hóa nhập liệu câu hỏi spss

Có 4 người tương ứng chọn như sau:

– Người 1 chọn: 1, 2, 5 (iPhone, Samsung, Huawei)

– Người 2 chọn: 1, 3, 4, 5, 6

– Người 3 chọn: 1, 2, 3, 4, 5, 6, 7

– Người 4 chọn: 2, 3 ,7

Chuyển sang giao diện nhập liệu Data View, tiến hành nhập liệu như hình:

Mã hóa nhập liệu câu hỏi spss

Người số 1 chọn 3 dòng máy là iPhone, Samsung, Huawei, tương ứng chúng ta nhập giá trị 1 (có sử dụng) cho 3 cột này, các cột còn lại nhập 0 (không sử dụng). Như ban đầu tác giả đề cập, nếu đáp án trả lời ngắn, các bạn nên chèn đáp án vào tên biến. Điều này giúp cho giao diện nhập liệu trực quan hơn, các bạn nhìn vào tiêu đề cột có thể thấy được tên đáp án, nhờ vậy khi nhập liệu sẽ nhanh và ít sai sót hơn rất nhiều. Cho hiển thị chế độ Value/Label thì giao diện sẽ thế này:

Đây là 2 cách mã hóa và nhập liệu cho câu hỏi định tính nhiều trả lời. Các bạn thấy cách nào dễ thực hiện và tiện lợi cho quá trình xử lý, các bạn nên sử dụng cách đó.

Tóm tắt:

Đối với dạng câu hỏi định tính nhiều trả lời các bạn cần chú ý những điểm dưới đây:

  • Số biến: Có bao nhiêu lựa chọn trong đáp án trả lời sẽ có bấy nhiêu biến.
  • Giá trị (Values): Tùy theo cách mã hóa giá trị value sẽ là lựa chọn Có/Không hoặc lựa chọn là tên các đáp án.
  • Thang đo (Measure): Thường là Nominal hoặc Ordinal tùy dạng câu hỏi.

3. Câu hỏi định tính mở

Câu hỏi mở là dạng câu hỏi không có các đáp án lựa chọn có sẵn mà người được khảo sát sẽ tự điền đáp án theo ý kiến của bản thân. Để dễ hiểu hơn, mời các bạn xem qua ví dụ dưới đây:

Ví dụ: Anh/Chị có đóng góp gì để công ty cải thiện sự hài lòng của nhân viên trong công việc:

…………………………………………………………………………………………………………………………………………….

Thường trong bảng khảo sát, câu hỏi mở sẽ được trình bày với hình thức giống như ví dụ. Kết thúc câu hỏi sẽ là một vài dòng trống để người được khảo sát ghi vào ý kiến của mình.

Người 1: Công ty cần cải thiện hệ thống máy lạnh do máy hay hỏng; mở thêm nhiều chương trình đào tạo để nâng cao trình độ nhân viên.

Người 2: Công ty cần đổi ghế cứng sang ghế dựa xoay để nhân viên làm việc thoải mái hơn; hỗ trợ cho nhân viên đi học các khóa học chuyên môn; đẩy mạnh hoạt động ngoại khóa team building để tăng tính gắn kết giữa các nhân viên; thưởng cuối năm của công ty rất thấp, có người không có thưởng.

Người 3: Cấp quản lý đang có vấn đề, cách quản lý và giám sát nhân viên quá khắt khe chi li tới mức không cần thiết, làm cho nhân viên bị tâm lý, không có được sự thoải mái khi làm việc; chính sách phúc lợi công ty chưa tốt so với mặt bằng các công ty hiện tại.

Đây là dạng câu hỏi yêu cầu quá trình mã hóa phức tạp nhất, mất thời gian nhiều nhất. Các bạn cần liệt kê ngắn gọn câu trả lời của người được hỏi thành từng tiêu chí riêng biệt, sau đó đặt tên chung cho những tiêu chí thuộc cùng một nhóm. Để dễ hiểu hơn, chúng ta sẽ đi vào thực hành với ví dụ ở trên và câu trả lời của 3 người.

Người 1: Liệt kê tiêu chí chúng ta sẽ có ý của người số 1 gồm: cải thiện máy lạnh; đào tạo nhân viên.

Người 2: Tương tự, ý của người số 2 gồm: cải thiện ghế làm việc; hỗ trợ nhân viên học tập; tăng cường teambuilding; thưởng cuối năm thấp.

Người 3: Ý của người số 3 gồm: xem xét lại cách giám sát của quản lý; cải thiện chính sách phúc lợi.

Sau khi đã liệt kê ra thành từng tiêu chỉ nhỏ, các bạn sẽ tìm điểm chung của tất cả các tiêu chí của 3 người và gom thành nhóm.

Mã hóa nhập liệu câu hỏi spss

Như vậy sẽ có 5 nhóm tiêu chí chung bao gồm:

  1. Đào tạo
  2. Quan hệ với đồng nghiệp
  3. Quan hệ với lãnh đạo
  4. Thưởng, phúc lợi

Chúng ta sẽ gán cho mỗi nhóm 1 value giống như câu hỏi đóng, như vậy chúng ta đã chuyển câu hỏi mở thành câu hỏi có đáp án giới hạn (gán 1: cơ sở vật chất, 2: đào tạo…). Ví dụ trong hình ảnh bên dưới là biến GopY.

Mã hóa nhập liệu câu hỏi spss

Trong quá trình gom nhóm các tiêu chí cùng một nhóm ý nghĩa lại với nhau, các bạn cần chú ý giữ cho số lượng nhóm càng ít càng tốt. Tác giả đã từng gặp phải các câu hỏi mở được mã hóa nhưng số value lên tới 15, 20,… trong khi có nhiều value vẫn có thể gom lại thành nhóm chung để rút gọn số value lại. Hãy cố gắng tinh giản số value để số phiếu trả lời cho một value là đủ nhiều, khi đó các kiểm định mới càng trở nên chính xác hơn.

Nên có một nhóm giá trị là Khác sau khi đã có được danh sách các value được rút gọn. Nhóm này chứa những ý kiến được ít người đề xuất, những tiêu chí không nằm trong hoặc rất ít liên quan đến những nhóm value đã được rút gọn.

Tóm lại, quy trình mã hóa cho câu hỏi mở sẽ là:

Mã hóa nhập liệu câu hỏi spss

Liệt kê các tiêu chí ngắn gọn từ câu trả lời của người được khảo sát > Gom nhóm các tiêu chí chung ý nghĩa vào một nhóm > Đặt tên mới cho các nhóm vừa gom > Các nhóm mới chính là value của câu hỏi mở, gán giá trị vào nhóm như câu hỏi đóng.

Tóm tắt:

Đối với dạng câu hỏi định tính mở các bạn cần chú ý những điểm dưới đây:

  • Số biến: Một câu hỏi tương ứng với 1 biến.
  • Giá trị (Values): Là số nhóm các tiêu chí sau khi đã rút gọn, giá trị cuối cùng nên để một nhóm Khác đại diện cho các tiêu chí nhỏ, không nằm trong các nhóm giá trị đã có.
  • Thang đo (Measure): Thường là Nominal.

4. Câu hỏi thự tự xếp hạng

Câu hỏi nhằm thu thập thông tin xếp hạng các tiêu chí có sẵn từ đánh giá của người được khảo sát. Chúng ta cùng tìm hiểu qua ví dụ sau:

Ví dụ: Anh/Chị vui lòng xếp hạng thứ tự mức độ yêu thích của mình đối với 3 loại nước giải khát sau đây: Coca Cola, Pepsi, Sting

  • Yêu thích nhất: …………
  • Yêu thích nhì: …………
  • Yêu thích ba: …………

Hoặc một cách trình bày khác: Anh/Chị vui lòng xếp hạng thứ tự mức độ yêu thích của mình đối với 3 loại nước giải khát sau đây. Yêu thích nhất ghi số 1, yêu thích nhì ghi số 2, yêu thích ba ghi số 3:

  • Coca Cola: …………
  • Pepsi: …………
  • Sting: …………

Với dạng câu hỏi này chúng ta nên sử dụng cách trình bày số 2 khi lập bảng khảo sát. Thứ tự độ quan trọng/mức yêu thích/… sẽ thích hợp hơn khi biễu diễn thành các con số có thứ tự tăng hoặc giảm dần.

Có bao nhiêu kết quả cần xếp hạng chúng ta cần tạo bấy nhiêu câu hỏi nhỏ đối với dạng câu hỏi thứ tự xếp hạng. Cụ thể trong ví dụ ở trên, người được khảo sát cần cho biết mức độ yêu thích nhất nhì ba của mình đối với 3 sản phẩm nước ngọt: Coca Cola, Pepsi, Sting. Như vậy, trong khuôn dữ liệu SPSS, ta cần lập 3 biến như sau:

Mã hóa nhập liệu câu hỏi spss

Cột Values, chúng ta cũng sẽ có 3 giá trị tương ứng với xếp hạng 3 mức độ yêu thích của người được khảo sát:

Và đây là giao diện khi nhập liệu vào Data View tương ứng với câu trả lời của các đối tượng được khảo sát:

Mã hóa nhập liệu câu hỏi spss

– Người 1: Thích Coca Cola nhất, thích Pepsi thứ 2, thích Sting thứ 3

– Người 2: Thích Pepsi nhất, thích Sting thứ 2, thích Coca Cola thứ 3

– Người 3: Thích Coca Cola nhất, thích Sting thứ 2, thích Pepsi thứ 3

Mã hóa nhập liệu câu hỏi spss

Tóm tắt:

Đối với dạng câu hỏi thứ tự xếp hạng các bạn cần chú ý những điểm dưới đây:

  • Số biến: Bao nhiêu đáp án cần xếp hạng sẽ cần bấy nhiêu biến.
  • Giá trị (Values): Bằng với số biến, có bao nhiêu thứ tự cần xếp hạng sẽ có tương ứng bấy nhiêu giá trị.
  • Thang đo (Measure): Thường là Ordinal.

5. Câu hỏi định lượng mở

Dạng câu hỏi này thường được trình bày dưới hình thức tương tự câu hỏi định tính mở. Tuy nhiên đáp án sẽ là một con số chứ không phải là một chuỗi văn bản. Cùng tìm hiểu ví dụ sau đây:

Ví dụ: Anh/Chị vui lòng điền vào chỗ trống các câu hỏi dưới đây:

  • Chiều cao của bạn là:………. centimet (cm)
  • Cân nặng của bạn là:………. kilogram (kg)
  • Số đo vòng 1 của bạn là:………. centimet (cm)

Trong ví dụ trên, người được khảo sát sẽ điền vào một con số ở các chỗ trống. Các con số này là tự do, chúng ta chỉ có thể có được giới hạn thấp nhất (min), cao nhất (max) trong một khoảng chừng nào đó. Nếu bạn không có yêu cầu gì khác, người được khảo sát sẽ điền vào con số chiều cao, cân nặng, số đo vòng 1 của họ một cách tự do. Có người sẽ điền vào chiều cao là 156cm, người là 157cm, người là 161cm, người là 163cm…, số đáp án gần như là vô hạn.

Mã hóa nhập liệu câu hỏi spss

Việc thu thập dữ liệu đối với dạng câu hỏi định lượng mở và không có yêu cầu giới hạn kèm theo sẽ khiến cho số lượng giá trị Values trở nên vô hạn. Do vậy, khi tạo biến cho câu hỏi dạng này, chúng ta sẽ không nhập giá trị vào mục Values. Thang đo được ưu tiên lựa chọn là Scale.

Mã hóa nhập liệu câu hỏi spss

Thu thập chính xác chiều cao, cân nặng, số đo vòng 1 trong tình huống này phục vụ cho các đề tài nghiên cứu khi cần phân tích sâu các con số chi tiết nhằm một mục đích nhất định nào đó mà việc chia khoảng (cân nặng dưới 40; từ 40-59; từ 60-79; từ 80 trở lên…) không thể mang lại kết quả chính xác như mong muốn.

Ngoài mục đích phân tích sâu từng giá trị chi tiết, các nhà nghiên cứu còn tiến hành chia khoảng giá trị chi tiết thành từng phân đoạn phục vụ cho các phân tích tổng quát, các phân tích không cần đào sâu vào từng giá trị riêng lẻ. Để tìm hiểu cách mã hóa lại biến có quá nhiều giá trị, các bạn vui lòng xem phần mở rộng “Mã hóa lại biến” ở cuối chương này.

Tóm tắt:

Đối với dạng câu hỏi định lượng mở các bạn cần chú ý những điểm dưới đây:

  • Số biến: Mỗi câu hỏi tương ứng với một biến.
  • Giá trị (Values): Không nhập giá trị vào mục Values vì giá trị là các con số tự do không kiểm soát.
  • Thang đo (Measure): Thường là Scale.

6. Câu hỏi định lượng Likert

Câu hỏi Likert có thể nói là dạng phổ biến nhất trong các đề tài nghiên cứu. Thường chúng không được trình bày theo câu hỏi mà được đưa về dạng các câu mệnh đề, các tiêu chí. Trong bảng khảo sát mục 1.4 chương 1, ngoại trừ 6 câu hỏi định tính thì 30 câu định lượng trình bày dạng bảng chính là các câu hỏi định lượng Likert.

Ở bước tạo khuôn dữ liệu Variable View, câu hỏi định lượng Likert nhập liệu giống như câu hỏi định tính một trả lời, các bạn chỉ tạo 1 biến cho 1 câu hỏi (về sau sẽ gọi là tiêu chí). Bảng khảo sát có 30 tiêu chí nên tác giả tạo tương ứng 30 biến như hình:

Mã hóa nhập liệu câu hỏi spss

Các bạn nhập các mục Type, Values, Missing, Measure… bình thường cho các biến. Phần Values, các bạn nhập các mức giá trị của thang Likert: 3, 5, 7, 9 … Trong hình bên dưới tác giả sử dụng Likert 5 mức độ đồng ý.

Mã hóa nhập liệu câu hỏi spss

Cách nhập liệu hoàn toàn giống với câu hỏi định tính một trả lời, mỗi hàng tương ứng với 1 người trả lời (1 phiếu khảo sát).

Mã hóa nhập liệu câu hỏi spss

Tóm tắt:

Đối với dạng câu hỏi định định lượng Likert các bạn cần chú ý những điểm dưới đây:

  • Số biến: Một câu hỏi tương ứng với 1 biến.
  • Giá trị (Values): Số giá trị bằng số mức giá trị của thang đo Likert.
  • Thang đo (Measure): Thường là Scale.