Sai số trong điều tra thống kê

Trong điều tra thống kê có hai loại sai số: Sai số chọn mẫu (sai số do tính đại diện của số liệu vì chỉ chọn một bộ phận các đơn vị để điều tra) và sai số phi chọn mẫu (sai số thuộc về lỗi của các quy định, hướng dẫn, giải thích tài liệu điều tra, do sai sót của việc cân đong, đo đếm, cung cấp thông tin, ghi chép, đánh mã, nhập tin…) từ đây gọi là “sai số điều tra”.

Sai số chọn mẫu chỉ phát sinh trong điều tra chọn mẫu khi tiến hành thu thập ở một bộ phận các đơn vị tổng thể (gọi là mẫu) rồi dùng kết quả suy rộng cho toàn bộ tổng thể. Sai số chọn mẫu phụ thuộc vào cỡ mẫu (mẫu càng lớn thì sai số càng nhỏ), vào độ đồng đều của chỉ tiêu nghiên cứu (độ đồng đều cao thì sai số chọn mẫu càng nhỏ) và phương pháp tổ chức điều tra chọn mẫu. Còn sai số điều tra xảy ra cả trong điều tra chọn mẫu và điều tra toàn bộ.
Trong thực tế công tác điều tra thống kê hiện nay, phương pháp chọn mẫu được áp dụng ngày càng nhiều và có hiệu quả. Số liệu thu được từ điều tra chọn mẫu ngày càng phong phú, đa dạng và phục vụ kịp thời các yêu cầu sử dụng. Bên cạnh đó chất lượng số liệu của điều tra chọn mẫu cũng còn những hạn chế nhất định. Có một số ý kiến hiện nay đánh giá không công bằng và thiếu khách quan về kết quả điều tra chọn mẫu, cho rằng số liệu chưa sát với thực tế vì chỉ điều tra một bộ phận rồi suy rộng cho tổng thể.
Tất nhiên cũng phải thấy rằng đã là điều tra chọn mẫu thì không thể tránh khỏi sai số chọn mẫu nhưng mức độ sai số chọn mẫu của phần lớn những chỉ tiêu trong các cuộc điều tra thống kê hiện nay thường là ở phạm vi cho phép nên chấp nhận được. Hơn nữa khi cần thiết ta có thể chủ động giảm được sai số chọn mẫu bằng cách điều chỉnh cỡ mẫu và tổ chức chọn mẫu một cách khoa học, tuân thủ đúng nguyên tắc chọn mẫu.
Điều đáng nói và cần quan tâm hơn trong điều tra thống kê chính là sai số phi chọn mẫu. Loại sai số này xảy ra ở cả ba giai đoạn điều tra, liên quan đến tất cả các đối tượng tham gia điều tra thống kê và ảnh hưởng đáng kể đến chất lượng số liệu thống kê.
Dưới đây sẽ đi sâu nghiên cứu về sai số phi chọn mẫu – sai số điều tra, xảy ra trong cả ba giai đoạn nhưng chỉ đề cập đến sai số liên quan tới những công việc, những đối tượng thường gặp nhiều hơn.

1. Sai số trong quá trình chuẩn bị điều tra thống kê:

Trong công tác điều tra thống kê, chuẩn bị điều tra giữ một vai trò cực kỳ quan trọng. Chất lượng của khâu chuẩn bị điều tra sẽ ảnh hưởng cả đến quá trình thu thập số liệu và cuối cùng là đến chất lượng của số liệu điều tra. Một cuộc điều tra được chuẩn bị kỹ lưỡng, chu đáo và đầy đủ sẽ là cơ sở đầu tiên để giảm sai số điều tra nhằm nâng cao chất lượng của số liệu thống kê.

1.1. Sai số điều tra liên quan tới việc xác định mục đích, nội dung và đối tượng điều tra:

 Xác định mục đích điều tra là làm rõ yêu cầu của cuộc điều tra phải trả lời những câu hỏi gì, đạt được những mục tiêu nào của công tác quản lý. Yêu cầu của mục đích điều tra phải rõ ràng, dứt khoát và đó chính là căn cứ để xác định nội dung cũng như đối tượng điều tra một cách đúng đắn, đầy đủ, phù hợp, không bị chệch hướng.
Cùng một đơn vị điều tra, nếu có mục đích điều tra khác nhau với cách tiếp cận thu thập thông tin khác nhau thì sẽ có nội dung cũng như đối tượng điều tra khác nhau.

Xác định đúng nội dung và đối tượng điều tra, một mặt làm cho số liệu thu thập được sẽ đáp ứng những yêu cầu sử dụng, số liệu đảm bảo “vừa đủ”. Mặt khác, xác định đúng nội dung và đối tượng điều tra là cơ sở để thiết kế bảng hỏi một cách khoa học và có điều kiện thuận lợi để tiếp cận với đối tượng cung cấp thông tin, đảm bảo thông tin thu được phù hợp và phản ánh đúng thực tế khách quan.
Tóm lại việc xác định đúng mục đích, nội dung và đối tượng điều tra làm cho cuộc điều tra thực hiện đúng hướng, đúng yêu cầu là một trong những điều kiện tiên quyết để đảm bảo chất lượng số liệu, giảm sai số trong điều tra thống kê.

1.2. Sai số liên quan tới việc xây dựng các khái niệm, định nghĩa dùng trong điều tra:

Khái niệm, định nghĩa dùng trong điều tra giúp cho hiểu rõ nội dung, bản chất cũng như phạm vi xác định thông tin của số liệu thống kê cần thu thập.
Như ta đã biết thống kê nghiên cứu mặt lượng trong quan hệ mật thiết với mặt chất của hiện tượng kinh tế – xã hội số lớn. Chính các khái niệm, định nghĩa là phản ánh về mặt chất của hiện tượng, là cơ sở để nhận biết, phân biệt hiện tượng này với hiện tượng khác cũng như xác định phạm vi của hiện tượng nghiên cứu. Nếu khái niệm, định nghĩa chuẩn xác, rõ ràng, được giải thích đầy đủ, cặn kẽ là cơ sở để xác định và thu thập số liệu thống kê phản nh đúng thực tế khách quan. Ngược lại nếu khái niệm, định nghĩa không đúng, mập mờ, thiếu rõ ràng thì việc xác định, đo tính (lượng hoá) hiện tượng sẽ bị sai lệch.

Ví dụ: Khi điều tra cán bộ khoa học công nghệ có trình độ sau đại học, xét về chất, sau đại học phải là những người đã tốt nghiệp và có bằng thạc sĩ, tiến sĩ và tiến sĩ khoa học. Trong thực tế có cuộc điều tra thống kê ở nước ta chỉ đưa ra khái niệm sau đại học còn chung chung, thiếu cụ thể. Điều này làm cho những người tham gia điều tra (kể cả điều tra viên lẫn đối tượng trả lời) hiểu khái niệm cán bộ khoa học công nghệ có trình độ sau đại học rất khác nhau. Một số ít người đã hiểu đúng với nghĩa trình độ sau đại học phải gồm những người có bằng thạc sĩ, tiến sĩ và tiến sĩ khoa học; phần đông còn lại đã hiểu không đúng và cho là sau đại học gồm những người đã tốt nghiệp đại học sau đó được đi thực tập sinh sau đại học và thậm chí còn cả những người đã tốt nghiệp đại học nhưng chỉ được đi tập trung để đào tạo bồi dưỡng thêm về nghiệp vụ một vài tháng.

Thực tế này đã làm cho số liệu điều tra được về cán bộ khoa học công nghệ có trình độ sau đại học tăng lên hơn hai lần so với số thực tế có tại thời điểm điều tra.

Như vậy, những lỗi trong việc xây dựng các khái niệm, định nghĩa và nội dung thông tin về tiêu thức, chỉ tiêu thống kê sẽ ảnh hưởng trực tiếp đến chất lượng số liệu thống kê. Đây là hiện tượng khá phổ biến trong điều tra thống kê ở nước ta hiện nay.

Để có số liệu  tốt,    giảm          bớt       sai      số     điều tra, một vấn đề có tính chất nguyên tắc đó là         phải chuẩn hoá các khái niệm, định nghĩa về các tiêu thức, chỉ tiêu của điều tra thống kê. Đồng thời phải giải thích rõ ràng, đầy đủ và cụ thể hoá các khái niệm, định nghĩa cho phù hợp với từng cuộc điều tra riêng biệt.

1.3. Sai số điều tra liên quan tới thiết kế bảng hỏi, xây dựng các bảng danh mục và mã số dùng trong điều tra:

Trong điều tra thống kê, bảng hỏi là vật mang tin, là công cụ giúp điều tra viên điền thông tin hoặc đánh dấu, đánh mã vào các ô, dòng, cột phù hợp theo nội dung trả lời của các câu hỏi tương ứng với các tiêu thức ghi ở bảng hỏi dùng trong điều tra.

Nếu các câu hỏi phức tạp, khó hiểu, khó trả lời, khó xác định hoặc khó điền thông tin thì khi đó thông tin thu được sẽ kém chính xác, không đáp ứng yêu cầu của số liệu điều tra.

Cùng với bảng hỏi, các bảng danh mục và các mã số có vai trò quan trọng trong quá trình tổng hợp số liệu thống kê. Thông tin thu được dù đảm bảo độ tin cậy cần thiết, nhưng nếu bảng danh mục dùng cho điều tra không chuẩn xác, các mã số không rõ ràng, khó áp dụng dẫn tới việc đánh sai, đánh nhầm và tất nhiên như vậy số liệu tổng hợp sẽ bị sai lệch.

Để giảm sai số điều tra, bảng hỏi phải được thiết kế một cách khoa học, đáp ứng đầy đủ nhu cầu thông tin theo nội dung điều tra đã được xác định, bảo đảm mối liên hệ logic và tính thống nhất giữa các câu hỏi. Mặt khác, các câu hỏi phải đơn giản, dễ hiểu, dễ trả lời, dễ ghi chép, phù hợp với trình độ của điều tra viên và đặc điểm về nguồn thông tin của từng loại câu                 hỏi. Thiết kế          bảng            hỏi     còn phải     đảm       bảo  thuận lợi cho việc áp  dụng công nghệ thông tin. Các bảng danh mục phải có nội dung phù hợp với những thông tin cần thu thập và được mã hoá một cách khoa học theo yêu cầu tổng hợp của điều tra. Danh mục vừa phải phù hợp với yêu cầu của từng cuộc điều tra, vừa phải đáp ứng và thống nhất với danh mục phục vụ cho tổng hợp chung      của công tác thống kê. Nội dung bảng danh  mục        và cách mã hoá phải được giải thích đầy đủ và hướng dẫn cụ thể.

1.4. Sai số điều tra liên quan tới việc lựa chọn điều tra viên và hướng dẫn nghiệp vụ:

Điều tra viên là người trực tiếp truyền đạt mục đích, nội dung, yêu cầu điều tra đến các đối tượng cung cấp thông tin, đồng thời trực tiếp phỏng vấn, lựa chọn thông tin để ghi vào bảng hỏi (nếu là điều tra trực tiếp). Vì vậy, điều tra viên có vai trò rất quan trọng trong việc đảm bảo chất lượng số liệu trong điều tra.

Nếu điều tra viên không nắm vững mục đích của cuộc điều tra, không hiểu hết nội dung thông tin cần thu thập thì sẽ truyền đạt không đúng các yêu cầu cần thiết cho đối tượng trả lời. Ngay cả khi điều tra viên nắm được nghiệp vụ, nhưng nếu thiếu ý thức trách nhiệm, chỉ phỏng vấn và ghi chép cho xong việc, hoặc cách tiếp cận với đối tượng điều tra không tốt thì cũng sẽ dẫn đến kết quả số liệu điều tra thu được không theo ý muốn.

Như vậy, việc lựa chọn điều tra viên không tốt cũng là nguyên nhân không kém phần quan trọng làm cho sai số điều tra tăng lên, ảnh hưởng đến chất lượng số liệu. Vì vậy, muốn giảm bớt loại sai số điều tra này, cần tuyển chọn điều tra viên có trình độ nhất định, nắm được nghiệp vụ, có kinh nghiệm thực tế về điều tra thống kê, đồng thời phải có ý thức và tinh thần trách nhiệm cao.

Sau khi                   lựa chọn được                       điều        tra viên               cần tổ             chức          tập       huấn         nghiệp             vụ      đầy        đủ và            thống nhất. Trong lớp tập huấn bên cạnh giải thích biểu mẫu điều tra cần cung cấp thêm những kiến thức về xã hội, phổ biến những kinh nghiệm thực tế và cách tiếp cận đối tượng điều tra, cách ứng  xử trong thực tế. Đối             với                                                                 các cuộc                             điều        tra      thống kê có                   nội       dung phức tạp                        và quy mô lớn, cần tiến hành điều tra thử để kịp thời rút kinh nghiệm, đảm bảo hướng dẫn nghiệp vụ gắn với điều tra thực địa.

Trong điều tra chọn mẫu, khi hướng dẫn nghiệp vụ cần chỉ rõ lộ trình điều tra theo từng cấp chọn mẫu, xác định địa bàn điều tra, lập danh sách địa bàn và đối tượng điều tra chọn mẫu (có địa chỉ cụ thể), quy định rõ những trường hợp mất mẫu phải thay đổi như thế nào, thay đổi đến đâu để tránh tình trạng điều tra viên thay đổi mẫu tuỳ tiện theo ý chủ quan của họ, v.v…

2. Sai số trong quá trình tổ chức điều tra:

2.1. Sai số điều tra liên quan đến quan hệ giữa yêu cầu về nội dung thông tin và quỹ thời gian, các điều kiện vật chất cần cho thu thập số liệu:

Nếu trong các cuộc điều tra thống kê phải thu thập quá nhiều chỉ tiêu có nội dung thông tin phức tạp, tốn nhiều thời gian để giải thích, phỏng vấn và ghi chép; trong khi đó quỹ thời gian và kinh phí dành cho công việc này lại không tương xứng, làm cho điều tra viên không đủ điều kiện để tiếp cận tìm hiểu tình hình thực tế, giải thích một cách đầy đủ, cặn kẽ về mục đích, yêu cầu và nội dung điều tra, …, cho người cung cấp thông tin thì có thể họ sẽ không khai báo, hoặc khai báo qua loa, sai với thực tế. Đặc biệt có những loại thông tin phải hồi tưởng thì càng không đủ thời gian để nhớ lại. Tất cả những điều đó làm cho số liệu thu thập được sai số nhiều, không phản ánh đúng thực tế khách quan.

Để nâng cao                         chất lượng số liệu thống                                       kê,        giảm          sai số           khi       tổ      chức          điều tra,              phải        cân đối

giữa nhu cầu                         thu thập thông tin                              với       khả        năng          về       điều        kiện         kinh phí và                    quỹ       thời gian dành cho điều tra. Không nên tổ chức một cuộc điều tra đòi hỏi thu thập quá nhiều chỉ tiêu; đặc biệt phải giới hạn những chỉ tiêu thu thập quá khó và tính toán phức tạp. Hơn nữa tuỳ thuộc vào đặc điểm và nội dung thông tin của các chỉ tiêu khác nhau, thuộc các đối tượng khác nhau để có cách tiếp cận thu thập thông tin cho hợp lý. Có thể chỉ tiêu này cần thu thập từ những nội dung chi tiết rồi tổng hợp chung lại, nhưng chỉ tiêu kia chỉ cần lấy số liệu khái quát. Không nên cho           rằng                        bất       kỳ                                                             chỉ             tiêu nào, nội       dung thông tin nào               cũng                                                                            phải        lấy       từ số liệu chi tiết mới là chính xác.

2.2. Sai số điều tra liên quan đến điều tra viên:

Như trên                    đã    nói để nâng cao chất lượng                                              số       liệu,         giảm sai                số     điều tra, một                       trong           những yêu cầu là phải chọn những người điều tra đủ tiêu chuẩn về chuyên môn và tinh thần trách nhiệm.

Ngoài những yêu cầu trên, điều tra viên khi được phân công về địa bàn điều tra, còn đòi hỏi phải làm quen với địa bàn, tìm hiểu thực tế về phong tục, tập quán, về điều kiện đi lại, sinh hoạt của địa phương.

Khi điều tra, điều tra viên phải kết hợp được kiến thức chuyên môn về điều tra đã được hướng dẫn với tình hình thực tế ở địa bàn điều tra, vừa phải giữ đúng nguyên tắc quy định cho điều tra, vừa phải có được những xử lý linh hoạt và hài hoà. Phần lớn những thắc mắc của đối tượng điều tra, điều tra viên phải tự mình tìm ra hướng giải đáp. Chỉ những trường hợp cần thiết mới ghi lại để xin ý kiến về cách xử lý của cấp chỉ đạo cao hơn.

2.3. Sai số điều        tra liên quan đến ý thức, tâm lý và khả năng hiểu biết của người trả lời:

Ở đây việc trả       lời       câu       hỏi       có thể không tốt      do ba nguyên nhân thuộc  người cung cấp thông tin như sau:

  • Về ý thức của người trả lời: Nếu họ không có tinh thần trách nhiệm cao, cho là cung cấp thông tin thế nào cũng được, nói cho xong việc thì có thể khi điều tra, người cung cung cấp thông tin sẽ lấy lý do này, lý do khác để không trả lời hoặc trả lời không hết, không đúng sự thật. Không ít trường hợp người trả lời còn cố tình khai không đúng vì lợi ích kinh tế và mục đích khác.
  • Về tâm lý, nhiều người cung cấp thông tin không muốn trả lời những câu hỏi liên quan đến đời          tư,                               đến mức        sống,    đến sự bí               mật kín          đáo                              của họ, của                      đơn vị họ. Ví          dụ:             khi                      điều tra thu thập thông tin mức thu                                               nhập        của hộ            gia        đình,         phần lớn các                      chủ hộ            nhất        là những                người có thu nhập cao thường không muốn nói thật, nói hết mức thu nhập của mình. Một ví dụ khác một người phụ nữ đi phá thai trong trường hợp giấu gia đình họ sẽ không muốn khai vì không muốn cho những người thân trong gia đình biết đến.
  • Về nhận thức của người trả lời, nhiều người do nhận thức có hạn, không thấy rõ được mục đích, yêu cầu điều tra, không hiểu được nội dung câu trả lời… do vậy họ không thể trả lời hoặc trả lời không đúng với yêu cầu câu hỏi.

Qua đây cho thấy, để giảm bớt sai số điều tra, điều tra viên phải có cách tiếp cận hợp lý với từng loại đối tượng điều tra, ngoài kiến thức chuyên môn còn phải hiểu biết về xã hội, giải thích cho người được phỏng vấn về mục đích, ý nghĩa, về nguyên tắc cung cấp và bảo mật thông tin riêng, về trách nhiệm và quyền hạn của người cung cấp thông tin, giải thích cho họ hiểu nội dung câu hỏi một cách thuận tiện nhất, gợi ý cho họ những cách trả lời để đi đến có được số liệu thật.

2.4. Sai số điều tra liên quan đến các phương tiện cân, đong, đo lường:

Tất cả các khâu khác chuẩn  bị    tốt,  nhưng  nếu các   loại  phương tiện như cân, thước đo, dụng cụ đo huyết áp… dùng cho các chỉ tiêu phải thực hiện kiểm tra, đo, đếm trực tiếp mà không được chuẩn bị tốt thì cũng sẽ sai sót dẫn đến sai số trong điều tra. Ví dụ: điều tra để xác định mức độ suy dinh dưỡng của trẻ em. Nếu ta dùng loại cân không chuẩn thì sẽ cân không chính xác, dẫn đến số liệu tổng hợp về tỷ lệ trẻ em suy dinh dưỡng sẽ không đúng, hoặc là cao hơn, hoặc là thấp hơn thực tế.

Như vậy, việc chuẩn bị tốt các phương tiện đo lường, sử dụng đơn vị đo lường tiêu chuẩn, tránh sử dụng đợn vị đo lường địa phương khi điều tra cũng là biện pháp cần thiết để giảm sai số điều tra.

3. Sai số liên quan đến quá trình xử lý thông tin:

Sai số điều tra còn có thể xảy ra vì sai sót trong khâu đánh mã, nhập tin trong quá trình tổng hợp, xử lý số liệu.

Số liệu thu về phải được kiểm tra sơ bộ trước khi đánh mã, nhập thông tin. Việc kiểm tra này có thể phát hiện ra những trường hợp hiểu đúng nhưng ghi chép sai như nhầm đơn vị tính: 1 cái ghi sai thành 1 ngàn cái, 1 đồng thành 1 ngàn đồng; điền sai vị trí của thông tin, v.v. Bằng kinh nghiệm nghề nghiệp cũng như quan hệ logic tính toán giữa các câu hỏi, người kiểm tra có thể phát hiện được những loại sai sót kiểu này. Kiểm tra sơ bộ còn có thể phát hiện những trường hợp có “số liệu lạ” (quá cao hoặc quá thấp so với mức bình quân chung). Những loại sai sót trên đây nhân viên kinh tế có thể tự điều chỉnh hoặc nếu trong những trường hợp cần thiết phải kiểm tra xác minh lại. Làm tốt khâu kiểm tra sơ bộ cũng là công việc góp phần quan trọng để giảm sai số điều tra.

Cần kiểm tra sơ bộ công đoạn đánh mã và nhập thông tin. Số liệu ghi đúng, ghi đầy đủ được kiểm tra kỹ lưỡng, nhưng nếu đánh mã sai, hoặc nhập thông tin sai thì cũng dẫn đến kết quả tổng hợp sai.

Sai sót trong đánh mã có thể là lựa chọn mã không phù hợp với nội dung của thông tin, hoặc là do bảng mã không cụ thể, khó xác định, hoặc là khả năng liên hệ vận dụng mã của người đánh mã không tốt; , đánh mã sai (mã này lẫn với mã kia) hoặc có mã đúng nhưng lộn số (ví dụ 51 thành 15), v.v…

Để khắc phục sai sót trong khâu đánh mã, trước hết phải có bảng mã tốt, cụ thể, phù hợp với nội dung thông tin cần thu thập. Bên cạnh những mã cụ thể cần có những mã chung để cho người đánh mã có cơ sở vận dụng cho những trường hợp thực tế xảy ra nhưng chưa có mã trong danh mục mã cụ thể (gọi là các trường hợp khác). Mặt khác, người đánh mã phải được hướng dẫn đầy đủ về yêu cầu, nguyên tắc và kỹ thuật đánh mã, khi thực hiện phải biết vận dụng và xử lý linh hoạt nhưng tuyệt đối không được tuỳ tiện, người đánh mã còn kết hợp chặt chẽ với các bộ phận khác trong cùng khâu tổng hợp, xử lý số liệu.

Sau đánh mã là khâu nhập thông tin và khâu này cũng thường xuyên xảy ra sai số. Loại sai sót này thường xảy ra trong các trường hợp sau: Nhập tin đúp hoặc bỏ qua không nhập thông tin, nhập mã sai, ấn lộn số, v.v…

Để khắc phục những sai sót khi nhập tin, thông trước hết phải lựa chọn những nhân viên nhập tin có khả năng nhập tốt, ít nhầm lẫn, có tinh thần trách nhiệm cao, tuân thủ nghiêm túc những quy trình và nguyên tắc nhập thông tin đã được hướng dẫn thống nhất.

Trên góc độ công nghệ thông tin, phải có chương trình nhập hợp lý, khoa học, có được những lệnh cho phép tự kiểm tra để phát hiện những lỗi nhập thông tin.

Trong nhiều trường hợp phải phân công chéo để nhập thông tin hai lần rồi so sánh đối chiếu số  liệu   nhập  để tìm ra những    trường  hợp   khôngthống nhất thuộc   về  lỗi nhập thông tin.

Đối với các cuộc điều tra thống kê thực tế hiện nay, những lỗi nhập thông tin ảnh hưởng đến sai số điều tra không phải là nhỏ. Tuy nhiên, sai số do lỗi nhập thông tin, nếu có chuẩn bị tốt hoàn toàn có khả năng khắc phục.