Bản chất của việc đo lường và thang đo (MEASUREMENT SCALES)

1. BẢN CHẤT CỦA VIỆC ĐO LƯỜNG

Việc đo lường gắn kết với nghiên cứu có nghĩa là gán các con số cho các sự kiện thực nghiệm, các đối tượng nghiên cứu hoặc các tính chất, hoặc các hành động theo các nguyên tắc nhất định. Định nghĩa này hàm ý rằng việc đo lường là một quá trình 3 bước:

  1. Chọn lựa các sự kiện thực nghiệm có thể quan sát được.
  2. Phát triển các nguyên tắc để gán các con số hoặc biểu tượng để thể hiện các khía cạnh khác nhau của sự kiện được đo lường.
  3. Áp dụng các nguyên tắc trên cho các quan sát tương ứng với từng sự kiện.

Mục tiêu của đo lường là cung cấp các dữ liệu, thông tin có chất lượng tốt nhất, ít sai sót nhất để trắc nghiệm giả thiết, để phỏng định, tiên lượng hoặc mô tả.

Chúng ta có thể đo lường cái gì?

Thông thường, trong nghiên cứu chúng ta sẽ đo lường các biến số (variables) và có thể phân loại chúng thành đối tượng (objects) hoặc là tính chất (properties).

Đối tượng (Objects) nghiên cứu là một khái niệm rộng, ám chỉ tới chủ thể má chúng ta đang tiến hành nghiên cứu. Trong khoa học kinh tế, đối tượng nghiên cứu có thể là cá nhân, hộ gia  đình, nhóm người,  các chủ thể  kinh tế,  khu vực  kinh  tế, v.v. Thông thường, ta không trực tiếp đo lường được đối tượng nghiên cứu mà chúng ta diễn giải đối tượng nghiên cứu thông qua các tính chất, đặc điểm của đối tượng nghiên cứu.

Tính chất (Properties) là các đặc tính của đối tượng, ví dụ như:

  • Các tính chất thực thể (Physical properties): chiều cao, cân nặng, tuổi tác, v.v.
  • Các tính chất tâm lý (Psychological properties): thái độ, sự thông minh, tình cảm, v.v.
  • Các tính chất xã  hội  (Social properties):  khả năng  lãnh  đạo, quan hệ cộng đồng, v.v.

Mặc dù vậy, trên thực tế, chúng ta thường không đo lường các đối tượng nghiên cứu cũng như các tính chất, mà chúng ta đo  lường  các chỉ  số đại  diện (indicants) cho  đối tượng hoặc tính chất. Ngoài ra, chúng ta cũng rất khó đo lường các tính chất tâm lý hoặc xã hội, trong khi lại có thể đo lường được các tính chất thực thể.

2. THANG ĐO (MEASUREMENT SCALES)

Khi đo lường, chúng ta đưa ra các nguyên tắc đo, và sau đó, diễn giải các quan sát của chúng ta về các chỉ số đại diện cho các tính chất của đối tượng nghiên cứu theo các nguyên tắc đo này. Có nhiều thang đo có thể áp dụng được, và chúng ta sẽ phải chọn các thang đo phù hợp nhất tuỳ theo chúng ta xây dựng các nguyên tắc như thế nào.

Các nguyên tắc đo có 4 đặc tính:

  1. Phân loại (Classification).Sử dụng các con số để chia nhóm hoặc sắp xếp các câu trả lời. Không sắp xếp theo trật tự thứ bậc.
  2. Thứ bậc (Order).Các con số được sắp xếp theo trật tự thứ bậc. Một con số phải lớn hơn, nhỏ hơn hoặc ngang bằng với một con số khác.
  3. Khoảng cách (Distance).Sự chênh lệch, sai biệt giữa các con số được xếp theo thứ bậc. Sai biệt giữa bất kỳ một cặp số liệu nào đều phải lớn hơn, nhỏ hơn hoặc ngang bằng với một con số khác với sự sai biệt của một cặp số bất kỳ khác.
  4. Số gốc (Origin).Các dãy số liệu có một số gốc duy nhất là số không.

Sự kết hợp của các đặc tính phân loại, thứ bậc, khoảng cách và gốc sẽ cho chúng ta 4 thang đo được sử dụng phổ biến là (1) thang đo danh nghĩa (nominal scale); (2) thang đo thứ bậc (ordinal scale); (3) thang đo khoảng cách (interval scale) và (4) thang đo tỷ số (ratio scale).

2.1. Thang đo danh nghĩa (Nominal Scales)

Thang đo này đôi khi còn được gọi là thang đo định danh. Trong nghiên cứu kinh tế và quản trị, thang đo danh nghĩa được  áp dụng rất  phổ biến. Với thang  đo này, chúng ta thu thập thông tin của một biến nào đó mà theo một cách thức tự nhiên hoặc được thiết kế, biến đó được chia thành hai loại hoặc nhiều hơn.

Với thang đo này, chúng ta chỉ có thể có được thông tin duy nhất là số đếm hoặc tỷ lệ các thành viên có trong mỗi nhóm. Nếu chúng ta sử dụng các biểu tượng dạng số theo nguyên tắc mà chúng ta đặt ra để xác định và biểu thị các nhóm, thì các con số này chỉ được hiểu là các nhãn (labels) một cách thuần túy, và không hề có giá trị định lượng nào hết.

Bởi vì ta chỉ có thể lượng hóa con số đếm của các thành viên trường hợp có trong mỗi nhóm (phân phối tần suất), ta không thể sử dụng chỉ số mode và giá trị trung bình như là một chỉ tiêu đo lường xu hướng trung tâm. Tương tự như vậy, ta cũng không thể đo lường độ phân tán của dữ liệu khi áp dụng thang đo danh nghĩa.

Mặc dù thang đo danh nghĩa không mạnh về khả năng thống kê, nhưng chúng vẫn rất hữu ích. Nếu không thể áp dụng thang đo nào khác, chúng ta vẫn có thể phân loại một bộ các tính chất thành một bộ các nhóm tương đương. Thang đo danh nghĩa rất có giá trị cho các nghiên cứu khai phá khi mà mục tiêu nghiên cứu là tìm hiểu các quan hệ hơn là bảo đảm các con số đo lường chính xác. Thang đo danh nghĩa củng được dùng phổ biến trong điều tra và các loại hình nghiên cứu khác khi cần phải phân loại dữ liệu theo các nhóm phụ của dân số điều tra. Thông thường, trong nghiên cứu kinh tế hoặc nghiên cứu khoa học xã     hội,  thang đo    danh nghĩa được áp dụng để phân loại    các         đặc điểm cá nhân của một nhóm người nào đó, ví dụ như giới tính, tình trạng gia đình, học vấn, thái độ chính trị, v.v.

2.2. Thang đo thứ bậc (Ordinal Scales)

Thang đo   thứ bậc, đầu tiên có các tính chất của   thang đo  danh nghĩa, cộng  với  tính chất chỉ thị thứ bậc. Ý nghĩa của thang đo thứ bậc là có thể chỉ ra khái niệm “lớn hơn”, “nhỏ hơn” mà không cần phải nói chính xác lớn hơn bao nhiêu, nhỏ hơn bao nhiêu. Thang đo thứ  bậc   cũng   có thể biểu thị    được các    trạng thái “cao hơn”,  “tốt hơn”,  “tệ hơn”, “kém hơn”, “quan trọng hơn” hoặc “kém quan trọng hơn”.

Thang đo thứ bậc cũng được ứng dụng khi chúng ta cần đo lường nhiều hơn một tính chất mà chúng ta quan tâm. Chúng ta có thể xếp hạng tổng hợp bằng cách hoặc là xếp hạng dựa trên sự tổng hợp các tính chất của một đối tượng nào đó, hoặc bằng cách xây dựng một bảng    xếp hạng tổng hợp dựa trên các xếp hạng riêng  lẻ  dựa trên  từng tính chất đơn lẻ.

Bởi vì các con số sử dụng trong thang đo thứ bậc chỉ có ý nghĩa xếp hạng, giá trị trung vị (median) là con số phù hợp để đo lường xu hướng trung tâm của dãy số biểu thị.

Khi thống kê các dữ liệu có được từ thang đo danh nghĩa hay thang đo thứ bậc, chúng ta có thể dùng các loại thống kê phi tham số (nonparametric tests) vì có nhiều loại trắc nghiệm thống kê mạnh, áp dụng một cách đơn giản, dễ tính toán và không đòi hỏi nhiều giả định như là thống kê tham số (parametric tests).

2.3. Thang đo khoảng cách (Interval Scales)

Thang đo khoảng cách có các đặc tính của thang đo danh nghĩa và thang đo thứ bậc, cộng thêm khả năng so sánh các khoảng cách giữa các cặp số (ví dụ khoảng cách sia biệt về thang đo giữa cặp số 1 và 2 tương đương với sai biệt giữa cặp số 2 và 3).

Có rất    nhiều ứng  dụng cụ  thể đối  với thang   đo  khoảng cách mà chúng ta  sẽ thấy  ở phần tiếp theo. Khi thang đo có tính chất khoảng cách và dữ liệu tương đối cân đối với một giá trị mode, ta có thể sử dụng giá trị trung bình toán học như là giá trị đo lường xu hướng trung tâm. Và vì vậy, ta có thể dùng giá trị độ lệch chuẩn (standard deviation) để đo lường sự phân tán của dữ liệu.

Khi phân phối các điểm số rút ra được từ thang đo khoảng cách bị thiên lệch về một hướng (lệch trái hoặc phải), chúng ta có thể sử dụng giá trị trung vị median để đo lường xu hướng trung tâm, và khoảng cách phân vị (interquartile range) để đo lường độ phân tán.

2.4. Thang đo tỷ số (Ratio Scales)

Thang đo tỷ số Ratio scales có tất cả các đặc diểm của ba thang đo trên, cộng với đặc điểm có giá trị gốc là số không. Thang đo tỷ số thể hiện giá trị thực của một biến.

Trong nghiên cứu kinh tế, chúng ta áp dụng thang đo tỷ số cho rất nhiều loại dữ liệu dạng số thực, ví dụ như giá trị tiền, dân số, khoảng cách, thu nhập (bằng tiền), năng suất, sản lượng, v.v.

Nghiên cứu thực nghiệm (empirical study) là cách thức các nhà nghiên cứu áp dụng để mô tả, giải thích và tiên lượng dựa trên các thông tin có được từ các quan sát.