Một trong những lệnh của STATA mà mình ít sử dụng nhất trong STATA có lẽ là lệnh DESCRIBE. Cú pháp cho lệnh này khá đơn giản, chỉ cần gõ DESCRIBE tên_biến là chúng ta sẽ có được các thông tin về format của biến, tên biến và ý nghĩa tên biến (label). Khi mở cửa sổ biến ra, click vào từng tên biến thì mình cũng có thể có được những thông tin này. Vậy nên, mình rất ít sử dụng lệnh DESCRIBE.
Gần đây, mình mới vừa học được một lệnh mới, thay thế cho lệnh DESCRIBE và cho mình nhiều kết quả mình mong muốn hơn. Đó là lệnh CODEBOOK.
Cú pháp lệnh CODEBOOK cũng rất đơn giản, chỉ gần gõ CODEBOOK + tên_biến là xong.
Lệnh này cho chúng ta biết được vô số các thông tin hữu dụng luôn, như là:
– Format của biến (type)
– Số quan sát bị missing
– Khoảng dữ liệu – giá trị nhỏ nhất và giá trị lớn nhất (range)
– Các giá trị thống kê mô tả như là giá trị trung bình (mean), độ lệch chuẩn (std. Dev), các giá trị phân vị (percentiles)
Lệnh CODEBOOK này giống như là lệnh kết hợp giữa DESCRIBE và SUMMARIZE vậy đó.
Các bạn ghi nhớ lệnh này để sử dụng sau này nhé.