Các khái niệm thường dùng trong thống kê

1. Tổng thể thống kê (Populations)

Tổng thể thống kê là tập hợp  các đơn vị cá biệt  về sự  vật,  hiện tượng  trên cơ  sở một đặc điểm chung nào đó cần được quan sát, phân tích mặt lượng của chúng. Các đơn vị, phần tử tạo nên hiện tượng được gọi là các đơn vị tổng thể.

Như vậy muốn xác định được một tổng thể thống kê, ta cần phải xác định được tất cả các đơn vị tổng thể của nó. Thực chất của việc xác định tổng thể thống kê là việc xác định các đơn vị tổng thể.

Trong nhiều trường hợp, các đơn vị của tổng thể được biểu hiện một cách rõ ràng, dễ xác định. Ta gọi nó là tổng thể bộ lộ. Ngược lại, một tổng thể mà các đơn vị của nó không được nhận biết một cách trực tiếp, ranh giới của tổng thể không rõ ràng được gọi là tổng thể tiềm ẩn.

Đối với    tổng thể  tiềm ẩn,  việc  tìm được   đầy  đủ,  chính xác  gặp  nhiều khó khăn. Việc nhầm lẫn, bỏ  sót các đơn trong tổng thể  dễ xảy  ra. Ví dụ như     tổng thể là   những những mê nhạc cổ điển, tổng thể người mê tín dị đoan,…

2. Mẫu (Samples)

Mẫu là một bộ phận của tổng thể, đảm bảo được tính đại diện và được chọn ra để quan sát và dùng để suy diễn cho toàn bộ tổng thể. Như vậy, tất cả các phần tử của mẫu phải thuộc tổng thể, nhưng ngược lại các phần tử của tổng thể thì chưa chắc thuộc mẫu. Điều này tưởng chừng là đơn giản, tuy nhiên trong một số trường hợp việc xác định mẫu cũng có thể dẫn đến nhầm lẫn, đặc biệt là trong trường hợp tổng thể ta nghiên cứu là tổng thể tiềm ẩn.

Ngoài ra, chọn mẫu như thế nào để làm cơ sở suy diễn cho tổng thể, tức là mẫu phải mang tính đại diện cho tổng thể. Điều này thực sự không dễ dàng, ta chỉ cố gắng hạn chế tối đa sự sai biệt này mà thôi chứ không thể khắc phục được hoàn toàn.

3. Quan sát (Observations)

Là mỗi đơn vị của mẫu ; trong một số tài liệu còn được gọi là quan trắc.

4. Tiêu thức thống kê

Các đơn vị tổng thể thường có nhiều đặc điểm khác nhau, tuy nhiên trong thống kế người ta chỉ  chọn một số đặc điểm để nghiên cứu,  các  đặc điểm này   người ra gọi   là tiêu thức thống kê. Như vậy, tiêu thức thống kê là khái niệm chỉ các đặc điểm của đơn vị tổng thể. Mỗi tiêu thức thống kê đều có các giá trị biểu hiện của nó, dựa vào sự biểu hiện của nó người ta chia ra làm hai loại:

  1. Tiêu thức thuộc  tính: là tiêu thức phản ánh  loại hoặc tính chất  của đơn vị.Ví dụ như ngành kinh doanh, nghề nghiệp,…
  1. Tiêu thức số lượng: là đặc trưng của đơn vị tổng thể được thể hiện bằng con số. Ví dụ, năng suất của một loại cây trồng.

Tiêu thức số lượng được chia làm 2 loại:

  • Loại rời rạc: là loại các giá trị có thể của nó là hữu hạn hay vô hạn và có thể đếm được.
  • Loại liên tục: là loại mà giá trị của nó có thể nhận bất kỳ một trị số nào đó trong một khoảng nào đó.

5. Tham số tổng thể

Là giá trị quan sát được của tổng thể và dùng để mô tả đặc trưng của hiện tượng nghiên cứu. Trong xác suất thống kê toán chúng ta đã biết các tham số tổng thể như trung bình tổng thể (p), tỷ lệ tổng thể (p), phương sai tổng thể (ơ2). Ngoài ra, trong quá trình nghiên cứu sâu môn thống kê chúng ta còn có thêm nhiều tham số tổng thể nữa như: tương quan tổng thể (p), hồi qui tuyến tính tổng thể,…

6. Tham số mẫu

Tham số mẫu là giá trị tính toán được của một mẫu và dùng để suy rộng cho tham số tổng thể. Đó là cách giải thích mang tính chất thông thường, còn đối với xác suất thống kê thì tham số mẫu là ước lượng điểm của tham số tổng thể, trong trường hợp chúng ta chưa biết tham số tổng thể chúng ta có thể sử dụng tham số mẫu để ước lượng tham số tổng thể. Chúng ta có thể liệt kê vài tham số mẫu như sau: trung bình mẫu ( x ), tỷ lệ mẫu (Ị), phương sai mẫu (S2), hệ số tương quan mẫu (r),…