Website Worth

Total Pageviews

Sunday

Thế nào là gia trọng?

Là làm cho cấu trúc (tuổi, giới, dân tộc, vv) của mẫu phù hợp với cấu trúc đó trong dân số.
Công thức tính gia trọng như sau: <![if !msEquation]><![endif]>
Trong đó
Ni là số người từ 18-25 trong một phường
N là tổng số người từ 18-60 trong phường đó.
ni là số người từ 18-25 ta chọn được/hỏi được sau khi kết thúc survey
n là tổng số người từ 18-60 ta hỏi được

Ví dụ tỷ lệ người trong độ tuổi 18-25 trong toàn dân số (từ 18-60 của phường đó) là 0.18
Nhưng tỷ lệ người này trong mẫu chỉ có 0.05.
Vậy trọng số cho nhóm tuổi đó sẽ bằng: 0.18/0.05= 3.6
Nói cách khác các hệ số tính được từ mẫu sẽ được nhân với 3.6 để ra được hệ số có gia trọng. Hệ số có gia trọng phản ánh chính xác hơn quan hệ của các tham số trong dân số.
Nếu phải gia trọng nhiều thuộc tính của dân số thì không nên làm từng cái rồi nhân với nhau, mà làm như sau:
<![if !supportLists]>-         <![endif]>Gia trọng cho thuộc tính thứ nhất
<![if !supportLists]>-         <![endif]>Tính phân phối (proportions) của thuộc tính thứ hai sau khi đã gia trọng thuộc tính thứ nhất
<![if !supportLists]>-         <![endif]>Gia trọng thuộc tính thứ hai
<![if !supportLists]>-         <![endif]>Tính phân phối của thuộc tính thứ bas sau khi đã gia trọng thuộc tính thứ hai,
<![if !supportLists]>-         <![endif]>Vv xem thêm

Gia trọng và liên hệ với chọn mẫu thừa (oversampling is good!)


Chọn mẫu thừa nghe thì có vẻ như cái gì đó 'tiêu cực'. Nhưng không phải vậy.
Trong cách chọn mẫu ngẫu nhiên đơn giản có hệ thống, người ta có thể chọn 1 trong mỗi 50 người hoặc 200 người để nghiên cứu.
Nhưng khi ta gặp một nhóm mẫu có đặc điểm ta quan tâm đặc biệt nào đó, ta sẽ áp dụng cách chọn mẫu thừa, sao cho số trường hợp được chọn trong tổng số mẫu sau cùng là đủ để phân tích.
Các nhóm dân tộc thiểu số thường được 'chọn thừa' là vì như thế.
Khi phân tích xong rồi, ta phải nhân kết quả với trọng số (như trong ví dụ trên) để trả lại tình trạng ban đầu cho nó.