Textbook Notes (369,071)
Canada (162,367)
SOAN 3120 (37)
Chapter 8

Chapter 8.docx

5 Pages

Sociology and Anthropology
Course Code
SOAN 3120
Michelle Dumas

This preview shows pages 1 and half of page 2. Sign up to view the full 5 pages of the document.
Chapter 8 Producing Data: Sampling ­ Sometimes we have data that describe a group of individuals and want to learn  what the data say – EXPLANATORY data analysis ­ Sometimes we have specific questions but no data to answer them – PRODUCE  data  in a way that is designed to answer our questions  ­ Cannot afford to sample every single person in a university – so we create a  SAMPLE of  the POPULATION  ­ A sound statistical design is necessary if we are to trust data from a sample ­ Practical problems can overwhelm even sound designs ­ Impact of technology is making it harder to produce trustworthy national data by  sampling  • Population versus Sample ­ Population  ▯in a statistical study is the entire group of individuals about which  we want information  ­ Sample  ▯part of the population from which we actually do collect information;  we use a sample to draw conclusions about the entire population ­ Sampling Design  ▯describes exactly how to choose a sample from the population ­ We often draw conclusion about a whole population on the basis of a sample ­ Choosing representative sample from a large and varied population is not so easy; 1) First step in planning a sample survey is to say exactly what population we  want to describe  2) Second step is to say exactly what we want to measure – give exact definitions  of our variables  3) The final step in planning a sample survey is the sampling design  • How to Sample Badly  ­ Sampling design is a specific method for choosing a sample from the population ­ Easiest – but not the best method just chooses individuals close at hand  ­ Convenience Sample  ▯a sample selected by taking the members of the population   that are easiest to reach   Ex; picking people out in a shopping mall  Often produce unrepresentative data; systematic errors caused by a bad  sampling design – ex; wealthy people, teenagers, and retired people are often  seen most commonly in malls  ▯This is a bias; the outcomes of mall surveys will repeatedly miss the truth  about the population in the same way ­ Bias ▯the design of a statistical is biased if it systematically favors certain  outcomes ­ People who take the trouble to respond to an open invitation are usually not  representative of any clearly defined population   Ex; people who write in, call in, or submit answers to polls on the radio  Polls like these are examples of VULUNTRAY RESPONSE SAMPLING  ­ Voluntary Response Sample  ▯consists of people who chose themselves by  responding to a broad appeal   Biased because people with a strong opinion are most likely to respond • Simple Random Samples ­ Voluntary sample – people choose whether to respond ­ Convenience sample – interviewer makes the choice of who responds ­ Statisticians remedy is to allow impersonal chance to choose the sample  ­ Sample selection chosen by chance rules out both favoritism by the sample and  self selection by respondents  ­ Choosing sample by chance attacks bias by giving all individuals an equal chance  to be chosen  Simplest way to use chance sample is to place names in a hat (the population)  and draw out a handful (the sample) ­ Simple Random Sample (SRS)  ▯of size n consists of n individuals from the  population chosen in such a way that every set of n individuals has an equal  chance to be the sample actually selected   Gives every possible sample an equal chance to be chosen   SRS doesn’t favor any part of the population   Downfall – writing names on slips of paper and drawing them from a hat is  slow an inconvenient and not good for large samples sizes   ­ In practice samplers use software – Simple random sample applet makes choosing  samples really fast  ­ If you don’t use applet or other software you can randomize using table of random  digits ­ Table of Random Digits  ▯is a long string of the digits 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,  with these two properties;  1) each entry in table is equally likely to be any of the 10 digits  2) entries are independent of each other – knowledge of one part of the table  gives no info about the other ­ There are two steps in using the table to choose a simple random sample; 1) Label – give each member of the population a numerical label of the same  length 2) Table – To choose an SRS, read from Table successive groups of digits of the  length you uses as labels; your sample contains the individuals whose labels  you find in the table  ­ Always use the smallest label possible; you can label up to 100 items with two  digits; 01, 02, 03 and up to 1000 with 3 digits and so on ­ Begin with label 01 or 001  ­ All labels have same chance of being found in table  ­ Ignore any groups of digit that was not used as a label or that duplicated a label  already in the sample  ­ Table has NO order but standard practice is to read across   ­ SRS is trusting because of the use of impersonal chance; there cannot be bias ­ THE FIRST QUESTION TO ASK ABOUT ANY SAMPLE IS WHETHER IT  WAS CHOSEN AT RANDOM • Inference about the Population ­ Inference  ▯The process of drawing conclusions about a population on the basis of   sample data; called inferences because we infer information about the population  from what we KNOW 
More Less
Unlock Document

Only pages 1 and half of page 2 are available for preview. Some parts have been intentionally blurred.

Unlock Document
You're Reading a Preview

Unlock to view full version

Unlock Document

Log In


Join OneClass

Access over 10 million pages of study
documents for 1.3 million courses.

Sign up

Join to view


By registering, I agree to the Terms and Privacy Policies
Already have an account?
Just a few more details

So we can recommend you notes for your school.

Reset Password

Please enter below the email address you registered with and we will send you a link to reset your password.

Add your courses

Get notes from the top students in your class.