Study Guides (247,982)
Canada (121,201)
Sociology (272)
SOCY 211 (15)
Midterm

Test 4 Review - Socy 211
Premium

6 Pages
95 Views
Unlock Document

Department
Sociology
Course
SOCY 211
Professor
Jones Adeji
Semester
Winter

Description
Association between variables measured at the interval ratio level  13.1  ▯trying to understand bivariate relationships, explore causal ties between variables, and  improve our abilities to predict scores 13.2  • In addition to measures of association such as phi or gamma, the conditional  distributions and patterns of cell frequency almost always provide useful  information and a better understanding of relationships • First step: construct and examine a scattergram – allow us to quickly identify  several important features of the relationship • Scattergram has two dimensions, the scores of the independent (x) variable are on  horizontal axis and the scores of the dependent (y) are on the vertical axis • Each dot represents a case in the sample and is located at a point determined by  the scores of the case • The overall pattern of the dots summarizes the nature of the relationship between  the two variables – draw a straight line through the cluster of dots –  summarization line is called the regression line • Scattergrams provide impressionistic information about the existence, strength,  and direction of the relationship, and can also be used to check for linearity  ( how  well the pattern of dots can be approximated with a straight line). Lastly, it can be  used to predict the score of a case one variable from the score of that case on the  other variable • Basic definition of association: two variables are associated if the distributions of  Y (dependent variable) change for the various conditions of X (independent  variable)  • If Y changes as X changes – there is an association  • In a Perfect association, all the dots would lie on the regression line  • Positive relationship: as X increases Y increases • Negative relations: As X decreases, X decreases  • One key assumption is that the 2 variables are essentially on a linear relationship • If the relationship is non linear, you need to treat the variables as if they were  ordinal rather than interval ratio in level of measurement 13.3 • Final use of scattergram is to predict scores of cases on one variable from their  score on the other • Predicted score is symbolized as Y’ – found by first localizing the score on X and  then drawing a straight line from that point to the regression line. From the  regression line, another straight line parallel to the X axis is drawn across the Y  axis – prediction technique is crude and the value of Y’ can change depending on  how accurately its drawn • Within each conditional distribution of Y, the mean is the point around which the  variation of scores is at a minimum  ▯if the regression line is drawn so that it  touches each conditional mean of Y, it be the straight line that comes as close as  possible to all of the scores  • Conditional means are found by summing all Y values for each value of X then  dividing by the number of cases … for X =1, Y = 1,2,3,5 …Conditional mea=  11/4 = 2.75 husbands with one child worked on average of 2.75 hours per week  doing housekeeping  • Only when there is a perfection association between X and Y will it fall perfectly  straight line • Y = a + bx • Y= the score on the dependent variable  • A= the slope of the regression line or the amount of change produced in Y by a  unit change in X  • B= the slope of the regression line or the amount of change produced in Y by a  unit change in X  • Find B first, the numerator of the formula is called the covariation of X and Y  ▯ measure of how X and Y vary together, and its value will reflect both the direction  and strength of the relationship • Make a computation table : with X, Y, and their summations, and X and Y squared  and then multiple XY and that summation  • A = the mean of Y – b(mean of x) • The full least squares regression line  for sample data can be formed  ▯used to  estimate scores on Y for any value of X 13.5 The Correlation Coefficient (Pearsons R) • The slope (b) of the least squares regression line a measure of the effect of Xon Y.  Because the slope is the amount of change produced in Y by a unit change of X, b  will increase in value as the relationship increases in strength – but b does not  vary from 0 to 1 so it is awkward measure of association • Rely on Pearson’s r ▯ correlation coefficient , to measure association between  interval ratio variables – varies from 0.00 to +­ 1.00  • Numerator of formua is the covariation of X and Y • Ex: an R value of + 0.50 indicates a strong, positive, linear relationship between  the variables. As the number of children in the family increases, the hourly  contribution of husbands to housekeeping also increases  13.6 Interpreting the Correlation Coefficient : r squared  • Value between the extremes of 0.0 and +­ 1.0 have no direct interpretation • 0.0 – 0.10 as weak • 0.11 and 0.30 as moderate • 0.31 – strong • Less arbitrary more direct interpretation of r by calculating additional statistic  called the coefficient of determination  ­ the square of Pearson’s R • Akin to PRE – measures of association is to predict the value of the dependent  variable under two conditions: 1) Y is predicted while ignoring information  supplied by X, and then second the independent variable X is taken into account  • The prediction of the Y scores under the first condition (while ignoring X) will be  the mean of Y, this is optimal, because we know the mean of any distribution is  closer to all the scores than any other point in the distribution – principle of  minimized variation  • If we predict the mean of Y for every case we will make fewer errors of prediction  than if we predict any other value for it  • Total Variation of Y= defining the extent of our prediction error under the first  condition while ignoring X by subtracting the mean of Y from the actual Y square  and squaring and summing these deviations = Sum(Y­ mean of Y)squared  • Next step, determine the extent to which knowledge of X improves our ability to  predict Y, if the two variables have a linear relationship, then predicting scores on  Y from the least squares regression equation will incorporate knowledge of X and  reduce errors of prediction  • Explained variation: represents the improvement in our ability to predict Y when  taking the mean of X into account  ▯explained variation divided by total variation   ▯thus r square (coefficient of determination) how X helps us to predict or  understand Y • Unexplained variation  ▯the difference between our best prediction of Y with X  and the actual scores – the scattering of the actual scores around the regression  line and can be found by subtracted the predicted Y scores from the actual Y  scores for each case and the squaring and summing the differences  • Explained and unexplained variations have a reciprocal relationship with  eachother, as one of the sums increases in va
More Less

Related notes for SOCY 211

Log In


OR

Join OneClass

Access over 10 million pages of study
documents for 1.3 million courses.

Sign up

Join to view


OR

By registering, I agree to the Terms and Privacy Policies
Already have an account?
Just a few more details

So we can recommend you notes for your school.

Reset Password

Please enter below the email address you registered with and we will send you a link to reset your password.

Add your courses

Get notes from the top students in your class.


Submit