Textbook Notes (368,434)
Canada (161,878)
Psychology (662)
PSYC 2002 (16)
all (1)
Chapter

PSYC2002BV DAILY WORKSHEET MASTERFILE.docx

63 Pages
101 Views
Unlock Document

Department
Psychology
Course
PSYC 2002
Professor
All Professors
Semester
Winter

Description
NEUR/PSYC 2002 Sections B and V                 Introduction to Statistics in Psychology                          Daily Study Worksheets Brian Tansley * You can only scroll the white portion of this worksheet page.  INTRODUCTION:  Each of these pages contains a daily study worksheet to help consolidate your learning of the subject  matter presented in the related lecture. It will also aid in your learning data analysis skills using MS Excel.   To open a worksheet, scroll up and down the tabs until you find the one you are looking for and then CLICK  ON THE TAB. This will open the tabbed page.  There are three types of exercises in each daily worksheet: (1) Terms and concepts to learn: You’ll know you have learned a key term or concept when you  can do two things: (1) Write a concise definition of the term or concept (no more than a sentence or two)  and (2) Understand how the concept is used in data analysis. Number 2 takes more time because you have  to learn to do this in the context of data analysis problems. We’ll be covering a variety of these later in the  course so for now, concentrate on (1).  While there’s no assigned textbook for this course there are lots of  places you can turn to for information on these terms and concepts. I’d start with your lecture notes, then I’d  look on Wikipedia…. If you are on campus there are also lots of statistics texts in the library… As a last  resort, if you are stuck finding suitable definitions, email me and I’ll put you onto a resource…(I say ‘last  resort’ because part of being a good student is knowing how to access information on your own and  evaluate its credibility. If you don’t know that yet, it’s time to learn!) (2) Excel tasks to complete: You’ll need to know how to use Excel at a level probably a little deeper  than you now know it. Learning skills takes extra time so budget more time at first to learn Excel skills (this  investment of time will pay off later in the course).  Have a look at the Excel Tutorial found in the Ancillary  Notes Notebook on the CuLearn page for this course. If you discover that you don’t know Excel at the level  described in this tutorial then YOUR FIRST ORDER OF BUSINESS IS TO LEARN EXCEL Skills. DO THIS  BEFORE ANYTHING ELSE ­­ AS YOU NEED EXCEL TO DO MOST OF THE COURSE CALCULATIONS. (3) Sample exam questions to answer:  Each daily worksheet contains a few sample exam  questions. These are very similar to the questions you’ll encounter on the exams for this course that are  taken from the relevant lecture to which this daily worksheet refers. Practice writing out a concise, short  answer to each question. Make sure the answer is both factually correct and grammatically correct, with no  spelling errors. There are two tabbed daily worksheets for each lecture and since there are two lectures per week this  means there are 4 daily worksheets to do per week. In the worksheet notebook you’ll see their tabs labelled  with 1/1 and 2/1 for the two worksheets for lecture 1; 1/5 and 2/5 for the two worksheets for lecture 5, etc.   Important! Each daily worksheet is designed to take about an hour to complete.  Budget an hour each  day for this work and dedicate your time to the work.  Do the worksheets on time: This means doing the first worksheet on the same day as the lecture  and the second one on the day after. Putting the work off until later (or not doing it at all) defeats the  purpose (and advantage) of studying the material while the lecture is still in your mind. You’ve paid ‘good  money’ to register for this course. To get your money’s worth out of it you need to devote ONE HOUR PER  DAY­EVERY DAY to studying PSYC2002. If you do, you’ll end up with a good foundation for both doing  basic statistics yourself and for learning additional concepts and skills in subsequent courses. Do not spend much more than one hour per day working on a daily worksheet  because if you do you’ll become less efficient as the time wears on. It is better to work a little bit each day  than to try to slog through a lot of the material in a marathon study session. .  The Ancillary Notes (downloadable from CuLearn) contain a brief Excel Tutorial,  among other things. I recommend you read the tutorial right away to determine if your present familiarity  with MS Excel.  Finally, keep in touch with me and the TAs regarding your progress. If you are having problems, get in touch  “the sooner the better” as this gives us time to do what we can to provide you with suggestions on how to  improve your studying. Nothing can be done for you at the eleventh hour ­­ so give us plenty  of time to help you navigate yourself over the speed bumps you encounter along the way.  Velis et Remis 2 NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 1: Brian Tansley * You can only scroll the white portion of this worksheet page.  Key terms and concepts to learn:   population, parameter, sample, statistic, random, variable, constant, measurement, continuous variable,  discrete variable, categorical variable Excel Exercises:   1. Download the PSYC2002 Survey Data.xls file from CuLearn. You will be working with the data in this file  throughout the course so make sure you keep a regular backup copy somewhere safe and back up your  files often. The first worksheet of this file contains the results of a 50­question survey that was administered  to the students attending the first live lecture of this course.  The data in this file are from 100 respondents  randomly selected from about 160 students who completed the survey.  2. Download the Survey form (2002Survey.xls) from CuLearn. Note this is a read­only file.  Read over each  question and for each, determine the type of variable and the type of measurement  scale used (write ‘Catx’ for categorical data with x different categories, ‘Rank’ for ordinal data, ‘Int’  for interval data and ‘Scalar’ for ratio data. Enter this information in the appropriate cell of the second row  of the PSYC2002 Survey DATA.xlm file. For example, if the data responses consist of 2 possible  choices (e.g., ‘yes’ or ‘no’) then you will code this as Cat2.  When finished, save your file and make a backup copy. Example Short Answer Questions:  1. Briefly explain why statistics and statistical reasoning are key elements for the Scientific Method in  general and for psychological research in particular. NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 1: Brian Tansley 2. Read around on one of the following personalities from the history of statistics and write a paragraph that  highlights his/her contribution to modern statistical procedures and thinking:    Ronald Fisher, Francis Galton, William Gossett, Charles Minard, Florence Nightingale, Karl Pearson,  Adolph Quetelet. 3. Briefly explain the difference between a population parameter and an associated sample statistic. 4. Compare and contrast Accuracy and Precision.                                              Velis et Remis NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 2 for Lecture 1: Brian Tansley * You can only scroll the white portion of this worksheet page.  Key terms and concepts to learn: descriptive statistics, inferential statistics, experiment, univariate , multivariate Excel Exercises:   1. Become familiar with both the manual and automatic entry of functions in Excel cells. Also, become  familiar with copying and pasting formulas and functions across arrays and locking row and/or column  addresses in arguments. Refer to the Excel Tutorial page of the Ancillary Notes, downloadable from  CuLearn.  2. Open the PSYC2002 Survey Data.xlsm Excel workbook.  Note that Excel opens the workbook on  the worksheet with the title SURVEY DATA (look for the title on the worksheet’s tab at the bottom of the  page. You will also see three additional worksheet tabs, labelled Q1, Q2 and Q3.   Create 47 additional worksheets in this workbook  – onefor each question in the survey.  1. To create a new worksheet, click on the + tab found at the bottom of the worksheets. This  opens a new worksheet. Double click the new worksheet tab and rename the first new  worksheet Q4. Click on the + tab again and another blank worksheet will appear. Rename it Q5, etc.  Repeat this process until you have a properly tab­labelled worksheet for each of the 50 questions in the  survey.   2. Go to the Survey Data worksheet and COPY the first column. This is the Subject ID  column, which is common to all questions in the survey. Paste a copy of this column into each of the 47 new  question worksheets you have made (see the examples provided for the first 3 question worksheets). NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 2 for Lecture 1: Brian Tansley 3. For each question worksheet, write the formula to copy the contents of each  data cell located in the address of the original data for that question in the cell to  the right of the Subject ID column. For example, in the Q1 worksheet, in the cell to the immediate  right of Ss#5 you’ll see ='SURVEY DATA'!B8    This is tells Excel to put whatever is stored in cell B8 on the  SURVEY DATA worksheet in cell B8 in the Q1 worksheet.  (Examples are shown for Q1, Q2 and Q3).  Note that the data in the cells of a given question worksheet are COPIES as they always REFER to the  data in respective cells on the “Survey Data” worksheet. Save your Excel file and make a backup copy. Example Short Answer Questions:   1. Describe the difference between a bar graph, a histogram and a frequency polygon and describe the  data measurement scales appropriate for each. 2. The act of measurement always results in some amount of ‘categorization’ of the measured data – even  if the original variable is continuous. Explain.                                              Velis et Remis NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 2:                                                        Brian Tansley * You can only scroll the white portion of this worksheet page.  Key terms and concepts to learn: frequency distribution, grouped frequency distribution, bin, cumulative frequency, relative frequency  Excel Exercises:   1. Open the PSYC2002 Survey Data.xls file and create a Frequency Distribution Table for each question  with a categorical measure, on its appropriate worksheet.  How to create FD tables for categorical data.  A frequency distribution (FD) table consists of  at least two columns of cells in Excel. The first column always contains the names of the  categories (one per cell) and the second column contains the # of items in the sample that fit that category.  There are many ways to make FD tables in Excel. The methods used to create FD tables for categorical  data differ from the methods used to create FD tables for scalar data. Now that you have the raw data for  each question on its own page, you can refer to the data on that page when you create your FD table for  that question.  Making FD tables for Categorical variables (Nominal measurement scales): For  categorical data you want to create the ‘bins’ column with as many rows in it as there are categories you  wish to count. In the cell to the right of each category label you will want to count the instances of that  category in your sample. One method to do this is to use the “COUNTIF” function in Excel:   =COUNTIF(sample range, “text”) NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 2:                                                            Brian Tansley Excel will search the sample range for instances of the text inside the quotes and count the # of instances  of them, returning this count in the cell.  Do this for each of your categories to complete your categorical FD  table. Don’t forget to Label each column in the cell immediately above the table proper. The first column will  be labelled ‘category’ and the second will be labelled ‘frequency’. For categorical measures the data are  typically coded either as a text variable (e.g. ‘yes’) or with a ‘dummy numerical code’  (where 1 stands for  ‘yes’, 2 for ‘no’ etc.). You can refer to the measurement scale description in the second row of the data  worksheet (you filled in this information as part of the Excel exercise in Daily Worksheet 1 for Lecture 1. Making FD tables for Scalar variables (Ordinal, Interval and Ratio measurement  scales): The data for these types of scales are represent a continuum of values (e.g., height or weight).   While the FD table for these types of data look the same (i.e., two columns of values with the first  containing the ‘bins’ and the second the count), there are differences in how you establish the counting  procedure for continuous data. One method is to use an ‘array formula’ in Excel, called the Frequency  formula. This entails mastering a little bit of computer keyboard work as follows:  The first thing to do is to define what is counted in each bin. Since these are continuous scales the bin  definitions now must include information regarding the real limits of the values that go in each bin. First; find  the range of the sample data for the measure. The range (max­min) gives you the upper and lower  boundaries of the values found in your sample data on that measurement scale. Next, define the bins for  the FD you want to make. For ‘starters’ create 10 bins with the lower boundary of each bin entered in its  associated cell. Next, HIGHLIGHT all the cells in the column adjacent to the bins column. Then, enter an  ‘array formula’ into the top cell in this highlighted area. To do this, write =FREQUENCY(data range,bin  range) and then press CTRL SHIFT ENTER keys all at the same time (instead of just ENTER as you  normally would upon completion of a function). Upon doing this you should see numbers appear to the right  of each bin cell. These numbers are the frequency counts from the sample data that fall within the limits of  each bin. Note:  For more help on this I recommend you access the following web page:   http://chandoo.org/wp/2009/06/01/statistical­distributions/ This page shows you how to  create a FD table with continuous data. The website also provides lots of tips for carrying out Excel work. Save your file and make a backup copy. NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 2:                                                      Brian Tansley Example Short Answer Questions:   1. What is the ‘ideal’ number of bins for a grouped frequency distribution for categorical variables?  Why? 2. What is the MINIMUM number of bins for a frequency distribution for a given continuous variable? Why? 3. What are the relative advantages and disadvantages of presenting frequency data in figures as  compared to tables? 4. Compare and contrast the frequency distribution, the relative frequency distribution and the cumulative  frequency distribution and provide examples of why each might be used.                                              Velis et Remis NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 2 for Lecture 2: Brian Tansley Key terms and concepts to learn: histogram, bar chart, frequency polygon, real limits, upper limit, lower limit,  Excel Exercises:   Learn how to create Frequency Distribution Graphs in Excel. For categorical data, use  the bar graph. For Scalar data use the histogram or the frequency polygon. Graphs are always started in Excel from Tables, so refer to the tables you have created as your data  sources.  There are a variety of “wizards” available in Excel to help you with graphing. Tansley’s ‘2­metre’ rule: Standing ~2m away from your computer screen look at the graph you’ve created. If  you can make out the critical details (including the ‘take home’ message) then your graph is OK. If not,  reduce the amount of information in the graph and look at it from 2m away again. Keep this up until you can  make out everything you want your reader to see in your graph.  Note this usually requires that you simplify graphics and increase the font sizes of labels, scales and  symbols.  Don’t be seduced by all of the ‘bells and whistles’ that Excel can provide to make your graph look  ‘better’. It takes almost no skill at all to make an easy graph look hopelessly complicated but it takes lot of  skill to make a complicated graph easy to read.  Start by writing down in a sentence what you want the graph to ‘say’ to your reader/viewer. Put no more in  the graph than what you have written down. Be judicious in the use of colour, fancy symbols, weird fonts  and icons, etc. Example Short Answer Questions: 1. What descriptive statistics can you use to summarize categorical data? NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 2 for Lecture 2: Brian Tansley 2. How are a histogram and a frequency polygon different from a bar chart? 3. San serif fonts are recommended for graphs and tables. Why? 4. What is ‘chart clutter’ and why is it to be avoided in making graphs?                                               Velis et Remis NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 3: Brian Tansley Key terms and concepts to learn: measures of FD central tendency, measures of FD dispersion, measures of FD symmetry and shape.  Excel Exercises:   Review the method for writing descriptive statistic functions in cells in Excel.   For each of the questions in your PSYC2002 Survey Data.xls workbook whose sample data are on  an interval or ratio scale (there are 34 ), calculate the sample maximum, minimum, range (created from the  difference between the max and min values), arithmetic mean, median, mode, variance, standard deviation,  skewness, kurtosis.  This will be done for each question on its own worksheet (you created these  worksheets earlier and copied the sample’s responses to that question onto it).   Now you’ll enter formulas, each statistic in its own cell.  Note that entering all these formulas by hand there  are 10 of them) for each of the 34 questions will be tedious! To save time and effort, you should already  know about how to copy and paste formulas (if you’ve read the Excel Tutorial in the Ancillary Notes).  Question 3 is the first survey question that has interval or ratio data, appropriate for calculating descriptive  statistics. On the Q3 worksheet, make a table with the names of the descriptive statistics in the first column,  followed by the formulae for them in the cells to the right. Enter the formulas, one cell at a time, down the  second column.   Start by entering the formula for the sample maximum (this one is done for you so you can see how it  works).  Note that the third item (the range) must be calculated as the difference between the max and min  values. All other formulas are Excel functions with their associated arguments. Example Short Answer Questions: NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 3: Brian Tansley 1. Compare and contrast the Mean, Median and Mode of a sample and discuss the merits of each in  describing the central tendency of a frequency distribution. 2. Why is the sample standard deviation often preferred as a descriptive statistic over the sample variance? 3. Why does the sample standard deviation formula have the term n­1 in the denominator, whereas the  population standard deviation formula only have N? 4. For each of the 4 measurement scale types, which of the descriptive statistics you’ve learned so far are  appropriate?                                              Velis et Remis NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 2 for Lecture 3: Brian Tansley Key terms and concepts to learn: equation, formula, numerator, denominator, ratio, arithmetic operation, Excel Exercises:   Learn how to use the “Quartile” and “Percentile” functions. For each of the 34 scalar variables in the survey  create a table that identifies the 10 , 25 , 33 , 50 , 67   and 90  percentile for the sample raw scores.  Example Short Answer Questions:  1. What is the ‘ballpark’ relationship between the sample range and standard deviation? 2. How can you use the “quartile” function in Excel to obtain the max, min and median values of a sample? 3. How are percentiles and the area under the FD curve related? What is the difference between a percentile and a ‘percentile rank’? Give an example of how each might be  used.                                              Velis et Remis NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 4: Brian Tansley Key terms and concepts to learn: stochastic, deterministic, randomized assignment, random sampling, convenience sample, representative  sample, sampling bias, Nyquist’s theorem,  Excel Exercises:    On a new worksheet with a tab titled “RANDOM SAMPLING” create a 100x100 cell array.  In each cell past  a table of random numbers using Excel’s =RAND() and/or =RANDBETWEEN() functions. HIGHLIGHT a  Cell near the edge of the array and then in two nearby cells write the formula for the arithmetic mean and  standard deviation for all cells in this table.  Then, press “recalc” (press the COMMAND key and the +/= key  together) 20 times and write down after each press the value of the mean, St Dev and raw score in the  highlighted cell. Write a short paragraph describing what happens to these three numbers over the course  of pressing the recalc button 20 times.  How might you quantify these changes? Can you explain why this happens? Example Short Answer Questions:  1. What does it mean to say that random (stochastic) events are INDEPENDENT? 2. Why is it impossible for a person to generate a string of random numbers? Hint: Another way of asking  this question is “what properties of humans makes it impossible for us to generate random sequences of  numbers”? 3. What perceptual properties do we possess that makes it difficult for us to recognize random sequences  as random? NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 4: Brian Tansley 4. Probability refers the chance of occurrence of an event or class of events. It is quantitatively expressed  as a ratio. What are the two quantities that form the numerator and denominator of the ratio? 5. Express the relationship between the area under a frequency distribution curve and probability. 6. Explain, in everyday language, the relationship between uncertainty and information. 7. What more can be said if you discover an event is truly RANDOM? NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology   DAILY WORKSHEET 2 for Lecture 4: Brian Tansley Key terms and concepts to learn: hypothesis, hypothesis test, Type 1 error, Type 2 error, alpha, significance, expectation Excel Exercises:   Return to the RANDOM SAMPLING worksheet you created in Daily Worksheet 1 for Lecture 4.  Write the  th formula for the 95  percentile in a cell adjacent to the sample mean and standard deviation you created in  the previous exercise.   Now, press the RECALCULATE key sequence (COMMAND key plus +/= key) once and write down on a  th piece of paper the 95  percentile value. Now repeatedly press the RECALULATE key sequence and  compare the new sample mean after each RECALCULATE with the 9  percentile value you wrote down.   KEEP DOING THIS UNTIL YOU OBTAIN A SAMPLE MEAN GREATER THAN THE 95  percentile value  th you wrote down. How many iterations (Recalculate key presses) did you have to make before you found  one?  Try again. How many this time? Once more, How many this time? Explain WHY it takes so many iterations to obtain a mean this extreme from a random sample. Example Short Answer Questions:  1. Why aren’t most behaviour science experiments conducted using random samples? 2. Why are most behavioural science experiments conducted using random assignment of Ss to  experimental conditions? 3. All measurements contain error. Why do scientists prefer to ‘err’ on the side of making fewer Type 1  errors than Type 2 ones? NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology   DAILY WORKSHEET 2 for Lecture 4: Brian Tansley 4. Describe in a short paragraph the term “Null Hypothesis”.  Read around on the term ‘null hypothesis’ and  write another short paragraph the describes its introduction and use in modern statistical thinking. 5. State as precisely and concisely as you can that “rejecting the null hypothesis” means in statistical terms. 6. Discuss the pros and cons of hypothesis testing in scientific research?                                              Velis et Remis NEUR/PSYC 2002 Section B and V Introduction to Statistics in Psychology DAILY WORKSHEET 1 for Lecture 5: Brian Tansley Key terms and concepts to learn: standard scores, derived score, linear transformation, shape­preserving transformations Excel Exercises:   For each question that has interval or ratio data, compute the z­score for each datum in the sample.  Calculate the sum of all z­scores for the data fr
More Less

Related notes for PSYC 2002

Log In


OR

Join OneClass

Access over 10 million pages of study
documents for 1.3 million courses.

Sign up

Join to view


OR

By registering, I agree to the Terms and Privacy Policies
Already have an account?
Just a few more details

So we can recommend you notes for your school.

Reset Password

Please enter below the email address you registered with and we will send you a link to reset your password.

Add your courses

Get notes from the top students in your class.


Submit