Study Guides (238,295)
United States (119,730)
Boston College (3,464)
Economics (366)
ECON 1151 (14)
All (14)

COMPLETE Statistics Notes - Part 1 (got 4.0 in the course)

16 Pages
Unlock Document

Boston College
ECON 1151

Study Guide: Midterm #1 Keely Henesey Chapter 1: Graphically Describing Data 1.1: Decision Making in an Uncertain Environment  Population (  N  ) : complete set of entities upon which statistical inferences will be drawn •  Parameter : number that describes a characteristic of the population (typically unknown)  Sample (  n  ) : an observed subset of the population of interest •  Statistic : number that describes a characteristic of a sample of population of interest (estimates parameters) Sampling Error: results from information only being available on subset of the population Nonsampling Errors: errors that could just as easily arise if a complete census of the population were taken •  Undercoverage : some groups are left out of population (thus the population sampled is not the relevant one) •  Nonresponse : individuals chosen can’t be contacted or won’t respond •  Response : can be caused by the respondent OR the interviewer (Wording—confusing/leading questions) o Respondent—lies/doesn’t remember correctly o Interviewer Variation—affect of race/gender of interviewer, variation in format of the question Simple Random Sampling (SRS):  • Each member is equally likely to be chosen • Each member is chosen strictly by chance • Selection of one member doesn’t influence selection of any other member • Every possible sample of a given size n has the same chance of selection Systematic Sampling: a method of collecting a simple random sample • Randomly assign each individual of the population a number and select of every jth item  ] • Randomly select a number between 1 and j to obtain the first item to be included in your systematic sample and  count off from there Descriptive Statistics: focus on graphical and numerical procedures that are used to summarize and process data • GATHERING of Information Inferential Statistics: using the data to make predictions, forecasts, and estimates to make better decisions • CONVERSION of Information into Knowledge 1.2: Classification of Variables Categorical Variables: responses that belong to groups or categories Numerical Variables: both discrete and continuous variables •  Discrete Variable : finite number of values (counting process) •  Continuous Variable : infinite values in some interval of numbers (measurement process) Qualitative Data: no measurable meaning to the “difference” in numbers  • Nominal or ordinal levels of measurement obtained from categorical questions •  Nominal Data : weakest type of data; numerical identification doesn’t imply ranking o Arbitrarily assigned code to each response •  Ordinal Data : numerical identification indicates the rank ordering of items Quantitative Data: measurable meaning to the difference in numbers • Interval or ratio levels of measurement obtained from numerical variables •  Interval Data : indicates rank and distance from an arbitrary zero o Ex. Temperature—20▯ in MN vs. 80▯ in FL [ It’s 60▯ warmer in FL but we can’t say it’s 4 times warmer ] •  Ratio Data : indicates rank and distance from a natural zero, THUS, ratios of two measures have meaning o Ex. Weight—200lbs vs. 100lbs [200lbs is twice the weight of 100lbs] 1.3: Graphs to Describe Categorical Variables Frequency Distribution: gives frequencies for each class or group (#) • Includes: tables, bar charts, Pareto diagrams •  Bar Chart : highlights frequency of each category [BARS DON’T TOUCH] •  Cross Table : number of observations for every combination of two categorical or ordinal variables (a.k.a. crosstab,  contingency table) o [r×c]  Cross Table: r rows and c columns COLUMNS ROWS •  Pareto Diagram : bar chart that displays the frequency of defect causes o Used To… Separate the “vital few” from the “trivial many”  80% is caused by/due to 20% o Category with the highest frequency of defects is on the far left o Highest Frequency of Defects  ▯Lowest Frequency of Defects Relative Frequency Distribution: gives proportion of frequencies for each groups (%) •  Pie Chart : highlights proportion of frequencies in each category 1.4: Graphs to Describe Time­Series Data Time Series: set of measurements of a quantity of interest ordered over time (sequence of observations is important)   Line Chart/Time­Series Plot : series of data plotted at various time intervals o X­Axis—time (weekly, monthly, quarterly, annually) o Y­Axis—numerical quantity of interest o Join adjacent points in time by straight lines 1.5: Graphs to Describe Numerical Variables Construction of a Frequency Distribution for Numerical Data: frequencies for each class  Determine k, the Number of Classes [usually 5­15]  Classes Should Be the Same Width, w Study Guide: Midterm #1 Keely Henesey w= Max−Min →ThenroundUP k  Classes Must Be Non­Overlapping & Inclusive of All Observations Cumulative Frequency Distribution: sum of frequencies of all classes up to and including the present class (always “less  than” upper limit of present class) Relative Cumulative Frequency Distribution: sum of percentages of all classes up to and including the present class  (always “less than” upper limit of present class) Histogram: each bar corresponds to defined classes (highlights frequency of each class)  Areas of each bar are proportional to the number of observations in its interval o Height is proportional as well UNLESS interval widths vary  BARS TOUCH! Ogive: line that connects cumulative percentages (Cumulative Line Graph)  [of Observations0) CV= ×100 (if ́ x>0) μ ́ • Verbally—If CV  is 50%, for stock A the standard deviation is 50% of the mean A Chebyshev’s Theorem: percentage of observations that lie with[μ±kσte]v is… 1 At Least 100 1± ( ) [ ] k • Works for any population (regardless of its distribution) , standard deviation , and [k>1 ]   (where k is the number of standard deviations) Study Guide: Midterm #1 Keely Henesey Empirical Rule: can provide an estimate (not just a minimum) for many large populations (approximately symmetric;  rounded, bell­shaped) Ap prox.68 Within1σ → Intervalμ±1σ ] Approx.95 Within2σ →Interval μ±2σ ] Almost AllareWithin3σ→ Intervalμ±3σ ] •  Outliers : observations that differ from the mean by m re than  Z­Score: a standardized value that indicates the number of standard deviations an observation is from the mean x −μ z=0 → Value=Mean ] z= i Note: [z>0 → Value>Mean ] σ [z<0 → Value1 → IncreasingLinear Relationship { } Cov<1 ]DecreasingLinear Relationship N n Cov(x, y)=σ xy 1 ∑ (xi−μ x(yi−μ y) Cov(x, y)=s xy 1 ∑ (xi−x́)(i−́y ) N i=1 n−1 i=1 •  Alternate Formulas for Population Variance : (apply to population covarianc and use id) by  n n s = 1 ∑ (x −́x)y s = 1 ∑ (y −́y)x xy n−1 i=1 i i xy n−1 i=1 i i •  Shortcomings of Covariance…   o Its value varies if variable is measured in different units (ft vs. inches vs. cm) o Fails to measure the strength of the relationship between two variables Correlation Coefficient: measures both direction and strength of the linear relationship between two variables Cov(x, y) Cov(x, y) ρ xy σ σ rxy s s x y x y •  Range of the Correlation Coefficient   ▯ [r=1 ] → Perfectly PositiveLinear Relationship [r=0 ] → NOLinear Relationship {r=−1 ]→Perfectly Negative Linear Relationship} •  A Relationship Exists If…  2 r∣≥ ( ) √n CAUTION: Correlation does not imply causation Chapter 3: Probability 3.1: Random Experiment, Outcomes, & Events Random Experiment: a process leading to two or more outcomes without knowing which will occur next •  Basic Outcomes : possible outcomes from a random experiment (no two outcomes can occur simultaneously) •  Sample Space : set of all basic outcomes (denoted by S); it is collectively exhaustive Event: any subset of basic outcomes from the sample space (denoted by E) •  Null Event : the absence of a basic outcome (deno)ed by  Intersection: probability of both A “AND” B happening  ▯D(A∩B)d By   •  Joint Probability : probability of an intersection  ▯Denoted By   Mutually Exclusive: if A & B have no common basic outcome • Intersection is an empty set or nul[ event  ▯ ] Union: probability of A “OR” B (or both)  ▯Den(A ∪B)y  Collectively Exhaustive: given K eve1ts2…,E K  in sample space S… • If [E 1 E 2…∪ E =S K ] , the K events are collectively exhaustive Set of All Basic Outcomes Contained in Sample Space Is… both mutually exclusive & collectively exhaustive Complement:  A  is the set of all basic outcomes not include[P(A)=1−P(A) ́ ] ́ • Events A and A  are both mutually exclusive and collectively exhaustive Study Guide: Midterm #1 Keely Henesey 3.2: Probability & Its Postulates Three Definitions of Probability: classical, relative frequency, and subjective Classical Probability: proportion of times an event will occur assuming equal likelihood of all outcomes in sample space P(A)= N A N Relative Frequency Probab
More Less

Related notes for ECON 1151

Log In


Don't have an account?

Join OneClass

Access over 10 million pages of study
documents for 1.3 million courses.

Sign up

Join to view


By registering, I agree to the Terms and Privacy Policies
Already have an account?
Just a few more details

So we can recommend you notes for your school.

Reset Password

Please enter below the email address you registered with and we will send you a link to reset your password.

Add your courses

Get notes from the top students in your class.