COMPSCI C8 Lecture : Week 4 Study Guide (Lecture & Textbook Notes)

3 Pages
26 Views
Unlock Document

Department
Computer Science
Course
COMPSCI C8
Professor
John Denero
Semester
Spring

Description
CS8 Weekly Study Guide: ​Week 3  Histograms, Functions, Groups  Monday, February 6 - Friday, February 10 CIT Readings:  ● Mon 2/6: Histograms 6.2  ● Wed 2/8: Functions 7, 7.1  ● Fri 2/10: Groups 7.2, 7.3    6.2 Visualizing Numerical Distributions Notes:  ● Categorical variables might have numbers, but those are NOT numerical distributions  ● Good way to check if numerical: Can you take average or perform arithmetic?  ● The ​hist ​method generates a histogram of the values in a column. The optional unit  argument is used in the labels on the two axes.  ● It is different than a bar chart! It has contiguous intervals called ​bins  ○ Bins include the LEFT value but exclude the RIGHT value (like ranges) so nothing  ends up in two bins or none because it’s at the edge  ● You may have to make adjustments to first or last bins  ● The optional argument ​bins ​can be used with hist to specify the endpoints of the bins  ● Long right tail = skewed right  ● Show the bins!  ○ Use the ​.bin​ ​method. Then show this table. It will give values that are greater than  or equal to the value in bin, but less than the next value in bin.  ● This method of drawing histograms creates a vertical axis that is said to be on the ​density  scale.​ The height of bar is not the percent of entries in the bin; it is the percent of entries  in the bin relative to the amount of space in the bin.  ● An advantage of the histogram over a bar chart is that a histogram can contain bins of  unequal width!!!  ● IF YOU USE NORMED = FALSE The height of each bar is simply plotted at the number of  movies in the bin, without accounting for the difference in the widths of the bins.  ● Remember the area principle - key detail is that height represents ​density ​and the height  is approximate.  ● The area of each bar is equal to the percent of data values that are in the corresponding  bin.  ● The total area of all the bars in the histogram is 100%. Speaking in terms of proportions,  we say that the areas of all the bars in a histogram "sum to 1".      LEC 9 (MONDAY): HISTOGRAMS  ● Bar Charts of Counts:   ○ Distributions: describes the frequency of its different values. You can achieve this  with the “group” method.  ○ Bar charts can calculate proportion of categorical variables  ● Bar chart has left out ages with 0 movies. So we could use age as a numerical variable.  Now we can do a histogram.  ● Binning Numerical Values  CS8 Weekly Study Guide: ​Week 3  Histograms, Functions, Groups  Monday, February 6 - Friday, February 10 ○ Upper bound IS the lower bound of the next bin.  ○ Here you can cover the whole number line  ○ Inclusive of left but exclusive of right  ● Histogram is a chart to display the distribution of numerical values using bins  ● Bin​ method:    ○ If you only give it one variable, it’ll find you some bins. It automatically splits the  range into even bins and you have decimal. The last bin will have count 0 (that’s  where it ends)  ○ You can make your own bins using the bins= argument of the BIN method using a  list. OR you can feed it a np.arange  ● Change the word bin to ​hist ​and you get a histogram! You can use a unit argument. But  there will always be a “per cent per unit” on the y axis.  ● You can also hist without using a bins argument but like….it might have weird bins bc  automatic 10 bins.   ● Normed argument: plots count per bins  ● The Density Scale (when normed is True
More Less

Related notes for COMPSCI C8

Log In


OR

Join OneClass

Access over 10 million pages of study
documents for 1.3 million courses.

Sign up

Join to view


OR

By registering, I agree to the Terms and Privacy Policies
Already have an account?
Just a few more details

So we can recommend you notes for your school.

Reset Password

Please enter below the email address you registered with and we will send you a link to reset your password.

Add your courses

Get notes from the top students in your class.


Submit