Zbiór danych mtcars, jego dane pochodzą z amerykańskiego magazynu “Motor Trend” z 1974 roku i obejmują zużycie paliwa oraz 10 aspektów konsrukcji i osiągów 32 samochodów. Zawiera następujące wartości:
mpg cyl disp hp
Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
Median :19.20 Median :6.000 Median :196.3 Median :123.0
Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
drat wt qsec vs
Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000
1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000
Median :3.695 Median :3.325 Median :17.71 Median :0.0000
Mean :3.597 Mean :3.217 Mean :17.85 Mean :0.4375
3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000
Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000
am gear carb
Min. :0.0000 Min. :3.000 Min. :1.000
1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000
Median :0.0000 Median :4.000 Median :2.000
Mean :0.4062 Mean :3.688 Mean :2.812
3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000
Max. :1.0000 Max. :5.000 Max. :8.000
Funkcja summary dla każdego zbioru wartości oblicza nam odpowiednio minimum, pierwszy kwantyl, mediane, średnią, trzeci kwantyl oraz maksimum. W dalszej części postaram się wyłumaczyć powyższe dane a także rozwinąć je o dodatkowe miary.
3 Średnia, mediana oraz odchylenie standardowe
W tej części zademonstruje jak policzyć powyższe statystyki z pomocą danych mpg
Może i ostatnia w tym punkcie ale nie oznacza to, że najmniej ważna czyli wartość która pojawia się najczęściej
Code
library(modeest)mfv(cyl)
[1] 8
Code
mfv(disp)
[1] 275.8
Code
mfv(hp)
[1] 110 175 180
Code
mfv(drat)
[1] 3.07 3.92
Code
mfv(wt)
[1] 3.44
Code
mfv(qsec)
[1] 17.02 18.90
Code
mfv(vs)
[1] 0
Code
mfv(am)
[1] 0
Code
mfv(gear)
[1] 3
Code
mfv(carb)
[1] 2 4
4 Pora na wizualizacje
Wykres rozrzutu mili/galon i koni mechanicznych
Code
library(ggplot2)
Dołączanie pakietu: 'ggplot2'
Następujący obiekt został zakryty z 'mtcars':
mpg
Code
ggplot(mtcars, aes(x = hp, y = mpg)) +geom_point(color ="darkgreen") +geom_smooth(method ="lm", se =FALSE, color ="forestgreen") +labs(title ="Zależność między ilością koni mechaniczny (HP) a MPG",x ="liczba koni mechanicznych (HP)",y ="Miles per Gallon (MPG)")
`geom_smooth()` using formula = 'y ~ x'
Rozkład zmiennej MPG
Code
ggplot(mtcars, aes(x = mpg)) +geom_histogram(binwidth =2, fill ="darkseagreen", color ="black") +labs(title ="Rozkład zmiennej MPG",x ="Miles per Gallon (MPG)",y ="Częstość" )
Zależność pomiędzy typem skrzyni biegów a ilością konii mechanicznych
Wykres ten pokazuje jaka różnica występuje pomiędzy automatyczną a manualną skrzynią biegów
Code
boxplot(hp ~as.factor(am), data = mtcars,main ="Porównanie hp i am w zbiorze mtcars",xlab ="Typ skrzyni biegów (am)",ylab ="ilość koni mechanicznych (hp)",col =c("forestgreen", "lightgreen"))
Wykres 3D
Code
library(plotly)
Registered S3 method overwritten by 'httr':
method from
print.response rmutil
Dołączanie pakietu: 'plotly'
Następujący obiekt został zakryty z 'package:ggplot2':
last_plot
Następujący obiekt został zakryty z 'package:stats':
filter
Następujący obiekt został zakryty z 'package:graphics':
layout
Code
plot_ly(mtcars, x =~gear, y =~cyl, z =~mpg, type ='scatter3d', mode ='markers', marker =list(size =5, color =~mpg, colorscale ='Viridis', showscale =TRUE)) %>%layout(scene =list(xaxis =list(title ='Gear'),yaxis =list(title ='Cyl'),zaxis =list(title ='MPG')))
5 Podsumowanie
W tym projekcie miałem okazje zaprezentować zbiór “mtcars”, który zawiera naprawdę wiele różnych informacji. W mojej pracy ukazałem zarówno możliwości matematyczne jak i graficzne programu R.
Dziękuje za uwage
Source Code
---title: "Zbiór mtcars"author: "Krzysztof Kalicki"format: html: toc: true toc-depth: 2 code-fold: true code-tools: true highlight: zenburn theme: darkly toc-location: left number-sections: true number-depth: 2 smooth-scroll: true---```{=html}<img src="https://i.postimg.cc/3JG92ky4/auta.jpg"alt="Samochód" style="max-width:100%; display:block; margin:auto;">```# Czym jest mtcars?Zbiór danych mtcars, jego dane pochodzą z amerykańskiego magazynu "Motor Trend" z 1974 roku i obejmują zużycie paliwa oraz 10 aspektów konsrukcji i osiągów 32 samochodów. Zawiera następujące wartości:1. mpg - Mile/galony(1mila=1,61km,1galon=3,79l)2. cyl - liczba cylindrów3. disp - pojemność skokowa silnika4. hp - konie mechaniczne5. drat - przełożenie tylnej osi6. wt - waga7. qsec - czas na 1/4 mili8. vs - silnik(0=v-kształtny, 1=prosty)9. am - skrzynia biegów(0=automatyczna, 1=manualna)10. gear - liczba biegów11. carb - ilość gaźników## mtcars```{r}attach(mtcars)head(mtcars)```# Podstawowe informacje o zbiorze mtcars## Funkcja summary```{r}summary(mtcars)```Funkcja summary dla każdego zbioru wartości oblicza nam odpowiednio minimum, pierwszy kwantyl, mediane, średnią, trzeci kwantyl oraz maksimum. W dalszej części postaram się wyłumaczyć powyższe dane a także rozwinąć je o dodatkowe miary.<img src="https://i.postimg.cc/Sx8vDXHz/samochod.jpg" alt="Samochód" style="max-width:100%; display:block; margin:auto;"/># Średnia, mediana oraz odchylenie standardoweW tej części zademonstruje jak policzyć powyższe statystyki z pomocą danych mpg```{r}srednia=mean(mpg)mediana=median(mpg)odchylenie=sd(mpg)sredniamedianaodchylenie```## Reszta podstawowych funkcji statystycznych### WariancjaW tym przypadku porównamy wariancje przy założeniu, że liczba cylindrów będzie równa 6 a skrzynia biegów będzie automatyczna:```{r}var(mpg[cyl==6& am==0])var(disp[cyl==6& am==0])var(hp[cyl==6& am==0])var(wt[cyl==6& am==0])var(drat[cyl==6& am==0])var(qsec[cyl==6& am==0])var(vs[cyl==6& am==0])var(gear[cyl==6& am==0])var(carb[cyl==6& am==0])```### RozstępCzyli w zasadzie różnica pomiędzy wartością największą a najmniejszą. W tym przypadku porównam dane dla 4 biegów i manualnej skrzyni biegów```{r}max(mpg[gear==4& am==1])-min(mpg[gear==4& am==1])max(disp[gear==4& am==1])-min(disp[gear==4& am==1])max(hp[gear==4& am==1])-min(hp[gear==4& am==1])max(drat[gear==4& am==1])-min(drat[gear==4& am==1])max(wt[gear==4& am==1])-min(wt[gear==4& am==1])max(qsec[gear==4& am==1])-min(qsec[gear==4& am==1])max(carb[gear==4& am==1])-min(carb[gear==4& am==1])```### DominantaMoże i ostatnia w tym punkcie ale nie oznacza to, że najmniej ważna czyli wartość która pojawia się najczęściej```{r}library(modeest)mfv(cyl)mfv(disp)mfv(hp)mfv(drat)mfv(wt)mfv(qsec)mfv(vs)mfv(am)mfv(gear)mfv(carb)```# Pora na wizualizacje### Wykres rozrzutu mili/galon i koni mechanicznych```{r}library(ggplot2)ggplot(mtcars, aes(x = hp, y = mpg)) +geom_point(color ="darkgreen") +geom_smooth(method ="lm", se =FALSE, color ="forestgreen") +labs(title ="Zależność między ilością koni mechaniczny (HP) a MPG",x ="liczba koni mechanicznych (HP)",y ="Miles per Gallon (MPG)")```### Rozkład zmiennej MPG```{r}ggplot(mtcars, aes(x = mpg)) +geom_histogram(binwidth =2, fill ="darkseagreen", color ="black") +labs(title ="Rozkład zmiennej MPG",x ="Miles per Gallon (MPG)",y ="Częstość" )```### Zależność pomiędzy typem skrzyni biegów a ilością konii mechanicznychWykres ten pokazuje jaka różnica występuje pomiędzy automatyczną a manualną skrzynią biegów```{r}boxplot(hp ~as.factor(am), data = mtcars,main ="Porównanie hp i am w zbiorze mtcars",xlab ="Typ skrzyni biegów (am)",ylab ="ilość koni mechanicznych (hp)",col =c("forestgreen", "lightgreen"))```### Wykres 3D```{r}library(plotly)plot_ly(mtcars, x =~gear, y =~cyl, z =~mpg, type ='scatter3d', mode ='markers', marker =list(size =5, color =~mpg, colorscale ='Viridis', showscale =TRUE)) %>%layout(scene =list(xaxis =list(title ='Gear'),yaxis =list(title ='Cyl'),zaxis =list(title ='MPG')))```# PodsumowanieW tym projekcie miałem okazje zaprezentować zbiór "mtcars", który zawiera naprawdę wiele różnych informacji. W mojej pracy ukazałem zarówno możliwości matematyczne jak i graficzne programu R.### Dziękuje za uwage