▶️ Tematyka

  • Weryfikacja hipotez statystycznych
    • Test dla wartości średniej w populacji
    • Test normalności rozkładu Shapiro-Wilka
    • Testy dla równości dwóch średnich
    • Test dla równości dwóch wariancji
    • Test niezależności chi-kwadrat
  • Pakiet dplyr
    • Wyświetlanie informacji o danych
    • Sortowanie danych
    • Losowanie obserwacji ze zbioru
    • Operator pipe (%>%)


📘 Weryfikacja hipotez statystycznych

Test dla wartości średniej w populacji

# Zbadano jak dużo studenci UE wydali w listopadzie 2022 roku na pieczywo.
# Do badania wylosowano próbę składającą się z 16 osób.
# Na poziomie istotności alfa=0,05 zweryfikować hipotezę, 
# że rzeczywista średnia kwota wydatków studentów UE w listopadzie 2022 na pieczywo była:
# a) równa 40zł,
# b) mniejsza niż 40 zł,
# c) większa niż 40 zł.

#Wprowadzenie danych.
wydatki=c(70,32,100,65,34,47,23,80,47,65,34,63,72,33,63,38)

# Ad a)

# H0: mi=40
# H1: mi=/=40
# 2-stronny obszar krytyczny.

wsr=mean(wydatki)
mi0=40
n=length(wydatki)
s=sd(wydatki)

T=(wsr-mi0)/s*sqrt(n)
T
## [1] 2.650558
alpha=0.05

# Wyznaczenie obszaru krytycznego
t.alpha.l=qt(alpha/2,n-1,lower.tail = T)
t.alpha.p=qt(alpha/2,n-1,lower.tail = F)

# Obszar, w którym jeżeli znajdzie się wartość statystyki testowej, to nie ma podstaw do odrzucenia H0.
c(t.alpha.l,t.alpha.p)
## [1] -2.13145  2.13145
# Wartość statystyki testowej należy do obszaru krytycznego. 
# Odrzucamy H0 na rzecz H1. 
# Można twierdzić, że rzeczywista średnia kwota wydatków na pieczywo studentów UE 
# w listopadzie 2022 była różna od 40 zł.


# Testowanie za pomocą wbudowanej funkcji.
t.test(wydatki,mu=40)
## 
##  One Sample t-test
## 
## data:  wydatki
## t = 2.6506, df = 15, p-value = 0.01817
## alternative hypothesis: true mean is not equal to 40
## 95 percent confidence interval:
##  42.76636 65.48364
## sample estimates:
## mean of x 
##    54.125
# p-wartość jest mniejsza od poziomu istotności alfa. 
# Odrzucamy H0 na rzecz H1.
# Można twierdzić, że rzeczywista średnia kwota wydatków na pieczywo studentów UE 
# w listopadzie 2022 była różna od 40 zł.

#"Ręczne wyznaczenie p-wartości"
1-pt(T,n-1)+pt(-T,n-1)
## [1] 0.0181711
# Ad b)                     

# H0: mi=40
# H1: mi>40

t.test(wydatki,mu=40,alternative = "g")
## 
##  One Sample t-test
## 
## data:  wydatki
## t = 2.6506, df = 15, p-value = 0.009086
## alternative hypothesis: true mean is greater than 40
## 95 percent confidence interval:
##  44.78288      Inf
## sample estimates:
## mean of x 
##    54.125
# p-wartość jest mniejsza od alfa=0.05. 
# Odrzucamy H0 na rzecz H1. 
# Można twierdzić, że średnia kwota wydatków na pieczywo studentów na UE w listopadzie 2022 była większa od 40 zł.

# Ad c) 

# H0: mi=40
# H1: mi<40

t.test(wydatki,mu=40,alternative = "l")
## 
##  One Sample t-test
## 
## data:  wydatki
## t = 2.6506, df = 15, p-value = 0.9909
## alternative hypothesis: true mean is less than 40
## 95 percent confidence interval:
##      -Inf 63.46712
## sample estimates:
## mean of x 
##    54.125
# Nie ma podstaw do odrzucenia H0.

Test normalności rozkładu Shapiro-Wilka

# H0: zmienna wydatki ma rozkład normalny
# H1: zmienna wydatki nie ma rozkładu normalnego

shapiro.test(wydatki)
## 
##  Shapiro-Wilk normality test
## 
## data:  wydatki
## W = 0.93908, p-value = 0.3378
# Brak podstaw do odrzucenia H0 (hipotezy zerowej, głoszącej że zmienna wydatki ma rozkład normalny).

# Wyświetlenie p-wartości. 
shapiro.test(wydatki)$p.value
## [1] 0.3378433

Testy dla równości dwóch średnich

Test dla równości średnich dla prób niezależnych

# install.packages("foreign")
library(foreign)

# Import danych zapisanych w pliku programu SPSS ze strony stat.ue.katowice.pl
wzrost<-read.spss("http://stat.ue.katowice.pl/dane1/heights.sav")
wzrost
## $Husband
##  [1] 186 180 160 186 163 172 192 170 174 191 182 178 181 168 162 188 168 183 188
## [20] 166 180 176 185 169 182 162 169 176 180 157 170 186 180 188 153 179 175 165
## [39] 156 185 172 166 179 181 176 170 165 183 162 192 185 163 185 170 176 176 160
## [58] 167 157 180 172 184 185 165 181 170 161 188 181 156 161 152 179 170 170 165
## [77] 165 169 171 192 176 168 169 184 171 161 185 184 179 184 175 173 164 181 187
## [96] 181  NA
## 
## $Wife
##  [1] 175 168 154 166 162 152 179 163 172 170 170 147 165 162 154 166 167 174 173
## [20] 164 163 163 171 161 167 160 165 167 175 157 172 181 166 181 148 169 170 157
## [39] 162 174 168 162 159 155 171 159 164 175 156 180 167 157 167 157 168 167 145
## [58] 156 153 162 156 174 160 152 175 169 149 176 165 143 158 141 160 149 160 148
## [77] 154 171 165 175 161 162 162 176 160 158 175 174 168 177 158 161 146 168 178
## [96] 170  NA
## 
## attr(,"label.table")
## attr(,"label.table")$Husband
## NULL
## 
## attr(,"label.table")$Wife
## NULL
## 
## attr(,"codepage")
## [1] 65001
class(wzrost)
## [1] "list"
attach(wzrost)

# Badano wzrost kobiet(żon) i mężczyzn(mężów).
# Należy zweryfikować hipotezę, że przeciętny wzrost mężów jest wyższy 
# niż przeciętny wzrost w grupie żon. Przyjąć poziom istotności 0,05.

# H0: mi_M=mi_K
# H1: mi_M>mi_K

t.test(Husband,Wife,alternative = "g")
## 
##  Welch Two Sample t-test
## 
## data:  Husband and Wife
## t = 7.5616, df = 188.57, p-value = 8.467e-13
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  8.147699      Inf
## sample estimates:
## mean of x mean of y 
##  174.3229  163.8958
# p-wartość jest mniejsza od założonego poziomu istotności alfa = 0.05. 
# Odrzucamy H0 na rzecz H1. 
# Można twierdzić, że średni wzrost mężów jest większy niż średni wzrost żon.

Testy dla równości dwóch średnich dla prób zależnych

# U kilku pacjentów badano rozkurczowe ciśnienie. Prawidłowe normy to: 80-84.
# Badane osoby mają wysokie ciśnienie i zgłosili się do badań nad nowym lekiem.
# Zmienna przed: ciśnienie rozkurczowe przed zażyciem leku.
# Zmienna po: ciśnienie rozkurczowe po tygodniowym zażywaniu leku.
# Na poziomie istotności alfa=0,05 zweryfikować hipotezę, że lek powoduje spadek ciśnienia.


przed <-c(85,90,86,92,88,86,91,89)
po <-c(86,86,88,82,88,82,84,85)

t.test(po,przed,paired = T,alternative="l")
## 
##  Paired t-test
## 
## data:  po and przed
## t = -2.2437, df = 7, p-value = 0.02988
## alternative hypothesis: true mean difference is less than 0
## 95 percent confidence interval:
##        -Inf -0.5056623
## sample estimates:
## mean difference 
##           -3.25
# Odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej.
# Można twierdzić, że średnia wysokość ciśnienia rozkurczowego 
# po tygodniowym stosowaniu leku była mniejsza niż przed stosowaniem leku.

# Inny zapis danych wejściowych.
badanie<- data.frame( 
  grupa = rep(c("przed", "po"), each = 8),
  cisnienie = c(przed, po))
badanie
##    grupa cisnienie
## 1  przed        85
## 2  przed        90
## 3  przed        86
## 4  przed        92
## 5  przed        88
## 6  przed        86
## 7  przed        91
## 8  przed        89
## 9     po        86
## 10    po        86
## 11    po        88
## 12    po        82
## 13    po        88
## 14    po        82
## 15    po        84
## 16    po        85
attach(badanie)

# Mając tak wyglądający zbiór danych, testowanie można przeprowadzić za pomocą kodu:
t.test(cisnienie~grupa,paired=T,alternative="l")
## 
##  Paired t-test
## 
## data:  cisnienie by grupa
## t = -2.2437, df = 7, p-value = 0.02988
## alternative hypothesis: true mean difference is less than 0
## 95 percent confidence interval:
##        -Inf -0.5056623
## sample estimates:
## mean difference 
##           -3.25

Test dla równości dwóch wariancji

# H0: sigma_K^2=sigma_M^2
# H1: sigma_K^2>sigma_M^2

var.test(Wife,Husband,alternative="g")
## 
##  F test to compare two variances
## 
## data:  Wife and Husband
## F = 0.84, num df = 95, denom df = 95, p-value = 0.8015
## alternative hypothesis: true ratio of variances is greater than 1
## 95 percent confidence interval:
##  0.5983559       Inf
## sample estimates:
## ratio of variances 
##          0.8399965
# Nie ma podstaw do odrzucenia H0 (hipotezy zerowej mówiącej o równości wariancji).

Test niezależności chi-kwadrat

# Wprowadzenie danych.
muzyka <- matrix(c(67, 57, 68,34, 59, 77),ncol=3,byrow=T)
dimnames(muzyka) <- list(c("K", "M"),c("Pop","R$B", "Rock"))
muzyka
##   Pop R$B Rock
## K  67  57   68
## M  34  59   77
# H0: zmienne są niezależne (płeć i rodzaj preferowanej muzyki są niezależne)
# H1: zmienne są zależne

chisq.test(muzyka)
## 
##  Pearson's Chi-squared test
## 
## data:  muzyka
## X-squared = 10.075, df = 2, p-value = 0.006488
# p-wartość jest mniejsza od poziomu istotności alfa.
# Odrzucamy H0 na rzecz H1. 
# Można twierdzić, że istnieje zależność między płcią i preferowanym stylem muzycznym.

# UWAGA! Należy pamiętać, że przy stosowaniu tego testu ważne jest założenie dot. liczebności oczekiwanych.

📘 Pakiet dplyr

#install.packages("dplyr")
library(dplyr)
## 
## Dołączanie pakietu: 'dplyr'
## Następujące obiekty zostały zakryte z 'package:stats':
## 
##     filter, lag
## Następujące obiekty zostały zakryte z 'package:base':
## 
##     intersect, setdiff, setequal, union
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

Wyświetlanie informacji o danych

str(iris)
## 'data.frame':    150 obs. of  5 variables:
##  $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
##  $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
##  $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
##  $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
##  $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
glimpse(iris)
## Rows: 150
## Columns: 5
## $ Sepal.Length <dbl> 5.1, 4.9, 4.7, 4.6, 5.0, 5.4, 4.6, 5.0, 4.4, 4.9, 5.4, 4.…
## $ Sepal.Width  <dbl> 3.5, 3.0, 3.2, 3.1, 3.6, 3.9, 3.4, 3.4, 2.9, 3.1, 3.7, 3.…
## $ Petal.Length <dbl> 1.4, 1.4, 1.3, 1.5, 1.4, 1.7, 1.4, 1.5, 1.4, 1.5, 1.5, 1.…
## $ Petal.Width  <dbl> 0.2, 0.2, 0.2, 0.2, 0.2, 0.4, 0.3, 0.2, 0.2, 0.1, 0.2, 0.…
## $ Species      <fct> setosa, setosa, setosa, setosa, setosa, setosa, setosa, s…

Sortowanie danych

arrange(iris,Sepal.Length)
##     Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1            4.3         3.0          1.1         0.1     setosa
## 2            4.4         2.9          1.4         0.2     setosa
## 3            4.4         3.0          1.3         0.2     setosa
## 4            4.4         3.2          1.3         0.2     setosa
## 5            4.5         2.3          1.3         0.3     setosa
## 6            4.6         3.1          1.5         0.2     setosa
## 7            4.6         3.4          1.4         0.3     setosa
## 8            4.6         3.6          1.0         0.2     setosa
## 9            4.6         3.2          1.4         0.2     setosa
## 10           4.7         3.2          1.3         0.2     setosa
## 11           4.7         3.2          1.6         0.2     setosa
## 12           4.8         3.4          1.6         0.2     setosa
## 13           4.8         3.0          1.4         0.1     setosa
## 14           4.8         3.4          1.9         0.2     setosa
## 15           4.8         3.1          1.6         0.2     setosa
## 16           4.8         3.0          1.4         0.3     setosa
## 17           4.9         3.0          1.4         0.2     setosa
## 18           4.9         3.1          1.5         0.1     setosa
## 19           4.9         3.1          1.5         0.2     setosa
## 20           4.9         3.6          1.4         0.1     setosa
## 21           4.9         2.4          3.3         1.0 versicolor
## 22           4.9         2.5          4.5         1.7  virginica
## 23           5.0         3.6          1.4         0.2     setosa
## 24           5.0         3.4          1.5         0.2     setosa
## 25           5.0         3.0          1.6         0.2     setosa
## 26           5.0         3.4          1.6         0.4     setosa
## 27           5.0         3.2          1.2         0.2     setosa
## 28           5.0         3.5          1.3         0.3     setosa
## 29           5.0         3.5          1.6         0.6     setosa
## 30           5.0         3.3          1.4         0.2     setosa
## 31           5.0         2.0          3.5         1.0 versicolor
## 32           5.0         2.3          3.3         1.0 versicolor
## 33           5.1         3.5          1.4         0.2     setosa
## 34           5.1         3.5          1.4         0.3     setosa
## 35           5.1         3.8          1.5         0.3     setosa
## 36           5.1         3.7          1.5         0.4     setosa
## 37           5.1         3.3          1.7         0.5     setosa
## 38           5.1         3.4          1.5         0.2     setosa
## 39           5.1         3.8          1.9         0.4     setosa
## 40           5.1         3.8          1.6         0.2     setosa
## 41           5.1         2.5          3.0         1.1 versicolor
## 42           5.2         3.5          1.5         0.2     setosa
## 43           5.2         3.4          1.4         0.2     setosa
## 44           5.2         4.1          1.5         0.1     setosa
## 45           5.2         2.7          3.9         1.4 versicolor
## 46           5.3         3.7          1.5         0.2     setosa
## 47           5.4         3.9          1.7         0.4     setosa
## 48           5.4         3.7          1.5         0.2     setosa
## 49           5.4         3.9          1.3         0.4     setosa
## 50           5.4         3.4          1.7         0.2     setosa
## 51           5.4         3.4          1.5         0.4     setosa
## 52           5.4         3.0          4.5         1.5 versicolor
## 53           5.5         4.2          1.4         0.2     setosa
## 54           5.5         3.5          1.3         0.2     setosa
## 55           5.5         2.3          4.0         1.3 versicolor
## 56           5.5         2.4          3.8         1.1 versicolor
## 57           5.5         2.4          3.7         1.0 versicolor
## 58           5.5         2.5          4.0         1.3 versicolor
## 59           5.5         2.6          4.4         1.2 versicolor
## 60           5.6         2.9          3.6         1.3 versicolor
## 61           5.6         3.0          4.5         1.5 versicolor
## 62           5.6         2.5          3.9         1.1 versicolor
## 63           5.6         3.0          4.1         1.3 versicolor
## 64           5.6         2.7          4.2         1.3 versicolor
## 65           5.6         2.8          4.9         2.0  virginica
## 66           5.7         4.4          1.5         0.4     setosa
## 67           5.7         3.8          1.7         0.3     setosa
## 68           5.7         2.8          4.5         1.3 versicolor
## 69           5.7         2.6          3.5         1.0 versicolor
## 70           5.7         3.0          4.2         1.2 versicolor
## 71           5.7         2.9          4.2         1.3 versicolor
## 72           5.7         2.8          4.1         1.3 versicolor
## 73           5.7         2.5          5.0         2.0  virginica
## 74           5.8         4.0          1.2         0.2     setosa
## 75           5.8         2.7          4.1         1.0 versicolor
## 76           5.8         2.7          3.9         1.2 versicolor
## 77           5.8         2.6          4.0         1.2 versicolor
## 78           5.8         2.7          5.1         1.9  virginica
## 79           5.8         2.8          5.1         2.4  virginica
## 80           5.8         2.7          5.1         1.9  virginica
## 81           5.9         3.0          4.2         1.5 versicolor
## 82           5.9         3.2          4.8         1.8 versicolor
## 83           5.9         3.0          5.1         1.8  virginica
## 84           6.0         2.2          4.0         1.0 versicolor
## 85           6.0         2.9          4.5         1.5 versicolor
## 86           6.0         2.7          5.1         1.6 versicolor
## 87           6.0         3.4          4.5         1.6 versicolor
## 88           6.0         2.2          5.0         1.5  virginica
## 89           6.0         3.0          4.8         1.8  virginica
## 90           6.1         2.9          4.7         1.4 versicolor
## 91           6.1         2.8          4.0         1.3 versicolor
## 92           6.1         2.8          4.7         1.2 versicolor
## 93           6.1         3.0          4.6         1.4 versicolor
## 94           6.1         3.0          4.9         1.8  virginica
## 95           6.1         2.6          5.6         1.4  virginica
## 96           6.2         2.2          4.5         1.5 versicolor
## 97           6.2         2.9          4.3         1.3 versicolor
## 98           6.2         2.8          4.8         1.8  virginica
## 99           6.2         3.4          5.4         2.3  virginica
## 100          6.3         3.3          4.7         1.6 versicolor
## 101          6.3         2.5          4.9         1.5 versicolor
## 102          6.3         2.3          4.4         1.3 versicolor
## 103          6.3         3.3          6.0         2.5  virginica
## 104          6.3         2.9          5.6         1.8  virginica
## 105          6.3         2.7          4.9         1.8  virginica
## 106          6.3         2.8          5.1         1.5  virginica
## 107          6.3         3.4          5.6         2.4  virginica
## 108          6.3         2.5          5.0         1.9  virginica
## 109          6.4         3.2          4.5         1.5 versicolor
## 110          6.4         2.9          4.3         1.3 versicolor
## 111          6.4         2.7          5.3         1.9  virginica
## 112          6.4         3.2          5.3         2.3  virginica
## 113          6.4         2.8          5.6         2.1  virginica
## 114          6.4         2.8          5.6         2.2  virginica
## 115          6.4         3.1          5.5         1.8  virginica
## 116          6.5         2.8          4.6         1.5 versicolor
## 117          6.5         3.0          5.8         2.2  virginica
## 118          6.5         3.2          5.1         2.0  virginica
## 119          6.5         3.0          5.5         1.8  virginica
## 120          6.5         3.0          5.2         2.0  virginica
## 121          6.6         2.9          4.6         1.3 versicolor
## 122          6.6         3.0          4.4         1.4 versicolor
## 123          6.7         3.1          4.4         1.4 versicolor
## 124          6.7         3.0          5.0         1.7 versicolor
## 125          6.7         3.1          4.7         1.5 versicolor
## 126          6.7         2.5          5.8         1.8  virginica
## 127          6.7         3.3          5.7         2.1  virginica
## 128          6.7         3.1          5.6         2.4  virginica
## 129          6.7         3.3          5.7         2.5  virginica
## 130          6.7         3.0          5.2         2.3  virginica
## 131          6.8         2.8          4.8         1.4 versicolor
## 132          6.8         3.0          5.5         2.1  virginica
## 133          6.8         3.2          5.9         2.3  virginica
## 134          6.9         3.1          4.9         1.5 versicolor
## 135          6.9         3.2          5.7         2.3  virginica
## 136          6.9         3.1          5.4         2.1  virginica
## 137          6.9         3.1          5.1         2.3  virginica
## 138          7.0         3.2          4.7         1.4 versicolor
## 139          7.1         3.0          5.9         2.1  virginica
## 140          7.2         3.6          6.1         2.5  virginica
## 141          7.2         3.2          6.0         1.8  virginica
## 142          7.2         3.0          5.8         1.6  virginica
## 143          7.3         2.9          6.3         1.8  virginica
## 144          7.4         2.8          6.1         1.9  virginica
## 145          7.6         3.0          6.6         2.1  virginica
## 146          7.7         3.8          6.7         2.2  virginica
## 147          7.7         2.6          6.9         2.3  virginica
## 148          7.7         2.8          6.7         2.0  virginica
## 149          7.7         3.0          6.1         2.3  virginica
## 150          7.9         3.8          6.4         2.0  virginica
arrange(iris,desc(Species),Sepal.Length)
##     Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1            4.9         2.5          4.5         1.7  virginica
## 2            5.6         2.8          4.9         2.0  virginica
## 3            5.7         2.5          5.0         2.0  virginica
## 4            5.8         2.7          5.1         1.9  virginica
## 5            5.8         2.8          5.1         2.4  virginica
## 6            5.8         2.7          5.1         1.9  virginica
## 7            5.9         3.0          5.1         1.8  virginica
## 8            6.0         2.2          5.0         1.5  virginica
## 9            6.0         3.0          4.8         1.8  virginica
## 10           6.1         3.0          4.9         1.8  virginica
## 11           6.1         2.6          5.6         1.4  virginica
## 12           6.2         2.8          4.8         1.8  virginica
## 13           6.2         3.4          5.4         2.3  virginica
## 14           6.3         3.3          6.0         2.5  virginica
## 15           6.3         2.9          5.6         1.8  virginica
## 16           6.3         2.7          4.9         1.8  virginica
## 17           6.3         2.8          5.1         1.5  virginica
## 18           6.3         3.4          5.6         2.4  virginica
## 19           6.3         2.5          5.0         1.9  virginica
## 20           6.4         2.7          5.3         1.9  virginica
## 21           6.4         3.2          5.3         2.3  virginica
## 22           6.4         2.8          5.6         2.1  virginica
## 23           6.4         2.8          5.6         2.2  virginica
## 24           6.4         3.1          5.5         1.8  virginica
## 25           6.5         3.0          5.8         2.2  virginica
## 26           6.5         3.2          5.1         2.0  virginica
## 27           6.5         3.0          5.5         1.8  virginica
## 28           6.5         3.0          5.2         2.0  virginica
## 29           6.7         2.5          5.8         1.8  virginica
## 30           6.7         3.3          5.7         2.1  virginica
## 31           6.7         3.1          5.6         2.4  virginica
## 32           6.7         3.3          5.7         2.5  virginica
## 33           6.7         3.0          5.2         2.3  virginica
## 34           6.8         3.0          5.5         2.1  virginica
## 35           6.8         3.2          5.9         2.3  virginica
## 36           6.9         3.2          5.7         2.3  virginica
## 37           6.9         3.1          5.4         2.1  virginica
## 38           6.9         3.1          5.1         2.3  virginica
## 39           7.1         3.0          5.9         2.1  virginica
## 40           7.2         3.6          6.1         2.5  virginica
## 41           7.2         3.2          6.0         1.8  virginica
## 42           7.2         3.0          5.8         1.6  virginica
## 43           7.3         2.9          6.3         1.8  virginica
## 44           7.4         2.8          6.1         1.9  virginica
## 45           7.6         3.0          6.6         2.1  virginica
## 46           7.7         3.8          6.7         2.2  virginica
## 47           7.7         2.6          6.9         2.3  virginica
## 48           7.7         2.8          6.7         2.0  virginica
## 49           7.7         3.0          6.1         2.3  virginica
## 50           7.9         3.8          6.4         2.0  virginica
## 51           4.9         2.4          3.3         1.0 versicolor
## 52           5.0         2.0          3.5         1.0 versicolor
## 53           5.0         2.3          3.3         1.0 versicolor
## 54           5.1         2.5          3.0         1.1 versicolor
## 55           5.2         2.7          3.9         1.4 versicolor
## 56           5.4         3.0          4.5         1.5 versicolor
## 57           5.5         2.3          4.0         1.3 versicolor
## 58           5.5         2.4          3.8         1.1 versicolor
## 59           5.5         2.4          3.7         1.0 versicolor
## 60           5.5         2.5          4.0         1.3 versicolor
## 61           5.5         2.6          4.4         1.2 versicolor
## 62           5.6         2.9          3.6         1.3 versicolor
## 63           5.6         3.0          4.5         1.5 versicolor
## 64           5.6         2.5          3.9         1.1 versicolor
## 65           5.6         3.0          4.1         1.3 versicolor
## 66           5.6         2.7          4.2         1.3 versicolor
## 67           5.7         2.8          4.5         1.3 versicolor
## 68           5.7         2.6          3.5         1.0 versicolor
## 69           5.7         3.0          4.2         1.2 versicolor
## 70           5.7         2.9          4.2         1.3 versicolor
## 71           5.7         2.8          4.1         1.3 versicolor
## 72           5.8         2.7          4.1         1.0 versicolor
## 73           5.8         2.7          3.9         1.2 versicolor
## 74           5.8         2.6          4.0         1.2 versicolor
## 75           5.9         3.0          4.2         1.5 versicolor
## 76           5.9         3.2          4.8         1.8 versicolor
## 77           6.0         2.2          4.0         1.0 versicolor
## 78           6.0         2.9          4.5         1.5 versicolor
## 79           6.0         2.7          5.1         1.6 versicolor
## 80           6.0         3.4          4.5         1.6 versicolor
## 81           6.1         2.9          4.7         1.4 versicolor
## 82           6.1         2.8          4.0         1.3 versicolor
## 83           6.1         2.8          4.7         1.2 versicolor
## 84           6.1         3.0          4.6         1.4 versicolor
## 85           6.2         2.2          4.5         1.5 versicolor
## 86           6.2         2.9          4.3         1.3 versicolor
## 87           6.3         3.3          4.7         1.6 versicolor
## 88           6.3         2.5          4.9         1.5 versicolor
## 89           6.3         2.3          4.4         1.3 versicolor
## 90           6.4         3.2          4.5         1.5 versicolor
## 91           6.4         2.9          4.3         1.3 versicolor
## 92           6.5         2.8          4.6         1.5 versicolor
## 93           6.6         2.9          4.6         1.3 versicolor
## 94           6.6         3.0          4.4         1.4 versicolor
## 95           6.7         3.1          4.4         1.4 versicolor
## 96           6.7         3.0          5.0         1.7 versicolor
## 97           6.7         3.1          4.7         1.5 versicolor
## 98           6.8         2.8          4.8         1.4 versicolor
## 99           6.9         3.1          4.9         1.5 versicolor
## 100          7.0         3.2          4.7         1.4 versicolor
## 101          4.3         3.0          1.1         0.1     setosa
## 102          4.4         2.9          1.4         0.2     setosa
## 103          4.4         3.0          1.3         0.2     setosa
## 104          4.4         3.2          1.3         0.2     setosa
## 105          4.5         2.3          1.3         0.3     setosa
## 106          4.6         3.1          1.5         0.2     setosa
## 107          4.6         3.4          1.4         0.3     setosa
## 108          4.6         3.6          1.0         0.2     setosa
## 109          4.6         3.2          1.4         0.2     setosa
## 110          4.7         3.2          1.3         0.2     setosa
## 111          4.7         3.2          1.6         0.2     setosa
## 112          4.8         3.4          1.6         0.2     setosa
## 113          4.8         3.0          1.4         0.1     setosa
## 114          4.8         3.4          1.9         0.2     setosa
## 115          4.8         3.1          1.6         0.2     setosa
## 116          4.8         3.0          1.4         0.3     setosa
## 117          4.9         3.0          1.4         0.2     setosa
## 118          4.9         3.1          1.5         0.1     setosa
## 119          4.9         3.1          1.5         0.2     setosa
## 120          4.9         3.6          1.4         0.1     setosa
## 121          5.0         3.6          1.4         0.2     setosa
## 122          5.0         3.4          1.5         0.2     setosa
## 123          5.0         3.0          1.6         0.2     setosa
## 124          5.0         3.4          1.6         0.4     setosa
## 125          5.0         3.2          1.2         0.2     setosa
## 126          5.0         3.5          1.3         0.3     setosa
## 127          5.0         3.5          1.6         0.6     setosa
## 128          5.0         3.3          1.4         0.2     setosa
## 129          5.1         3.5          1.4         0.2     setosa
## 130          5.1         3.5          1.4         0.3     setosa
## 131          5.1         3.8          1.5         0.3     setosa
## 132          5.1         3.7          1.5         0.4     setosa
## 133          5.1         3.3          1.7         0.5     setosa
## 134          5.1         3.4          1.5         0.2     setosa
## 135          5.1         3.8          1.9         0.4     setosa
## 136          5.1         3.8          1.6         0.2     setosa
## 137          5.2         3.5          1.5         0.2     setosa
## 138          5.2         3.4          1.4         0.2     setosa
## 139          5.2         4.1          1.5         0.1     setosa
## 140          5.3         3.7          1.5         0.2     setosa
## 141          5.4         3.9          1.7         0.4     setosa
## 142          5.4         3.7          1.5         0.2     setosa
## 143          5.4         3.9          1.3         0.4     setosa
## 144          5.4         3.4          1.7         0.2     setosa
## 145          5.4         3.4          1.5         0.4     setosa
## 146          5.5         4.2          1.4         0.2     setosa
## 147          5.5         3.5          1.3         0.2     setosa
## 148          5.7         4.4          1.5         0.4     setosa
## 149          5.7         3.8          1.7         0.3     setosa
## 150          5.8         4.0          1.2         0.2     setosa

Filtrowanie danych

iris1<-filter(iris,Sepal.Length>5)
iris1
##     Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1            5.1         3.5          1.4         0.2     setosa
## 2            5.4         3.9          1.7         0.4     setosa
## 3            5.4         3.7          1.5         0.2     setosa
## 4            5.8         4.0          1.2         0.2     setosa
## 5            5.7         4.4          1.5         0.4     setosa
## 6            5.4         3.9          1.3         0.4     setosa
## 7            5.1         3.5          1.4         0.3     setosa
## 8            5.7         3.8          1.7         0.3     setosa
## 9            5.1         3.8          1.5         0.3     setosa
## 10           5.4         3.4          1.7         0.2     setosa
## 11           5.1         3.7          1.5         0.4     setosa
## 12           5.1         3.3          1.7         0.5     setosa
## 13           5.2         3.5          1.5         0.2     setosa
## 14           5.2         3.4          1.4         0.2     setosa
## 15           5.4         3.4          1.5         0.4     setosa
## 16           5.2         4.1          1.5         0.1     setosa
## 17           5.5         4.2          1.4         0.2     setosa
## 18           5.5         3.5          1.3         0.2     setosa
## 19           5.1         3.4          1.5         0.2     setosa
## 20           5.1         3.8          1.9         0.4     setosa
## 21           5.1         3.8          1.6         0.2     setosa
## 22           5.3         3.7          1.5         0.2     setosa
## 23           7.0         3.2          4.7         1.4 versicolor
## 24           6.4         3.2          4.5         1.5 versicolor
## 25           6.9         3.1          4.9         1.5 versicolor
## 26           5.5         2.3          4.0         1.3 versicolor
## 27           6.5         2.8          4.6         1.5 versicolor
## 28           5.7         2.8          4.5         1.3 versicolor
## 29           6.3         3.3          4.7         1.6 versicolor
## 30           6.6         2.9          4.6         1.3 versicolor
## 31           5.2         2.7          3.9         1.4 versicolor
## 32           5.9         3.0          4.2         1.5 versicolor
## 33           6.0         2.2          4.0         1.0 versicolor
## 34           6.1         2.9          4.7         1.4 versicolor
## 35           5.6         2.9          3.6         1.3 versicolor
## 36           6.7         3.1          4.4         1.4 versicolor
## 37           5.6         3.0          4.5         1.5 versicolor
## 38           5.8         2.7          4.1         1.0 versicolor
## 39           6.2         2.2          4.5         1.5 versicolor
## 40           5.6         2.5          3.9         1.1 versicolor
## 41           5.9         3.2          4.8         1.8 versicolor
## 42           6.1         2.8          4.0         1.3 versicolor
## 43           6.3         2.5          4.9         1.5 versicolor
## 44           6.1         2.8          4.7         1.2 versicolor
## 45           6.4         2.9          4.3         1.3 versicolor
## 46           6.6         3.0          4.4         1.4 versicolor
## 47           6.8         2.8          4.8         1.4 versicolor
## 48           6.7         3.0          5.0         1.7 versicolor
## 49           6.0         2.9          4.5         1.5 versicolor
## 50           5.7         2.6          3.5         1.0 versicolor
## 51           5.5         2.4          3.8         1.1 versicolor
## 52           5.5         2.4          3.7         1.0 versicolor
## 53           5.8         2.7          3.9         1.2 versicolor
## 54           6.0         2.7          5.1         1.6 versicolor
## 55           5.4         3.0          4.5         1.5 versicolor
## 56           6.0         3.4          4.5         1.6 versicolor
## 57           6.7         3.1          4.7         1.5 versicolor
## 58           6.3         2.3          4.4         1.3 versicolor
## 59           5.6         3.0          4.1         1.3 versicolor
## 60           5.5         2.5          4.0         1.3 versicolor
## 61           5.5         2.6          4.4         1.2 versicolor
## 62           6.1         3.0          4.6         1.4 versicolor
## 63           5.8         2.6          4.0         1.2 versicolor
## 64           5.6         2.7          4.2         1.3 versicolor
## 65           5.7         3.0          4.2         1.2 versicolor
## 66           5.7         2.9          4.2         1.3 versicolor
## 67           6.2         2.9          4.3         1.3 versicolor
## 68           5.1         2.5          3.0         1.1 versicolor
## 69           5.7         2.8          4.1         1.3 versicolor
## 70           6.3         3.3          6.0         2.5  virginica
## 71           5.8         2.7          5.1         1.9  virginica
## 72           7.1         3.0          5.9         2.1  virginica
## 73           6.3         2.9          5.6         1.8  virginica
## 74           6.5         3.0          5.8         2.2  virginica
## 75           7.6         3.0          6.6         2.1  virginica
## 76           7.3         2.9          6.3         1.8  virginica
## 77           6.7         2.5          5.8         1.8  virginica
## 78           7.2         3.6          6.1         2.5  virginica
## 79           6.5         3.2          5.1         2.0  virginica
## 80           6.4         2.7          5.3         1.9  virginica
## 81           6.8         3.0          5.5         2.1  virginica
## 82           5.7         2.5          5.0         2.0  virginica
## 83           5.8         2.8          5.1         2.4  virginica
## 84           6.4         3.2          5.3         2.3  virginica
## 85           6.5         3.0          5.5         1.8  virginica
## 86           7.7         3.8          6.7         2.2  virginica
## 87           7.7         2.6          6.9         2.3  virginica
## 88           6.0         2.2          5.0         1.5  virginica
## 89           6.9         3.2          5.7         2.3  virginica
## 90           5.6         2.8          4.9         2.0  virginica
## 91           7.7         2.8          6.7         2.0  virginica
## 92           6.3         2.7          4.9         1.8  virginica
## 93           6.7         3.3          5.7         2.1  virginica
## 94           7.2         3.2          6.0         1.8  virginica
## 95           6.2         2.8          4.8         1.8  virginica
## 96           6.1         3.0          4.9         1.8  virginica
## 97           6.4         2.8          5.6         2.1  virginica
## 98           7.2         3.0          5.8         1.6  virginica
## 99           7.4         2.8          6.1         1.9  virginica
## 100          7.9         3.8          6.4         2.0  virginica
## 101          6.4         2.8          5.6         2.2  virginica
## 102          6.3         2.8          5.1         1.5  virginica
## 103          6.1         2.6          5.6         1.4  virginica
## 104          7.7         3.0          6.1         2.3  virginica
## 105          6.3         3.4          5.6         2.4  virginica
## 106          6.4         3.1          5.5         1.8  virginica
## 107          6.0         3.0          4.8         1.8  virginica
## 108          6.9         3.1          5.4         2.1  virginica
## 109          6.7         3.1          5.6         2.4  virginica
## 110          6.9         3.1          5.1         2.3  virginica
## 111          5.8         2.7          5.1         1.9  virginica
## 112          6.8         3.2          5.9         2.3  virginica
## 113          6.7         3.3          5.7         2.5  virginica
## 114          6.7         3.0          5.2         2.3  virginica
## 115          6.3         2.5          5.0         1.9  virginica
## 116          6.5         3.0          5.2         2.0  virginica
## 117          6.2         3.4          5.4         2.3  virginica
## 118          5.9         3.0          5.1         1.8  virginica
filter(iris,Species=="setosa",Sepal.Length>5)
##    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1           5.1         3.5          1.4         0.2  setosa
## 2           5.4         3.9          1.7         0.4  setosa
## 3           5.4         3.7          1.5         0.2  setosa
## 4           5.8         4.0          1.2         0.2  setosa
## 5           5.7         4.4          1.5         0.4  setosa
## 6           5.4         3.9          1.3         0.4  setosa
## 7           5.1         3.5          1.4         0.3  setosa
## 8           5.7         3.8          1.7         0.3  setosa
## 9           5.1         3.8          1.5         0.3  setosa
## 10          5.4         3.4          1.7         0.2  setosa
## 11          5.1         3.7          1.5         0.4  setosa
## 12          5.1         3.3          1.7         0.5  setosa
## 13          5.2         3.5          1.5         0.2  setosa
## 14          5.2         3.4          1.4         0.2  setosa
## 15          5.4         3.4          1.5         0.4  setosa
## 16          5.2         4.1          1.5         0.1  setosa
## 17          5.5         4.2          1.4         0.2  setosa
## 18          5.5         3.5          1.3         0.2  setosa
## 19          5.1         3.4          1.5         0.2  setosa
## 20          5.1         3.8          1.9         0.4  setosa
## 21          5.1         3.8          1.6         0.2  setosa
## 22          5.3         3.7          1.5         0.2  setosa

Losowanie obserwacji ze zbioru

# Wylosowanie 5% obserwacji ze zbioru danych.
sample_frac(iris,0.05)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1          4.6         3.2          1.4         0.2     setosa
## 2          5.4         3.0          4.5         1.5 versicolor
## 3          4.4         2.9          1.4         0.2     setosa
## 4          7.9         3.8          6.4         2.0  virginica
## 5          6.4         2.8          5.6         2.2  virginica
## 6          5.5         4.2          1.4         0.2     setosa
## 7          4.8         3.0          1.4         0.3     setosa
## 8          5.7         2.8          4.1         1.3 versicolor
0.05*150
## [1] 7.5

Operator pipe (%>%)

16%>%sqrt()%>%log()
## [1] 1.386294
log(4)
## [1] 1.386294
# Wyselekcjonowanie ze zbioru danych iris: irysów, które są gatunku versicolor, 
# a uzyskany zbiór należy posortować malejąco względem Petal.Width.
iris%>%filter(Species=="versicolor")%>%arrange(desc(Petal.Width))
##    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1           5.9         3.2          4.8         1.8 versicolor
## 2           6.7         3.0          5.0         1.7 versicolor
## 3           6.3         3.3          4.7         1.6 versicolor
## 4           6.0         2.7          5.1         1.6 versicolor
## 5           6.0         3.4          4.5         1.6 versicolor
## 6           6.4         3.2          4.5         1.5 versicolor
## 7           6.9         3.1          4.9         1.5 versicolor
## 8           6.5         2.8          4.6         1.5 versicolor
## 9           5.9         3.0          4.2         1.5 versicolor
## 10          5.6         3.0          4.5         1.5 versicolor
## 11          6.2         2.2          4.5         1.5 versicolor
## 12          6.3         2.5          4.9         1.5 versicolor
## 13          6.0         2.9          4.5         1.5 versicolor
## 14          5.4         3.0          4.5         1.5 versicolor
## 15          6.7         3.1          4.7         1.5 versicolor
## 16          7.0         3.2          4.7         1.4 versicolor
## 17          5.2         2.7          3.9         1.4 versicolor
## 18          6.1         2.9          4.7         1.4 versicolor
## 19          6.7         3.1          4.4         1.4 versicolor
## 20          6.6         3.0          4.4         1.4 versicolor
## 21          6.8         2.8          4.8         1.4 versicolor
## 22          6.1         3.0          4.6         1.4 versicolor
## 23          5.5         2.3          4.0         1.3 versicolor
## 24          5.7         2.8          4.5         1.3 versicolor
## 25          6.6         2.9          4.6         1.3 versicolor
## 26          5.6         2.9          3.6         1.3 versicolor
## 27          6.1         2.8          4.0         1.3 versicolor
## 28          6.4         2.9          4.3         1.3 versicolor
## 29          6.3         2.3          4.4         1.3 versicolor
## 30          5.6         3.0          4.1         1.3 versicolor
## 31          5.5         2.5          4.0         1.3 versicolor
## 32          5.6         2.7          4.2         1.3 versicolor
## 33          5.7         2.9          4.2         1.3 versicolor
## 34          6.2         2.9          4.3         1.3 versicolor
## 35          5.7         2.8          4.1         1.3 versicolor
## 36          6.1         2.8          4.7         1.2 versicolor
## 37          5.8         2.7          3.9         1.2 versicolor
## 38          5.5         2.6          4.4         1.2 versicolor
## 39          5.8         2.6          4.0         1.2 versicolor
## 40          5.7         3.0          4.2         1.2 versicolor
## 41          5.6         2.5          3.9         1.1 versicolor
## 42          5.5         2.4          3.8         1.1 versicolor
## 43          5.1         2.5          3.0         1.1 versicolor
## 44          4.9         2.4          3.3         1.0 versicolor
## 45          5.0         2.0          3.5         1.0 versicolor
## 46          6.0         2.2          4.0         1.0 versicolor
## 47          5.8         2.7          4.1         1.0 versicolor
## 48          5.7         2.6          3.5         1.0 versicolor
## 49          5.5         2.4          3.7         1.0 versicolor
## 50          5.0         2.3          3.3         1.0 versicolor