1 Analiza zbioru danych Cats

1.1 Opis zbioru danych

Zbiór z biblioteki “MASS”. Zawiera 144 kolumn i przedstawia płeć, wagę i wagę serca wybranych kotów

Opis nagłówków

  1. Sex: Płeć kota
  2. Bwt: Waga kota podana w Kg
  3. Hwt: Waga serca podana w g

1.2 Wczytanie bibliotek

library(MASS)
library(ggplot2)
## Warning: pakiet 'ggplot2' został zbudowany w wersji R 4.2.3

1.3 Wczytywanie danych dotyczacych

data(cats)
head(cats)
##   Sex Bwt Hwt
## 1   F 2.0 7.0
## 2   F 2.0 7.4
## 3   F 2.0 9.5
## 4   F 2.1 7.2
## 5   F 2.1 7.3
## 6   F 2.1 7.6

1.4 Struktura i podsumowanie danych

str(cats)
## 'data.frame':    144 obs. of  3 variables:
##  $ Sex: Factor w/ 2 levels "F","M": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Bwt: num  2 2 2 2.1 2.1 2.1 2.1 2.1 2.1 2.1 ...
##  $ Hwt: num  7 7.4 9.5 7.2 7.3 7.6 8.1 8.2 8.3 8.5 ...
summary(cats)
##  Sex         Bwt             Hwt       
##  F:47   Min.   :2.000   Min.   : 6.30  
##  M:97   1st Qu.:2.300   1st Qu.: 8.95  
##         Median :2.700   Median :10.10  
##         Mean   :2.724   Mean   :10.63  
##         3rd Qu.:3.025   3rd Qu.:12.12  
##         Max.   :3.900   Max.   :20.50

2 Wizualne przedstawienie danych

2.1 Wykres punktowy

ggplot(cats, aes(Bwt,Hwt, color = Sex)) +
  geom_point() +
  labs(x = "Waga (oz)", y = "Wzrost (cm)", title = "Wzrost vs. Waga kotów")

2.2 Histogram wagi kotów z podziałem na płeć

ggplot(cats, aes(x = Bwt, fill = Sex)) +
  geom_histogram(binwidth = 1, position = "dodge", alpha = 0.7) +
  labs(title = "Histogram wagi kotów z podziałem na płeć", x = "Waga", y = "Częstość")

2.3 Wykres pudełkowy wzrostu kotów z podziałem na płeć

ggplot(cats, aes(Sex,Hwt, fill = Sex)) +
  geom_boxplot() +
  labs(title = "Wykres pudełkowy wzrostu kotów z podziałem na płeć", x = "Płeć", y = "Wzrost")

3 Analiza zależności

3.1 Analiza korelacji

print(paste("Współczynnik korelacji Pearsona:", round(cor(cats$Bwt, cats$Hwt), 2)))
## [1] "Współczynnik korelacji Pearsona: 0.8"

Występuje silna korelacja dodatnia. Poniżej przedstawiam wykres obrazujący ową korelację.

ggplot(cats, aes(Bwt,Hwt, color = Sex)) +
  geom_point() +
  labs(x = "Waga (oz)", y = "Wzrost (cm)", title = "Wzrost vs. Waga kotów") +
  geom_smooth(method = "lm", se = FALSE, color = "red")
## `geom_smooth()` using formula = 'y ~ x'

3.2 Testowanie hipotez

t.test(Bwt ~ Sex, data = cats)
## 
##  Welch Two Sample t-test
## 
## data:  Bwt by Sex
## t = -8.7095, df = 136.84, p-value = 8.831e-15
## alternative hypothesis: true difference in means between group F and group M is not equal to 0
## 95 percent confidence interval:
##  -0.6631268 -0.4177242
## sample estimates:
## mean in group F mean in group M 
##        2.359574        2.900000

P-value = 8.831e-15 Wartość P jest bliska zero co sugeruje istotną statystycznie różnicę między średnimi wagami kotów płci żeńskiej i męskiej