library(HistData)
data(Arbuthnot)
attach(Arbuthnot)
library(ggplot2)
library(patchwork)

0.1 Wstęp

Do analizy danych wykorzystamy pakiet danych Arbuthnot znajdujący się w pakiecie HistData. Znajdują się w nim informacje dotyczące chrztów w Londynie w latach 1629-1710. Nazwa pakietu pochodzi od nazwiska Johna Arbuthnota, który zebrał te dane.

Dane Arbuthnot zawierają kolumny takie jak:

  • Year - rok, w którym odnotowano dane
  • Males - liczba chrztów chłopców
  • Females - liczba chrztów dziewczynek
  • Plague - liczba śmierci z powodu dżumy
  • Mortality - liczba zgonów
  • Ratio - stosunek Males/Females
  • Total - całkowita liczba chrztów w Londynie
head(Arbuthnot)
##   Year Males Females Plague Mortality    Ratio Total
## 1 1629  5218    4683      0      8771 1.114243 9.901
## 2 1630  4858    4457   1317     10554 1.089971 9.315
## 3 1631  4422    4102    274      8562 1.078011 8.524
## 4 1632  4994    4590      8      9535 1.088017 9.584
## 5 1633  5158    4839      0      8393 1.065923 9.997
## 6 1634  5035    4820      1     10400 1.044606 9.855

0.2 Analiza struktury

0.2.1 Analiza poziomu przeciętnego

summary(Males)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2890    4759    6073    5907    7576    8426

Maksymalna liczba chrztów chłopców wynosi 8426, natomiast minimalna 2890.

Mediana liczby chrztów chłopców wynosi 6073.

Średnia liczba chrztów chłopców wynosi 5907.

quantile(Males,c(0.25,0.5,0.75))
##     25%     50%     75% 
## 4759.25 6073.00 7576.50

W 25% zbadanych lat ilość chrztów chłopców nie przekraczała 4759.25.

W 50% zbadanych lat ilość chrztów chłopców nie przekraczała 6073.

W 75% zbadanych lat ilość chrztów chłopców nie przekraczała 7576.50.

summary(Females)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2722    4457    5718    5535    7150    7779

Maksymalna liczba chrztów dziewczynek wynosi 7779, natomiast minimalna 2722.

Mediana liczby chrztów dziewczynek wynosi 5718.

Średnia liczba chrztów dziewczynek wynosi 5535.

quantile(Females,c(0.25,0.5,0.75))
##     25%     50%     75% 
## 4457.00 5718.00 7150.25

W 25% zbadanych lat ilość chrztów dziewczynek nie przekraczała 4457.

W 50% zbadanych lat ilość chrztów dziewczynek nie przekraczała 5718

W 75% zbadanych lat ilość chrztów dziewczynek nie przekraczała 7150.25.

summary(Mortality)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    8393   12739   17867   17816   21030   97306

Maksymalna liczba zgonów wynosi 97306, natomiast minimalna 8393.

Mediana liczby zgonówk wynosi 17867.

Średnia liczba zgonów wynosi 17816.

quantile(Mortality,c(0.25,0.5,0.75))
##      25%      50%      75% 
## 12738.75 17867.00 21029.50

W 25% zbadanych lat ilość zgonów nie przekraczała 12738.75

W 50% zbadanych lat ilość zgonów nie przekraczała 17867.

W 75% zbadanych lat ilość zgonów nie przekraczała 21029.5.

0.2.2 Analiza zróznicowania

sqrt(var(Males)*(length(Males)-1)/length(Males))
## [1] 1642.645

Wartości liczby chrztów chłopców odchylają się od jej wartości średniej przeciętnie o 1642.645.

sqrt(var(Females)*(length(Females)-1)/length(Females))
## [1] 1582.4

Wartości liczby chrztów dziewczynek odchylają się od jej wartości średniej przeciętnie o 1582.4.

sqrt(var(Mortality)*(length(Mortality)-1)/length(Mortality))
## [1] 10044.18

Wartości śmiertelności odchylają się od jej wartości średniej przeciętnie o 10044.18.

0.3 Analiza zależności

cor(Mortality,Plague)
## [1] 0.8608566

Pomiędzy liczbą śmierci z powodu dżumy występuje silna dodatnia zależność korelacyjna. Oznacza to, że gdy rośnie jedna zmienna, rośnie też druga.

cor(Total,Mortality)
## [1] 0.3430815

Pomiędzy liczbą chrztów, a śmiertelnością występuje umiarkowana dodatnia zależność korelacyjna. Oznacza to, że gdy rośnie liczba chrztów, rośnie też liczba zgonów.

cor(Females,Males)
## [1] 0.9959903

Między liczbą chrztów chłopców i dziewczynek występuje silna dodatnia zależność korelacyjna. Oznacza to, że jeżeli rośnie liczba chrztów chłopców to zwiększa się również liczba chrztów dziewczynek.

0.4 Wykresy

ggplot(Arbuthnot,aes(Year,Males))+geom_line()+ylab("Liczba chrztów chłopców")+xlab("Rok")+ggtitle("Liczba ochrzczonych chłopców w zależności od roku")

ggplot(Arbuthnot,aes(Year,Females))+geom_line()+ylab("Liczba chrztów dziewczynek")+xlab("Rok")+ggtitle("Liczba ochrzczonych dziewczynek w zależności od roku")

ggplot(Arbuthnot,aes(Year,Total)) + geom_point() +  geom_smooth(formula=y~x,method="lm", se=FALSE, color="blue") + ylab("Liczba chrztów w Londynie") + xlab("Rok") + ggtitle("Wykres regresji liniowej dla liczby chrztów w Londynie")

Ten wykres przedstawia punkty danych, które reprezentują liczbę chrztów w Londynie na przestrzeni lat. Dodatkowo, linia regresji liniowej została dodana, aby zobrazować ogólny trend zmian w tych danych.

0.5 Zakończenie

Analiza danych pakietu Arbuthnot dostarczyła kilku cennych wniosków dotyczących liczby chrztów chłopców i dziewczynek. Wykres liczby chrztów dziewczynek i chłopców wykazuje, że ich liczba ulegała fluktuacjom w zależności od roku. Działania podejmowane w tych okresach, wydarzenia historyczne i zmiany demograficzne mogą wpływać na ich liczbę.