Zbiór danych “gapminder” to zestaw danych zawierający informacje o różnych krajach na przestrzeni lat. Został on zebrany przez Hansa Roslinga i jego zespół w ramach projektu Gapminder Foundation, mającego na celu prezentowanie danych w sposób dostępny i zrozumiały dla szerokiego grona odbiorców.
W tym zbiorze zdajdziemy informacje o danym kraju (country), z jakiego kontynentu pochodzi (continent), podany jest rok dla którego są przedstawione dane (year), średnia długość życia (lifeExp), liczba populacji (pop), a także PKB per capita w dolarach amerykańskich (gdpPercap).
Wczytujemy zbiór “gapminder” z pakietu o tej samej nazwie.
options(repos='http://cran.rstudio.com/') # Ustawienie serwera lustrzanego CRAN
install.packages("gapminder")
## Instalowanie pakietu w 'C:/Users/GrzegorzKończak/AppData/Local/R/win-library/4.2'
## (ponieważ 'lib' nie jest określony)
## pakiet 'gapminder' został pomyślnie rozpakowany oraz sumy MD5 zostały sprawdzone
##
## Pobrane pakiety binarne są w
## C:\Users\GrzegorzKończak\AppData\Local\Temp\Rtmp4WLqiI\downloaded_packages
library(gapminder)
## Warning: pakiet 'gapminder' został zbudowany w wersji R 4.2.3
data(gapminder)
dane=gapminder
dane
## # A tibble: 1,704 × 6
## country continent year lifeExp pop gdpPercap
## <fct> <fct> <int> <dbl> <int> <dbl>
## 1 Afghanistan Asia 1952 28.8 8425333 779.
## 2 Afghanistan Asia 1957 30.3 9240934 821.
## 3 Afghanistan Asia 1962 32.0 10267083 853.
## 4 Afghanistan Asia 1967 34.0 11537966 836.
## 5 Afghanistan Asia 1972 36.1 13079460 740.
## 6 Afghanistan Asia 1977 38.4 14880372 786.
## 7 Afghanistan Asia 1982 39.9 12881816 978.
## 8 Afghanistan Asia 1987 40.8 13867957 852.
## 9 Afghanistan Asia 1992 41.7 16317921 649.
## 10 Afghanistan Asia 1997 41.8 22227415 635.
## # ℹ 1,694 more rows
Wyodrębniamy dane dla poszczególnych krajów które przydadzą się w dalszej analizie.
dane_włochy=gapminder[769:780,]
dane_niemcy=gapminder[565:576,]
dane_finlandia=gapminder[517:528,]
dane_grecja=gapminder[589:600,]
dane_lesotho=gapminder[877:888,]
dane_argentyna=gapminder[49:60,]
dane_włochy
## # A tibble: 12 × 6
## country continent year lifeExp pop gdpPercap
## <fct> <fct> <int> <dbl> <int> <dbl>
## 1 Italy Europe 1952 65.9 47666000 4931.
## 2 Italy Europe 1957 67.8 49182000 6249.
## 3 Italy Europe 1962 69.2 50843200 8244.
## 4 Italy Europe 1967 71.1 52667100 10022.
## 5 Italy Europe 1972 72.2 54365564 12269.
## 6 Italy Europe 1977 73.5 56059245 14256.
## 7 Italy Europe 1982 75.0 56535636 16537.
## 8 Italy Europe 1987 76.4 56729703 19207.
## 9 Italy Europe 1992 77.4 56840847 22014.
## 10 Italy Europe 1997 78.8 57479469 24675.
## 11 Italy Europe 2002 80.2 57926999 27968.
## 12 Italy Europe 2007 80.5 58147733 28570.
dane_niemcy
## # A tibble: 12 × 6
## country continent year lifeExp pop gdpPercap
## <fct> <fct> <int> <dbl> <int> <dbl>
## 1 Germany Europe 1952 67.5 69145952 7144.
## 2 Germany Europe 1957 69.1 71019069 10188.
## 3 Germany Europe 1962 70.3 73739117 12902.
## 4 Germany Europe 1967 70.8 76368453 14746.
## 5 Germany Europe 1972 71 78717088 18016.
## 6 Germany Europe 1977 72.5 78160773 20513.
## 7 Germany Europe 1982 73.8 78335266 22032.
## 8 Germany Europe 1987 74.8 77718298 24639.
## 9 Germany Europe 1992 76.1 80597764 26505.
## 10 Germany Europe 1997 77.3 82011073 27789.
## 11 Germany Europe 2002 78.7 82350671 30036.
## 12 Germany Europe 2007 79.4 82400996 32170.
dane_finlandia
## # A tibble: 12 × 6
## country continent year lifeExp pop gdpPercap
## <fct> <fct> <int> <dbl> <int> <dbl>
## 1 Finland Europe 1952 66.6 4090500 6425.
## 2 Finland Europe 1957 67.5 4324000 7545.
## 3 Finland Europe 1962 68.8 4491443 9372.
## 4 Finland Europe 1967 69.8 4605744 10922.
## 5 Finland Europe 1972 70.9 4639657 14359.
## 6 Finland Europe 1977 72.5 4738902 15605.
## 7 Finland Europe 1982 74.6 4826933 18533.
## 8 Finland Europe 1987 74.8 4931729 21141.
## 9 Finland Europe 1992 75.7 5041039 20647.
## 10 Finland Europe 1997 77.1 5134406 23724.
## 11 Finland Europe 2002 78.4 5193039 28205.
## 12 Finland Europe 2007 79.3 5238460 33207.
dane_grecja
## # A tibble: 12 × 6
## country continent year lifeExp pop gdpPercap
## <fct> <fct> <int> <dbl> <int> <dbl>
## 1 Greece Europe 1952 65.9 7733250 3531.
## 2 Greece Europe 1957 67.9 8096218 4916.
## 3 Greece Europe 1962 69.5 8448233 6017.
## 4 Greece Europe 1967 71 8716441 8513.
## 5 Greece Europe 1972 72.3 8888628 12725.
## 6 Greece Europe 1977 73.7 9308479 14196.
## 7 Greece Europe 1982 75.2 9786480 15268.
## 8 Greece Europe 1987 76.7 9974490 16121.
## 9 Greece Europe 1992 77.0 10325429 17541.
## 10 Greece Europe 1997 77.9 10502372 18748.
## 11 Greece Europe 2002 78.3 10603863 22514.
## 12 Greece Europe 2007 79.5 10706290 27538.
dane_lesotho
## # A tibble: 12 × 6
## country continent year lifeExp pop gdpPercap
## <fct> <fct> <int> <dbl> <int> <dbl>
## 1 Lesotho Africa 1952 42.1 748747 299.
## 2 Lesotho Africa 1957 45.0 813338 336.
## 3 Lesotho Africa 1962 47.7 893143 412.
## 4 Lesotho Africa 1967 48.5 996380 499.
## 5 Lesotho Africa 1972 49.8 1116779 497.
## 6 Lesotho Africa 1977 52.2 1251524 745.
## 7 Lesotho Africa 1982 55.1 1411807 797.
## 8 Lesotho Africa 1987 57.2 1599200 774.
## 9 Lesotho Africa 1992 59.7 1803195 977.
## 10 Lesotho Africa 1997 55.6 1982823 1186.
## 11 Lesotho Africa 2002 44.6 2046772 1275.
## 12 Lesotho Africa 2007 42.6 2012649 1569.
dane_argentyna
## # A tibble: 12 × 6
## country continent year lifeExp pop gdpPercap
## <fct> <fct> <int> <dbl> <int> <dbl>
## 1 Argentina Americas 1952 62.5 17876956 5911.
## 2 Argentina Americas 1957 64.4 19610538 6857.
## 3 Argentina Americas 1962 65.1 21283783 7133.
## 4 Argentina Americas 1967 65.6 22934225 8053.
## 5 Argentina Americas 1972 67.1 24779799 9443.
## 6 Argentina Americas 1977 68.5 26983828 10079.
## 7 Argentina Americas 1982 69.9 29341374 8998.
## 8 Argentina Americas 1987 70.8 31620918 9140.
## 9 Argentina Americas 1992 71.9 33958947 9308.
## 10 Argentina Americas 1997 73.3 36203463 10967.
## 11 Argentina Americas 2002 74.3 38331121 8798.
## 12 Argentina Americas 2007 75.3 40301927 12779.
Rozważmy podstawowe mierniki statysytyczne przy użyciu funkcji summary().
summary(dane)
## country continent year lifeExp
## Afghanistan: 12 Africa :624 Min. :1952 Min. :23.60
## Albania : 12 Americas:300 1st Qu.:1966 1st Qu.:48.20
## Algeria : 12 Asia :396 Median :1980 Median :60.71
## Angola : 12 Europe :360 Mean :1980 Mean :59.47
## Argentina : 12 Oceania : 24 3rd Qu.:1993 3rd Qu.:70.85
## Australia : 12 Max. :2007 Max. :82.60
## (Other) :1632
## pop gdpPercap
## Min. :6.001e+04 Min. : 241.2
## 1st Qu.:2.794e+06 1st Qu.: 1202.1
## Median :7.024e+06 Median : 3531.8
## Mean :2.960e+07 Mean : 7215.3
## 3rd Qu.:1.959e+07 3rd Qu.: 9325.5
## Max. :1.319e+09 Max. :113523.1
##
Po podsumowaniu danych widoczne jest że kazdy kraj występuje 12 razy - dane dla lat 1952-2007. Najwięcej krajów w podanym zbiorze pochodzi z Afryki, a najmniej z Oceanii. Minimalny rok to 1952, a maksymalny 2007, mediana, a także średnia lat wynosi 1980. Minimalna średnia długość życia w zbiorze wynosi 23,6 lat, a maksymalna 82,6, średnia dla wszystkich krajów w podanych latach - 59,47 lat. Minimalna populacja wynosi 60 010 a maksymalna 1 319 000 000, średnia - 29 600 000. Minimalne PKB per capita 241.2 US dolarów, a maksymalne 113523.1 US dolarów, średnie - 7215.3 US dolarów. Oprócz tego w tabeli są warości kwartyli dla wszystkich danych liczbowych.
Poniższe wykresy wizualizują poszczególne dane ze zbioru. Dla każdego wykresu dołączony jest tytuł informujący co się na nim znajduje.
plot(dane_włochy$year, dane_włochy$gdpPercap, type ='l', col='deeppink', main='Zmiana wartości PKB per capita w danych krajach', lwd=3, xlab='lata 1952-2007', ylab='PKB per capita')
lines(dane_finlandia$year, dane_finlandia$gdpPercap, col='green', lwd=3)
lines(dane_grecja$year, dane_grecja$gdpPercap, type ='l', col='purple', lwd=3)
lines(dane_lesotho$year, dane_lesotho$gdpPercap, type ='l', col='gold', lwd=3)
lines(dane_argentyna$year, dane_argentyna$gdpPercap, type ='l', col='coral2', lwd=3)
lines(dane_niemcy$year, dane_niemcy$gdpPercap, type ='l', col='aquamarine', lwd=3)
legend("topleft", legend=c("Włochy","Finlandia", "Grecja", "Lesotho", "Argentyna","Niemcy"),
col=c('deeppink', 'green','purple', 'gold','coral2','aquamarine'), lty=1, lwd=3)
library(ggplot2)
## Warning: pakiet 'ggplot2' został zbudowany w wersji R 4.2.3
ggplot(dane, aes(x = continent, y = pop, fill = continent)) +
geom_bar(stat = "summary", fun = "sum") +
labs(title = "Suma populacji dla każdego kontynentu",
x = "Kontynent", y = "Suma populacji") +
theme_update()+
theme(plot.title = element_text(hjust = 0.5, face = "bold"))
ggplot(dane, aes(x = continent, y = gdpPercap, fill = continent)) +
geom_bar(stat = "summary", fun = "mean") +
labs(title = "Średnie PKB per capita dla każdego kontynentu",
x = "Kontynent", y = "Średnie PKB per capita") +
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5, face = "bold"))
ggplot(dane, aes(continent, lifeExp, fill=continent))+
geom_boxplot()+
labs(x='Kontynenty', y='długość życia', fill='kontynenty', title="Rozkład Długości Życia na Różnych Kontynentach" )+
theme(legend.position = 'bottom')+
theme(plot.title = element_text(hjust = 0.5, face = "bold"))
plot(dane_włochy$year, dane_włochy$lifeExp, type ='l', col='#FFB6C1', main='Zmiana średniej długości życia w wybranych krajach', lwd=3, xlab='lata 1952-2007', ylab='Długość życia')
lines(dane_finlandia$year, dane_finlandia$lifeExp, col='#ADD8E6', lwd=3)
lines(dane_grecja$year, dane_grecja$lifeExp, type ='l', col='#98FB98', lwd=3)
lines(dane_lesotho$year, dane_lesotho$lifeExp, type ='l', col='#FFD700', lwd=3)
lines(dane_argentyna$year, dane_argentyna$lifeExp, type ='l', col='#DDA0DD', lwd=3)
lines(dane_niemcy$year, dane_niemcy$lifeExp, type ='l', col='grey', lwd=3)
legend("topleft", legend=c("Włochy","Finlandia", "Grecja", "Lesotho", "Argentyna","Niemcy"),
col=c("#FFB6C1", "#ADD8E6", "#98FB98", "#FFD700", "#DDA0DD","grey"), lty=1, lwd=3)
rok_do_analizy <- 2007
dane_rok <- subset(dane, year == rok_do_analizy)
ggplot(dane_rok, aes(x = lifeExp)) +
geom_histogram(binwidth = 2, fill = "skyblue", color = "black", alpha = 0.7) +
labs(title = paste("Rozkład długości życia w roku", rok_do_analizy),
x = "Długość życia",
y = "Liczba krajów") +
theme_minimal() +
theme(plot.title = element_text(hjust = 0.5, face = "bold"))
library(dplyr)
##
## Dołączanie pakietu: 'dplyr'
## Następujące obiekty zostały zakryte z 'package:stats':
##
## filter, lag
## Następujące obiekty zostały zakryte z 'package:base':
##
## intersect, setdiff, setequal, union
populacja_kontynenty_2007_procent <- gapminder %>%
filter(year == 2007) %>%
group_by(continent) %>%
summarise(total_pop = sum(pop)) %>%
mutate(procent_pop = total_pop / sum(total_pop) * 100)
ggplot(populacja_kontynenty_2007_procent, aes(x = "", y = procent_pop, fill = continent)) +
geom_bar(stat = "identity", width = 1) +
coord_polar("y") +
labs(title = "Udział procentowy populacji kontynentów w roku 2007",
fill = "Kontynent", y ='') +
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5, face = "bold"))
ggplot(gapminder, aes(x = gdpPercap, y = lifeExp, color = continent)) +
geom_point(alpha = 0.7) +
labs(title = "Związek między PKB per capita a długością życia",
x = "PKB per capita",
y = "Długość życia",
color = "Kontynent") +
theme_minimal()+
theme(plot.title = element_text(hjust = 0.5, face = "bold"))
Sprawdźmy kierunek i siłę zależności korelacyjnej pomiędzy PKB per capita w wybranych krajach, a oczekiwaną długością życia.
korelacja1=cor(dane_włochy$gdpPercap,dane_włochy$lifeExp)
korelacja1
## [1] 0.98976
korelacja2=cor(dane_finlandia$gdpPercap,dane_finlandia$lifeExp)
korelacja2
## [1] 0.9816066
korelacja3=cor(dane_niemcy$gdpPercap,dane_niemcy$lifeExp)
korelacja3
## [1] 0.9861578
korelacja4=cor(dane_grecja$gdpPercap,dane_grecja$lifeExp)
korelacja4
## [1] 0.9623481
We wszystkich przypadkach występuje silna dodatnia liniowa zależność korelacyjna, wraz ze wzrostem wartości PKB per capita w wybranych krajach (Włochy, Finlandia, Niemcy, Grecja) przeciętnie rośnie długość życia.
Przedstawmy korelację liniową między PKB per capita a długością życia w wyżej podanych krajach na wykresie. Dla każdego kraju została dopasowana linia regresji (model liniowej regresji) między PKB per capita a długością życia.
m1=lm(dane_włochy$lifeExp~dane_włochy$gdpPercap)
m2=lm(dane_finlandia$lifeExp~dane_finlandia$gdpPercap)
m3=lm(dane_niemcy$lifeExp~dane_niemcy$gdpPercap)
m4=lm(dane_grecja$lifeExp~dane_grecja$gdpPercap)
plot(dane_włochy$lifeExp~dane_włochy$gdpPercap, pch=3,col='red', xlab='PKB per capita 1952-2007', ylab='długość życia', main='Korelacjia liniowa między PKB per capita, a długością życia')
abline(m1, col="red", lwd=3, pch=3)
points(dane_finlandia$lifeExp~dane_finlandia$gdpPercap, col='blue')
abline(m2, col='blue', lwd=3)
points(dane_niemcy$lifeExp~dane_niemcy$gdpPercap, pch=8, col='green')
abline(m3, col='green', lwd=3)
points(dane_grecja$lifeExp~dane_grecja$gdpPercap, pch=12, col='purple')
abline(m4, col='purple', lwd=3)
legend("topleft", legend=c("Włochy","Finlandia", "Niemcy","Grecja"),
col=c('red','blue','green','purple'),pch=c(3,1,8,12))
Na podstawie danych dotyczących Włoch sprawdźmy wartości odchyleń standardowych i współczynników zmienności w latach 1952-2007 dla poszczególnych danych.
S2=var(dane_włochy$lifeExp)*(length(dane_włochy$lifeExp)-1)/length(dane_włochy$lifeExp)
S2
## [1] 21.8163
S=sqrt(S2)
S
## [1] 4.670792
V=(S/mean(dane_włochy$lifeExp))*100
V
## [1] 6.310702
Przeciętna długość życia we Włoszech w latach 1952-2007 odchylała się od średniej przeciętnie o 4,7 lat. Współczynnik zmienności wynosi 6,31%
S2=var(dane_włochy$pop)*(length(dane_włochy$pop)-1)/length(dane_włochy$pop)
S2
## [1] 1.188932e+13
S=sqrt(S2)
S
## [1] 3448089
V=(S/mean(dane_włochy$pop))*100
V
## [1] 6.322481
Wartości populacji we Włoszech w latach 1952-2007 odchylają się od ich wartości średniej przeciętnie o 3448089. Współczynnik zmienności wynosi 6.32%
S2=var(dane_włochy$gdpPercap)*(length(dane_włochy$gdpPercap)-1)/length(dane_włochy$gdpPercap)
S2
## [1] 62746920
S=sqrt(S2)
S
## [1] 7921.295
mean(dane_włochy$gdpPercap)
## [1] 16245.21
V=(S/mean(dane_włochy$gdpPercap))*100
V
## [1] 48.76081
Wartości PKB per capita dla Włoch w latach 1952-2007 odchylają się od ich wartości średniej przeciętnie o 7921.3 USD. Współczynnik zmienności wynosi 48.76%
Policzmy średnią długość życia dla każdego kraju:
srednia_dlugosc_zycia <- tapply(gapminder$lifeExp, gapminder$country, mean, na.rm = TRUE)
srednia_dlugosc_zycia
## Afghanistan Albania Algeria
## 37.47883 68.43292 59.03017
## Angola Argentina Australia
## 37.88350 69.06042 74.66292
## Austria Bahrain Bangladesh
## 73.10325 65.60567 49.83408
## Belgium Benin Bolivia
## 73.64175 48.77992 52.50458
## Bosnia and Herzegovina Botswana Brazil
## 67.70783 54.59750 62.23950
## Bulgaria Burkina Faso Burundi
## 69.74375 44.69400 44.81733
## Cambodia Cameroon Canada
## 47.90275 48.12850 74.90275
## Central African Republic Chad Chile
## 43.86692 46.77358 67.43092
## China Colombia Comoros
## 61.78514 63.89775 52.38175
## Congo, Dem. Rep. Congo, Rep. Costa Rica
## 44.54375 52.50192 70.18142
## Cote d'Ivoire Croatia Cuba
## 48.43617 70.05592 71.04508
## Czech Republic Denmark Djibouti
## 71.51050 74.37017 46.38075
## Dominican Republic Ecuador Egypt
## 61.55450 62.81683 56.24300
## El Salvador Equatorial Guinea Eritrea
## 59.63333 42.96000 45.99925
## Ethiopia Finland France
## 44.47575 72.99192 74.34892
## Gabon Gambia Germany
## 51.22050 44.40058 73.44442
## Ghana Greece Guatemala
## 52.34067 73.73317 56.72942
## Guinea Guinea-Bissau Haiti
## 43.23983 39.21025 50.16525
## Honduras Hong Kong, China Hungary
## 57.92083 73.49283 69.39317
## Iceland India Indonesia
## 76.51142 53.16608 54.33575
## Iran Iraq Ireland
## 58.63658 56.58175 73.01725
## Israel Italy Jamaica
## 73.64583 74.01383 68.74933
## Japan Jordan Kenya
## 74.82692 59.78642 52.68100
## Korea, Dem. Rep. Korea, Rep. Kuwait
## 63.60733 65.00100 68.92233
## Lebanon Lesotho Liberia
## 65.86567 50.00708 42.47625
## Libya Madagascar Malawi
## 59.30417 47.77058 43.35158
## Malaysia Mali Mauritania
## 64.27958 43.41350 52.30208
## Mauritius Mexico Mongolia
## 64.95325 65.40883 55.89033
## Montenegro Morocco Mozambique
## 70.29917 57.60883 40.37950
## Myanmar Namibia Nepal
## 53.32167 53.49133 48.98633
## Netherlands New Zealand Nicaragua
## 75.64850 73.98950 58.34942
## Niger Nigeria Norway
## 44.55867 43.58133 75.84300
## Oman Pakistan Panama
## 58.44267 54.88225 67.80175
## Paraguay Peru Philippines
## 66.80908 58.85933 60.96725
## Poland Portugal Puerto Rico
## 70.17692 70.41983 72.73933
## Reunion Romania Rwanda
## 66.64425 68.29067 41.48158
## Sao Tome and Principe Saudi Arabia Senegal
## 57.89633 58.67875 50.62592
## Serbia Sierra Leone Singapore
## 68.55100 36.76917 71.22025
## Slovak Republic Slovenia Somalia
## 70.69608 71.60075 40.98867
## South Africa Spain Sri Lanka
## 53.99317 74.20342 66.52608
## Sudan Swaziland Sweden
## 48.40050 49.00242 76.17700
## Switzerland Syria Taiwan
## 75.56508 61.34617 70.33667
## Tanzania Thailand Togo
## 47.91233 62.20025 51.49875
## Trinidad and Tobago Tunisia Turkey
## 66.82800 60.72100 59.69642
## Uganda United Kingdom United States
## 47.61883 73.92258 73.47850
## Uruguay Venezuela Vietnam
## 70.78158 66.58067 57.47950
## West Bank and Gaza Yemen, Rep. Zambia
## 60.32867 46.78042 45.99633
## Zimbabwe
## 52.66317
Średnie PKB per capita dla kontynentów w latach 1952-2007:
srednie_pkb_kontynenty <- aggregate(gapminder$gdpPercap, by = list(gapminder$continent, gapminder$year), mean, na.rm = TRUE)
srednie_pkb_kontynenty
## Group.1 Group.2 x
## 1 Africa 1952 1252.572
## 2 Americas 1952 4079.063
## 3 Asia 1952 5195.484
## 4 Europe 1952 5661.057
## 5 Oceania 1952 10298.086
## 6 Africa 1957 1385.236
## 7 Americas 1957 4616.044
## 8 Asia 1957 5787.733
## 9 Europe 1957 6963.013
## 10 Oceania 1957 11598.522
## 11 Africa 1962 1598.079
## 12 Americas 1962 4901.542
## 13 Asia 1962 5729.370
## 14 Europe 1962 8365.487
## 15 Oceania 1962 12696.452
## 16 Africa 1967 2050.364
## 17 Americas 1967 5668.253
## 18 Asia 1967 5971.173
## 19 Europe 1967 10143.824
## 20 Oceania 1967 14495.022
## 21 Africa 1972 2339.616
## 22 Americas 1972 6491.334
## 23 Asia 1972 8187.469
## 24 Europe 1972 12479.575
## 25 Oceania 1972 16417.333
## 26 Africa 1977 2585.939
## 27 Americas 1977 7352.007
## 28 Asia 1977 7791.314
## 29 Europe 1977 14283.979
## 30 Oceania 1977 17283.958
## 31 Africa 1982 2481.593
## 32 Americas 1982 7506.737
## 33 Asia 1982 7434.135
## 34 Europe 1982 15617.897
## 35 Oceania 1982 18554.710
## 36 Africa 1987 2282.669
## 37 Americas 1987 7793.400
## 38 Asia 1987 7608.227
## 39 Europe 1987 17214.311
## 40 Oceania 1987 20448.040
## 41 Africa 1992 2281.810
## 42 Americas 1992 8044.934
## 43 Asia 1992 8639.690
## 44 Europe 1992 17061.568
## 45 Oceania 1992 20894.046
## 46 Africa 1997 2378.760
## 47 Americas 1997 8889.301
## 48 Asia 1997 9834.093
## 49 Europe 1997 19076.782
## 50 Oceania 1997 24024.175
## 51 Africa 2002 2599.385
## 52 Americas 2002 9287.677
## 53 Asia 2002 10174.090
## 54 Europe 2002 21711.732
## 55 Oceania 2002 26938.778
## 56 Africa 2007 3089.033
## 57 Americas 2007 11003.032
## 58 Asia 2007 12473.027
## 59 Europe 2007 25054.482
## 60 Oceania 2007 29810.188
Liczba krajów ze zbioru na kontynent:
liczba_krajow_na_kontynent <- tapply(gapminder$country, gapminder$continent, function(x) length(unique(x)))
liczba_krajow_na_kontynent
## Africa Americas Asia Europe Oceania
## 52 25 33 30 2
Średnia długość życia dla wszystkich krajów w roku 1952 i 2007:
rok_do_analizy1=1952
rok_do_analizy <- 2007
rozklad_dlugosci_zycia1 <- gapminder$lifeExp[gapminder$year == rok_do_analizy1]
mean(rozklad_dlugosci_zycia1)
## [1] 49.05762
rozklad_dlugosci_zycia <- gapminder$lifeExp[gapminder$year == rok_do_analizy]
mean(rozklad_dlugosci_zycia)
## [1] 67.00742