Menu główne:
Analiza danych statystycznych pozwala na zwięzłe przedstawienie wyników badania zodpowiednich charakterystyk liczbowych. Obejmuje ona m.in. analizę poziomu średniego wartości zmiennej, zróżnicowania (zmienności) oraz asymetrii (skośności) rozkładu.
####################################################################
############## Analiza struktury - wybrane zagadnienia #############
####################################################################
### Wybrane wskaźniki klasyczne (szereg wyliczający)
klasyczne=function(x) { # x to ciag wartosci badanej zmiennej
n=length(x) # liczebność proby
xsr=mean(x) # średnia arytmetyczna
S2=sum((x-xsr)^2)/n # wariancja
S=sqrt(S2) # odchylenie standardowe
V=S/xsr # klasyczny współczynnik zmienności
M3=sum((x-xsr)^3)/n # trzeci moment centralny
Lambda3=M3/S^3 # trzeci moment centralny zestandaryzowany
#wyniki prezentujemy jako listę:
list("średnia arytmetyczna"=xsr, "wariancja"=S2, "odchylenie standardowe"=S, "klasyczny współczynnik zmienności"=V, "trzeci moment centralny zestandaryzowany"=Lambda3)
}
# przykładowe wywołania funkcji
# przykład 1
klasyczne(c(1:10)) # dla kolejnych liczb naturalnych od 1 do 10
# wyniki będą następujące:
# $`średnia arytmetyczna`
# [1] 5.5
# $wariancja
# [1] 8.25
# $`odchylenie standardowe`
# [1] 2.872281
# $`klasyczny współczynnik zmienności`
# [1] 0.522233
# $`trzeci moment centralny zestandaryzowany`
# [1] 0
# przykład 2
z=c(2,7,4,6,21)
klasyczne(z)
# przykład 3
#dane dotyczące USA:
state.x77
#więcej informacji na temat danych:
?state.x77
#wyniki dla pierwszej kolumny danych (tj. liczby mieszkańców)
klasyczne(state.x77[,1])
#wyniki dla drugiej kolumny danych (tj. dochodów per capita w roku 1974)
klasyczne(state.x77[,2])
# wyniki są następujące:
# $`średnia arytmetyczna`
# [1] 4435.8
# $wariancja
# [1] 370021.8
# $`odchylenie standardowe`
# [1] 608.2942
# $`klasyczny współczynnik zmienności`
# [1] 0.1371329
# $`trzeci moment centralny zestandaryzowany`
# [1] 0.2109882
####################################################################
### Wybrane wskaźniki pozycyjne (szereg wyliczający)
## wstęp
# kwantyle - opis:
?quantile
# przykład
y=c(1,3,6,7,17,100)
quantile(y)
# wyniki będą następujące (minimum, kwartyle, maksimum):
# 0% 25% 50% 75% 100%
# 1.00 3.75 6.50 14.50 100.00
# podobnie:
summary(y)
# kwartyle:
quantile(y)[2] # drugi element listy tj. pierwszy kwartyl
quantile(y)[3] # trzeci element listy tj. drugi kwartyl (mediana)
quantile(y)[4] # czwarty element listy tj. trzeci kwartyl
## funkcja
pozycyjne=function(x) { # x to ciag wartosci badanej zmiennej
Q1=as.numeric(quantile(x)[2]) # drugi element listy tj. pierwszy kwartyl
Q2=as.numeric(quantile(x)[3]) # trzeci element listy tj. drugi kwartyl (mediana)
Q3=as.numeric(quantile(x)[4]) # czwarty element listy tj. trzeci kwartyl
Me=Q2
R=max(x)-min(x) # rozstęp
RQ=Q3-Q1 # rozstęp ćwiartkowy
Q=RQ/2 # odchylenie ćwiartkowe
VQ=Q/Me # pozycyjny współczynnik zmienności
AQ=((Q3-Q2)-(Q2-Q1))/(Q3-Q1) # pozycyjny współczynnik asymetrii
#wyniki prezentujemy jako listę:
list("mediana"=Me, "rozstęp"=R, "rozstęp ćwiartkowy"=RQ, "odchylenie ćwiartkowe"=Q,"pozycyjny współczynnik zmienności"=VQ,"pozycyjny współczynnik asymetrii"=AQ)
}
# przykładowe wywołania funkcji
# przykład 1
pozycyjne(c(1:10)) # dla kolejnych liczb naturalnych od 1 do 10
# wyniki będą następujące:
# $mediana
# [1] 5.5
# $rozstęp
# [1] 9
# $`rozstęp ćwiartkowy`
# [1] 4.5
# $`odchylenie ćwiartkowe`
# [1] 2.25
# $`pozycyjny współczynnik zmienności`
# [1] 0.4090909
# $`pozycyjny współczynnik asymetrii`
# [1] 0
# przykład 2
z=c(2,7,4,6,21)
pozycyjne(z)
# przykład 3
#dane dotyczące łączenia się z internetem przez pewien
# serwer (w ciągu kolejnych minut):
WWWusage
# więcej informacji na temat danych:
?WWWusage
# wyniki:
pozycyjne(WWWusage)
# wyniki są następujące:
# $mediana
# [1] 138.5
# $rozstęp
# [1] 145
# $`rozstęp ćwiartkowy`
# [1] 68.5
# $`odchylenie ćwiartkowe`
# [1] 34.25
# $`pozycyjny współczynnik zmienności`
# [1] 0.2472924
# $`pozycyjny współczynnik asymetrii`
# [1] -0.1532847