Dane

Przejdź do treści
Lp
Zbiór
(źródło)
Pliki
Tytuł i opis
Obserwacje / zmienne
Typ zmiennych
Uwagi
1
Cars93
Dane dotyczą samochodów sprzedawanych na rynku amerykańskim w roku 1993.
Manufacturer, Model,
Type, Min.Price, Price, …
93 / 27
numeryczne, nominalne, binarne
Analiza struktury, zależności, testy
2
AirPassengersPasażerowie linii lotniczych w latach 1949 - 1960. Dane miesięczne.
144 / 1
numeryczne
Szereg czasowy.
Wahania sezonowe.
3
Wzrost
 Husband – wzrost męża
 Wife – wzrost żony
96/2
 numeryczne
Korelacja, regresja
4
carsPrędkość samochodu i odległość do zatrzymania.
speed
dist
50 / 2
numeryczne
Korelacja, regresja.
5
kredytyInformacje o kredytobiorcach.
płeć
wiek
historia kredytowa
cel
zabezpieczenie, ...
968 / 7
numeryczna, porządkowe, nominalne
Tabele wielodzielcze.
6
mtcarsCharakterystyki samochodów.
mpg - l. mil na galonie paliwa
cyl - liczba cylindrów
wt - waga
gear - liczba biegów, ...
32 / 11
numeryczne, porządkowe, binarne
Macierz współczynników korelacji.
Regresja wieloraka.
7
 
 csv
Ludność Belgii z roku 2004
i 2003 oraz dane finansowe dotyczące dochodów gmin w 2001 roku
589/17
 numeryczna, nominalne

8

Dane techniczne samochodów Toyota Corolla
1436 / 37
Numeryczne, binarne
Analiza struktury, zależności,
estymacja, testy
9
AnimalsŚrednia masa ciała i mózgu dla 28 gatunków zwierząt
28/2
numeryczne
Korelacja, regresja
10
Przeciętne płace w Chinach w podziale na regiony i sektory przemysłu
231/3
numeryczne,
nominalne
Analiza struktury, zależności,
estymacja, testy
11
Diag1sav
Dane dotyczące aktywności fizycznej Polaków w 2013 roku
 ROK_URODZ_ALL, GP60, GP61,…,
IMIE_ALL, PLEC_ALL,
84478 / 16
 nominalne, binarne, numeryczne
Analiza struktury, zależności, testy
12
Diag2sav
Dane dotyczące oceny stopnia zadowolenia z różnych aspektów życia Polaków w 2013 roku
status9_2013, …,
IMIE_ALL, PLEC_ALL,
ROK_URODZ_ALL, eduk4_2013,
84478 / 28
 nominalne, binarna, numeryczne, porządkowe
Analiza struktury, zależności, testy
13
Bezrobotni
Liczba bezrobotnych (w tys. osób)
 w województwach w Polsce w latach 2005 – 2017 (dane kwartalne)
51/16
numeryczne
Szereg czasowy
14
Podmioty gospodarcze
Liczba podmiotów gospodarczych nowo zarejestrowanych w rejestrze REGON
 w Polsce i z podziałem na województwa,
 w latach 2009-2016
8/17
numeryczne

15
Dochody powiatówDochody ogółem w powiatach w Polsce
w roku 2016 (w mln zł)
314/1
 
numeryczne

16
DJIDzienne kursy zamknięcia indeksu Dow Jones Industrial w 2017 roku
219 / 1  
numeryczne
Analiza dynamiki
17
Trees
Dane dotyczą pomiarów obwodu, wysokości i objętości 31 ściętych drzew.
Girth, Height, Volume.
31 / 3
numeryczne
Analiza struktury, zależności,
 estymacja, testy
18
Women
Dane dotyczą średniego wzrostu (w calach) i wagi (w funtach) amerykańskich kobiet w wieku 30-39 lat.
15 / 2
numeryczne.
Analiza struktury, zależności
19
Sleep
Dane o wpływie dwóch leków usypiających (wzrost/spadek liczby godzin snu w porównaniu do liczby godzin snu przed podaniem leku) dla 10 pacjentów.
ID. extra, group,
20 / 3
numeryczne
Testy
20
Rivers
Dane dotyczące długości (w milach) 141 "głównych" rzek w Ameryce Północnej.
141 / 1
numeryczna
Analiza struktury
21
Iris
Zestaw danych dotyczy kwiatów irysa. Zawiera pomiary (w centymetrach) o długości i szerokości działek kielicha i płatków dla 50 kwiatów z każdego z 3 gatunków: setosa, versicolor oraz virginica.
Species. Sepal.Length,
Sepal.Width, Petal.Length,
Petal.Width.
150 / 5
numeryczne, nominalna
Analiza struktury, zależności, testy
22
Post_op
Dane dotyczą pomiarów temperatury ciała wykonanych u pacjentów po operacjach
L-CORE, L-SURF, L-O2, L-BP, …
90 / 9
porządkowe, numeryczna, nominalne
Analiza zależności
23
Wzrost_P
Oryginalny zbiór danych utworzony przez Karla Pearsona opisujący zależność pomiędzy wzrostem syna i ojca.
1078 / 2
numeryczne
Analiza zależności
24
SkiJump2013
Wyniki skoków narciarskich z sezonu 2013/2014.
2130 / 16
 
Numeryczne, nominalne, porządkowe
Analiza struktury, zależności,
estymacja, testy
25
AirQuality
Zbiór danych zawiera godzinowe odczyty czujników badających jakość powietrza w obrębie pewnego włoskiego miasta (znacznie zanieczyszczony obszar).
9358/15
 
 
numeryczne
Brakujące dane oznaczone są wartością ”-200”.
 
 
Zmienne opisane w odrębnym pliku txt.
26
EnergyData
Zbiór danych opisujący zużycie energii, temperaturę i wilgotność powietrza w domu niskoenergetycznym (dane rejestrowane przez 4,5 miesiąca co 10 minut).
19735 /27
numeryczne
Zmienne opisane w odrębnym pliku txt.
27
WineQuality_White
Zbiór danych opisujący cechy fizykochemiczne białego wina „Vinho verde” pochodzącego z północnej Portugalii.
4898/12  
 
numeryczne
Zmienne opisane w odrębnym pliku txt.
28
Zbiór danych opisujący cechy fizykochemiczne czerwonego wina „Vinho verde” pochodzącego z północnej Portugalii.
1599/12
 
 
numeryczne
Zmienne opisane w odrębnym pliku txt.
29
Employees
Dane o zatrudnieniu
100 / 11
numeryczne, nominalne
Analiza struktury, zależności,
estymacja, testy
30
Employee DataDane o zatrudnieniu
474 / 9
numeryczne, nominalne
Analiza struktury, zależności,
estymacja, testy
31
Regresja liniowa 500

50 / 6
numeryczne

32
Modele przyczynowo-opisowe i f. trendu
xlsx
60 / 5
numeryczne


























Wróć do spisu treści