Ludzie pragną czasami się rozstawać, żeby móc tęsknić, czekać i cieszyć się z powrotem.
Wystarczy przypisać każdej kategorii właściwą wagę, mnożąc ją przez częstość, i zastosować następujące równanie:
N
(15.6)
gdzie EfX — suma wszystkich kategorii pomnożonych przez ich czÄ™stość.
W tabeli 15.12 przedstawiono dane dotyczące liczby lat nauki dla 34 osób. Średnią liczbę lat nauki możemy obliczyć, stosując równanie (15.6). Aby obliczyć wartość LfX (kolumna 3), pomnożyliśmy wartość każdej kategorii (kolumna 1) przez jej częstość (kolumna 2) i zsumowaliśmy wszystkie iloczyny. Średnia liczba lat nauki wynosi zatem:
- 278
X=----=8,18.
34
383
Równanie (15.6) można również stosować dla danych pogrupowanych. Wówczas za środek przedziału przyjmujemy wartość x. Na przykład, obliczając średnią wielkość rodziny dla danych przedstawionych w tabeli 15.13, do obliczeń wykorzystujemy jedynie środek każdego przedziału:
- 51
X= — = 2,83. 18
Tabela 15.12. Rozkład lat nauki
Liczba lat nauki / &
(1) (2) (3)
2 3 6
3 2 6
6 5 30
8 10 80
10 8 80
12 4 48
14 2 28
Ogółem W=34 2!/2r*278
Tabela 15.13. Wielkość rodziny dla wybranej grupy respondentów
Wielkość rodziny
Środek przedziału
/
fX
0-2 1 10 10
3-5 4 5 20
6-8 7 3 21
Ogółem /V=18 ZfX=5i
W odróżnieniu od wartości modalnej i mediany, obliczając średnią arytmetyczną, uwzględniamy wszystkie wartości rozkładu, co sprawia, że jest ona szczególnie wrażliwa na wartości skrajne. Na przykład, jeżeli jedna osoba na dziesięć zarabia 60000$ rocznie, a pozostałe osoby zarabiają po 5000$, to średnie zarobki w tej grupie wyniosą 10500$. Wartość ta nie jest jednak dobrą reprezentacją tego rozkładu. Średnia arytmetyczna jako miara tendencji centralnej może zatem wprowadzać w błąd, gdy niektóre z wartości w zbiorze danych są bardzo niskie lub bardzo wysokie.
Przykład 15.1 ilustruje procedurę obliczania trzech miar tendencji centralnej.
384
Przykład 15.1
Obliczanie trzech miar tendencji centralnej
Wartość modalna = kategoria, do której wpada najwięcej przypadków = 9
Każda * reprezentuje jedną obserwację Ogólna liczba przypadków = 39
6 * 8 * * * 9 * * * * 5
4 * * * *
* * * * * 3
2 * * * * * *
* * * * » * * 1 1
* * * * * * * * *
5 6 7 8 9 10 11 12 13
wartość zmiennej
Mediana = punkt środkowy = (N + l)/2 = (39+ l)/2 = 20 5 5 666677777788888888999999999 10 10 10 10 10 11 11 11 12 13
T Punkt środkowy = dwudziesty przypadek = 8 Średnia arytmetyczna =
5x2= 10
6 x 4 = 24
7 x 6 = 42
8 x 8 = 64 9x9 = 81
10 x 5 = 50
11 x3 = 33
12 x 1 = 12 13x1 = 13
329 / 39 = 8,44 (ogółem) (przypadki) (średnia)
Porównanie mody, mediany i średniej
Wszystkie trzy miary tendencji centralnej można wykorzystywać do opisywania rozkÅ‚adów jećmozmiermowych. Każda z ruch ma jednak swoje wÅ‚aÅ›ciwoÅ›ci, które okreÅ›lajÄ… i ograniczajÄ… ich stosowanie. Wartość modalna wskazuje na ten punkt, który ma najwiÄ™kszÄ… gÄ™stość, mediana jest Å›rodkowym punktem rozkÅ‚adu, a Å›rednia arytmetyczna to przeciÄ™tna wartość wszystkich obserwacji. Dlatego miar tych nie można stosować automatycznie. SkÄ…d zatem badacz wie, kiedy zastosować danÄ… miarÄ™ tendencji centralnej? Na to pytanie nie ma prostej odpowiedzi — zależy ona
385
od celu badania. I tak na przykład, jeżeli badacz chciałby poznać przeciętny pozi dochodów całej grupy, aby określić, ile każda z osób zarabiałaby, gdyby wszys mieli jednakowe dochody, to średnia arytmetyczna byłaby tu najbardziej odpowiednia, ponieważ dzięki niej zostałyby uwzględnione zarówno najniższe, jak i najniższe dochody. Jeżeli natomiast urzędnik chciałby się dowiedzieć, która z osób z tej grupy ma prawo do pomocy społecznej, to najlepszą miarą będzie wartość modalna. ponieważ pokaże nam, jakie dochody są najbardziej typowe, a na miarę tę nie wpłyną dochody skrajne.
Badacz powinien również wziąć pod uwagę poziom pomiaru analizowanej zmiennej, podejmując decyzję o wyborze miary tendencji centralnej. Wartość modalna można stosować dla wszystkich poziomów pomiaru, lecz dla zmiennych nominalnych, takich jak przynależność partyjna, jest to jedyna poprawna miara. Medianę można wykorzystać dla zmiennych porządkowych takich, jak postawy polityczne, lecz można za jej pomocą opisywać również dane uzyskane na wyższym poziomie pomiaru. Średnią arytmetyczną możemy natomiast zastosować w przypadku danych interwałowych i ilorazowych, takich jak dochody czy wiek.
Trzy miary tendencji centralnej
¦ Wartość modalna. Jest to kategoria, do której wpada najwięcej przypadków, lub obserwacja pojawiająca się najczęściej w zbiorze danych.
¦ Mediana. Jest to obserwacja, kategoria lub przedział, który dzieli rozkład na dwie równe części. Aby znaleźć medianę dla nieparzystej liczby danych nie pogrupowanych, należy uporządkować wszystkie obserwacje w porządku rosnącym i znaleźć wynik środkowy. W wypadku parzystej liczby obserwacji mediana znajduje się między dwoma środkowymi wynikami. Aby znaleźć medianę dla danych pogrupowanych, należy wykorzystać równanie (15.1). Mediana jest jednym z przykładów grupy miar nazywanych centylami. Równanie (15.1) można tak przekształcić, aby na jego podstawie obliczać dowolny centyl. Równania (15.2), (15.3) i (15.4) są przykładami takich przekształceń.