Ludzie pragną czasami się rozstawać, żeby móc tęsknić, czekać i cieszyć się z powrotem.
Zanim pracÄ™ tÄ™ ukoÅ„czono dziesięć lat później, posiadane informacje byÅ‚y już w zasadzie zbyt przestarzaÅ‚e, aby można je byÅ‚o wykorzystać dla celów polityki podatkowej czy ocenić na ich podstawie preferencje polityczne. StaÅ‚o siÄ™ jasne, że UrzÄ…d Statystyczny musi opracować nowe techniki, aby dane dotyczÄ…ce populacji Amerykanów byÅ‚y szybciej dostÄ™pne. Herman Hollerith, pracownik UrzÄ™du, skonstruowaÅ‚ elektrycznÄ… maszynÄ™ liczÄ…cÄ…, która w 1890 roku — w czasie jedenastego spisu ludnoÅ›ci — umożliwiÅ‚a opracowanie i stabelaryzowanie danych w ciÄ…gu dwóch i pół roku. UrzÄ…dzenie Holleritha „rejestrowaÅ‚o dane dziÄ™ki wykorzystaniu prÄ…du elektrycznego, który przeÅ‚Ä…czaÅ‚ proste, podobne do zegara urzÄ…dzenie liczÄ…ce. Kiedy prÄ…d przepÅ‚ywaÅ‚ przez otwór w kartoniku nie przewodzÄ…cym prÄ…du, elektromagnes aktywowaÅ‚ licznik impulsów"'.
Teraz, kiedy Urząd Statystyczny przygotowuje się do dwudziestego drugiego spisu ludności, który ma być przeprowadzony w 2000 roku, elektryczna maszyna licząca Holleritha wydaje się reliktem przeszłości. W roku 1890 urządzenie Holleritha mogło na przykład przetworzyć od 10 000 do 20 000 kart dziennie, podczas gdy aparatura komputerowa, którą dzisiaj dysponuje Urząd Statystyczny, może przetworzyć około miliona danych w ciągu minuty.
Historia ta pokazuje, jak bardzo — w porównaniu ze spisem z 1890 roku — zostaÅ‚y udoskonalone metody opracowywania i analizowania danych. W tym rozdziale przedstawimy powszechnie stosowane współczesne metody wstÄ™pnego opracowywania i kodowania danych. Omówimy metody kodowania dedukcyjnego — gdy zasady kodowania sÄ… wyprowadzane z teorii — oraz indukcyjnego — gdy źródÅ‚em budowanych kategorii sÄ… dane — a także przedstawimy zasady kodowania oraz zasady tworzenia zeszytów kodowych. Przeanalizujemy również problem rzetelnoÅ›ci kodowania i wskażemy, za pomocÄ… jakich metod można tÄ™ rzetelność zwiÄ™kszyć. Na koniec opiszemy różne sposoby kodowania oraz omówimy wykorzystanie komputerów w procesie przechowywania, przetwarzania i analizowania zbiorów danych.
Dane wykorzystywane współcześnie są prawie zawsze kodowane, przechowywane, wyszukiwane i analizowane za pomocą systemów komputerowych. Bez względu na to, czy korzysta się z komputerów osobistych, minikomputerów czy komputerów profesjonalnych, logika zbierania i opracowywania danych jest podobna. W rozdziale tym przedstawimy też najczęściej spotykane metody przetwarzania danych w procesie kodowania i tworzenia zeszytów kodowych. Przyporządkowanie kodów liczbowych zebranym danym zwiększa możliwości wykorzystania komputerów w procesie ich wyszukiwania i analizowania.
1 George E. Biles, Alfred A. Bolton, BernadettÄ™ DiRe (1989), Herman Hollerith: Inventor, Manager, Entrepreneur — A Centennial Remembrance. „The Journal of Management", 15, s. 603-615.
351
¦ Schematy kodowania
Jak przekonaliśmy się w rozdziale 6, pomiar polega na tworzeniu zasad przyporządkowywania liczb obserwacjom. Przyporządkowanie może być całkowicie arbitralne (jak w przypadku zmiennych nominalnych), czy też może odzwierciedlać uporządkowanie danych porządkowych lub interwałowych. Liczba przypisana obserwacji nazywana jest kodem. Wszystkim przypadkom lub jednostkom spełniającym te same warunki przypisuje się te same kody. Na przykład, jeżeli kod „1" oznacza „kobietę", to kodując dane dla zmiennej płci, należy przyporządkować 1 wszystkim kobietom. Znaczenie każdego kodu powinno zostać objaśnione w zeszycie kodowym, który należy dołączyć do każdego zbioru danych. W tej części omówimy, w jaki sposób badacze przypisują kody zgromadzonym danym.
Kody mogą być również wykorzystywane do grupowania danych dotyczących określonego pojęcia. Przypuśćmy, że badacz zebrał informacje dotyczące zawodów kilkuset osób badanych. Poniżej pokazujemy przykład listy zarejestrowanych zawodów:
Prawnik
Fryzjer
Stolarz
Makler
Operator dźwigu
Weterynarz
Pielęgniarka
Sezonowy pracownik rolny
Pracownik szczebla kierowniczego
Inżynier
Elektryk
Pracownik agencji reklamowej
Zanim dane te będzie można przeanalizować, należy poszczególne zawody pogrupować w kategorie. Poniżej przedstawiamy jeden z możliwych sposobów klasyfikacji zawodów:
1. Wolne zawody i osoby zatrudnione na szczeblu kierowniczym: prawnik, weterynarz, pracownik szczebla kierowniczego, inżynier.
2. Pracownicy techniczni i sprzedawcy: pracownik agencji reklamowej, makler.
3. Pracownicy sektora usług i robotnicy wykwalifikowani: fryzjer, stolarz, operator dźwigu, pielęgniarka, elektryk.
4. Robotnicy niewykwalifikowani: sezonowy pracownik rolny.
Ten system kategoryzowania zawodów uwzględnia poziom dochodów, prestiż oraz wykształcenie i pozwala badaczom na posługiwanie się w analizach czterema dobrze zdefiniowanymi kategoriami zawodów, zamiast kilkunastoma konkretnymi zawodami. Systemy kategorii, takie jak wyżej przedstawiony, wykorzystywane w procesie klasyfikowania odpowiedzi czy zachowań odnoszących się do pojedynczej pozycji kwestionariusza lub pojedynczej zmiennej, nazywane są schematami kodowania. Poniżej omawiamy zasady konstruowania takich schematów.
Reguły kodowania