Otostutkimukset otettiin hitaasti käyttöön virallisissa tilastoissa
- Ensimmäiset osittaistutkimukset
- Otostutkimukset tulevat väestölaskennan korvikkeiksi
- Suomen julkinen sektori omaksuu otostutkimukset
- Helsinki etunenässä otostutkimusten käyttäjäksi
- Työvoimatutkimus oli Tilastokeskuksen ensimmäinen otostutkimus
- Kaikki kotitaloudet kulutustutkimuksen otokseen vuonna 1966
- Yksityiset tutkimuslaitokset tienraivaajina
Koko dokumentti sivutettuna
Kirjoittaja: Vesa Kuusela on kehittämispäällikkö Tilastokeskuksen Elinolot-yksikössä. Artikkeli on julkaistu Tilastokeskuksen Hyvinvointikatsauksessa 2/2009.
Lähes kaikissa maissa surveytutkimukset ovat vallanneet alaa saman kaavan mukaan. Edelläkävijöinä ovat olleet yksityiset tutkimuslaitokset, ja niiden jälkeen akateemiset tutkijat ovat ottaneet otosmenetelmän käyttöönsä. Julkinen sektori on yleensä omaksunut menetelmän viimeisenä. Suomenkin tilastovirasto teki ensimmäisen otostutkimuksen vasta vuonna 1958.
Sen jälkeen kun Current Population Surveyn (CPS) tuottamat tiedot otettiin virallisen tilaston osaksi Yhdysvalloissa, ovat otostutkimuksiin perustuvat tilastot vakiinnuttaneet paikkansa monien maiden virallisissa tilastoissa. CPS:n aloittaminen oli vedenjakaja, josta tämä kehitys varsinaisesti alkoi (ks. Kuusela 2009). Ensimmäisen onnistuneen galluptutkimuksen ja sitä seuranneen keskustelun on arvioitu lisänneen sekä suuren yleisön että tiedeyhteisön luottamusta otostutkimuksiin ja niiden uskottavuuteen (Hansen 1987).
Alun perin surveymenetelmä kehitettiin yhteiskunnallisia tutkimuksia varten täydentämään väestölaskennan tietoja. Vuosisata sitten otantatutkimusten soveltaminen väestötutkimuksiin ei kuitenkaan ollut yhtä helppoa kuin nykyisin infrastruktuurin heikkouden ja väestötietojen puutteiden vuoksi. Suurimmat käytännön ongelmat olivat otoksen poiminnassa ja tiedon keruun järjestämisessä.
Edustava otos on mahdollista poimia vain, jos väestörakenne on tunnettu ja väestöstä on saatavilla esimerkiksi edustava luettelo tai kartta. Ainoana mahdollisena tietojenkeruutapana pidettiin "laskijoiden" eli haastattelijoiden käyttöä. Tällaisen tiedonkeruun organisointi on työlästä ja vaatii paljon resursseja. Yksinkertaista satunnaisotantaa ei pidetty mahdollisena tiedonkeruun vaikeuden ja kustannusten vuoksi.
Ensimmäiset osittaistutkimukset
Alkuaikoja leimasi lisäksi epäily, että ihmispopulaatio on niin monimuotoinen ja vaikeasti hallittava, ettei siitä voi saada luotettavaa käsitystä osittaistutkimuksilla.1800-luvun puolivälin tienoilla Adolphe Quetelet pyrki osoittamaan, että lähes kaikki ihmisten ominaisuudet noudattavat väestötasolla normaalijakaumaa. Hänen kuluisin ideansa lienee niin sanottu keskiarvoihminen, l'homme moyen. Keskiarvoihminen oli ihanne, jonka kaltaisia kaikkien ihmisten teoriassa piti olla - poikkeamat keskiarvosta saattoi tulkita virheiksi.
Quetelet'n ajatusten innoittamana syntyivät ensimmäiset yhteiskunnalliset osittaistutkimukset, kun ranskalainen insinööri Frederic Le Play kehitti niin sanotun monografiamenetelmän. Sen ideana oli tutkia vain tyypillisiä keskiarvotapauksia, ja välttää ääritapauksia. Haastateltaviksi valittiin esimerkiksi tyypillisiä työläistalouksia. Tästä menetelmästä tuli hyvin suosittu 1800-luvun lopulla.
Veera Hjeltin tekemä Tutkimus ammattityöläisten toimeentuloehdoista Suomessa 1908-1909 oli ensimmäinen Suomessa tehty osittaistutkimus. Se perustui monografiamenetelmään, ja siinä tutkittiin tyypillisiä työläistalouksia, "normaaliperheitä". Jonkin verran muokattuna ja laajennettuna koskemaan "yhteiskunnan eri piirejä" tämä tutkimusmenetelmä säilyi Suomessa aina 1960-luvulle asti.
Otostutkimukset tulevat väestölaskennan korvikkeiksi
Ensimmäisenä nykymuotoisena otostutkimuksena pidetään Norjan tilastoviraston pääjohtajan Anders Kiaerin haastattelututkimusta 1890-luvun alussa. Tällä tutkimuksellaan Kiaer pyrki hankkimaan tietoja norjalaisten sosiaalisista oloista väestölaskentaa yksinkertaisemmalla ja halvemmalla menetelmällä. Kiaerin menetelmässä tutkimusnäyte pyrittiin muodostamaan väestön "pienoismalliksi". Tämä oli käänteentekevä innovaatio, ja edelleenkin edustavan otoksen ajatellaan olevan pienoismalli perusjoukosta.
Kiaer esitteli "edustavan menetelmänsä" Kansainvälisen tilastoinstituutin ISI:n kokouksessa vuonna 1895 (Kiaer 1895). Se sai osakseen voimakasta kritiikkiä sen ajan nimekkäimmiltä tilastotieteilijöiltä. Jyrkin arvostelu Kiaerin menetelmää kohtaan tuli yllättäen Norjasta: sen väitettiin antavan harhaanjohtavan kuvan Norjan väestöstä ja sen elinoloista. Kritiikki oli niin vakuuttavaa, että otostutkimukset hävisivät Norjasta kokonaan moneksi vuosikymmeneksi (Lie 2002).
Suomen julkinen sektori omaksuu otostutkimukset
Suomessa otanta- ja haastattelumenetelmien tuntemus kasvoi nopeasti 1940-luvun lopussa ja 1950-luvun alussa. Heikki Waris ja Pekka Kuusi tekivät niihin aikoihin ensimmäiset akateemiset otostutkimukset (ks. Kuusela 2008). Myös julkisella sektorilla menetelmä alkoi olla tunnettu, joskaan Tilastokeskuksessa sitä ei käytetty.
Luultavasti ensimmäinen viranomaisen tekemä otostutkimus oli verorasituskomitean vuonna 1950 toteuttama haastattelututkimus "fyysillisten henkilöiden verorasituksen" selville saamiseksi. Komitean raportissa on varsin seikkaperäinen ja asiantunteva kuvaus otosmenetelmistä. Raportissa käytettiin suomenkielisten termien puuttuessa vielä usein englantia, esimerkiksi otoksen sijasta käytettiin sanaa "sampling". Komitea kuuli asiantuntijoina muun muassa professori A. E. Tudeeria, yliaktuaari E. H. Laurilaa ja Tauno Hellevuota Suomen Gallupista.
Tämän tutkimuksen esikuvana oli monissa maissa tehty kulutustutkimus. Vaatimukseksi astetettiin, että "aineiston tulee mahdollisimman hyvin edustaa läpileikkausta kaikista väestön ja väestöryhmän perheistä". Kirjanpitomenetelmää ei pidetty riittävän nopeana ja luotettavana, ja siksi komitea päätyi käyttämään haastattelumenetelmää, josta oli saatu hyviä kokemuksia muun muassa Yhdysvalloissa, Kanadassa ja Ranskassa.
Suomessa ei ollut tilastoa perhetyypeistä, eikä meillä tiedetty perheitten tai perhetyyppien jakautumista tuloluokkiin. Sen selvittämiseksi komitea teki esitutkimuksen, koska "viime aikoina tapahtunut kehitys sampling-teorian alalla on näet johtanut menetelmiin, joissa tarvitaan etukäteen laadittuja luetteloita tutkimukseen joutuvista henkilöistä tai perheistä nimineen ja osoitteineen." Esitutkimuksessa käytettiin "stratifioitua randomsampling" -menetelmää. Esitutkimuksen aineistosta valittiin satunnaisesti noin tuhannen ruokakunnan "sampling" varsinaiseen kulutustutkimukseen.
Omien haastattelijoiden rekrytointi ja kouluttaminen arvioitiin liian kalliiksi ja hitaaksi. Siksi komitea päätyi käyttämään Suomen Gallupin haastattelijaverkostoa, joka oli siihen aikaan ainoa pysyvä organisaatio Suomessa.
Helsinki etunenässä otostutkimusten käyttäjäksi
Otostutkimukset sisällytettiin julkisiin tilastoihin ensimmäisten joukossa myös Helsingissä. Kettil Bruun teki 1950-luvun alussa Helsingin kaupungin toimeksiannosta kaksi otostutkimusta: ensimmäinen koski Helsingin nuorisoa (Bruun 1952) ja toinen vanhusväestöä (Bruun 1953). Bruunin tutkimukset ajoittuvat samalle ajanjaksolle kuin Heikki Wariksen ja Pekka Kuusen ensimmäiset tutkimukset (ks. Kuusela 2008). Myös Bruun näyttää olleen varsin hyvin perillä surveymetodologiasta ja sen ongelmista.
Nuorisotutkimuksen otannan Bruun pyrki tekemään "umpimähkäisesti", mutta tietoa nuorten kokonaismäärästä Helsingissä ei ollut saatavilla - otos oli poimittava kaksivaiheisesti väestökirjoista. Bruun teki myös katoanalyysin ("poisputoama" oli 9,7 %) ja totesi, että nuorimman ikäryhmän osalta tietoja voidaan pitää suurin piirtein edustavina, mutta vanhemmissa ikäryhmissä kato oli niin suurta, että se saattoi vaikuttaa tuloksiin.
Kettil Bruun analysoi seikkaperäisesti myös kerätyn aineiston luotettavuutta. Tutkimuksen suurimpia virhelähteitä olivat Bruunin mukaan haastattelijoiden kirjaamat epätarkat tai virheelliset vastaukset. (Haastattelijoina toimi 50 teoreettisesti haastattelutyöhön perehtynyttä ylioppilasta.) Haastattelijoiden piti toimittaa aineisto vähintään kahdessa erässä, jotta haastattelijoiden työ voitiin tarkistaa tiedon keruun kestäessä.
Lisäksi haastattelijoiden piti itse arvioida, miten luotettavana he pitivät haastattelua (täysin luotettavia haastatteluja oli 64,7 %). Lisäksi "kuvan saamiseksi arkaluonteisten kysymysten - - vastausten vilpittömyydestä" lomakkeella oli kysymys: "Äänestittekö viime vaaleissa?". Näitä vastauksia oli tarkoitus verrata äänestystietoihin, mutta vertailu osoittautui vaikeaksi ja epäluotettavaksi. Bruun kuitenkin toteaa, että "suurin piirtein lienee aineisto tyydyttävä."
Vanhustutkimuksen menetelmä oli suurin piirtein samanlainen kuin nuorisotutkimuksessakin, ja raportointikin noudatti samoja periaatteita (ks. Bruun 1953).
Työvoimatutkimus oli Tilastokeskuksen ensimmäinen otostutkimus
Tilastokeskuksen ensimmäinen moderni otostutkimus oli vuonna 1958 aloitettu Työvoimatutkimus, joka aluksi tehtiin postikyselynä (ks. Kuusela 2009). Tätä edelsi Lauri Heikinheimon tutkimus metsätyövoiman tutkimusmenetelmistä (Heikinheimo 1954). Tutkimus tehtiin Helsingin yliopistossa, mutta Tilastollisen päätoimiston väestölaskentaosasto ja sen kenttäorganisaatio osallistui näytteen poimintaan ja tiedon keruuseen. Asiantuntijoina tutkimukseen osallistuivat muun muassa professorit Heikki Waris ja Leo Törnqvist.
Ennen varsinaisen aineiston poimintaa Heikinheimo teki kolme esitutkimusta otanta- ja tiedonkeruumenetelmien vertailemiseksi. Varsinkin otantaa koskeva tutkimus oli perusteellinen; sen tärkein tavoite oli otoskoon määrittäminen ennalta määriteltyjen virhemarginaalien puitteissa. Heikinheimo totesi esitutkimusten osoittaneen, että Suomessa on otantatutkimuksia varten käyttökelpoinen luettelo, henkikirjat, joista otos voidaan poimia vaivattomammin kuin esimerkkimaissa Yhdysvalloissa ja Englannissa. Lisäksi hän totesi esitutkimusten osoittaneen, että osittamisella ei saavuteta mainittavaa hyötyä.
Tutkimuksen perusjoukkona olivat kaikki maalaiskunnissa asuneet työikäiset miehet, ja heistä poimittiin kuukauden 1. ja 15. päivinä syntyneet. Pitkän pohdinnan jälkeen Heikinheimo totesi, että käytännössä ei ole mitään syytä epäillä, ettei näin poimittua näytettä voisi pitää todennäköisyysotoksena.
Kaikki kotitaloudet kulutustutkimuksen otokseen vuonna 1966
Tilastokeskus teki ensimmäisen kulutustutkimuksen jo vuosisadan alussa, mutta vasta vuonna 1966 tehtiin ensimmäinen tutkimus, jonka otos edusti maan kaikkia kotitalouksia. Tätä aiemmat tutkimukset oli rajoitettu joihinkin erityisiin väestöryhmiin kuten palkansaajiin tai maaseutuväestöön. Modeenin (1952) mukaan satunnaisotantaa ei Suomessa sovellettu kulutustutkimuksessa käytännöllisten syiden takia, vaikka sitä monessa muussa maassa käytettiinkin ja siitä oli hyviä kokemuksia. Merkittävin käytännön syy oli ongelmat haastattelutyön organisoinnissa. Vuosien 1966 ja 1971 kulutustutkimusten tietojenkeruun hoitivat maatalous- ja kotitalousneuvojat (Marjomaa 2000).
Tilastokeskuksella ei ollut omaa pysyvää haastatteluorganisaatiota vielä 1970-luvun alussa, ja siksi tiedonkeruut oli hoidettava erilaisilla väliaikaisilla järjestelyillä. Esimerkiksi vuoden 1971 kotitaloustiedustelun (kulutustutkimuksen) tarpeisiin rekrytoitiin 250 haastattelijaa. Kuluttajahintaindeksiä varten hintatietoja hankki 70 asiamiestä.
Työvoimatutkimuksen kadon tutkimiseksi tehtiin haastattelututkimus, johon tarvittiin 350 maatalouskeskusten toimihenkilöä (Marjomaa 2000). Haastattelijoiden tarve lisääntyi jatkuvasti 1970-luvulla. Lopulta vuonna 1975 Tilastokeskukseen perustettiin haastatteluorganisaatio, mikä helpotti oleellisesti otosmenetelmän käyttöönottoa.
Yksityiset tutkimuslaitokset tienraivaajina
Suomessa otostutkimusten yleistymistä luultavasti haittasi yliopisto-opetuksen puuttuminen. Suomen ensimmäiset akateemisten otostutkimusten tekijät hankkivat tietonsa Yhdysvalloista (ks. Kuusela 2008). Georg Lutherin (1993) mukaan Helsingin yliopistossa alettiin järjestää tilastotieteen peruskursseja 1940-luvun puolivälin tienoilla. Näillä kursseilla käsiteltiin tilastotieteen perusasioita, mutta ei otantateoriaa. Suomen Tilastoseura järjesti ensimmäisen otantateorian kurssin vasta vuonna 1950. Kouluttajiksi kutsuttiin asiantuntijoita ulkomailta.
Tilastovirastoissa on aina 1800-luvulta lähtien ollut paljon surveymenetelmään epäilevästi suhtautuvia. Ensimmäinen viralliseen tilastoon kuuluva otostutkimus aloitettiin Suomessakin vasta vuonna 1958. Gunnar Modeenin (1952) kommentti viittaa epäsuorasti siihen, että otostutkimusten verkkainen tulo Suomen virallisen tilaston osaksi johtui viraston epäilevästä asenteesta: " - - haastattelu- ja tutkimusmenetelmää - - on käytetty suhteellisen menestyksellisesti Yhdysvalloissa ja Kanadassa. Siellä onkin suuren yleisön suhtautuminen tällaisiin kyselyihin suopea." Myös haastatteluorganisaation puuttuminen hidasti menetelmän käyttöönottoa.
Toisaalta kehityskulku on lähes kaikissa maissa ollut samankaltainen. Ensin surveytutkimukset on otettu käyttöön yksityisissä mielipidetutkimuslaitoksissa, niiden jälkeen akateemiset tutkijat ovat alkaneet soveltaa menetelmää ja viimeiseksi - usein pitkän ajan jälkeen - julkinen sektori on alkanut kerätä tietoja otostutkimuksilla.
Lähteet:
Bruun, K. 1952.Nuorisotutkimus vuonna 1951.
Tilastollisia kuukausitietoja Helsingistä 1952 nro 10-11. Helsingin
kaupungin tilastotoimisto.
Bruun, K. 1953. Vanhustutkimus vuonna 1952.
Tilastollisia kuukausitietoja Helsingistä 1953 nro 5-6. Helsingin
kaupungin tilastotoimisto.
Fyysillisten henkilöiden verorasitus vuonna 1949.
Komitean mietintö 8/1951.
Hansen, M. 1987.Some History and Reminiscences on
Survey Sampling. Statistical Science 2/1987.
Heikinheimo, L. 1954. Metsätyövoiman
tutkimusmenetelmä. Acta forestelia Fennica 63. Helsinki.
Kiaer, A. N. 1895. Observations et expériences
concernant des dénombrements représentatives. Bulletin of the
International Statistical Institute 9, 176-183.
Kuusela, V. 2008. Surveyn alkutaival
tieteelliseksi tutkimusmenetelmäksi. Hyvinvointikatsaus
4/2008.
Kuusela, V. 2009. Suuri lama teki
työvoimatutkimuksesta otostutkimusten edelläkävijän.
Hyvinvointikatsaus 1/2009.
Lie, E. 2002. The Rise and Fall of Sampling in
Norway, 1875-1906. Science in Context, 15, 385-409.
Luther, G. 1993. Suomen tilastotoimen historia
vuoteen 1970. Tilastokeskus, Helsinki.
Marjomaa, P. 2000. Tilastokeskus 1971-2000.
Tilastokeskus, Helsinki.
Modeen, G. 1952. Elinkustannusindeksi.
Sosiaalipoliittisen yhdistyksen julkaisuja 4. Tammi, Helsinki.
Hyvinvointikatsauksen artikkeleita ja muita kirjoituksia saa siteerata lähde mainiten. Kokonaisen kirjoituksen lainaamiseen tulee saada kirjoittajan lupa. Kirjoittajat kirjoittavat omissa eivätkä Tilastokeskuksen nimissä.
Päivitetty 30.9.2009