Laatuseloste: Työvoimatutkimus
- 1. Tilastotietojen relevanssi
- 2. Tilastotutkimuksen menetelmäkuvaus
- 3. Tietojen oikeellisuus ja tarkkuus
- 4. Julkaistujen tietojen ajantasaisuus ja oikea-aikaisuus
- 5. Tietojen saatavuus ja läpinäkyvyys/selkeys
- 6. Tilastojen vertailukelpoisuus
- 7. Selkeys ja eheys/yhtenäisyys
1. Tilastotietojen relevanssi
Työvoimatutkimus on otostutkimus, jonka avulla tilastoidaan 15–74-vuotiaan väestön työmarkkinoille osallistumista, työllisyyttä, työttömyyttä ja työaikaa kuukausittain, neljännesvuosittain ja vuosittain. Tutkimuksen tietosisältö perustuu EU:n asetukseen, ja tutkimuksen otokseen kuuluu joka kuukausi noin 12 000 henkilöä. Vastaajien antamien tietojen pohjalta luodaan kuva koko 15–74-vuotiaan väestön toiminnasta työmarkkinoilla yhden viikon aikana. Työmarkkina-aseman perusluokittelussa väestö jaetaan työllisiin, työttömiin ja työvoiman ulkopuolisiin. Näistä työlliset ja työttömät yhdessä muodostavat työvoiman.
Tutkimus antaa tuoreen ja kattavan kuvan työvoimasta ja työmarkkinoiden muutoksista. Julkisuudessa seurataan kuukausittain erityisesti työllisyyden ja työttömyyden muutoksia edellisen vuoden vastaavasta kuukaudesta. Kausitasoitettuja lukuja käytetään seurattaessa muutoksen trendiä. Tutkimus antaa tietoa myös työikäisistä henkilöistä, jotka eivät ole työssä tai työnhakijoina. Vuodesta 2003 alkaen on saatu osaotokselta tietoja myös kotitalouksien rakenteesta sekä kotitalouden kaikkien 15–74-vuotiaiden toiminnasta suhteessa työmarkkinoihin. Työvoimatutkimuksen tietosisällöstä on kuvaus osoitteessa: http://tilastokeskus.fi/til/tyti/tyti_2008-02-19_tlu_001.html .
Työvoimatutkimuksen kuukausi- ja neljännesvuositulokset kertovat työllisyyden kausi- ja suhdannevaihteluista. Työvoimatutkimuksen aikasarjat taas kuvaavat työmarkkinoiden muutoksia pitkillä ajanjaksoilla. Vuosikeskiarvot kuvaavat työvoimaa eli työllisiä ja työttömiä sekä työvoiman ulkopuolella olevia esimerkiksi toimialan, ammatin, koulutuksen, iän, sukupuolen ja alueen mukaan ryhmiteltynä.
Tutkimuksen tuloksia käytetään muun muassa työvoimapoliittisten ennusteiden ja suunnitelmien laadinnassa, päätösten teon tukena sekä erilaisten toimien työllisyysvaikutusten seurannassa. Tärkeitä tulosten käyttäjiä ovat ministeriöt, aluesuunnittelusta vastaavat elimet, työnantaja- ja työntekijäjärjestöt, yliopistot ja tutkimuslaitokset, kansainväliset järjestöt ja Euroopan unioni. Tilastokeskuksessa tietoja käytetään esimerkiksi kansantalouden tilinpidon laadinnassa. Euroopan unionin tilastovirasto, Eurostat, ohjaa tutkimuksen sisältöä ja seuraa sen laatua. Eurostat tuottaa sille toimitetuista neljännesvuosiaineistoista omia rakenneindikaattoreitaan ja muita tilastoja.
Tutkimuksessa käytetyt käsitteet ja määritelmät noudattavat YK:n kansainvälisen työjärjestön ILO:n suosituksia ja Euroopan unionin tilastotoimen asetuksia. Työvoimatutkimuksen nykyinen tietosisältö perustuu pääosin Euroopan unionin työvoimatutkimuksia koskeviin asetuksiin (577/98, 2257/2003 ja 430/2005). Euroopan unionin työvoimatutkimuksesta löytyy tarkempi kuvaus osoitteesta: http://ec.europa.eu/eurostat/statistics-explained/index.php/Labour_market_and_Labour_force_survey_(LFS)_statistics . Vuodesta 1999 lähtien työvoimatutkimuksen yhteydessä on tehty EU-maiden yhteinen ad hoc -lisätutkimus, jonka aihe vaihtelee vuosittain. Ad hoc -tutkimuksista tarkemmin osoitteessa: http://tilastokeskus.fi/til/tyti/tyti_2018-04-12_men_001.pdf .
Vuonna 2018 lisätutkimuksen aiheena oli työn ja perheen yhteensovittaminen. Haastatteluun lisättiin myös joitakin samaan aiheeseen liittyviä kansallisia kysymyksiä. Tutkimus perustui työvoimatutkimuksen otokseen. Tutkimukseen haastateltiin työvoimatutkimuksen viidennellä kerralla 18–64-vuotiaat kohdehenkilöt. Kiinnostuksen kohteena olivat erityisesti ne henkilöt, joilla oli alle 15-vuotiaita lapsia.
Vastanneita oli yli 13 000 henkilöä. Tulokset on painotettu vastaamaan koko 18– 64-vuotiasta väestöä. Vastauskadon vaikutuksia tuloksiin korjattiin käyttämällä niin kutsuttua painojen kalibrointia. Painojen kalibroinnissa käytettiin seuraavia rekisteritietoja: sukupuoli, ikä, koulutus ja alue. Väestötietojen ohella kalibroinnissa hyödynnettiin muun muassa tietoja työllisyydestä, lasten lukumäärästä sekä nuorimman lapsen iästä.
Käsitteitä:
-
Työllinen on henkilö, joka on tutkimusviikolla tehnyt ansiotyötä vähintään tunnin rahapalkkaa tai luontaisetua vastaan tai voittoa saadakseen. Myös tutkimusviikolla työstä tilapäisesti pois ollut palkansaaja lasketaan työlliseksi, jos poissaolon syy on äitiys- tai isyysvapaa tai oma sairaus tai jos poissaolo on kestänyt alle 3 kuukautta. Yrittäjä tai samassa kotitaloudessa asuvan perheenjäsenen yrityksessä palkatta työskentelevä lasketaan työlliseksi riippumatta poissaolon pituudesta tai syystä.
-
Työtön on henkilö, joka tutkimusviikolla on työtä vailla (ei ollut palkkatyössä tai tehnyt työtä yrittäjänä), on etsinyt työtä aktiivisesti viimeisen neljän viikon aikana palkansaajana tai yrittäjänä ja voisi aloittaa työn kahden viikon kuluessa. Myös henkilö, joka on työtä vailla ja odottaa sovitun työn alkamista kolmen kuukauden kuluessa, luetaan työttömäksi, jos hän voisi aloittaa työn kahden viikon kuluessa. Työttömäksi luetaan myös työpaikastaan toistaiseksi lomautettu, joka täyttää edellä mainitut kriteerit.
-
Työvoimaan kuuluvat kaikki ne 15-74-vuotiaat henkilöt, jotka tutkimusviikolla olivat työllisiä tai työttömiä.
-
Työvoiman ulkopuolella olevilla tarkoitetaan henkilöitä, jotka tutkimusviikolla eivät olleet työllisiä tai työttömiä. Työvoiman ulkopuolella olevista voidaan käyttää myös käsitettä työvoimaan kuulumattomat.
Muita työvoimatutkimuksen käsitteitä on selitetty osoitteessa: http://tilastokeskus.fi/til/tyti/kas.html.
Työvoimatutkimuksessa käytettäviä luokituksia ovat Toimialaluokitus 2008 (TOL 2008, NACE Rev. 2), Ammattiluokitus 2010 (ISCO-08), Sosioekonomisen aseman luokitus 1989 (Ammattiluokitus 2010 pohjalta) ja Koulutusluokitus 2016 (ISCED 2011) sekä alueluokituksista suuralue, aluehallintovirasto (AVI), elinkeino-, liikenne- ja ympäristökeskus (ELY-keskus) sekä maakunta.
2. Tilastotutkimuksen menetelmäkuvaus
Työvoimatutkimuksen perusjoukon muodostavat Suomessa vakinaisesti asuvat 15–74-vuotiaat henkilöt. Perusjoukkoon kuuluvat myös tilapäisesti ulkomailla (alle vuoden) oleskelevat sekä Suomen väestötietojärjestelmään rekisteröidyt ulkomaalaiset, joiden oleskelu Suomessa kestää vähintään vuoden ( http://www.vrk.fi/ulkomaalaisen-rekisterointi ).
Työvoimatutkimuksen otos poimitaan ositetulla satunnaisotannalla väestön keskusrekisteriin perustuvasta Tilastokeskuksen väestötietokannasta kahdesti vuodessa. Tutkimus on paneelitutkimus, jossa samaa henkilöä haastatellaan viisi kertaa. Haastattelut tehdään kolmen kuukauden välein, paitsi neljäs haastattelu, joka tehdään kuuden kuukauden kuluttua kolmannesta haastattelusta. Ensimmäisen ja viimeisen haastattelun väli on 15 kuukautta. Joka kuukauden otokseen kuuluu noin 12 000 henkilöä, keskimäärin noin joka 300. henkilö perusjoukosta. Yhden tutkimuskuukauden otos koostuu viidestä rotaatioryhmästä, jotka ovat tulleet tutkimukseen mukaan eri aikoina. Otos vaihtuu asteittain siten, että kolmena peräkkäisenä kuukautena vastaamisvuorossa ovat eri henkilöt. Peräkkäisinä vuosineljänneksinä vastaajista 3/5 on samoja. Peräkkäisten vuosien otosten päällekkäisyys on 2/5. Tietoja kerätään kaikilta vuoden viikoilta.
Suurimmassa osassa Euroopan maita työvoimatutkimuksen tiedonkeruu perustuu kotitalousotokseen, mikä tarkoittaa sitä, että haastatellaan samalla kertaa kaikki tietyssä osoitteessa asuvat saman kotitalouden jäsenet. Suomen lisäksi vain Ruotsissa, Tanskassa ja Sveitsissä otos on henkilöpohjainen, eli haastateltavana on vain otokseen poimittu kohdehenkilö. EU:n asetus kuitenkin edellyttää tietoja myös kotitaloudesta, ja Suomessa tämä on ratkaistu hyödyntämällä työvoimatutkimuksen paneeliominaisuutta. Viidennellä haastattelukerralla tehdään perushaastattelun lisäksi kotitaloushaastattelu, jossa selvitetään kohdehenkilön kotitalouden jäsenet sekä kotitalouteen kuuluvien 15–74-vuotiaiden toiminta työmarkkinoilla. Jotta aineisto kuvaisi koko väestöä, siihen on lisätty ylimääräisen otoksen avulla myös sellaisia kotitalouksia, joiden kaikki jäsenet ovat 75 vuotta täyttäneitä. Alle 15-vuotiaita lapsia ja yli 75-vuotiaita ei työvoimatutkimuksessa haastatella, vaan heille luodaan muutamia työmarkkina-asemaa kuvaavia tietoja keinotekoisesti.
Kotitalousaineiston avulla voidaan tarkastella esimerkiksi perheen yhteyttä työllisyyteen sekä molempien puolisoiden työmarkkina-asemaa yhdessä. Vuonna 2018 kotitalousaineistossa oli noin 47 000 henkilöä, jotka muodostivat 20 000 kotitaloutta. Työvoimatutkimuksen kotitalousosaa on kerätty nykymuotoisena vuodesta 2003, ja tiedot ovat julkaistavissa pääsääntöisesti vuodesta 2004 lähtien.
Tutkimuksen tietosisältö vaihtelee eri tutkimuskerroilla. Ensimmäisellä tutkimuskerralla kysytään tarkemmin joitakin perustietoja, joiden ennallaan pysyminen tarkistetaan seuraavilla tutkimuskerroilla. Viimeisellä eli viidennellä tutkimuskerralla tietosisältö on laajempi, kun mukana on kotitalousosa ja vuosittain eri aiheesta tehtävä ad hoc -osa sekä joitain lisäkysymyksiä päätyöhön liittyen.
Tilastokeskuksen haastattelijat keräävät tiedot tietokoneavusteisilla puhelinhaastatteluilla. Vuonna 2018 työvoimatutkimuksessa haastateltiin noin 95 000 henkilöä. Tutkimuksen vastausosuus oli keskimäärin 66 prosenttia.
Otoksesta saadut tulokset painotetaan vastaamaan koko 15–74-vuotiasta väestöä. Vastauskadon vaikutuksia tuloksiin korjataan käyttämällä niin kutsuttua painojen kalibrointia, jossa painotuksella tuotetaan oikeat väestöjakaumat alueen, sukupuolen ja iän mukaan. Aputietona käytetään lisäksi työ- ja elinkeinoministeriön työnhakijarekisterin tietoja.
Työvoimatutkimuksen luvut, kuten kaikki otostutkimuksilla saadut luvut ovat niin kutsuttuja estimaatteja. Estimaatti on matemaattisella menettelyllä (estimoinnilla) otoshavaintoja käyttäen saatu arvio perusjoukon ominaisuudesta. Esimerkiksi tietyn kuukauden julkaistu työttömien lukumäärä on tällaisella menettelyllä saatu Suomen 15–74-vuotiaiden työttömien lukumäärää koskeva arvio eli estimaatti.
Neljännesvuosi- ja vuosiestimaatit ovat kuukausiestimaattien keskiarvoja. Työpäivät ja tehdyt työtunnit estimoidaan kyseisen kuukauden kalenteripäivien lukumäärän mukaan. Työpäivien ja tehtyjen työtuntien neljännesvuosi- ja vuosiestimaatit ovat kuukausiestimaattien summia.
Työvoimatutkimuksen työllisyys- ja työttömyysluvut vaihtelevat suhteellisen säännöllisesti vuoden eri kuukausina. Työvoimatutkimuksesta julkaistaan myös niin kutsuttuja trendejä, joista on poistettu vuodesta toiseen samantyyppisenä toistuva vaihtelu. Pitkän aikavälin kehityksen suunta sekä suhdannevaihtelu ovat paremmin havaittavissa trendistä kuin tasoittamattomista kuukausiluvuista. Käytetystä menetelmästä johtuen trendin viimeisimmät luvut muuttuvat jonkin verran, kun seuraavan kuukauden tiedot liitetään mukaan aikasarjaan. Tämä trendien ennakollinen luonne on syytä ottaa huomioon luvuista päätelmiä tehtäessä. Aikasarjojen trendikomponentit on laskettu kesäkuusta 2007 alkaen EU:n tilastoviraston Eurostatin suosittelemalla Tramo/Seats -menetelmällä. Trendistä ja sen käytön rajoituksista on kerrottu tarkemmin osoitteessa: http://tilastokeskus.fi/til/tyti/men.html .
3. Tietojen oikeellisuus ja tarkkuus
Työvoimatutkimuksen lukujen luotettavuuteen vaikuttavat vastauskato (ks. edellä), mittausvirheet sekä otannasta aiheutuva satunnaisvaihtelu.
Mittausvirheitä syntyy muun muassa siitä, että kysymykset voidaan ymmärtää ja tulkita eri tavoilla, vastaaja ei muista tai ei halua kertoa joitain tietoja tai vastausten kirjaamisessa tapahtuu virheitä. Mittausvirheitä pyritään vähentämään kehittämällä ja testaamalla haastattelukysymyksiä, haastatteluohjeita, käyttöliittymää sekä kouluttamalla haastattelijoita.
Otannasta aiheutuvalla satunnaisvaihtelulla tarkoitetaan sitä, että eri otoksista lasketut luvut poikkeaisivat jonkin verran toisistaan. Arvioitaessa karkeasti otannasta aiheutuvan satunnaisvaihtelun suuruutta erilaisissa tilanteissa on pääperiaatteena, että lukuihin sisältyy sitä vähemmän otannasta aiheutuvaa epävarmuutta, 1) mitä suuremman otoksen pohjalta luvut on laskettu ja 2) mitä suurempaa väestöryhmää luvut kuvaavat . Esimerkiksi neljännesvuotta koskevat luvut ovat tarkempia kuin samaa asiaa koskevat kuukausiluvut, koska neljännesvuositiedot on saatu haastattelemalla kolminkertainen määrä henkilöitä verrattuna kuukausitietoihin. Koko vuotta koskevat luvut ovat kaikkein tarkimpia. Jälkimmäinen periaate tarkoittaa sitä, että samankokoisella otoksella saadut työllisten ja työttömien lukumäärää koskevat luvut eli estimaatit ovat sitä tarkempia, mitä suurempaa osaryhmää ne koskevat. Tarkasteltavan osaryhmän pienentyessä otannasta aiheutuvan satunnaisvaihtelun osuus kasvaa. Tämän vuoksi esimerkiksi työttömien lukumäärät eri ikäryhmissä tai eri alueilla eivät ole yhtä luotettavia kuin kaikkien työttömien lukumäärä.
Otannasta aiheutuvaa epätarkkuutta arvioidaan estimaatin keskivirheen avulla. Keskivirheen suuruuteen vaikuttavat sekä otoksen koko että tarkastelun kohteena olevan ominaisuuden vaihtelu eli muuttujan varianssi. Keskivirheen avulla voidaan laskea estimaatin luottamusväli , jolla haettu perusjoukon arvo sijaitsee tietyllä todennäköisyydellä. Työvoimatutkimuksessa käytetty 95 prosentin luottamusväli on väli, jolla kiinnostuksen kohteena olevan ominaisuuden todellinen arvo sijaitsee 95 prosentin todennäköisyydellä . Jos esimerkiksi tietyn kuukauden työttömien määrän estimaatti on 230 000 ja sen keskivirhe 7 700, on työttömien määrän 95 prosentin luottamusväli 230 000 ± 15 100 eli 214 900–245 100 henkilöä. Estimaattiin lisättävä ja siitä vähennettävä osa saadaan kertomalla estimaatin keskivirhe 95 prosentin luottamusvälin kertoimella 1,96. Tämä osa kuvaa otannasta aiheutuvaa epävarmuutta ja sitä kutsutaan estimaatin virhemarginaaliksi .
Esimerkkejä työllisten ja työttömien lukumäärän tarkkuudesta osaryhmän koon mukaan
Satunnaisvaihtelun suuruusluokan havainnollistamiseksi esitetään seuraavissa taulukoissa 1–3 esimerkkejä erikokoisista työllisten ja työttömien lukumäärän estimaateista, niiden virhemarginaaleista ja muista luotettavuuden tunnusluvuista. Esimerkeissä esitetty satunnaisvaihtelun suuruusluokka on karkea arvio satunnaisvaihtelun ylärajasta, kun tarkastelun kohteena on vastaavankokoinen työllisten tai työttömien lukumäärän estimaatti sukupuolen, iän tai alueen mukaan . Esimerkiksi vastaavankokoisissa toimialan mukaisissa osaryhmissä virhemarginaalit ovat suurempia. Taulukon 1 esimerkit koskevat kuukausiestimaatteja. Taulukoissa 2–3 on vastaavat tiedot neljännesvuosi- ja vuosiestimaattien osalta.
Taulukko 1. Esimerkkejä eri kokoluokan kuukausiestimaattien tarkkuudesta: Työllisten ja työttömien lukumäärät sukupuolen, iän ja alueen mukaan. 1)
Kuukausi- estimaatti |
Kuukausiestimaatin virhemarginaalit (95 %:n luottamusväli) |
Keskivirhe | Suhteellinen keskivirhe |
|
henkilöä | henkilöä | henkilöä | % | |
Työlliset | 2 400 000 | ± 27 800 | 14 200 | 0,6 |
1 200 000 | ± 21 000 | 10 700 | 0,9 | |
600 000 | ± 15 300 | 7 800 | 1,3 | |
300 000 | ± 11 600 | 5 900 | 2,0 | |
100 000 | ± 6 700 | 3 400 | 3,4 | |
50 000 | ± 4 700 | 2 400 | 4,8 | |
10 000 | ± 2 900 | 1 500 | 15,0 | |
Työttömät | 230 000 | ± 15 100 | 7 700 | 3,3 |
120 000 | ± 11 800 | 6 000 | 5,0 | |
90 000 | ± 10 800 | 5 500 | 6,1 | |
60 000 | ± 9 000 | 4 600 | 7,7 | |
30 000 | ± 6 900 | 3 500 | 11,7 | |
20 000 | ± 5 100 | 2 600 | 13,0 | |
10 000 | ± 3 700 | 1 900 | 19,0 |
Taulukosta 1 voidaan esimerkiksi nähdä, että jos osaryhmän työllisten kuukausiestimaatti on noin 300 000 henkilöä, sijoittuu perusjoukon todellinen työllisten lukumäärä 95 prosentin todennäköisyydellä välille 300 000 ± 11 600 henkilöä. Tämä luottamusvälin koko suhteessa estimaatin kokoon on selvästi suurempi kuin vastaava osuus taulukon ylimmän rivin suuren estimaatin kohdalla. 300 000 henkilöä pienempien estimaattien luottamusvälit ovat suhteellisesti vielä suurempia.
Taulukoiden 1–3 tietojen keskinäinen vertailu havainnollistaa myös sitä, että vuosi- ja neljännesvuositiedot ovat kuukausitietoja tarkempia. Edellä tarkasteltua 300 000 henkilön työllisten estimaattia vastaavan neljännesvuosiestimaatin 95 prosentin luottamusväli, 300 000 ± 6 700, henkilöä (taulukko 2) on kuukausiestimaatin luottamusväliä selvästi pienempi. Vuosiestimaatit ovat vielä neljännesvuosiestimaatteja tarkempia (taulukko 3). Tämä tarkkuuden ero ei ole kuitenkaan yhtä suuri kuin vastaava ero kuukausi- ja neljännesvuositietojen välillä.
Taulukko 2. Esimerkkejä eri kokoluokan neljännesvuosiestimaattien tarkkuudesta: Työllisten ja työttömien lukumäärät sukupuolen, iän ja alueen mukaan. 1)
Neljännes- vuosiestimaatti |
Neljännes- vuosiestimaatin virhemarginaalit (95 %:n luottamusväli) |
Keskivirhe | Suhteellinen keskivirhe |
|
henkilöä | henkilöä | henkilöä | % | |
Työlliset | 2 400 000 | ± 16 100 | 8 200 | 0,3 |
1 200 000 | ± 12 500 | 6 400 | 0,5 | |
600 000 | ± 8 800 | 4 500 | 0,8 | |
300 000 | ± 6 700 | 3 400 | 1,1 | |
100 000 | ± 4 700 | 2 400 | 2,4 | |
50 000 | ± 3 900 | 2 000 | 4,0 | |
10 000 | ± 2 000 | 1 000 | 10,0 | |
Työttömät | 230 000 | ± 8 800 | 4 500 | 2,0 |
120 000 | ± 6 900 | 3 500 | 2,9 | |
90 000 | ± 6 100 | 3 100 | 3,4 | |
60 000 | ± 5 100 | 2 600 | 4,3 | |
30 000 | ± 3 500 | 1 800 | 6,0 | |
20 000 | ± 3 100 | 1 600 | 8,0 | |
10 000 | ± 2 400 | 1 200 | 12,0 |
Taulukko 3. Esimerkkejä eri kokoluokan vuosiestimaattien tarkkuudesta: Työllisten ja työttömien lukumäärät sukupuolen, iän ja alueen mukaan. 1)
Vuosi- estimaatti |
Vuosiestimaatin virhemarginaalit (95 %:n luottamusväli) |
Keskivirhe | Suhteellinen keskivirhe |
|
henkilöä | henkilöä | henkilöä | % | |
Työlliset | 2 400 000 | ± 15 700 | 8 000 | 0,3 |
1 200 000 | ± 11 400 | 5 800 | 0,5 | |
600 000 | ± 7 800 | 4 000 | 0,7 | |
300 000 | ± 6 100 | 3 100 | 1,0 | |
100 000 | ± 3 300 | 1 700 | 1,7 | |
50 000 | ± 2 500 | 1 300 | 2,6 | |
10 000 | ± 800 | 400 | 4,0 | |
Työttömät | 230 000 | ± 7 100 | 3 600 | 1,6 |
120 000 | ± 5 700 | 2 900 | 2,4 | |
90 000 | ± 4 500 | 2 300 | 2,6 | |
60 000 | ± 3 500 | 1 800 | 3,0 | |
30 000 | ± 2 400 | 1 200 | 4,0 | |
20 000 | ± 2 000 | 1 000 | 5,0 | |
10 000 | ± 1 600 | 800 | 8,0 |
Estimoinnin luotettavuuden tilastotieteellinen kuvaus
Työvoimatutkimuksen estimointimenetelmä perustuu painojen kalibrointiin, jossa alkuperäisiä otosasetelmasta laskettuja otospainoja muokataan regressiomallin avulla siten, että halutut väestöjakaumat saadaan oikeiksi.
Estimaattien tarkkuutta arvioidaan niiden keskivirheen avulla. Keskivirhe (otosvarianssin neliöjuuri) ilmaisee sen, kuinka tiiviisti havainnoista estimoitu parametrin arvo on keskittynyt mitattavan perusjoukon parametrin ympärille. Keskivirheen suuruuteen vaikuttavat otosasetelma, havaintojen lukumäärä tarkasteltavassa kokonais- tai osajoukossa, tutkimusmuuttujan jakaumasta aiheutuva vaihtelu sekä laskentakaavan ominaisuudet.
Keskivirheestä johdettavia havaintojen luotettavuuden tunnuslukuja ovat luottamusvälit ja suhteellinen keskivirhe. Luottamusväli kuvaa sitä, kuinka laajalla alueella perusjoukon todellinen parametrin arvo on suhteessa otoksesta laskettuun estimaattiin. Luottamusväliä laskettaessa kiinnitetään haluttu riskitaso. Työvoimatutkimuksessa käytetty 5 prosentin riskitaso tarkoittaa sitä, että jos otosten ottamista toistettaisiin, parametrin todellinen arvo osuisi 95 tapauksessa sadasta luottamusvälin sisään ja jäisi 5 tapauksessa sadasta sen ulkopuolelle.
Suhteellinen keskivirhe (variaatiokerroin) on keskivirheen prosenttiosuus estimaatista. Keskivirheen suhteuttaminen estimaatin kokoon poistaa muuttujan mittakaavasta aiheutuvan vaikutuksen. Tämän ansiosta eri muuttujien suhteellisen keskivirheen arvoja tai saman muuttujan keskivirheen arvoja eri osajoukoissa on helppo verrata keskenään.
Työvoimatutkimuksen kuukausi- ja neljännesvuositiedoille käytetään keskivirheen estimaattorina yleistetyn regressioestimaattorin (GREG) varianssiestimaattoria. Vuosiestimaattien tilastolliseen tarkkuuteen ja sen arviointiin vaikuttaa se, että työvoimatutkimuksen otos vaihtuu vuoden kuluessa asteittain. Peräkkäisinä vuosineljänneksinä 60 prosenttia haastateltavista on samoja. Vuoden aikana 90 prosenttia haastatteluista koskee henkilöitä, joita on haastateltu vähintään kaksi kertaa. Samojen henkilöiden vuoden aikana eri haastatteluissa antamat vastaukset korreloivat keskenään, jos henkilön työmarkkina-asema ei muutu haastattelukertojen välillä. Tämän vastausten keskinäisen riippuvuuden huomioon ottamiseksi käytetään työvoimatutkimuksessa vuosiestimaattien keskivirheiden arviointiin 1-asteisen ryväsotannan approksimaatiota, jossa useamman kerran vuoden aikana haastatelluille lasketaan rypään sisäinen varianssi. Rypäät muodostetaan haastateltavan henkilön perusteella. Rypään sisäinen varianssi on nolla, mikäli haastateltavan työmarkkina-asema ei muutu vuoden aikana eri haastattelukertojen välillä.
Esimerkiksi työttömien 230 000 henkilön vuosiestimaatin keskivirheeksi saadaan käytetyllä menetelmällä 3 600 henkilöä ja luottamusväliksi 230 000 ± 7 100 henkilöä. Jos vuosiestimaatin pohjana olevat haastattelut olisivat koskeneet kaikki eri henkilöitä, olisi työttömien vuosiestimaatin keskivirhe ollut 2 300 ja luottamusväli 230 000 ± 4 500 henkilöä. Samojen henkilöiden haastatteleminen uudelleen eri vuosineljänneksillä selittää sen, että työvoimatutkimuksen vuositietojen ja neljännesvuositietojen tarkkuuden ero ei ole niin suuri kuin tehtyjen haastattelujen lukumäärän perusteella voisi olettaa.
4. Julkaistujen tietojen ajantasaisuus ja oikea-aikaisuus
Työvoimatutkimuksen tuloksia julkaistaan kuukausittain, neljännesvuosittain ja vuosittain. Neljännesvuosi- ja vuositulokset ovat kuukausitulosten keskiarvoja eli ne kuvaavat tilannetta ko. tutkimusjakson ”keskimääräisellä” viikolla. Työpanosta koskevat tiedot ovat jaksojen tulosten summia. Julkaistavat tiedot ovat lopullisia. Ainoastaan kausitasoitus muuttaa hieman viimeisimpiä kausitasoitettuja kuukausituloksia. Kuukausitiedot julkaistaan noin kolmen viikon kuluttua tutkimuskuukauden päättymisestä. Neljännesvuositiedot julkaistaan samanaikaisesti kunkin vuosineljänneksen viimeisen kuukauden tietojen kanssa. Neljännesvuositiedot ovat tilastollisesti kuukausitietoja luotettavampia ja sisältävät yksityiskohtaisempia tietoja, muun muassa työllisyys- ja työpanostiedot toimialoittain sekä tarkempia alueittaisia tietoja. Yksityiskohtaisimmat tulokset julkaistaan vuositilastossa. EU:n tilastovirastolle, Eurostatille, toimitetaan neljännesvuosittain aineisto, josta laaditaan EU:n jäsenmaita koskevia tilastoja.
5. Tietojen saatavuus ja läpinäkyvyys/selkeys
Työvoimatutkimuksen tulokset julkaistaan Suomen virallisen tilaston Työmarkkinat -sarjassa. Keskeisimmät kuukausi- ja neljännesvuosi- ja vuositulokset julkistetaan määräpäivinä Internetissä työvoimatutkimuksen kotisivulla http://tilastokeskus.fi/tyovoimatutkimus . Kotisivun linkeistä löytyvät muun muassa tilaston kuvaus, käsitteet ja määritelmät sekä työvoimatutkimuksen maksuttomat tilastotietokantataulukot (StatFin). Tietoja on saatavissa internetin kautta myös Tilastokeskuksen maksullisesta aikasarjatietokannasta (ASTIKA). Eurostat julkaisee työvoimatutkimuksen neljännesvuosi- ja vuositietoja omilla internet-sivuillaan.
Työvoimatilaston vuosijulkaisu sisältää katsauksen kuluneeseen tilastovuoteen, keskeisten käsitteiden määritelmät, käytettyjen luokitusten kuvaukset, aikasarja- ja vuositaulukoita sekä tämän työvoimatutkimuksen laatuselosteen. Työvoimatutkimuksen tietoja julkaistaan lisäksi säännöllisesti Suomen tilastollisessa vuosikirjassa sekä Tilastokatsauksessa. Maksullisia erityisselvityksiä voi tiedustella työvoimatutkimuksen tietopalvelusta.
Työvoimatutkimuksen tietoja ei luovuteta tunnistettavassa muodossa Tilastokeskuksen ulkopuolelle (Tilastolaki 280/2004, Henkilötietolaki 523/1999). Aineiston luovuttaminen on mahdollista ainoastaan erillisen käyttölupapäätöksen perusteella ja tunnistetiedot poistettuna tieteellistä tutkimusta ja tilastollisia selvityksiä varten. EU-työvoimatutkimusta varten muokatut aineistot toimitetaan EU:n tilastovirastolle ilman tunnistetietoja. Työvoimatutkimuksen tiedot suojataan Tilastokeskuksen tietosuojaohjeessa määritellyn suojausluokan mukaan. Rekisteriseloste on nähtävissä osoitteessa: http://www.stat.fi/meta/rekisteriselosteet/rekisteriseloste_tyovoimatutkimus.html .
Tietopalvelu tyovoimatutkimus@tilastokeskus.fi ja puh. 029 551 1000.
6. Tilastojen vertailukelpoisuus
Kuukausittainen työvoimatutkimus, aluksi nimellä työvoimatiedustelu, on ollut käynnissä vuodesta 1959 alkaen. Tänä aikana sen tietosisältöä, tiedonkeruutapoja ja menetelmiä on kehitetty useaan otteeseen. Keskeisimmistä tiedoista on vertailukelpoinen aikasarja vuodesta 1989 asti.
Alkuun tietosisällöltään melko suppean tutkimuksen tiedot kerättiin postikyselynä. Vuonna 1976 tietosisältö laajeni ja menetelmää uudistettiin. Vuosina 1977–1993 tutkimus koostui kuukausitiedustelusta sekä sitä täydentävästä erillisestä puhelimitse tehdystä vuosihaastattelusta. Kuukausitiedustelun tiedonkeruu muutettiin vuonna 1983 postikyselystä puhelinhaastatteluksi, minkä ansiosta vastauskato pieneni noin 30 prosentista 4 prosenttiin.
Suomen liityttyä Euroopan unioniin työvoimatutkimus harmonisoitiin Euroopan unionin yhteiseen työvoimatutkimukseen. Aluksi vuosina 1995–1998 EU-työvoimatutkimuksen tiedot kerättiin erillisenä haastattelututkimuksena keväisin maalis–toukokuussa. Kuukausitutkimus uudistettiin asteittain vastaamaan EU-työvoimatutkimusta. Vuonna 1997 kuukausitutkimuksen sisältö laajentui, tiedonkeruu muuttui tietokoneavusteiseksi puhelinhaastatteluksi (CATI) sekä käsitteet ja määritelmät yhdenmukaistettiin vastaamaan entistä paremmin Euroopan unionin ja YK:n työjärjestön ILO:n ohjeita ja suosituksia. Työttömän määritelmää tarkistettiin vielä toukokuussa 1998 ja julkaistut aikasarjat korjattiin vuodesta 1989 alkaen taannehtivasti uudistettujen määritelmien mukaisiksi.
Huhtikuussa 1999 työvoimatutkimuksen tietosisältö laajeni edelleen, kun kuukausitutkimus ja EU-työvoimatutkimus yhdistyivät yhdeksi jatkuvaksi työvoimatutkimukseksi. Vuoden 2000 alusta siirryttiin jatkuvaan tutkimusviikkoon, kun aiemmin kunkin kuukauden tiedot kerättiin yhdeltä tutkimusviikolta. Jatkuvaan tutkimusviikkoon siirtyminen vaikutti työpäivä- ja työtuntitietoihin, minkä vuoksi ne eivät ole vuodesta 2000 eteenpäin täysin vertailukelpoisia aiempiin tietoihin. Vuodesta 2003 alkaen tutkimuksen tietosisältö laajeni osaotokselta kerättävällä kotitalousosalla. Vuonna 2008 otettiin käyttöön uusi tiedonkeruulomake: tutkimuksen tietosisältö muuttui hieman ja osa tiedoista siirryttiin keräämään osaotokselta, jolta kerättyjä tietoja käytetään vain vuositietoina.
7. Selkeys ja eheys/yhtenäisyys
Työvoimatutkimuksen lisäksi työmarkkinoihin liittyviä Tilastokeskuksen tilastoja ovat avointen työpaikkojen tilasto, työolotutkimus, työtaistelutilasto, työtapaturmatilasto sekä työssäkäyntitilasto.
Näistä työssäkäyntitilasto tuottaa tietoja väestön toiminnasta suhteessa työmarkkinoihin. Sen tiedot poikkeavat tiedonkeruutavasta sekä työllisten ja työttömien määrittelystä johtuen jonkin verran työvoimatutkimuksen tiedoista. Työssäkäyntitilasto on eri viranomaisten rekisteritietoihin pohjautuva kokonaisaineisto. Työssäkäyntitilaston tiedot henkilön toiminnasta koskevat pääosin vuoden viimeistä viikkoa. Tilaston tiedot työttömyydestä perustuvat työ- ja elinkeinoministeriön työnhakijarekisteriin. Tilaston valmistuminen kestää runsaan 1 1/2 vuotta, ennakkotietojen valmistuminen noin vuoden. Koska työssäkäyntitilasto on kokonaisaineisto, tarjoaa se työvoimatutkimusta paremmin aluetietoja (myös kuntakohtaisia) sekä tietoja pienistä väestöryhmistä, esimerkiksi pienistä toimialoista ja ammattialoista. Hallinnollisiin rekistereihin perustuvan työssäkäyntitilaston käsitteet eivät ole kansainvälisesti vertailukelpoisia.
Työvoimatutkimuksen tietoja käytetään Tilastokeskuksen kansantalouden tilinpidossa. Muun muassa tämän vuoksi työvoimatutkimuksen keskeisten käsitteiden, kuten väestö, työllisyys ja työtunnit, määrittelemisessä noudatetaan mahdollisimman pitkälle kansantalouden tilinpidon suosituksia (YK:n System of National Accounts, SNA ja European System of Accounts, ESA). Työvoimatutkimuksessa julkisen sektorin määrittely poikkeaa jonkin verran kansantalouden tilinpidon sektoriluokittelusta. Asevelvolliset luokitellaan kansantalouden tilinpidossa ILO:n suosituksen mukaan työllisiksi, kun taas työvoimatutkimuksessa asevelvolliset ovat työvoiman ulkopuolella.
Euroopan unionin tilastoviraston, Eurostatin, julkaisemat Suomen työvoimatutkimuksen tulokset eroavat Suomessa julkaistuista siten, että asevelvolliset eivät ole lainkaan mukana Eurostatin tiedoissa. Useimmissa EU-maissa asevelvolliset eivät kuulu työvoimatutkimuksen kohdejoukkoon eli yksityisissä kotitalouksissa asuvaan väestöön. Tämä aiheuttaa eroja etenkin 15–24-vuotiaita koskeviin tuloksiin. Suomen julkaisemissa luvuissa asevelvollisuutta suorittavat ovat mukana työvoiman ulkopuolisessa väestössä. Joissain tapauksissa eroja voi tulla siitä, että Eurostatin luvuissa on mukana koko yksityisissä kotitalouksissa asuva väestö iästä riippumatta ja Suomessa 15–74-vuotias väestö.
Myös työ- ja elinkeinoministeriö julkaisee tietoja työttömistä työnhakijoista. Työ- ja elinkeinoministeriön tiedot perustuvat rekisteripohjaiseen työnvälitystilastoon, joka kuvaa kuukauden viimeistä arkipäivää. Työnvälitystilaston työttömyyden määrittely perustuu lainsäädäntöön ja hallinnollisiin määräyksiin, minkä vuoksi tilastotiedot eivät ole kansainvälisesti vertailukelpoisia. Työnvälitystilastossa työttömältä ei edellytetä yhtä aktiivista työnhakua kuin työvoimatutkimuksessa. Myös opiskelijoiden hyväksymisessä työttömiksi on eroja. Tietoja tilastojen välisistä eroista on selitetty tarkemmin osoitteessa: http://tilastokeskus.fi/til/tyti/tyti_2016-08-23_men_001.html .
Lähde: Perheet 2018, Tilastokeskus
Lisätietoja: Tarja Nieminen 029 551 3561, info@tilastokeskus.fi
Vastaava tilastojohtaja: Jari Tarkoma
Päivitetty 17.6.2019
Suomen virallinen tilasto (SVT):
Perheet [verkkojulkaisu].
ISSN=1798-3215. Vuoroasuminen 2018,
Laatuseloste: Työvoimatutkimus
. Helsinki: Tilastokeskus [viitattu: 27.12.2024].
Saantitapa: https://www.stat.fi/til/perh/2018/03/perh_2018_03_2019-06-17_laa_001_fi.html