Dokumentation som var i kraft 21.12.2024

Statistikens primäruppgifter

Allmän beskrivning

Inkomstfördelningsstatistiken beskriver strukturen på hushållens inkomster och fördelningen bland befolkningsgrupper och regioner i Finland. Statistiken framställs årligen och dess informationsinnehåll baserar sig på internationella rekommendationer (OECD (2013) OECD Framework for Statistics on the Distribution of Household Income, Consumption and Wealth; UNECE (2011) Canberra Group Handbook on Household Income Statistics, Second edition 2011). Inkomstfördelningsstatistiken beskriver på ett täckande sätt hushållens disponibla penninginkomster, vilket är det primära inkomstgreppet i inkomstfördelningsstatiken. Andra huvudinkomstbegrepp är produktionsfaktorinkomst, det vill säga löne-, företagar- och kapitalinkomster, erhållna transfereringar samt betalda transfereringar. Utifrån statistiken produceras flera indikatorer, varav de viktigaste är Gini-koefficienten, som beskriver inkomstskillnader, medelvärdet och medianen på inkomster i hushåll och bostadshushåll samt den relativa låginkomstgraden.

Inkomstfördelningsstatistikens totalmaterial är ett registerbaserat material som omfattar hela befolkningen. Inkomstfördelningsstatistikens totalmaterial är den primära nationella datakällan för att beskriva inkomster och inkomstskillnader efter befolkningsgrupp och region. Tidsserieuppgifterna är statistikförda på ett jämförbart sätt sedan år 1995.

Uppgifterna i urvalsmaterialet är internationellt jämförbara, och de är tillgängliga från och med år 1966. Vid bildandet av materialet följs förordningen om ESS EU-SILC-statistiken (Europaparlamentets och rådets förordning 1700/2019, ersatt den tidigare förordningen 1177/2003). Urvalsmaterialet lämpar sig inte för en exakt inkomstfördelningsgranskning mellan regioner eller befolkningsgrupper, på grund av begränsningar i representativiteten. I urvalsmaterialet används sådana klassificeringar och bakgrundsuppgifter som inte finns i totalmaterialet. Den viktigaste av klassificeringarna är den socioekonomiska ställningen.

Statistikens population

Målpopulationen i inkomstfördelningsstatistiken är privata hushåll och personerna i hushållen, med andra ord bostadsbefolkningen i Finland i slutet av statistikåret (31.12.).                                                                                                                 
Populationen omfattar alla privata hushåll och de personer i dem som var stadigvarande bosatta i Finland i slutet av inkomsternas referensperiod (31.12., datainsamlingsåret - 1).

Bostadsbefolkningen utgörs av alla personer som stadigvarande bor i en bostad. Utanför statistiken är drygt två procent av befolkningen. Dessa är adresslösa, de som bor på anstalt (t.ex. personer som vistas långvarigt på äldreboenden, vårdhem, i fängelse eller på sjukhus), personer som bor stadigvarande utomlands och personer som bor tillfälligt i Finland. Beväringar ingår i statistikens population.

Statistisk enhet

Statistiska enheter i inkomstfördelningsstatistiken är privat hushåll (bostadshushåll och hushåll med gemensam ekonomi), person och konsumtionsenhet. 

Definitionen av hushåll är olika i inkomstfördelningsstatistikens totalmaterial och urvalsmaterial. I totalmaterialet är hushållet bostadshushållet. Bostadshushållet består av de personer som stadigvarande bor i samma bostad eller på samma adress. Bostadshushållet används i alla Statistikcentralens registerbaserade statistikgrenar. I inkomstfördelningsstatistikens urvalsmaterial definieras ett hushåll utgående från gemensam ekonomi, på basis av uppgifter som samlats in genom intervju. Ett hushåll består av de personer som bor och äter tillsammans eller som annars gemensamt använder sina inkomster. Enhetligheten mellan de olika materialen har under de senaste åren på enhetsnivå varit 94–95 procent i populationen.

Måttenhet

Måttenheter i inkomstfördelningsstatistiken är euro och procent samt antal hushåll, personer och konsumtionsenheter.

Basperiod

Det sista statistikåret är basperioden för uppgifter om realvärden på penningbelopp för inkomstfördelningsstatistiken.

Referensperiod

Inkomstfördelningsstatistiken beskriver uppgifter från statistikåret, som är ett helt kalenderår, och från slutet av statistikåret (31.12).

Referensområde

I inkomstfördelningsstatistiken används regionindelningar som motsvarar EU:s enhetliga NUTS-indelning av områdesenheter (NUTS2, dvs. storområdesindelningen, NUTS3 dvs. landskapsindelningen), välfärdsregion, ekonomisk region och kommun.

Sektortäckning

Inkomstfördelningsstatistiken omfattar privata hushåll i Finland.
Inkomstfördelningsstatistikens totalmaterial omfattar bostadsbefolkning i Finland.

Tidstäckning

Tidsserieuppgifterna i totalmaterialet för inkomstfördelningsstatistiken omfattar uppgifter för åren 1995–.

Uppgifterna i urvalsmaterialet för inkomstfördelningsstatistiken är tillgängliga årligen från och med 1986. De uppgifter som publiceras för åren 1966, 1971, 1976 och 1981 baseras på konsumtionsundersökningen.

Distributionsfrekvens

Uppgifterna i inkomstfördelningsstatistiken distribueras varje år. Eventuella revisioner görs i tidsserierna i samband med årspubliceringen.

Noggrannhet, tillförlitlighet och aktualitet

Noggrannhet och tillförlitlighet i allmänhet

Som informationskällor i totalmaterialet för inkomstfördelningsstatistiken används endast administrativa registermaterial, varvid kvaliteten på statistiken beror på kvaliteten på källmaterialet och fel i behandlingen av materialet. Kvaliteten på informationskällorna är god i statistikföring som grundar sig på registersystem.

Inkomstfördelningsstatistikens urvalsmaterial grundar sig på en representativ urvalsundersökning. Största delen av uppgifterna fås från administrativa informationskällor. En del uppgifter insamlas genom att intervjua hushåll. Felkällor är urvalsfel och övriga felkällor är täcknings-, mätnings-, bortfalls- och behandlingsfel.

De viktigaste felkällorna i urvalsmaterialet för inkomstfördelningsstatistiken gäller svarsbortfall. Enhetsbortfallet korrigeras med viktning som grundar sig på urvalsdesignen (urvalsdesign i två faser). Designvikterna korrigeras först per stratum med ett inverterat tal för urvalspersonernas inklusionssannolikhet. Därefter skalas de svarskorrigerade vikterna till antalet hushåll och vikterna kalibreras för att motsvara den centrala kända demografiska fördelningen i populationen och inkomstsummorna i totalmaterialet. Det finns få fel på grund av partiellt bortfall i urvalsmaterialet. Dessa fel består främst av fel bland de få inkomstuppgifter som insamlats via intervjuer om källskattepliktiga ränteinkomster. Partiellt bortfall korrigeras genom imputering.

Kvaliteten på resultaten i inkomstfördelningsstatistiken påverkas utöver av bortfall och slumpvariation även av täckningsfel (rampopulationen avviker från målpopulationen) och mätningsfel (det uppmätta värdet av resultatvariabeln avviker från dess rätta värde). Dessa felkällor är små i båda materialen (total- och urvalsmaterialet).

En del felkällor i inkomstfördelningsstatistiken kan generera systematiska fel. Systematiska fel bedöms genom att jämföra estimat med sådana uppgifter om hela befolkningen som fås ur totalmaterialet och andra register samt med motsvarande uppgifter ur annan statistik. Vad gäller befolkningsuppgifter har kvaliteten på totalmaterialet utretts till exempel i kvalitetsbeskrivningen för Statistikcentralens statistik över bostäder och boendeförhållanden. Täckningen av totalmaterialets inkomstuppgifter är god sett till det använda inkomstbegreppet (disponibla penninginkomster). I uppgifterna saknas inkomstposter utanför registren eller som inte räknas som inkomst. Inkomstuppgifternas täckning och kvalitet undersöks genom att jämföra totalmaterialet med övriga statistikkällor, såsom Skatteförvaltningens, Folkpensionsanstaltens, Pensionsskyddscentralens och Institutet för hälsa och välfärds statistik och Statistikcentralens uppgifter för hushållssektorn i nationalräkenskaperna Jämförelser görs regelbundet årligen och mera information ges av Statistikcentralen.

I inkomstfördelningsstatistikens urvalsmaterial bedöms estimatens skevhet och exakthet med hjälp av medelfel i uppgifterna.

Aktualitet

Statistikårets uppgifter publiceras ur totalmaterialet för inkomstfördelningsstatistiken som slutliga uppgifter omkring 11–12 månader efter slutet av statistikåret.

Punktlighet

Uppgifterna levereras till användarna exakt vid de publiceringstidpunkter som uppgetts i publiceringskalendern, omkring 11–12 månader efter utgången av statistikåret.

Jämförbarhet

Geografisk jämförbarhet

Totalmaterialet för inkomstfördelningsstatistiken beskriver på ett täckande sätt bostadshushållens inkomster, med följande regionindelningar: EU:s enhetliga NUTS-indelning av områdesenheter (NUTS2, dvs. storområdesindelningen, NUTS3 dvs. landskapsindelningen), ekonomisk region och kommun.

Inkomstfördelningsstatistikens urvalsmaterial baserar sig på en nationellt representativ urvalsundersökning. Urvalsmaterialets uppgifter är nationellt regionalt jämförbara med den NUTS2- eller storområdesindelning och kommungruppering som används i statistiken, och internationellt jämförbara med beaktande av de landsspecifika skillnaderna i NUTS2-indelningens inkomstbegrepp. Inkomsterna i urvalsmaterialet för inkomstfördelningsstatistiken motsvarar med små undantag de uppgifter som publiceras av Eurostat och OECD. Ett sådant undantag orsakas av naturaförmåner i löneinkomsterna, som inräknas i inkomster i den nationella statistikföringen, men inte i EU-SILC-statistiken.

Jämförbarhet över tid

Tidsserieuppgifterna i totalmaterialet för inkomstfördelningsstatistiken gäller åren från och med år 1995. Den tidsserie som bildats utifrån totalmaterialet för inkomstfördelningsstatistiken är inte helt och hållet jämförbar mellan åren 1995–2009 och 2010–. Efter 2010 har det också gjorts ändringar och justeringar i inkomstbildningen av tekniska skäl, som inte har korrigerats i tidsserien. År 2023 inkluderades skattefria försäkringsersättningar för personskada i inkomsterna från inkomstregistret.

Ur urvalsmaterialet kan fås tidsserieuppgifter från och med år 1986. I tidsseriedata har man försökt beakta de viktigaste förändringarna i inkomstbildningen. Data från åren 1986-1992 och 1993- är inte helt jämförbara på grund av skattereformen 1993. I tidsseriedata baseras uppgifterna för åren 1966, 1971, 1976 och 1981 på konsumtionsundersökningen.

I totalmaterialet för inkomstfördelningsstatistiken förnyades beräkningsmetoden för skogsinkomster, hur rehabiliteringspenningen bildas preciserades och nya inkomstposter lades till i inkomstnomenklaturen från och med år 2010. Nya inkomstposter är underhållsstöd, erhållet underhåll, skattefria stipendier och beväringarnas dagpenning. Betalt underhåll lades till i betalda transfereringar som en avgift av skattenatur för personer som har avdragit underhållsavgifter i sin beskattning. Underhållsstöd fås direkt ur FPA:s register, men erhållet underhåll har härletts ur skatteavdragsuppgifterna som gäller betalare av underhållsavgifter. Även hur rehabiliteringspengarna bildas preciserades genom att den andel som styrs direkt till arbetsgivaren togs bort från personernas rehabiliteringspengar.

Den tidsmässiga jämförbarheten av inkomstbegreppen i inkomstfördelningsstatistiken försvåras även av reformen av skatt på utdelning år 2005, då gottgörelse av bolagsskatt slopades. Före skatteförnyelsen räknades gottgörelse av bolagsskatten som inkomst i dividend-, produktionsfaktor- och bruttoinkomster. Eftersom gottgörelsen av bolagsskatt också ingick i betalda transfereringar, har skattereformen ingen inverkan på den disponibla inkomstens jämförbarhet. I inkomstfördelningsstatistikens tidsseriefiler har förändringarna till följd av skattereformen korrigerats för åren 1993–2004. Dessa förändringar påverkar på samma sätt den tidsmässiga jämförbarheten av både de inkomstuppgifter som genereras utifrån totalmaterialet och de inkomstuppgifter som genereras utifrån urvalsmaterialet.

Den kalkylerade bostadsinkomsten för ägarbostäder som skapas utgående från urvalsmaterialet framställs fortfarande som en separat inkomstkomponent och den räknas fortfarande till hushållets disponibla inkomster (men inte till penninginkomsterna). År 2006 förnyades i statistiken kalkyleringssättet för bostadsinkomst genom att beakta å ena sidan gemensam praxis med Statistikcentralens övriga statistik (särskilt konsumtionsundersökningen och nationalräkenskaperna) och å andra sida med kraven i förordningen om statistiken ESS EU-SILC. De viktigaste förändringarna är kopplade till revidering av stratum av bruttohyror som beräknats för urvalshushållen med hjälp av en stratummetod och till behandling av ägarbostäders avskrivningar. I stratumen är bruttohyran i enlighet med den statistiska kommungrupperingen ersatt med kommunvisa uppgifter och i de större kommunerna med delområdesuppgifter (sedan år 2012 används bruttohyra i enlighet med delområdet i fler stora kommuner än tidigare). De stratumvisa värdena på bruttohyror baserar sig fortfarande på de genomsnittliga hyrorna i gamla och nya hyresförhållanden enligt Statistikcentralens statistik över bostadshyror för fritt finansierade bostäder, men värdena på hyror som baserar sig på stratum med ett lågt antal observationer har korrigerats med försäljningspriserna för gamla bostäder i bostadsaktiebolag. Från bostadsinkomst avdras inte längre avskrivningar när det gäller personer som bor i egnahemshus. Bostadsinkomst som beräknats med den förnyade metoden har införts retroaktivt i tidsserieuppgifterna från och med år 1993, så till den delen är inkomstbegreppen jämförbara när inkomstfördelningsstatistikens tidsseriematerial används som informationskälla.

Till de urvalsbaserade erhållna transfereringarna har sedan inkomstfördelningsstatistiken år 2006 inte längre inräknats hushållets erhållna penninggåvor eller andra gåvor. Orsaken är enhetlighet med inkomstbegreppet i statistiken ESS EU-SILC. Det nya beräkningssättet minskar hushållets genomsnittliga disponibla inkomster med omkring 150 euro per hushåll.

Datainsamlingssättet för undersökningen ändrades år 2021. Då infördes en webblankett som datainsamlingssätt vid sidan av telefonintervjun. Webblanketten erbjöds de hushåll som vid tidpunkten för urvalet hade endast en medlem. År 2022 var det också möjligt för större hushåll att svara på nätet. Omkring 38 procent av svaren samlades in med webblanketten. De uppgiftslämnare som svarade via webben representerar omkring 1 238 000 hushåll i hela befolkningen, dvs. omkring 42 procent av alla hushåll.

När uppgifter som beskriver personens sysselsättning och övriga ekonomiska verksamhet bildades år 2021 användes delvis som ersättning för de tidigare intervjuuppgifterna uppgifter som baserade sig på inkomstregistret. Dessutom samlades uppgifter om verksamheten in från uppgiftslämnarna med en förnyad datainsamlingsblankett. På grund av ändringar i datakällan och datainsamlingsblanketten har de källuppgifter som används vid klassificeringen av socioekonomisk ställning ändrats. Tidsserien för socioekonomisk ställning kan dock anses jämförbar med tidigare år om man beaktar de sedvanliga osäkerhetsfaktorerna kopplade till urvalsstatistik.

Enhetlighet över statistikområdena

Totalmaterialet för inkomstfördelningsstatistiken är enhetligt med den statistik som baserar sig på Statistikcentralens totalmaterial. Urvalsmaterialets statistiska uppgifter, Statistikcentralens statistik över levnadsförhållanden samt förmögenhet har bildats på ett integrerat sätt utgående från uppgifter som samlats in inom ramen för undersökningen om inkomster och levnadsförhållanden, genom intervjuer och totalmaterialet.

Utöver inkomstfördelningsstatistiken ingår inkomstbegrepp i Statistikcentralens statistik över förmögenhet, konsumtionsundersökning och nationalräkenskaper.

Det finns inga betydande begreppsskillnader mellan inkomstfördelningsstatistikens urvalsmaterial och konsumtionsundersökningen. Båda följer definitionen på inkomst enligt internationella rekommendationer. Inkomstfördelningsstatistikens boendekostnader och konsumtionsundersökningens konsumtionsutgifter för boende är enhetliga. I konsumtionsundersökningens uppgifter inräknas konsumtionsutgifter för hushållets egentliga bostäder och fritidsbostäder (inkl. kalkylerad konsumtion). Statistikföringen följer principen om bruttohyra och för klassificeringen används en detaljerad klassificering av konsumtionsutgifterna (COICOP-HBS). Utöver det nämnda kan statistikuppgifterna avvika på grund av urvals- och framställningsmetoder.

Vid jämförelse av inkomstfördelningsstatistikens inkomstsummor i hela landet med nationalräkenskapernas poster på inkomst- och inkomstanvändningskonton ska man beakta skillnaderna i avgränsningen av sektorer, i en del definitioner och i statistikgrenarnas framställningsmetoder. På grund av skillnaderna kan stora avvikelser förekomma i nationalräkenskapernas och inkomstfördelningsstatistikens siffor, till exempel gällande årsförändringen i hushållens disponibla inkomst. 

I inkomstfördelningsstatistikens erhållna transfereringar indelas de sociala förmånerna i målgrupper/huvudgrupper enligt klassificeringen i ESSPROS-statistiksystemet (The European System of Integrated Social PROtection Statistics). Klassificeringen är enhetlig med THL:s statistik över utgifter för det sociala skyddet samt utgifternas finansiering och den används i EU-SILC-statistik. I inkomstfördelningsstatistiken räknas utkomststödet som övrig social trygghet, medan det utkomststöd som beviljats för boendeutgifter i THL:s statistik över utgifter för det sociala skyddet samt utgifternas finansiering räknas som boendeförmåner och det utkomststöd som beviljats för hälsoutgifter räknas som förmåner för sjukdomstid fr.o.m. statistikåret 2022. Studieförmåner beaktas inte i ESSPROS-statistikföringen.

Enhetlighet med nationalräkenskaperna

Inkomstfördelningsstatistik beskriver hushållssektorns inkomster och transfereringar och är således en utvidgning till hushållssektorns inkomst- och inkomstanvändningskonto i nationalräkenskaperna. Vid jämförelse av inkomstfördelningsstatistikens inkomstsummor i hela landet med nationalräkenskapernas poster på inkomst- och inkomstanvändningskonton ska man beakta skillnaderna i avgränsningen av sektorer, i en del definitioner och i statistikgrenarnas framställningsmetoder. På grund av skillnaderna kan stora avvikelser förekomma i nationalräkenskapernas och inkomstfördelningsstatistikens siffor, till exempel gällande årsförändringen i hushållens disponibla inkomst. 

I nationalräkenskaperna ingår bland annat ett beräknat bostadsinkomst från ägarbostad i det disponibla inkomsten, medan huvudinkomstbegreppet i inkomstfördelningsstatistiken (disponibel penninginkomst) inte inkluderar bostadsinkomst från ägarbostad.

Det finns betydande konceptuella skillnader i kapitalinkomster. Nationalräkenskaperna inkluderar inte realisationsvinster, men de inkluderar skatter betalda på skattepliktiga realisationsvinster. Inkomstfördelningsstatistiken (totalmaterialet) inkluderar försäljningsvinster (realisationsvinster minus förluster) som kapitalinkomst och de skatter som betalas på dessa som betalda inkomstöverföringar. Den transaktionen D412R Ränta (FISIM-justerad), inlåning, inkomster, ingår inte i inkomstfördelningsstatistiken. De ekonomiska transaktionerna D422R Ägaruttag från kvasibolag och D44R Kapitalavkastning tillräknad försäkringstagare motsvarar inte begreppen som används i inkomstfördelningsstatistiken.

Det finns även betydande metodologiska och konceptuella skillnader i inkomster från företagande.

Intern enhetlighet

Statistiken är enhetlig till innehållet med undantag för inverkan av begreppsskillnader som gäller hushåll och inkomster samt särskilda felkällor i urvalsmaterialet.

Totalmaterialets och urvalsmaterialets inkomstuppgifter är annars lika, men i urvalsmaterialet ingår inkomstuppgifter som fattas från registren (ränteinkomster som beskattas enligt källskattelagen, vissa transfereringar mellan hushåll) och samlas in genom att intervjua hushåll.

Källmaterial och datainsamlingar

Källmaterial

Källmaterial

Totalmaterialet för inkomstfördelningsstatistiken är ett statistikmaterial som omfattar hela hushållsbefolkningen och sammanställas på individnivå ur administrativt material och administrativa register. Således innehåller statistiken detaljerade uppgifter om inkomsterna i alla hushåll och bland personerna i hushållen.

Vid framställandet av totalmaterialet har använts följande administrativa material och statistikregister:
  • Befolkningsdatasystemet som tillhandahålls av Myndigheten för digitalisering och befolkningsdata samt Statistikcentralens person- och bostadsdatalager.
  • Skatteförvaltningens skattedatabas
  • Folkpensionsanstaltens databas över pensioner och förmåner (sjukförsäkringsersättnings- och rehabiliteringsregistret, underhållsstödsregistret, studiestödsregistret och registret över bostadsbidrag.)
  • Material som gäller förebyggande och kompletterande utkomststöd, vilket Institutet för hälsa och välfärd (THL) insamlat från kommunerna
  • Pensionsskyddscentralens register över pensionsfall
  • Statistikcentralens examensregister
  • Statskontorets databas för systemet för ersättning av militärskadeärenden
  • Finansinspektionens uppgifter (inkomstrelaterad arbetslöshetsdagpenning)
  • Statistikcentralens företagsregister
  • Sysselsättningsfondens (tidigare Utbildningsfonden) uppgifter
  • Inkomstregistret
Inkomstfördelningsstatistikens urvalsmaterial grundar sig på en representativ urvalsundersökning. Grunduppgifterna i inkomstfördelningsstatistikens urvalsmaterial sammanställs genom att förena de uppgifter som fåtts genom att intervjua hushåll och totalmaterialets registeruppgifter med ett urval som på ett godkänt sätt intervjuats. Huvuddelen av hushållens klassificeringsuppgifter samt de inkomstuppgifter som inte fåtts ur register har insamlats genom intervjuer inom ramen för undersökningen om inkomster och levnadsförhållanden.

Ram

Målpopulationen för totalmaterialet är Finlands bostadsbefolkning i slutet av statistikåret (31.12). Bostadsbefolkningen utgörs av alla personer som stadigvarande bor i en bostadslägenhet. Utanför statistiken är drygt två procent av befolkningen. Dessa är de som har sin stadigvarande adress vid inrättningar (t.ex. personer som vistas långvarigt på äldreboenden, vårdhem, i fängelse eller på sjukhus), bostadslösa, personer som bor utomlands eller på okänd adress. Totalmaterialet upprättas genom att slå samman uppgifter ur administrativa källor och registerkällor med hjälp av personbeteckningen. Hushållets inkomster bildas genom att summera inkomsterna hos de personer som bor i hushållet. 

Urvalsram

Urvalsmaterialets målpopulation och referenstidpunkt (sista dagen på statistikåret) är desamma som i totalmaterialet. Urvalsramen är ett totalmaterial som grundar sig på befolkningsdatasystemet som tillhandahålls av Myndigheten för digitalisering och befolkningsdata och på Statistikcentralens person- och bostadsdatalager. Referenstidpunkten för urvalsmaterialets population är 31.12. Urvalsramen bildas före statistikårets slut, och detta leder till att urvalsramen innehåller en del fel. Urvalet granskas före datainsamlingen från det uppdaterade totalmaterialet och fel till följd av övertäckning korrigeras innan urvalet väljs.

Urvalsramen används till olika ändamål i urvalet, i inkomstfördelningsstatistikens urvalsmaterial för att skapa bostadshushåll och urvalsklasser.

Det befolkningsdatasystem som tillhandahålls av Myndigheten för digitalisering och befolkningsdata är i allmänhet uttömmande och uppdaterad i fråga om personer. Uppgifter om befolkningsförändringar uppdateras i realtid. Statistikcentralen använder uppgifterna varje vecka för sina person- och bostadsdatalager, som används för statistiska ändamål, bl.a. månatligen för publicering av preliminär statistik om den kommunvisa befolkningen efter kön. 

Inkomstfördelningsstatistikens urvalsmaterial

I inkomstfördelningsstatistikens urvalsundersökning följs en fyra års roterande paneldesign. Varje panel omfattar fyra undersökningsomgångar.

Till sin typ är urvalsdesignen en tvåfasig stratifierad urvalsdesign.  I urvalets första fas väljs masterurvalet bland personer (50 000, undantagsvis 100 000 åren 2016, 2019 och 2020) genom ett systematiskt urval ur urvalsramen. I den andra fasen väljs ett slumpmässigt urval av personer (5 000) inklusive bostadshushåll från masterurvalets stratum med icke-relativ kvotering. Personernas urvalssannolikhet varierar mellan olika stratum. Stratumen är de 12 grupperna av socioekonomisk ställning. De socioekonomiska uppgifterna bildas utgående från beskattningsbara inkomster enligt inkomsttypen och inkomstnivån hos den i hushållet (bostadshushållet) med de högsta inkomsterna (förutom i fråga om företagare).

År 2019 inkluderades under första undersökningsomgången ett tilläggsurval med 500 personer. År 2020 var urvalsstorleken 5 500.

Som en följd av paneldesignen väljs för undersökningens 2–4 undersökningsomgång ett tilläggsurval av 16-åringar och man iakttar urvalsdragning under andra fasen.

Urvalspersonerna (och deras bostadshushåll) syftar på den befolkning som är registrerad som stadigvarande bosatt i Finland den 31 december. Urvalsenheten är person som fyllt 16 år.  

Datainsamlingsmetod

Totalmaterialet för inkomstfördelningsstatistiken är ett statistikmaterial som omfattar hela hushållsbefolkningen och sammanställas på personnivå ur administrativt material och administrativa register. Således innehåller statistiken detaljerade uppgifter om inkomsterna i alla hushåll och bland personerna i hushållen.

Den huvudsakliga datainsamlingsmetoden för uppgifter som insamlas genom intervjuer för inkomstfördelningsstatistiken är datorstödd telefonintervju (CATI, computer assisted telephone interview) som administreras av en intervjuare och webintervju (CAWI, computer assisted web interview). Endast en liten del av intervjuerna (omkring 1–2 %) insamlas med datorstödd besöksintervju (CAPI, computer assisted personal interview).

Frekvens för datainsamling

Data för statistiken över arbetskonflikter samlas in varje år.

Metoder

Databehandling

I urvalsmaterialet för inkomstfördelningsstatistiken får hushållen och personerna en viktkoefficient som används för att höja uppgifterna så att de representerar populationens uppgifter. För urvalspersonerna bildas först en designvikt som beskriver sannolikheten av att personen blir vald ur urvalet. För det godkända urvalet korrigeras vikten med ett inverterat tal för urvalspersonens inklussionssannolikhet. Svarsbortfallet korrigeras vidare i materialet genom att kalibrera (CALMAR-makro) vikterna så att de motsvarar populationens centrala kända fördelning och summor. Genom förfarandet strävar man efter att minska den skevhet som kan uppstå på grund av bortfallet och generera så exakta estimat som möjligt för de viktigaste inkomstvariablerna.

Vid kalibrering av vikterna i materialet för år 2022 användes följande uppgifter:
  • region (landskapsindelningen, där Helsingfors och den övriga huvudstadsregionen är separat; statistisk kommungruppering)
  • bostadshushållens storlek
  • medlemmarnas ålders- och könsgrupper
  • utbildningsgraden hos 16 år fyllda personer
  • totalsummor på centrala inkomstposter: löne-, företagar- och kapitalinkomster, arbetslöshetsdagpenning (grunddagpenning och arbetsmarknadsstöd, inkomstrelaterad andel), pensioner, ränta på bostads- och studielån
  • antal inkomsttagare (inkomstrelaterad arbetslöshetsdagpenning, löneinkomster, pensionsinkomster)
  • antalet personer i hushåll med små inkomster i bostadsbefolkningen (registerbaserat inkomstbegrepp, inkomstfördelningsstatistikens totalmaterial)
Från kalibreringsuppgifter togs antalet personer i hushåll med små inkomster i bruk statistikåret 2015 och utbildningsgraden statistikåret 2016 för att korrigera den ökade skevheten på grund av det ökade bortfallet. Det här hade en betydande inverkan på utbildningsfördelningen bland personer som fyllt 16 år: antalet som enbart gått grundskolan eller saknade uppgift om utbildning ökade och antalet som avlagt högskoleexamen minskade. Däremot blev det inga stora förändringar i befolkningsgruppernas medianinkomster och inga stora årsförändringar. Inkomstförhållandena mellan befolkningsgrupperna förändrades inte. Kalibreringsändringen hade ingen inverkan på jämförbarheten för centrala nyckeltal.
 

Datavalidering

Riktigheten hos de uppgifter som bildas i totalmaterialet för inkomstfördelningsstatistiken säkerställs genom att kontrollera felfriheten och enhetligheten i uppgifterna från olika källmaterial, för de klassificeringar och variabler som härleds. Kontroller görs dessutom i urvalsmaterialet efter att uppgifterna i totalmaterialet sammanslagits med urvalet. Täckningen av totalmaterialets inkomstuppgifter är god sett till det använda inkomstbegreppet (disponibla penninginkomster). I uppgifterna saknas inkomstposter utanför registren eller som inte räknas som inkomst.

Vad gäller befolkningsuppgifter har kvaliteten på totalmaterialet utretts till exempel i kvalitetsbeskrivningen för Statistikcentralens statistik över bostäder och boendeförhållanden. Inkomstuppgifternas täckning och det utarbetade materialets kvalitet undersöks genom att jämföra totalmaterialet med övriga statistikkällor, såsom Skatteförvaltningens, Folkpensionsanstaltens, Pensionsskyddscentralens och Institutet för hälsa och välfärds statistik och Statistikcentralens uppgifter för hushållssektorn i nationalräkenskaperna Jämförelser görs regelbundet årligen och mera information ges av Statistikcentralen.

Den främsta felkällan i urvalsmaterialet är enhetsbortfall, som korrigeras med viktning som grundar sig på urvalsdesignen. Kvaliteten på resultaten påverkas utöver av bortfall och slumpvariation även av täckningsfel (rampopulationen avviker från målpopulationen) och mätningsfel (det uppmätta värdet av resultatvariabeln avviker från dess rätta värde).  Endast en liten del av inkomstposterna samlas in genom intervjuer (bl.a. ränteinkomster som beskattas enligt källskattelagen). På datainsamlingens elektroniska blankett ingår kontroller av trovärdighet och logik. Uppgifterna processas efter datainsamlingen med behövliga kontroller och editeringar på enhetsnivå, huvudsakligen med automatiserade procedurer som följer vanliga regler. Partiellt bortfall imputeras med hot-deck-metoden. En del felkällor kan generera systematiska fel. Systematiska fel bedöms genom att jämföra estimat med sådana uppgifter om hela befolkningen som fås ur totalmaterialet och andra register samt med motsvarande uppgifter ur annan statistik. Jämförelser görs årligen och mera information om dessa ges av Statistikcentralen.

Principer och riktlinjer

Organisation

Statistikcentralen

Organisationsenhet

Samhällsstatistik

Lagstiftning och andra överenskommelser

Framställningen av statistik styrs av statistiklagen. I statistiklagen föreskrivs bl.a. om insamling av uppgifter, behandling av uppgifter och uppgiftsskyldighet. Vid statistikproduktionen tillämpas på behandlingen av uppgifter utöver statistiklagen också dataskyddslagen samt lagen om offentlighet i myndigheternas verksamhet. 

Vid utarbetandet av statistik tillämpar Statistikcentralen EU:s statistikförordningar, som styr statistikbyråerna i alla EU-länder.  

Ytterligare information: Statistiklagstiftning 

Datainnehållet i urvalsmaterialet för inkomstfördelningsstatistiken grundar sig på Europaparlamentets och rådets ramförordning 1177/2003; 1700/2019, som gäller statistiken ESS EU-SILC (EU-SILC, Statistics on Income and Living Conditions).  

Principer för dataskydd

Dataskyddet för uppgifter som samlats in för statistiska ändamål garanteras i enlighet med kraven i statistiklagen (280/2004), lagen om offentlighet i myndigheternas verksamhet (621/1999), EU:s allmänna dataskyddsförordning (EU) 2016/679 och dataskyddslagen (1050/2018). Datamaterialen är skyddade med behövliga fysiska och tekniska lösningar i alla skeden av bearbetningen. Statistikcentralen har utarbetat detaljerade föreskrifter och anvisningar för den konfidentiella bearbetningen av uppgifter. Personalen har bara tillgång till de uppgifter som är nödvändiga med tanke på arbetsuppgifterna. Utomstående har inte tillträde till de lokaler där material på enhetsnivå behandlas. De anställda har undertecknat ett sekretessavtal när de trädde i tjänst. Överträdelser av datasekretessen bestraffas. 

Ytterligare information: Dataskydd | Statistikcentralen (stat.fi) 

Sekretess – behandling av uppgifter

Uppgifterna behandlas endast av dem som framställer statistiken och har behörighet att använda uppgifterna. Alla som hör till Statistikcentralens personal har undertecknat ett sekretessavtal där de förbinder sig att hemlighålla uppgifter som enligt statistiklagen eller lagen om offentlighet i myndigheternas verksamhet föreskrivs som sekretessbelagda.

Statistiklagen styr sammanställandet av statistik (280/2004). Vid behandling av personuppgifter tillämpas utöver statistiklagen EU:s allmänna dataskyddsförordning EU 2016/679 och den nationella dataskyddslagen. Om sekretess beträffande uppgifter som insamlats för statistiska ändamål föreskrivs i lagen om offentlighet i myndigheternas verksamhet (621/1999) dvs. i offentlighetslagen.

Uppgifter i urvalsmaterialet för inkomstfördelningsstatistiken bifogas till Statistikcentralens servicematerial om inkomstfördelningsstatistiken. Servicematerialet innehåller inte direkta identifikationsuppgifter. För att säkerställa dataskyddet görs värdena för sådana inkomstvariabler som underlättar igenkänning grövre.

Uppgifterna i det statistikmaterial som utgör grunden för urvalsmaterialet för inkomstfördelningsstatistiken och statistiken över levnadsförhållanden levereras till EU:s statistikverk Eurostat för statistiken EU-SILC (EU-SILC, Statistics on Income and Living Conditions). Statistikmaterialet innehåller inte direkta identifikationsuppgifter. För materialet vidtas dessutom skyddsåtgärder som är gemensamma för alla länder och vid behov nationella åtgärder. Eurostat överlåter material ur statistiken EU-SILC för forskning utifrån ansökan. De forskare som behandlar materialet undertecknar ett sekretessavtal.

Statistiska skyddsmetoder beskrivs bland annat i publikationen Handbook on Statistical Disclosure Control (2010).

Principer för offentliggörande

Statistikcentralen publicerar nya statistiska uppgifter vardagar kl. 8.00 i sin webbtjänst. Publiceringstidpunkterna för statistik uppges på förhand i den publiceringskalender som finns i webbtjänsten. Uppgifterna är offentliga efter att de har uppdaterats i webbtjänsten. 

Ytterligare information: Statistikcentralens principer för offentliggörande av statistik 

Datautbyte

Regionspecifika uppgifter i totalmaterialet för inkomstfördelningsstatistiken publiceras utöver av Statistikcentralen även som tabelluppgifter i statistik- och indikatorbanken SOTKAnet som administreras av Institutet för hälsa och välfärd (THL).

Inkomstuppgifterna i inkomstfördelningsstatistiken används för Statistikcentralens statistik över levnadsförhållanden. Inkomstfördelningsstatistiken och statistiken över levnadsförhållanden grundar på samma urvalsmaterial. Uppgifterna används för den internationella statistiken ESS EU-SILC (EU-SILC, Statistics on Income and Living Conditions). EU:s statistikbyrå Eurostat ansvarar för statistikföringen av EU-SILC och för överlåtelse av dess statistikmaterial för forskningsändamål. Att använda uppgifterna för forskningsändamål förutsätter en ansökan om användningstillstånd.

Ur urvalsmaterialet för inkomstfördelningsstatistiken levereras dessutom till OECD (OECD IDD) och vissa år till Luxemburg Income Study's (LIS) internationella databas. De publicerar internationellt jämförbara uppgifter på sin statistikwebbplats.

Tillgänglighet och tydlighet

Nya statistiska uppgifter publiceras som databastabeller i databasen StatFin. Databasen är det primära forumet för att publicera uppgifter och de nya uppgifterna uppdateras först i databasen. Vid publicering av statistiska uppgifter kan befintliga databastabeller uppdateras med nya uppgifter eller så kan helt nya databastabeller publiceras.   

Utöver de statistiska uppgifter som publiceras i databasen StatFin publiceras i allmänhet ett meddelande om de viktigaste uppgifterna i webbtjänsten. Om offentliggörandet innehåller uppgifter från flera referensperioder (t.ex. månads- och årsuppgifter), publiceras i webbtjänsten en översikt som sammanställer dessa uppgifter. Både i meddelandet och i översikten listas de databastabeller som uppdaterats vid publiceringstidpunkten. Statistikuppgifter kan i vissa fall också publiceras enbart som databasoffentliggöranden i databasen StatFin. I samband med dessa s.k. databasoffentliggöranden publiceras varken ett meddelande eller en översikt. 

Meddelandena och databastabellerna publiceras på tre språk: finska, svenska och engelska. De svenska och engelska versionerna av meddelandena kan vara mindre omfattande än de finska.   

Om det sker ändringar i tidsplanerna för offentliggöranden och databastabeller informeras allmänheten genom ändringsmeddelanden i webbtjänsten, liksom om det görs korrigeringar. 

Riktlinjer för revidering av uppgifter

Revidering av redan publicerade statistiska uppgifter är en del av den normala statistikproduktionen och innebär förbättrad kvalitet. Principen är att de statistiska uppgifterna bygger på bästa tillgängliga material och information om det fenomen som statistikförs. Å andra sidan strävar man efter att informera om revideringar så transparent som möjligt på förhand. Med förhandskommunikation säkerställs att användarna kan bereda sig på revideringar av uppgifter. 

Bakgrunden till revideringen av uppgifter i offentliggörandena är ofta komplettering av material. I så fall grundar sig den nya, reviderade statistiksiffran på en bredare informationsgrund och beskriver fenomenet ännu mer exakt. 

Revideringen av uppgifterna i statistiken kan också bero på den beräkningsmetod som använts, exempelvis årlig avstämning av siffror eller uppdatering av viktstruktur. Också ändring av basår och använda klassificeringar orsakar revidering av uppgifter. 

Kvalitetsbedömning

Kvalitetssäkring

Kvalitetsledningen förutsätter helhetsinriktad styrning av verksamheten. Statistikområdets egen ram för kvalitetsledning är riktlinjerna för europeisk statistik (CoP). Kvalitetskriterierna för Finlands officiella statistik överensstämmer med riktlinjerna för europeisk statistik. 

Användarnas tillgång

Uppgifterna publiceras samtidigt för alla användare. Innan statistiska uppgifter publiceras får de behandlas och lämnas ut bara av de personer vid Statistikcentralen som deltar i framställningen av statistiken eller som behöver uppgifterna i sitt eget arbete innan de publiceras. 

Ytterligare information: Principer för publicering av statistik 

Statistikcentralen är producent till materialet och äger upphovsrätten om inte annat anges i anslutning till produkten, uppgiften eller tjänsten. Användarvillkor för statistiska uppgifter. 

Statistikexperter

Veli-Matti Törmälehto
specialforskare
029 551 3680