keskiviikko 28. maaliskuuta 2018

Karin karttakeppitehdas

Karin karttakeppi oyj

Mitä eroa on keskiarvolla ja mediaanilla — ja ennen kaikkea, kumpaa niistä nyt pitäisi katsoa? Varmaankin olet kuullut, että keskiarvojen tuijottaminen on huono idea. Toisaalta keskiarvoista puhutaan niin paljon, ettei mediaanikaan voi olla ihan ylivoimainen.

Kuten maailmassa yleensä, yhtä oikeaa vastausta ei ole. Asian selvittämiseksi siirtykäämme hämyiselle teollisuusalueelle...

Kari omistaa tehtaan, karttakeppitehtaan. Viime vuosikymmenen opetusteknologinen rakennemuutos on johtanut tehtaan toimintojen sopeuttamiseen, toisin sanoen firmassa työskentelee enää parikymmentä ihmistä ja heistäkin osa vajaita tunteja. Lähdetäänpä tutkimaan hieman palkkojen jakautumista eri keskilukujen avulla.

Keskiarvo

Keskiarvon laskeminen on kaikille tuttua: palkkojen summa jaetaan palkansaajien määrällä.

Karin firmassa keskipalkka on 2650 euroa. Ei kai ihan huonommin matalalle teollisuudelle? Mutta otetaanpa toinen luku: muiden työntekijöiden kuin toimitusjohtaja Karin keskipalkka on... 2160 euroa. Puoli tonnia vähemmän!

Tämä havainnollistaa hyvin sitä, että äärimmäiset arvot voivat vaikuttaa keskiarvoon tuntuvasti. Lukujen vertaaminen kertoo myös siitä, että vanha kapitalisti tietää, mistä kate tulee — ja mitä sillä voi tehdä. (Harjoitus: kuinka suuri Karin palkka on?)

Yliopistolaiset kohtalaisen kiinnostuneita sigma-algebroista. Kuvassa hyvin innostunut matemaatikko.

Tilastokeskus tietää kertoa, että keskimäärin suomalaisessa lapsiperheessä on 1,85 lasta. Kuitenkin tavanomaisella asuinalueella ympärilleen katsellessa näkee vain kokonaisia lapsia. Keskiarvon ei ilmiselvästi tarvitse olla mahdollinen arvo!

Sama pätee palkkarakenteeseen. Yksikään Karin työntekijöistä ei saa 2160 euron palkkaa. Kohta selviää, miksei.

Tyyppiarvo

Moodi on Helsingin yliopiston tilastotieteen ainejärjestö. Tyyppiarvo taas on sen järjestölehti.

Moodi eli tyyppiarvo myöskin tarkoittaa aineiston yleisintä lukua. Keskimääräisessä lapsiperheessä saattaa olla 1,85 lasta, mutta saman tilaston mukaan useimmin lapsiperheessä on tasan yksi lapsi.

Palkat tosin taitavat usein riippua niin monesta tekijästä, että harvemmin kahdella työntekijällä on sama liksa. Karin lafkassa näin ei ainakaan ole, joten tyyppiarvosta ei ole mitään hyötyä. Siksi moodi on jäänyt tunnusluvuissa vähän samaan asemaan kuin Moodi ry opiskelijahuoneiden jaossa: kellarin hämärään nurkkaan. (Mutta ilmapiiri on sitäkin mahtavampi!)

Puhkikulunut sohva ja huonoa huumoria.

Mediaani

Mediaani saadaan laittamalla palkat suuruusjärjestykseen ja valitsemalla keskimmäinen. Se siis kertoo, missä palkkojen puoliväli menee: puolet saa vähemmän ja puolet enemmän.

Karin tehtaassa palkkojen mediaani on 1750 euroa. Se kertookin jo karumman kuvan: ainakin puolet työntekijöistä saa enintään tuon suuruista palkkaa.

Mediaania käytetään usein keskiarvon sijasta, koska ääripäät eivät vaikuta siihen samalla tavalla. Mediaani on kirjaimellisesti keskellä aineistoa ja siksi kuvaa paremmin "tyypillistä" arvoa. Sekään ei kuitenkaan ole täydellinen, koska luvut eivät välttämättä ole tasaisesti jakautuneita.

Persentiilit ja histogrammit

Jos mediaani kerran kertoo puolestavälistä, mieleen tulee, voisiko sitä yleistää. Vilkaisu nettiotsikoihin kertoo, että kyllä voi: klikkaa nähdäksesi, paljonko rikkain prosentti tienaa!

Yksi todella hyödyllinen tapa on jatkaa suuruusjärjestykseen pistetyllä palkkalistalla, mutta jakaa se neljänneksiin. Kuvan muodossa tämä esitetään usein viiksilaatikoilla, joissa viikset esittävät koko palkkajakauman ja laatikko sen alueen, jolla keskimmäiset kaksi neljäsosaa palkoista ovat.

Laatikon päällä on melko pitkä viiksi.

Saman voi esittää toisellakin tavalla, nimittäin histogrammina. Histogrammi on hieno nimitys pylväskaaviolle, jossa vaaka-akseli on jaettu tasaisiin paloihin ja pylvään korkeus kertoo, kuinka moni palkansaaja kuuluu palaseen. Jos Karin tehtaan palkkalista jaetaan palasiin, joiden leveys on 500 euroa, saadaan tämännäköinen kuva...

Kaksi rypästä ja kaukana pidemmällä yhden hengen pylväs.

...ja nyt ainakin on ilmeistä, minkälainen henkilöstörakenne firmassa on! Kari maksaa sorvaajille vähän, keskijohdolle ja myynnille kohtuu runsaasti ja itselleen sitten pikkaisen extraa eläkekassaan. Vaikka matemaatikot liitutauluja vielä ostavatkin, alkaa karttakeppimaakarin olla hyvä aika feidata.

Tarinan matemaattinen opetus on yksinkertainen: ei ole yhtä oikeaa keskilukua. Sen sijaan ne kaikki ovat yleensä jotenkin väärässä. Liian usein monimutkaisia asioita yritetään tiivistää yhteen ainoaan lukuarvoon, ja silloin menetetään paljon. Vai mitä sanot allaolevista kuvaajista? Jokaisen keskiarvo ja mediaani on 3.

Tasainen jako, ääripäihin keskittynyt jako, kellokäyrän mallinen jako.

2 kommenttia:

  1. Normand Baillargeonia luettu? Hyvä hyvä.

    VastaaPoista
    Vastaukset
    1. Sieltähän tämä aihe tuli (yhdessä tilaston perusopintojen kanssa), tekstistä satuin jättämään linkin muinaiseen (10/2016) lukuvinkkiini pois. Elikkä plagioitu aihe ja plagioitu kehystarina ;)

      Poista

Kommentit ovat moderoituja — yritän hyväksyä kommenttisi mahdollisimman pian. Voit kirjoittaa kommenttiin LaTeX-koodia tai yksinkertaista HTML-merkintää: lue lisää Kommentointi-sivulta.