Otanta

Perusjoukko

Perusjoukko eli populaatio on joukko, joka on tutkimuksen kohteena. Perusjoukkona voi olla esim. korkeasta verenpaineesta kärsivät, tietyn yrityksen asiakkaat, vuonna 2005 rekisteröidyt autot, tuotannossa syntyneet koneenosat, pörssissä noteeratut yritykset jne.

Kokonaistutkimuksessa tutkitaan koko perusjoukko.

Otos

Jos ei ole mahdollista tai kannattavaa tutkia koko perusjoukkoa, niin voidaan tutkia perusjoukon osajoukko. Jos tutkittavaa osajoukkoa voidaan perustellusti pitää edustavana, perusjoukko pienoiskoossa, niin sitä kutsutaan otokseksi.

Sopivalla otantamenetelmällä pyritään varmistamaan otoksen edustavuus. Parhaiten edustava otos saadaan satunnaisuutta apuna käyttäen (arvonta).

Edustavan otoksen avulla on mahdollista tehdä perusjoukkoa koskevia päätelmiä.

Näyte

Jos poimitaan tutkimukseen ne perusjoukon alkiot, jotka ovat 'saatavilla', niin kyseessä on näyte eikä otos. Näytteen valitsija tai näytteen kohteet voivat toimia puolueellisesti, koska näytettä ei valita arpomalla.

Esim. Katukysely on hyvä esimerkki näytteenotosta. Kadulla liikkujat eivät välttämättä kovin hyvin edusta tutkittavaa perusjoukkoa, ellei perusjoukkona ole kyseisellä kadulla kyseiseen aikaan liikkuvat.

Esim. Jos TV:n ajankohtaisohjelma pyytää katsojia sähköpostittamaan mielipiteensä ajankohtaisesta asiasta, niin kyseessä on itse valikoituva näyte. Osallistujat siis itse valitsevat itsensä. Ei varmaankaan ole perusteltua pitää tällaista osajoukkoa edustavana otoksena.

Kyselytutkimuksissa näytteen perusteella ei pidä tehdä perusjoukkoa koskevia päätelmiä.

Otannan virhelähteitä

Otannan virhelähteitä

Kehikkovirhe

Käytännössä koko perusjoukko ei aina ole käytettävissä otosta valittaessa.

kehikkovirhe

Esim. Otos helsinkiläisistä voidaan valita puhelinluettelosta. Puhelinluettelo ei kuitenkaan sisällä kaikkia helsinkiläisiä.

Esim. Otos suomalaisista yrityksistä voidaan valita rekisteristä, joka ei sisällä vasta perustettuja yrityksiä.

Jos koko perusjoukko ei ole käytettävissä otosta valittaessa, niin otoksen perusteella tehdyt perusjoukkoa koskevat päätelmät saattavat olla harhaisia. Näin on, jos käytettävissä olevan otantakehikon alkiot ovat tutkittavissa asioissa erilaisia kuin otantakehikkoon kuulumattomat.

Esim. Jos otos helsinkiläisistä valitaan puhelinluettelosta, niin alipeitto saattaa aiheuttaa merkittävän virheen. Voisi esimerkiksi ajatella, että melkoinen osa opiskelijoista, joilla ei ole lankapuhelinta, jää otantakehikon ulkopuolelle.

Joskus otantakehikko voi olla liian laaja ja sisältää varsinaiseen perusjoukkoon kuulumattomia. Kysely- ja haastattelututkimuksissa kannattaakin esittää kysymykset, joilla varmistetaan vastaajan kuuluminen tarkoitettuun perusjoukkoon.

Otantavirhe

Otantavirhe

Eri otokset, samankokoisetkin, antavat erilaisia tuloksia. Tässä on kyse sattuman aiheuttamasta otantavirheestä.

Otantavirheen suuruus voidaan todennäköisyyslaskennan keinoin arvioida. Itse asiassa otantavirhe on ainoa otantatutkimukseen liittyvä virhelaji, jonka suuruus voidaan laskennallisesti määrittää. Tilastollinen päättely eli perusjoukkoa koskevien päätelmien tekeminen perustuu otantavirheen tuntemiseen.

Kato

Osa otokseen valituista jää tavoittamatta tai kieltäytyy vastaamasta. Vastauskadon seurauksena otoksen perusteella tehdyt perusjoukkoa koskevat päätelmät saattavat olla harhaisia. Näin on, jos vastaamatta jääneet ovat tutkittavissa asioissa erilaisia kuin vastanneet.

Vastauskadon aiheuttaman harhan tarkkaa suuruutta ei yleensä pystytä määrittämään.

Otannan edut

Otantatutkimus on halvempi kuin kokonaistutkimus ja tulokset saadaan nopeammin. On ehkä yllättävää, mutta otantatutkimuksen tulokset voivat olla luotettavampia kuin kokonaistutkimuksen. Otantatutkimuksessa voidaan panostaa enemmän huolelliseen ja tarkkaan mittaamiseen sekä valitun otoksen tavoittamiseen. Kokonaistutkimuksessa kato ja kehikkovirhe ovat mahdollisia siinä kuin otantatutkimuksessakin.

Otoksen koko

Otoskoosta ei voi antaa yleispätevää ohjetta. Muutama esimerkki valaisee asiaa:

Esim. Tuotettujen laakerinkuulien halkaisijan keskiarvo voidaan selvittää riittävän tarkasti jo muutaman kymmenen kuulan otoksesta, jos kuulat ovat riittävän tasalaatuisia (halkaisijan vaihteluväli on pieni).

Esim. Jos eteläisen Suomen talitinttien maksasta löytyvien raskasmetallien pitoisuuksissa ei havaita suurta vaihtelua, niin jo muutaman kymmenen linnun otos riittää hyvin raskasmetallipitoisuuksien määrittämiseen.

Esim. Jos halutaan verrata eri ikäryhmien internet-käyttötottumuksia, niin otoksesta täytyy löytyä vähintään 30 mielellään 60 edustajaa kustakin ikäryhmästä.

Esim. Jos tutkitaan ydinvoiman vastustusta, niin prosenttiosuuksien virhemarginaali on 2-3 prosenttiyksikön luokkaa vielä 1000 henkilön otoksellakin. Yleensäkin prosenttiosuuksien tarkkaan määrittämiseen tarvitaan suuri otos.

Esim. Jos kyselyn perusjoukkona on yrityksen 500 työntekijää, niin lienee järkevintä suorittaa kokonaistutkimus.

Pienestä otoksesta voi otantavirheen takia tulla hyvinkin epäedustava. Otoskokoa kasvattamalla voidaan aina pienentää epäedustavan otoksen todennäköisyyttä. Nyrkkisääntö: käytä niin suurta otosta kuin resurssit suinkin sallivat.

Otantamenetelmiä

Esim. Jos valmistetun tuotteen laatua tutkitaan valitsemalla tutkittavaksi osa maanantai aamupäivän tuotannosta, niin kyseessä ei ole edustava otos koko tuotannosta, mutta voi olla edustava otos maanantai aamupäivän tuotannosta. Maanantai aamupäivän tuotanto saattaa laadultaan poiketa muiden ajankohtien tuotannosta.

Esim. Jos Alkoholiliikkeen asiakastutkimuksessa haastatellaan asiakkaita eri viikonpäivinä lounasaikaan, niin kyseessä ei ole edustava otos asiakaskunnasta, mutta voi olla edustava otos lounasaikaan asioivista asiakkaista. Lounasajan ulkopuolella liikkeessä asioivat saattavat olla mielipiteiltään erilaisia.

Esim. Jos Helsingin liiketalouden ammattikorkeakoulun opiskelijoista valitaan tutkittavat kiertämällä luokkahuoneissa päiväsaikaan, niin kyseessä ei ole edustava otos koulun opiskelijoista, mutta voi olla edustava otos päiväopiskelijoista. Otoksen ulkopuolelle jäävät iltaopiskelijat ja opinnäytetyövaiheessa olevat opiskelijat, jotka eivät enää osallistu luennoille.

Jos tutkija valitsee tutkittavia oman harkintansa mukaan, niin kyse ei ole otoksesta, vaan harkinnanvaraisesta näytteestä. Tällöin on kyseenalaista tehdä koko perusjoukkoa koskevia päätelmiä otoksen perusteella.

Otantamenetelmillä pyritään varmistamaan otannan satunnaisuus: kaikilla perusjoukon jäsenillä pitäisi olla samanlainen mahdollisuus päästä otokseen mukaan. Joissain menetelmissä voidaan myös varmistaa tiettyjen avainryhmien riittävän edustus. Käytännön tilanne ja käytössä olevat resurssit sanelevat minkälaista otantamenetelmää käytetään. On erityisen tärkeää, että käytetty otantamenetelmä kuvataan tutkimusraportissa yksityiskohtaisesti. Mahdollisuuksien mukaan pyritään soveltamaan joitain seuraavassa kuvattavista otantamenetelmistä:

Yksinkertainen satunnaisotanta - arvonta

Yksinkertainen satunnaisotanta

Otannan perusmenetelmä on yksinkertainen satunnaisotanta. Yksinkertaisessa satunnaisotannassa jokaisella alkiolla on yhtä suuri todennäköisyys tulla poimituksi otokseen. Yksinkertainen satunnaisotanta valitaan arpomalla.

Systemaattinen otanta - joka k:s

Systemaattinen otanta

Systemaattinen otanta sopii käytettäväksi silloin, kun perusjoukkoa ei tarkkaan pystytä määrittämään, esimerkiksi liikkeen asiakastutkimus ovensuukyselynä, liikennetutkimus maantiellä jne.. Systemaattisessa otannassa valitaan ensin poimintaväli. Jos perusjoukon koko on tiedossa, niin poimintaväli saadaan jakamalla perusjoukon koko halutulla otoskoolla. Jos poimintaväliksi valitaan k, niin seuraavaksi arvotaan k:n ensimmäisen tilastoyksikön joukosta yksi ja sen jälkeen poimitaan järjestyksessä joka k:s. tilastoyksikkö. Menetelmä sopii käytettäväksi myös silloin, jos käytettävissä on luettelo perusjoukon jäsenistä. Luettelosta voidaan poimia otos systemaattista otantaa käyttäen.

Systemaattista otantaa käytettäessä täytyy varmistaa, ettei poimintajonossa esiinny jaksollisuutta:

Esim. Pullotuskoneessa on 10 suutinta ja kone pullottaa 10 pulloa kerralla. Jos laaduntarkkailussa tarkastetaan joka kymmenes pullo, niin jokainen tarkastettu pullo on saman suuttimen pullottama. Kyseessä ei varmastikaan ole edustava otos pullotuskoneen pullottamista pulloista.

Ositettu otanta - avainryhmien edustus taattu

Ositettu otanta

Esim. Jos tutkimuksen tarkoituksena on vertailla Suomessa asuvia suomenkielisiä ja ruotsinkielisiä, niin yksinkertaisella satunnaisotannalla arvottu otos luultavasti sisältäisi aika vähän ruotsinkielisiä. Vertailua varten ruotsinkielisiä pitäisi kuitenkin olla niin paljon, että voitaisiin tehdä kaikkia Suomessa asuvia ruotsinkielisiä koskevia päätelmiä. Ratkaisu on ositettu otanta,  jossa arvotaan otos erikseen suomenkielisistä ja erikseen ruotsinkielisistä. Jos halutaan nimenomaan verrata kyseisiä ryhmiä toisiinsa, niin käytetään tasaista kiintiöintiä: suomenkielisiä arvotaan mukaan yhtä monta kuin ruotsinkielisiäkin. Tällöin otoksesta ei tietenkään suoraan voi tehdä kaikkia Suomessa asuvia koskevia päätelmiä, ainoastaan päätelmiä suomenkielisistä ja ruotsinkielisistä.

Esim. Jos tutkimuksen tarkoituksena on tehdä kaikkia Suomessa asuvia koskevia päätelmiä, mutta halutaan taata suomenkielisten ja ruotsinkielisten edustus otoksessa, niin voidaan käyttää suhteellista kiintiöintiä: suomenkielisten ja ruotsinkielisten suhde säilytetään samana kuin perusjoukossa.

Ositetussa otannassa voidaan osittavana muuttujana käyttää mitä tahansa tutkimuksen kannalta tärkeää muuttujaa, kuten  ikäryhmä, sukupuoli, asuinseutu jne..

Ryväsotanta

Ryväsotanta

Ryväsotannassa perusjoukon alkiot ryhmitellään ryppäisiin. Vain osa ryppäistä pääsee mukaan otokseen.

Esim. Oppilaitoksen opiskelijoista voidaan poimia otos arpomalla ensin otos luokkahuoneista, jolloin luokkahuoneet ovat nk. ryppäitä. Arvotuissa luokkahuoneissa käydään sitten suorittamassa kysely. Otoksessa pitäisi myös huomioida päivä ja iltaopiskelijat. Tämän voisi toteuttaa arpomalla otos luokkahuoneista päiväsaikaan ja toinen otos ilta-aikaan. Tässä yhdistetään ryväsotantaan ositettu otanta, jolla taataan päivä- ja iltaopiskelijoiden edustus.

Esim. Jos tutkitaan tänä vuonna peruskoulun aloittavia, niin voidaan poimia ensin otos kouluista, jolloin koulut ovat ryppäitä. Tämän jälkeen arvotaan kustakin otokseen tulleesta koulusta tietty määrä tutkimuksen kohderyhmään kuuluvia oppilaita.

Jos poimituista ryppäistä tutkitaan kaikki ryppäisiin kuuluvat alkiot, puhutaan yksiasteisesta ryväsotannasta. Jos poimituista ryppäistä valitaan vain osa alkioista tutkittavaksi, niin kyseessä on kaksiasteinen ryväsotanta.

Otanta ja Excel

Jos perusjoukon alkioista on käytettävissä tietokonemuodossa oleva numeroitu luettelo, niin voit valita Excelin avulla halutun kokoisen otoksen.

Oletetaan, että Exceliin on avattu luettelo, josta osa näkyy alla olevassa kuvassa:

Asiakasrekisteri

Valitse komento Tools-Data Analysis-Sampling (Työkalut Tietojen analysointi-Otanta). Jos Data Analysis -toimintoa ei löydy valikosta, niin voit ladata sen valikkoon Tools-Add Ins (Työkalut-Apuohjelmat) -toiminnon kautta.

Excel otanta

Otanta ikkunassa määritetään:

Toiminnon tuloksena saat tyhjään laskentataulukkoon otokseen mukaan tulevat numerot. Muut tiedot voit hakea taulukkohakufunktiolla VLOOKUP (PHAKU):

Taulukkohakufunktion käyttö

Funktio etsii solun A1 numeroa Taul1-laskentataulukon alueen A2:B1001 ensimmäisestä sarakkeesta ja palauttaa kyseisen numeron kohdalla olevan sarakkeen 2 tiedon (koska toiseksi viimeinen argumentti 2). Funktion viimeinen argumentti 0 tarkoittaa, että haetaan täsmälleen solun A1 sisältämää numeroa.

Huomaa, miten viittaus Taul1-taulukon soluihin on kiinteä (dollarimerkit). Tämän ansiosta funktio voidaan kopioida ensimmäiseltä riviltä taulukon muille riveille viittauksen muuttumatta.