MINTAVÉTEL

Mintavételnek hívjuk az összes olyan döntést, amikor egy elemzésben, vizsgálatban a potenciális válaszadóknak csak egy részétől gyűjtünk be adatot, vonjuk be az elemzésbe.

Az elemzői munka minőségére (az eredmények megbízhatóságára) a legnagyobb hatással a mintavétel megfelelősége van. Alkalmazhatja valaki a legjobb szakértőket, választhatja a legizgalmasabb bonyolult statisztikai elemző eszközöket, vagy éppen a legjobb kérdéseket teheti fel a leggondosabb felkészítés mellett – ha nem megfelelő a minta kiválasztása, akkor minden eredménye hibás lesz.

Fontos tudni, hogy nem csak megkérdezésnél lehet mintavételről beszélni, ugyanilyen elvek és feltételek vonatkoznak egy gépsoron az ellenőrzött munkadarabok kiválasztására vagy éppen egy nagy vevőnyilvántartás szúrópróba szerinti újranézése esetén is. A Big Data típusú vizsgálatok esetén is rendszeres, hogy nem a teljes (akár százmilliós) adatbázison futtatnak elemzéseket, hanem kisebb, szűkebb részmintákon.

A mintavételi feladat végrehajtásához a kiinduló állapot az alapsokaság meghatározása – vagyis hogy elvileg kik között akarunk kérdezni, kikre lesz érvényes a piackutatásunk, elemzésünk. Lehetséges ilyen meghatározás pl., hogy az elkövetkező 12 hónapban téligumit vásárlókra akarunk érvényes megállapításokat tenni, de lehet ez egy demográfiai feltétel vagy éppen földrajzi jellemző.

Ezt követően fontos meghatároznunk, hogy mennyi mintavételi pontot (válaszadót, munkadarabot, elemszámot stb.) szeretnénk bevonni az elemzésbe. Ennek meghatározása egyrészt a költségek függvénye, másrészt a becslés pontosságának elvárt mértéke alapján történhet. Minden vizsgálat esetén a felhasznált statisztikai módszerek és kérdéstípusok erősen befolyásolják az azokhoz szükséges elemszámokat.

A mintavételi megoldásoknál megkülönböztetünk véletlen és nem véletlen mintákat.

A nem véletlen mintavétel egyik variációja, amikor teljes körű adatfelvétel történik (tehát az adatrögzítésbe és elemzésbe minden olyan személy vagy adatpont bekerül, aki érintett), de ez szinte sohasem valósul meg. Ha valaki például csak 100 vevővel rendelkezik és mindenkit megkérdez a munkájáról, akkor az elvi szinten teljes körű, de ha már 1-2 vevő nem válaszol, akkor itt is mintavétel történik.

A nem véletlen mintavételek közös jellemzője, hogy valamilyen hatás miatt a célcsoport nem minden elemének van esélye bekerülni a mintába. Ez a torzítás lehet tudatos (pl. Facebookról keresünk válaszadókat, de nem minden vevőnk használ internetet vagy közösségi médiát) vagy nem szándékolt (ilyen, amikor egy vevőnk adatai hibásak, ezért nem kapja meg a felkérést). A nem véletlen mintavételek következménye az elemzés megbízhatóságának romlása, ugyanis ilyen esetben nincs ismeretünk arról, hogy milyen válaszok, szegmensek maradtak ki az adatgyűjtésből.

A véletlen mintavételeknek számos variációja van, de közös jellemzőjük, hogy az alapsokaság minden tagjának ismert és nullánál nagyobb az esélye a mintába kerülésre. Mindkét kifejezésnek van jelentősége, mert fontos, hogy az elemző számára előre tudott legyen, hogy mekkora az elméleti esélyhányados, míg azzal, hogy ez a valószínűség nem nulla, az is biztos, hogy valamilyen módon minden tagról gyűjthető lenne információ.

A mintavételi módszerek között gyakran alkalmazott az egyszerű véletlen mintavétel – ennek feltétele, hogy minden szereplőnek azonos legyen az esélye (jellemzően 1/n) a bekerülésre.

Másik gyakran alkalmazott megoldás, amikor egyes részcsoportok előre meghatározottan nagyobb vagy kisebb valószínűséggel kerülnek be annak érdekében, hogy a részterület elemezhető legyen (pl. az országos vizsgálatoknál rendszerint Budapesten és Borsod megyében a lélekszámhoz képest kevesebb interjú készül annak érdekében, hogy a kisebb megyékben – elsősorban Tolna és Nógrád kerül ide – legyen annyi adat, hogy önállóan is elemezhető legyen az ottani viselkedés. Ennek a megoldásnak nem arányos véletlen mintavétel a neve.

Harmadik gyakran hallott kifejezés a rétegzett (vagy többlépcsős) mintavétel. Ilyenkor nem egy lépésben választják ki a válaszadókat, hanem 2-3 lépésben jutnak el odáig, hogy legyenek válaszadók. Ennek lényege, hogy elsőre meghatározzák mondjuk a nemek közötti arányt – legyen ez mondjuk 40-60% az egyik nem javára, majd ezen belül választják ki a korcsoportokat, és csak harmadik lépésben vesznek ki, pl. 10-20-30 válaszadót az egyes csoportokból.

Szintén jellemző kifejezés az arányos vagy önsúlyozó minta. Ez nem jelent mást, mint hogy a mintában néhány kiválasztott kulcsdimenzió szerint pontosan akkora arányban fordulnak elő a mintavételi pontok, mint a teljes alapsokaságban, így a minta belső aránya már önmagában leköveti a vizsgált populáció arányait.

Végezetül egy fontos kérdés: ha valaki elhelyez a saját oldalán, közösségi médiafelületein egy kérdőívet, akkor az arra válaszolók sohasem képeznek majd véletlen mintavételt, aminek két oka van.

Egyrészt ki vannak zárva azok a válaszadásból, akik nem találták meg a kérdőívet, így vannak olyanok, akiknek a bekerülési valószínűsége 0. Másrészt, akik meg is találták a kérdőívet, maguk döntenek a kitöltésről, így önkiválasztásról beszélhetünk, ahol a bekerülés valószínűsége előre nem ismert – a válaszadó éppen aktuális hajlandóságától függ, és ez a kapcsolat vagy döntés nagyon bizonytalan.

 Utoljára szerkesztve: 2020. március 28

KAPCSOLÓDÓ FOGALMAK

kapcsolódó dossziék

Oldalunk célja a tájékoztatás. Minden tartalmat a legnagyobb gondossággal állítottunk össze és rendszeresen ellenőrzünk, az itt szereplő információk azonban nem tekinthetők konkrét helyzetekre vonatkozó üzleti vagy jogi tanácsadásnak. Az itt szereplő információk alkalmazásából fakadó bármilyen jogkövetkezményért a kiadó felelősséget nem vállal.

Hivatalos állásfoglalásért mindig forduljon az illetékes hivatalhoz, ha tanácsadásra van szüksége, a megfelelő szakértőkhöz! Ha az oldalon aktualitását vesztett, hibás információt találna, kérjük, jelezze nekünk: hibabejelentes@startupguide.hu.