Citeren? Stichting Lezen - Leesmonitor(2024). Definities statistiek. https://www.lezen.nl/onderzoek/definities-statistiek/.
15 februari 2021

Populatie (N) en steekproef (n)

De term ‘populatie’ verwijst naar de totale groep mensen waarover statistische uitspraken worden gedaan (bijvoorbeeld alle Nederlanders, alle basisscholieren). De term ‘steekproef’ verwijst naar een selecte groep mensen uit deze populatie, die deel heeft genomen aan het onderzoek.

Variabele

Een variabele is een grootheid die in waarde kan veranderen. Een onafhankelijke variabele verwijst naar een variabele die invloed uitoefent. Een afhankelijke variabele verwijst naar een variabele waarop invloed wordt uitgeoefend. Een onderzoek naar de invloed van de leesmotivatie op de leesvaardigheid, kent leesmotivatie als onafhankelijke en leesvaardigheid als afhankelijke variabele.

Mediator en moderator

Soms wordt de relatie tussen twee variabelen door een derde variabele verklaard; we spreken dan van een mediator. ‘Leesfrequentie’ kan bijvoorbeeld de relatie tussen ‘leesmotivatie’ en ‘leesvaardigheid’ verklaren; hoe groter de motivatie, hoe frequenter het lezen, en hoe hoger vervolgens de leesvaardigheid. Een derde variabele kan ook optreden als beïnvloeder of moderator. Hiervan is bijvoorbeeld sprake als vooral bij jongens meer lezen tot beter lezen leidt. ‘Sekse’ treedt in dat geval op als moderatorvariabele.

Gemiddelde (M) en standaarddeviatie (SD)

Voor elke variabele kan een gemiddelde worden berekend. Dit wordt gedaan door de getallen op te tellen en te delen door het aantal waarnemingen. De standaardafwijking is een spreidingsmaat. Deze wordt gebruikt om uit te drukken wat de verdeling of afwijking is ten opzichte van het gemiddelde. De meeste verschijnselen die worden onderzocht laten zich vatten in de normale verdeling (klokcurve). Dit betekent dat de meeste waarnemingen zich centreren rond het gemiddelde, en het aantal waarnemingen afneemt naarmate de afstand van het gemiddelde groter wordt. Zo zijn er bijvoorbeeld relatief veel Nederlandse vrouwen van 1.70 lang, maar veel minder van 1.85, en bijna geen van 1,50.

Correlatie versus causaliteit

De correlatie is de samenhang tussen twee variabelen. Het vinden van een correlatie betekent dat er sprake is van een verband. Als de correlatie is berekend, is de richting van het verband – welke variabele beïnvloedt de ander? – onbekend. Bij causaliteit is de richting van het verband wel bekend: er is sprake van een duidelijke oorzaak-gevolgrelatie. De meest zuivere manier om causaliteit vast te leggen is middels een gerandomiseerd experiment. Hierin worden proefpersonen bij toeval aan de experimentgroep en controlegroep toegewezen. Wordt er een verschil gevonden tussen de groepen in de waarde van de afhankelijke variabele, dan kan dit waarschijnlijk worden toegewezen aan de experimentele ingreep.

Statistische toets

Een statistische toets wordt gebruikt om te onderzoeken of voor een veronderstelling, ook wel hypothese, ondersteuning kan worden gevonden. De hypothese kan op basis van wat de test uitwijst worden aangenomen of verworpen.

Significantie

De significantie drukt uit of een uitkomst niet op toeval berust. De significantie wordt uitgedrukt als kans middels de waarde p. In de meeste onderzoeken betekent een waarde van p gelijk aan of kleiner dan 0,05 dat gesproken wordt van een significante uitkomst. Er is in dit geval een zekerheid van 95% dat het resultaat niet op toeval berust.

Effectgrootte

Effectgrootte verwijst naar de sterkte van het effect van een interventie. Een veelgebruikte maat voor het bepalen van effectgrootte is Cohens ‘d’. In het geval van een positieve waarde is er sprake van een gunstig effect; in het geval van een negatieve waarde is er sprake van een ongunstig effect.