Massa's elementen en de normale verdeling

Het is algemeen bekend dat de meeste, zo niet alle, menselijke eigenschappen in variërende mate voorkomen, en even bekend is de manier waarop dat gebeurt: de meeste mensen zitten rond het gemiddelde, en naarmate je verder van het gemiddelde afzit, zijn er minder mensen met die eigenschap: mensen van 1,75 meter zijn heel gewoon, en die van 1,20 of 2,20 meter zijn zeldzaam, met allerlei variaties daartussen. Mede vanwege het vele voorkomen ervan noemt men dit de "normale verdeling".

Dit geldt niet alleen voor menselijke eigenschappen, maar ook op heel veel andere plaatsen in de natuur. Het geldt eigenlijk overal waar de waarde van iets afhangt van een aantal andere factoren, als de factoren niet van elkaar afhangen - een aantal van vier of vijf is al voldoende. Een bekend voorbeeld is het aantal punten dat je gooit met bijvoorbeeld zes dobbelstenen. Als men als men het aantal keren dat een bepaalde uitkomst voorkomt gaat tellen, en je zet dat naast elkaar in een grafiek, krijg je een uitkomst van de vorm als hiernaast. Uitkomsten 6 (6 enen) en 36 (6 zessen) staan aan de uiteinden als zeldzaamheden, wat iedereen weet - iedereen weet ook wel wat het meest voorkomt: het gemiddelde van 6 en 36, dus 42 gedeeld door 2, is 21 (of ook: zes maal het gemiddeld aantal punten op een dobbelsteen, is zes maal 3,5; u weet wel: 1 tegenover 6, 2 tegenover 5, 3 tegenover 4). En als je hiervan en diagram maakt met horizontaal de score en vertikaal het aantal malen dat ze voorkomt, krijg je dit:

Het belang van het aantal factoren of aantal dobbelstenen wordt geïllustreerd door één enkele dobbelsteen te nemen. Dan hebben alle uitkomsten evenveel kans: zes komt even vaak voor als drie - dat wil zeggen: de grafiek loopt horizontaal: De eerste uitschieter in het midden ontstaat bij twee stenen, en die piek wordt steeds geprononceerder en de grafiek steeds "gladder" naarmate je meer dobbelstenen neemt.

Het aantal factoren oftewel dobbelstenen dat in de praktijk speelt, hangt natuurlijk ten nauwste samen met de omvang van de groep elementen die je aan het bestuderen bent: hoe meer elementen, hoe meer kans op diversiteit en hoe meer kans op meerdere factoren. Dat wil zeggen het gedrag van de normale verdeling is een eigenschap van grotere groepen. Eén aspect van die groepen is al beschreven, namelijk daar waar ze vormen van relatief zwakke interactie vertonen  . Als groepen, of hun eigenschappen, beschreven kunnen worden met dobbelstenen zoals zojuist, dan hebben ze totaal géén interactie - het bestaan van een interactie tussen de dobbelstenen, zeg bijvoorbeeld als er magneetjes in zaten, zou het patroon van de normale verdeling onmiddellijk verstoren - statistisch gezien is dat "vals spel'. Voor de praktische en met name menselijke toepassing zijn dat natuurlijk juist de interessante gevallen. Een groot van de wetenschap der statistiek bestaat uit het distilleren van zwakke interacties uit statistische gegevens.

In de meeste praktische gevallen komen de factoren niet in keurige aftelbare aantallen 1, 2, 3, enzovoort zoals bij dobbelstenen, maar in alle mogelijke waarden zoals bij lengtes: 1,41 , 1,42 , 1,43 , enzovoort. Dat wil zeggen: de trapjesgrafiek wordt een continue:

Uit de berekeningen die hierbij horen, zijn een aantal regels te halen. Dat is gedaan door de ontdekker van de grafiek, de wiskundige Gauss  . De eerste regel is dat alle Gaussiaanse grafieken slechts verschillen in twee opzichten: de waarde van het gemiddelde, en de waarde van de spreiding. Dat laatste kan je ook zeggen als hoe nauw of hoe wijd de grafiek is. De wiskundige maat ervoor is de standaard-deviatie, die bepaald wordt door van ieder punt te berekenen hoe ver het van het gemiddelde ligt, en van al deze waarden het gemiddelde te nemen. Een rekenvoorbeeld: zijn er dertig leerlingen in de klas en vijftien ervan hebben een 6 en vijftien hebben een 8, dan is het gemiddelde 7, en de standaarddeviatie 1 (dertig maal 1 gedeeld door dertig. Hebben er tien een 6, tien een 7, en tien een acht, is het gemiddelde ook 7, en de standaarddeviatie 0,67 (twintig maal 1 gedeeld door dertig). Hebben ze allemaal een 7, is het gemiddelde 7 en de standaarddeviatie 0.

Het grote belang van de standaarddeviatie is dat men het kan gebruiken als maatstaf voor afwijkingen van het gemiddelde: circa tweederde van alle gevallen ligt tussen de twee punten die één maal de standaarddeviatie van het gemiddelde afliggen, het licht rode gebied in de volgende grafiek:

En circa 95 procent van alle gevallen ligt tussen de punten die twee maal de standaarddeviatie van het gemiddelde afliggen, wat betekent dat slechts circa 5 procent erbuiten ligt, en dat laatste is het rode deel van de grafiek.

Een toepassingvoorbeeld is dat van de schoenenfabrikant. Welke maten moet de fabrikant in zijn assortiment hebben om zo veel mogelijk klanten te bedienen, zonder te veel geld kwijt te zijn aan de extreme gevallen waarvan hij heel weinig verkoopt. Dit wordt volledig bepaald door de standaarddeviatie. Wil hij 95 procent van alle mensen bedienen, dan moet hij de gemiddelde maat nemen, en twee standaarddeviaties daarboven en daarbeneden maken. En voor andere percentages valt dat allemaal precies te berekenen.

Het is volkomen duidelijk dat de Gaussiaanse verdeling dus eindeloos veel toepassingen heeft, van maatvoering in de kledingindustrie tot zaken als hoe hoog maak je de deuropening van een huis, en hoe richt ik een school in: hoe gemengder de klas, hoe meer de spreiding in slimheid, en hoe meer leerlingen er buiten de boot vallen. Omdat de Gaussianse verdeling zo veel voorkomt, heet hij ook heel vaak de "normale verdeling". En dat moet men dus eigenlijk zien in de gewone betekenis van "normaal": het is zoals de dingen normaal gaan.

De Gaussiaanse grafiek heeft uiterst belangrijke toepassingen in ons taalgebruik  , en ook belangrijke gevolgen voor het bestuderen en het besturen van de maatschappij  en de mens  .


Naar Groep en individu  , Gedragsonderscheid en rasonderscheid  , Gauss psychologisch  , of site home  ·.

27 jan.2006