Kansrekening
voor Bouwkunde
in het
voetspoor van Dekking c.s. (2002)
Prof.dr.ir. T.M. de Jong
2003-03-02
1.1 Kansruimte
W,
bestaande uit alle mogelijke gevallen w
1.2 Eenvoudige
gebeurtenis A, samengesteld uit bijzondere gevallen a, eerste
somregel.
1.3 Meervoudige gebeurtenis, eerste productregel.
1.7 Ontwerpen van spreidingstoestanden
2.3 Drie verzamelingen wordt al moeilijk
2.4 Eenvoudige
problemen kunnen al meer verzamelingen inhouden
3.2 De
Wet van de totale kansruimte
Het begrip ‘kans’ is een
aanvankelijk intuïtief begrip waarop in het verleden tal van definitiepogingen
zijn stukgelopen. Toch begrijpt iedereen dat de kans om één te gooien bij het
werpen van een gewone dobbelsteen één op zes is. De daarmee bedoelde kans P (probability) is dus een verhouding die kan worden uitgedrukt
in de breuk 1/6. Intuïtie wordt hier vertaald in wiskunde. Bij meer worpen,
dobbelstenen of eisen aan de uitkomst schiet de intuïtie tekort, zodat daarvoor
een wiskundige benadering vereist is. Er waren 4 eeuwen nodig om het volgende
betoog rond te krijgen.
De noemer van de breuk
(1/6), staat voor het aantal (#W) van alle (bij de
dobbelsteen 6) gevallen w die mogelijk zijn in de kansruimte
(verzameling) W. Deze Griekse hoofdletter (omega) lijkt treffend
op een omgekeerde vaas. Wanneer men een vaas met zes verschillend gekleurde
knikkers omkeert, dan is bij de eerste knikker die eruit valt de kans op een
bepaalde kleur (gebeurtenisdefinitie) ook één op zes. Bij de tweede knikker is de kans
op één van de overgebleven kleuren echter 1/5, bij de derde 1/4 enzovoort. Deze
vergroting van de kans door verkleining van de kansruimte ontstaat alleen als
men de gevallen knikkers niet teruglegt in de vaas. Als men de vaas overeind
laat staan kan men ‘blind trekken’ en al of niet terugleggen. Bij het ‘werpen’ van
een dobbelsteen zijn alleen gevallen ‘met teruglegging’ denkbaar omdat de ogen van een dobbelsteen na de
worp nu eenmaal niet van de dobbelsteen verdwijnen zodat de kans bij elke worp
even groot blijft als de eerste keer. Bij 6x gooien zijn 6x6x6x6x6x6=66
volgorden van
eventueel herhaalde uitkomsten mogelijk (de eerste keer 6, de tweede keer ook 6
enzovoort). Bij de vaas zonder teruglegging zijn echter 6x5x4x3x2x1=6!
(‘zesfaculteit’, de eerste keer 6, de tweede keer 5 enzovoort)
kleurvolgorden zonder herhaling mogelijk.
Dat is beduidend minder dan wanneer men de herhaalde uitkomsten meerekent.
De teller van de genoemde
breuk 1/6, staat voor het geval van één bijzondere gebeurtenis. In dit geval is
dat het gooien van een één, maar het gooien van een twee, een drie enzovoort tot
zes is bij een eerlijke dobbelsteen even zeldzaam. Dat één van deze 6 gevallen {a1,
a2, a3, a4, a5, a6}
gegooid zal worden is de enige zekerheid die men heeft vóór de gebeurtenis.
De kans dat men:
·
één van de getallen
{1, 2, 3, 4, 5, 6} gooit (zekere gebeurtenis) is zes op zes (P=1);
·
een nul gooit
(onmogelijke gebeurtenis) is 0 (P=0);
·
één van de getallen
{1, 2, 3} gooit (gebeurtenis) is drie op zes (eerste somregel, P=1/6+1/6+1/6=0,5).
Het getal waarin men de
vooraf gedefinieerde gevallen a1, a2, a3 …
optelt tot een vooraf gedefinieerde gebeurtenis, wordt in de kansrekening
aangegeven met de letter A. De kans op deze gebeurtenis is dus P=#A/#W. De vorm van de letter A lijkt toevallig op een
stroom gevallen die uit een vaas valt.
Als men twee keer mag
werpen (meervoudige gebeurtenis), dan is de kans om beide keren een één te werpen
1/6x1/6=1/36 (productregel). Men kiest dit keer het product omdat de kans
dat een worp aan de gebeurtenisdefinitie beantwoordt (gunstige uitkomst) die van alle keren samen reduceert. Dat geldt
evengoed voor het werpen van een één en vervolgens een twee, een zes en
vervolgens een vijf of welke vooraf gedefinieerde volgorde van twee gevallen
dan ook. Er zijn 6x6=62=36 mogelijkheden om op die manier een
meervoudige gebeurtenis vooraf eenduidig te definiëren, zodat de kans op elke
eenduidig gebeurtenis afzonderlijk P=1/36 is. Bij het trekken zonder
teruglegging (zonder
herhaling) van twee knikkers van de zes uit een vaas zijn
het er 6x5=30 (dat is hetzelfde als 6x5 x 4x3x2x1 / 4x3x2x1 ofwel
6!/(6-2)!). De kans 1/30 op één van die mogelijkheden is groter dan bij de
dobbelsteen (1/36, per definitie met teruglegging). Bij 3 keer werpen
zijn er 63 = 216 volgorden mogelijk, bij 3 keer trekken zonder
teruglegging 6x5x4 = 120 ofwel 6!/(6-3)! (d.w.z. 6x5x4 x 3x2x1 / 3x2x1).
De overblijvende
volgorden 3x2x1 van de vierde, vijfde en zesde keer trekken die we niet meer
benutten doen er niet meer toe en worden met (6-3)! in de noemer weggestreept.
Meer algemeen kan men
zeggen dat k keer werpen met een dobbelsteen die n uitkomsten heeft W = nk
volgorden (variaties) oplevert. Hetzelfde geldt overigens voor k
keuzen uit n letters, bijvoorbeeld 32=9: {aa ab ac ba bb bc ca cb
cc} of 23=8: {aaa aab aba baa abb bab bba bbb}. Het k<n keren
trekken of kiezen zonder teruglegging (en dus zonder uitkomstherhaling) uit
aanvankelijk n verschillend gekleurde knikkers levert #W = n!/(n-k)! volgorden. De (n-k)! volgorden van
n-k kleuren die er na k keer trekken uit n kleuren nog getrokken hadden kunnen
worden (buiten de gebeurtenis) doen er immers niet meer toe en worden
met de noemer weggestreept. Als men echter de volle n keren trekt (k=n) zijn n!
volgorden (permutaties) mogelijk omdat, n-k = 0 zodat #W = n! / 0! (0! wordt per definitie op 1 gesteld).
Hetzelfde geldt weer voor
k keuzen uit n=k letters, bijvoorbeeld 3!=6: {abc acb bac bca cab cba), waarvan
3!/2!=3 {arr rar rra} resteren als de volgorden van b en c om het even zijn.
Wanneer in de definitie
van een meervoudige gebeurtenis A van de telkens samenstellende gevallen {a1,
a2, …} een aantal niet stuk voor stuk, maar als categorie genoemd
zijn, dan doet de volgorde van die gevallen er binnen de gebeurtenis
kennelijk ook niet meer toe. Het aantal mogelijke volgorden in W blijft echter voor de kans op die categorie van
groot belang en moet uit het zinsverband van de gebeurtenisdefinitie worden
opgemaakt (meerduidige gebeurtenis). Bij het trekken uit een vaas met een rode, een
witte en vijf blauwe knikkers, is het binnen de kans om eerst of later zonder
teruglegging ooit een blauwe te trekken (gebeurtenisdefinitie!) niet meer van
belang wèlke blauwe men trekt. Men kan deze volgorden dus met de noemer ook
wegstrepen. Er zijn dan bij het maximaal aantal keren trekken n van de n! mogelijke,
n!/k! relevante volgorden in W overgebleven. De kansruimte van volgorden daalt met de grootte van
de beoogde categorie k, zodat de kans P stijgt. Bij minder dan n keren
trekken k moet men bovendien de mogelijke volgorden van de resterende keren die
men niet benut weer buiten beschouwing laten (wegstrepen): er zijn dan
n!/k!(n-k)! mogelijkheden over (combinaties). Het is overigens bij deze gebeurtenisdefinitie
binnen de keren k en binnen de niet getrokken rest n-k ook niet meer van belang
in welke volgorde men rood of wit trekt, zodat men ze in de restcategorie ‘niet
blauw’ kan plaatsen. Het aantal categorieën is nu door de gebeurtenisdefinitie
beperkt tot blauw en niet-blauw (bi-nominaal). Daarom heet de formule voor
combinaties C(n,k) = n!/k!(n-k)! ‘binomium van Newton’. Denk: ‘k uit n’, zeg: ’n over k’, schrijf (nk).
Wat in de tijd volgorde heet, is
in de ruimte orde, schikking of
indeling. Het ordenen van een bouwprogramma k in een
ruimte n kan op C(n,k) manieren. Wanneer men bijvoorbeeld een grid van 4 cellen
mag indelen met een programma van 0, 1, 2, 3 of 4 cellen bebouwing, zijn de 16
combinaties mogelijk waarvan in Figuur
1 de bebouwing zwart is weergegeven. Bij 16 cellen is
het aantal mogelijkheden al gestegen tot 65536 schikkingen waarvan in Figuur 2 alleen het aantal per programma k is
weergegeven. Bij deze aantallen tekent zich een normale verdeling af. De
meeste mogelijkheden ontstaan als het terrein voor de helft bebouwd is.
|
|
n = 16 |
|
|
|
Figuur 1 C(4,k) |
Figuur 2 C(16,k) |
|
|
|
|
Wanneer men alle
schikkingen van Figuur 1 onverdeeld optelt zijn dat 24=16
schikkingsmogelijkheden van 4 keuzen uit 2 legenda-eenheden. Wanneer men in de
eerste kolom van Figuur 1 de grijze elementen nader specificeert naar 4
legenda-eenheden die men
niet allemaal hoeft te gebruiken (zonder programma, met herhaling), heeft men 44
= 256 schikkingsmogelijkheden (variaties). Wanneer men telkens zonder herhaling
alle legenda-eenheden moet gebruiken, blijven daarvan 4! = 4x3x2x1 = 24
schikkingen (permutaties) over. Bij een programma van b ha bebouwing, g ha
groen en w ha water (waarvoor geldt b+g+w=n) zijn er n!/b!g!w! gridgebonden
ontwerpvarianten.
In Figuur 3 zijn alle mogelijke verdelingen van n = {1,2,3,4)
deeltjes over twee ruimten weergegeven. Als men de individuele deeltjes merkt
met A, B, C, D, kan men de schikkingsmogelijkheden per toestand (gebeurtenis) k
tellen. Deze bepalen de kans P dat deze toestand zal optreden. Extreem lage of
hoge waarden van k representeren concentratie in de ene of de andere ruimte. De
schikking van de individuele deeltjes doet er na telling niet meer toe, alleen
hun aantal is nog van belang.
|
|
Figuur 3 De verdeling van deeltjes over twee ruimten |
|
|
|
Figuur 4 De toenemende onwaarschijnlijkheid van concentratie met een groeiende n |
|
In Figuur 4 is weergegeven dat bij groei van het aantal deeltjes
(10, 100) zich een steeds smallere normale verdeling aftekent, hetgeen betekent
dat toestand k=n/2 (spreiding) steeds waarschijnlijker wordt. Afgebeeld zijn
verder een waarschijnlijke en onwaarschijnlijke verdeling van 100 deeltjes in
een cylinder. De kans op een bepaalde spreidingstoestand van zeer veel deeltjes
heeft een positieve relatie met de entropie S, afhankelijk van de integraal
gesommeerde warmte-inhoud Q per temperatuur T:
De (verandering van)
kracht waarmee een zuiger uit een cylinder gedrukt wordt is gelijk aan de
verhouding tussen (de verandering van) energie en entropie (Figuur 5).
|
|
Figuur
5 Carnot-motor |
|
In een cylindermotor
wordt gebruik gemaakt van afwisselende gebeurtenissen (toestanden) om
toegevoerde wanordelijke energie (warmte) gedeeltelijk om te zetten in
ordelijke beweging. Helaas kan dat alleen door een deel van de wanordelijke
energie af te voeren (de gebeurtenis ‘afkoelen’ verlaagt het rendement).
Het bepalen van de
spreidingstoestand (vorm) van legenda-eenheden (bebouwd,
onbebouwd, materiaal, ruimte, geparkeerde auto’s, groen, water) op
verschillende schaalniveaus speelt een hoofdrol in het ruimtelijk ontwerpen. In
Figuur 6 is de terminologie van toestand en proces
weergegeven. Elk vierkant bevat 100 stippen en heeft dus dezelfde dichtheid, maar een verschillende spreidingstoestand. Kiest
men een kleiner kader, dan verschilt de dichtheid weer. Daarmee krijgt het
begrip ‘vorm’ een schaalgelede, statistische betekenis.
|
|
Figuur 6 Spreidingstoestanden |
|
Deconcentratie in een
straal van 100km lijkt een natuurlijk proces, concentratie kost
bestuurlijke, culturele, economische en ontwerptechnische inspanning. De kans
dat dit lukt (opéénhoping) hangt onder andere af van de afstand (deviatie) van het gemiddelde: volkomen spreiding.
|
|
Figuur 7
Spreidingstoestanden in de Randstad |
In de twee rechter
figuren van Figuur 7 is de linker topografische weergave gestyleerd in
steden (stadsdelen) en dorpen (wijken). De grote cirkels met een straal van 3km
(‘steden’) zijn eenheden van 100 000 inwoners, de kleine met een straal van 1km
(‘dorpen’) zijn eenheden van 10 000 inwoners. De oppervlakte van de
cirkels komt toevallig goed overeen met het gemiddelde stedelijke ruimtegebruik
van 100 000 of 10 000 inwoners in Nederland. Waar de cirkels overlappen bestaat
dus een hogere stedelijke dichtheid dan gemiddeld in Nederland.
Om verder te reduceren kan men ook 10 cirkels samennemen tot cirkels
van een grotere orde. Daarmee worden andere vergelijkingen mogelijk,
bijvoorbeeld een vergelijking tussen Parijs, Londen en de Randstad. In
onderstaande figuur is deze vergelijking visueel gemaakt door 10 cirkels van
3km straal samen te nemen tot cirkels van 10km straal.
|
|
Figuur 8
Reductie ten behoeve van een visuele vergelijking |
|
We zien dat Parijs en
Londen een veel hogere agglomeratiedichtheid hebben dan in Nederland
gebruikelijk: de cirkels overlappen elkaar. In deze weergave is ook een groene
legenda van landschappen en landschapsparken toegevoegd. De ‘groene’ cirkels
zijn alleen daar getrokken waar binnen hun gebied juist minder dan een
gedefinieerd aantal inwoners aanwezig is. De vraag is, of behalve ruimtedruk
ook energie-inhoud en temperatuur en daarmee entropie op dit niveau een
zinvolle betekenis kan krijgen. Dit zou een wetenschapsgebied ‘Regional
physics’ rechtvaardigen.
Gesteld men gooit met een
dobbelsteen bij twee worpen zonder acht te slaan op de volgorde:
·
een één of
een twee (P=24/36-4/36=5/9)[b];
·
een één of
een drie (P=24/36-4/36=5/9);
enzovoort;
·
een één en
een twee (P=2/6x1/6=1/18)[c];
·
een één en
een drie (P=2/6x1/6=1/18);
enzovoort;
Het woordje ‘of’ geeft
meer mogelijkheden A en dus een grotere kans dan het woordje ‘en’.
Hoe zit dat?
Als begrippen of
verzamelingen overlappen geven zij problemen die niet zouden optreden wanneer
zij elkaar zouden uitsluiten. In een betoog maken overlappende begrippen
voegwoorden zoals ‘en’ en ‘of’ nodig. Deze voegwoorden zijn in het dagelijks
spraakgebruik dubbelzinnig. Zij worden daarom in de formele logica beperkt in
ondubbelzinnige operatoren zoals Ù (‘én’ alleen in de zin van ‘voor zover ook’) en Ú (‘of’ alleen in de zin van ‘zowel .. als ..’), om
zinsconstructies te maken die ook ergens op slaan. Het is dus beter om
uitsluitende (exclusieve, disjuncte) begrippen en verzamelingen te hanteren,
zodat dit soort voegwoorden en logische operatoren overbodig zijn.
Als men concreet
aftelbare verzamelingen A en B, bestaande uit aanwijsbare elementen a1,
a2 …am en b1, b2 …bn
(waarbij het aantal elementen #A=m en #B=n) tracht te karakteriseren, kan een
overlapping ontstaan waar a’s met b’s samenvallen. Die overlap geeft men weer
als ‘A Ç B’ (denk
‘A én B’ maar zeg ‘doorsnede van A en B’). Als men vervolgens de elementen van A en B
‘verenigt’ is dat iets anders dan optellen. Bij het optellen van alle a’s en
alle b’s telt de overlapping waar zij samenvallen immers dubbel. De vereniging
zonder dubbeltelling geeft men weer als ‘A È B’ (denk ‘A of B’, maar zeg ‘vereniging van
A en B’). Bij overlapping moet van de optelling #A + #B de overlap #A Ç B worden afgetrokken:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
#A È B |
= |
#A |
+ |
#B |
- |
#A Ç B |
|
|
Figuur 9 Vereniging zonder de overlapping |
|||||||||||
|
Vergelijking
1: #A È B = #A + #B - #A Ç B
Wanneer men bovendien een
omvattend (rechthoekig weergegeven) domein W met de elementen w1,
w2…wp
definieert waarbinnen beide (rond weergegeven) verzamelingen A en B passen,
ontstaan 16 combinaties in twee complementaire groepen (Figuur 10).
|
|
|
|
|
|
|
|
W |
A |
B |
A È B |
A Ç B |
A Ç Bc |
Ac Ç B |
(A Ç Bc) È (Ac Ç B) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Wc |
Ac |
Bc |
Ac Ç Bc |
Ac È Bc |
Ac È B |
A È Bc |
(Ac È B) Ç (A È Bc) |
|
|
|
(A È B)c |
(A Ç B)c |
|
|
|
|
|
|
Morgan’s Laws |
|
|
|
|
Figuur
10 Alle
deelverzamelingen van twee overlappende verzamelingen A en B binnen W |
|||||||
|
|
|
|
|
|
|
Het complement van A
(niet-A binnen W) wordt weergegeven met Ac, van B met Bc,
enzovoort.
Het complement (A È B)c van de vereniging A È B blijkt hier gelijk
aan de doorsnede Ac Ç Bc, terwijl
het complement (A Ç B)c van de doorsnede A Ç B gelijk is aan de vereniging Ac È Bc (Morgan’s laws, visueel afleidbaar
uit Figuur 10).
De vereniging A È B kan men in niet-overlappende, elkaar
uitsluitende (disjuncte) verzamelingen splitsen (Vergelijking 2, waarin Vergelijkingen
3 alle direkt visueel afleidbaar uit Figuur 10):
Vergelijking 2 A È B = A Ç B +
A Ç Bc + Ac
Ç B, waarin:
Vergelijkingen 3 A
Ç Bc = A - A Ç B
en Ac Ç B = B - A Ç B.
Substitueert men nu Vergelijkingen 3 in Vergelijking 2, dan
krijgt men Vergelijking 1. Deze
abstracte wiskundige voorstelling van visueel zo vanzelfsprekende zaken, gaat
zijn vruchten afwerpen wanneer men met meer dan 2 visueel niet meer
voorstelbare verzamelingen binnen W te maken krijgt.
Dat gebeurt vaak bij
‘gevallen’ a, b, c enz., als elementen van samengestelde ‘gebeurtenissen’ A, B,
C enzovoort. Als de gevallen a1, a2 …am, b1,
b2 …bn enz. gelijkwaardig zijn, krijgen de verzamelingen
A, B, C enz. een telbare inhoud #A, #B, #C enz., visueel voor te stellen als
oppervlakken binnen het oppervlak van alle mogelijke gevallen W. Hun kans P(A), P(B), P(C) enz. is dan hun
verhouding tot #W: #A/#W, #B/#W, #C/#W enzovoort. De kans op het optreden van een of ander element uit W is #W/#W, gelijk aan 1 ofwel 100%. De kansen P(A), P(B),
P(C) enz. maken daar deel van uit zodat daarvoor geldt: 0 £P(X) £1. Als ze elkaar uitsluiten kan men de kansen gewoon optellen. Als ze
daarentegen niet disjunct zijn moet men de overlappingen opsporen en van de
opgetelde gevallen aftrekken zoals in Vergelijking 1.
Dat is meteen al een
probleem wanneer men 3 verzamelingen heeft, omdat men de overlapping van drie
overlappingen drie keer aftrekt, zodat men die er weer een keer bij op moet
tellen om de hele oppervlakte eenmaal gevuld te krijgen.
|
||||||
|
|
|
|
|
|
|
P(AÈBÈC) |
= |
P(A) + P(B) +
P(C) |
- |
(P(AÇB)+P(BÇC)+P(BÇC)) |
+ |
P(AÇBÇC) |
|
|
|
|
|
|
|
Bij n>3
verzamelingen wordt het visueel onoverzichtelijk. Wiskundig wordt het een
afwisseling van aftrekken en optellen, waarbij de laatste term wordt opgeteld
als n oneven is en afgetrokken als n is, hetgeen in de formule wordt bereikt
met de factor (-1)n-1:
Vergelijking 4:
Dit bewijst men door
Vergelijking 1 toe te passen in P(A1ÈA2È … ÈAn), geïnterpreteerd als P((A1ÈA2È … )ÈAn) en dit herhaald voor de telkens overblijvende termen (A1ÈA2È … )[d].
Bij de
stedebouwkunde-oefening S4 in mei 2000-2001 werden cijfers gegeven voor vaardigheid
en kennis. Van de 64 ingeschreven studenten vielen 11 af; 31 deden zowel examen
in vaardigheid als in kennis. Van deze laatste categorie was de voorkennis van
29 bekend. De vraag deed zich voor of voorkennis bij de oefening zoveel invloed
had op de resultaten dat de oefeningen die deze voorkennis opleveren als
ingangsniveau verplicht gesteld moesten worden. Men kan zich daarbij nog
afvragen of dat in het bijzonder voor het vaardigheidsdeel of voor het
kennisdeel geldt. Er zijn dus drie verzamelingen: studenten die aan de
vaardigheidsbeoordeling meededen, studenten die aan de kennistoets meededen en
studenten waarvan de voorkennis bekend was. Alle verzamelingen zijn bovendien
verdeeld in voldoende en onvoldoende, zodat er 25 deelverzamelingen zijn. De
resultaten zijn in onderstaand schema in aantallen studenten gespecificeerd.
Moet men op grond van deze en soortgelijke uitkomsten een ingangsniveau eisen?
VAARDIGHEID |
|
|
|
|
|
|
|
|
|||
ONVOLDOENDE |
|
0 |
|
|
|
|
|
||||
|
VOLDOENDE |
|
0 |
|
|
|
KENNIS |
||||
|
|
|
|
|
|
0 |
ONVOLDOENDE |
||||
|
|
|
|
|
|
0 |
VOLDOENDE |
|
|||
|
|
|
|
1 |
1 |
|
|
|
7 |
2 |
|
|
|
3 |
|
1 |
3 |
0 |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
5 |
20 |
0 |
2 |
|
|
|
|
|
|
0 |
1 |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
3 |
|
|
|
|
|
|
VOLDOENDE |
|
6 |
|
afgevallen |
||||
|
|
ONVOLDOENDE |
|
5 |
|
afgevallen |
|||||
|
|
VOORKENNIS BEKEND |
|
||||||||
De kans op gevallen van A
binnen B wordt conditionele waarschijnlijkheid P(A|B) genoemd:
|
|
|
|
P(A|B)=P(A Ç B)/P(B) |
|
|
|
Ac
È B |
Figuur 11 A
binnen B |
Vergelijking 5 Kans
op A binnen B |
Figuur 12 Als A dan B |
|
|
|
Dit komt voor als alle
gevallen van A die niet tot B gerekend worden buiten beschouwing kunnen blijven
(gestippeld in Figuur 11), bijvoorbeeld omdat we B nu eenmaal geconstateerd hebben. A kan dus
alleen nog optreden binnen B. B is dan ‘noodzakelijke voorwaarde’ voor het
optreden van een geval van A. Men kan concluderen ‘als A dan B’, formeel
logisch weergegeven als A Þ B (voldoende voorwaarde, implicatie, zie Figuur 12)[f]. Dat laat onverlet dat B zonder A kan optreden,
maar als B eenmaal geconstateerd is, is er binnen de 100% kans op B als deel
daarvan nog een kans op A over (zie Vergelijking 5).
Zo zijn niet alle
gevallen van Architectuur (A) ook gebouwd (B) en niet alles wat gebouwd is, is
ook Architectuur. A en B horen wel tot de verzameling ontwerpen (W), al zijn daar bijvoorbeeld ook industriële
ontwerpen bij. Beperken we ons tot gebouwde architectuur, dan is de kans op
architectuur binnen alles wat gebouwd is gelijk aan P(A|B).
De kans op uitsluitend verschillende verjaardagen
is in een groep van:
1 persoon: 365/365;
2 personen ditzelfde vermenigvuldigd met de kans
op de 364 overblijvende dagen: 364/365;
3 personen met dit vermenigvuldigd met de kans op
de 363 overblijvende dagen: 363/365;
enzovoort:
i personen dit vermenigvuldigd met de kans op de
366-i overblijvende dagen: (366-i)/365.
De berekening is dus: |
Voor n := 1…100 levert dit telkens een produkt
van n termen, waarin i elke keer weer oploopt van 1 tot n. De uitkomsten van deze produkten staan in deze
grafiek: |
|
|
||
Figuur 13 De kans op verschillende verjaardagen |
||
|
Hieruit blijkt P(22) = 0,5243 en P(23) = 0.4927.
De kans op uitsluitend verschillende verjaardagen is dus in een groep van 22
personen iets meer dan 50%. De complementaire kans op tenminste één gelijke
verjaardag is bij 23 iets minder dan 50% en bij 23 iets meer dan 50%.
Het is opmerkelijk, dat de persoonlijk
interessante vraag naar de kans op gelijke verjaardagen veel moeilijker
direkt op te lossen valt dan via de voor niemand interessante complementaire
vraag naar de kans op verschillende verjaardagen. ‘Probeer het eens via
het complement’ leidt vaak ineens tot een eenvoudige oplossing (‘lateraal,
inclusief of integraal denken’).
In dit geval hebben we verder intuïtief aangenomen
dat elke volgende persoon tot een volgende vermenigvuldigingsfactor leidt.
Waarom een vermenigvuldiging?
Als ik iemand tegenkom,
dan is de kans dat onze B2(2 verjaardagen op verschillende dagen
vallen) gelijk aan P(B2). Als er nog iemand bij komt die A3(op
een willekeurige dag jarig is), dan is de kans dat B3(3 verjaardagen
op verschillende dagen vallen) gelijk aan de kans op B2 én A3
ofwel P(B2 Ç A3). P(B2 Ç A3) is niet gelijk aan P(B2)*P(A3)!
Volgens Vergelijking 5 is P( B2 Ç A3) = P(B2)*P(A3|B2).
In deze vorm is Vergelijking 5 meer algemeen bekend als de tweede productregel:
|
Vergelijking
6,
productregel: P(A Ç B)
= P(A|B)*P(B) |
|
A3 kan op 365
van de 365 dagen vallen: P(A3)=365/365, maar de voorwaarde in P(A3|B2)
dat B2(2 verjaardagen op verschillende dagen vallen) verbiedt A3(op
een willekeurige dag jarig te zijn) 2 van de 365 dagen, zodat de kans tot 263
dagen wordt beperkt: P(A3|B2) = 365/365 ‑ 2/365
= 263/365.
Men kan dus constateren:
P(B3) = P(B2)*P(A3|B2)
= (365/365)*( 364/365)*( 363/365) = 0.9918, en vervolgens:
P(B4)
= P(B3)*P(A4|B3) = (365/365)*( 364/365)*(
363/365) *(362/365) = 0.98364,
enzovoort tot n:
P(Bn) = P(Bn-1)*P(An|Bn-1)
= P(Bn-1)*((366-n)/365), waarin:
P(Bn-1) = P(Bn-2)*P(An-1|Bn-2)
= P(Bn-2)*((365-n)/365), waarin weer
P(Bn-2)
= P(Bn-3)*P(An-2|Bn-3) = P(Bn-3)*((364-n)/365),
enzovoort aflopend van
i=n tot 1 met telkens een vermenigvuldigingsfactor (366-i)/365 minder:
met als laatste
termen bijvoorbeeld:
P(B4) =
P(B3)*P(A4|B3) = (365/365)*(364/365)*(363/365)
*(362/365) = 0.98364, waarin:
P(B3) =
P(B2)*P(A3|B2) = (365/365)*( 364/365)*(
363/365) = 0.9918, waarin weer:
P(B2) =
P(B1)*P(A2|B1) = (365/365)*( 364/365) =
0,99726, waarin weer:
P(B1)
= P(B0)*P(A1|B0) = (365/365) = 1.
Als vraagstukken
moeilijk grijpbaar lijken, beperkt de voorwaardelijke kans P(A|B) de blik op de
gebeurtenis A tot gevallen van B. Deze beperking helpt alleen als de informatie
over B specifieker is dan over A. In het geval van de verjaardagen zou het dus
weinig zin gehad hebben om te proberen met P(B|A) verder te komen, want van A
wisten we alleen ‘het op een willekeurige dag jarig zijn’, terwijl we van B
‘het op verschillende dagen jarig zijn’ wisten. Waar A ‘onverschillig’ is,
maakt B wel verschil. We beperkten nieuwe gevallen A tot eerder beschouwde
gevallen B en niet omgekeerd, omdat in B al een verdergaande operationele
beperking beschikbaar was.
Wanneer we nieuwe
gevallen A onderbrengen in een bestaande categorie B is daarin een
tijdsvolgorde voorondersteld die verhelderend kan zijn bij het operationeel
maken van vraagstukken.
Als die
tijdsvolgorde er al niet is, kan het nuttig zijn hem in de wiskundige
beschouwing als gedachtenexperiment in te brengen en het tijdloze vraagstuk
‘hoeveel kans bij n personen’ te beginnen bij één of twee personen en er dan
telkens één bij te nemen om te zien of er een regelmatigheid ontstaat die
wiskundig te vangen is. Wiskunde is de leer van de regelmaat. In het geval van
de verjaardagen werd met de kansregel P(Bn) = P(Bn-1)*P(An|Bn-1)
de nieuwe gebeurtenis An onder de oude regel Bn‑1
gebracht, waardoor een nieuwe kansregel Bn ontstond. Aangezien men
bij de vorige nieuwe gebeurtenis An-1 precies zo tewerk kon gaan ten
aanzien van de vorige oude regel Bn-2, ontstond in de regels zelf
een regelmaat, het toevoegen van een factor, die weer wiskundig te vangen was
in
Het gaat immers om
een produkt, en daarbij is evenals bij de som de volgorde niet meer van belang,
de regel van n produktregels is na het gedachtenexperiment weer tijdloos
geworden.
Gesteld dat 2% van
onze woningen B(niet brandveilig) is, en dat door de brandweer daarvan 99% terecht
A(wordt afkeurd), maar van de Bc(brandveilige) woningen 5% ten
onrechte A(wordt afgekeurd). Hoeveel kans loop ik dan dat mijn woning wordt
afgekeurd (P(A))?
Hier staat:
a.
De kans dat mijn
woning B(niet brandveilig) is, P(B) = 0.02.
b.
De kans dat mijn woning
in zo’n geval terecht A(wordt afgekeurd), P(A|B) = 0.99.
c.
De kans dat mijn
woning Bc(brandveilig) is, P(Bc) = 0.98.
d.
De kans dat mijn
woning in zo’n geval ten onrechte A(wordt afgekeurd), P(A|Bc) =
0.05.
Volgens Vergelijking
6, productregel: P(A Ç B) = P(A|B)*P(B) gelden nu de volgende stelingen.
De kans dat mijn woning niet brandveilig is én
wordt afgekeurd P(A Ç B) =
P(A|B)*P(B).
De kans dat mijn woning brandveilig is én toch
wordt afgekeurd P(A Ç Bc)
= P(A|Bc)*P(Bc).
Die kansen mogen we
gewoon optellen omdat er geen overlappingen zijn tussen Bc en B, de
woning is brandveilig of niet, de woning A(wordt afgekeurd) terwijl hij
brandveilig is of niet: A = (A Ç Bc) È (A Ç B).
De kans dat mijn woning
wordt afgekeurd is dus P(A) = P(A Ç B) + P(A Ç Bc) =
P(A|B)*P(B) + P(A|Bc)*P(Bc) =
0,99 * 0,02 + 0,05 * 0,98 = 0,0688.
De 5% ten onrechte afkeuringen tellen dus behoorlijk mee.
B en Bc betreffen in twee
complementaire categorieën alle woningen en dus de totale kansruimte W, maar men kan onderscheid maken in verschillende
woningcategorieën C1, C2 tot Cn zodat #C1 + #C2 + … + #Cn = #W en daarvoor geldt dan een meer algemene wet van
totale kansruimte:
P(A) = P(A|C1)*P(C1) + P(A|C2)*P(C2)
+ … + P(A|Cn)*P(Cn) |
|
Vergelijking 7 De wet van de totale kansruimte |
|
Met deze somwet van
produktregels hebben we P(A) uit Vergelijking
6, productregel: P(A Ç B) = P(A|B)*P(B) uit al zijn voorwaarden losgemaakt door de totale
kansruimte in de beschouwing te betrekken, weer een geval van ‘Probeer het eens
via het complement’.
Ik weet nu wel
hoeveel kans er is dat mijn woning door de brandweer wordt afgekeurd, maar hoe
weet ik nu of dat dan terecht is? De kans dat mijn woning terecht als
B(brandgevaarlijk) is afgekeurd binnen de kans dat hij überhaupt wordt
A(afgekeurd) is weer een voorwaardelijke kans, nu omgekeerd: P(B|A).
Daarvoor geldt Vergelijking 5, zij het met A en B verwisseld: P(B|A)=P(B Ç A)/P(A).
De teller P(B Ç A) is hetzelfde als de al eerder met Vergelijking 6 uitgerekende
P(A Ç B) = P(A|B) * P(B) = 0,99 * 0,02 = 0,0198.
Ook de noemer hadden we al met een eenvoudige
voorganger van Vergelijking
7 uitgerekend:
P(A) = P(A|B) * P(B) + P(A|Bc) * P(Bc) = 0,99 * 0,02 + 0,05 * 0,98 = 0,0688.
Het quotiënt P(B Ç A)/P(A) is dus de gevraagde
P(B|A) = 0,28779.
De kans dat mijn
woning B(brandgevaarijk) is als zij wordt A(afgekeurd) is dus 29%. De overige
71% is dus de kans bij afkeuring van een Bc(niet-brandgevaarlijke)
woning!
De uitwerking naar
meer categorieën C staat bekend als Bayes’ Rule (Vergelijking
8).
P(A Ç Ci) |
|
P(A|Ci)*P(Ci) |
|
|
|
P(A) |
|
|
|
|
|
of uitgewerkt |
P(Ci|A)= |
P(A|Ci)*P(Ci) |
|
P(A|C1)*P(C1) + P(A|C2)*P(C2)
+ … + P(A|Cn)*P(Cn) |
(met Vergelijking 7) |
||
|
|||
Vergelijking
8 Bayes Rule |
|||
|
[a] Naar [Dekking, 2002 #3] blz. 13.
[b] In de matrix van alle 36 combinaties telkens twee
kolommen en twee rijen waarin 4 cellen overlappen:
11 |
21 |
31 |
41 |
51 |
61 |
12 |
22 |
32 |
42 |
52 |
62 |
13 |
23 |
33 |
43 |
53 |
63 |
14 |
24 |
34 |
44 |
54 |
64 |
15 |
25 |
35 |
45 |
55 |
65 |
16 |
26 |
36 |
46 |
56 |
66 |
[c] Omdat bij een ‘gunstige’ eerste worp met 2
gedefinieerde mogelijkheden in de teller, bij de tweede worp nog maar 1
gedefinieerde mogelijkheid overblijft.
[d] Zie [Dehling, 1995 #2], bladzijde 13.
[e] Naar [Dekking, 2002 #3] blz. 19.
[f] Zie [Jong, 2002 #1], bladzijde 196: in Figuur 12 zijn de gevallen waarin de uitspraak ‘Als A dan
B’ waar is zwart weergegeven. Deze
uitspraak is alleen onwaar als A niet B. Ook als niet B en niet A, is de
uitspraak áls A dan B waar.