2 Overlappende gebeurtenissen [a]

3 Voorwaardelijke kans [e]

1.1 Kansruimte W, bestaande uit alle mogelijke gevallen w

1.2 Eenvoudige gebeurtenis A, samengesteld uit bijzondere gevallen a, eerste somregel.

1.3 Meervoudige gebeurtenis, eerste productregel.

1.4 Meerduidige gebeurtenis

1.5 Ordening

1.6 Wanorde (entropie)

1.7 Ontwerpen van spreidingstoestanden

2.1 Logica

2.2 Twee verzamelingen

2.3 Drie verzamelingen wordt al moeilijk

2.4 Eenvoudige problemen kunnen al meer verzamelingen inhouden

3.1 De tweede produktregel

3.2 De Wet van de totale kansruimte

3.3 Bayes’ Rule

Het begrip ‘kans’ is een aanvankelijk intuïtief begrip waarop in het verleden tal van definitiepogingen zijn stukgelopen. Toch begrijpt iedereen dat de kans om één te gooien bij het werpen van een gewone dobbelsteen één op zes is. De daarmee bedoelde kans P (probability) is dus een verhouding die kan worden uitgedrukt in de breuk 1/6. Intuïtie wordt hier vertaald in wiskunde. Bij meer worpen, dobbelstenen of eisen aan de uitkomst schiet de intuïtie tekort, zodat daarvoor een wiskundige benadering vereist is. Er waren 4 eeuwen nodig om het volgende betoog rond te krijgen.

De noemer van de breuk (1/6), staat voor het aantal (#W) van alle (bij de dobbelsteen 6) gevallen w die mogelijk zijn in de kansruimte (verzameling) W. Deze Griekse hoofdletter (omega) lijkt treffend op een omgekeerde vaas. Wanneer men een vaas met zes verschillend gekleurde knikkers omkeert, dan is bij de eerste knikker die eruit valt de kans op een bepaalde kleur (gebeurtenisdefinitie) ook één op zes. Bij de tweede knikker is de kans op één van de overgebleven kleuren echter 1/5, bij de derde 1/4 enzovoort. Deze vergroting van de kans door verkleining van de kansruimte ontstaat alleen als men de gevallen knikkers niet teruglegt in de vaas. Als men de vaas overeind laat staan kan men ‘blind trekken’ en al of niet terugleggen. Bij het ‘werpen’ van een dobbelsteen zijn alleen gevallen ‘met teruglegging’ denkbaar omdat de ogen van een dobbelsteen na de worp nu eenmaal niet van de dobbelsteen verdwijnen zodat de kans bij elke worp even groot blijft als de eerste keer. Bij 6x gooien zijn 6x6x6x6x6x6=6⁶ volgorden van eventueel herhaalde uitkomsten mogelijk (de eerste keer 6, de tweede keer ook 6 enzovoort). Bij de vaas zonder teruglegging zijn echter 6x5x4x3x2x1=6! (‘zesfaculteit’, de eerste keer 6, de tweede keer 5 enzovoort) kleurvolgorden zonder herhaling mogelijk. Dat is beduidend minder dan wanneer men de herhaalde uitkomsten meerekent.

De teller van de genoemde breuk 1/6, staat voor het geval van één bijzondere gebeurtenis. In dit geval is dat het gooien van een één, maar het gooien van een twee, een drie enzovoort tot zes is bij een eerlijke dobbelsteen even zeldzaam. Dat één van deze 6 gevallen {a₁, a₂, a₃, a₄, a₅, a₆} gegooid zal worden is de enige zekerheid die men heeft vóór de gebeurtenis.

De kans dat men:

· één van de getallen {1, 2, 3, 4, 5, 6} gooit (zekere gebeurtenis) is zes op zes (P=1);

· een nul gooit (onmogelijke gebeurtenis) is 0 (P=0);

· één van de getallen {1, 2, 3} gooit (gebeurtenis) is drie op zes (eerste somregel, P=1/6+1/6+1/6=0,5).

Het getal waarin men de vooraf gedefinieerde gevallen a₁, a₂, a₃ … optelt tot een vooraf gedefinieerde gebeurtenis, wordt in de kansrekening aangegeven met de letter A. De kans op deze gebeurtenis is dus P=#A/#W. De vorm van de letter A lijkt toevallig op een stroom gevallen die uit een vaas valt.

Als men twee keer mag werpen (meervoudige gebeurtenis), dan is de kans om beide keren een één te werpen 1/6x1/6=1/36 (productregel). Men kiest dit keer het product omdat de kans dat een worp aan de gebeurtenisdefinitie beantwoordt (gunstige uitkomst) die van alle keren samen reduceert. Dat geldt evengoed voor het werpen van een één en vervolgens een twee, een zes en vervolgens een vijf of welke vooraf gedefinieerde volgorde van twee gevallen dan ook. Er zijn 6x6=6²=36 mogelijkheden om op die manier een meervoudige gebeurtenis vooraf eenduidig te definiëren, zodat de kans op elke eenduidig gebeurtenis afzonderlijk P=1/36 is. Bij het trekken zonder teruglegging (zonder herhaling) van twee knikkers van de zes uit een vaas zijn het er 6x5=30 (dat is hetzelfde als 6x5 x ~~4x3x2x1~~ / ~~4x3x2x1~~ ofwel 6!/(6-2)!). De kans 1/30 op één van die mogelijkheden is groter dan bij de dobbelsteen (1/36, per definitie met teruglegging). Bij 3 keer werpen zijn er 6³ = 216 volgorden mogelijk, bij 3 keer trekken zonder teruglegging 6x5x4 = 120 ofwel 6!/(6-3)! (d.w.z. 6x5x4 x ~~3x2x1~~ / ~~3x2x1~~).

De overblijvende volgorden 3x2x1 van de vierde, vijfde en zesde keer trekken die we niet meer benutten doen er niet meer toe en worden met (6-3)! in de noemer weggestreept.

Meer algemeen kan men zeggen dat k keer werpen met een dobbelsteen die n uitkomsten heeft W = n^k volgorden (variaties) oplevert. Hetzelfde geldt overigens voor k keuzen uit n letters, bijvoorbeeld 3²=9: {aa ab ac ba bb bc ca cb cc} of 2³=8: {aaa aab aba baa abb bab bba bbb}. Het k<n keren trekken of kiezen zonder teruglegging (en dus zonder uitkomstherhaling) uit aanvankelijk n verschillend gekleurde knikkers levert #W = n!/(n-k)! volgorden. De (n-k)! volgorden van n-k kleuren die er na k keer trekken uit n kleuren nog getrokken hadden kunnen worden (buiten de gebeurtenis) doen er immers niet meer toe en worden met de noemer weggestreept. Als men echter de volle n keren trekt (k=n) zijn n! volgorden (permutaties) mogelijk omdat, n-k = 0 zodat #W = n! / 0! (0! wordt per definitie op 1 gesteld).

Hetzelfde geldt weer voor k keuzen uit n=k letters, bijvoorbeeld 3!=6: {abc acb bac bca cab cba), waarvan 3!/2!=3 {arr rar rra} resteren als de volgorden van b en c om het even zijn.

Wanneer in de definitie van een meervoudige gebeurtenis A van de telkens samenstellende gevallen {a₁, a₂, …} een aantal niet stuk voor stuk, maar als categorie genoemd zijn, dan doet de volgorde van die gevallen er binnen de gebeurtenis kennelijk ook niet meer toe. Het aantal mogelijke volgorden in W blijft echter voor de kans op die categorie van groot belang en moet uit het zinsverband van de gebeurtenisdefinitie worden opgemaakt (meerduidige gebeurtenis). Bij het trekken uit een vaas met een rode, een witte en vijf blauwe knikkers, is het binnen de kans om eerst of later zonder teruglegging ooit een blauwe te trekken (gebeurtenisdefinitie!) niet meer van belang wèlke blauwe men trekt. Men kan deze volgorden dus met de noemer ook wegstrepen. Er zijn dan bij het maximaal aantal keren trekken n van de n! mogelijke, n!/k! relevante volgorden in W overgebleven. De kansruimte van volgorden daalt met de grootte van de beoogde categorie k, zodat de kans P stijgt. Bij minder dan n keren trekken k moet men bovendien de mogelijke volgorden van de resterende keren die men niet benut weer buiten beschouwing laten (wegstrepen): er zijn dan n!/k!(n-k)! mogelijkheden over (combinaties). Het is overigens bij deze gebeurtenisdefinitie binnen de keren k en binnen de niet getrokken rest n-k ook niet meer van belang in welke volgorde men rood of wit trekt, zodat men ze in de restcategorie ‘niet blauw’ kan plaatsen. Het aantal categorieën is nu door de gebeurtenisdefinitie beperkt tot blauw en niet-blauw (bi-nominaal). Daarom heet de formule voor combinaties C(n,k) = n!/k!(n-k)! ‘binomium van Newton’. Denk: ‘k uit n’, zeg: ’n over k’, schrijf (ⁿ_k).

Wat in de tijd volgorde heet, is in de ruimte orde, schikking of indeling. Het ordenen van een bouwprogramma k in een ruimte n kan op C(n,k) manieren. Wanneer men bijvoorbeeld een grid van 4 cellen mag indelen met een programma van 0, 1, 2, 3 of 4 cellen bebouwing, zijn de 16 combinaties mogelijk waarvan in Figuur 1 de bebouwing zwart is weergegeven. Bij 16 cellen is het aantal mogelijkheden al gestegen tot 65536 schikkingen waarvan in Figuur 2 alleen het aantal per programma k is weergegeven. Bij deze aantallen tekent zich een normale verdeling af. De meeste mogelijkheden ontstaan als het terrein voor de helft bebouwd is.

		_{n = 16}

Figuur 1 C(4,k)	Figuur 2 C(16,k)

Wanneer men alle schikkingen van Figuur 1 onverdeeld optelt zijn dat 2⁴=16 schikkingsmogelijkheden van 4 keuzen uit 2 legenda-eenheden. Wanneer men in de eerste kolom van Figuur 1 de grijze elementen nader specificeert naar 4 legenda-eenheden die men niet allemaal hoeft te gebruiken (zonder programma, met herhaling), heeft men 4⁴ = 256 schikkingsmogelijkheden (variaties). Wanneer men telkens zonder herhaling alle legenda-eenheden moet gebruiken, blijven daarvan 4! = 4x3x2x1 = 24 schikkingen (permutaties) over. Bij een programma van b ha bebouwing, g ha groen en w ha water (waarvoor geldt b+g+w=n) zijn er n!/b!g!w! gridgebonden ontwerpvarianten.

In Figuur 3 zijn alle mogelijke verdelingen van n = {1,2,3,4) deeltjes over twee ruimten weergegeven. Als men de individuele deeltjes merkt met A, B, C, D, kan men de schikkingsmogelijkheden per toestand (gebeurtenis) k tellen. Deze bepalen de kans P dat deze toestand zal optreden. Extreem lage of hoge waarden van k representeren concentratie in de ene of de andere ruimte. De schikking van de individuele deeltjes doet er na telling niet meer toe, alleen hun aantal is nog van belang.

Figuur 3 De verdeling van deeltjes over twee ruimten

Figuur 4 De toenemende onwaarschijnlijkheid van concentratie met een groeiende n

In Figuur 4 is weergegeven dat bij groei van het aantal deeltjes (10, 100) zich een steeds smallere normale verdeling aftekent, hetgeen betekent dat toestand k=n/2 (spreiding) steeds waarschijnlijker wordt. Afgebeeld zijn verder een waarschijnlijke en onwaarschijnlijke verdeling van 100 deeltjes in een cylinder. De kans op een bepaalde spreidingstoestand van zeer veel deeltjes heeft een positieve relatie met de entropie S, afhankelijk van de integraal gesommeerde warmte-inhoud Q per temperatuur T:

De (verandering van) kracht waarmee een zuiger uit een cylinder gedrukt wordt is gelijk aan de verhouding tussen (de verandering van) energie en entropie (Figuur 5).

Figuur 5 Carnot-motor

In een cylindermotor wordt gebruik gemaakt van afwisselende gebeurtenissen (toestanden) om toegevoerde wanordelijke energie (warmte) gedeeltelijk om te zetten in ordelijke beweging. Helaas kan dat alleen door een deel van de wanordelijke energie af te voeren (de gebeurtenis ‘afkoelen’ verlaagt het rendement).

Het bepalen van de spreidingstoestand (vorm) van legenda-eenheden (bebouwd, onbebouwd, materiaal, ruimte, geparkeerde auto’s, groen, water) op verschillende schaalniveaus speelt een hoofdrol in het ruimtelijk ontwerpen. In Figuur 6 is de terminologie van toestand en proces weergegeven. Elk vierkant bevat 100 stippen en heeft dus dezelfde dichtheid, maar een verschillende spreidingstoestand. Kiest men een kleiner kader, dan verschilt de dichtheid weer. Daarmee krijgt het begrip ‘vorm’ een schaalgelede, statistische betekenis.

Figuur 6 Spreidingstoestanden

Deconcentratie in een straal van 100km lijkt een natuurlijk proces, concentratie kost bestuurlijke, culturele, economische en ontwerptechnische inspanning. De kans dat dit lukt (opéénhoping) hangt onder andere af van de afstand (deviatie) van het gemiddelde: volkomen spreiding.

Figuur 7 Spreidingstoestanden in de Randstad

In de twee rechter figuren van Figuur 7 is de linker topografische weergave gestyleerd in steden (stadsdelen) en dorpen (wijken). De grote cirkels met een straal van 3km (‘steden’) zijn eenheden van 100 000 inwoners, de kleine met een straal van 1km (‘dorpen’) zijn eenheden van 10 000 inwoners. De oppervlakte van de cirkels komt toevallig goed overeen met het gemiddelde stedelijke ruimtegebruik van 100 000 of 10 000 inwoners in Nederland. Waar de cirkels overlappen bestaat dus een hogere stedelijke dichtheid dan gemiddeld in Nederland.

Om verder te reduceren kan men ook 10 cirkels samennemen tot cirkels van een grotere orde. Daarmee worden andere vergelijkingen mogelijk, bijvoorbeeld een vergelijking tussen Parijs, Londen en de Randstad. In onderstaande figuur is deze vergelijking visueel gemaakt door 10 cirkels van 3km straal samen te nemen tot cirkels van 10km straal.

Figuur 8 Reductie ten behoeve van een visuele vergelijking

We zien dat Parijs en Londen een veel hogere agglomeratiedichtheid hebben dan in Nederland gebruikelijk: de cirkels overlappen elkaar. In deze weergave is ook een groene legenda van landschappen en landschapsparken toegevoegd. De ‘groene’ cirkels zijn alleen daar getrokken waar binnen hun gebied juist minder dan een gedefinieerd aantal inwoners aanwezig is. De vraag is, of behalve ruimtedruk ook energie-inhoud en temperatuur en daarmee entropie op dit niveau een zinvolle betekenis kan krijgen. Dit zou een wetenschapsgebied ‘Regional physics’ rechtvaardigen.

Gesteld men gooit met een dobbelsteen bij twee worpen zonder acht te slaan op de volgorde:

· een één of een twee (P=24/36-4/36=5/9)[b];

· een één of een drie (P=24/36-4/36=5/9);

enzovoort;

· een één en een twee (P=2/6x1/6=1/18)[c];

· een één en een drie (P=2/6x1/6=1/18);

enzovoort;

Het woordje ‘of’ geeft meer mogelijkheden A en dus een grotere kans dan het woordje ‘en’.

Hoe zit dat?

Als begrippen of verzamelingen overlappen geven zij problemen die niet zouden optreden wanneer zij elkaar zouden uitsluiten. In een betoog maken overlappende begrippen voegwoorden zoals ‘en’ en ‘of’ nodig. Deze voegwoorden zijn in het dagelijks spraakgebruik dubbelzinnig. Zij worden daarom in de formele logica beperkt in ondubbelzinnige operatoren zoals Ù (‘én’ alleen in de zin van ‘voor zover ook’) en Ú (‘of’ alleen in de zin van ‘zowel .. als ..’), om zinsconstructies te maken die ook ergens op slaan. Het is dus beter om uitsluitende (exclusieve, disjuncte) begrippen en verzamelingen te hanteren, zodat dit soort voegwoorden en logische operatoren overbodig zijn.

Als men concreet aftelbare verzamelingen A en B, bestaande uit aanwijsbare elementen a₁, a₂ …a_m en b₁, b₂ …b_n (waarbij het aantal elementen #A=m en #B=n) tracht te karakteriseren, kan een overlapping ontstaan waar a’s met b’s samenvallen. Die overlap geeft men weer als ‘A Ç B’ (denk ‘A én B’ maar zeg ‘doorsnede van A en B’). Als men vervolgens de elementen van A en B ‘verenigt’ is dat iets anders dan optellen. Bij het optellen van alle a’s en alle b’s telt de overlapping waar zij samenvallen immers dubbel. De vereniging zonder dubbeltelling geeft men weer als ‘A È B’ (denk ‘A of B’, maar zeg ‘vereniging van A en B’). Bij overlapping moet van de optelling #A + #B de overlap #A Ç B worden afgetrokken:


	#A È B	=	#A	+	#B	-	#A Ç B
Figuur 9 Vereniging zonder de overlapping

Vergelijking 1: #A È B = #A + #B - #A Ç B

Wanneer men bovendien een omvattend (rechthoekig weergegeven) domein W met de elementen w₁, w₂…w_p definieert waarbinnen beide (rond weergegeven) verzamelingen A en B passen, ontstaan 16 combinaties in twee complementaire groepen (Figuur 10).


W	A	B	A È B	A Ç B	A Ç B^c	A^c Ç B	(A Ç B^c) È (A^c Ç B)


W^c	A^c	B^c	A^c Ç B^c	A^c È B^c	A^c È B	A È B^c	(A^c È B) Ç (A È B^c)
			(A È B)^c	(A Ç B)^c
			Morgan’s Laws
Figuur 10 Alle deelverzamelingen van twee overlappende verzamelingen A en B binnen W

Het complement van A (niet-A binnen W) wordt weergegeven met A^c, van B met B^c, enzovoort.

Het complement (A È B)^c van de vereniging A È B blijkt hier gelijk aan de doorsnede A^c Ç B^c, terwijl

het complement (A Ç B)^c van de doorsnede A Ç B gelijk is aan de vereniging A^c È B^c (Morgan’s laws, visueel afleidbaar uit Figuur 10).

De vereniging A È B kan men in niet-overlappende, elkaar uitsluitende (disjuncte) verzamelingen splitsen (Vergelijking 2, waarin Vergelijkingen 3 alle direkt visueel afleidbaar uit Figuur 10):

Vergelijking 2 A È B = A Ç B + A Ç B^c + A^c Ç B, waarin:

Vergelijkingen 3 A Ç B^c = A - A Ç B en A^c Ç B = B - A Ç B.

Substitueert men nu Vergelijkingen 3 in Vergelijking 2, dan krijgt men Vergelijking 1. Deze abstracte wiskundige voorstelling van visueel zo vanzelfsprekende zaken, gaat zijn vruchten afwerpen wanneer men met meer dan 2 visueel niet meer voorstelbare verzamelingen binnen W te maken krijgt.

Dat gebeurt vaak bij ‘gevallen’ a, b, c enz., als elementen van samengestelde ‘gebeurtenissen’ A, B, C enzovoort. Als de gevallen a₁, a₂ …a_m, b₁, b₂ …b_n enz. gelijkwaardig zijn, krijgen de verzamelingen A, B, C enz. een telbare inhoud #A, #B, #C enz., visueel voor te stellen als oppervlakken binnen het oppervlak van alle mogelijke gevallen W. Hun kans P(A), P(B), P(C) enz. is dan hun verhouding tot #W: #A/#W, #B/#W, #C/#W enzovoort. De kans op het optreden van een of ander element uit W is #W/#W, gelijk aan 1 ofwel 100%. De kansen P(A), P(B), P(C) enz. maken daar deel van uit zodat daarvoor geldt: 0 £P(X) £1. Als ze elkaar uitsluiten kan men de kansen gewoon optellen. Als ze daarentegen niet disjunct zijn moet men de overlappingen opsporen en van de opgetelde gevallen aftrekken zoals in Vergelijking 1.

Dat is meteen al een probleem wanneer men 3 verzamelingen heeft, omdat men de overlapping van drie overlappingen drie keer aftrekt, zodat men die er weer een keer bij op moet tellen om de hele oppervlakte eenmaal gevuld te krijgen.

Bij n>3 verzamelingen wordt het visueel onoverzichtelijk. Wiskundig wordt het een afwisseling van aftrekken en optellen, waarbij de laatste term wordt opgeteld als n oneven is en afgetrokken als n is, hetgeen in de formule wordt bereikt met de factor (-1)^n-1:

Vergelijking 4:

Dit bewijst men door Vergelijking 1 toe te passen in P(A₁ÈA₂È … ÈA_n), geïnterpreteerd als P((A₁ÈA₂È … )ÈA_n) en dit herhaald voor de telkens overblijvende termen (A₁ÈA₂È … )[d].

Bij de stedebouwkunde-oefening S4 in mei 2000-2001 werden cijfers gegeven voor vaardigheid en kennis. Van de 64 ingeschreven studenten vielen 11 af; 31 deden zowel examen in vaardigheid als in kennis. Van deze laatste categorie was de voorkennis van 29 bekend. De vraag deed zich voor of voorkennis bij de oefening zoveel invloed had op de resultaten dat de oefeningen die deze voorkennis opleveren als ingangsniveau verplicht gesteld moesten worden. Men kan zich daarbij nog afvragen of dat in het bijzonder voor het vaardigheidsdeel of voor het kennisdeel geldt. Er zijn dus drie verzamelingen: studenten die aan de vaardigheidsbeoordeling meededen, studenten die aan de kennistoets meededen en studenten waarvan de voorkennis bekend was. Alle verzamelingen zijn bovendien verdeeld in voldoende en onvoldoende, zodat er 25 deelverzamelingen zijn. De resultaten zijn in onderstaand schema in aantallen studenten gespecificeerd. Moet men op grond van deze en soortgelijke uitkomsten een ingangsniveau eisen?

VAARDIGHEID
ONVOLDOENDE					0
	VOLDOENDE				0				KENNIS
						0	ONVOLDOENDE
						0	VOLDOENDE
				1	1				7	2
		3		1	3	0		1

			3	5	20	0	2
		0	1	0

				0				3
			VOLDOENDE				6		afgevallen
		ONVOLDOENDE					5		afgevallen
		VOORKENNIS BEKEND

De kans op gevallen van A binnen B wordt conditionele waarschijnlijkheid P(A|B) genoemd:


	P(A\|B)=P(A Ç B)/P(B)
		A^c È B
Figuur 11 A binnen B	Vergelijking 5 Kans op A binnen B	Figuur 12 Als A dan B

Dit komt voor als alle gevallen van A die niet tot B gerekend worden buiten beschouwing kunnen blijven (gestippeld in Figuur 11), bijvoorbeeld omdat we B nu eenmaal geconstateerd hebben. A kan dus alleen nog optreden binnen B. B is dan ‘noodzakelijke voorwaarde’ voor het optreden van een geval van A. Men kan concluderen ‘als A dan B’, formeel logisch weergegeven als A Þ B (voldoende voorwaarde, implicatie, zie Figuur 12)[f]. Dat laat onverlet dat B zonder A kan optreden, maar als B eenmaal geconstateerd is, is er binnen de 100% kans op B als deel daarvan nog een kans op A over (zie Vergelijking 5).

Zo zijn niet alle gevallen van Architectuur (A) ook gebouwd (B) en niet alles wat gebouwd is, is ook Architectuur. A en B horen wel tot de verzameling ontwerpen (W), al zijn daar bijvoorbeeld ook industriële ontwerpen bij. Beperken we ons tot gebouwde architectuur, dan is de kans op architectuur binnen alles wat gebouwd is gelijk aan P(A|B).

De kans op uitsluitend verschillende verjaardagen is in een groep van:

1 persoon: 365/365;

2 personen ditzelfde vermenigvuldigd met de kans op de 364 overblijvende dagen: 364/365;

3 personen met dit vermenigvuldigd met de kans op de 363 overblijvende dagen: 363/365;

enzovoort:

i personen dit vermenigvuldigd met de kans op de 366-i overblijvende dagen: (366-i)/365.

De berekening is dus:	_{Voor n := 1…100 levert dit telkens een produkt van n termen, waarin i elke keer weer oploopt van 1 tot n.} _{De uitkomsten van deze produkten staan in deze grafiek:}

Figuur 13 De kans op verschillende verjaardagen

Hieruit blijkt P(22) = 0,5243 en P(23) = 0.4927. De kans op uitsluitend verschillende verjaardagen is dus in een groep van 22 personen iets meer dan 50%. De complementaire kans op tenminste één gelijke verjaardag is bij 23 iets minder dan 50% en bij 23 iets meer dan 50%.

Het is opmerkelijk, dat de persoonlijk interessante vraag naar de kans op gelijke verjaardagen veel moeilijker direkt op te lossen valt dan via de voor niemand interessante complementaire vraag naar de kans op verschillende verjaardagen. ‘Probeer het eens via het complement’ leidt vaak ineens tot een eenvoudige oplossing (‘lateraal, inclusief of integraal denken’).

In dit geval hebben we verder intuïtief aangenomen dat elke volgende persoon tot een volgende vermenigvuldigingsfactor leidt. Waarom een vermenigvuldiging?

Als ik iemand tegenkom, dan is de kans dat onze B₂(2 verjaardagen op verschillende dagen vallen) gelijk aan P(B₂). Als er nog iemand bij komt die A₃(op een willekeurige dag jarig is), dan is de kans dat B₃(3 verjaardagen op verschillende dagen vallen) gelijk aan de kans op B₂ én A₃ ofwel P(B₂Ç A₃). P(B₂ Ç A₃) is niet gelijk aan P(B₂)*P(A₃)! Volgens Vergelijking 5 is P( B₂ Ç A₃) = P(B₂)*P(A₃|B₂).

In deze vorm is Vergelijking 5 meer algemeen bekend als de tweede productregel:

Vergelijking 6, productregel: P(A Ç B) = P(A|B)*P(B)

A₃ kan op 365 van de 365 dagen vallen: P(A₃)=365/365, maar de voorwaarde in P(A₃|B₂) dat B₂(2 verjaardagen op verschillende dagen vallen) verbiedt A₃(op een willekeurige dag jarig te zijn) 2 van de 365 dagen, zodat de kans tot 263 dagen wordt beperkt: P(A₃|B₂) = 365/365 ‑ 2/365 = 263/365.

Men kan dus constateren:

P(B₃) = P(B₂)*P(A₃|B₂) = (365/365)*( 364/365)*( 363/365) = 0.9918, en vervolgens:

P(B₄) = P(B₃)*P(A₄|B₃) = (365/365)*( 364/365)*( 363/365) *(362/365) = 0.98364,

enzovoort tot n:

P(B_n) = P(B_n-1)*P(A_n|B_n-1) = P(B_n-1)*((366-n)/365), waarin:

P(B_n-1) = P(B_n-2)*P(A_n-1|B_n-2) = P(B_n-2)*((365-n)/365), waarin weer

P(B_n-2) = P(B_n-3)*P(A_n-2|B_n-3) = P(B_n-3)*((364-n)/365),

enzovoort aflopend van i=n tot 1 met telkens een vermenigvuldigingsfactor (366-i)/365 minder:

(366-i)/365, zoals in Figuur 13, maar nu afgeleid van de tweede productregel van Vergelijking 6.

met als laatste termen bijvoorbeeld:

P(B₄) = P(B₃)*P(A₄|B₃) = (365/365)*(364/365)*(363/365) *(362/365) = 0.98364, waarin:

P(B₃) = P(B₂)*P(A₃|B₂) = (365/365)*( 364/365)*( 363/365) = 0.9918, waarin weer:

P(B₂) = P(B₁)*P(A₂|B₁) = (365/365)*( 364/365) = 0,99726, waarin weer:

P(B₁) = P(B₀)*P(A₁|B₀) = (365/365) = 1.

Als vraagstukken moeilijk grijpbaar lijken, beperkt de voorwaardelijke kans P(A|B) de blik op de gebeurtenis A tot gevallen van B. Deze beperking helpt alleen als de informatie over B specifieker is dan over A. In het geval van de verjaardagen zou het dus weinig zin gehad hebben om te proberen met P(B|A) verder te komen, want van A wisten we alleen ‘het op een willekeurige dag jarig zijn’, terwijl we van B ‘het op verschillende dagen jarig zijn’ wisten. Waar A ‘onverschillig’ is, maakt B wel verschil. We beperkten nieuwe gevallen A tot eerder beschouwde gevallen B en niet omgekeerd, omdat in B al een verdergaande operationele beperking beschikbaar was.

Wanneer we nieuwe gevallen A onderbrengen in een bestaande categorie B is daarin een tijdsvolgorde voorondersteld die verhelderend kan zijn bij het operationeel maken van vraagstukken.

Als die tijdsvolgorde er al niet is, kan het nuttig zijn hem in de wiskundige beschouwing als gedachtenexperiment in te brengen en het tijdloze vraagstuk ‘hoeveel kans bij n personen’ te beginnen bij één of twee personen en er dan telkens één bij te nemen om te zien of er een regelmatigheid ontstaat die wiskundig te vangen is. Wiskunde is de leer van de regelmaat. In het geval van de verjaardagen werd met de kansregel P(B_n) = P(B_n-1)*P(A_n|B_n-1) de nieuwe gebeurtenis A_n onder de oude regel B_n‑1 gebracht, waardoor een nieuwe kansregel B_n ontstond. Aangezien men bij de vorige nieuwe gebeurtenis A_n-1 precies zo tewerk kon gaan ten aanzien van de vorige oude regel B_n-2, ontstond in de regels zelf een regelmaat, het toevoegen van een factor, die weer wiskundig te vangen was in (366-i)/365, een produkt van n factoren die met i veranderen. Het maakt dan overigens niet meer uit of men zoals hier terugtelt in de tijd van i = n tot 1 of vooruit telt van i = 1 tot n: (366-i)/365.

Het gaat immers om een produkt, en daarbij is evenals bij de som de volgorde niet meer van belang, de regel van n produktregels is na het gedachtenexperiment weer tijdloos geworden.

Gesteld dat 2% van onze woningen B(niet brandveilig) is, en dat door de brandweer daarvan 99% terecht A(wordt afkeurd), maar van de B^c(brandveilige) woningen 5% ten onrechte A(wordt afgekeurd). Hoeveel kans loop ik dan dat mijn woning wordt afgekeurd (P(A))?

Hier staat:

a. De kans dat mijn woning B(niet brandveilig) is, P(B) = 0.02.

b. De kans dat mijn woning in zo’n geval terecht A(wordt afgekeurd), P(A|B) = 0.99.

c. De kans dat mijn woning B^c(brandveilig) is, P(Bc) = 0.98.

d. De kans dat mijn woning in zo’n geval ten onrechte A(wordt afgekeurd), P(A|B^c) = 0.05.

Volgens Vergelijking 6, productregel: P(A Ç B) = P(A|B)*P(B) gelden nu de volgende stelingen.

De kans dat mijn woning niet brandveilig is én wordt afgekeurd P(A Ç B) = P(A|B)*P(B).

De kans dat mijn woning brandveilig is én toch wordt afgekeurd P(A Ç B^c) = P(A|B^c)*P(B^c).

Die kansen mogen we gewoon optellen omdat er geen overlappingen zijn tussen B^c en B, de woning is brandveilig of niet, de woning A(wordt afgekeurd) terwijl hij brandveilig is of niet: A = (A Ç B^c) È (A Ç B).

De kans dat mijn woning wordt afgekeurd is dus P(A) = P(A Ç B) + P(A Ç B^c) = P(A|B)*P(B) + P(A|B^c)*P(B^c) = 0,99 * 0,02 + 0,05 * 0,98 = 0,0688. De 5% ten onrechte afkeuringen tellen dus behoorlijk mee.

B en Bc betreffen in twee complementaire categorieën alle woningen en dus de totale kansruimte W, maar men kan onderscheid maken in verschillende woningcategorieën C₁, C₂ tot C_n zodat #C₁ + #C₂ + … + #C_n = #W en daarvoor geldt dan een meer algemene wet van totale kansruimte:

P(A) = P(A|C₁)*P(C₁) + P(A|C₂)*P(C₂) + … + P(A|C_n)*P(C_n)

Vergelijking 7 De wet van de totale kansruimte

Met deze somwet van produktregels hebben we P(A) uit Vergelijking 6, productregel: P(A Ç B) = P(A|B)*P(B) uit al zijn voorwaarden losgemaakt door de totale kansruimte in de beschouwing te betrekken, weer een geval van ‘Probeer het eens via het complement’.

P(A) + P(B) + P(C)

(P(AÇB)+P(BÇC)+P(BÇC))

Ik weet nu wel hoeveel kans er is dat mijn woning door de brandweer wordt afgekeurd, maar hoe weet ik nu of dat dan terecht is? De kans dat mijn woning terecht als B(brandgevaarlijk) is afgekeurd binnen de kans dat hij überhaupt wordt A(afgekeurd) is weer een voorwaardelijke kans, nu omgekeerd: P(B|A).

Daarvoor geldt Vergelijking 5, zij het met A en B verwisseld: P(B|A)=P(B Ç A)/P(A).

De teller P(B Ç A) is hetzelfde als de al eerder met Vergelijking 6 uitgerekende

P(A Ç B) = P(A|B) * P(B) = 0,99 * 0,02 = 0,0198.

Ook de noemer hadden we al met een eenvoudige voorganger van Vergelijking 7 uitgerekend:

P(A) = P(A|B) * P(B) + P(A|B^c) * P(B^c) = 0,99 * 0,02 + 0,05 * 0,98 = 0,0688.

Het quotiënt P(B Ç A)/P(A) is dus de gevraagde P(B|A) = 0,28779.

De kans dat mijn woning B(brandgevaarijk) is als zij wordt A(afgekeurd) is dus 29%. De overige 71% is dus de kans bij afkeuring van een B^c(niet-brandgevaarlijke) woning!

De uitwerking naar meer categorieën C staat bekend als Bayes’ Rule (Vergelijking 8).

P(A Ç C_i)		P(A\|C_i)*P(C_i)
		P(A)

of uitgewerkt	P(C_i\|A)=	P(A\|C_i)*P(C_i)
of uitgewerkt	P(C_i\|A)=	P(A\|C₁)P(C₁) + P(A\|C₂)P(C₂) + … + P(A\|C_n)*P(C_n)	(met Vergelijking 7)

Vergelijking 8 Bayes Rule

[b] In de matrix van alle 36 combinaties telkens twee kolommen en twee rijen waarin 4 cellen overlappen:

11	21	31	41	51	61
12	22	32	42	52	62
13	23	33	43	53	63
14	24	34	44	54	64
15	25	35	45	55	65
16	26	36	46	56	66

[c] Omdat bij een ‘gunstige’ eerste worp met 2 gedefinieerde mogelijkheden in de teller, bij de tweede worp nog maar 1 gedefinieerde mogelijkheid overblijft.

[f] Zie [Jong, 2002 #1], bladzijde 196: in Figuur 12 zijn de gevallen waarin de uitspraak ‘Als A dan B’ waar is zwart weergegeven. Deze uitspraak is alleen onwaar als A niet B. Ook als niet B en niet A, is de uitspraak áls A dan B waar.

11	21	31	41	51	61
12	22	32	42	52	62
13	23	33	43	53	63
14	24	34	44	54	64
15	25	35	45	55	65
16	26	36	46	56	66

11	21	31	41	51	61
12	22	32	42	52	62
13	23	33	43	53	63
14	24	34	44	54	64
15	25	35	45	55	65
16	26	36	46	56	66

11	21	31	41	51	61
12	22	32	42	52	62
13	23	33	43	53	63
14	24	34	44	54	64
15	25	35	45	55	65
16	26	36	46	56	66