4.5 kwantitatief -> categoriaal

Top  Previous  Next

 

Bij zogenaamde bivariate data worden twee variabelen tesamen onderzocht om na te gaan of er samenhang tussen de variabelen bestaat.

Bij twee numerieke variabelen, bijvoorbeeld lengte en gewicht, is een puntenwolk geschikt.

Bij twee categoriale  variabelen, bijvoorbeeld geslacht en klasse, is een kruistabel geschikt.

 

Voor een numerieke en een categoriale variabele tesamen is niet direct een geschikte tabel of diagram beschikbaar.

De oplossing is dan om de numerieke variabele in categorieën in te delen. Zo kun je een variabele leeftijd in categorieën indelen, bijvoorbeeld jong-volwassen-oud. Daarbij gaat uiteraard informatie verloren, maar dat is bij een eenvoudig staafdiagram ook het geval.

 

4.5aIn de dataset van de Titianic is ook de variabele leeftijd opgenomen.
Je maakt een kruistabel met drie categorieën voor die variabele.

 
Button

 

Je indruk van de samenhang tussen geslacht en leeftijd kun je verder onderzoeken in Kruistabel analyse.

In de kruistabel zijn de leeftijdscategorieën aangegeven met de labels: jong, volwassen en oud.

 

4.5bOnderzoek verder met diagrammen.

 
Button