Mijn baby's eerste data stapjes

Over onze baby's én data

Geen blog over een corporate of een technisch hoogstandje van een van onze klanten. Het is vandaag Valentijnsdag. De dag van het “houden van”. Dit keer niet over onze (heimelijke) liefdes of ouders. Nee, dit keer over onze kinderen én data. Allemaal leuk en aardig die kiddo’s, ze zijn niet zomaar zo goed opgevoed. Deze blog gaat over het eerste jaar, gevoed door data, liefde en wat melk.

Laten we beginnen met de situatie. Na negen maanden wachten is het dan zo ver. De kleine is er. Gefeliciteerd! De keus voor flesvoeding is gemaakt en het kind groeit er prima mee. Samen met de moeder en de opvang houden we goed bij wat erin gaat. De app die we gebruiken kan ook de luier verschoningen en gewichten bijhouden. Dat klinkt als muziek in de oren van deze data analist. Helaas zat er geen exportknop in de app en na wat contact met de ontwikkelaars kreeg ik ze zover om een export te maken. Ready? Data? Go!

Luiers

Ook deze dataset is niet 100% schoon, zoals alle datasets. Er moet een normalisatie slag overheen. Enfin, in Splunk is dit zo gedaan. Daarna moet ik de features die ik wil gebruiken (type luierverschoning bijvoorbeeld) nog aanmaken vanuit de data. Ik kies ervoor om poepluiers, plasluiers en combi-luiers te nemen als feature. De data zijn ook niet van precies 1 jaar, laten we gemakshalve zeggen van 11 maanden.

Laten we eerst wat aggregates pakken, de samenvattende descriptive statistics.

Grafiek 1: Verdeling tussen de verschillende inhoudsopgaven

Ik zie hier een mooie verdeling tussen de verschillende inhoud van de luiers. Als ervaringsdeskundige kan ik met enige zekerheid vaststellen dat je niet altijd luiers van de twee kleinste typen wil.Grafiek 2: Het aantal luiers per luiertypen

Dat is een totaal van: 1652 luiers verschoond in iets minder dan een jaar.Wij gebruiken Kruidvat luiers, deze zijn als beste getest en geschikt bij een allergie. De gemiddelde prijs van een luier in een mid-pack, van maat 0 (€0,12/luier) tot maat 5 (€0,25/luier) heb ik uitgerekend op €0,17/luier.

Je voelt het al aankomen, dat is totaal (gemiddeld) uitgegeven aan de luiers. Dit is (gemiddelde van ((luiers per pak/prijs) per maat)) Er zijn er in totaal meer luiers gebruikt. Helaas is dit niet voldoende onderbouwing om een salarisverhoging aan te vragen.

Voeding

Naast de luiers drinkt en eet het kind je natuurlijk helemaal arm. Wij hebben de hapjes niet geregistreerd. Daarnaast maakten we deze ook zelf met groente van de boer en is het lastig daar dan een prijs aan te hangen. Wel kunnen we kijken naar het aantal flessen en volumes.

We kunnen wel kijken naar de totalen:

Trellis 1: Het aantal flessen en het totale volume

Dat zijn een heleboel flessen. Laten we er eens wat meer statistiek erop loslaten:

Trellis 2: De mediaan van het volume en het gemiddelde volume per fles

De mediaan en het gemiddelde liggen dicht bij elkaar, het scheelt 10 milliliter. Dit vertelt mij in ieder geval dat de dataset redelijk “normaal verdeeld” is. Dit zien we ook in de frequency distribution terug met alleen op 200ml uitschieters. 170ml is ietwat verhoogd.

Tabel 1: De frequency distributie van het volume per voeding

En in een histogram zien we hetzelfde beeld

Grafiek 3: Histogram van de voedingsvolumes

De modus komt uit op 200 ml en de standaarddeviatie is 45.2 ml.

Het is lastig een exacte prijs lastig te berekenen in verband met medische voeding door allergie.

Gebroken Nachten

Voor iedere ouder zijn de gebroken nachten zwaar. Ze zeggen ook wel dat de eerste 1000 dagen van een kind meer doet met de ouders dan iedereen denkt. Zie ook de “ode aan ouders” van het Nederlands Centrum jeugdgezondheid. Een prachtig filmpje dat goed laat zien hoe het er echt aan toe gaat. Gelukkig heeft UMBRiO mij in deze periode goed kunnen ondersteunen.

Hieronder zie je duidelijk een grote dip in het aantal uren slaap/inbed en de variabiliteit ervan na de geboorte. Wie ook goed kijkt, ziet een lichte verhoging in de donkere dagen van het jaar voor het opstaan.

Grafiek 4: Het aantal uren slaap

Interessant is om te kijken naar de verschoningen en voedingen in die periode. De volgende grafiek laat de volumes van de fles per dag zien en het aantal verschoningen. De x-as is anders dan hierboven en loopt van februari tot januari.

Grafiek 5: De flessen en luiers over tijd

 

Grafiek 6: Ingezoomde tijden van de eerste week en 10 maanden verder. Niet gelijke x-schaal.

Je ziet in bovenstaande grafieken dat het aantal nachtvoedingen en verschoningen later in het jaar gelukkig tot het verleden behoren. Op dit moment is nog niet elke nacht onbezorgd, maar we komen al een heel eind. De kleine doet het goed.

Hieronder het dashboard wat ik uiteindelijk heb gemaakt:

Het was een leuke oefening om met data te spelen en inzicht te krijgen in mijn leven van afgelopen jaar. Hopelijk heb ik je geïnspireerd in wat data kan betekenen voor jezelf.

Over Rick van den IJssel
Rick is Data Consultant en Product Owner bij UMBRiO en verantwoordelijk voor onze online en on-demand workshops. Als Analytics Translator en Splunk consultant helpt hij organisaties bij het ontsluiten van data uit bedrijfsapplicaties en vertaalt deze naar waardevolle informatie voor IT en business besluitvorming. Daarnaast zorgt hij voor de adoptie van datagedrevenheid door cultuurverandering tot stand te brengen. Samen met de collega’s van UMBRiO zorgt hij er ervoor dat organisaties data-driven kunnen werken. Rick gelooft in een inclusieve samenleving die de wereld elke dag een beetje mooier, houdbaar en toekomstbestendig maakt.