Rolf Ypma, Data Scientist bij het NFI

Ik was heel bewust opzoek naar een data science plek en bij heel veel bedrijven zie je dat dat gevraagd wordt, maar dan vooral om te zorgen dat mensen meer op jouw banners klikken en om meer inkomsten binnen te halen. Ik wilde juist wat meer inhoud, dat je echt iets doet dat goed is voor de samenleving. We werken hier aan analyses en visualisaties voor politie, OM en allerlei andere partners binnen de veiligheidsketen. We doen strafzaken, projecten en onderzoek.

Een strafzaak is precies wat je  denkt dat het is. Strafzaken, moord, echt zware dingen. Er zijn stukken bewijs gevonden en dat moeten wij als NFI interpreteren en uitspraak doen  over wat het bewijs precies zegt en in hoeverre dat voor- of  tegen- de verdachte spreekt. Ook aan de opsporingskant werken we mee, als de politie heel veel data verzameld heeft en ze kunnen er eigenlijk niet meer mee uit de voeten dan komen wij langs om het inzichtelijker te maken. Om ze daarbij te helpen en ook om analyses te doen om het opsporingswerk te ondersteunen. Iedereen gebruik mobieltjes, voor criminelen is dat niet anders, ze hebben er vaak zelfs meer dan één. Daar kan je heel veel gegevens over opvragen. Over waar die mobieltjes geweest zijn en wat dat betekend. Dat kan je dan combineren met andere gegevens zoals kentekenregistraties of andere gegevens over waar criminelen vaak komen of wie hun contactpersonen zijn. Dan kan je een heel beeld opbouwen, een patroon van die mensen, hoe ze zich bewegen en daar hopelijk interessante dingen uit halen.

Alles wat we doen is maatwerk, het is altijd veel werk om alles goed bij elkaar te krijgen en  netjes in de database te stoppen. Voor echt het analysewerk zijn er allerlei open source tooltjes die we daarvoor gebruiken. We gebruiken voornamelijk Python en alle libraries die daar aan vast zitten. Dus veel in scikit-learn en in TensorFlow en dat soort dingen. Machine Learning gebruiken we om  statistische-achtige analyses bouwen. Om echt op het goede antwoord uit te komen. Waarbij je weet dat het belangrijk is want iemand kan naar de gevangenis gaan of niet, op basis van jouw antwoord. Het belangrijkste om hier te werken is dat je interesse hebt in puzzels oplossen. Programmeren, een beetje software engineering moet je hebben, statistiek, Machine Learning,  wiskunde. Maar dat gezegd hebbende is het heel breed. Het is een vrij nieuwe discipline; Data Sience en we hebben een aantal mensen vanuit de computerwereld, een aantal mensen uit de natuurkunde en wiskunde maar ook mensen die psychologie gedaan hebben en zichzelf de rest van de skills bijgeleerd hebben. De forensische-kant leer je meestal hier.

Behalve technische dingen kunnen, moet je in een team kunnen werken. Niet iedereen kan dat, maar dat is hier wel echt heel belangrijk. Dat je kritiek kan geven maar ook kritiek kan krijgen en samen een product bouwen. Daarbij, omdat het forensisch is, moet je echt betrouwbaar zijn. Je werkt met vertrouwelijke gegevens, dus daar moet je je wel van bewust zijn. Ik vind juist het leuke aan data science dat je zó veel verschillende mensen hebt, met zó veel verschillende achtergronden. Je kan veel meer leren als mensen een hele andere achtergrond hebben dan als ze allemaal hetzelfde zijn als jij.