10 Veelgestelde sollicitatievragen voor Data Scientist

Het veld van data science evolueert voortdurend, verspreid over verschillende industrieën en vereist een uitgebreide vaardighedenset met wiskunde, statistiek, programmeren en marketing. Als zodanig vereist het worden van een datawetenschapper een indrukwekkende mix van technische vaardigheden, creativiteit en communicatie.

Functiebeschrijvingen voor datawetenschappers kunnen enorm variëren, hoewel iedereen op zoek is naar kandidaten met een lange lijst van de meest wenselijke jobvaardigheden zoals kritisch denken, probleemoplossing, data-analyse, emotionele intelligentie, aandacht voor detail en teamwerk. Dit betekent dat interviewvragen voor datawetenschappers verschillende onderwerpen kunnen omvatten en kunnen variëren van typische soft skills-vragen tot extreem technische discussies.

Data science-interviews vereisen veel voorbereiding. Of je nu net bent afgestudeerd aan een topschool voor informatica of je wilt overstappen naar een ander bedrijf of industrie, je moet de tijd nemen om de belangrijkste concepten van je werk te bespreken. Net zoals je weet hoe je moet rijden, maar misschien moeite hebt met het reciteren van specifieke regels van de weg, kun je vastlopen in een interview om uit te leggen hoe een specifiek algoritme werkt.

Om je te helpen voorbereiden, hebben we 10 van de meest voorkomende interviewvragen voor datawetenschappers samengesteld. Van vroege vertoningen tot tweede en derde fase video en interviews ter plaatse, je zult een breed scala aan onderzoeken tegenkomen zoals deze van je technische vaardigheden, communicatieve vaardigheden en werkstijl.

1. 'Vertel ons meer over het meest recente project in uw portefeuille.'

Er is veel vraag naar datawetenschappers in veel verschillende industrieën, maar bedrijven zijn vaak op zoek naar iemand met zeer specifieke vaardigheden en een goede cultuuraanpassing. Een gedetailleerd online portfolio met het soort werk waartoe u in staat bent, evenals een sterke aanwezigheid op sociale media en een persoonlijk merk, helpt u zich te onderscheiden van andere kandidaten en u in contact te brengen met wervende managers en recruiters voor banen waarvoor u perfect bent geschikt voor.

Wees voorbereid in elk data science-interview om uitgebreid te praten over alle elementen van je CV, portfolio of website. Pas uw reactie op een project aan uw publiek aan. Als het een eerste screening is of een panel met deelnemers uit verschillende afdelingen, moet u zich richten op de manier waarop uw werk positieve resultaten heeft opgeleverd voor de klant en zijn bedrijf.

Wanneer u het gedeelte van het interviewproces bezoekt waar u een andere gegevenswetenschapper, ingenieur, analist of andere technische persoon ontmoet, is een meer gedetailleerde beschrijving van de gegevens en processen die bij uw werk betrokken zijn vereist.

2. 'Waarom wilt u voor dit bedrijf werken?'

Zelfs als u rechtstreeks via uw online portfolio of LinkedIn-profiel werd gecontacteerd en werd uitgenodigd om te solliciteren voor een openstaande functie, wil het bedrijf nog steeds weten waarom u hebt geaccepteerd en waarom u denkt dat u geschikt bent voor de baan.

Naast het opfrissen van je technische vaardigheden, moet je voorbereiding op het interview onderzoek omvatten naar het bedrijf waarop je solliciteert. Informatie over hun branche, missie, personeel, precies wat ze doen en hoe goed ze het doen, zal u helpen een specifiek op maat gemaakt antwoord op deze vraag te maken.

Geef aan hoe uw vaardigheden hen zullen helpen hun doelen te bereiken. Vind een manier om passie uit te drukken over een of meer aspecten van uw functie, inclusief de missie, filosofie, innovatie of productlijn van het bedrijf. Als dit je droomjob is, kan het de moeite waard zijn om voorafgaand aan het interview een data science-project samen te stellen dat een probleem voor hen oplost - zoals een beroep doen op een nieuwe demografische of efficiëntere leveringen plannen.

3. 'Noem de datawetenschappers die je het meest bewondert en leg uit waarom.'

Hoewel dit een zeer persoonlijke vraag is die technisch gezien geen goed antwoord heeft, zijn de antwoorden die u selecteert erg belangrijk. Uw onderzoek naar het bedrijf, evenals die op het interviewpanel kunnen u helpen om alleen met deze vraag een goede eerste indruk te maken.

Het kennen van de mensen die prominent aanwezig zijn in het veld, evenals degenen die momenteel golven maken, zullen de interviewers laten zien dat jullie allebei goed geïnformeerd en gepassioneerd zijn over de industrie. Het is handig om datawetenschappers te bespreken die worden gewaardeerd in de specifieke carrièrearena waar u solliciteert, zoals financiën, medicijnen of de aandelenmarkt.

Deze vraag is meer dan alleen een indrukwekkende lijst met namen. Het 'waarom'-gedeelte van de vergelijking laat ook uw potentiële werkgevers zien wat u op uw vakgebied waardeert en hoe u uw werk zult benaderen. Als uw onderzoek heeft aangetoond dat het bedrijf waarde hecht aan innovatie, integriteit of zelfs een bepaalde statistische methode, is dit een uitstekende gelegenheid om hen te laten weten dat u dezelfde waarden deelt.

4. 'Hoe zou u een aanbevelingsmachine uitleggen aan iemand van de marketingafdeling?'

Een van de belangrijke eigenschappen die datawetenschappers onderscheidt van andere technische genieën, is de mogelijkheid om gegevens te converteren, weer te geven en uit te leggen op een manier die niet-technische mensen kunnen begrijpen. Dat maakt een vraag als deze een van de belangrijkste interviewvragen van datawetenschappers die je tegenkomt. Interviewers willen zien hoe goed u concepten zoals datamodellering, beslissingsbomen en lineaire regressie kunt communiceren met elk publiek.

In dit specifieke geval wil je eerst in eenvoudige bewoordingen uitleggen hoe een engine voor aanbevelingen werkt, met voorbeelden van zowel op inhoud gebaseerde filtering als collaboratieve filtering. Vervolgens wilt u bespreken hoe u met de marketingafdeling kunt werken om hun aantrekkelijke klanten te combineren met de kracht van het algoritme dat verzamelde gegevens gebruikt om te bepalen wat consumenten willen.

5. 'Wat zijn de verschillen tussen begeleid en niet-begeleid leren?'

U kunt beginnen met samen te vatten dat het belangrijkste verschil tussen deze twee is dat begeleid leren trainingsgegevens heeft waarvan het algoritme kan leren en antwoorden kan geven. Leren zonder toezicht vereist dat dingen worden gegroepeerd op basis van overeenkomsten, gemeenschappelijke afwijkingen en andere patroonzoekende processen in plaats van op basis van harde en snelle gegevens.

De interviewer wil dat je meer in detail gaat, dus het is belangrijk om de specifieke verschillen op te sommen en te kunnen spreken over de verschillende gebruikte algoritmen.

Leren onder toezicht

  • gebruikt bekende en gelabelde gegevens als invoer
  • heeft een feedbackmechanisme
  • gebruikt voor voorspelling
  • de gebruikelijke algoritmen zijn onder andere beslissingsboom, logistieke regressie, lineaire regressie, ondersteuning van vectormachines en random forest

Leren zonder toezicht

  • gebruikt niet-gemerkte gegevens als invoer
  • heeft geen feedbackmechanisme
  • gebruikt voor analyse
  • de gebruikelijke algoritmen zijn K-middelen clustering, hiërarchische clustering, autoencoders en associatieregels

U zult enkele voorbeelden willen hebben, hetzij generiek, hetzij van een specifiek project waaraan u hebt gewerkt, om de verschillen tussen deze twee soorten machine learning te illustreren en in welke gevallen elk zou kunnen worden gebruikt. Ongecontroleerd leren kan bijvoorbeeld worden gebruikt bij het lanceren van een nieuw product waarvan de demografie van de klant waarop het mogelijk aanspreekt onbekend is.

abonneren

Meld u aan voor onze nieuwsbrief voor meer geweldige inhoud en ontvang 20% ​​KORTING op onze carrière-test!

abonneren

6. 'Hoe voorkom je selectiebias?'

Deze vraag kan vele vormen aannemen in een interview met data science. Mogelijk wordt u gevraagd om selectiebias te definiëren, hoe u dit kunt vermijden of om een ​​specifiek voorbeeld te geven van hoe het een rol speelde in een project waaraan u werkte.

Het belangrijkste probleem met selectiebias is dat conclusies zijn getrokken uit een niet-willekeurige steekproef. Het is duidelijk dat de gemakkelijkste oplossing is om altijd te kiezen uit een willekeurige steekproef van een duidelijk gedefinieerde populatie. Je zult moeten toelichten waarom dat niet altijd mogelijk is.

Aangezien selectiebias opzettelijk kan zijn - met onderwerpselectie of gegevensverwijdering met opzet gedaan om een ​​vooropgezette theorie of projectie te bewijzen - dit voor het wervingspanel een indirecte manier zou kunnen zijn om een ​​van die moeilijke interviewvragen te stellen over ethiek en integriteit op het werk .

U zult uiteindelijk willen benadrukken dat selectiebias vaker een geval is van onbedoelde of onvermijdelijk bevooroordeelde gegevens. Zorg dat u enkele van de gebieden toelicht waar selectiebias kan optreden, waaronder bemonstering, tijdsinterval, gegevens en slijtage. Geef vervolgens enkele voorbeelden van hoe hefboomtechnieken zoals resamplen en boosten u kunnen helpen om niet-willekeurige monsters te werken.

Als u deel uitmaakt van een interview wanneer u spreekt met vertegenwoordigers van minder technische afdelingen, gebruik dan een gemakkelijk verteerbaar exemplaar dat duidelijk de voorkeur van de selectie illustreert. Gegevenswetenschapper Eric Hollingsworth verwijst naar een les die is geleerd uit de uitbraak van vogelgriep in 2011, waarbij 'alleen zeer zieke personen werden geteld' in een statistische steekproef van 'bevestigde gevallen'. De resulterende 80% meldde het sterftecijfer, zo verschrikkelijk als gevolg van selectiebias, veroorzaakte aanzienlijke wijdverbreide angst.

7. 'Hoe kunnen uitbijterwaarden worden behandeld?'

Dit is een veel voorkomende interviewvraag voor datawetenschappers, omdat het laat zien hoe je de gegevens gebruikt die je hebt gekregen, de methoden die je gebruikt om die gegevens te verwerken en of je bereid bent om de tijd te nemen om elk stukje van die gegevens te evalueren.

U zult eerst willen praten over wat een uitbijter is, als getallen die ver buiten het gegevenscluster in een grafiek bestaan, als 2-3 standaarddeviaties van het gemiddelde, enzovoort. De volgende stap in het omgaan met uitbijters is evalueren waarom ze zijn gebeurd.

Een kleine hoeveelheid uitbijters die kunnen worden toegeschreven aan eenvoudige menselijke of machinefouten worden eenvoudig geëlimineerd. Houd er echter rekening mee dat zelfs een enkele uitbijter een belangrijk gegevenspunt kan zijn in plaats van een probleem, omdat dit kan wijzen op het succes van een enkele marketingtactiek, een nieuw medicijningrediënt of productlijn.

Vervolgens wilt u uitleggen hoe u kunt omgaan met een groot aantal uitbijters, waarvoor complexere oplossingen nodig zijn. Mogelijk moet u bijvoorbeeld het model wijzigen dat u gebruikt, de gegevens normaliseren naar het gemiddelde of een willekeurig forest-algoritme gebruiken. Probeer opnieuw een praktijkvoorbeeld uit uw ervaring als datawetenschapper te gebruiken om de juiste tactieken uit te leggen.

8. 'Waarom is het opschonen van gegevens belangrijk?'

Gegevensverzameling en -opruiming zijn een dominant onderdeel van uw werk als gegevenswetenschapper en nemen tot 80% van uw tijd in beslag. In welke branche u ook solliciteert, in de interviewvragen staat er altijd een over waarom gegevens opschonen belangrijk is. Interviewers zullen ook vragen stellen over uw gewenste reinigingstechnieken en -programma's.

U moet benadrukken hoe schone gegevens nodig zijn om de juiste conclusies te trekken, maar het gaat niet alleen om de cijfers. Leg uit hoe te beginnen met volledige, nauwkeurige, geldige en uniforme gegevens direct van invloed is op hun bedrijf. De belangrijkste voordelen om te bespreken zijn:

  • verbeterde besluitvorming over bedrijfsdoelstellingen
  • snellere klantenwerving en her-targeting van klanten in het verleden
  • tijd- en bronbesparingen door het elimineren van onnauwkeurige of dubbele gegevens
  • verbeterde productiviteit
  • verbeterd teammoreel dankzij herhaalde efficiënte en nauwkeurige resultaten

9. 'Wat is het doel van A / B-testen?'

Vragen over A / B-testen tijdens uw interview voor een functie van gegevenswetenschapper kunnen beginnen met een meer algemene verwijzing naar het gebruik van experimenteel ontwerp om een ​​enkele vraag over gebruikersgedrag of voorkeuren te beantwoorden. Het doel van het testen van een ontwerpvariabele voor een website, app of nieuwsbrief is eenvoudigweg om te evalueren of een verandering de rente, betrokkenheid en conversie verhoogt.

Een manier om u te onderscheiden bij het beantwoorden van dit soort interviewvragen is om te bespreken hoe andere datawetenschappers de verkeerde conclusies kunnen trekken uit A / B-testen. Mogelijke valkuilen zijn onder meer:

  • niet voldoende lang genoeg gegevens verzamelen
  • teveel variabelen tegelijk testen
  • geen rekening houden met externe factoren die het verkeer tijdens de testperiode kunnen beïnvloeden
  • het negeren van kleine winsten die in de loop van de tijd kunnen worden opgebouwd en gecombineerd met andere positieve veranderingen voor hogere inkomsten
  • missen grote interpretaties zoals netto financiële winsten of verliezen ten opzichte van conversiepercentages

Afgezien van het wijzen op deze problemen, moet je aangeven hoe je ze zou oplossen - of, beter nog, hoe je ze al hebt vermeden in je vorige data science-projecten.

10. 'Je hebt 48 uur om deze codeeruitdaging op te lossen.'

De codeeruitdaging kan een eerste manier zijn om potentiële datawetenschappers te screenen, of het kan een tweede stap in het interviewproces zijn nadat u de eerste hindernis met een recruiter of wervingsmanager hebt weggenomen. Dit kan een test op locatie zijn die 30 minuten tot 2 uur duurt, waarbij je codeert op een whiteboard of op een toetsenbord in het zicht van de interviewer. U krijgt vaak een taalkeuze, maar wees bereid om te coderen in SQL of Python.

Sommige bedrijven wijzen langere taken toe, met deadlines tot een week. Whiteboard-uitdagingen kunnen het schrijven van vrij eenvoudige SQL-query's vereisen, maar langere tests zijn natuurlijk complexer. Meestal krijgt u gegevens en wordt u gevraagd om specifieke voorspellingen te doen met behulp van die gegevens, en moet u uw werk laten zien. Een recent interviewer van datawetenschappers kreeg bijvoorbeeld Airbnb-gegevens en werd gevraagd om huizenprijzen te voorspellen op basis van accommodatiefuncties.

De interviewers zullen uw keuzes met u willen bespreken, de veronderstellingen die u hebt gemaakt, de functies die u hebt gekozen, waarom u bepaalde algoritmen hebt gebruikt en meer. Vaak is het antwoord dat u krijgt minder belangrijk dan uw proces, creativiteit, leesbaarheid van code en ontwerp.

Dit kan een zenuwslopende interviewervaring zijn, dus bereid je voor door oefencoderingsuitdagingen te maken en te voltooien met vrienden of collega's op het gebied van gegevenswetenschap. U kunt ook sites zoals Leetcode en SQLZOO bezoeken voor codeeroefeningen. Werkelijke proefgesprekken met algoritmische en systeemontwerpproblemen zijn gratis beschikbaar via Interviewing.io.

Zoals u ziet, kunnen interviewvragen voor datawetenschappers moeilijk zijn en kan het algehele proces lang en zwaar zijn. Een van de belangrijkste interviewtips is om positief te blijven, zelfs als u vindt dat een deel van het interviewproces slecht is verlopen. We zijn vaak moeilijker voor onszelf dan anderen, en je kunt nog steeds de klus klaren ondanks dat je niet elk antwoord zo perfect krijgt als je zou willen.

Als je de kans misloopt, vraag dan om feedback en gebruik deze om je volgende interviewervaring te verbeteren. Veel gerenommeerde datawetenschappers werden immers vanuit verschillende posities afgewezen en bleven toch succesvol in de banen die uiteindelijk beter pasten!

Welke vragen en codeeruitdagingen kwam u tegen toen u probeerde een baan in de gegevenswetenschap te bemachtigen? Neem deel aan de discussie in de reacties hieronder en help je collega-datawetenschappers zich voorbereiden op hun volgende interview!

Laat Een Reactie Achter

Please enter your comment!
Please enter your name here