Als aspirant-data scientist is de beste manier voor u om uw vaardigheidsniveau te verhogen door te oefenen. En welke betere manier is er om je technische vaardigheden te oefenen dan het maken van projecten. Persoonlijke projecten zijn een essentieel onderdeel van je carrièregroei. Ze brengen je een stap dichter bij je data science droom. Projecten zullen je kennis, vaardigheden en zelfvertrouwen een boost geven. Het tonen van projecten in je cv gaat het krijgen van een data science baan veel makkelijker maken.
“Welke projecten moet ik maken?” vraag je je af? Nou, maak je geen zorgen voor een tweede! Want ik ben hier, met deze geweldige ideeën voor data science projecten in 2020. Dus laten we alvast beginnen!
- Character Recognition
- Driver Drowsiness Detection
- Borstkankerdetectie
- Impact Of Climate Change On Global Food Supply
- Chatbot
- Web Traffic Time Series Forecasting
- Fake News Detection
- Herkenning van menselijke acties
- Voorspelling van bosbranden
- Gender & Leeftijdsdetectie
- Conclusie
- Inschrijven op onze nieuwsbrief
- Word lid van onze Telegram-groep. Maak deel uit van een boeiende online gemeenschap. Word hier lid.
Character Recognition
Dit project richt zich op het vermogen van de computer om de door mensen met de hand geschreven karakters te herkennen en te begrijpen. Een geconvolueerd neuraal netwerk wordt getraind met behulp van de MNIST dataset. Dit helpt het neurale netwerk om handgeschreven cijfers met een redelijke nauwkeurigheid te herkennen. Het project maakt gebruik van deep learning en vereist de Keras en Tkinter bibliotheken.
Driver Drowsiness Detection
Overnight driving is een zware baan. Veel ongelukken gebeuren wanneer een bestuurder slaperig of suf wordt tijdens het rijden. Dit project is erop gericht om te herkennen wanneer de bestuurder mogelijk in slaap valt en alarm slaat.
Dit project maakt gebruik van een deep learning model om te classificeren tussen beelden waar de ogen van mensen open of gesloten zijn. Het houdt een score bij op basis van hoe lang de ogen gesloten blijven. Als de score verder stijgt dan een gespecificeerde drempel. slaat het model alarm. Om deze projecten te implementeren, moet u goed op de hoogte zijn van alle basisconcepten van Data Science.
Borstkankerdetectie
Het borstkankerdetectieproject gebruikt histologiebeelden om te classificeren of de patiënt Invasief Ductaal Carcinoom heeft of niet. Dit project maakt gebruik van een IDC dataset om histologiebeelden te classificeren als kwaadaardig of goedaardig. Een geconvolueerd neuraal netwerk is het meest geschikt voor deze taak. Het model wordt getraind met behulp van ongeveer 80% van de dataset, en de resterende dataset wordt gebruikt om de nauwkeurigheid van het model te testen nadat het is getraind.
Impact Of Climate Change On Global Food Supply
Klimaatveranderingen en anomalieën worden tegenwoordig een gewoon onderdeel van onze wereld. Dit begint elk aspect van het menselijk leven op onze planeet te beïnvloeden. Dit project richt zich op het kwantificeren van de invloed die de klimaatverandering heeft en zal hebben op de wereldwijde voedselproductie. Het doel van dit project is de mogelijke gevolgen van klimaatverandering voor de productie van basisgewassen te beoordelen. Het project beoordeelt de gevolgen van temperatuur- en neerslagveranderingen, rekening houdend met de effecten van kooldioxide op de plantengroei en de onzekerheid van de klimaatverandering. Dit project behandelt de visualisatie van gegevens en vergelijkingen die worden getrokken tussen opbrengsten in verschillende regio’s op verschillende tijdstippen.
Chatbot
Chatbots spelen een belangrijke rol in het bedrijfsleven. Ze helpen bij het leveren van verbeterde en gepersonaliseerde diensten en besparen tegelijkertijd mankracht.
Een chatbot kan worden getraind met behulp van deep learning-technieken en met behulp van een dataset met een lijst met vocabulaire, een lijst met veelvoorkomende zinnen, de bedoeling erachter en de passende reacties. De meest gebruikte methode voor het trainen van chatbots is het gebruik van Recurring Neural Networks (RNN). De bot bestaat uit een encoder die zijn toestanden bijwerkt aan de hand van de ingevoerde zin, samen met de bedoeling, en de toestand doorgeeft aan de bot. De bot gebruikt dan de decoder om een gepast antwoord te vinden op basis van de woorden en de intentie erachter. U kunt chatbot eenvoudig implementeren met Python.
Web Traffic Time Series Forecasting
Time series forecasting is een zeer belangrijk concept in de statistiek en machine learning. Voorspellen van webverkeer is een populaire toepassing van tijdreeksvoorspelling. Het helpt webservers om hun bronnen beter te beheren om uitval te voorkomen. Om het project nog interessanter te maken, kun je wavenets gebruiken in plaats van traditionele neurale netwerken. Wavenets gebruiken causale convoluties, waardoor ze efficiënter en lichter zijn.
Fake News Detection
Het idee achter dit project is om een machine learning model te bouwen dat kan detecteren of het nieuws dat door een social media post wordt gegeven waar is of niet. Je kunt de TfidfVectorizer gebruiken, en een PassiveAggressive classifier om dit model te bouwen.
TF of de Term Frequency is het aantal keren dat een woord in een document voorkomt.
IDF of de Inverse Document Frequency is een maatstaf voor het belang van een woord, gebaseerd op het aantal keren dat het in verschillende documenten voorkomt. Veel voorkomende woorden die in veel documenten voorkomen, hebben geen hoog belang.
TFIDFVectorizer analyseert een verzameling documenten en maakt op basis daarvan een TF-IDF matrix.
A PassiveAggressive classifier blijft passief als de classificatie-uitkomst juist is, maar verandert agressief zijn classificatiecriteria als de classificatie onjuist is.
Met behulp hiervan kunnen we een machine-leermodel bouwen dat het nieuws kan classificeren als nep of waar.
Herkenning van menselijke acties
Het model voor herkenning van menselijke acties kijkt naar korte video’s van mensen die bepaalde acties uitvoeren en probeert ze te classificeren op basis van wat de actie is. Het gebruikt een geconvolueerd neuraal netwerk dat getraind is op een dataset met korte video’s en bijbehorende accelerometergegevens. Het project converteert eerst de versnellingsmetergegevens naar een tijdsgetekende weergave. Vervolgens gebruikt het de Keras-bibliotheek om het netwerk te trainen, valideren en testen op basis van de dataset.
Voorspelling van bosbranden
Bosbranden en natuurbranden zijn alarmerend vaak voorkomende rampen geworden in de wereld van vandaag. Deze rampen beschadigen het ecosysteem en kosten ook veel geld en infrastructuur om aan te pakken. Met behulp van k-means clustering kun je hotspots van bosbranden en de ernst van een brand op die plek identificeren, wat kan worden gebruikt voor een betere toewijzing van middelen en snellere reactietijden. Door meteorologische gegevens te gebruiken, zoals seizoenen waarin branden vaker voorkomen en weersomstandigheden die branden verergeren, kan de nauwkeurigheid van de resultaten nog verder worden vergroot.
Gender & Leeftijdsdetectie
Gender- en leeftijdsdetectie is een computer vision en machine learning project. Het maakt gebruik van convolutionele neurale netwerken of CNN. Het project heeft tot doel het geslacht en de leeftijd van een persoon te detecteren door één enkel beeld van zijn gezicht te analyseren. Het geslacht wordt geclassificeerd als man of vrouw en de leeftijd als 0-2, 4-6, 8- 2, 15-20, 25-32, 38-43, 48-53, 60-100. Door factoren als make-up, belichting, gezichtsuitdrukkingen, enz. kan het moeilijk zijn om geslacht en leeftijd te herkennen aan de hand van een enkele foto. Daarom wordt in dit project een classificatiemodel gebruikt in plaats van regressie.
Conclusie
Met de kennis van de juiste tools is geen data science-project te moeilijk. Projecten zijn de perfecte manier om je vaardigheden te verbeteren en vooruitgang te boeken in de beheersing ervan.
Deze data science-projecten zijn de projecten die in 2020 zeer nuttig en trending zullen zijn. Ze zullen je zeker naar succes leiden. Het enige wat u hoeft te doen, is aan de slag gaan.
Inschrijven op onze nieuwsbrief
Wees op de hoogte van de laatste updates en relevante aanbiedingen door uw e-mailadres in te vullen.