Som kommende datalog er den bedste måde for dig at øge dit færdighedsniveau ved at øve dig. Og hvilken bedre måde er der til at øve dine tekniske færdigheder på end at lave projekter. Personlige projekter er en vigtig del af din karriereudvikling. De vil bringe dig et skridt nærmere din datalogidrøm. Projekterne vil øge din viden, dine færdigheder og din selvtillid. At fremvise projekter i dit cv vil gøre det meget lettere at få et datavidenskabsjob.
“Hvilke projekter skal jeg lave?” spørger du? Nå, men du skal ikke bekymre dig et sekund! For jeg er her, med disse fantastiske ideer til datalogiprojekter i 2020. Så lad os begynde allerede!
- Tegngenkendelse
- Detektion af døsighed hos chaufføren
- Brystkræftdetektion
- Klimaændringers indvirkning på den globale fødevareforsyning
- Chatbot
- Tidsserieprognoser for webtrafik
- Fake News Detection
- Human Action Recognition
- Forest Fire Prediction
- Genre & Aldersdetektion
- Slutning
- Abonner på vores nyhedsbrev
- Tilmeld dig vores Telegram-gruppe. Bliv en del af et engagerende onlinefællesskab. Tilmeld dig her.
Tegngenkendelse
Dette projekt fokuserer på computerens evne til at genkende og forstå de tegn, der er håndskrevet af mennesker. Der trænes et konvoluteret neuralt netværk ved hjælp af MNIST-datasættet. Dette hjælper det neurale netværk til at genkende håndskrevne cifre med rimelig nøjagtighed. Projektet anvender deep learning og kræver Keras- og Tkinter-bibliotekerne.
Detektion af døsighed hos chaufføren
Natkørsel er et hårdt job. Der sker mange ulykker, når en chauffør bliver søvnig eller døsig under kørslen. Dette projekt har til formål at genkende, hvornår chaufføren måske er ved at falde i søvn, og slå alarm.
Dette projekt bruger en deep learning-model til at klassificere blandt billeder, hvor folks øjne er åbne eller lukkede. Den opretholder en score baseret på, hvor længe øjnene forbliver lukkede. Hvis scoren stiger yderligere over en bestemt tærskelværdi. Modellen slår alarm. For at implementere disse projekter skal du sikre dig, at du er meget godt klar over alle de grundlæggende begreber inden for datalogi.
Brystkræftdetektion
Brystkræftdetektionsprojektet bruger histologibilleder til at klassificere, om patienten har Invasivt duktalt karcinom eller ej. Dette projekt anvender et IDC-datasæt til at klassificere histologibilleder som ondartede eller godartede. Et konvoluteret neuralt netværk er bedst egnet til denne opgave. Modellen trænes ved hjælp af ca. 80 % af datasættet, og det resterende datasæt bruges til at teste modellens nøjagtighed efter træning.
Klimaændringers indvirkning på den globale fødevareforsyning
Klimaændringer og anomalier er ved at blive en almindelig del af vores verden i dag. Dette er begyndt at påvirke alle aspekter af menneskelivet på vores planet. Dette projekt fokuserer på at kvantificere den indvirkning, som klimaændringerne har og vil få på den globale fødevareproduktion. Formålet med dette projekt er at vurdere den potentielle indvirkning af klimaændringerne på produktionen af basisafgrøder. Projektet vurderer konsekvenserne af temperatur- og nedbørsændringer under hensyntagen til kuldioxidens indvirkning på plantevæksten og usikkerheden i forbindelse med klimaændringerne. Projektet omhandler datavisualisering og sammenligninger, der foretages mellem udbytter i forskellige regioner på forskellige tidspunkter.
Chatbot
Chatbots spiller en vigtig rolle i virksomheder. De hjælper med at levere forbedrede og personaliserede tjenester og sparer samtidig arbejdskraft.
En chatbot kan trænes ved hjælp af dybe indlæringsteknikker og ved hjælp af et datasæt med en liste over ordforråd, en liste over almindelige sætninger, hensigten bag dem og deres passende svar. Den mest almindelige metode til træning af chatbots er at bruge Recurring Neural Networks (RNN). Botten består af en koder, der opdaterer sine tilstande i henhold til den indtastede sætning sammen med hensigten og videregiver tilstanden til botten. Botten bruger derefter dekoderen til at finde et passende svar i overensstemmelse med ordene og hensigten bag dem. Du kan nemt implementere chatbot med Python.
Tidsserieprognoser for webtrafik
Tidsserieprognoser er et meget vigtigt begreb inden for statistik og maskinlæring. Forudsigelse af webtrafik er en populær anvendelse af tidsserieprognoser. Det hjælper webservere med at forvalte deres ressourcer bedre for at undgå udfald. For at gøre projektet endnu mere interessant kan du bruge wavenets i stedet for traditionelle neurale netværk. Wavenets bruger kausale konvolutioner, hvilket gør dem mere effektive og lette på samme tid.
Fake News Detection
Ideen bag dette projekt er at opbygge en maskinlæringsmodel, der kan registrere, om den nyhed, der gives af et indlæg på et socialt medie, er sand eller ej. Du kan bruge TfidfVectorizer og en PassiveAggressive-klassifikator til at opbygge denne model.
TF eller Term Frequency er antallet af gange, et ord forekommer i et dokument.
IDF eller den omvendte dokumentfrekvens er et mål for betydningen af et ord baseret på antallet af gange, det forekommer i forskellige dokumenter. Almindelige ord, der forekommer i mange dokumenter, har ikke høj betydning.
TFIDFVectorizer analyserer en samling dokumenter og opretter en TF-IDF-matrix i henhold til den.
En PassivAggressiv klassifikator forbliver passiv, hvis klassifikationsresultatet er korrekt, men ændrer aggressivt sine klassifikationskriterier, hvis klassifikationen er forkert.
Ved hjælp af disse kan vi opbygge en maskinlæringsmodel, der kan klassificere nyhederne som falske eller sande.
Human Action Recognition
Modellen til genkendelse af menneskelige handlinger ser på korte videoer af mennesker, der udfører bestemte handlinger, og forsøger at klassificere dem på baggrund af, hvad handlingen er. Den anvender et konvoluteret neuralt netværk, der er trænet på et datasæt, som indeholder korte videoer og accelerometerdata, der er knyttet til dem. Projektet konverterer først accelerometerdataene til en tidsskiveskåret repræsentation. Derefter bruger det Keras-biblioteket til at træne, validere og teste netværket i henhold til datasættet.
Forest Fire Prediction
Skovbrande og vilde brande er blevet alarmerende almindelige katastrofer i dagens verden. Disse katastrofer skader økosystemet og koster også meget i form af penge og infrastruktur at håndtere. Ved hjælp af k-means clustering kan man identificere hotspots for skovbrande og brandens alvorlighed på det pågældende sted, hvilket kan bruges til bedre ressourceallokering og hurtigere responstider. Ved at bruge meteorologiske data som f.eks. sæsoner, hvor brande er mere almindelige, og vejrforhold, der forværrer dem, kan man øge nøjagtigheden af resultaterne yderligere.
Genre & Aldersdetektion
Genre- og aldersdetektion er et computer vision- og maskinlæringsprojekt. Det anvender konvolutionelle neurale netværk eller CNN. Projektet har til formål at detektere køn og alder på en person ved at analysere et enkelt billede af dennes ansigt. Kønnet klassificeres som mand eller kvinde, og alderen klassificeres i intervallerne 0-2, 4-6, 8- 2, 15-20, 25-32, 38-43, 48-53 og 60-100. På grund af faktorer som makeup, belysning, ansigtsudtryk osv. kan det være vanskeligt at genkende køn og alder ud fra et enkelt billede. Derfor anvendes der i dette projekt en klassifikationsmodel i stedet for regression.
Slutning
Med kendskab til de rigtige værktøjer er der intet datalogiprojekt, der er for svært. Projekter er den perfekte måde at forbedre dine færdigheder på og gøre fremskridt hen imod deres beherskelse.
Disse datavidenskabsprojekter er dem, der vil være meget nyttige og trendende i 2020. De vil helt sikkert føre dig til succes. Alt du behøver at gøre er at komme i gang.
Abonner på vores nyhedsbrev
Få de seneste opdateringer og relevante tilbud ved at dele din e-mail.