Come aspirante data scientist, il modo migliore per aumentare il tuo livello di abilità è fare pratica. E quale modo migliore per mettere in pratica le tue abilità tecniche che fare progetti. I progetti personali sono una parte essenziale della tua crescita professionale. Ti porteranno un passo più vicino al tuo sogno di scienza dei dati. I progetti aumenteranno le tue conoscenze, le tue abilità e la tua fiducia. Mostrare i progetti nel tuo curriculum renderà molto più facile ottenere un lavoro nella scienza dei dati.
“Quali progetti dovrei fare? Bene, non preoccupatevi per un secondo! Perché io sono qui, con queste incredibili idee per progetti di scienza dei dati nel 2020. Quindi cominciamo!
- Riconoscimento dei caratteri
- Rilevamento della sonnolenza del guidatore
- Rilevamento del cancro al seno
- Impatto del cambiamento climatico sull’approvvigionamento alimentare globale
- Chatbot
- Previsione delle serie temporali del traffico web
- Rilevazione di notizie false
- Riconoscimento delle azioni umane
- Previsione degli incendi boschivi
- Gender &Rilevamento dell’età
- Conclusione
- Abbonati alla nostra Newsletter
- Unisciti al nostro gruppo Telegram. Fai parte di una coinvolgente comunità online. Unisciti qui.
Riconoscimento dei caratteri
Questo progetto si concentra sulla capacità del computer di riconoscere e comprendere i caratteri scritti a mano dagli umani. Una rete neurale convoluta viene addestrata usando il dataset MNIST. Questo aiuta la rete neurale a riconoscere le cifre scritte a mano con una ragionevole accuratezza. Il progetto utilizza l’apprendimento profondo e richiede le librerie Keras e Tkinter.
Rilevamento della sonnolenza del guidatore
La guida notturna è un lavoro difficile. Molti incidenti accadono quando un autista ha sonno o sonnolenza durante la guida. Questo progetto mira a riconoscere quando il guidatore potrebbe addormentarsi e dare l’allarme.
Questo progetto utilizza un modello di deep learning per classificare tra le immagini dove gli occhi delle persone sono aperti o chiusi. Mantiene un punteggio basato su quanto tempo gli occhi rimangono chiusi. Se il punteggio aumenta oltre una soglia specificata. Il modello lancia l’allarme. Per implementare questi progetti, assicurati di essere ben consapevole di tutti i concetti di base della scienza dei dati.
Rilevamento del cancro al seno
Il progetto di rilevamento del cancro al seno utilizza immagini istologiche per classificare se il paziente ha un carcinoma duttale invasivo o meno. Questo progetto utilizza un set di dati IDC per classificare le immagini istologiche come maligne o benigne. Una rete neurale convoluta è la più adatta per questo compito. Il modello viene addestrato utilizzando circa l’80% del dataset, e il restante dataset viene utilizzato per testare l’accuratezza del modello dopo averlo addestrato.
Impatto del cambiamento climatico sull’approvvigionamento alimentare globale
Il cambiamento climatico e le anomalie stanno diventando una parte comune del nostro mondo in questi giorni. Questo sta iniziando a influenzare ogni aspetto della vita umana sul nostro pianeta. Questo progetto si concentra sulla quantificazione dell’impatto che il cambiamento climatico sta avendo e avrà sulla produzione alimentare globale. Lo scopo di questo progetto è di valutare il potenziale impatto del cambiamento climatico sulla produzione di colture di base. Il progetto valuta le implicazioni del cambiamento della temperatura e delle precipitazioni, prendendo in considerazione gli effetti dell’anidride carbonica sulla crescita delle piante e l’incertezza del cambiamento climatico. Questo progetto si occupa della visualizzazione dei dati e dei confronti tra le rese in diverse regioni in tempi diversi.
Chatbot
I chatbot giocano un ruolo importante nelle aziende. Aiutano a fornire servizi migliori e personalizzati e a risparmiare manodopera allo stesso tempo.
Un chatbot può essere addestrato utilizzando tecniche di deep learning e utilizzando un set di dati con un elenco di vocabolario, un elenco di frasi comuni, l’intento dietro di esse e le loro risposte appropriate. La metodologia più comune per l’addestramento dei chatbot è quella di utilizzare le reti neurali ricorrenti (RNN). Il bot consiste in un codificatore che aggiorna i suoi stati in base alla frase in ingresso insieme all’intento e passa lo stato al bot. Il bot poi usa il decodificatore per trovare una risposta appropriata secondo le parole e l’intento dietro di esse. Puoi implementare facilmente il chatbot con Python.
Previsione delle serie temporali del traffico web
La previsione delle serie temporali è un concetto molto importante nelle statistiche e nell’apprendimento automatico. Prevedere il traffico web è un’applicazione popolare della previsione delle serie temporali. Aiuta i server web a gestire meglio le loro risorse per evitare interruzioni. Per rendere il progetto ancora più interessante, è possibile utilizzare wavenet invece delle tradizionali reti neurali. I wavenet usano convoluzioni causali che li rendono più efficienti e leggeri allo stesso tempo.
Rilevazione di notizie false
L’idea dietro questo progetto è di costruire un modello di apprendimento automatico che possa rilevare se la notizia data da qualsiasi post sui social media è vera o no. Puoi usare il TfidfVectorizer e un classificatore PassiveAggressive per costruire questo modello.
TF o la Term Frequency è il numero di volte che una parola appare in un documento.
IDF o la Frequenza inversa del documento è una misura dell’importanza di una parola basata sul numero di volte che compare in diversi documenti. Le parole comuni che ricorrono in molti documenti non hanno un’importanza elevata.
TFIDFVectorizer analizza una collezione di documenti e crea una matrice TF-IDF in base ad essa.
Un classificatore passivo-aggressivo rimane passivo se il risultato della classificazione è corretto ma cambia aggressivamente i suoi criteri di classificazione se la classificazione è errata.
Utilizzando questi, possiamo costruire un modello di apprendimento automatico che può classificare le notizie come false o vere.
Riconoscimento delle azioni umane
Il modello di riconoscimento delle azioni umane guarda brevi video di persone che eseguono determinate azioni e cerca di classificarle in base all’azione. Utilizza una rete neurale convoluta addestrata su un set di dati contenente brevi video e dati dell’accelerometro ad essi associati. Il progetto prima converte i dati dell’accelerometro in una rappresentazione a fette temporali. Poi utilizza la libreria Keras per addestrare, convalidare e testare la rete in base al set di dati.
Previsione degli incendi boschivi
Gli incendi boschivi e gli incendi selvaggi sono diventati disastri allarmantemente comuni nel mondo di oggi. Questi disastri danneggiano l’ecosistema e costano anche molto in termini di denaro e infrastrutture da affrontare. Utilizzando il clustering k-means, è possibile identificare i punti caldi degli incendi boschivi e la gravità di un incendio in quel punto, che può essere utilizzato per una migliore allocazione delle risorse e tempi di risposta più rapidi. Usando i dati meteorologici come le stagioni durante le quali gli incendi sono più comuni e le condizioni meteorologiche che li esacerbano, si può aumentare ulteriormente la precisione dei risultati.
Gender &Rilevamento dell’età
Il rilevamento del genere e dell’età è un progetto di computer vision e machine learning. Utilizza reti neurali convoluzionali o CNN. Il progetto mira a rilevare il sesso e l’età di una persona analizzando una singola immagine del suo viso. Il genere è classificato come maschio o femmina e l’età è classificata tra gli intervalli di 0-2, 4-6, 8- 2, 15-20, 25-32, 38-43, 48-53, 60-100. A causa di fattori come il trucco, l’illuminazione, le espressioni facciali, ecc, riconoscere il sesso e l’età da una singola immagine può essere difficile. Pertanto, questo progetto utilizza un modello di classificazione invece della regressione.
Conclusione
Con la conoscenza degli strumenti giusti, non c’è progetto di scienza dei dati che sia troppo difficile. I progetti sono il modo perfetto per migliorare le proprie competenze e progredire verso la loro padronanza.
Questi progetti di scienza dei dati sono quelli che saranno molto utili e di tendenza nel 2020. Vi porteranno sicuramente al successo. Tutto quello che devi fare è iniziare.
Abbonati alla nostra Newsletter
Ottieni gli ultimi aggiornamenti e le offerte rilevanti condividendo la tua email.