Como aspirante a cientista de dados, a melhor maneira de você aumentar seu nível de habilidades é praticando. E que melhor maneira há de praticar suas habilidades técnicas do que fazer projetos. Os projectos pessoais são uma parte essencial do crescimento da sua carreira. Eles o levarão um passo mais perto do seu sonho de ciência de dados. Os projetos irão aumentar o seu conhecimento, habilidades e confiança. Mostrar projetos em seu currículo vai facilitar muito a obtenção de um emprego em ciências de dados.
“Que projetos eu devo fazer?” você pergunta? Bem, não se preocupe por um segundo! Pois eu estou aqui, com essas idéias incríveis para projetos de ciência de dados em 2020. Então vamos começar já!
- Character Recognition
- Driver Drowsiness Detection
- Detecção do cancro da mama
- Impacto das mudanças climáticas no fornecimento global de alimentos
- Chatbot
- Previsão de séries de tempo de tráfego Web
- Detecção de Notícias Falsas
- Conhecimento da Acção Humana
- Forest Fire Prediction
- Gênero &Detecção de idade
- Conclusão
- Subscreva a nossa Newsletter
- Junte-se ao nosso Grupo de Telegramas. Faça parte de uma comunidade online envolvente. Junte-se a nós aqui.
Character Recognition
Este projecto foca-se na capacidade do computador para reconhecer e compreender os caracteres escritos à mão pelos humanos. Uma rede neural enrolada é treinada usando o conjunto de dados MNIST. Isto ajuda a rede neural a reconhecer dígitos escritos à mão com razoável precisão. O projeto usa aprendizagem profunda e requer as bibliotecas Keras e Tkinter.
Driver Drowsiness Detection
Overnight driving is a hard job. Muitos acidentes acontecem quando um motorista fica sonolento ou sonolento enquanto dirige. Este projecto pretende reconhecer quando o condutor pode estar a adormecer e faz soar o alarme.
Este projecto utiliza um modelo de aprendizagem profunda para classificar entre imagens onde os olhos das pessoas estão abertos ou fechados. Ele mantém uma pontuação baseada no tempo em que os olhos permanecem fechados. Se a pontuação aumenta mais do que um limite especificado. O modelo aumenta o alarme. Para implementar estes projectos, certifique-se de que está muito bem ciente de todos os conceitos básicos da Data Science.
Detecção do cancro da mama
O projecto de detecção do cancro da mama utiliza imagens histológicas para classificar se a paciente tem ou não Carcinoma Ductal Invasivo. Este projeto usa um conjunto de dados do IDC para classificar as imagens histológicas como malignas ou benignas. Uma rede neural enrolada é a mais adequada para esta tarefa. O modelo é treinado usando cerca de 80% do conjunto de dados, e o restante do conjunto de dados é usado para testar a precisão do modelo após treiná-lo.
Impacto das mudanças climáticas no fornecimento global de alimentos
A mudança climática e as anomalias estão se tornando uma parte comum do nosso mundo hoje em dia. Isto está começando a afetar todos os aspectos da vida humana em nosso planeta. Este projeto se concentra em quantificar o impacto que as mudanças climáticas estão tendo e terão na produção global de alimentos. O objetivo deste projeto é avaliar o impacto potencial da mudança climática na produção de culturas básicas. O projeto avalia as implicações da mudança de temperatura e da precipitação, levando em conta os efeitos do dióxido de carbono no crescimento das plantas e a incerteza na mudança climática. Este projecto trata da visualização de dados e comparações entre produções em diferentes regiões em diferentes momentos.
Chatbot
Chatbots desempenham um papel importante nos negócios. Eles ajudam a fornecer serviços melhorados e personalizados e, ao mesmo tempo, poupam mão-de-obra.
Um chatbot pode ser treinado usando técnicas de aprendizagem profunda e usando um conjunto de dados com uma lista de vocabulário, uma lista de frases comuns, a intenção por trás delas, e suas respostas apropriadas. A metodologia mais comum para treinamento de chatbots é usar Redes Neurais Recorrentes (RNN). O bot consiste em um codificador que atualiza seus estados de acordo com a frase de entrada junto com a intenção e passa o estado para o bot. O bot então usa o decodificador para encontrar uma resposta apropriada de acordo com as palavras e a intenção por trás delas. Você pode implementar chatbot facilmente com Python.
Previsão de séries de tempo de tráfego Web
Previsão de séries de tempo é um conceito muito importante em estatística e aprendizagem de máquina. A previsão de tráfego web é uma aplicação popular da previsão de séries temporais. Ela ajuda os servidores web a gerenciar melhor seus recursos para evitar interrupções. Para tornar o projeto ainda mais interessante, você pode usar wavenets ao invés das tradicionais redes neurais. Wavenets usam convoluções causais que as tornam mais eficientes e leves ao mesmo tempo.
Detecção de Notícias Falsas
A ideia por trás deste projecto é construir um modelo de aprendizagem de máquinas que possa detectar se as notícias dadas por qualquer post de redes sociais são verdadeiras ou não. Você pode usar o TfidfVectorizer, e um classificador PassiveAggressive para construir este modelo.
TF ou o termo Frequency é o número de vezes que uma palavra aparece em um documento.
IDF ou a Frequência do Documento Inverso é uma medida da importância de uma palavra baseada no número de vezes que ela ocorre em diferentes documentos. As palavras comuns que ocorrem em muitos documentos não têm grande importância.
TFIDFVectorizer analisa um conjunto de documentos e cria uma matriz TF-IDF de acordo com ela.
Um classificador passivoAggressivo permanece passivo se o resultado da classificação estiver correto, mas agressivamente muda seu critério de classificação se a classificação estiver incorreta.
Usando estes, podemos construir um modelo de aprendizagem da máquina que pode classificar as notícias como falsas ou verdadeiras.
Conhecimento da Acção Humana
O modelo de reconhecimento da acção humana olha para pequenos vídeos de humanos que realizam determinadas acções e tenta classificá-las com base no que é a acção. Ele usa uma rede neural enrolada treinada em um conjunto de dados contendo vídeos curtos e dados de acelerômetros associados a eles. O projeto primeiro converte os dados do acelerômetro em representação temporizada. Em seguida utiliza a biblioteca Keras para treinar, validar e testar a rede de acordo com o conjunto de dados.
Forest Fire Prediction
Forest Firees and wildfires have become alarmantly common disasters in today’s world. Estes desastres danificam o ecossistema e também custam muito em termos de dinheiro e infra-estrutura para se lidar com eles. Usando o agrupamento de meios k, você pode identificar os focos de incêndio florestal e a gravidade de um incêndio naquele local, que pode ser usado para uma melhor alocação de recursos e tempos de resposta mais rápidos. Usando dados meteorológicos como estações do ano em que os incêndios são mais comuns, e condições climáticas que os exacerbam podem aumentar ainda mais a precisão dos resultados.
Gênero &Detecção de idade
Detecção de gênero e idade é um projeto de visão computacional e aprendizagem de máquina. Ele usa redes neurais convolucionais ou CNN. O projeto visa detectar o sexo e a idade de uma pessoa, analisando uma única imagem do seu rosto. O sexo é classificado como masculino ou feminino e a idade é classificada entre as faixas de 0-2, 4-6, 8- 2, 15-20, 25-32, 38-43, 48-53, 60-100. Devido a fatores como maquiagem, iluminação, expressões faciais, etc., reconhecer o sexo e a idade de uma única imagem pode ser difícil. Portanto, este projeto usa um modelo de classificação ao invés de regressão.
Conclusão
Com o conhecimento das ferramentas certas, não há um projeto de ciência de dados que seja muito difícil. Os projetos são a maneira perfeita para melhorar suas habilidades e progredir em direção ao seu domínio.
Estes projectos de ciência de dados são os que serão muito úteis e com tendência para 2020. Eles certamente irão levá-lo ao sucesso. Tudo o que você precisa fazer é começar.
Subscreva a nossa Newsletter
Receba as últimas actualizações e ofertas relevantes, partilhando o seu e-mail.