Como aspirante a científico de datos, la mejor manera de aumentar tu nivel de habilidad es practicando. Y qué mejor manera hay para practicar tus habilidades técnicas que haciendo proyectos. Los proyectos personales son una parte esencial del crecimiento de tu carrera. Te llevarán un paso más cerca de tu sueño de la ciencia de los datos. Los proyectos aumentarán tus conocimientos, habilidades y confianza. Mostrar proyectos en tu currículum va a hacer que conseguir un trabajo de ciencia de datos sea mucho más fácil.
«¿Qué proyectos debo hacer?» te preguntarás? ¡Pues no te preocupes ni un segundo! Porque aquí estoy yo, con estas increíbles ideas para proyectos de ciencia de datos en 2020. Así que ¡empecemos ya!
- Reconocimiento de caracteres
- Detección de somnolencia del conductor
- Detección de Cáncer de Mama
- Impacto del cambio climático en el suministro global de alimentos
- Chatbot
- Previsión de series temporales de tráfico web
- Detección de noticias falsas
- Reconocimiento de la acción humana
- Predicción de incendios forestales
- Detección de género &Edad
- Conclusión
- Suscríbete a nuestra Newsletter
- Únete a nuestro grupo de Telegram. Forma parte de una atractiva comunidad online. Únete aquí.
Reconocimiento de caracteres
Este proyecto se centra en la capacidad del ordenador para reconocer y entender los caracteres escritos a mano por los humanos. Se entrena una red neuronal enrevesada utilizando el conjunto de datos MNIST. Esto ayuda a la red neuronal a reconocer los dígitos escritos a mano con una precisión razonable. El proyecto utiliza el aprendizaje profundo y requiere las bibliotecas Keras y Tkinter.
Detección de somnolencia del conductor
La conducción nocturna es un trabajo duro. Muchos accidentes ocurren cuando un conductor tiene sueño o está somnoliento mientras conduce. Este proyecto pretende reconocer cuándo el conductor puede estar quedándose dormido y da la alarma.
Este proyecto utiliza un modelo de aprendizaje profundo para clasificar entre las imágenes en las que los ojos de las personas están abiertos o cerrados. Mantiene una puntuación basada en el tiempo que los ojos permanecen cerrados. Si la puntuación aumenta más allá de un umbral especificado. El modelo da la alarma. Para implementar estos proyectos, asegúrate de conocer muy bien todos los conceptos básicos de la Ciencia de Datos.
Detección de Cáncer de Mama
El proyecto de detección de cáncer de mama utiliza imágenes histológicas para clasificar si el paciente tiene Carcinoma Ductal Invasivo o no. Este proyecto utiliza un conjunto de datos IDC para clasificar las imágenes histológicas como malignas o benignas. Una red neuronal convoluta es la más adecuada para esta tarea. El modelo se entrena utilizando alrededor del 80% del conjunto de datos, y el conjunto de datos restante se utiliza para probar la precisión del modelo después de entrenarlo.
Impacto del cambio climático en el suministro global de alimentos
El cambio climático y las anomalías se están convirtiendo en una parte común de nuestro mundo en estos días. Esto está empezando a afectar a todos los aspectos de la vida humana en nuestro planeta. Este proyecto se centra en cuantificar el impacto que el cambio climático está teniendo y tendrá en la producción mundial de alimentos. El objetivo de este proyecto es evaluar el impacto potencial del cambio climático en la producción de cultivos básicos. El proyecto evalúa las implicaciones del cambio de temperaturas y precipitaciones, teniendo en cuenta los efectos del dióxido de carbono en el crecimiento de las plantas y la incertidumbre del cambio climático. Este proyecto se ocupa de la visualización de datos y de las comparaciones establecidas entre los rendimientos de diferentes regiones en diferentes momentos.
Chatbot
Los chatbots desempeñan un papel importante en las empresas. Ayudan a proporcionar servicios mejorados y personalizados y, al mismo tiempo, ahorran mano de obra.
Un chatbot puede ser entrenado usando técnicas de aprendizaje profundo y utilizando un conjunto de datos con una lista de vocabulario, una lista de frases comunes, la intención detrás de ellas y sus respuestas apropiadas. La metodología más común para entrenar a los chatbots es utilizar redes neuronales recurrentes (RNN). El bot consta de un codificador que actualiza sus estados según la frase de entrada junto con la intención y pasa el estado al bot. A continuación, el bot utiliza el decodificador para encontrar una respuesta adecuada según las palabras y la intención que hay detrás de ellas. Puedes implementar el chatbot fácilmente con Python.
Previsión de series temporales de tráfico web
La previsión de series temporales es un concepto muy importante en estadística y aprendizaje automático. La predicción del tráfico web es una aplicación popular de la previsión de series temporales. Ayuda a los servidores web a gestionar mejor sus recursos para evitar cortes. Para hacer el proyecto aún más interesante, puedes utilizar wavenets en lugar de las redes neuronales tradicionales. Las wavenets utilizan convoluciones causales que las hacen más eficientes y ligeras al mismo tiempo.
Detección de noticias falsas
La idea detrás de este proyecto es construir un modelo de aprendizaje automático que pueda detectar si las noticias dadas por cualquier post de medios sociales son verdaderas o no. Se puede utilizar el TfidfVectorizer, y un clasificador PassiveAggressive para construir este modelo.
TF o la Frecuencia de Términos es el número de veces que aparece una palabra en un documento.
IDF o la Frecuencia Inversa de Documentos es una medida de la importancia de una palabra basada en el número de veces que aparece en diferentes documentos. Las palabras comunes que aparecen en muchos documentos no tienen una importancia alta.
TFIDFVectorizer analiza una colección de documentos y crea una matriz TF-IDF de acuerdo con ella.
Un clasificador pasivo-agresivo permanece pasivo si el resultado de la clasificación es correcto pero cambia agresivamente sus criterios de clasificación si la clasificación es incorrecta.
Usando estos, podemos construir un modelo de aprendizaje automático que puede clasificar las noticias como falsas o verdaderas.
Reconocimiento de la acción humana
El modelo de reconocimiento de la acción humana mira videos cortos de seres humanos que realizan ciertas acciones y trata de clasificarlos en base a lo que es la acción. Utiliza una red neuronal enrevesada entrenada en un conjunto de datos que contiene vídeos cortos y datos del acelerómetro asociados a ellos. El proyecto primero convierte los datos del acelerómetro en una representación en tiempo. A continuación, utiliza la biblioteca Keras para entrenar, validar y probar la red de acuerdo con el conjunto de datos.
Predicción de incendios forestales
Los incendios forestales y los fuegos fatuos se han convertido en desastres alarmantemente comunes en el mundo actual. Estos desastres dañan el ecosistema y también cuestan mucho en términos de dinero e infraestructura para hacer frente a ellos. La agrupación de k-means permite identificar los focos de incendios forestales y la gravedad del fuego en ese punto, lo que puede servir para asignar mejor los recursos y acelerar los tiempos de respuesta. El uso de datos meteorológicos como las estaciones en las que los incendios son más comunes y las condiciones meteorológicas que los agravan puede aumentar aún más la precisión de los resultados.
Detección de género &Edad
La detección de género y edad es un proyecto de visión por ordenador y aprendizaje automático. Utiliza redes neuronales convolucionales o CNN. El proyecto pretende detectar el género y la edad de una persona analizando una sola imagen de su rostro. El género se clasifica como masculino o femenino y la edad se clasifica entre los rangos de 0-2, 4-6, 8- 2, 15-20, 25-32, 38-43, 48-53, 60-100. Debido a factores como el maquillaje, la iluminación, las expresiones faciales, etc., reconocer el sexo y la edad a partir de una sola imagen puede resultar difícil. Por lo tanto, este proyecto utiliza un modelo de clasificación en lugar de regresión.
Conclusión
Con el conocimiento de las herramientas adecuadas, no hay proyecto de ciencia de datos que sea demasiado difícil. Los proyectos son la forma perfecta de mejorar tus habilidades y progresar hacia su dominio.
Estos proyectos de ciencia de datos son los que serán muy útiles y tendencia en 2020. Seguramente te llevarán al éxito. Todo lo que necesitas es empezar.
Suscríbete a nuestra Newsletter
Obtén las últimas actualizaciones y ofertas relevantes compartiendo tu email.