Jako aspirujący data scientist, najlepszym sposobem na zwiększenie poziomu swoich umiejętności jest praktyka. A co jest lepszym sposobem na ćwiczenie umiejętności technicznych niż tworzenie projektów. Projekty osobiste są istotną częścią rozwoju Twojej kariery. Dzięki nim zbliżysz się o krok do swoich marzeń o nauce o danych. Projekty zwiększą Twoją wiedzę, umiejętności i pewność siebie. Pokazanie projektów w swoim CV sprawi, że zdobycie pracy w nauce o danych będzie o wiele łatwiejsze.
„Jakie projekty powinienem robić?” pytasz? Cóż, nie martw się ani przez chwilę! Bo jestem tutaj, z tymi niesamowitymi pomysłami na projekty z zakresu nauki o danych w 2020 roku. Więc zacznijmy już teraz!
- Rozpoznawanie znaków
- Driver Drowsiness Detection
- Wykrywanie raka piersi
- Impact Of Climate Change On Global Food Supply
- Chatbot
- Web Traffic Time Series Forecasting
- Wykrywanie fałszywych wiadomości
- Rozpoznawanie działań ludzkich
- Przewidywanie pożarów lasów
- Płeć &Detekcja wieku
- Wnioski
- Subscribe to our Newsletter
- Dołącz do naszej grupy Telegram. Bądź częścią angażującej społeczności online. Dołącz tutaj.
Rozpoznawanie znaków
Ten projekt skupia się na zdolności komputera do rozpoznawania i rozumienia znaków pisanych ręcznie przez ludzi. Skonwertowana sieć neuronowa jest trenowana przy użyciu zbioru danych MNIST. Pomaga to sieci neuronowej rozpoznawać ręcznie pisane cyfry z rozsądną dokładnością. Projekt wykorzystuje głębokie uczenie i wymaga bibliotek Keras i Tkinter.
Driver Drowsiness Detection
Prowadzenie samochodu w nocy to trudne zadanie. Wiele wypadków zdarza się, gdy kierowca staje się senny lub senny podczas jazdy. Ten projekt ma na celu rozpoznanie, kiedy kierowca może zasypiać i podnosi alarm.
Ten projekt wykorzystuje model głębokiego uczenia do klasyfikacji obrazów, na których oczy ludzi są otwarte lub zamknięte. Utrzymuje on wynik oparty na tym, jak długo oczy pozostają zamknięte. Jeśli wynik wzrasta dalej niż określony próg. Model podnosi alarm. Aby wdrożyć te projekty, upewnij się, że jesteś bardzo dobrze świadomy wszystkich podstawowych pojęć Data Science.
Wykrywanie raka piersi
Projekt wykrywania raka piersi wykorzystuje obrazy histologiczne do klasyfikacji, czy pacjent ma Invasive Ductal Carcinoma, czy nie. Projekt ten wykorzystuje zestaw danych IDC do klasyfikacji obrazów histologicznych jako złośliwych lub łagodnych. Skonwertowana sieć neuronowa najlepiej nadaje się do tego zadania. Model jest trenowany przy użyciu około 80% zbioru danych, a pozostały zbiór danych jest używany do testowania dokładności modelu po jego wytrenowaniu.
Impact Of Climate Change On Global Food Supply
Zmiany klimatu i anomalie stają się powszechną częścią naszego świata w dzisiejszych czasach. Zaczyna to wpływać na każdy aspekt ludzkiego życia na naszej planecie. Ten projekt skupia się na ilościowym określeniu wpływu, jaki zmiany klimatyczne mają i będą miały na globalną produkcję żywności. Celem tego projektu jest ocena potencjalnego wpływu zmian klimatu na produkcję podstawowych roślin uprawnych. Projekt ocenia implikacje zmian temperatury i opadów, biorąc pod uwagę wpływ dwutlenku węgla na wzrost roślin i niepewność zmian klimatycznych. Projekt ten zajmuje się wizualizacją danych i porównaniami między plonami w różnych regionach w różnych okresach.
Chatbot
Chatboty odgrywają ważną rolę w przedsiębiorstwach. Pomagają one w świadczeniu ulepszonych i spersonalizowanych usług, a jednocześnie oszczędzają siłę roboczą.
Chatbot może być szkolony przy użyciu technik głębokiego uczenia i przy użyciu zbioru danych z listą słownictwa, listą popularnych zdań, intencji stojących za nimi i ich odpowiednimi odpowiedziami. Najczęstszą metodologią szkolenia chatbotów jest wykorzystanie rekurencyjnych sieci neuronowych (RNN). Bot składa się z kodera, który aktualizuje swoje stany zgodnie ze zdaniem wejściowym wraz z intencją i przekazuje stan do bota. Bot następnie używa dekodera, aby znaleźć odpowiednią odpowiedź w zależności od słów i intencji, które za nimi stoją. Możesz łatwo wdrożyć chatbota za pomocą Pythona.
Web Traffic Time Series Forecasting
Prognozowanie szeregów czasowych jest bardzo ważną koncepcją w statystyce i uczeniu maszynowym. Przewidywanie ruchu na stronach internetowych jest popularnym zastosowaniem prognozowania szeregów czasowych. Pomaga ono serwerom internetowym lepiej zarządzać swoimi zasobami, aby uniknąć przestojów. Aby uczynić projekt jeszcze bardziej interesującym, zamiast tradycyjnych sieci neuronowych możesz użyć wavenetów. Wavenety używają konwolucji przyczynowych, co czyni je bardziej wydajnymi i lekkimi w tym samym czasie.
Wykrywanie fałszywych wiadomości
Pomysł tego projektu polega na zbudowaniu modelu uczenia maszynowego, który może wykryć, czy wiadomości podane przez dowolny post w mediach społecznościowych są prawdziwe, czy nie. Możesz użyć TfidfVectorizer, oraz klasyfikatora PassiveAggressive do zbudowania tego modelu.
TF lub Częstotliwość Terminów jest liczbą wystąpień danego słowa w dokumencie.
IDF lub Inverse Document Frequency jest miarą ważności słowa opartą na liczbie jego wystąpień w różnych dokumentach. Słowa pospolite, które występują w wielu dokumentach nie mają wysokiego znaczenia.
TFIDFVectorizer analizuje kolekcję dokumentów i tworzy według niej macierz TF-IDF.
A PassiveAggressive klasyfikator pozostaje pasywny, jeśli wynik klasyfikacji jest poprawny, ale agresywnie zmienia swoje kryteria klasyfikacji, jeśli klasyfikacja jest niepoprawna.
Używając tego, możemy zbudować model uczenia maszynowego, który może sklasyfikować wiadomości jako fałszywe lub prawdziwe.
Rozpoznawanie działań ludzkich
Model rozpoznawania działań ludzkich patrzy na krótkie filmy wideo ludzi wykonujących pewne działania i próbuje je sklasyfikować w oparciu o to, co to za działanie. Wykorzystuje on zagmatwaną sieć neuronową wytrenowaną na zbiorze danych zawierającym krótkie filmy i dane z akcelerometru z nimi związane. Projekt najpierw konwertuje dane z akcelerometru do reprezentacji pociętej w czasie. Następnie wykorzystuje bibliotekę Keras do szkolenia, walidacji i testowania sieci zgodnie z zestawem danych.
Przewidywanie pożarów lasów
Pożary lasów i dzikie pożary stały się alarmująco powszechnymi katastrofami w dzisiejszym świecie. Klęski te niszczą ekosystem, a także kosztują dużo pieniędzy i infrastruktury, aby sobie z nimi poradzić. Używając klasteryzacji k-średnich, można zidentyfikować punkty zapalne pożarów lasów i nasilenie pożaru w tym miejscu, co może być wykorzystane do lepszego przydziału zasobów i szybszego czasu reakcji. Użycie danych meteorologicznych, takich jak pory roku, w których pożary są bardziej powszechne, oraz warunki pogodowe, które je zaostrzają, może jeszcze bardziej zwiększyć dokładność wyników.
Płeć &Detekcja wieku
Detekcja płci i wieku jest projektem z zakresu wizji komputerowej i uczenia maszynowego. Wykorzystuje on konwencjonalne sieci neuronowe lub CNN. Projekt ma na celu wykrycie płci i wieku osoby poprzez analizę pojedynczego obrazu jej twarzy. Płeć jest klasyfikowana jako męska lub żeńska, a wiek jest klasyfikowany w przedziałach 0-2, 4-6, 8-2, 15-20, 25-32, 38-43, 48-53, 60-100. Ze względu na takie czynniki jak makijaż, oświetlenie, mimika twarzy, itp. rozpoznanie płci i wieku z pojedynczego obrazu może być trudne. Dlatego w tym projekcie zastosowano model klasyfikacyjny zamiast regresji.
Wnioski
Przy znajomości odpowiednich narzędzi, nie ma zbyt trudnego projektu z dziedziny data science. Projekty są doskonałym sposobem na doskonalenie swoich umiejętności i postęp w kierunku ich opanowania.
Te projekty data science są tymi, które będą bardzo przydatne i trendy w 2020 roku. Z pewnością doprowadzą Cię do sukcesu. Wszystko, co musisz zrobić, to zacząć działać.
Subscribe to our Newsletter
Get the latest updates and relevant offers by sharing your email.