Mint feltörekvő adattudós, a legjobb módja annak, hogy növelje a készségszintjét, az a gyakorlás. És mi lehet jobb módja a technikai készségek gyakorlásának, mint a projektek készítése. A személyes projektek elengedhetetlen részét képezik a karriered növekedésének. Egy lépéssel közelebb visznek az adattudományi álmaidhoz. A projektek növelik a tudásodat, a készségeidet és az önbizalmadat. A projektek bemutatása az önéletrajzodban sokkal könnyebbé teszi az adattudományi állás megszerzését.
“Milyen projekteket készítsek?” – kérdezed? Nos, egy pillanatig se aggódjon! Mert itt vagyok én, ezekkel a csodálatos ötletekkel az adattudományi projektekhez 2020-ban. Szóval kezdjük máris!
- Karakterfelismerés
- Vezető álmosságának felismerése
- Mellrák felismerése
- A klímaváltozás hatása a globális élelmiszerellátásra
- Chatbot
- Webforgalom idősor-előrejelzés
- Fake News Detection
- Emberi cselekvésfelismerés
- Erdőtüzek előrejelzése
- Gender & Age Detection
- Következtetés
- Iratkozzon fel hírlevelünkre
- Csatlakozz a Telegram csoportunkhoz. Legyen részese egy magával ragadó online közösségnek. Csatlakozzon itt.
Karakterfelismerés
Ez a projekt arra összpontosít, hogy a számítógép képes legyen felismerni és megérteni az emberek által kézzel írt karaktereket. Egy tekervényes neurális hálózatot képezünk ki az MNIST adathalmaz felhasználásával. Ennek segítségével a neurális hálózat elfogadható pontossággal ismeri fel a kézzel írt számjegyeket. A projekt mély tanulást használ, és a Keras és a Tkinter könyvtárakat igényli.
Vezető álmosságának felismerése
Az éjszakai vezetés kemény munka. Rengeteg baleset történik, amikor a sofőr álmos vagy álmos lesz vezetés közben. Ennek a projektnek az a célja, hogy felismerje, ha a sofőr esetleg elalszik, és riasztást adjon.
Ez a projekt egy mély tanulási modellt használ, hogy osztályozzon a képek között, ahol az emberek szemei nyitva vagy csukva vannak. Fenntart egy pontszámot az alapján, hogy a szemek mennyi ideig maradnak csukva. Ha a pontszám tovább nő egy megadott küszöbértéknél. A modell riasztást ad ki. E projektek megvalósításához győződjön meg róla, hogy nagyon jól ismeri az adattudomány összes alapfogalmát.
Mellrák felismerése
A mellrák felismerése projekt szövettani képeket használ annak osztályozására, hogy a betegnek van-e invazív duktális karcinómája vagy sem. Ez a projekt egy IDC-adatkészletet használ a szövettani képek rosszindulatú vagy jóindulatúvá minősítéséhez. Egy tekervényes neurális hálózat a legalkalmasabb erre a feladatra. A modellt az adathalmaz körülbelül 80%-ának felhasználásával képezzük ki, a fennmaradó adathalmazt pedig a modell betanítása után a modell pontosságának tesztelésére használjuk.
A klímaváltozás hatása a globális élelmiszerellátásra
A klímaváltozás és az anomáliák napjainkban a világunk mindennapos részévé válnak. Ez kezd kihatni az emberi élet minden aspektusára bolygónkon. Ez a projekt annak számszerűsítésére összpontosít, hogy az éghajlatváltozás milyen hatással van és lesz a globális élelmiszertermelésre. A projekt célja, hogy felmérje az éghajlatváltozásnak az alapvető növénykultúrák termelésére gyakorolt lehetséges hatását. A projekt a hőmérséklet- és csapadékváltozás következményeit értékeli, figyelembe véve a szén-dioxidnak a növények növekedésére gyakorolt hatását és az éghajlatváltozás bizonytalanságát. A projekt az adatok vizualizálásával és a különböző régiókban, különböző időpontokban elért terméshozamok közötti összehasonlításokkal foglalkozik.
Chatbot
A chatbotok fontos szerepet játszanak a vállalkozásokban. Segítenek a jobb és személyre szabott szolgáltatások nyújtásában, és egyúttal munkaerőt takarítanak meg.
Egy chatbotot mélytanulási technikákkal és egy olyan adathalmaz segítségével lehet betanítani, amely tartalmazza a szókincset, a gyakori mondatok listáját, a mögöttük álló szándékot és a megfelelő válaszokat. A chatbotok képzésének legelterjedtebb módszertana az ismétlődő neurális hálózatok (RNN) használata. A bot egy kódolóból áll, amely a bemeneti mondatnak megfelelően frissíti az állapotát a szándékkal együtt, és továbbítja az állapotot a botnak. A bot ezután a dekódert használja arra, hogy megtalálja a megfelelő választ a szavaknak és a mögöttük lévő szándéknak megfelelően. A chatbotot könnyen megvalósíthatja Python segítségével.
Webforgalom idősor-előrejelzés
Az idősor-előrejelzés nagyon fontos fogalom a statisztikában és a gépi tanulásban. A webes forgalom előrejelzése az idősor-előrejelzés egyik népszerű alkalmazása. Segítségével a webszerverek jobban tudják kezelni erőforrásaikat, hogy elkerüljék a kieséseket. Hogy még érdekesebbé tegye a projektet, a hagyományos neurális hálózatok helyett használhat hullámhálókat. A wavenetek kauzális konvolúciókat használnak, ami hatékonyabbá és egyben könnyebbé teszi őket.
Fake News Detection
A projekt lényege egy olyan gépi tanulási modell létrehozása, amely képes felismerni, hogy a bármely közösségi média poszt által közölt hír igaz-e vagy sem. A modell felépítéséhez a TfidfVectorizer, és egy PassiveAggressive osztályozót használhatunk.
TF vagy a Term Frequency azt jelenti, hogy egy szó hányszor fordul elő egy dokumentumban.
IDF vagy az Inverse Document Frequency egy szó fontosságának mérőszáma, amely azon alapul, hogy hányszor fordul elő a különböző dokumentumokban. A sok dokumentumban előforduló gyakori szavak nem rendelkeznek nagy fontossággal.
A TFIDFVectorizer elemzi a dokumentumok gyűjteményét, és ennek megfelelően létrehoz egy TF-IDF mátrixot.
A passzívAgresszív osztályozó passzív marad, ha az osztályozás eredménye helyes, de agresszívan megváltoztatja az osztályozási kritériumokat, ha az osztályozás helytelen.
Ezek felhasználásával olyan gépi tanulási modellt építhetünk, amely képes a híreket hamisnak vagy igaznak minősíteni.
Emberi cselekvésfelismerés
Az emberi cselekvésfelismerő modell rövid videókat néz meg, amelyeken emberek bizonyos cselekvéseket végeznek, és aszerint próbálja osztályozni őket, hogy milyen cselekvésről van szó. Egy rövid videókat és a hozzájuk tartozó gyorsulásmérő adatokat tartalmazó adatkészleten betanított tekervényes neurális hálózatot használ. A projekt először a gyorsulásmérő adatait alakítja át időszeletelt reprezentációvá. Ezután a Keras könyvtárat használja a hálózat edzésére, validálására és tesztelésére az adatkészletnek megfelelően.
Erdőtüzek előrejelzése
Az erdőtüzek és az erdőtüzek riasztóan gyakori katasztrófákká váltak napjainkban. Ezek a katasztrófák károsítják az ökoszisztémát, és a kezelésük pénzben és infrastruktúrában is sokba kerül. A k-means klaszterezés segítségével azonosítani lehet az erdőtüzek forró pontjait és a tűz súlyosságát az adott helyen, ami felhasználható az erőforrások jobb elosztásához és a gyorsabb reagálási időhöz. A meteorológiai adatok, például az évszakok, amelyekben a tüzek gyakoribbak, és a tüzeket súlyosbító időjárási körülmények használata tovább növelheti az eredmények pontosságát.
Gender & Age Detection
Gender and age detection is a computer vision and machine learning project. Konvolúciós neurális hálózatokat vagy CNN-t használ. A projekt célja egy személy nemének és korának felismerése egyetlen arckép elemzésével. A nemet férfi vagy nő, az életkort pedig a 0-2, 4-6, 8-2, 15-20, 25-32, 38-43, 48-53, 60-100 közötti tartományokba sorolja. Az olyan tényezők miatt, mint a smink, a megvilágítás, az arckifejezések stb. a nem és az életkor felismerése egyetlen kép alapján nehéz lehet. Ezért ez a projekt regresszió helyett osztályozási modellt használ.
Következtetés
A megfelelő eszközök ismeretében nincs olyan adattudományi projekt, amely túl nehéz lenne. A projektek tökéletes módja annak, hogy fejlessze készségeit és haladjon azok elsajátítása felé.
Ezek az adattudományi projektek azok, amelyek nagyon hasznosak és trendik lesznek 2020-ban. Ezek biztosan a sikerhez vezetnek majd. Csak annyit kell tenned, hogy belevágsz.
Iratkozzon fel hírlevelünkre
Megosztva e-mail címét, megkapja a legfrissebb frissítéseket és releváns ajánlatokat.