În calitate de cercetător de date aspirant, cel mai bun mod de a vă crește nivelul de abilități este de a exersa. Și ce modalitate mai bună există pentru exersarea abilităților tehnice decât realizarea de proiecte. Proiectele personale sunt o parte esențială a dezvoltării carierei dumneavoastră. Acestea vă vor duce cu un pas mai aproape de visul dvs. de știință a datelor. Proiectele vă vor stimula cunoștințele, abilitățile și încrederea. Afișarea proiectelor în CV-ul dumneavoastră va face ca obținerea unui loc de muncă în domeniul științei datelor să fie mult mai ușoară.
„Ce proiecte ar trebui să fac?”, vă întrebați? Ei bine, nu vă faceți griji nicio secundă! Pentru că sunt aici, cu aceste idei uimitoare de proiecte de știință a datelor în 2020. Așa că haideți să începem deja!
- Recunoașterea caracterelor
- Declararea somnolenței șoferului
- Detecția cancerului de sân
- Impactul schimbărilor climatice asupra aprovizionării cu alimente la nivel mondial
- Chatbot
- Prognoza seriilor temporale de trafic web
- Fake News Detection
- Recunoașterea acțiunilor umane
- Forest Fire Prediction
- Gender & Detectarea vârstei
- Concluzie
- Înscrieți-vă la newsletter-ul nostru
- Alăturați-vă grupului nostru Telegram. Faceți parte dintr-o comunitate online captivantă. Înscrieți-vă aici.
Recunoașterea caracterelor
Acest proiect se concentrează pe capacitatea computerului de a recunoaște și înțelege caracterele scrise de mână de către oameni. O rețea neuronală convolutivă este antrenată folosind setul de date MNIST. Acest lucru ajută rețeaua neuronală să recunoască cifrele scrise de mână cu o precizie rezonabilă. Proiectul utilizează învățarea profundă și necesită bibliotecile Keras și Tkinter.
Declararea somnolenței șoferului
Conducerea pe timp de noapte este o muncă grea. O mulțime de accidente se întâmplă atunci când un șofer devine somnoros sau somnolent în timp ce conduce. Acest proiect își propune să recunoască momentul în care șoferul ar putea să adoarmă și să tragă semnalul de alarmă.
Acest proiect utilizează un model de învățare profundă pentru a clasifica printre imaginile în care ochii oamenilor sunt deschiși sau închiși. Acesta menține un scor bazat pe cât timp ochii rămân închiși. Dacă scorul crește mai mult decât un prag specificat. Modelul declanșează alarma. Pentru a implementa aceste proiecte, asigurați-vă că sunteți foarte bine familiarizați cu toate conceptele de bază ale științei datelor.
Detecția cancerului de sân
Proiectul de detecție a cancerului de sân utilizează imagini histologice pentru a clasifica dacă pacientul are sau nu carcinom ductal invaziv. Acest proiect utilizează un set de date IDC pentru a clasifica imaginile histologice ca fiind maligne sau benigne. O rețea neuronală convolutivă este cea mai potrivită pentru această sarcină. Modelul este antrenat folosind aproximativ 80% din setul de date, iar setul de date rămas este utilizat pentru a testa acuratețea modelului după antrenarea acestuia.
Impactul schimbărilor climatice asupra aprovizionării cu alimente la nivel mondial
Schimbările și anomaliile climatice devin o parte obișnuită a lumii noastre în aceste zile. Acest lucru începe să afecteze fiecare aspect al vieții umane pe planeta noastră. Acest proiect se concentrează pe cuantificarea impactului pe care schimbările climatice îl au și îl vor avea asupra producției alimentare globale. Scopul acestui proiect este de a evalua impactul potențial al schimbărilor climatice asupra producției de culturi de bază. Proiectul evaluează implicațiile schimbărilor de temperatură și de precipitații, luând în considerare efectele dioxidului de carbon asupra creșterii plantelor și incertitudinile legate de schimbările climatice. Acest proiect se ocupă de vizualizarea datelor și de comparațiile întocmite între randamentele din diferite regiuni, în momente diferite.
Chatbot
Chatbots joacă un rol important în afaceri. Aceștia ajută la furnizarea de servicii îmbunătățite și personalizate și, în același timp, economisesc forță de muncă.
Un chatbot poate fi antrenat cu ajutorul tehnicilor de învățare profundă și folosind un set de date cu o listă de vocabular, o listă de propoziții comune, intenția din spatele acestora și răspunsurile adecvate. Cea mai frecventă metodologie de instruire a chatbot-urilor este utilizarea rețelelor neuronale recurente (RNN). Robotul este format dintr-un codificator care își actualizează stările în funcție de propoziția de intrare împreună cu intenția și transmite starea către robot. Robotul folosește apoi decodorul pentru a găsi un răspuns adecvat în funcție de cuvinte și de intenția din spatele acestora. Puteți implementa chatbotul cu ușurință cu Python.
Prognoza seriilor temporale de trafic web
Prognoza seriilor temporale este un concept foarte important în statistică și învățare automată. Predicția traficului web este o aplicație populară a prognozei seriilor de timp. Aceasta ajută serverele web să își gestioneze mai bine resursele pentru a evita întreruperile. Pentru a face proiectul și mai interesant, puteți utiliza wavenets în locul rețelelor neuronale tradiționale. Wavenets utilizează convoluții cauzale, ceea ce le face mai eficiente și mai ușoare în același timp.
Fake News Detection
Ideea din spatele acestui proiect este de a construi un model de învățare automată care poate detecta dacă știrile date de orice postare din social media sunt adevărate sau nu. Puteți utiliza TfidfVectorizer, și un clasificator PassiveAggressive pentru a construi acest model.
TF sau Term Frequency (frecvența termenilor) este numărul de apariții ale unui cuvânt într-un document.
IDF sau Inverse Document Frequency (frecvența inversă a documentelor) este o măsură a importanței unui cuvânt pe baza numărului de apariții ale acestuia în diferite documente. Cuvintele comune care apar în multe documente nu au o importanță mare.
TFIDFVectorizer analizează o colecție de documente și creează o matrice TF-IDF în funcție de aceasta.
Un clasificator pasivAgresiv rămâne pasiv dacă rezultatul clasificării este corect, dar își schimbă agresiv criteriile de clasificare dacă clasificarea este incorectă.
Utilizându-le, putem construi un model de învățare automată care poate clasifica știrile ca fiind false sau adevărate.
Recunoașterea acțiunilor umane
Modelul de recunoaștere a acțiunilor umane se uită la videoclipuri scurte cu oameni care execută anumite acțiuni și încearcă să le clasifice în funcție de ce acțiune este. Acesta utilizează o rețea neuronală convolutivă antrenată pe un set de date care conține videoclipuri scurte și date de accelerometru asociate acestora. Proiectul convertește mai întâi datele de accelerometru într-o reprezentare în felii de timp. Apoi folosește biblioteca Keras pentru a antrena, valida și testa rețeaua în funcție de setul de date.
Forest Fire Prediction
Incendiile de pădure și incendiile de vegetație au devenit dezastre alarmant de frecvente în lumea de astăzi. Aceste dezastre dăunează ecosistemului și, de asemenea, costă foarte mult în termeni de bani și infrastructură pentru a le face față. Utilizând gruparea k-means, puteți identifica punctele fierbinți ale incendiilor de pădure și gravitatea unui incendiu în acel loc, ceea ce poate fi utilizat pentru o mai bună alocare a resurselor și pentru timpi de răspuns mai rapizi. Utilizarea datelor meteorologice, cum ar fi anotimpurile în care incendiile sunt mai frecvente și condițiile meteorologice care le agravează, poate crește și mai mult acuratețea rezultatelor.
Gender & Detectarea vârstei
Detectarea genului și a vârstei este un proiect de viziune computerizată și învățare automată. Acesta utilizează rețele neuronale convoluționale sau CNN. Proiectul își propune să detecteze sexul și vârsta unei persoane prin analiza unei singure imagini a feței acesteia. Genul este clasificat ca fiind de sex masculin sau feminin, iar vârsta este clasificată în intervalele 0-2, 4-6, 8- 2, 15-20, 25-32, 38-43, 48-53, 60-100. Din cauza unor factori precum machiajul, lumina, expresiile faciale etc., recunoașterea sexului și a vârstei dintr-o singură imagine poate fi dificilă. Prin urmare, acest proiect utilizează un model de clasificare în loc de regresie.
Concluzie
Cu cunoașterea instrumentelor potrivite, nu există proiect de știință a datelor care să fie prea dificil. Proiectele sunt modalitatea perfectă de a vă îmbunătăți abilitățile și de a progresa spre stăpânirea acestora.
Aceste proiecte de știință a datelor sunt cele care vor fi foarte utile și în tendințe în 2020. Ele vă vor conduce cu siguranță spre succes. Tot ce trebuie să faceți este să începeți.
Obțineți cele mai recente actualizări și oferte relevante prin partajarea e-mail-ului dvs.