In questo evento un po’talk ed un po’ code-lab, Matteo Gentile ci guiderà in un caso pratico di Exploratory Data Analisys, seguendo un notebook in python su Google Colabs – Chi volesse portarsi il laptop, potrà seguire ed eseguire direttamente il codice.
L’appuntamento è per Giovedi 11 Gennaio a partire dalle ore 18:00 presso l’Ordine degli Ingegneri della Provincia di Genova, Piazza della Vittoria, 11/10.
Tutti noi abbiamo quotidianamente a che fare con insiemi di dati (più o meno grandi), spesso contenuti in file Excel, e vorremmo tanto “capirci qualcosa” in modo semplice, come ad esempio capire se ci sono errori evidenti, rilevare valori o eventi anomali e trovare relazioni interessanti tra le variabili.
In questo evento introduttivo, destinato a tutti, faremo una analisi esplorativa passo passo dei dati contenuti in un file Excel.
L’Analisi Esplorativa dei Dati (EDA, Exploratory Data Analysis) è utilizzata dai data scientist per analizzare e investigare i set di dati e riassumere le loro caratteristiche principali, spesso utilizzando metodi di visualizzazione.
Questa analisi aiuta a determinare il modo migliore per utilizzare le origini dati per ottenere le risposte di cui hai bisogno, rendendo più facile per i data scientist scoprire modelli, individuare anomalie, testare un’ipotesi o controllare i presupposti.
In sostanza, si tratta di esaminare e caratterizzare attentamente i dati al fine di trovarne le caratteristiche sottostanti, le possibili anomalie e i modelli e le relazioni nascoste.
L’analisi esplorativa dei dati viene utilizzata principalmente per vedere cosa i dati possono rivelare al di là delle attività di modellazione formale o di test delle ipotesi e fornisce una migliore comprensione delle variabili dei set di dati e delle relazioni tra loro. Può anche aiutare a determinare se le tecniche statistiche che stai prendendo in considerazione per l’analisi dei dati sono appropriate. Originariamente sviluppato dal matematico americano John Tukey negli anni ’70, le tecniche di analisi esplorativa dei dati continuano ad essere un metodo ampiamente utilizzato nel processo di rilevamento oggi.
Questa comprensione dei dati è ciò che alla fine guiderà attraverso i passaggi successivi della pipeline di machine learning, dalla preelaborazione dei dati alla creazione del modello e all’analisi dei risultati.
Il processo dell’EDA comprende fondamentalmente questi compiti principali:
- Panoramica del set di dati e statistiche descrittive
- Identificazione e gestione valori nulli
- Eliminazione colonne inutili
- Gestione valori anomali
- Valutazione della qualità dei dati
Matteo Gentile Laureato in Ingegneria Elettronica nel 2003, ha iniziato a lavorare in alcune società come sviluppatore fino a entrare in Siemens nel 2008, in cui si è occupato di diversi ambiti del software in automazione industriale .Dal 2021 si occupa di Intelligenza Artificiale e Machine Learning per la previsione della pianificazione degli ordini e la manutenzione predittiva delle macchine negli impianti industriali.Dal 2017 Consigliere dell’Ordine degli Ingegneri di Genova.
Il meetup sarà in presenza, con talk Q&A col pubblico e rinfresco finale
L a registrazione sarà disponibile sul nostro canale YouTube