Machine Learning – DataScienceSeed

febbraio 15, 2023giugno 5, 2023

DSS Meetup #33 – Machine Learning ad impatto sociale

Abstract:

Il tema del talk saranno le tecnologie per l’inclusione, con l’obiettivo ambizioso di garantire pari opportunità a chiunque nei percorsi di studio e sul lavoro.

Mostreremo come l’intelligenza artificiale e la realtà virtuale, utilizzando tecniche allo stato dell’arte, come il Natural Language Processing e la Computer Vision, sono validi strumenti per raggiungere questo importante traguardo.

Questo tema viene da sempre al primo posto per Tech4All, una startup innovativa ad alto valore tecnologico, spin-off dell’Università della Tuscia, che si occupa dello sviluppo di strumenti digitali, basati su tecniche di machine learning, per rendere accessibile lo studio e il lavoro, anche a persone con disturbi specifici dell’apprendimento.

Per presentare il loro approccio e come hanno usato la tecnologia, saranno presenti Lorenzo Daidone e Andrea Zingoni, entrambi soci fondatori e amministratori di Tech4All.

Andrea Zingoni, docente di Informatica e di Intelligenza Artificiale presso l’Università della Tuscia, coglierà l’occasione per presentare alcuni progetti che lo vedono coinvolto in prima persona, per dare un’idea delle ultimissime frontiere della ricerca nel campo dell’ICT.

Andrea Zingoni

Andrea Zingoni è Ricercatore e Referente per le attività legate all’Intelligenza Artificiale presso l’Università della Tuscia. Ha conseguito la laurea magistrale in Ingegneria delle Telecomunicazioni e il dottorato di ricerca in Ingegneria dell’Informazione presso l’Università di Pisa. Nel corso della sua carriera accademica ha partecipato a numerosi progetti di ricerca, sia nazionali che internazionali, e ha collaborato con diversi partner provenienti da università, industria e pubblica amministrazione. I suoi interessi di ricerca sono caratterizzati da un approccio interdisciplinare e includono l’intelligenza artificiale, le tecnologie blockchain, l’elaborazione delle immagini, la computer vision, il telerilevamento, i sensori elettro-ottici e l’analisi del suono, applicati a diversi settori, come l’ingegneria biomedica, l’istruzione/educazione, l’ingegneria civile, il supporto alla società, la governance e la gestione. È titolare dei corsi di “Informatica” e “Fondamenti di Intelligenza Artificiale” del Corso di Laurea in Ingegneria Industriale dell’Università della Tuscia, dove insegna anche al Master di II livello in “Intelligenza Artificiale per il Business e la Cyber Security”. È inoltre socio fondatore e amministratore di due startup hi-tech, Tech4All e U-VI tech., che operano nei settori dell’istruzione e del trasferimento tecnologico.

Lorenzo Daidone

Lorenzo è co-fondatore di una startup (Estro) e di una spin-off universitaria (Tech4All) le quali sviluppano tecnologie, ad alto impatto sociale, basate su machine learning.

È uno sviluppatore appassionato di robotica, per anni ha formato docenti per cogliere le opportunità del coding applicato alla didattica e alle STEAM.

La visione di: “creare un modo dì accessibilità” si sposa pienamente con i suoi valori personali e con i valori del team con cui lavora.

Presentazione Zingoni (pptx 27M)

ottobre 9, 2022ottobre 27, 2022

DSS Meetup #30 – Quantum Computing e Data Science.

Quantum Computing e Data Science

L’intervento si propone di focalizzare l’impatto potenziale del quantum computing sulle applicazioni di data science e di presentare alcune esperienze che possano aiutare a capire se e come iniziare a prendere in considerazione gli algoritmi quantici nello sviluppo di soluzioni innovative. Una prima parte presenterà una introduzione generale al tema ed alle linee di ricerca di QC connesse in particolare alla data science, illustrandone i punti cruciali dal punto di vista computazionale. Una seconda parte si focalizzerà su alcuni esempi di applicazioni e sugli strumenti software per iniziare a lavorare con computer quantistici, almeno a livello di simulazione, nell’attesa di avere uno sulla scrivania…

Ennio Ottaviani è un fisico teorico ed imprenditore. E’ direttore scientifico di OnAIR, dove coordina progetti di ricerca sulle applicazioni di IA in diversi settori dell’industria e dei servizi. E’ docente di Metodi Predittivi nel corso di laurea in Statistica Matematica a Genova.

Francesco Rosasco è un informatico e lavora in OnAIR dalla laurea, specializzandosi sulla computer vision ed i sistemi di riconoscimento automatico. In queste applicazioni cura in particolare anche gli aspetti di parallelizzazione e di efficienza computazionale.

Slides OnAIR (4M pdf)

giugno 18, 2021luglio 7, 2021

DSS Online #10 MLOps, quando si smette di giocare

Lunedi 5 luglio,abbiamo parlato di MLOps con Simone Merello, Head of Deep AI presso Perceptolab.

Se hai seguito l’evento online o hai visto il video

lasciaci un feedback!

Ogni giorno sempre più modelli vengono sviluppati per creare nuove funzionalità. Sfortunatamente non appena si ha a che fare con più modelli, dataset e data scientists le cose si complicano. Ciascun esperimento ha molte dipendenze e l’effetto “changing anything changes everything” rende difficile tenere traccia di cosa sta accadendo. Una soluzione ML-driven richiede di tracciare come un modello è stato prodotto, scelto, distribuito e come si comporta in produzione: il modello di ML è solo un pezzo del puzzle. Simone ci mostrerà alcuni dei problemi più comuni che grosse AI companies hanno nel sviluppare soluzioni basate sul ML e come risolverli.

Simone Merello, inizia la sua carriera come ricercatore in ambito ML presso l’università NTU di Singapore. Successivamente esce dall’ambito accademico per diventare prima Research Scientist ed ora Head of Deep AI presso Perceptolab.

Hanno partecipato al dibattito a fine talk

Piero Cornice, Lead Engineer in Lilli

Andrea Panizza Senior AI Specialist at Baker Hughes

Qui le slide dell’incontro: MLOps – quando si smette di giocare

ed il famoso file “Registro Merello dei 300 tools ML” in formato ODS: AI Tools and Platforms

dicembre 9, 2020dicembre 21, 2020

DSS Online #6: Causal Reasoning in ML: Spiegare “perché”

Torniamo in UK ad incontrare Pier Paolo Ippolito, Freelance data scientist con un portafoglio di competenze impressionante e la passione per la divulgazione. Ci parlerà di un tema importante nel Machine Learning: distinguere le cause dalle correlazioni, con un esempio purtroppo sempre alla ribalta, legato alla diffusione delle epidemie.

Partecipano all’incontro Carla Marcenaro e Simone Merello.

Lascia qui un feedback sull’evento

Al giorno d’oggi le tecnologie di Machine Learning si basano solo sulle correlazioni tra le diverse “features”. Ció nonostante, questo approccio può eventualmente portare a conclusioni errate poiché correlazioni non implicano necessariamente causalità.

Come esempio di questo studio di ricerca, Pier Paolo ha creato e distribuito una suite di modelli “agent based” e comportamentali al fine di simulare gli sviluppi di malattie epidemiche in diversi tipi di comunità.

Nel meetup quindi, oltre ad imparare qualcosa sul tema del causal reasoning, esploreremo un esempio molto concreto, sviluppato in open source e disponibile come applicazione web.

Pier Paolo Ippolito è un SAS Data Scientist e MSc in Intelligenza Artificiale laureato presso l’Università di Southampton. Ha un forte interesse per i progressi dell’IA e le applicazioni di apprendimento automatico. Al di fuori del suo lavoro, è uno scrittore per Towards Data Science e un Kaggle Contributor.

Scarica le slide del talk (pdf 2M)

Link a cui si fa riferimento nel talk:

Main page: https://pierpaolo28.github.io/

Dashboard: http://3.22.240.181:8501/

Librerie per Causal Reasoning: https://microsoft.github.io/dowhy/, https://github.com/uber/causalml, https://github.com/quantumblacklabs/causalnex

Libreria per lavorare con equazioni differenziali (modelli compartimentali): https://www.scipy.org/

giugno 20, 2019luglio 15, 2019

DataScienceSeed#7 – Sicurezza Cyber-fisica: vehicle Platooning / Industralizzare il flusso di ML con MLFlow

Lascia un feedback sull’evento
(e dicci se vuoi partecipare al Deep Learning Group)

Ecco l’agenda del settimo incontro, che ha celebrato il primo anno di attività del nostro meetup! Di seguito tutto il materiale presentato ed i relativi video, ripresi e renderizzati da Wonderland Production.

Platooning: predire (ed evitare!) collisioni tra i veicoli con il machine learning

La guida automatica e coordinata di veicoli (Platooning) è un problema molto complesso, a causa della molteplicità dei corpi in movimento e della necessità di interconnssione tra i veicoli che avviene in genere su un canale non affidabile e tempo variante. L’obiettivo è evitare le collisioni.

Click sull’immagine per il pdf delle slide

Il caso si presta a sperimentare tecniche diverse nel campo del Machine Learning, confrontando pro e contro dei vari approcci, e costituisce una introduzione molto concreta al concetto di Cyber-Physical Safety.

Nell’incontro il problema è stato affrontato con Rulex, uno strumento rule based che abbiamo già incontrato nei meetup, e che ha i suoi punti di forza nella semplicità di uso e nell’interpretabilità dei risultati. Il dataset di riferimento è a disposizione della community, come Challenge per l’estate.

Link al Dataset – 3MBytes zip file

Maurizio Mongelli è ricercatore presso il CNR a Genova, il cui istituto, IEIIT, ha dato luogo a Rulex, azienda leader del panorama mondiale nel machine learning interpretabile.

Industrializzazione dei processi di Machine Learning in contesti Big Data enterprise: introduzione a MLFlow

I processi e le attività relativi all’addestramento dei modelli di Machie Learning possono rivelarsi molto complessi ed onerosi, specialmente nel contesto Big Data delle grandi aziende. MLFlow è uno strumento opensource che fornisce una soluzione per tenere traccia delle metriche, dei modelli e di tutti i parametri operativi utilizzando uno strumento unificato che consente di semplificare e rendere affidabile la gestione dell’intero processo. Scopriremo con Luca Ruzzola come funziona e come possiamo utilizzarlo in combinazione con i principali framework.

Click sull’immagine per il repository github della presentazione e del codice

Luca Ruzzola è Machine Learning Engineer e Data Scientist presso Agile Skill, azienda del gruppo Agile Lab che si occupa di consulenza e formazione su Big Data e AI.

Dataset Challenge – Natural Language Processing

Ludovico Simone, di Digital Tree ci ha presentato un dataset su NLP che è stato presentato nell’Hackathon del recente edizione del Web Marketing Festival di Rimini.

Clicl sull’immagine per pdf delle slide ed il link al dataset

Chi affronterà il challenge uscendone vittorioso, potrà presentare la propria analisi e la propria tecnica in un prossimo Meetup

Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

Wonder Talent Investor

Gruppo IB

maggio 11, 2019giugno 10, 2019

DataScienceSeed#6 – Stock Market Machine Learning & Caffè con Pandas

23 Maggio 2019, Digital Tree, Genova, ore 18

Se hai partecipato a questo evento, lasciaci un feedback!

Ecco l’agenda del sesto incontro, a cavallo tra la frontiera della ricerca e la didattica sui nostri dataset.

Mercati Finanziari: affrontare con il Machine Learning un un problema davvero complesso

Simone Merello, specialista in AI for Finance presso Nanyang Technological University of Singapore

Predire l’andamento del mercato finanziario è un problema complesso, al punto che non ne è ancora chiara la fattibilità stessa. Sono state tentate tutte le tecniche di Machine Learning ed ogni sorta di reti naurali, ma i problemi sono tanti ed a tanti livelli. Simone ci ha spiegato come ha affrontato questo problema, presentandoci le tecniche usate nelle ultime ricerche, in un percorso tra le difficoltà e le opportunità valido per molte classi di problemi.

Ecco le slides di Simone, sotto forma di Google Doc

Attenzione! Audio Challenge!

L’audio del talk è molto disturbato a causa di un problema tecnico al sistema della sala nel giorno della ripresa. Ce ne scusiamo… nonostante gli sforzi in post produzione dei ragazzi del service la qualità audio è molto inferiore al livello che vorremmo tenere. Ma possiamo trasformare questo problema in opportunità!! Siamo certi che con il Machine Learning / Deep Learning si può ulteriormente ripulire questo audio. Chi vuole tantare? I tentativi più o meno riusciti saranno presentati in un meetup!

Caffè con Pandas: cosa abbiamo imparato dal Coffe Machines Dataset

Marcello Morchio, Andrea Boero – DataScienceSeeed team

Marcello Morchio DataScienceSeed — Marcello Morchio alle prese con il LightGBM

A Febbraio i ragazzi di Flairbit ci hanno offerto un problema di manutenzione predittiva su una flotta di macchine del caffè professionali. Ci abbiamo lavorato e siamo pronti a mostrarne i risultati alla community. Marcello ha parlato di Pandas, la libreria Python che non può mancare nella cassetta degli attrezzi del data scientist, per passare da un dataset selvaggio ad un docile datasetche daremo in pasto ad un modello di machine learning di tipo “classico” ma per niente banale, il LightGBM, Andrea ha poi mostrato come costruire ed addestrare una rete neurale feed forward per lo stesso dataset, ottimizzandone gli iperparametri fino ad identificare la configurazione ottimale.

Riusciremo a prevenire i guasti ed a meritarci un buon caffè?

Flairbit Challange - pdf slides — Flairbit Challange – pdf slides

Github Repository del codice (Pandas, LightGBM e SHAP)
La descrizione è nel README del repo.

Google Drive link dello Zip file (55M) dell’approccio Neural Networks

Relazione (PDF 1MB) Neural Networks

Andrea Boero eSimone Merello discutono di architetture neurali mentre gli altri si mangiano la focaccia

Deep Learning Group

Abbiamo presentato nel meetup il Learning Group su Deep Learning che partirà con la prima sessione l’11 Giugno, alle 18.30 presso Digital Tree.

Seguiremo il corso Practical Deep Learning for coders, di Fast.ai, e ci incontreremo ogni due settimane per discutere delle lezioni seguite online, del codice presentato, delle difficoltà incontrate e magariper provare a cimentarci con qualche progetto reale.

Il progetto del learning group segue il percorso tracciato dai gruppi di studio TVML di IAML

Per accedere al gruppo, usa il form di feedback dell’evento.

Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

Wonder Talent Investor

Gruppo IB

dicembre 1, 2018gennaio 22, 2019

DataScienceSeed#3 – AI Marketing & Edge Intelligence

Nel nostro terzo incontro, abbiamo spaziato in campi molto vasti, ed abbiamo lanciato un nuovo challenge!

Se hai partecipato per favore compila il form di feedback!

Datascienceseed #3 Feedback

The State of AI Marketing 2018

Federico Gobbi, Program Manager presso Mind The Bridge, vive a San Francisco dove ha fondato Artificial Intelligence Marketing Association, che tra le altre cose organizza meetup di livello top e pubblica un interessantissimo magazine su Medium. Federico ha presentato la sua ricerca “The State of AI Marketing 2018”, dedicata all’applicazione della AI nel marketing e di come ogni azienda può cominciare ad impiegarla.

La presentazione è densa di casi d’uso concreti con i riferimenti per approndirli, una miniera di informazioni e di spunti!

Tramite il form di feedback è possibile richiedere la presentazione in power point con tutte le note ed i link – un regalo super di Federico alla community Genovese. Qui sotto il link alla versione in PDF.

Presentazione di Federico Gobbi — Slideset della presentazione di Federico Gobbi

Edge Intelligence & Explainable AI

Il Deep Learning e’ indubbiamente l’approccio AI che ad oggi ha colto maggiormente l’eco della stampa e l’immaginario collettivo. Pochi pero’ sanno che l’algoritmo di back propagation dell’errore alla base del DL, necessita di grandi quantiità di dati e di grande potenza computazionale per convergere e puo’ essere facilmente ingannato. Ma sopratutto non e’ in grado di “spiegare” le regole che stanno dietro al proprio funzionamento, il che’ lo rende incompatibile con la trasparenza richiesta dai nuovi regolamenti sulla privacy, quali la GDPR.

In questo talk Fabrizio Cardinali CEO di Knowhedge, nuova startup di AI Consulting di Genova, spiega un approccio alternativo all’AI basato su chipset HW che usano algoritmi a consumi e profondita’ ridotta (shallow), in grado di funzionare su HW IOT di frontiera (edge) con intelligenza distribuita (swarm) e in grado di favorire una AI sempre piu’ accessibile e spiegabile per tutti (“explainable AI”).
Giancarlo Bo, Luca Marchese, Andrea Decamilli, Giorgio Cantarini e Marco Migliorati affiancheranno Fabrizio nel presentare MYW.AI il progetto di Smart Speaker intelligente incubato da Knowhedge presso Digital Tree e che prevede la realizzazione di un marketplace blockchain like basato su IOTA Tangle per la distribuzione certificata e sicura di algoritmi AI per il mercato professionale.

Slideset della presentazione di Fabrizio Cardinali

Dataset Challenge Hands-On

Fin dal primo incontro abbiamo puntato sul facilitare esperienze concrete su dati reali forniti da aziende sul territorio. Nel meetup #3 abbiamo anticipato la presentazione di un nuovo dataset, questa volta proposto da Flairbit. Il contenuto e le sfide saranno presentate nell’incontro “Dataset Challenge Hands-On” del 7 Febbario.

Nello stesso incontro Giorgio Garziano presenterà la sua soluzione al Dataset Challenge lanciato da Rulex nel meetup #1.

ATTENZIONE – L’incontro Dataset Hands-On sarà un approfondimento tecnico, con numero di posti molto limitato per agevolare un dialogo molto interattivo. Partecipa all’incontro se ti interessa mettere le mani su un problema concreto da affrontare con tecniche di Data Science e Machine Learning. Se anche non hai ancora le competenze necessarie ma vorresti imparare, vieni! Potresti trovare qualcuno con cui collaborare per imparare insieme. Se hai il sospetto di soffrire di allergia al codice o agli algoritmi forse è meglio se aspetti il prossimo meetup. Se hai letto fino a questo punto questo noiosissimo disclaimer ed ancora la cosa ti incuriosice allora clicca sull’immagine qui sotto!

Qui trovi i link ai nostri incontri precedenti, con il materiale presentato.

https://www.datascienceseed.com/

Se ti interessa dare un’occhiata ai dataset relativi ai challenge, contattaci. Se la tua analisi sarà particolarmente interessante uno degli interventi del prossimo incontro potrebbe essere il tuo!

Italian Association for Machine Learning

Digital Tree Innovation Habitat

Knowhedge

Per entrare nella community Data Science Seed puoi iscriverti al Meetup!

https://www.meetup.com/it-IT/Data-Science-Seed-Meetup-Genova

ottobre 22, 2018dicembre 7, 2018

DataScienceSeed #2 – Automotive, Data Design & Smart Farming

11 Novembre 2018, ore 18 presso Digital Tree Innovation Habitat

Se hai partecipato, compila per favore il form di feedback a questo link!

DataScienceSeed #2 Feedback!

Nel primo incontro abbiamo conosciuto aziende che lavorano nel campo data science e machine learning ed abbiamo cominciato a conoscere gli strumenti per cimentarsi in queste discipline.

Nel secondo incontro, ospitato dal Digital Tree Innovation Habitat, abbiamo cominciato invece a bagnarci i piedi negli algoritmi, sempre restando legati a problemi concreti.

Il primo speaker è stato Alberto Cabri, di Vega Research Labs, che ci ha presentato un caso di classificazione in ambito automotive, e di come è stato risolto con strumenti open source, generando infine un efficiente modello white box che consente la classificazione della tipologia di motori sulla linea di produzione.

Tramite questo link si può scaricare un file .zip contenente il dataset ed il notebook mostrato da Alberto, in versione eseguibile o in versione pdf per la sola consultazione

Marco Tagliavacche è il presidente dell’associazione Architecta (https://www.architecta.it/) e ci ha parlato dell’importanza dell’organizzazione e della visualizzazione dei dati. Non di solo codice vive il data scientist!

La presentazione è disponibile in pdf a questo link.

Per finire, Giorgio Garziano, Senior SW developer, e autore su http://www.datascienceplus.com ci ha presentato i risultati della sua analisi sul dataset di Cynomys, il caso di Smart Farming presentato tra i challenge nel primo incontro che trovate alla pagina:

https://www.datascienceseed.com/2018/07/21/datascienceseed-meetup-1-coltivare-competenze/

Il lavoro di Giorgio è stato presentato insieme a Fabiana Surace, founder di Cynomys, che ha riassunto il problema e ne ha spiegato molto chiaramente il valore di business per gli allevatori

La documentazione completa è a questo link, dal quale si scarica un .zip con la presentazione di Fabiana in pdf ed il file HTML con l’analisi di Giorgio. Il file HTML va visualizzato con connessione internet attiva per visualizzare correttamente le formule.

https://www.datascienceseed.com/2018/07/21/datascienceseed-meetup-1-coltivare-competenze/

Se ti interessa dare un’occhiata ai dataset relativi ai challenge, per esplorarli nel tempo che manca al maeetup contattaci. Se la tua analisi sarà particolarmente interessante uno degli interventi dei prossimi incontri potrebbe essere il tuo!