DataScienceSeed Online#12 – Open Source AI sulla linea di produzione

DataScienceSeed torna online Mercoledì 26 Gennaio, a partire dalle ore 18:00. Incontreremo Paolo Mascellani, presidente della cooperativa eLabor, che sta sviluppando un sistema completo ed open source che porta il deep learning sulla linea di prodizione.

ADR-Flow applica tecniche di deep learning al riconoscimento automatico dei difetti di produzione industriale, coniugandole con una infrastruttura  software robusta ed adattabile. Non propone dei risultati nuovi, ma applica risultati consolidati ad una necessità ben precisa, consentendo di concentrarsi sulle necessità specifiche perché il sistema si occupa di tutto il resto. Il tutto, Open Source.

Le prime esperienze fatte con ADR-Flow riguardano il problema della corretta cablatura degli impianti  di un motoveicolo: al di la della dimostrazione della possibilità teorica di raggiungere questo obiettivo, la sfida è architettare una struttura robusta e flessibile di raccolta e gestione dei dati.

Questo ha richiesto di affrontare problematiche architetturali da coniugare con gli stumenti di Data Science (nel nostro caso il transfer learning con Keras e Tensor Flow), affrontando i problemi tipici di avere pochi dati e sbilanciati (data augmentation, controllo dell’overfitting, pesatura dei campioni) ed usando metriche adeguate a descrivere il problema.

Molti e notevoli gli stimoli per miglioramenti ed evoluzioni future: efficienza dell’addestramento e del riconoscimento, sia dal punto di vista della dimensione dei modelli che dei tempi di elaborazione, sistemi di ausilio all’etichettatura dei campioni, modi per affrontare difetti estremamente rari, ma importanti (ad esempio riguardanti la sicurezza), uso di generative adversarial network per sintetizzare campioni realistici, difetti nelle produzioni continue, ed è solo l’inizio.

Paolo Mascellani è presidente della cooperativa eLabor, che ha fondato nel 2001 assieme ad alcuni amici con lo scopo di non far perdere alla società le energie di quanti si trovano in un periodo di difficoltà dal punto di vista lavorativo ed allo stesso tempo di fornire ad aziende, enti, cooperative, eccetera, servizi tecnologicamente avanzati, basati su software libero ed a costo sostenibile.

Convinto della sinergia tra formazione e lavoro, si è laureato dapprima in Ingegneria Elettronica, poi in Scienze dell’Informazione e successivamente ha conseguito il dottorato di ricerca in Logica Matematica ed Informatica teorica. Negli ultimi anni ha seguito con successo numerosi corsi di formazione on-line su temi come Machine Learning, Internet of Things, Big Data, Sviluppo Agile e molto altro. In tutto questo tempo non ha mai smesso di lavorare, con numerose puntate in vari paesi in via di sviluppo, di mettere in pratica quanto ha studiato e di trasmettere ai propri amici, familiari e colleghi le conoscenze acquisite e la voglia di acquisirne altre.

È questo il caso anche del rilevamento automatico dei difetti di produzione industriale.

DataScienceSeed#7 – Sicurezza Cyber-fisica: vehicle Platooning / Industralizzare il flusso di ML con MLFlow

Lascia un feedback sull’evento
(e dicci se vuoi partecipare al Deep Learning Group)

Ecco l’agenda del settimo incontro, che ha celebrato il primo anno di attività del nostro meetup! Di seguito tutto il materiale presentato ed i relativi video, ripresi e renderizzati da Wonderland Production.


Platooning: predire (ed evitare!) collisioni tra i veicoli con il machine learning

La guida automatica e coordinata di veicoli (Platooning) è un problema molto complesso, a causa della molteplicità dei corpi in movimento e della necessità di interconnssione tra i veicoli che avviene in genere su un canale non affidabile e tempo variante. L’obiettivo è evitare le collisioni.

Click sull’immagine per il pdf delle slide

Il caso si presta a sperimentare tecniche diverse nel campo del Machine Learning, confrontando pro e contro dei vari approcci,  e costituisce una introduzione molto concreta al concetto di Cyber-Physical Safety.

Nell’incontro il problema è stato affrontato con Rulex, uno strumento rule based che abbiamo già incontrato nei meetup, e che ha i suoi punti di forza nella semplicità di uso e nell’interpretabilità dei risultati. Il dataset di riferimento è a disposizione della community, come Challenge per l’estate.

Link al Dataset – 3MBytes zip file

Maurizio Mongelli è ricercatore presso il CNR a Genova, il cui istituto, IEIIT, ha dato luogo a Rulex, azienda leader del panorama mondiale nel machine learning interpretabile.


Industrializzazione dei processi di Machine Learning in contesti Big Data enterprise: introduzione a MLFlow

I processi e le attività relativi all’addestramento dei modelli di Machie Learning possono rivelarsi molto complessi ed onerosi, specialmente nel contesto Big Data delle grandi aziende. MLFlow è uno strumento opensource che fornisce una soluzione per tenere traccia delle metriche, dei modelli e di tutti i parametri operativi utilizzando uno strumento unificato che consente di semplificare e rendere affidabile la gestione dell’intero processo. Scopriremo con Luca Ruzzola come funziona e come possiamo  utilizzarlo in combinazione con i principali framework.

Click sull’immagine per il repository github della presentazione e del codice

Luca Ruzzola è Machine Learning Engineer e Data Scientist  presso Agile Skill, azienda del gruppo Agile Lab che si occupa di consulenza e formazione su Big Data e AI.


Dataset Challenge  –  Natural Language Processing

Ludovico Simone, di Digital Tree ci ha presentato un dataset su NLP che è stato presentato nell’Hackathon del recente edizione del Web Marketing Festival di Rimini.

Clicl sull’immagine per pdf delle slide ed il link al dataset

Chi affronterà il challenge uscendone vittorioso, potrà presentare la propria analisi e la propria tecnica in un prossimo Meetup


Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione  IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

Wonder Talent Investor

Gruppo IB

DataScienceSeed#6 – Stock Market Machine Learning & Caffè con Pandas

23 Maggio 2019, Digital Tree, Genova, ore 18

DataScienceSeed meetup 23 maggio 2019

Se hai partecipato a questo evento, lasciaci un feedback!

Ecco l’agenda del sesto incontro, a cavallo tra la frontiera della ricerca e la didattica sui nostri dataset.

Merello e Finanza

Mercati Finanziari: affrontare con il Machine Learning un un problema davvero complesso

Simone Merello, specialista in AI for Finance presso Nanyang Technological University of Singapore

Simone Merello a DatasScienceSeed
Simone Merello a DatasScienceSeed

Predire l’andamento del mercato finanziario è un problema complesso, al punto che non ne è ancora chiara la fattibilità stessa. Sono state tentate tutte le tecniche di Machine Learning ed ogni sorta di reti naurali, ma i problemi sono tanti ed a tanti livelli. Simone ci ha spiegato come ha affrontato questo problema, presentandoci le tecniche usate nelle ultime ricerche, in un percorso tra le difficoltà e le opportunità valido per molte classi di problemi.

Ecco le slides di Simone, sotto forma di Google Doc

Attenzione! Audio Challenge!

L’audio del talk è molto disturbato a causa di un problema tecnico al sistema della sala nel giorno della ripresa. Ce ne scusiamo… nonostante gli sforzi in post produzione dei ragazzi del service la qualità audio è molto inferiore al livello che vorremmo tenere. Ma possiamo trasformare questo problema in opportunità!! Siamo certi che con il Machine Learning / Deep Learning si può ulteriormente ripulire questo audio. Chi vuole tantare? I tentativi più o meno riusciti saranno presentati in un meetup!

 


 

Morchio Marcello Andrea Boero DataScienceSeed 23 maggio 2018

Caffè con Pandas: cosa abbiamo imparato dal Coffe Machines Dataset

Marcello Morchio, Andrea Boero – DataScienceSeeed team

Marcello Morchio DataScienceSeed
Marcello Morchio alle prese con il LightGBM

A Febbraio i ragazzi di Flairbit ci hanno offerto un problema di manutenzione predittiva su una flotta di macchine del caffè professionali.  Ci abbiamo lavorato e siamo pronti a mostrarne i risultati alla community. Marcello ha parlato di Pandas, la libreria Python che non può mancare nella cassetta degli attrezzi del data scientist, per passare da un dataset selvaggio ad un docile datasetche daremo in pasto ad un modello di machine learning di tipo “classico” ma per niente banale, il LightGBM, Andrea  ha poi mostrato come costruire ed addestrare una rete neurale feed forward per lo stesso dataset, ottimizzandone gli iperparametri fino ad identificare la configurazione ottimale.

Riusciremo a prevenire i guasti ed a meritarci un buon caffè?

 

Flairbit Challange - pdf slides
Flairbit Challange – pdf slides

 

Github Repository del codice (Pandas, LightGBM e SHAP)
La descrizione è nel README del repo.

Google Drive link dello Zip file (55M) dell’approccio Neural Networks

Relazione (PDF 1MB)  Neural Networks

Andrea Boero eSimone Merello
Andrea Boero eSimone Merello discutono di architetture neurali mentre gli altri si mangiano la focaccia

 

 

 


Deep Learning Group

Abbiamo presentato nel meetup il Learning Group su Deep Learning che partirà con la prima sessione l’11 Giugno, alle 18.30 presso Digital Tree.

Seguiremo il corso Practical Deep Learning for coders, di Fast.ai, e ci incontreremo ogni due settimane per discutere delle lezioni seguite online, del codice presentato, delle difficoltà incontrate e magariper provare a cimentarci con qualche progetto reale.

Il progetto del learning group segue il percorso tracciato dai gruppi di studio TVML di IAML

Per accedere al gruppo, usa il form di feedback dell’evento.


Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione  IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

Wonder Talent Investor

Gruppo IB

DataScienceSeed#5 – Arte Cultura e Data Science

Se hai partecipato a questo meetup, per favore lasciaci un feedback qui!

Ecco l’agenda del quinto incontro,  tutto legato ad attività di ricerca tra Digitale, Arte e Beni Culturali

In codice ratio

In Codice Ratio: trascrizione automatica di manoscritti medievali

Simone Scardapane: Ricercatore @ Università La Sapienza e Presidente IAML

Il progetto di ricerca  In Codice Ratio, promosso da un team di Roma Tre, si pone l’obiettivo di sviluppare tecnologie per l’estrazione automatica dell’informazione da documenti storici, a partire da un caso di studio d’eccezione: l’Archivio Segreto Vaticano, uno dei più grandi archivi storici al mondo in termini di dimensioni e valore dei documenti custoditi. L’analisi di documenti così antichi presenta una serie di sfide specifiche: i testi sono manoscritti, in lingua latina ed accessibili unicamente in forma di immagine. Nel talk si descrivono i risultati ottenuti finora, i problemi da affrontare nel futuro, e soprattutto come le più recenti tecniche di deep learning (reti convolutive, U-Net, sistemi sequence2sequence) aiutano e guidano nella possibile risoluzione di queste sfide.

Presentazione di Simone Scardapane in formato pdf
Presentazione di Simone Scardapane in formato pdf

Metodi e Modelli 3D per l’analisi, la classificazione e l’interpretazione di reperti archeologici

Silvia Biasotti, Bianca Falcidieno, CNR IMATI

Per rispondere alla crescente necessità di metodi per la quantificazione della similarità tra frammenti e l’identificazione di elementi stilisticamente compatibili, IMATI ha sviluppato tecniche di analisi, classificazione e riconoscimento di forma, che vanno dall’identificazione di caratteristiche geometriche peculiari di un gruppo di oggetti, al riconoscimento di particolari configurazioni o strutture, fino all’identificazione e classificazione di parti con particolari decori e funzionalità. A partire da tali premesse è stata sviluppata una ricca base metodologica per la classificazione, la ricerca e il confronto di oggetti attraverso similarità di forma, declinando il concetto di similarità rispetto alle diverse sfaccettature che tale termine suggerisce: similarità geometrica, strutturale, funzionale o semantica.

La classificazione, la riunificazione e il riconoscimento di frammenti e decorazioni sono argomenti trattati nel progetto Horizon 2020 GRAVITATE.

Presentazione di Bianca Falcidieno e Silvia Biasotti in formato pdf
Presentazione di Bianca Falcidieno e Silvia Biasotti in formato pdf

I meetup DataScienceSeed sono in collaborazione con IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

DataScienceSeed#4 – Metro Linea “R” / Kaggle: l’arena è il mondo

Meetup4 Cover

Per i partecipanti all’incontro, ecco il link per lasciare il feedback.

Metropolitana – Linea “R”

Il trio di Flairbit

Matteo Rulli, Co-Founder di FlairBit ci ha presentato la trasposizione in linguaggio R di una delle sue applicazioni di data analytics sviluppate per l’analisi delle serie temporali, usando l’algoritmo DTW Dynamyc Time Warping. E’ stato illustrato un notebook R per l’analisi del flusso passeggeri in una rete metropolitana cittadina.

Il modello è in grado di

  • Classificare diverse tipologie di flussi passeggeri nel corso della giornata
  • Predire il volume passeggeri
  • Classificare le stazioni in base al flusso passeggeri nel tempo
FlairBit Presentation
Fai click per scaricare lo zip file con la presentazione di HTML

Durante la presentazione sono state illustrate le fasi di data preparation e i risultati ottenuti, mostrando anche come condividere il notebook mediante la self-service data analytics platform ShinyApp.

FlairBit è una software house che fornisce prodotti software proprietari e servizi di consulenza per aiutare le aziende nel processo di trasformazione digitale e innovazione nei processi produttivi.

Kaggle: L’arena è il mondo!

Rapuzzi for Kaggle

Che cos’è una Kaggle Competition? Andrea Rapuzzi, CEO di A-SIGN, ci ha raccontato la sua esperienza alle prese con un’entusiasmante sfida di Data Science. Lezioni imparate, difficoltà incontrate, competenze applicate, limiti e opportunità di questo nuovo modello di scienza (e di business).

Ed una perla finale con una lezione di epistemologia applicata al Machine Learning che ha strappato l’applauso!

Che c’entrano Rosenkrantz e Guildestern con il deep learning? Fai click per scaricare il pdf del talk di Andrea.

Questo è il secondo talk di Andrea nel nostro meetup: trovate il primo intervento nella pagina del meetup #1

 


Qui trovi i link ai nostri incontri precedenti, con il materiale presentato.

https://www.datascienceseed.com/

Se ti interessa dare un’occhiata ai dataset relativi ai challenge, contattaci. Se la tua analisi sarà particolarmente interessante uno degli interventi del prossimo incontro potrebbe essere il tuo!

Italian Association for Machine Learning

Digital Tree Innovation Habitat

Per entrare nella community Data Science Seed puoi iscriverti al Meetup!

https://www.meetup.com/it-IT/Data-Science-Seed-Meetup-Genova

 


Video by Wonderland Productions 

 

 

Dataset Challenge Hands-On #1 – Flairbit coffee machines, Rulex churn service

DataScienceSeed Hands-ON #1

Il Dataset Hands-On è dedicato alla presentazione di problemi concreti di aziende o di ricerca, da affrontare con tecniche di data science a scopo didattico. Non c’è niente come un problema vero per imparare!

L’obiettivo è presentare dataset e relative sfide da parte di aziende o istituzioni, a sviluppatori, data scientists, machine learning engineers, esperti o in corso di formazione. Lo scopo degli incontri e delle sfide è didattico, ma non si esclude che ne possa uscire qualcosa di buono, sia per l’azienda che propone il challenge sia per chi lo affronta. Non si può perdere: o si ha successo o si impara…e le due cose non si escludono!

Ecco quello di cui abbiamo parlato nel primo incontro dedicato ai Dataset:

Internet of Professional Coffee Machines

FlairBit, software house che fornisce prodotti software proprietari e servizi di consulenza per aiutare le aziende nel processo di trasformazione digitale e innovazione, ha presentato un dataset contenente dati di funzionamento, manutenzione e guasti relativi a macchine per l’erogazione di bevande. Luca Bixio e Matteo Rulli hanno raccontato il contesto in cui il dataset è stato raccolto, spiegato il contenuto del dataset nei dettagli e lanciato alcune sfide ai partecipanti che vorranno cimentarsi con l’analisi dei dati. Sarà possibile prevedere il funzionamento delle macchine nel prossimo futuro sulla base dei dati a disposizione? Sarà possibile determinare le cause di un fermo macchina o di un guasto? Sarà possibile prevedere un fermo macchina? La sfida è lanciata!

Click per scaricare il pdf che descrive il dataset

Rulex Dataset Challenge
Presentazione dei risultati di Giorgio Garziano

Rulex propne uno speciale tipo di piattaforma AI, che si distingue per creare modelli comprensibili e facilmente implementabili, per consentire agli esperti di business e di processo di creare e distribuire rapidamente applicazioni AI senza bisogno di competenze matematiche o di programmazione.

Andrea Caridi, Business Development Manager di Rulex, aveva presentato nel primo incontro DataScienceSeed un dataset relativo al churn di un servizio di musica online, ovvero all’analisi ed alla predizione dell’abbandono della piattaforma da parte degli utenti, per poter consentire di prendere azioni mirate per prevenirlo.

Click per aprire la pagina che descrive il dataset. Per avere una copia del dataset usate il modulo in fondo al post.

Durante il nostro incontro, Giorgio Garziano,  senior software developer ed autore in datascienceplus.com, ha descritto la sua analisi eseguita in linguaggio R, con un notebook molto sostanzioso:

Click per scaricare il file .zip con il notebook R mostrato da Giorgio.

 

Il dataset fornito da Rulex deriva dal dataset della Kaggle Competition WSDM – KKBox’s Churn Prediction Challenge.

Per  sperimentare l’analisi usando il tool Rulex Analytics, usate il modulo qui sotto,

 

DataScienceSeed#3 – AI Marketing & Edge Intelligence

Nel nostro terzo incontro, abbiamo spaziato in campi molto vasti, ed abbiamo lanciato un nuovo challenge!

Se hai partecipato per favore compila il form di feedback!

Datascienceseed #3 Feedback

The State of AI Marketing 2018

Federico Gobbi, Program Manager presso Mind The Bridge, vive a San Francisco dove ha fondato Artificial Intelligence Marketing Association, che tra le altre cose organizza meetup di livello top e pubblica un interessantissimo magazine su Medium. Federico ha presentato la sua ricerca “The State of AI Marketing 2018”, dedicata all’applicazione della AI nel marketing e di come ogni azienda può cominciare ad impiegarla.

La presentazione è densa di casi d’uso concreti con i riferimenti per approndirli, una miniera di informazioni e di spunti!

Tramite il form di feedback è possibile richiedere la presentazione in power point con tutte le note ed i link – un regalo super di Federico alla community Genovese. Qui sotto il link alla versione in PDF.

Presentazione di Federico Gobbi
Slideset della presentazione di Federico Gobbi


Edge Intelligence & Explainable AI

Il Deep Learning e’ indubbiamente l’approccio AI che ad oggi ha colto maggiormente l’eco della stampa e l’immaginario collettivo. Pochi pero’ sanno che l’algoritmo di back propagation dell’errore alla base del DL, necessita di grandi quantiità di dati e di grande potenza computazionale per convergere e puo’ essere facilmente ingannato. Ma sopratutto non e’ in grado di “spiegare” le regole che stanno dietro al proprio funzionamento, il che’ lo rende incompatibile con la trasparenza richiesta dai nuovi regolamenti sulla privacy, quali la GDPR.

In questo talk Fabrizio Cardinali CEO di Knowhedge, nuova startup di AI Consulting di Genova, spiega un approccio alternativo all’AI basato su chipset HW che usano algoritmi a consumi e profondita’ ridotta (shallow), in grado di funzionare su HW IOT di frontiera (edge) con intelligenza distribuita (swarm) e in grado di favorire una AI sempre piu’ accessibile e spiegabile per tutti (“explainable AI”).
Giancarlo Bo, Luca Marchese, Andrea Decamilli, Giorgio Cantarini e Marco Migliorati affiancheranno Fabrizio nel presentare MYW.AI il progetto di Smart Speaker intelligente incubato da Knowhedge presso Digital Tree e che prevede la realizzazione di un marketplace blockchain like basato su IOTA Tangle per la distribuzione certificata e sicura di algoritmi AI per il mercato professionale.

Slideset della presentazione di Fabrizio Cardinali
Slideset della presentazione di Fabrizio Cardinali


Dataset Challenge Hands-On

Fin dal primo incontro abbiamo puntato sul facilitare esperienze concrete su dati reali forniti da aziende sul territorio. Nel meetup #3 abbiamo anticipato la presentazione di un nuovo dataset, questa volta proposto da Flairbit. Il contenuto e le sfide saranno presentate nell’incontro “Dataset Challenge Hands-On” del 7 Febbario.

Nello stesso incontro Giorgio Garziano presenterà la sua soluzione al Dataset Challenge lanciato da Rulex nel meetup #1.

ATTENZIONE L’incontro Dataset Hands-On sarà un  approfondimento tecnico, con numero di posti molto limitato per agevolare un dialogo molto interattivo. Partecipa all’incontro se ti interessa mettere le mani su un problema concreto da affrontare con tecniche di Data Science e Machine Learning. Se anche non hai ancora le competenze necessarie ma vorresti imparare, vieni!  Potresti trovare qualcuno con cui collaborare per imparare insieme. Se hai il sospetto di soffrire di allergia al codice o agli algoritmi forse è meglio se aspetti il prossimo meetup. Se hai letto fino a questo punto questo noiosissimo disclaimer ed ancora la cosa ti incuriosice allora clicca sull’immagine qui sotto!

DataScienceSeed Hands-ON #1
DataScienceSeed Hands-ON #1

 

 


 

Qui trovi i link ai nostri incontri precedenti, con il materiale presentato.

https://www.datascienceseed.com/

Se ti interessa dare un’occhiata ai dataset relativi ai challenge, contattaci. Se la tua analisi sarà particolarmente interessante uno degli interventi del prossimo incontro potrebbe essere il tuo!

Italian Association for Machine Learning

Digital Tree Innovation Habitat

Knowhedge

Per entrare nella community Data Science Seed puoi iscriverti al Meetup!

https://www.meetup.com/it-IT/Data-Science-Seed-Meetup-Genova

DataScienceSeed #2 – Automotive, Data Design & Smart Farming

11 Novembre 2018, ore 18 presso Digital Tree Innovation Habitat

Se hai partecipato, compila per favore il form di feedback a questo link!

DataScienceSeed #2 Feedback!

Nel primo incontro abbiamo conosciuto aziende che lavorano nel campo data science e machine learning ed abbiamo cominciato a conoscere gli strumenti per cimentarsi in queste discipline.

Nel secondo incontro, ospitato dal Digital Tree Innovation Habitat, abbiamo cominciato invece a bagnarci i piedi negli algoritmi, sempre restando legati a problemi concreti.

Il primo speaker è stato Alberto Cabri, di Vega Research Labs, che ci ha presentato un caso di classificazione in ambito automotive, e di come è stato risolto con strumenti open source, generando infine un efficiente modello white box che consente la classificazione della tipologia di motori sulla linea di produzione.

Tramite questo link si può scaricare un file .zip contenente il dataset ed il notebook mostrato da Alberto, in versione eseguibile o in versione pdf per la sola consultazione

 


Marco Tagliavacche è il presidente dell’associazione Architecta (https://www.architecta.it/) e ci ha parlato dell’importanza dell’organizzazione e della visualizzazione dei dati. Non di solo codice vive il data scientist!

La presentazione è disponibile in pdf a questo link.

 


Per finire, Giorgio Garziano, Senior SW developer, e autore su http://www.datascienceplus.com ci ha presentato i risultati della sua analisi sul dataset di Cynomys, il caso di Smart Farming presentato tra i challenge nel primo incontro che trovate alla pagina:

https://www.datascienceseed.com/2018/07/21/datascienceseed-meetup-1-coltivare-competenze/

Il lavoro di Giorgio è stato presentato insieme a Fabiana Surace, founder di Cynomys, che ha riassunto il problema e ne ha spiegato molto chiaramente il valore di business per gli allevatori

La documentazione completa è a questo link, dal quale si scarica un .zip con la presentazione di Fabiana in pdf ed il file HTML con l’analisi di Giorgio. Il file HTML va visualizzato con connessione internet attiva per visualizzare correttamente le formule.

 


Se ti interessa dare un’occhiata ai dataset relativi ai challenge, contattaci. Se la tua analisi sarà particolarmente interessante uno degli interventi del prossimo incontro potrebbe essere il tuo!

https://www.datascienceseed.com/2018/07/21/datascienceseed-meetup-1-coltivare-competenze/

Se ti interessa dare un’occhiata ai dataset relativi ai challenge, per esplorarli nel tempo che manca al maeetup contattaciSe la tua analisi sarà particolarmente interessante uno degli interventi dei prossimi incontri potrebbe essere il tuo!

 

DataScienceSeed Meetup #1 – Coltivare Competenze

Data Science, Machine Learning, Intelligenza Artificiale…

Dietro alle parole ci sono opportunità di crescita, per chi vuole imparare ed essere operativo e per chi ha capito che per sviluppare la propria attività la via è quella dei dati. I meetup DataScienceSeed nascono per unire questi due mondi, con l’aiuto di chi sta già percorrendo queste strade.

Per chi vuole imparare è una occasione di sperimentare come diventare operativi sia possibile con strumenti accessibili e senza bisogno di essere guru.

Per chi vuole sviluppare la propria attività per comprendere le opportunità, orientarsi ed incontrare chi potrebbe essere d’aiuto.

In questo primo incontro abbiamo conosciuto tre persone speciali nel campo del Data Science: un manager di una azienda nata a  Genova nel campo del Machine Learning e che è ora basata a Boston tra i grandi dell’AI, un imprenditore appassionato di programmazione ed ora di machine learning, che sta affrotando con decisione la metamorfosi verso questo nuovo mondo, ed una Data Scientist con la vocazione dell’Open Source che attraverso la sua esperienza professionali e di attività nelle conferenze della community Python, ci ha guidati in una carrellata  tra gli strumenti disponibili per imparare ed affrontare la sfida dei dati.

Ecco i relatori e gli organizzatori: da sinistra Marcello Morchio, Andrea Rapuzzi, Stefania Delprete, Andrea Caridi, Luca Oppo, Franco De Mattei
Ecco (quasi tutti) i relatori e gli organizzatori: da sinistra Marcello Morchio (DataScienceSeed), Andrea Rapuzzi (A-Sign), Stefania Delprete (TOP-IX), Andrea Caridi (Rulex), Luca Oppo (Madein.it), Franco De Mattei (DataScienceSeed, Maker’s Village) – Missing: Enrico Carta (Cynomys), Enrico Ferrari (Rulex)

 

Enrico Ferrari, R&D Manager, Rulex
Enrico si occupa di machine learning da più di 10 anni. Ha partecipato dagli inizi all’avventura di Rulex, una startup nata dalla ricerca genovese con l’obiettivo di produrre modelli predizioni spiegabili e da qualche anno sbarcata a Boston. Per Enrico il futuro dell’Intelligenza Artificiale è nel Cognitive Machine Learning che combina la potenza delle macchine con le capacità di interpretazione e di intuizione degli umani.

Download slides – Enrico Ferrari – Rulex

 

https://www.rulex.ai/

Andea Rapuzzi, Owner A-Sign
Da software engineering a data science, quanto è lungo il passo? Andrea Rapuzzi ci racconta il suo viaggio alla scoperta di una nuova prospettiva e di un set di skill indispensabile per affrontare le nuove sfide tecnologiche. Perché farlo? Da dove partire? Con quali competenze iniziali? Quanto impegno richiede? Dove si può arrivare? Non un manuale di navigazione ma il diario di bordo di due anni entusiasmanti.

Download slides – Andrea Rapuzzi – A-SIGN

http://www.a-sign.it/

Stefania Delprete, Data scientist, TOP-IX, Personal development expert
Stefania è coinvolta nella comunità open source e di data science come volontaria alla PyCon, EuroPython, NumFOCUS ambassador, e organizzando a Torino la Pandas Sprint prendendo parte ad un evento internazionale.

Stefania ha esposto, anche con una demo basata su open data di Genova, come si possa far leva sulle librerie open source di Python, la loro documentazione e interazione con la comunità per iniziare alla grande il tuo progetto di data science!

Download slides – Stefania Delprete

 

Codice della demo di Stefania su Github

https://www.linkedin.com/in/astrastefania/

DataScienceSeed Challenge

Ecco le prime sfide, per mettere alla prova le nostre competenze di Data Science su problemi concreti. In base all’interesse raccolto tra i partecipanti organizzeremo incontri dedicati all’approfondimento dei tre problemi ed alle modalità per affrontarli. Nel prossimo meetup vedremo se sarà uscito qualcosa di interessante!

Se hai partecipato all’evento, puoi dare feedback e segnalarci un eventuale interesse, senza impegno, per appronfondire una o più sfide, usando questo link.

Se non hai partecipato all’evento ma ti piacciono le sfide, usa questo link.

Incantastorie 2018

un Dataset in movimento – presentato da Luca Oppo, Madein.it

Download slides – Challenge Madein.it


Musica Online: studiamo il “churning” di un servizio online

Presentato da Andrea Caridi, Rulex

Download slide – Challenge Rulex


Allevamento sostenibile: la tecnologia nella stalla

presentato da Enrico Carta, Cynomys

Download slides – Challenge Cynomys

Abbiamo concluso la serata con un aperitivo di networking, con prodotti di Aggio House

DataScienceSeed è un meetup NO PROFIT, sostenibile grazie alla sponsorizzazione di imprenditori illuminati,  dalla disponibilià di speakers competenti con la passione per la condivisione ed all’interesse di un pubblico vivace ed interessato. Se fai parte di una di queste  categorie puoi  entra nella community Data Science Seed 

https://www.meetup.com/it-IT/Data-Science-Seed-Meetup-Genova

Partner

Sponsor


Focaccia