Riceviamo dalla School of Python for Genomics "Massimiliano Orsini" e pensando possa essere di interesse pubblichiamo.
-...-..-.-..
Cari Colleghi e care Colleghe,
ho il piacere di annunciare il seguente evento di training, che si svolgerà in presenza ed in lingua italiana:
School of Python for Genomics "Massimiliano Orsini". Advanced Module: Applying Machine Learning to Genomics Data
Grazie ai progressi tecnologici, oggi è possibile sequenziare il DNA su larga scala, generando grandi quantità di dati che rappresentano una fonte fondamentale per la ricerca biologica. Tuttavia, nonostante la disponibilità di numerosi strumenti di analisi, l’interpretazione dei dati richiede spesso competenze specifiche per lo sviluppo o l’adattamento di script e software.
Con tale motivazione, la Società Italiana di Diagnostica di Laboratorio Veterinaria (SIDiLV) e l'Infrastruttura Italiana di Bioinformatica (ELIXIR Italy o IIB) hanno organizzato la School of Python for Genomics "Massimiliano Orsini". Obiettivo della Scuola è quello di fornire le competenze necessarie per utilizzare il linguaggio Python sia per l'uso e lo sviluppo di software che per l'analisi di dati genomici in generale.
La Scuola completa si compone di 3 moduli consequenziali:
-
Advanced Module: Applying Machine Learning to Genomics Data (20-24 Apr 2026)
Il Machine Learning (ML) è sempre più centrale nella ricerca scientifica e trova importanti applicazioni nell’interpretazione di dati di caratterizzazione genomica di agenti patogeni, tra cui microrganismi a trasmissione alimentare. L’applicazione di approcci di ML consente, ad esempio, di elaborare modelli predittivi per la gravità clinica delle infezioni o per identificare il probabile serbatoio animale o la sorgente alimentare di infezione.
Il terzo modulo della Scuola ha come obiettivo principale quello di utilizzare Python per applicare diversi modelli di Machine Learning a dati di caratterizzazione genomica di una popolazione di ceppi patogeni di Escherichia coli. Attraverso l'analisi critica delle metriche di valutazione dei modelli, i partecipanti saranno guidati nella selezione degli algoritmi più adeguati per problemi predittivi legati alla circolazione dei ceppi e/o alla loro associazione con forme cliniche severe.
Al termine del corso, i partecipanti saranno in grado di:
-
descrivere i concetti fondamentali del ML e distinguere i principali paradigmi di apprendimento
-
illustrare le fasi del workflow di ML, dalla raccolta e pre-processamento dei dati alla valutazione del modello
-
esplorare la struttura di un dataset e visualizzarne le caratteristiche mediante tecniche di plotting
-
eseguire il pre-processamento del dataset
-
applicare tecniche di riduzione della dimensionalità (PCA) e clustering
-
implementare algoritmi di ML in Python utilizzando librerie standard
-
valutare le prestazioni di un modello con metriche appropriate al task
-
selezionare l'algoritmo più adeguato in funzione del problema
-
riconoscere gestire le principali problematiche del ML (overfitting, data leakage, sbilanciamento delle classi)
-
interpretare in modo critico i risultati di un modello e contestualizzarli rispetto al problema biologico di riferimento.
Al termine del Modulo, i/le partecipanti avranno acquisito una visione critica delle potenzialità e dei limiti del ML applicato a dati di caratterizzazione genomica, con particolare riferimento al suo impatto nel contesto della Sanità Pubblica.
Il corso sarà tenuto in lingua italiana e avrà luogo a Roma, presso l’Istituto Superiore di Sanità, dalle ore 14:00 del 20 Aprile alle ore 16:00 del 24 Aprile 2026. Il corso sarà estremamente pratico e finalizzato all’apprendimento mediante esercitazioni su dati reali. I partecipanti dovranno portare il proprio laptop.
Per candidarsi, riempire il seguente form: https://forms.gle/XVpyk4CMMJWdQQjx8
Scadenza per la candidatura: 8 Aprile 2026.
Numero massimo di partecipanti: 20.
Sarà data priorità a coloro che hanno frequentato il Modulo precedente: "Intermediate module” nel 2024. La selezione avverrà sulla base dell’ordine di iscrizione e delle competenze necessarie per seguire gli insegnamenti di questo modulo intermedio (come dichiarate nel form di application). I candidati selezionati verranno contattati entro il 10 aprile 2026.
La partecipazione al corso è gratuita; ai partecipanti selezionati sarà richiesto successivamente il pagamento della quota associativa SIDiLV per l’anno 2026 (quota intera: €50; quota ridotta under 35: €30).
Tutte le informazioni sono disponibili al seguente link:
Cordiali Saluti,
Loredana Le Pera
(a nome di tutti gli Organizzatori).
