Realizzazione by siti web firenze e web.at.work

contatti
realizzazione siti web

INTERNET Il futuro di Internet tra web 3.0 e la GRID del CERN

Ci siamo appena abituati alle tendenze del Web 2.0 in termini di aggragazione e approccio al web, che già si parla di web 3.0 pronto a introdurre i suoi concetti di web semantico.

Il futuro di Internet sembra sempre più orientato, inoltre, verso:

 

Fisica e informatica si incontrano: la grid del CERN e le reti del futuro

tim barners lee

Oltre al grande valore della corrispondente ricerca scientifica di base, la fisica delle particelle può vantare tra i suoi meriti il fatto di fungere da lancio e traino di importanti imprese di carattere tecnologico. Tra queste, la più eclatante del recente passato è stata probabilmente l'invenzione del World Wide Web. Agli inizi degli anni '90 videro la luce al CERN il primo server e il primo browser di pagine html della storia. L'idea, i protocolli e i programmi furono originalmente sviluppati da un fisico che svolgeva attività di ricerca presso il CERN, di nome Tim Berners-Lee (nella foto).

Dietro la forte spinta degli esperimenti che lavorano all'acceleratore LHC, nel settore dell'informatica si sta verificando oggi una rivoluzione analoga e forse persino più importante di quella del web: stanno nascendo le prime griglie computazionali, che prendono nel gergo tecnico il nome di grid.

Per quanto riguarda l'analisi dei dati, gli esperimenti di LHC devono affrontare una nuova sfida tecnologica, dato che essi produrranno nell'arco della loro vita operativa di 10-15 anni una quantità di dati superiore per ordini di grandezza rispetto al passato, e necessiteranno per questo di strumenti informatici nuovi e molto potenti. La scoperta di nuove particelle elementari richiede infatti l'analisi statistica al calcolatore di tutti i dati acquisiti dai rivelatori ATLAS, CMS, ALICE e LHCb. Un insieme di dati è rappresentato sostanzialmente come una sequenza numerica all'interno di un file del tutto analogo a quelli che troviamo sui nostri computer casalinghi. Ogni singolo frammento di rivelatore di particelle, dei milioni e milioni che ce ne sono in un grande esperimento LHC, produce un segnale in seguito al passaggio di una particella al suo interno. Tutti i segnali relati vi ad un evento di collisione tra i pro toni vengono tramutati in numeri tramite convertitori analogico-digitali, che sono quindi registrati all'interno di file.

I quattro esperimenti di LHC producono circa 15 Petabyte di dati all'anno (il Petabyte corrisponde a un milione di Gigabyte), sufficienti per riempire annualmente qualcosa come 20 milioni di Compact Disk. I dati devono essere disponibili per qualcosa come 5.000 scienziati in 500 Istituti di ricerca e Università in ogni parte del mondo, e conservati per una quindicina di anni.

La memorizzazione e la distribuzione dei dati non è la sola difficoltà da affrontare: i dati devono essere analizzati mediante calcolatori, e quindi oltre alle grandi quantità di dispositivi per memorizzare i dati (essenzialmente dischi e nastri con le attuali tecnologie) e alle veloci reti necessarie per trasferirli in giro per il mondo, è parimenti necessario disporre di ingenti quantità di computer che rileggano i dati e li processino. Il numero di calcolatori di cui l'analisi dati di LHC ha bisogno si attesta su ordine di 100.000 computer commerciali, del tutto analoghi a quelli che usiamo ogni giorno per il nostro lavoro o per svagarci e comunicare.

L'approccio tradizionale consisterebbe nel centralizzarli tutti situandoli in una zona attigua agli esperimenti, diciamo in un'enorme sala dei laboratori CERN. Tuttavia, questo risulterebbe assolutamente sconveniente, come ci accingiamo a motivare nel seguito, ed è perciò stato sviluppato un nuovo modello di distribuzione dei dati e dei calcolatori su scala mondiale.

La ragione primaria di non concentrare tutti i 100.000 calcolatori e dispositivi per la memorizzazione dei dati al CERN è stata di carattere economico. Quando nel 1999 si iniziò a progettare l'infrastruttura di calcolo necessaria agli esperimenti di LHC, si realizzò immediatamente che i costi sarebbero stati di gran lunga maggiori di quanto il bilancio del CERN avrebbe potuto permettersi di spendere. Inoltre, in molti Paesi esistevano già realtà consolidate che operavano come centri di calcolo, e quindi nacque l'idea che il loro potenziamento e lo sviluppo di una nuova tecnologia informatica capace di far lavorare insieme tutti i centri avrebbe consentito di limitare considerevolmente le spese da sostenere, distribuendole nei vari Paesi partecipanti al progetto, ossia di fatto spalmandole sul mondo intero. Questa fu la motivazione della costruzione della griglia computazionale di LHC, la cosiddetta Worldwide LHC Computing Grid (Griglia Computazionale Mondiale di LHC), abbreviata nell'acronimo WLCG: la più grande infrastruttura hardware e software del mondo.

Il progetto WLCG ebbe dunque inizio nel 2002, ed è oggi una realtà consolidata che coinvolge circa 200 centri di calcolo situati in più di 30 paesi in America, Asia ed Europa, pronta per iniziare ad analizzare i dati prodotti dagli esperimenti di LHC. La sua missione è quindi di sviluppare e mantenere l'infrastruttura necessaria alla memorizzazione dei dati e alla loro analisi per tutta la durata degli esperimenti.

I dati degli esperimenti sono acquisiti al cern, e poi trasferiti secondo l modello gerarchico su più strati (detti in gergo tecnico Tier) in tutto il mondo. Dopo una prima fase di processo al cern (che essendo al vertice della piramide viene chiamato Tier-0) essi sono spediiti ai centri di calcolo più grandi (i cosiddetti Tier-l), che sono situati in Canada, Francia, Germania, Olanda, Paesi scandinavi, Regno Unito, Spagna, Stati USA, Taiwan, e ovviamente Italia. In Italia, in particolare, il centro di calcolo si trova a Bologna, presso dell'INFN appositamente tecnologie informatiche, CNAF.

tim barners lee

Questi centri di calcolo Tier-1 rendono quindi disponibili i dati allo strato successivo, costituito da oltre 140 centri di calcolo di dimensioni inferiori ai Tier-l, ma comunque rilevanti, raggruppati in una ventina di Paesi. I Tier-2 sono inoltre seguiti da un ulteriore strato, i centri Tier-3, che sono costituiti da piccoli gruppi di calcolatori posizionati all'interno dei singoli istituti di ricerca e dipartimenti universitari, cioè in prossimità degli uffici dei ricercatori, che impiegano il proprio computer personale (l'ultimissimo strato, il Tier-4) per distribuire gli ordini ai calcolatori dei Tier superiori ed ottenere indietro i risultati desiderati.

Immaginate dunque questa im-mensa rete di calcolatori operanti tra loro in modo coordinato, distribuita su una ragnatela di centri di calcolo tutti collegati tra loro mediante connessioni molto veloci, decine di migliaia di volte più veloci di quelle che siamo abituati ad adoperare mediante i nostri collegamenti Internet casalinghi. L'infrastruttura di rete veloce in Italia ha fatto grandi passi in avanti negli ultimi anni grazie al Consortium GARR, che gestisce e sviluppa la rete informatica della ricerca italiana. Esiste comunque un'urgente necessità di finanziamenti in questo settore, per far partire il progetto di rete di prossima generazionene, denominato GARR-X, e quindi tenere il passo dei programmi di sviluppo degli altri Paesi avanzati.

È importante infatti tener presente che gli enormi progressi fatti nell'ultimo decennio nel settore del calcolo su grossa scala sono strettamente legati agli sviluppi della tecnologia di rete. Dieci anni fa sarebbe stato sciocco pensare di spostare una grande quantità di dati da un punto all'altro del Pianeta per processarli su un computer remoto, poiché il tempo necessario allo spostamento sarebbe stato proibitivo. Grazie alla diffusione della rete Internet e delle fibre ottiche nei sistmi delle telecomunicazioni, la velocità dei collegamenti nazionali e internazionali è più che raddoppiata di anno in anno, portando ad un aumento di prestazioni per ordini di grandezza nell'arco di pochissimi anni. La velocità tipica delle reti con cui lavorano oggi i ricercatori di LHC dell'ordine delle decine di miliardi di bit al secondo (10 Gigabit/s), da confrontare con una normale connessione Internet di casa nostra, che nella migliore delle ipotesi può arrivare a 10 milioni di bit al secondo (10 Megabit/s).

Oltre alla velocità dei trasferimenti in rete, un'altra fondamentale variabile da considerare è 1'affidabilità. Spostando miliardi di file da una parte all'altra del pianeta errori di trasferimento di vario genere sono inevitabili. Per risolvere questo problema sono stati sviluppati nella grid complicati meccanismi di recupero in caso di fallimenti nella comunicazione tra due computer remoti.

Tutto il complesso dell'infrastruttura hardware, insieme al software necessario per farla funzionare in modo coerente e coordinato, costituisce nel suo complesso la Grid di LHC.

Siamo quindi a questo punto in grado di definire in modo più generale il concetto di base della Grid, utilizzando alcune semplici analogie. Quando apriamo un rubinetto dell'acqua a casa è come se avessimo a disposizione una quantità acqua immensa (ovviamente ciò è vero se l'acqua corrente è sempre disponibile, cosa che non vale ovunque). Similmente, quando colleghiamo un elettrodomestico ad una presa elettrica, la quantità di elettricità cui possiamo attingere è in linea di principio illimitata. Perché non fare qualcosa di simile anche per ciò che riguarda la capacità di eseguire una grossa mole di calcoli e accedere a enormi quantità di dati?

Il computer tradizionale, come lo comosciamo oggi, è un sistema localizzato analogamente ad un serbatoio di acqua o ad un generatore di corrente elettrica che potremmo trovare in un condominio. Le risorse che può mettere a disposizione (memoria, velocità della CPU e così via) sono per definizione limitate. Perché invece non pensare ad un computer come composto da molte parti che comunicano dinamicamente tra loro mediante la rete Internet, disinteressandoci di dove si trovi ciascuna sua singola parte, sia essa hardware o software, similmente quanto avviene per la forni tura di acqua gas o elettricità? La rete che può soddisfare un'esigenza di questo genere è al punto la Grid. In effetti il termine Grid stato proprio ispirato dall'analogia con la rete elettrica (in Inglese electrical grid quindi dall'idea che l'utente possa collegarsi ad una "presa di potenza di calcolo" usufruendone in modo potenzialmente illimitato e senza conoscere da dove ess provenga o come sia stata prodotta, sostenendone ovviamente i relativi costi.

Collegando su scala mondiale processori, memorie e software, la tecnologia trasformerà il computer da oggetto localizzato e personale in una struttura distribuita. Il computer che abbiamo sulla scrivania sarà costituito da tastiera e schermo, collegati alla rete mediante una connessione veloce, e nulla di più. Tutto ciò che serve sarà disponibile in rete: programmi, memoria, CPU e disco rigido, dove avremo a disposizione programmi e locazioni di memoria in cambio del pagamento di un abbonamento a consumo, analogamente al caso di una pay-perview dei programmi televisivi, senza più sprecare tempo nelle procedure di istallazione, manutenzione, aggiornamento e soluzione dei relativi problemi.

La condivisione delle risorse è la base della filosofia della Grid. Immaginiamo che in un prossimo futuro ciascuno di noi avrà la possibilità di accedere alla potenza di milioni di computer e alle loro periferiche, computer che saranno distribuiti in tutto il mondo e apparterranno a molte persone e organizzazioni differenti. Non dovremo più istallare sul nostro computer il programma di cui abbiamo bisogno, ma ordineremo alla Grid di eseguirlo su uno o più computer remoti dove esso è già istallato. E non dovremo localizzare questi computer, anzi non ci sarà nessun bisogno di sapere dove essi si trovino, la Grid lo farà per noi e troverà il posto migliore per eseguire il programma nel minor tempo possibile, inviandoci a casa il risultato finale. Nel caso dovessimo avere bisogno di analizzare una grande mole di dati memorizzati su computer differenti, la Grid troverà da sola la strada più breve senza farci perdere tempo utile.

La Grid è già una solida realtà non solo nella fisica delle particelle, ma anche nell'ambito delle collaborazioni scientifiche tout court. Esempi di utilizzo della tecnologia di calcolo della Grid includono l'archivio e catalogazione di oggetti astronomici, l'esplorazione del genoma umano, simulazioni di terremoti ed eruzioni vulcaniche, previsioni del tempo studio dei cambiamenti climatici, studio e simulazioni della formazione di nano-strutture e dinamica molecolare, simulazioni di fluidodinamica per la progettazione di oggetti veloci quali aerei, auto, barche da competizione, ecc., diagnostica di patologie mediante la condivisione su scala globale di archivi medici (l'accesso veloce a archivi distribuiti di dati permetterà presto di confrontare le analisi di un paziente con quelle di milioni di altri, e quindi di identificare precocemente le patologie da cui il paziente è afflitto) e supporto alle indagini cliniche e così via.

Questa tecnologia sta ora cominciando ad uscire dai confini del mondo della ricerca per entrare in quello dei servizi e del privato. La Grid interessa innanzitutto il commercio elettronico, ma il sistema offre vantaggi anche in molti altri settori. Ci sono importanti applicazioni nell'industria, nella finanza, nella sociologia e finanché nel mondo dell'intrattenimento, cioè in generale in tutti i campi nei quali è indispensabile modellizzare fenomeni complessi, effettuare simulazioni sulla base di una moltitudine di variabili e scenari, analizzare grandi quantità di dati e visualizzarli, prendere decisioni in tempo reale. Come esempi possiamo citare problemi complicati quali la previsione degli andamenti del mercato azionario, l'ottimizzazione delle strategie di vendita, analisi statistiche del comportamenti e delle tendenze sociali, analisi demografiche e previsione dei flussi migratori, monitoraggio e previsione dei flussi del traffico stradale, ottimizzazione nell'uso delle reti telefoniche, finitura di animazioni tridimensionali, eccetera.

Un'impresa come la Grid di LHC ha quindi gettato le basi per la costruzione di un sistema di Grid globale, contribuendo alla realizzazione di una visione unificata delle metodologie di calcolo del futuro.

 

separatore

Informazioni sull'autore

Sergio Ferraiolo

foto
Descrizione:

Web Master di webdesignfirenze.com, titolare di Siti web gallery che ha realizzato il sito.

Mansioni: Programmatore, web designer e Analista

Web design per la creazione siti web firenze insieme a tecniche di SEO Marketing per creare un sito di successo

Portfolio: gallery immobiliare per la vendita e l'acquisto di immobili di prestigio

Portfolio: impresa di pulizie per servizi di pulizia industriale