AMS (Alpha Magnetic Spectrometer) è un esperimento di astrofisica delle particelle per la ricerca di materia oscura, materia mancante e antimateria a bordo della International Space Station.
Nel 2000 è stato affidato al CILEA il compito di progettare, sviluppare e mantenere un sistema di trasferimento dati che:
trasferisse tutti i dati di AMS-02 (per un ammontare previsto di 280 Tbyte) dal Science Operation Control Center (SOCC) del CERN a un sito remoto, Italian Ground Segment Data Storage (IGSDS), attualmente installato presso il CNAF di Bologna, che fungesse da Master Copy.
fosse in grado di trasferire tali dati con un throughput garantito di 12 Mbit/sec.
fosse in grado di trasferire, usando la medesima architettura, dati da siti remoti al CERN.
implementasse un sistema di book-keeping su DataBase relazionale.
La prima versione, interamente sviluppata in C, Perl e MySQL3 da personale CILEA, è stata utilizzata in produzione dal 2003 al 2005 e ha trasferito 11.2 Tbyte dal CERN all'IGSD e 4 Tbyte dai siti remoti che lo hanno adottato. Tali siti sono:
CERN-Lab2 (Prevessin, FR)
CNAF INFN (IT)
GAM-LPTA (Montepellier, FR)
IN2P3 (Lyon, FR)
INFN BO (IT)
INFN MI (IT)
INFN PG (IT)
Università de Geneve (CH)
È stato inoltre fatto un porting di tale sistema su IPv6, per permettere il trasferimento dei dati presso la South Eastern University di Nanjing, China. Tale porting ha richiesto anche lo studio e l'ottimizzazione di alcuni parametri dello stack TCP/IP, al fine di ottimizzare l'uso della banda (TCP_WIN_SIZE e vari meccanismi di congestion avoidance).
La versione corrente, sviluppata in C, Python e MySQL4, è in produzione dal gennaio 2007 e ha già trasferito 5 TB di dati dal CERN e circa 2 TB dai siti remoti, con un throghput effettivo medio di 68 Mbit/sec e una consistenza intrinseca del 99,98%.
L'AMS Software Group ha validato la versione corrente come versione ufficiale dell'AMS Data Transfer System durante il Technical Interchange Meeting al CERN.
Inoltre, la versione corrente può funzionare in modalità stand-alone o in modalità grid-aware, nella quale si fa uso del grid-middleware glite 3.x. In particolare, la modalità grid-aware offre la possibilità di usare grid per trasferire i dati ed effettuare verifiche di consistenza tra i campioni di dati, ed è particolarmente efficiente per accedere allo storage HSMS-CASTOR, sui cui vengono salvati i dati all'IGSDS.
È attualmente in fase di beta-test la versione grid-only del sistema, che permetterà un uso nativo dell'architettura grid, appoggiandosi a DataBase locali MySQL e a un DataBase Oracle co-gestito con il CERN-IT Database Services. In base ai test in corso, tale release sarà in grado di sostenere un throughput circa 7 volte superiore a quello richiesto.
Per questo motivo, il personale CILEA coinvolto nel progetto è stato nominato AMS Database/Grid responsible per l'esperimento AMS.
Nell'ambito del progetto viene inoltre regolarmente svolta la seguente attività sistemistica.
Manutenzione ordinaria e straordinaria dei server di Data Transfer dell'AMS Data Transfer Management and Survey Facility (DTMSF) presso INFN-Milano Bicocca.
Manutenzione ordinaria e straordinaria di fileserver, webserver e storage NAS del DTMSF presso INFN-Milano Bicocca.
Manutenzione ordinaria e straordinaria dei server di Data Transfer presso AMS Science Operation Control Center al CERN.
Manutenzione del cluster di calcolo AMS presso INFN-Milano Bicocca. Il cluster è di tipologia Beowulf, per un ammontare di 86 nodi di calcolo, distribuiti su 3 architetture hardware e software differenti.
AMD Athlon(tm) XP 2000+ - Scientific Linux Cern 3.0.8 (diskless cluster)
AMD Athlon(tm) XP 2200+ - Scientific Linux Cern 3.0.8
AMD Athlon(tm) XP 2200+ - Debian Sarge 3.1-r1
Dual Core AMD Opteron(tm) Processor 275 - Scientific Linux Cern 4.4
Al fine di integrare tra loro le diverse architetture, oltre al sistema di gestione code batch OpenPBS è stato sviluppato un sistema custom, che permette il cluster-cross-over e il resource brokering.
Collaborazioni:
INFN Milano Bicocca
CERN IT Department - Database Services for Physics (DP) per l'ottimizzazione, la personalizzazione e la gestione di DataBase Oracle e MySQL
CERN IT Department - Communication Systems (CS) per l'ottimizzazione e la personalizzazione dei protocolli di rete
CalTech - CERN MonALISA Group per lo studio e l'ottimizzazione di sistemi di trasferimento dati su reti LFN.
Southeast University, Nanjing China, Department of Computer Science and Engineering per il porting su Ipv6 e l'ottimizzazione dei parametri di TCP