Non tutti i server sono uguali e non tutte le configurazioni restituiscono medesimi risultati: questo significa che ogni server e ogni specifica va pensata per uno specifico contesto. Quando la necessità è quella di avere performance di alto livello, per necessità che comportano il passaggio obbligato da capacità computazionali alte, ecco che un cloud server GPU è la risposta da individuare.
Un cloud server GPU, infatti, è un server in Cloud appositamente ottimizzato per offrire potenza computazionale elevata. Tale caratteristica rende possibili calcoli molto complessi tramite l'impiego di processori grafici altamente performanti che garantiscono prestazioni superiori alle comuni CPU. Configurazioni di questo genere risultano ottimali in diversi ambiti di applicazione, per esempio quando si ha la necessità di addestrare algoritmi di Machine Learning o si devono gestire grandi volumi di task paralleli. Sfruttando le sole CPU multi-core non vi avrebbero a disposizione prestazioni dello stesso livello, non si potrebbero conseguire gli stessi risultati nell'implementazione di progetti di Intelligenza Artificiale o sarebbero necessari tempi molto più lunghi.
Ma quali caratteristiche deve possedere un cloud server GPU per supportare elaborazioni, risorse e funzionalità indispensabili per l'AI? Rispondiamo a questa domanda analizzando l'offerta di Seeweb, Cloud provider i cui server sono montati a rack all'interno di Data Center collocati in Italia.
I Cloud server GPU di Seeweb
I server GPU di Seeweb sono dislocati nel nostro Paese e quest'ultimo non è certo soltanto un dettaglio geografico. Tale posizionamento offre infatti due vantaggi: il primo riguarda il fatto che la vicinanza geografica si traduce in una riduzione dei tempi di latenza a beneficio delle performance; il secondo attiene alla conformità con le normative UE (GDPR) sulla conservazione e il trattamento dei dati. Questi ultimi, infatti, vengono processati esclusivamente in Europa, garantendo un elevato livello di compliance. Da non ignorare, inoltre, il fatto che i processori grafici di Seeweb operano in server farm alimentate da energie rinnovabili e certificate ISO14001: ciò permette di coniugare potenza, basso consumo energetico, emissioni ridotte e sostenibilità ambientale, come testimoniato anche da un'infrastruttura certificata DNSH (Do No Significant Harm).
I server GPU di Seeweb sono pronti all'uso indipendentemente dalla loro destinazione (video processing, analisi di Big Data, training dei modelli di Machine Learning, Deep Learning, computer vision). Lo stack tecnologico disponibile è stato concepito per l'utilizzo immediato e lo spazio per i dati associato di default a ciascuna istanza può essere esteso tramite Cloud ScaleOut Filer o altre soluzioni di storage. Questo grazie all'integrazione con i servizi di Public Cloud del provider.
Nessun problema per le attività di inferenza con AI più impegnative e il calcolo mainstream. I Tensor Core basati sull'architettura NVIDIA Ampere e la Multi-Instance GPU consentono di accelerare in sicurezza più carichi di lavoro, anche paralleli, come per esempio l'inferenza con IA su larga scala e le applicazioni HPC (High Performance Computing). Nel caso in cui si abbia la necessità di maggiore flessibilità nell'uso di sistemi GPU o architetture multi-GPU, è possibile deployare e gestire l'infrastruttura tramite IaC in quanto le istanze Cloud GPU sono supportate da Terraform.
Seeweb e certificazione Terraform
Terraform è una soluzione per lo IaC (Infrastructure as Code) rilasciata sotto licenza Open Source. Tale piattaforma permette di progettare un'infrastruttura IT tramite la definizione di file e si presenta come un linguaggio dichiarativo che consente di mantenere l'infrastruttura in maniera agile, flessibile ed efficiente. Nello specifico un linguaggio dichiarativo è un linguaggio di programmazione focalizzato sulla descrizione di ciò che deve essere fatto e non sul come farlo. Gli utenti hanno quindi la possibilità di specificare quello che desiderano ottenere, mentre il sistema si occupa di individuare il modo migliore per raggiungere l'obiettivo desiderato.
Terraform presenta diversi vantaggi tra cui l'integrazione con Git, il sistema di controllo di versione più utilizzato dagli sviluppatori. Con tale linguaggio i processi di delivery e gestione delle architetture IT risultano notevolmente contenuti ed è possibile replicare interi ambienti in tempi molto ridotti, minimizzando gli errori e riducendo i rischi. Si può quindi avviare senza sforzo il clone di un'infrastruttura, realizzando ad esempio un ambiente di sviluppo identico a quello di produzione con cui eseguire test in tutta sicurezza.
Seeweb è il primo Cloud Provider italiano certificato Terraform e quindi anche il primo a supportare tale integrazione, così come le aziende e i professionisti che sfruttano la metodologia IaC. Quest'ultima permette di rimuovere gran parte delle procedure manuali in quanto le infrastrutture Cloud si possono realizzare tramite codice archiviato in file di configurazione, con un vantaggio rilevante in termini di produttività.
Cloud server GPU di Seeweb: specifiche tecniche e fatturazione
Le soluzioni Cloud server GPU di Seeweb per AI e Machine Learning sono basate su schede grafiche NVIDIA Quadro RTX A6000, RTX6000 e A30 che sono di per sé garanzia di grande potenza. La fatturazione è oraria, senza pagamento anticipato, e non vengono addebitati il traffico di rete delle istanze Cloud e le chiamate alle API (Application Programming interface). Una volta attivato il server con le risorse desiderate dal pannello di controllo, l'utilizzo delle istanze viene conteggiato a fine mese sulla base dell'impiego orario. È possibile rimuovere un'istanza Cloud dal pannello, anche solo dopo poche ore dall'attivazione e senza doverlo comunicare formalmente al provider, fin dal momento in cui non se ne ha più necessità.
Parliamo quindi di un servizio Cloud basato sulla fornitura di risorse on-demand dove il billing dipende unicamente dal loro reale utilizzo. Senza costi nascosti e quindi senza sorprese dal punto di vista dell'investimento. Il costo orario di ciascuna configurazione viene infatti mostrato al cliente prima dell'ordine, evidenziando anche il totale della spesa mensile.
I cloud server GPU di Seeweb presentano driver e sistema già configurati, banda pari a 1Gbps e traffico compreso da 1TB. Le immagini server sono personalizzabili e sono disponibili tre livelli di assistenza con il vantaggio della gestione completa (full management) dell'infrastruttura di supercalcolo. Non mancano nemmeno l'ormai indispensabile integrazione con i sistemi di orchestrazione dei container (Kubernetes) e un supporto tecnico veloce pre e post-vendita disponibile tutto l'anno h24.
L'hardware dedicato, l'uptime garantito del 99.90%, il monitoraggio della costante della continuità operativa e la protezione proattiva contro gli attacchi DDoS (Distributed Denial of Service), aggiungono infine ulteriori livelli di affidabilità e sicurezza ad un servizio ottimizzato per l'automazione del deployment completamente gestibile via API.
Conclusioni
Le moderne GPU rappresentano il supporto ideale per l'elaborazione di grandi quantità di dati. Tale caratteristica le rende particolarmente adatte per applicazioni di AI, apprendimento automatico, data analysis e rendering di grafica avanzata. I server Cloud GPU di Seeweb consentono di accedere alle risorse di elaborazione delle GPU senza dover acquistare hardware costoso o gestire la manutenzione di un'infrastruttura locale (on-premise). Il tutto con il vantaggio di poter accedere a risorse scalabili e adattabili all'evoluzione di qualsiasi progetto.
I Cloud server GPU di Seeweb trovano svariati ambiti di applicazione, dallo sviluppo dei giochi online alla finanza computazionale, dalla ricerca scientifica all'analisi dei dati in ambito medico, dalle applicazioni CUDA (Compute Unified Device Architecture) alle infrastrutture per l'intelligenza artificiale, fino all'implementazione di modelli generativi. Le risorse on-demand e il billing in base all'utilizzo reale garantiscono inoltre il controllo completo sui costi di esercizio.