Una domanda frequente che mi pongono nelle aziende è “Come gestite l’alta disponibilità e il recupero dati?”. Alta disponibilità (High Availability, HA) e recupero dati (Disaster Recovery, DR), suo parente spesso ignorato, sono termini che nessuna azienda dovrebbe ignorare. Quale significato attribuire all’alta disponibilità, comunque, dipende dall’applicazione aziendale, dall’infrastruttura IT e dalla prospettiva dell’utente finale. Quindi la vera domanda è: “In cosa consiste una configurazione per alta disponibilità in un ambiente di output enterprise?” Sono necessarie soluzioni specifiche o posso usare quelle che ho già? Esistono problematiche tecniche specifiche connesse alla gestione dell’output di cui devo tener conto?
Anzitutto cosa significa “disponibile” per un server di output aziendale e come si fa a garantirne la disponibilità? Il primo passo dovrebbe essere la selezione di soluzioni hardware e software intrinsecamente stabili (può sembrare ovvio, ma conviene ricordarlo). Relativamente all’hardware, il server non è l’unico elemento da considerare. Ad esempio, un server può essere attivo e perfettamente funzionante secondo tutte le metriche di piattaforma e di applicazione, ma se gli utenti non riescono a stampare, dal loro punto di vista quel server è fermo. Il software di gestione dell’output di LRS è realizzato per essere scalabile verticalmente e orizzontalmente, ma sarebbe comunque imprudente affidarsi a un unico server. Le pagine di storia abbondano di transatlantici “inaffondabili” e centri dati “inarrestabili”. Il vostro ambiente HA conterà probabilmente su più server.
Spesso la configurazione HA utilizzata è dettata dalle applicazioni aziendali e da considerazioni di ordine finanziario. Una delle prime domande formulate da un ingegnere LRS per un intervento relativo all’alta disponibilità è “cosa state usando al momento?” E non è per evitare di fare il suo lavoro. Il software VPSX® e i suoi componenti possono funzionare con qualsiasi numero di sistemi ad alta disponibilità. Poiché è probabile che si continuerà a usare la soluzione esistente, è importante capire quali sono le soluzioni già usate dal cliente e con le quali si rapporta quotidianamente.
Un altro fattore è quanto velocemente deve essere ripristinata la funzionalità di stampa a fronte di un periodo di interruzione. In altre parole, i tempi di inattività si misurano in termini di praticità, esperienza del cliente, perdita di denaro... o forse esistenza? In caso di guasto, il sistema deve essere ripristinato all’istante e in modo trasparente, o magari può essere accettabile un tempo di recupero di 5-15 minuti? Il termine “all’istante” è facile a dirsi e naturalmente è anche possibile, tuttavia un tale livello di disponibilità può richiedere ulteriori complessità e infrastrutture.
Prima di progettare una soluzione di alta disponibilità, occorre tenere presenti alcuni punti chiave. In primo luogo, il software LRS è già progettato per supportare un’installazione in cui i componenti eseguibili sono separati dalla configurazione e dai dati dell’applicazione. Tale progetto può essere sfruttato per utilizzare sistemi di magazzino ad alta disponibilità quali SAN o NAS. Inoltre ha funzionato bene con diversi sistemi cluster hardware eseguiti su Windows e UNIX, che necessitano di un archivio di dati condivisi. Recentemente sono state utilizzate soluzioni di Application Delivery Controller (o servizi di bilanciamento del carico). Tutti questi tipi di soluzioni HA sono attualmente in uso e ben funzionanti negli ambienti reali dei clienti. Ma c’è di più.
È necessario considerare la natura dell’output. Ad esempio, un’applicazione può generare un “documento” aziendale che di fatto è una raccolta di documenti da stampare in uno specifico ordine. Se un sistema HA è stato configurato semplicemente per “dare le carte” a più server di output, è possibile che tali documenti vengano stampati senza rispettare l’ordine, oppure che un documento non correlato si inserisca nel gruppo. Fortunatamente il software LRS supporta una serie di approcci per garantire sia l’alta disponibilità dei sistemi che l’integrità dell’output.
Altra domanda frequente: “Se in una configurazione attiva/passiva ci sono più server di output, come faccio a indicare a un Application Delivery Controller qual è il server attivo?” Finora questo risultato è stato ottenuto mediante il controllo del componente HA per vedere se l’applicazione è in ascolto su determinate porte IP, ovvero IPP, LPR e/o le porte di interfaccia dell’applicazione. A volte, possiamo addirittura chiamare il servizio Web dell’applicazione. Tuttavia recentemente LRS ha sviluppato un programma di utilità che può interrogare la soluzione LRS utilizzando un set complesso di regole euristiche per determinare la “salute” generale dell’ambiente di output. Questo stesso tool può gestire più di due istanze VPSX e addirittura assistere in uno scenario di failover automatico.
Inoltre la soluzione LRS e i suoi componenti di supporto integrano una serie di meccanismi e funzionalità. Ad esempio, se si stampa da un’applicazione server come SAP, Epic e altre, il protocollo LRSQ può essere utile per aumentare l’affidabilità di consegna dei documenti e per indicare una destinazione alternativa del server di output. Nel caso in cui il server LRS primario non fosse disponibile, il flusso di stampa viene automaticamente inoltrato a una destinazione secondaria. È una funzione molto semplice, ma che si è dimostrata davvero molto potente in situazioni reali, quando tutte le altre misure di alta disponibilità si sono rivelate insufficienti (solitamente a causa di un errore umano).
Inoltre la soluzione LRS integra la funzionalità base della coda. Quando un lavoro di stampa viene inviato al server VPSX e per qualche motivo la destinazione finale non è raggiungibile a causa di un problema di rete o un inceppamento della stampante, il lavoro non va perduto. È possibile attendere il ripristino del dispositivo, per un periodo di tempo predeterminato, e quindi inviare di nuovo il lavoro di stampa. Anche la selezione del protocollo di comunicazione corretto per la stampante può migliorare la disponibilità. La maggior parte delle stampanti per uso commerciale comunica mediante il metodo Printer Job Language (PJL). Questo consente di riavviare un lavoro interrotto dalla pagina in cui è avvenuto lo stop.
Potrei continuare all’infinito. I modi per assicurare la disponibilità e la capacità di ripristino dell’ambiente di stampa sono numerosi. Il miglior consiglio che posso dare è: stabilite una relazione di consulenza con l’assistenza di LRS. Il team è in costante contatto con situazioni del mondo reale, può contare su un’ampia rete di colleghi (me compreso), e saprà aiutarvi a progettare uno scenario di output resiliente e capace di resistere a qualsiasi sfida. Il più delle volte utilizzando l’infrastruttura già esistente, che il vostro reparto IT conosce a fondo.