Skip to main content

I sistemi IT sono più complessi che mai e la quantità di denaro che le aziende investono in essi raggiunge ogni anno nuovi record, quindi le aziende non possono permettersi di trascurare l'importanza di mantenere sotto controllo la propria infrastruttura. Il monitoraggio dell'infrastruttura è la tua arma segreta per evitare downtime imprevisti, cali di performance o vulnerabilità di sicurezza.

Sei responsabile della gestione di server on-premises, ambienti cloud o una configurazione ibrida? Hai bisogno di un processo per monitorare e analizzare in tempo reale i tuoi sistemi, reti e servizi per assicurarti che tutto funzioni efficientemente.

In questa guida completa al monitoraggio dell'infrastruttura, scoprirai come tenere sotto stretto controllo l’intero ecosistema IT, dall’hardware ai software, e come individuare potenziali problemi prima che abbiano un impatto sulla tua azienda. Ti illustrerò i principali strumenti e le best practice per creare un sistema di monitoraggio robusto e approfondirò alcune delle sfide che i responsabili IT affrontano, come la gestione dell’enorme mole di dati o l’integrazione del monitoraggio su più piattaforme. Ho dei consigli che ti aiuteranno a superare anche i momenti più difficili.

Want more from The CTO Club?

Create a free account to finish this piece and join a community of CTOs and engineering leaders sharing real-world frameworks, tools, and insights for designing, deploying, and scaling AI-driven technology.

This field is for validation purposes and should be left unchanged.
Name*

Assicuriamoci che tu abbia tutte le carte in regola per avere successo!

Che cos'è il Monitoraggio dell'Infrastruttura?

Il monitoraggio dell’infrastruttura tiene traccia e raccoglie metriche relative ai sistemi digitali come server, macchine virtuali, container e database. Monitora statistiche come uptime, prestazioni e utilizzo delle risorse per produrre insight che guidano le decisioni operative sul back end.

La maggior parte degli strumenti di monitoraggio dell'infrastruttura che ho usato negli anni visualizza le metriche raccolte con funzioni come grafici e diagrammi, facilitando l’interpretazione dell’attività nel tempo e l'individuazione delle tendenze.

Come Funziona il Monitoraggio dell’Infrastruttura?

Prima di iniziare, dovrai integrare lo strumento di monitoraggio dell'infrastruttura scelto nel tuo sistema. Le procedure variano a seconda del tipo di monitoraggio che desideri implementare, come vedrai più avanti in questo articolo. Consulta il fornitore per una guida introduttiva.

Dopo che è operativo, potrai utilizzarlo per monitorare i tre principali livelli della tua infrastruttura IT:

3 square blocks in the colors lime green, purple, and black are stacked on top of each other to represent the 3 main layers of infrastructure.
  • Hardware: Questo livello comprende i componenti fisici dell’infrastruttura, inclusi processori, memoria e dispositivi di archiviazione
  • Sistema operativo: Il SO è l’intermediario tra l’hardware e il layer applicativo dello stack tecnologico
  • Applicazione: Questo livello include il software che gestisce i processi aziendali

Il processo generale secondo cui funziona un monitor IT di infrastruttura comprende i seguenti passaggi:

  • Scoperta: Il monitor effettua la scansione della tua infrastruttura per individuare tutti i componenti di cui dovrà occuparsi su tutti e tre i livelli dello stack tecnologico.
  • Mappatura: Successivamente individua e segnala tutte le dipendenze e le posizioni dei componenti.
  • Raccolta: I monitor trascorrono generalmente la maggior parte del tempo raccogliendo dati dai componenti individuati, inclusi log applicativi e metriche sulle performance. A seconda del tipo di monitor che possiedi, questo processo può includere anche errori e vulnerabilità.
  • Analisi: Il monitor utilizza i dati raccolti per ricavare insight, in modo automatico oppure fornendo all’utente strumenti adeguati, con visualizzazioni disponibili di default.
  • Visibilità: L’obiettivo finale di qualsiasi monitor è introdurre l’osservabilità nell’infrastruttura IT, ed è ciò verso cui punterai con tutti gli altri passaggi del processo.

Tutti questi passaggi sono continui, anche quelli che ho descritto come relativi alla fase di configurazione. Spesso si svolgono in contemporanea perché, man mano che la tua infrastruttura si espande, il monitor dovrebbe essere in grado di adattarsi per fornirti la massima osservabilità.

Quali Funzionalità Comprende il Monitoraggio dell’Infrastruttura?

Alcune delle principali funzionalità degli strumenti di monitoraggio dell’infrastruttura includono:

  • Gestione dei log e telemetria: Gli strumenti di monitoraggio dell'infrastruttura IT dovrebbero consentire di raccogliere varie metriche e statistiche da diverse fonti e poi aggregarle in un unico posto accessibile.
  • Visualizzazione: Quasi certamente riceverai grandi quantità di dati anche da un piccolo sistema IT, e la capacità di visualizzarli sotto forma di oggetti come grafici, tabelle e heatmap rende più facile estrarre informazioni da tutto ciò.
  • Analitica: Questa funzione completa la visualizzazione permettendo al software di eseguire test su larga scala per ricavare insight dai dati, che puoi utilizzare per guidare le decisioni aziendali. I test possono andare dal confronto di più set di dati fino all'individuazione di tendenze da uno solo.
  • Reportistica: Questa funzione consente di ottenere ulteriori informazioni sullo stato della tua infrastruttura, e di solito hai la possibilità di scegliere se ricevere report dettagliati o sintetici. Ho anche notato che la maggior parte degli strumenti di monitoraggio più noti ti consente di programmare quando ricevere i report e a volte anche dove farli inviare.
  • Gestione di errori, richieste e incidentiQueste funzionalità permettono di segnalare i problemi e monitorarli fino alla loro risoluzione. In questa categoria rientrano elementi come ticket, gruppi di errori, avvisi e notifiche che aiutano te e il tuo team a gestire i problemi in modo più efficace.
  • Automazione: Queste funzionalità consentono di ridurre il tempo impiegato per attività ripetitive come l'impostazione e il controllo dei workflow, testing, mappatura delle dipendenze e validazione dei rilasci.
  • Ottimizzazione dei costi: Molti strumenti in questo campo sono basati sull'utilizzo, e non è raro che la spesa aumenti notevolmente con la crescita delle operazioni. Per questo motivo, una funzionalità molto utile è l'opzione di configurare soglie di spesa o allerte quando ci si avvicina ai limiti, così da poter intervenire tempestivamente.
  • Osservabilità full-stack: Una buona soluzione di monitoraggio dovrebbe offrirti visibilità su tutto il tuo stack tecnologico, compresi endpoint e dipendenze. Una piattaforma unificata che consente di gestire l’intero sistema aiuta molto a contenere la dispersione e a ottimizzare i costi.
  • Architettura cloud agnostica: Gli strumenti di monitoraggio dell’infrastruttura non dovrebbero vincolarti a una sola piattaforma cloud, anche se un cloud provider li offre. Potrebbero esserci vantaggi aggiuntivi nell'utilizzarli su una piattaforma rispetto a un'altra, ma in generale è pratica comune poter scegliere dove impiegarli.

Tipi di monitoraggio dell'infrastruttura

Esistono due tipi di monitoraggio dell'infrastruttura: basato su agenti e senza agenti. La differenza sta nel modo in cui li configuri per interagire con la tua infrastruttura IT.

Immagine che confronta il monitoraggio dell'infrastruttura agent-based vs agentless

Il monitoraggio basato su agenti richiede l'installazione di uno strumento per poter raccogliere direttamente i dati da ciò che stai monitorando. Ad esempio, se vuoi osservare server bare metal con un approccio basato su agenti, dovrai installare un monitor su ciascuno di essi.

In questo modo, gli agenti possono raccogliere molti più dati dall'infrastruttura a livello granulare e fornire indici di disponibilità più affidabili, ma spesso richiedono competenze tecniche maggiori e più tempo per la configurazione e la manutenzione.

Il monitoraggio senza agenti, invece, funziona utilizzando API e protocolli per raccogliere dati, di solito dai pacchetti mentre si spostano tra i componenti.

Per questo motivo, i monitor senza agenti sono spesso più economici e semplici da configurare, ma otterrai meno metriche e la funzionalità dipenderà dalla stabilità della rete.

In definitiva, la soluzione giusta dipende da ciò che desideri ottenere dalla tua strategia di monitoraggio, e per fortuna puoi utilizzare entrambe le soluzioni contemporaneamente. Io ho usato agenti sui componenti critici e il senza agenti su tutto il resto, sempre nella stessa infrastruttura.

Quale infrastruttura IT dovresti monitorare?

Dovresti usare la soluzione di monitoraggio dell'infrastruttura per tenere d'occhio quanto segue:

sfondo viola con immagini e parole in verde lime che mostrano 7 elementi da monitorare, dai server all'archiviazione ai dispositivi.
  • Server: Monitorando questi elementi, puoi mantenere la sicurezza e la disponibilità complessiva del sistema.
  • Storage: Gestisci questi elementi per evitare che i tuoi dati e altri asset vengano compromessi a causa di violazioni e fughe di informazioni.
  • Container e orchestrator: Se questi sono in buone condizioni, le tue applicazioni containerizzate funzioneranno meglio.
  • Reti: Conoscere il traffico in entrata e in uscita ti aiuta a fornire un'esperienza migliore, a implementare il bilanciamento del carico e a rispondere in modo efficace ad attacchi DDoS.
  • Piattaforme cloud: Puoi monitorare aspetti come capacità e utilizzo delle risorse per garantirne la disponibilità e il controllo dei costi.
  • Esperienza digitale: Monitorando come i vari fattori legati alla tua infrastruttura influenzano l'esperienza utente nei tuoi touchpoint, puoi aumentare il tasso di fidelizzazione.
  • Dispositivi: Se la tua infrastruttura IT è composta da diversi endpoint, monitorarli ti aiuta a garantire che siano sicuri e funzionino correttamente.
Upgrade your inbox with more tech leadership wisdom for delivering better software and systems.

Upgrade your inbox with more tech leadership wisdom for delivering better software and systems.

This field is for validation purposes and should be left unchanged.
Name*

Perché Hai Bisogno del Monitoraggio dell'Infrastruttura?

Nel corso della mia carriera nello sviluppo software, ho visto in prima persona i benefici che gli strumenti di monitoraggio dell'infrastruttura offrono a vari team, inclusi DevOps e ITOps.

Graphic explaining why you need an infrastructure monitoring system with small logos for each challenges

I vantaggi del monitoraggio dell'infrastruttura includono:

1. Rilevamento e Gestione dei Problemi

La maggior parte delle soluzioni di monitoraggio dell'infrastruttura analizza continuamente i tuoi ambienti alla ricerca di eventuali problemi o anomalie. Quando rilevano qualcosa di insolito, inviano una notifica con le linee guida per la risoluzione in modo che tu possa affrontarli il prima possibile.

Uno studio recente ha rilevato che il 32% delle infrastrutture aziendali contiene vulnerabilità critiche che vengono prese di mira dagli hacker, quindi è fondamentale predisporre un sistema per gestire questi problemi prima che possano impattare il tuo business.

2. Controllo della Proliferazione

La proliferazione IT è uno dei maggiori problemi che le aziende in crescita devono affrontare. Si riferisce alla crescita incontrollata di sistemi e applicazioni informatiche, che può introdurre vulnerabilità alla sicurezza nella tua infrastruttura e ridurre la produttività. Con una buona soluzione di monitoraggio IT, puoi sfruttare una piattaforma unificata di osservabilità e tenere sotto controllo la proliferazione informatica.

3. Gestione dei Costi

Con una soluzione di monitoraggio IT, puoi tenere meglio sotto controllo le spese sui diversi sistemi così che non sfuggano al controllo. Questo vantaggio risulta particolarmente evidente quando si ha a che fare con modelli di prezzo basati sull'uso, come le piattaforme di cloud computing, dove il consumo reale non è facilmente prevedibile in anticipo.

I monitor dell'infrastruttura ti forniscono strumenti sia per evitare che la spesa superi un limite prefissato sia per avvisarti quando i costi si avvicinano a superare una soglia determinata.

4. Sicurezza

Con la maggior parte dei principali strumenti di monitoraggio dell'infrastruttura sul mercato oggi, beneficerai di scansioni automatiche e continue del sistema che possono rilevare anomalie e intervenire per prevenire minacce alla sicurezza sia note che emergenti.

Inoltre, puoi aspettarti che lo strumento ti aiuti con azioni di ripristino e mitigazione affinché tu comprenda il problema e sappia come affrontare eventi simili in futuro.

Se lavori con un'infrastruttura on-premise, puoi delegare alcune funzioni di sicurezza a uno di questi strumenti e concentrarti su altre aree di crescita. Personalmente, trovo utile che questi strumenti cifrino automaticamente i dati in transito, dandoti tranquillità quando ospiti tu stesso le applicazioni.

5. Conformità

Per chiunque abbia un'azienda in un settore altamente regolamentato, come finanza, sanità o istruzione, gli strumenti giusti per l'infrastruttura IT possono rendere la conformità semplice come un clic. Scansionano la tua infrastruttura e generano report che aiutano a dimostrare la conformità a standard come HIPAA, ISO e altri.

Per quanto riguarda gli audit, questi strumenti possono anche effettuare controlli e generare log e report che puoi presentare agli organismi di vigilanza, e in più possono offrirti sistemi che consentono agli auditor di ottenere accesso temporaneo alla tua infrastruttura IT.

6. Disponibilità/Uptime del Sistema

Gli strumenti di monitoraggio dell'infrastruttura possono essere di grande aiuto per i team DevOps e ITOps perché offrono funzioni che ti aiutano a mantenere i sistemi attivi e funzionanti.

I principali vantaggi riguardano il monitoraggio delle prestazioni per statistiche come la regressione, ma i benefici sono evidenti anche grazie a funzionalità che consentono di risolvere i problemi in meno tempo, rilasciare prodotti più rapidamente e, in generale, essere più proattivi.

La Bank of New Zealand utilizza il monitoraggio dell'infrastruttura sul proprio cluster Kubernetes
Ecco uno screenshot dello strumento di monitoraggio dell'infrastruttura della Bank of New Zealand. (Fonte)

Se sei ancora indeciso su tutto ciò, dovresti sapere che i risultati sono tangibili. La Bank of New Zealand è passata a un sistema cloud-first. Cinque anni dopo l'implementazione della soluzione adeguata di monitoraggio dell'infrastruttura, l'istituto ha riportato che i principali incidenti di servizio sono diminuiti del 94% e i rilasci di software di alta qualità sono aumentati del 58%.

Come scegliere una soluzione di monitoraggio dell'infrastruttura

Non manca certo la scelta di strumenti per il monitoraggio dell'infrastruttura sul mercato.

Criteri di selezione per i sistemi di monitoraggio dell'infrastruttura

Quando valuti una soluzione di monitoraggio dell'infrastruttura, alcuni dei criteri da tenere a mente includono i seguenti:

  • Funzionalità specifiche per il settore: Se lavori in un settore di nicchia o in uno più regolamentato della media, cerca opzioni che si adattino ai tuoi casi d'uso specifici, con funzioni come la gestione della conformità.
  • Portata: La tua infrastruttura IT potrebbe comprendere facilmente diversi sistemi, inclusi server, piattaforme cloud e endpoint, quindi dovresti trovare uno strumento di monitoraggio che li copra tutti per evitare dispersioni.
  • Scalabilità: Lo strumento di monitoraggio IT scelto deve essere in grado di crescere insieme alle tue operazioni, così da non dover correre a cercare un sostituto quando le esigenze superano quanto era stato previsto.
  • Assistenza clienti: Questo aspetto è rilevante soprattutto per i team con competenze tecniche limitate e/o che optano per soluzioni completamente gestite. Se hai valutato la tua situazione e pensi di non poter risolvere internamente eventuali problemi seri, dovresti dare priorità a soluzioni i cui clienti hanno sottolineato esplicitamente la qualità del supporto.
  • Sicurezza: Inizia con la crittografia e il controllo degli accessi degli utenti come requisito minimo, poi cerca funzionalità come la gestione delle patch, il rilevamento di anomalie e minacce, e la gestione delle vulnerabilità per proseguire da lì.
  • Costo: Mentre alcuni strumenti di monitoraggio dell'infrastruttura offrono tariffe flat, molti modelli di prezzo sono basati sull'utilizzo. Ti consiglio di contattare direttamente il fornitore per calcolare quali cifre aspettarti in base alle tue esigenze attuali future.
  • Integrazioni: Potresti aver bisogno di connetterti ad altri strumenti per sfruttare al massimo la piattaforma di monitoraggio, inclusi tool per la collaborazione come Jira e Google Workspace, il controllo versione come GitLab e GitHub, e l'orchestrazione tramite Kubernetes e OpenShift.

I migliori strumenti per il monitoraggio dell'infrastruttura

Alcuni dei migliori strumenti di monitoraggio dell'infrastruttura che ho utilizzato e apprezzato negli ultimi anni in ruoli DevOps includono:

1. Grafana – Migliore opzione open-source

Uno screenshot che mostra la piattaforma di monitoraggio dell'infrastruttura di Grafana Labs
Utilizzare Grafana per gestire i deployment dei container. (Fonte)

Grafana è una piattaforma open-source per l’osservabilità sviluppata da Grafana Labs che puoi usare on-premise con la versione OSS oppure nel cloud.

Se non hai mai usato uno strumento di monitoraggio prima, ti consiglio di dare un’occhiata alla loro demo online per farti un’idea della piattaforma. È accessibile dalla home page del loro sito web, gratuita e non richiede alcuna iscrizione o installazione.

Uno dei maggiori punti di forza di Grafana è nelle visualizzazioni che offre e in quanto puoi configurare ciò che desideri vedere. Per il monitoraggio dell’infrastruttura, ti permette di ottenere una visibilità "full-stack" grazie allo stack LGTM:

  • Loki per i log
  • Grafana per le visualizzazioni
  • Tempo per le tracce
  • Mimir per le metriche

2. Amazon CloudWatch - Le migliori funzionalità di registrazione dei log

Immagine che mostra la dashboard di Amazon CloudWatch mentre viene utilizzata per gestire i log
Lavorare con i log utilizzando CloudWatch. (Fonte)

Amazon CloudWatch è uno strumento di monitoraggio di applicazioni e infrastrutture che funziona su tutti i principali cloud e on-premises, ma consiglio di utilizzarlo su AWS perché si ottengono maggiori vantaggi.

Innanzitutto, utilizza nativamente Amazon Route 53 e VPC Flow Logs per raccogliere e pubblicare log. Puoi anche usarlo per raccogliere log da altri prodotti e servizi AWS che compongono la tua infrastruttura IT, inclusi CloudTrail, Lambda e API Gateway.

Oltre alle sue funzioni di registrazione dei log, apprezzo anche il suo approccio alla sicurezza tramite strumenti come Identity and Access Management (IAM) per controllare i permessi utente e Key Management Service (KMS) per la crittografia.

3. New Relic - Le migliori funzionalità di gestione degli errori

Utilizzo della funzione Error Inbox in New Relic per il monitoraggio dell'infrastruttura
Ecco come appare un gruppo di errori utilizzando Error Inbox in New Relic. (Fonte)

New Relic è stato uno dei primissimi strumenti di monitoraggio delle infrastrutture che abbia mai utilizzato, e ancora oggi mi capita di tornare a consigliarlo ad altri dopo anni per la sua efficacia nella gestione degli errori.

Offre una funzione chiamata Error Inbox, che ti permette di:

  • Accedere agli errori in un unico posto e consultarli con dati contestuali completi
  • Creare gruppi di errori, che vengono aggregati in base alla gravità, con la possibilità di impostare regole di notifica personalizzate per ricevere avvisi solo sui gruppi ad alta priorità
  • Segnalare in modo proattivo, classificare e risolvere gli errori prima che vengano aperte segnalazioni
  • Integrare Slack per tenere aggiornati i team
  • Accedere ai dati storici degli errori, completi di dettagli come commenti e link, anche dopo che gli errori sono stati risolti

4. Honeycomb - Il migliore per i servizi distribuiti

Un'immagine di una heatmap creata con Honeycomb.io
Dati visualizzati come heatmap per l'analisi con la funzione BubbleUp di Honeycomb. (Fonte)

Ho incontrato Honeycomb per la prima volta solo un paio di mesi fa, ma mi ha conquistato quasi subito grazie alla funzione BubbleUp.

Ho utilizzato BubbleUp per confrontare grandi quantità di metriche e altri dati raccolti dai miei sistemi, e si è sempre rivelato fondamentale nell'evidenziare tendenze e altri spunti analitici che mi erano sfuggiti, persino quando avevo già delle visualizzazioni.

Se la tua infrastruttura è composta da sistemi distribuiti, le funzionalità di telemetria di Honeycomb possono aiutarti a gestire e ordinare i dati raccolti.

5. eG Enterprise - Le migliori funzionalità di mappatura delle dipendenze

Screenshot di eG Enterprise di eG Innovations mentre viene utilizzato per monitorare i dispositivi di storage di un sistema IT
Monitoraggio dei dispositivi di storage con eG Enterprise. (Fonte)

eG Enterprise è una soluzione di monitoraggio dell'infrastruttura e delle prestazioni delle applicazioni (APM) di eG Innovations che funziona sia su applicazioni legacy che moderne, oltre che su infrastrutture cloud e on-premise.

Personalmente, l’ho utilizzato su una piattaforma self-hosted e ho trovato molto valide le sue funzioni di mappatura delle dipendenze e topologia dell’infrastruttura nel rivelare la composizione della mia infrastruttura IT. Ho testato la funzione di auto-scoperta per diversi tipi di dipendenze che coinvolgevano macchine virtuali, macchine fisiche e applicazioni.

Le presenta in modo visivo, quindi è facile determinare come le modifiche in un’area possano influenzare il resto del sistema, informazioni che ho usato per migliorare la sicurezza e le prestazioni.

Best practice per il monitoraggio dell’infrastruttura

Nello sviluppare la tua strategia di monitoraggio dell’infrastruttura, alcune best practice che credo dovresti tenere a mente, sulla base dei consigli di alcuni amministratori di sistema e responsabili tecnici che ho consultato per questo articolo, includono:

Best practices for infrastructure monitoring
  • Automatizza: In questo modo ti liberi da compiti ripetitivi e banali per concentrarti su aree di crescita più critiche. L’automazione ti permette inoltre di ridurre i rischi legati a flussi di lavoro manuali, dove un errore umano potrebbe causare seri problemi.
  • Configura gli avvisi: Devi sapere cosa succede nei tuoi sistemi il prima possibile, così da poter rispondere rapidamente. Configura il modo in cui ricevi le notifiche in base alla priorità, così da non essere sommerso da avvisi di basso livello.
  • Standardizza tra gli ambienti: Se usi il monitor per diversi sistemi, è consigliabile applicare gli stessi processi e configurazioni dove possibile, così non devi preoccuparti di ricordare come funziona ciascuno.
  • Dai priorità ai componenti principali: Se non puoi configurare tutto in una volta e devi implementare il sistema gradualmente, inizia dai componenti più critici e procedi via via verso quelli meno importanti. Ad esempio, la sicurezza dei data center dovrebbe avere la precedenza rispetto all’ottimizzazione delle prestazioni.
  • Esegui audit: Oltre a mantenerti conforme alle normative, queste attività possono aiutarti a scoprire vulnerabilità e altri problemi che potrebbero mettere a rischio la tua infrastruttura se venissero trascurati.
  • Testa e aggiorna spesso: Prenditi il tempo di essere proattivo eseguendo test di stress e penetration test sulla tua piattaforma per valutare quanto sei preparato ad affrontare situazioni di prestazioni o sicurezza. Se usi una soluzione self-hosted, ti consiglio di controllare almeno una volta al giorno la presenza di aggiornamenti se le patch automatiche non sono disponibili.
  • Consulta regolarmente il fornitore: Tieni regolarmente i contatti con il tuo provider per sapere se ci sono funzioni nuove o in arrivo di cui potresti beneficiare, ricevere raccomandazioni per ottenere il massimo dal tuo monitor e altre informazioni vitali che potresti perdere se non ti tieni aggiornato.

Cosa succede ora?

Più della metà delle aziende ha oggi spostato tutta l’infrastruttura rilevante sul cloud, e trovare una soluzione di monitoraggio solida è importante quanto qualsiasi altra decisione aziendale. Se sei in fase di migrazione verso il cloud, utilizza le informazioni fornite in questo articolo per posizionarti al meglio per il successo.

Iscriviti alla newsletter del CTO Club per ulteriori approfondimenti sulle ultime innovazioni e soluzioni tecnologiche per il tuo business.