Skip to main content
Key Takeaways

Ambizioni Alle Stelle e Realtà del Cloud: Hathora puntava a una crescita rapida facendo affidamento sull'infrastruttura cloud, ospitando su AWS con Kubernetes e rivolgendosi a sviluppatori di giochi di ogni dimensione, dai piccoli team agli studi più grandi.

Mercato MMO: Un Gioco da Miliardi di Dollari: Il mercato dei giochi MMO è destinato ad espandersi di quasi 30 miliardi di dollari entro il 2029, offrendo enormi opportunità e grandi sfide infrastrutturali per aziende come Hathora.

Successo e Pressione: Troppo, Troppo in Fretta: La piattaforma di Hathora è stata rapidamente adottata da oltre 100 studi, ma le richieste dei clienti più grandi hanno evidenziato i limiti e gli alti costi dell'approccio solo cloud.

Rivalutazione della Strategia: Lezioni Dure: Rendendosi conto delle inadeguatezze dell'infrastruttura, il team di Hathora ha rivalutato il piano aziendale per trovare modi sostenibili di supportare e trarre profitto dai grandi studi di gioco.

Lezioni per i Leader Tecnologici: Adattarsi alla Scala: L’esperienza di Hathora è un insegnamento per i leader tecnologici sull’importanza della scalabilità dell’infrastruttura e dell’equilibrio tra costi del cloud e strategie di crescita.

A volte, la stessa infrastruttura che ti aiuta a raggiungere un lancio di successo finisce per diventare un ostacolo mentre il tuo business decolla verso l’alto.

Nel caso di Hathora, ciò era letteralmente vero e un po’ ironico: l’azienda si occupa di fornire infrastruttura critica e orchestrazione dei server per studi di videogiochi che devono ospitare e far scalare online i loro giochi multiplayer.

Si tratta di un mercato enorme da molti punti di vista. La società di ricerca Technavio ha previsto che il mercato dei giochi MMO (massive multiplayer online) crescerà di quasi 30 miliardi di dollari tra il 2025 e il 2029, ad esempio. Altri analisti prevedono una crescita simile nei prossimi cinque anni circa.

Want more from The CTO Club?

Create a free account to finish this piece and join a community of CTOs and engineering leaders sharing real-world frameworks, tools, and insights for designing, deploying, and scaling AI-driven technology.

This field is for validation purposes and should be left unchanged.
Name*

Hathora voleva lanciare e scalare rapidamente la propria piattaforma, quindi ha seguito il percorso ormai comune a molte startup, piccoli team e altre aziende: ha puntato tutto sul cloud, gestendo ogni aspetto su Amazon Web Services con EKS, il servizio Kubernetes completamente gestito del gigante del cloud. Le sue ambizioni sembravano senza limiti: Hathora voleva servire sviluppatori di giochi di tutte le dimensioni, dai team più piccoli ai grandi studi e chiunque si trovasse nel mezzo.

E ha funzionato – fino a un certo punto. Oltre 100 studi di sviluppo di giochi hanno adottato la piattaforma Hathora entro sei mesi dal lancio iniziale. Tuttavia, quel successo iniziale ha portato alla luce un problema fondamentale considerando l’obiettivo di Hathora di servire studi di tutte le dimensioni, provenienti da tutto il mondo: quando hanno iniziato a lavorare con studi sempre più grandi, l’economia della loro infrastruttura esclusivamente cloud è diventata rapidamente insostenibile – tanto che rischiavano di perdere una grossa e redditizia fetta del mercato complessivo.

In questo caso di studio, osserveremo da vicino come il CTO di Hathora e il suo team hanno trasformato la strategia iniziale di business e tecnologia, ottenendo risultati potenzialmente dirompenti – così come alcune lezioni apprese utili per altri leader tecnologici di qualsiasi settore.

L’azienda & il CTO

Azienda: Hathora, fornitore globale di infrastruttura critica e orchestrazione dei server per studi di videogiochi che devono ospitare i loro giochi multiplayer online.

Il CTO: Harsh Pandey, che è anche il fondatore dell’azienda:

“Abbiamo costruito Hathora per offrire agli studi di sviluppo di tutte le dimensioni un’infrastruttura su scala globale senza doverla sviluppare da soli. Ma quando abbiamo iniziato a determinare i prezzi per i grandi studi, i conti non tornavano più. I costi del cloud, in particolare quelli di uscita dei dati, rendevano la nostra offerta insostenibile proprio per il tipo di clienti che volevamo servire.”

Sede principale: New York City

Clienti serviti: Oggi, Hathora serve clienti (letteralmente) in tutto il mondo, operando da 14 regioni globali distribuite su sei continenti.

Il problema di business

Grandi ambizioni portano solitamente a grandi sfide, e così è stato anche per Harsh e Hathora.

Alcuni di questi problemi sono insiti nella natura dell’industria videoludica: i giochi MMO non sono piccoli negozi di quartiere con flussi di traffico prevedibili. Al contrario, i giochi multiplayer devono fornire aggiornamenti costanti a ogni singolo giocatore connesso contemporaneamente, garantendo alte prestazioni.

Questo significa grandi quantità di dati che si spostano costantemente avanti e indietro tra l’infrastruttura di back-end e i singoli giocatori, che nei giochi più grandi possono essere milioni. E se pensi che i tuoi clienti siano esigenti, basti dire che i gamer più appassionati non sono certo famosi per la pazienza riguardo a prestazioni e user experience.

Gestire i carichi di gioco dalla sola piattaforma cloud di Hathora funzionava bene per gli studi più piccoli. Ma quando uno studio più grande si è rivolto all’azienda per conoscere i prezzi, Harsh e il team si sono accorti dei limiti del modello finanziario.

“Abbiamo capito di dover affrontare una sfida quando un grande studio di videogiochi che utilizzava la nostra piattaforma di hosting per playtest interni ci ha chiesto il prezzo per il lancio,” ci ha raccontato Harsh. “Il loro preventivo per la larghezza di banda superava il milione di dollari al mese.”

Era quattro volte il costo previsto per il computing necessario a far girare il gioco, secondo Harsh. Non era sostenibile né per lo studio né per Hathora. Questo ha portato Hathora a un bivio: mantenere la strategia cloud-only originale col rischio di perdere il segmento dei grandi studi, o cambiare strada.

“Il problema da risolvere era il prezzo, semplice e chiaro,” dice Harsh.

La soluzione, però, era tecnica: Hathora doveva trasformare la propria infrastruttura per rispondere meglio alle esigenze specifiche dei carichi di lavoro dei server di gioco, adottando al contempo un modello tariffario accessibile anche per i più grandi studi.

Cosa hanno fatto e perché

I professionisti del settore tecnologico di ogni tipo hanno sentito numerosi discorsi sui vantaggi della migrazione di infrastruttura e carichi di lavoro sul cloud, o sul semplice lancio come realtà solo cloud. Questa è stata una tendenza dominante per anni, e Hathora non ha fatto eccezione.

Hathora ha seguito una direzione quasi opposta per risolvere il problema dei grandi clienti, adottando un’architettura cloud ibrido e puntando infine su un vecchio cavallo di battaglia: i server bare metal. 

(Dai un’occhiata al nostro articolo su questa tendenza più recente del passaggio dall’ambiente cloud all’infrastruttura on-premises.)

Harsh racconta l’evoluzione dell’azienda:

“Siamo passati a un modello ibrido e abbiamo monitorato il costo infrastrutturale per sessione concorrente, le prestazioni di latenza nelle diverse regioni globali e l’impegno ingegneristico richiesto per gestire tutto. Trasferendo l’80% dei nostri carichi di lavoro su bare metal, possiamo dimezzare quasi i costi di calcolo e ridurre i costi di banda di oltre il 90%. Ora gestiamo oltre 30.000 core distribuiti su 14 regioni con un team di ingegneri relativamente piccolo. Quel livello di efficienza e di copertura sarebbe stato impossibile con la nostra architettura iniziale.”

Continuano comunque a sfruttare l’infrastruttura cloud per scalabilità e picchi di domanda, che ora rappresenta circa il 20% dei carichi di lavoro (anziché il 100%). Ma ora lo stack di Hathora si basa su due provider bare-metal e su risorse cloud AWS e GCP invece che mantenere tutto su AWS. Harsh e il suo team hanno optato per Talos Linux, una distribuzione minimalista progettata appositamente per ambienti Kubernetes, e Omni (sempre di Sidero Labs) per l’orchestrazione da un singolo piano di controllo nei vari ambienti ibridi.

Inutile dire che non è stato semplice come premere un interruttore. Inoltre, andavano tenuti in conto pro e contro. La scelta iniziale di partire solo su cloud ha permesso a Hathora di lanciare rapidamente e con successo. Allontanarsi da quel modello ha significato rinunciare ad alcuni dei vantaggi del cloud, almeno inizialmente:

“Cambiare strategia ha significato rinunciare a molte delle comodità offerte dalle piattaforme cloud,” dice Harsh. “Avremmo perso il ridimensionamento automatico semplice, il monitoraggio integrato e i servizi gestiti. Questo ha aggiunto complessità operativa. Inoltre, dovevamo dimostrare di poter eguagliare o superare le prestazioni del cloud. Non c’era garanzia che avremmo trovato fornitori o strumenti adatti alle nostre esigenze. Ma ritenevamo che avere controllo sui costi e sulle prestazioni fosse essenziale per il nostro modello di business, ed eravamo pronti a correre questo rischio.”

La scommessa sta dando i suoi frutti, spianando la strada per la prossima fase di crescita di Hathora: ora l’azienda serve clienti in sei continenti. Può offrire la stessa infrastruttura critica ai principali studi a un costo significativamente inferiore rispetto a prima. Fornisce inoltre un controllo più granulare sulle esigenze specifiche dei carichi di lavoro dei giochi (questo è anche un importante vantaggio dei software di gestione dei requisiti), offrendo controllo a livello di nodo con Talos Linux e orchestrazione cluster unificata con Omni, indipendentemente da dove girano i carichi di lavoro.

“Questi strumenti sono minimali, sicuri e facili da usare attraverso diversi tipi di infrastruttura,” dice Harsh. “Abbiamo valutato il nostro stack in base a prestazioni, costi e quanto controllo avremmo mantenuto. La nuova configurazione ci permette di operare con un team ridotto e scalare a livello globale senza essere vincolati ad un solo fornitore.”

In effetti, il piccolo team di ingegneria di Hathora è diventato una sorta di KPI non ufficiale. Dopo la migrazione della prima regione completa al modello ibrido, ha registrato miglioramenti istantanei sulle prestazioni e sui costi e ha scalato rapidamente (ora gestisce 14 regioni nel mondo).

“Ogni volta che qualcuno scopre che la nostra infrastruttura è gestita da pochi ingegneri, è un momento che ci ricorda quanto siamo cresciuti.”

Le principali intuizioni e lezioni apprese

Non è necessario lavorare nell’infrastruttura digitale o nell’industria dei videogiochi per applicare principi e lezioni simili nella propria azienda.

  • Ascolta i tuoi clienti: Harsh e il suo team si sono accorti di avere un problema – e che dovevano essere proattivi per risolverlo – ascoltando i loro clienti, in particolare il grande studio che aveva utilizzato Hathora per test interni e successivamente aveva chiesto una stima dei costi per eseguire il gioco reale sulla loro infrastruttura. I CTO sono tanto responsabili di risolvere i problemi dei clienti quanto di costruire soluzioni tecnologiche: le due cose vanno di pari passo.
  • Non abbiate paura di cambiare direzione. "Cloud first", "cloud native" e termini simili dovrebbero essere considerati strategie adattabili, non dogmi inviolabili. Lo stesso principio si applica su larga scala: solo perché si parte con una determinata strategia non significa che si debba mantenerla per sempre. Hathora avrebbe potuto rimanere ferma e restare interamente nel cloud, ma questo avrebbe limitato il suo potenziale di crescita e, alla fine, le prestazioni dei giochi eseguiti sulla sua infrastruttura.

Passare a un modello ibrido ha permesso all'azienda di servire clienti di tutte le dimensioni e di migliorare le prestazioni grazie a una maggiore flessibilità e controllo nell'affrontare le esigenze specifiche dei carichi di lavoro dei giochi. Da allora Hathora è stata in grado di lanciare un livello enterprise che offre ai più grandi studi prezzi prevedibili e forti garanzie sulle prestazioni.

  • Sii scrupoloso nelle tue analisi. Un cambiamento di questa portata non si può realizzare a tentoni. Harsh e il team hanno realizzato un proof-of-concept completo con Talos e Omni per mettere alla prova il loro cambio di strategia:

"Una volta che abbiamo verificato di poter orchestrare tutto tramite un unico sistema, abbiamo migrato la nostra prima regione completa. I miglioramenti prestazionali sono stati immediati. Da lì, abbiamo esteso il modello globalmente, aggiungendo fornitori e location man mano che procedevamo,” ha detto Harsh.

Il team ha analizzato i pro e i contro – compresa la perdita iniziale dei vantaggi del cloud descritti da Harsh sopra – per minimizzare le sorprese. Sapeva di dover trovare una soluzione compatibile con Kubernetes che potesse orchestrare tutto tra più ambienti e regioni, trattando essenzialmente ogni macchina allo stesso modo, sia che funzionasse su bare metal che nel cloud.

Harsh ha sottolineato che hanno anche effettuato approfonditi benchmark sui fornitori, confrontando CPU AMD e Intel, testando le prestazioni di rete nel mondo reale e valutando i vendor su quanto bene si confrontassero con Global Accelerator di AWS. 

"Ci siamo assicurati che la nostra nuova configurazione non fosse solo più economica, ma anche più veloce e affidabile nelle regioni che contavano."

  • Punta sul lungo termine: Cambiamenti di direzione trasformativi come questo non servono solo a risolvere problemi una tantum. Se fatti bene, aprono sempre più possibilità in futuro. La mentalità di lungo termine sta già dando i suoi frutti per Hathora. Continuano a sviluppare nuove funzionalità per gli studi più grandi, come opzioni di cluster dedicati, peering regionale per passaggi a bassa latenza e una migliore osservabilità durante gli eventi live.

Harsh ha inoltre affermato che il nuovo modello di infrastruttura di Hathora per il gaming sta mostrando potenziale valore anche in altri settori che richiedono reattività in tempo reale e throughput elevato, e il piano a lungo termine dell’azienda è di sviluppare nuove soluzioni per gli sviluppatori al di fuori dell’industria dei giochi.

"Il passaggio a un modello ibrido ci ha dato flessibilità a lungo termine. Ora possiamo entrare rapidamente in nuove regioni, testare nuovi vendor hardware senza vincoli e dare ai clienti maggior controllo su come viene distribuita la loro infrastruttura. La piattaforma è diventata molto più modulare e adattabile."

Per più casi studio e playbook, iscriviti alla newsletter di The CTO Club.