Des ambitions élevées face à la réalité du cloud: Hathora visait une croissance rapide en s’appuyant sur l’infrastructure cloud, hébergée sur AWS avec Kubernetes, et ciblait les développeurs de jeux allant de petites équipes jusqu’aux grands studios.
Marché du MMO : un terrain de jeu à un milliard de dollars: Le marché des jeux MMO devrait croître de près de 30 milliards de dollars d’ici 2029, offrant de vastes opportunités, mais aussi de sérieux défis d’infrastructure pour des entreprises comme Hathora.
Succès et tension : trop, trop vite: La plateforme de Hathora a été adoptée rapidement par plus de 100 studios, mais les exigences des plus gros clients ont révélé les limites et les coûts élevés de leur approche tout-cloud.
Revoir la stratégie : apprentissage difficile: Après avoir constaté les insuffisances de leur infrastructure, l’équipe de Hathora a réévalué son plan d’affaires pour trouver des moyens durables de soutenir et de rentabiliser les grands studios de jeux.
Leçons pour les leaders technologiques : s’adapter à l’échelle: L’expérience de Hathora est une leçon pour les décideurs technologiques sur l’importance de la scalabilité de l’infrastructure et de l’équilibre entre les coûts du cloud et les stratégies de croissance.
Parfois, l’infrastructure même qui vous permet de réussir un lancement devient un frein alors que votre entreprise prend son envol.
Dans le cas de Hathora, cela s’est avéré on ne peut plus littéral — et un brin ironique : L’entreprise propose une infrastructure critique et une orchestration de serveurs permettant aux studios de jeux vidéo d’héberger et de faire évoluer leurs jeux multijoueurs en ligne.
C’est un immense marché selon la plupart des critères. Le cabinet de recherche Technavio prévoit que le marché des jeux massivement multijoueurs en ligne (MMO) connaîtra une croissance de près de 30 milliards de dollars entre 2025 et 2029, par exemple. D’autres analystes anticipent une croissance similaire sur les cinq prochaines années environ.
Hathora souhaitait lancer et faire évoluer sa plateforme rapidement, elle a donc suivi une stratégie aujourd’hui courante pour de nombreuses startups, petites équipes et autres entreprises : tout miser sur le cloud en exploitant Amazon Web Services avec EKS, le service Kubernetes entièrement géré du géant du cloud. Les ambitions de la société semblaient sans limite : Hathora voulait servir des développeurs de jeux de toutes tailles, des plus petites équipes aux plus grands studios, et tous les profils intermédiaires.
Et cela a fonctionné — jusqu’à un certain point. Plus de 100 studios de jeux ont adopté la plateforme Hathora au cours des six premiers mois suivant son lancement initial. Ce succès précoce a mis en lumière un problème fondamental par rapport à l’objectif d’Hathora : servir des studios de jeux de toutes tailles et partout dans le monde. Lorsqu’ils ont commencé à collaborer avec des studios de plus en plus importants, l’économie de leur infrastructure exclusivement cloud est vite devenue intenable — au point où ils risquaient de passer à côté d’un large segment rentable du marché global.
Dans cette étude de cas, nous examinerons de près comment le CTO d’Hathora et son équipe ont transformé leur stratégie initiale, tant sur le plan commercial que technologique, avec des résultats potentiellement radicaux — ainsi que des enseignements utiles pour d’autres dirigeants technologiques, quel que soit leur secteur.
L’entreprise & le CTO
Entreprise : Hathora, fournisseur mondial d’infrastructure critique et d’orchestration de serveurs pour les studios de jeux vidéo souhaitant héberger leurs jeux multijoueurs en ligne.
Le CTO : Harsh Pandey, également fondateur de l’entreprise :
« Nous avons créé Hathora pour que les studios de jeux, quelle que soit leur taille, aient accès à une infrastructure à l’échelle mondiale sans avoir à la construire eux-mêmes. Mais en commençant à évaluer les coûts pour des studios de grande taille, l’économie ne tenait pas. Les coûts du cloud, en particulier la sortie de données, rendaient notre offre intenable précisément pour le type de clients que nous voulions cibler. »
Siège social : New York
Implantation clients : Aujourd’hui, Hathora sert (littéralement) des clients du monde entier depuis 14 régions, réparties sur six continents.
Le problème métier
De grandes ambitions riment souvent avec de grands défis, et c’est exactement ce qu’ont rencontré Harsh et Hathora.
Une partie de cela réside dans la nature même de l’industrie du jeu vidéo : les jeux MMO ne sont pas des commerces de quartier au trafic prévisible. Les jeux multijoueurs doivent fournir des mises à jour constantes, à chaque joueur connecté, et ce de manière ultra-performante.
Cela représente une quantité massive de données circulant en permanence entre l’infrastructure back-end et les joueurs, qui peuvent se compter en millions pour les plus grands jeux. Et si vous pensez que vos clients sont exigeants, disons simplement que les joueurs passionnés ne sont pas du genre patient lorsqu’il s’agit de performances et d’expérience de jeu…
L’hébergement des serveurs de jeux depuis la plateforme exclusivement cloud d’Hathora convenait bien aux petits studios. Mais lorsqu’un studio de plus grande taille a sollicité l’entreprise sur les tarifs, Harsh et son équipe ont rapidement cerné les limites du modèle économique.
« Nous avons réalisé qu’un problème se posait lorsqu’un grand studio de jeux utilisant notre plateforme d’hébergement de serveurs de jeux pour ses playtests internes nous a interrogés sur les tarifs pour le lancement, » nous confie Harsh. « Leur facture estimée de bande passante dépassait un million de dollars par mois. »
C’était quatre fois le coût de calcul normalement attendu pour exécuter le jeu, d’après Harsh. Ni pour le studio, ni pour Hathora ce n’était viable. Le choix était simple : continuer avec la stratégie initiale tout-cloud au risque de perdre la cible des grands studios, ou changer de cap.
« Le problème à résoudre, c’était juste le prix, tout simplement, » explique Harsh.
La solution, en revanche, était technique : Hathora devait transformer sa propre infrastructure pour mieux répondre aux exigences uniques des charges de serveurs de jeux, tout en adoptant un modèle tarifaire facilement accessible aux plus grands studios.
Ce qu’ils ont fait et pourquoi
Les professionnels de la tech de tous horizons ont entendu bon nombre d’arguments en faveur des bénéfices de la migration de l’infrastructure et des charges de travail vers le cloud, ou tout simplement du lancement d’une activité entièrement basée dans le cloud. Il s’agit d’une tendance majeure depuis des années, et Hathora n’a pas fait exception.
Hathora a fait presque le chemin inverse pour résoudre son problème avec les grands clients, adoptant une architecture cloud hybride et misant finalement sur une vieille valeur sûre : les serveurs bare metal.
(Découvrez notre article sur cette tendance plus récente du retour des environnements cloud vers des infrastructures sur site.)
Harsh revient sur l’évolution de l’entreprise :
« Nous sommes passés à un modèle hybride et nous avons suivi le coût de l’infrastructure par session concurrente, la latence dans les différentes régions du monde et l’effort d’ingénierie nécessaire pour tout opérer. En transférant 80 % de nos charges de travail sur du bare metal, nous pouvons quasiment réduire de moitié nos coûts de calcul et faire baisser les coûts de bande passante de plus de 90 %. Nous gérons désormais plus de 30 000 cœurs sur 14 régions avec une équipe d’ingénieurs relativement réduite. Ce niveau d’efficacité et d’envergure aurait été impossible avec notre architecture d’origine. »
Ils continuent d’exploiter l’infrastructure cloud pour être flexibles et répondre aux pics de demande, ce qui représente environ 20 % des charges de travail (au lieu de 100 %). Mais la stack de Hathora repose désormais sur deux fournisseurs bare metal et les ressources cloud d’AWS et GCP, au lieu de tout laisser sur AWS. Harsh et son équipe ont choisi Talos Linux, une distribution minimaliste conçue spécifiquement pour les environnements Kubernetes, et Omni (également par Sidero Labs) pour l’orchestration depuis un plan de contrôle unique, sur l’ensemble de leurs environnements hybrides.
Inutile de préciser que cela n’a pas été aussi simple qu’allumer ou éteindre un interrupteur. De plus, il y avait des avantages et des inconvénients à analyser. Être 100 % cloud au départ a permis à Hathora de se lancer rapidement et avec succès. S’éloigner de ce modèle impliquait d’abandonner certains avantages du cloud, du moins dans un premier temps :
« Changer signifiait renoncer à bon nombre des facilités offertes par les plateformes cloud », explique Harsh. « Nous allions perdre l’autoscaling facile, la surveillance intégrée et les services managés. Cela ajoutait une complexité opérationnelle. Nous devions prouver que nous pouvions égaler ou dépasser les performances du cloud. Rien ne garantissait que nous trouverions les bons fournisseurs ou outils qui fonctionneraient selon nos besoins. Mais selon nous, il était essentiel pour notre modèle économique de mieux contrôler les coûts et les performances, et nous étions prêts à prendre ce risque. »
Ce pari commence à rapporter, ouvrant la voie à la prochaine étape de la croissance de Hathora : l’entreprise dessert désormais des clients sur six continents. Elle peut fournir la même infrastructure critique aux plus grands studios à un coût bien plus bas qu’avant. Elle offre également un contrôle plus poussé sur les exigences spécifiques aux workloads du jeu, grâce à un contrôle au niveau des nœuds via Talos Linux et une orchestration cluster unifiée avec Omni, quel que soit l’emplacement des charges de travail.
« Ces outils sont minimalistes, sûrs, et faciles à utiliser sur différents types d’infrastructure », déclare Harsh. « Nous avons évalué notre stack sur la base de la performance, du coût, et de la quantité de contrôle que nous allions garder. La nouvelle configuration nous permet de fonctionner avec une petite équipe et de nous développer mondialement sans dépendre d’un fournisseur en particulier. »
En effet, la petite taille de l’équipe d’ingénierie de Hathora est devenue une sorte d’indicateur clé. Ils ont rapidement mesuré des gains en performance et en coûts après la migration de leur première région complète vers le modèle hybride, puis ont accéléré leur déploiement (gérant désormais 14 régions dans le monde).
« À chaque fois que quelqu’un découvre que notre infrastructure est gérée par seulement quelques ingénieurs, cela confirme le chemin parcouru. »
Points clés et enseignements tirés
Vous n’avez pas besoin d’évoluer dans l’industrie de l’infrastructure numérique ou du jeu vidéo pour appliquer des principes et leçons similaires dans votre propre entreprise.
- Écoutez vos clients : Harsh et son équipe ont pris conscience du problème – et de la nécessité d’agir pour le résoudre – en écoutant leurs clients, notamment le grand studio qui utilisait Hathora pour des tests internes et a ensuite demandé une estimation du coût pour y faire tourner le jeu en production. Les CTO ont autant la responsabilité de résoudre les problèmes de leurs clients que de bâtir des solutions techniques – les deux sont indissociables.
- N’ayez pas peur de pivoter. « Cloud first », « cloud native » et autres formules similaires doivent être vues comme des stratégies adaptables, pas comme des dogmes immuables. Ce principe est universel : démarrer avec une stratégie particulière n’oblige pas à la conserver pour toujours. Hathora aurait pu ne rien changer et rester totalement dans le cloud, mais cela aurait limité son potentiel de croissance, et à terme, la performance des jeux fonctionnant sur son infrastructure.
Adopter un modèle hybride a permis à l’entreprise de servir des clients de toutes tailles et d’améliorer ses performances grâce à une flexibilité et un contrôle accrus pour répondre aux exigences spécifiques des charges de travail liées aux jeux. Hathora a ainsi pu lancer une offre destinée aux grandes entreprises, offrant aux plus grands studios une tarification prévisible et de solides garanties de performance.
- Analysez avec rigueur. Un tel changement ne peut pas être réalisé à l’aveugle. Harsh et son équipe ont mené un véritable test de faisabilité avec Talos et Omni pour mettre leur changement stratégique à l’épreuve :
« Après avoir validé que nous pouvions orchestrer tout via un seul système, nous avons migré notre première région complète. Les gains de performance ont été immédiats. À partir de là, nous avons déployé le modèle à l’échelle mondiale, en ajoutant des fournisseurs et des emplacements au fur et à mesure, » a déclaré Harsh.
L’équipe a analysé les avantages et inconvénients – notamment la perte initiale des bénéfices du cloud qu’Harsh avait évoqués plus haut – afin d’éviter toute mauvaise surprise. Il leur fallait une solution compatible avec Kubernetes pouvant orchestrer l’ensemble dans différents environnements et régions, et qui soit capable de traiter chaque machine de façon identique qu’elle soit sur du bare metal ou dans un cloud.
Harsh a également mentionné qu’ils ont mené une analyse approfondie des fournisseurs, en comparant les processeurs AMD et Intel, en testant les performances réseaux en conditions réelles, et en évaluant le niveau de performance des fournisseurs par rapport à Global Accelerator d’AWS.
« Nous avons veillé à ce que notre nouvelle configuration ne soit pas seulement moins coûteuse, mais aussi plus rapide et plus fiable dans les régions qui comptaient. »
- Pensez sur le long terme : Des changements de cap aussi profonds ne servent pas seulement à régler un problème ponctuel. S’ils sont bien réalisés, ils ouvrent de plus en plus d’opportunités à l’avenir. Cette vision à long terme porte déjà ses fruits pour Hathora. L’équipe continue de développer de nouvelles fonctionnalités pour les grands studios, telles que des options de clusters dédiés, le peering régional pour des transferts à faible latence et une meilleure observabilité lors des événements en direct.
Harsh a également indiqué que le nouveau modèle d’infrastructure de Hathora pour le jeu vidéo montre un potentiel de valeur dans d’autres secteurs nécessitant une réactivité en temps réel et un haut débit, et que la stratégie long terme de l’entreprise est de proposer de nouvelles solutions pour les développeurs en dehors de l’industrie du jeu.
« Passer à un modèle hybride nous a donné de la flexibilité à long terme. Nous pouvons désormais entrer rapidement sur de nouveaux marchés, tester de nouveaux fournisseurs de matériel sans être verrouillés, et offrir à nos clients un meilleur contrôle sur le déploiement de leur infrastructure. La plateforme est devenue bien plus modulaire et adaptable. »
Pour plus d’études de cas et de guides pratiques, abonnez-vous à la newsletter de The CTO Club.
