Skip to main content
Key Takeaways

Grandes ambiciones frente a realidades de la nube: Hathora buscó un rápido crecimiento apoyándose en la infraestructura de nube, alojando en AWS con Kubernetes y atendiendo a desarrolladores de juegos desde pequeños equipos hasta grandes estudios.

Mercado MMO: Un sector de miles de millones de dólares: Se proyecta que el mercado de juegos MMO crecerá en casi 30 mil millones de dólares para 2029, presentando vastas oportunidades y retos serios de infraestructura para empresas como Hathora.

Éxito y presión: Demasiado, demasiado rápido: La plataforma de Hathora fue adoptada rápidamente por más de 100 estudios, pero las demandas de clientes grandes dejaron al descubierto las limitaciones y altos costos de su enfoque solo en la nube.

Revisando la estrategia: Aprender por las malas: Al darse cuenta de las carencias de su infraestructura, el equipo de Hathora reevaluó su plan de negocio para encontrar formas sostenibles de apoyar y beneficiarse de grandes estudios de juegos.

Lecciones para líderes tecnológicos: Adaptarse a escala: La experiencia de Hathora sirve de lección para líderes tecnológicos sobre la importancia de la escalabilidad de la infraestructura y la necesidad de equilibrar los costos de la nube con las estrategias de crecimiento.

A veces, la misma infraestructura que te ayuda a lograr un lanzamiento exitoso termina convirtiéndose en un obstáculo a medida que tu negocio despega a gran velocidad.

En el caso de Hathora, esto fue literalmente cierto y un poco irónico: la empresa se dedica a proporcionar infraestructura crítica y orquestación de servidores para que estudios de videojuegos puedan alojar y escalar sus juegos multijugador en línea.

Es un mercado enorme por casi cualquier medida. La firma de investigación Technavio proyectó que el mercado de juegos multijugador masivos en línea (MMO) crecerá casi 30 mil millones de dólares entre 2025 y 2029, por ejemplo. Otros analistas proyectan un crecimiento similar en los próximos cinco años aproximadamente.

Want more from The CTO Club?

Create a free account to finish this piece and join a community of CTOs and engineering leaders sharing real-world frameworks, tools, and insights for designing, deploying, and scaling AI-driven technology.

Este campo es un campo de validación y debe quedar sin cambios.
Name*

Hathora quería lanzar y escalar su plataforma rápidamente, así que siguió lo que se ha convertido en una estrategia común para muchas startups, equipos pequeños y otros negocios: apostó todo por la nube, ejecutando todo en Amazon Web Services con EKS, el servicio Kubernetes completamente gestionado del gigante de la nube. Sus ambiciones parecían no tener límites: Hathora quería atender a desarrolladores de juegos de todos los tamaños, desde los equipos más pequeños hasta los estudios más grandes y todos los que están en el medio.

Y funcionó – hasta cierto punto. Más de 100 estudios de desarrollo de juegos adoptaron la plataforma de Hathora en los seis meses siguientes a su lanzamiento inicial. Ese éxito inicial reveló un problema fundamental dado el objetivo de Hathora de servir a estudios de juegos de todos los tamaños y de todo el mundo: cuando empezaron a trabajar con estudios cada vez más grandes, la economía de su infraestructura solo en la nube rápidamente se volvió insostenible – tanto así que arriesgaban perderse un segmento grande y lucrativo del mercado general.

En este caso práctico, veremos de primera mano cómo el CTO y el equipo de Hathora transformaron su estrategia inicial de negocio y tecnología con resultados potencialmente dramáticos – además de algunas lecciones aprendidas para otros líderes tecnológicos en cualquier industria.

La empresa y el CTO

Empresa: Hathora, un proveedor global de infraestructura crítica y orquestación de servidores para que estudios de videojuegos puedan alojar sus juegos multijugador en línea.

El CTO: Harsh Pandey, quien también es el fundador de la empresa:

“Construimos Hathora para dar a los estudios de juegos de todos los tamaños acceso a infraestructura a escala global sin que tuvieran que construirla ellos mismos. Pero cuando empezamos a calcular precios para estudios más grandes, la economía no funcionaba. Los costos de la nube, especialmente la salida de datos, hacían nuestra oferta insostenible precisamente para el tipo de clientes que queríamos atender.”

Sede: Ciudad de Nueva York

Alcance de clientes: Actualmente, Hathora atiende (literalmente) a clientes en todo el mundo desde 14 regiones globales distribuidas en seis continentes.

El problema empresarial

Las grandes ambiciones suelen traer grandes retos, y ese fue precisamente el caso de Harsh y Hathora.

Parte de eso es fundamental por la naturaleza de la industria de los videojuegos: los juegos MMO no son pequeños comercios familiares con patrones de tráfico predecibles. En cambio, los juegos multijugador deben entregar actualizaciones constantes a cada jugador conectado de manera simultánea y con alto rendimiento.

Eso significa enormes cantidades de datos moviéndose regularmente entre la infraestructura de back-end y los jugadores individuales, que pueden ser millones en los juegos más grandes. Y si crees que tus clientes son exigentes, digamos que los gamers serios no suelen ser un público muy paciente cuando se trata del rendimiento y la experiencia del juego.

Ejecutar cargas de trabajo de servidores de juegos desde la plataforma solo en la nube de Hathora funcionaba bien para estudios pequeños. Pero cuando un estudio más grande se acercó a la empresa para preguntar por los precios, Harsh y su equipo se dieron cuenta de las limitaciones de su modelo financiero.

“Supimos que teníamos un reto que afrontar cuando un gran estudio de juegos que usaba nuestra plataforma de alojamiento de servidores de juego para pruebas internas nos preguntó sobre el precio para el lanzamiento,” nos contó Harsh. “Su factura proyectada de ancho de banda superaba el millón de dólares al mes.”

Eso era cuatro veces el costo normal esperado de cómputo para ejecutar el juego, según Harsh. Eso no era sostenible ni para el estudio ni para Hathora. Eso puso a Hathora en una encrucijada: seguir con su estrategia original solo en la nube y arriesgarse a perder el segmento de grandes estudios, o hacer un cambio.

“El problema a resolver era el precio, simple y llanamente,” dice Harsh.

La solución, sin embargo, fue técnica: Hathora necesitaba transformar su propia infraestructura para adaptarse mejor a las demandas únicas de las cargas de trabajo de servidores de juego, y, al mismo tiempo, adoptar un modelo de precios que incluso los estudios más grandes pudieran utilizar con facilidad.

Qué hicieron y por qué

Los profesionales de la tecnología de todo tipo han escuchado infinidad de argumentos sobre los beneficios de migrar infraestructuras y cargas de trabajo a la nube, o simplemente de lanzar una empresa nativamente en la nube. Esa ha sido una gran tendencia por años, y Hathora no fue la excepción.

Hathora hizo prácticamente lo contrario para resolver su problema con grandes clientes, adoptando una arquitectura de nube híbrida y, finalmente, apostando en grande por un viejo conocido: servidores bare metal. 

(Consulte nuestro artículo sobre esta tendencia más reciente de migrar de entornos cloud hacia infraestructuras on-premise).

Harsh comparte sobre la evolución de la empresa:

“Nos cambiamos a un modelo híbrido y rastreamos el costo de infraestructura por sesión concurrente, el rendimiento de la latencia en las regiones globales y el esfuerzo de ingeniería necesario para operar todo. Al trasladar el 80% de nuestras cargas de trabajo a bare metal, podemos reducir los costos de cómputo casi a la mitad y disminuir los costos de ancho de banda en más de un 90%. Ahora gestionamos más de 30,000 núcleos en 14 regiones con un equipo de ingeniería relativamente pequeño. Ese nivel de eficiencia y alcance habría sido imposible con nuestra arquitectura original.”

Siguen aprovechando la infraestructura en la nube para la escalabilidad y los picos de demanda, lo que representa aproximadamente el 20% de las cargas de trabajo (en lugar del 100%). Pero ahora la pila de Hathora depende de dos proveedores de servidores bare metal y recursos cloud de AWS y GCP, en lugar de mantener todo en AWS. Harsh y su equipo optaron por Talos Linux, una distribución minimalista diseñada específicamente para entornos Kubernetes, y Omni (también de Sidero Labs) para la orquestación desde un único plano de control a través de sus entornos híbridos.

No hace falta decir que esto no fue tan simple como encender o apagar una luz. Además, hubo pros y contras a considerar. Apostar por la nube inicialmente ayudó a Hathora a lanzar rápidamente y con éxito. Alejarse de ese modelo significó renunciar a algunas de las ventajas que ofrece la nube, al menos al principio:

“Cambiar significaba renunciar a muchas de las comodidades que ofrecen las plataformas cloud”, dice Harsh. “Perderíamos el autoscaling fácil, la monitorización integrada y los servicios gestionados. Eso añadió complejidad operativa. También tuvimos que demostrar que podíamos igualar o superar el rendimiento cloud. No había garantía de que encontráramos proveedores o herramientas que funcionaran como necesitábamos. Pero creímos que controlar costes y rendimiento era esencial para nuestro modelo de negocio, y estuvimos dispuestos a tomar ese riesgo.”

La apuesta está dando frutos y pavimentando el camino para la siguiente etapa de crecimiento de Hathora: la empresa ahora atiende clientes en seis continentes. Puede entregar la misma infraestructura crítica a los estudios más grandes a un costo significativamente menor que antes. También ofrece un control más granular sobre los requisitos únicos de las cargas de trabajo de juegos (esto es un beneficio principal del software de gestión de requisitos), proporcionando control a nivel de nodo con Talos Linux y orquestación de clústeres unificada con Omni, independientemente de dónde se ejecuten las cargas de trabajo.

“Estas herramientas son minimalistas, seguras y fáciles de operar en diferentes tipos de infraestructura,” dice Harsh. “Evaluamos nuestra pila según el rendimiento, el coste y el nivel de control que mantendríamos. La nueva configuración nos permite operar con un equipo pequeño y escalar globalmente sin quedarnos atados a ningún proveedor.”

De hecho, el pequeño equipo de ingeniería de Hathora se ha convertido en una especie de KPI no oficial. Demostró mejoras inmediatas en rendimiento y coste después de migrar su primera región completa al modelo híbrido y posteriormente escaló rápidamente (actualmente opera en 14 regiones de todo el mundo).

“Cada vez que alguien se entera de que nuestra infraestructura es gestionada por solo unos pocos ingenieros, es un momento que refuerza hasta dónde hemos llegado.”

Ideas clave y lecciones aprendidas

No tienes que estar en los sectores de infraestructura digital o videojuegos para aplicar principios y enseñanzas similares en tu propio negocio.

  • Escucha a tus clientes: Harsh y el equipo se dieron cuenta de que tenían un problema – y que debían ser proactivos para solucionarlo – escuchando a sus clientes, en particular al gran estudio que había estado utilizando Hathora para pruebas internas y luego pidió estimaciones de costes si ejecutaban el juego real ahí. Los CTO tienen tanta responsabilidad en resolver los problemas de los clientes como en construir soluciones tecnológicas: ambas cosas van de la mano.
  • No tengas miedo de pivotar. “Cloud first”, “cloud native” y términos similares deben ser tratados como estrategias adaptables, no como dogmas sagrados. El mismo principio se aplica ampliamente: el hecho de que comiences con una estrategia en particular no significa que debas mantenerla para siempre. Hathora podría haberse quedado como estaba y permanecer completamente en la nube, pero hacerlo habría limitado su potencial de crecimiento y, en última instancia, el rendimiento de los juegos que se ejecutan en su infraestructura.

Pivotar a un modelo híbrido permitió a la empresa atender a clientes de todos los tamaños y mejorar el rendimiento gracias a una mayor flexibilidad y control al abordar los requisitos específicos de las cargas de trabajo de los juegos. Desde entonces, Hathora ha podido lanzar un nivel empresarial que ofrece a los estudios más grandes precios predecibles y sólidas garantías de rendimiento.

  • Sé diligente en tu análisis. Este tipo de transformación no se puede lograr mediante suposiciones. Harsh y su equipo realizaron una prueba de concepto completa con Talos y Omni para poner a prueba su cambio estratégico:

"Una vez que validamos que podíamos orquestar todo a través de un solo sistema, migramos nuestra primera región completa. Las mejoras de rendimiento fueron inmediatas. A partir de ahí, implementamos el modelo a nivel global, agregando proveedores y ubicaciones a medida que avanzábamos,” dijo Harsh.

Analizó los pros y los contras –incluida la pérdida inicial de los beneficios de la nube que Harsh mencionó anteriormente– para minimizar las sorpresas. Sabía que tenía que encontrar una solución compatible con Kubernetes que pudiera orquestar todo a través de múltiples entornos y regiones, y que en esencia tratara todas las máquinas por igual, ya funcionaran sobre bare metal o en la nube.

Harsh señaló que también profundizaron en la evaluación comparativa de proveedores, comparando CPUs AMD e Intel, probando el rendimiento de red en situaciones reales y evaluando a los proveedores según su desempeño frente al Global Accelerator de AWS. 

“Nos aseguramos de que nuestra nueva configuración no solo fuera más barata, sino también más rápida y fiable en las regiones que importaban.”

  • Juega a largo plazo: Los cambios de rumbo transformadores como este no se tratan solo de resolver problemas puntuales. Si se hacen bien, abren cada vez más posibilidades de cara al futuro. El enfoque a largo plazo ya está dando frutos para Hathora. Siguen desarrollando nuevas funciones para estudios grandes, como opciones de clústeres dedicados, interconexión regional para traspasos de baja latencia y una mayor observabilidad durante eventos en vivo.

Harsh también comentó que el nuevo modelo de infraestructura de Hathora para juegos está mostrando valor potencial en otras industrias que requieren respuesta en tiempo real y alto rendimiento, y el objetivo a largo plazo de la empresa es desarrollar nuevas soluciones para desarrolladores fuera de la industria de videojuegos.

“La transición a un modelo híbrido nos dio flexibilidad a largo plazo. Ahora podemos ingresar rápidamente en nuevas regiones, probar nuevos proveedores de hardware sin ataduras y dar más control a los clientes sobre cómo se implementa su infraestructura. La plataforma se ha vuelto mucho más modular y adaptable.”

Para más estudios de caso y guías prácticas, suscríbete al boletín de The CTO Club.