L'Auto Scaling sur AWS

L'Auto Scaling sur AWS
Photo by Eran Menashri / Unsplash

Dans cet article, nous allons parler d'Auto Scaling, ce que c'est et comment le mettre en place sur AWS.

Qu'es que l'Auto Scaling ?

L'auto-scaling est un mécanisme qui permet à un service cloud d'ajuster automatiquement la puissance de calcul (nombre de serveurs, ressources CPU/RAM, etc...) en fonction de la charge réelle, par exemple, augmenter les serveurs quand il y a beaucoup de visiteurs, puis les réduire quand la demande baisse. C'est comme avoir un élastique qui s'étire ou se contracte selon la pression, sans intervention humaine.

Pourquoi mettre un place un auto-scaling ?

L'auto-scaling sur AWS permet d'ajuster automatiquement les ressources (comme les instances EC2 dans notre cas) en fonction de la charge réelle, afin d'optimiser les performances et les coûts. Cela évite les surcoûts liés à une surprovision de ressources inutilisées, tout en garantissant la disponibilité et la réactivité de l'application pendant les pics de trafic.

C'est particulièrement utile pour :

  • Gérer les variation de trafic (ex. : pics saisonniers, campagnes marketing).
  • Maintenir la disponibilité et la performance sans intervention manuelle.
  • Réduire les coûts en ne payant que pour les ressources réellement utilisées.

Prérequis :

Créer un groupe d'auto scaling EC2

Pour cela, nous allons allez dans "Groupe Auto Scaling"

Nous allons maintenant créer notre groupe Auto Scaling

Donner un nom et sélectionner votre model d'instance à déployer

Sélectionner le ou les zones que vous souhaitez et le type de Scaling que vous souhaitez

Vous pouvez choisir d'inclure cela dans un load balancer si vous en possédez un (dans mon cas il n'y en a pas)

Maintenant, nous allons choisir la taille et les paramètres de notre Auto Scaling, il faut veiller à ne pas demander une trop grande capacité mal afin de limiter les coûts, tout en choisissant une qui assumera la charge que vous attendez de votre service.

Mon cas n'est qu'un exemple, j'ai donc choisi de n'avoir qu'une seul machine et en cas de pique d'utilisation, seul une 2nd machine sera provisionner.

J'ai aussi choisi la politique la plus coûteuse effective, dans une situation réelle où la disponibilité est la priorité, nous aurions choisi la 2nde option (Ex : un site marchant en période de soldes).

Vérifier que tout est bon, et voila ! Vous avez votre auto scaling.