AWS re:Cap (Semaine 2)

AWS re:Cap (Semaine 2)

Comme la semaine passée, je vous propose un billet récapitulatif des annonces que j’ai retenues du re:Invent sur cette seconde semaine.

Vous pouvez retrouver la première semaine ici :

AWS re:Cap (Semaine 1)
Cette année, j’ai décidé de vous faire un billet chaque semaine avec lesannonces que j’ai retenu du Re:Invent. Ce billet est purement subjectif, ce que j’ai retenu n’est pas forcément le plusimportant, mais plutôt les informations que j’ai jugé pertinentes. En complément de ce billet, vous pouve…

Une fois de plus, ces annonces sont sélectionnées de manière complètement arbitraire, et ne sont pas forcément les plus intéressantes pour tout le monde.

Cette seconde semaine était très teintée big data, comme nous allons le voir de suite.

Big data

  • Tout d’abord parlons de l’annonce qui personnellement m’inquiète, notamment avec l’affaire du health data hub en France, AWS a annoncé la disponibilité d’AWS HealthLake, une plateforme pour stocker et analyser les données de santé en masse. Bien qu’il soit pertinent d’offrir une offre managée, sécurisée concernant ces données, j’ai peur que cela pousse encore plus vers AWS, sans aucune alternative. (Lien)
  • Lake Formation se voit aussi ajouté de nouvelles fonctionnalités : Gestion des autorisations en mode colonne et transactions ACID en preview (Lien)
  • QuickSight, service managé similaire à Tableau Software (en plus léger), est maintenant compatible avec ElasticSearch en tant que backend, ouvrant de nouvelles possibilités (Lien)

EMR

Les EMR ne sont pas en reste non plus :

  • Il est maintenant possible d’exploiter EKS pour faire fonctionner les jobs EMR, simplifiant de fait le déploiement nécessaire à chaque lancement, et accélérant les lancements des traitements (Lien)
  • AWS a aussi annoncé la disponibilité d’un nouvel IDE pour les EMR, EMR Studio, une solution intégrée permettant de faciliter le développement, la visualisation et le debug des applications pour EMR, avec la possibilité d’exploiter AWS SSO pour en gérer l’accès (Lien)

SageMaker

Sans doute le service le plus gâté la semaine passée, SageMaker et le service de machine learning d’AWS :

  • Il est maintenant possible de faire de l’entrainement distribué, permettant de faire plus facilement du deep learning avec des jeux de données complexes ou lourds, accélérant de fait l’apprentissage (Lien)
  • SageMaker est maintenant capable de gérer les modèles d’apprentissage sur des flottes IOT avec Sage Maker Edge Manager (Lien)
  • La factorisation accélère tout et AWS le sait ! C’est pourquoi il est maintenant possible de stocker des fonctionnalités que l’on réutilise via SageMaker Feature Store (Lien)
  • Si le machine learning est trop complexe, il est maintenant possible d’utiliser SageMaker Jumpstart, un service visant à fournir des socles tout prêts pour faciliter l’adoption du machine learning (Lien)
  • Le CI/CD et le machine learning sont maintenant possibles ! Avec SageMaker Pipelines, il est maintenant possible de construire, piloter, automatiser et mettre à l’échelle les traitements SageMaker et ainsi apporter de l’orchestration dans l’apprentissage (Lien)
  • L’apprentissage n’est pas forcément un traitement demandant une charge de travail constante. C’est pourquoi il est maintenant possible de monitorer en temps réels l’usage des ressources SageMaker pour pouvoir réallouer le juste nécessaire (Lien)

EC2/RDS/Container

Si la Big Data était à l’honneur, les autres services ne sont pas pour autant sur la touche.

EC2

  • Disponibilité de nouvelles instances GPU, les g4ad, propulsées par des AMD Radeon Pro V520, avec des processeurs AMD EPYC. Offrant un rapport prix/performance environ 45 % supérieur à la génération précédente. (Lien)
  • Le monitoring est le point faible d’AWS, et il semble que ce re:Invent ajoute pas mal d’outils en ce sens, c’est dans ce contexte qu’arrive les nouvelles métriques liées à l’utilisation réseau sur les EC2 (Lien)
  • J’attendais cette fonctionnalité depuis des années, il est (enfin) possible de faire un simili traceroute sur AWS pour analyser les éventuels points de blocage (Lien)

RDS

  • Nouvelle génération d’instances pour RDS, basées sur les processeurs AWS, Graviton. Les performances annoncées sont assez colossales (7 fois plus de performance, 4 fois plus de cœur, 2 fois plus de cache par cœur, mémoire 5 fois plus rapide, performance sur les calculs à virgule flottante 2 fois plus rapide) (Lien)

ECR

  • En plus des annonces de la semaine passée sur ECR, il est maintenant possible de faire de la réplication interrégionale sur ECR, permettant de servir toujours l’image au plus proche du consommateur. (Lien)

En conclusion

Cette nouvelle semaine a une fois de plus été intense pour suivre tous ces changements et annonces. De par le volume d’annonce, AWS affirme une fois de plus sa position de leader dans le domaine du cloud public.

Pour ma part, j’espère encore (naïvement) des annonces concernant l’IAM cette semaine.

Et vous que pensez-vous des annonces jusque là ?