Autoskalierung
Autoscaling ist die Fähigkeit eines Systems, sich automatisch anzupassen, in der Regel in Bezug auf die Rechenleistung. Bei einem Autoscaling-System werden die Ressourcen automatisch hinzugefügt, wenn sie benötigt werden, und können so den schwankenden Anforderungen der Nutzer angepasst werden. Die Autoscaling-Prozesse sind unterschiedlich und lassen sich an verschiedene Metriken anpassen, z. B. an den Arbeitsspeicher oder die Prozesszeit. Managed Cloud Services sind in der Regel mit Autoscaling-Funktionen verbunden, da es mehr Optionen und Implementierungen gibt als bei den meisten On-Premise-Implementierungen.
Früher wurden die Infrastruktur und die Anwendungen so konzipiert, dass die Spitzenauslastung des Systems berücksichtigt wurde. Diese Architektur bedeutete, dass mehr Ressourcen nicht ausgelastet waren und unelastisch auf die sich ändernde Nachfrage reagierten. Diese Unflexibilität bedeutete höhere Kosten für das Unternehmen und Geschäftseinbußen durch Ausfälle aufgrund von Übernachfrage.
Durch die Nutzung der Cloud, die Virtualisierung und Containerisierung von Anwendungen und deren Abhängigkeiten können Unternehmen Anwendungen entwickeln, die sich an die Anforderungen der Nutzer anpassen. Sie können die Nachfrage nach Anwendungen überwachen und sie automatisch anpassen, um ein optimales Nutzererlebnis zu gewährleisten. Ein Beispiel dafür ist der Anstieg der Zuschauerzahlen, den Netflix jeden Freitagabend erlebt. Autoscaling bedeutet, dynamisch mehr Ressourcen hinzuzufügen: zum Beispiel die Anzahl der Server zu erhöhen, um mehr Videostreaming zu ermöglichen, und sie wieder anzupassen, sobald sich der Verbrauch normalisiert hat.