Het huidige snapshotsysteem is voor 95% van de mensen niet of nauwelijks bruikbaar.
Maken/terugzetten te traag: https://www.transip.nl/knowledgebase/idee/2019-waarschuwingen-toevoegen-maken-snapshot-wanneer/
Geen voortgang getoond: https://www.transip.nl/knowledgebase/idee/2043-snapshot-voortgang/
- Het CP blokkeert: https://www.transip.nl/knowledgebase/idee/1755-snapshot-maken-maken-belangrijke-acties-blokkeren/
Zodra je VPS groter is dan een X1 (50gb), dan duurt het maken van een snapshot zo lang dat het onbruikbaar is. Bij een grote VPS heb ik bijgehouden hoe lang het duurde, en kwam uit op een snelheid van 80mb/s.
De kleinste VPS is 50gb, maar veel zullen 150gb of 300gb hebben:
- 50gb = 10min
- 150gb = 32min
- 300gb = 1 uur
Stel dat je je server wilt upgraden, dan is dit de meest gebruikte workflow:
- firewall aan (1 min)
- server shutdown (1 min)
- snapshot maken (1 uur)
- software upgraden (10 min)
- testen (5 min)
- bij issue, snapshot terugzetten (1 uur)
- firewall uit (1 min)
Een relatieve kleine update (10min) zorgt voor een downtime van tussen de 1 en 2 uur. (afhankelijk of je wel of geen rollback doet)
De huidige flow is als volgt:
- Gebruiker drukt op knop
- CP vergrendelt en snapshot wordt gemaakt
- Nadat snapshot gemaakt is wordt de volledige snapshot gekopieerd naar een schijf op een andere locatie (dit zorgt voor de vertraging)
- Zodra het kopiëren klaar is wordt het CP weer ontgrendeld.
Mijn voorstel is om stap 3 optioneel te maken, of als laatste uit te voeren. Nieuwe flow is dan als volgt:
- Druk op knop
Snapshot wordt gemaakt (instant)
- Snapshot wordt na 8u pas gekopieerd naar de externe locatie of
- Snapshot wordt nooit gekopieerd / automatisch weggegooid na 8u
Omdat bij het terugzetten de snapshot nog lokaal staat, zal het terugzetten ook instant zijn. De gebruiker kan hier gewoon op wachten als hij op de knop drukt. Er hoeft geen voortgang getoond te worden. Het CP hoeft niet te vergrendelen.
Goed idee?
@Matthijs van Beek, Toevallig nu bezig, bij mij duurt het nu al bijna 3 kwartier, voor een snapshot van een 300 GB schijf met 93 GB aan data. Draait alleen iets van een webserver met heel weinig bezoek op de server.
Vroeger ging dit echt een stuk sneller, altijd op draaiende servers gedaan, nooit op offline servers geprobeerd.