Berichten met de tag ‘high availability’

High Availability betaalbaar: dure SAN overbodig

30 november 2010 door Dick Tump

Bij veel oplossingen voor high available virtualisatie, is het nog steeds nodig om een shared storage te hebben. Dat is heel mooi als het budget er ook naar is, maar voor een bedrijf dat gewoon een cluster wil hebben van misschien twee of drie kleine nodes, is dat eigenlijk overbodig. Want om het 100% betrouwbaar te hebben, moet je shared storage natuurlijk ook enige redundantie te hebben.

Alternatief binnen de virtualisatiepakketten is natuurlijk het opslaan van de virtuele instanties op de schijven van nodes zelf. Bij een aantal pakketten is het wel mogelijk om de data te verplaatsen, soms zelfs live. Maar dat maakt het cluster weer niet high available, omdat je bij uitval van die node, de data van die instantie nergens anders hebt staan.

Netwerk RAID 1: onze oplossing voor betaalbare high available virtualisatieOnze oplossing daarbij is eigenlijk simpel, maar doeltreffend: het gebruik van RAID 1 (mirroring), maar dan over het netwerk. Voor elke virtuele instantie kies je een primaire node en een secundaire node. Op de primaire node gaat de instantie draaien en de secundaire node bevat een exacte kopie van de data. Als de virtuele instantie data wegschrijft, wordt dat tegelijkertijd naar beide nodes weggeschreven. Mocht de primaire node uitvallen, dan kan de virtuele instantie direct worden opgestart op de secundaire node. En in geval van bijvoorbeeld onderhoud aan de primaire node, kan van te voren een live migration worden gedaan, waardoor er niet eens downtime is.

Er is dus geen dure SAN meer nodig en daarmee is deze oplossing perfect voor bedrijven die een betaalbaar cluster nodig hebben. Uitbreiding is altijd mogelijk, want er is geen limiet aan het aantal nodes. In theorie is het dus mogelijk om een cluster van 100 nodes hiermee te voorzien. En het is geen probleem om later alsnog een SAN toe te voegen aan het cluster, mocht het cluster toch groeien. Gecombineerd gebruik van de netwerk RAID 1 functionaliteiten en een SAN is daarbij geen probleem, dus zowel de SAN als de schijven van de nodes zelf kunnen dan efficient worden gebruikt.

Een kort overzicht van de belangrijkste mogelijkheden:

  • Gecombineerd cluster, dus tegelijkertijd gebruik van SAN en netwerk RAID 1 (mirroring) voor optimaal gebruik van beschikbare resources
  • Live migration (verplaatsen zonder downtime) van instanties naar de secundaire node
  • Zonder downtime een andere secundaire node kiezen voor een instantie
  • (Automatische) Failover naar de secundaire node, bijvoorbeeld bij uitval van de primaire node
  • Schaalbaar: starten met minimaal twee nodes en onbeperkt uitbreidbaar

De software is al beschikbaar voor iedereen die een clusteroplossing bij ons afneemt. Dus heeft u interesse, neem dan gerust contact met ons op om de mogelijkheden door te spreken. Overigens komt de software waarschijnlijk ook beschikbaar als los pakket, dus houd onze weblog in de gaten.

Virtualisatie: nu in een nieuwe verpakking

17 februari 2010 door Dick Tump

Stilstand is achteruitgang. Onder dat motto blijven we altijd weer ontwikkelen. Soms betekent dat vervanging van apparatuur, zoals de overstap naar Cisco apparatuur, maar soms is er ook op software niveau verbetering mogelijk. Zoals in dit geval het opnieuw uitvinden van virtualisatie.

We zijn enkele jaren geleden begonnen met virtualisatie op basis van Xen. Uiteraard hebben wij dit uitvoerig getest en we hebben de clusters op basis van Xen dan ook al een flinke tijd stabiel draaien. Waar klanten (gelukkig) niks van merken, is de beheerkant. Voor dit beheer zijn we momenteel deels afhankelijk van third-party tools. Na een tijdje kom je dan toch altijd kleine dingen tegen. Het betreft open source software, dus het is zelf aan te passen. Maar dat is weer lastiger met updates van de ontwikkelaars van de software. Je kunt ook losse dingen eromheen schrijven, maar dat komt het functioneren vaak ook niet ten goede.

Eind vorig jaar besloten we dat het tijd werd om alles opnieuw te bekijken. Na veel testen, is de keus gevallen op de virtualisatietechniek KVM en het ontwikkelen van eigen clustersoftware. Eigen software is makkelijker te combineren met bijvoorbeeld onze eigen beheer- & administratie-software en krijgen we daarnaast nog meer diepgaande invloed op onze clusters, wat weer handig is bij eventuele storingen.

Maar waarom geen Xen meer? Hiervoor waren eigenlijk meerdere redenen. Belangrijk was vooral dat Xen voornamelijk voor de, inmiddels verouderde, 2.6.18 kernel wordt ontwikkeld. Hierdoor missen vaak kernel modules voor de wat nieuwere hardware. De ontwikkeling van KVM lijkt wat actiever te zijn en meerdere Linux distributies hebben Xen ook de deur uitgedaan en vervangen door KVM. In Linux Debian Lenny zit wel een Xen kernel op basis van 2.6.26, maar we hebben tijdens onze testen deze niet volledig stabiel gekregen.

Verder hebben we met Xen ook andere kleine probleempjes. Zo gaat bijvoorbeeld een live migration (dus zonder downtime een virtueel systeem naar een ander fysiek systeem verplaatsen) niet altijd helemaal goed. KVM is op dit punt toch wel heel wat beter. Ook blijkt KVM iets betere performance te leveren dan onze huidige Xen opstelling.

Het grootste deel van deze ‘problemen’ is overigens niet aanwezig bij Citrix XenServer. Hierbij hebben we bijvoorbeeld zeer positieve ervaringen met live migration, op voorwaarde dat de software voor gastsystemen van Citrix geïnstalleerd is. Citrix XenServer heeft alleen weer als nadeel dat het wat minder open is en hierdoor veel meer afhankelijk bent van Citrix. Als oplossing voor onze klanten die zelf virtualisatie willen, is dat vaak geen probleem.

Het ontwikkelen van ons nieuwe cluster en bijbehorende clustersoftware heel wat manuren gekost.  Zo zijn onder andere het beheer van instellingen, toevoegen van virtuele systemen, ervoor zorgen dat er geen dubbele MAC adressen ontstaan in het netwerk, virtuele servers live migreren, de harddisks van een systeem kunnen vergroten en regelmatige automatische controles of alles nog wel correct draait,  enkele van de vele belangrijke beheer functies die onze clustersoftware moesten komen.  Ook klanten moesten meer controle krijgen over hun virtuele server, waaronder bijvoorbeeld het zelfstandig kunnen herstarten of via de console overnemen van een virtuele server zijn onderdelen die binnen ons klantensysteem ‘my.shockmedia.nl’ beschikbaar moesten komen.

Na veel ontwikkeling en testen is dan inmiddels ons nieuwe cluster, op basis van KVM en onze eigen clustersoftware, live gegaan. Nieuwe Virtuele Servers leveren wij dan ook per direct op vanuit ons nieuwe cluster.

Betrouwbare storage met Open-E

22 juli 2009 door Dick Tump

Het is natuurlijk niet voor niks dat wij gecertificeerd Open-E partner zijn geworden. Wij beschouwen Open-E als een van de betere storage solutions op dit moment, zeker als shared storage binnen een virtualisatiecluster met Xen of VMware. Toch een gedurfde uitspraak, binnen een wereld waarbij veelal wordt gekozen voor prijzige oplossingen van merken als Equallogic.

iSCSI failover: uitval van een SAN is geen uitval van de storage
Een van de interessantere mogelijkheden van Open-E is wel iSCSI failover, waardoor uitval van een van de SANs niet een uitval van de storage betekent. Open-E weet binnen een seconde over te schakelen op het andere systeem, waardoor een hapering eigenlijk niet eens merkbaar is. Alle virtuele instances die op de storage hun data opslaan, blijven dus gewoon zonder problemen werken.

Betaalbaarder, maar ook beter
Een Open-E oplossing is een zeer goed betaalbare oplossing. Zo betaalbaar zelfs, dat licenties en hardware meegerekend, je in plaats van (de gebruikelijke oplossing) één enkele prijzige SAN, twee op Open-E gebaseerde SANs neer kunt zetten. Alle hardware kan altijd kapot, welk merk dan ook, maar het belangrijkst is om bij uitval toch zo min mogelijk problemen te hebben. Daarvoor kan wel een SLA worden afgesloten waarbij binnen 4 uur de SAN weer gerepareerd is door de leverancier, maar dan liggen wel alle servers er 4 uur lang uit. En een dergelijke SLA is vaak ook nog eens een behoorlijke periodieke kostenpost, naast dat 4 uur downtime natuurlijk niet is te verkopen aan klanten.

Ook de door Open-E geleverde performance is zeer goed. Door gebruik te maken van meerdere gigabit uplinks, is een zeer hoge data throughput haalbaar. In de server zelf wordt dan een goede hardware RAID controller geplaatst met zeer snelle schijven. Zo is met een SATA RAID 5 bestaande uit 4 schijven een snelheid van boven de 300 megabyte per seconde prima haalbaar. En voor de I/O intensieve applicaties is een SAS RAID 5 tegenwoordig ook goed betaalbaar.

Onze oplossing: high availability op maar 4 servers
Wij kunnen klanten dankzij Open-E en VMware of Citrix XenServer al een high availability oplossing bieden vanaf 4 ‘gewone’ dedicated servers. Op 2 servers draait de SAN met iSCSI failover en op 2 andere servers draait VMware of Citrix XenServer met automatische failover. Naast dat we hiermee een zeer stabiele oplossing bieden, is uitbreiding in de toekomst ook eenvoudig mogelijk, door bijvoorbeeld een extra fysieke server te plaatsen waar weer VMware of Xen instances op komen te draaien. En het mooie is, deze clusters ondersteunen zonder problemen zowel Windows als Linux. Of zelfs een combinatie van deze twee!

Twee dedicated servers inclusief Open-E met iSCSI failover, is al leverbaar vanaf 300 euro per maand.