Berichten met de tag ‘RAID’

Op jacht naar meer performance

29 januari 2010 door Dick Tump

Een belangrijke bezigheid binnen Shock Media is de eeuwige jacht naar meer performance. Dit kan worden gerealiseerd door optimalisatie, maar soms bestaat er ook gewoon betere hardware. Een goede verbetering is bijvoorbeeld de Intel Nehalem processorarchitectuur met DDR3 geheugen. Maar dit keer gaat het om een nieuwe serie harde schijven, welke Samsung recent op de markt heeft gebracht. Hierbij geven ze de ongeloofwaardige claim dat ze 30% sneller zijn dan de vorige serie. Deze nieuwe serie, de Samsung F3 harddisks, zijn te krijgen in 500 GB en 1 TB formaat, twee formaten die veel worden gebruikt op dit moment.

Doordat de SATA schijven steeds sneller worden, zijn ze tegenwoordig ook voor de wat zwaarder belaste servers vrij interessant. Alhoewel SAS voorlopig voorlopig nog wel even de grote winnaar blijft, zeker omdat er geen SATA 15.000 rpm schijven zijn, is juist die combinatie van veel opslagcapaciteit, goede performance en de prijs bij veel situaties interessant.

Reden genoeg dus om deze schijven maar eens aan een aantal testjes te onderwerpen. Eerst sluiten we ze in RAID 1 aan op een Areca ARC-1200 controller, in een Windows server uitgerust met Xeon X3330 processor. Hierop draaien we ATTO Disk Benchmark:

Samsung F3 Benchmark

Samsung F3 Benchmark

Als je bedenkt dat er met de vorige serie schijven met erg veel moeite maar 130 MB/s uit te persen was, is een piek van ruim 180 MB/s wel een erg goede score.

Ook met tests onder Linux zien we mooie waarden terug. We hebben een Nehalem systeem uitgerust met software RAID 10. Linux MD RAID ondersteunt meerdere ‘layouts’, waaronder ‘far’, welke de data op verschillende ‘fysieke’ plekken van de disks op gaat slaan. Hierdoor zijn iets betere access tijden mogelijk en liggen de snelheden bij sequentieel lezen ook iets hoger. Als filesystem gebruiken we Ext4, want uit eerdere tests bij ons bleek al dat Ext4 net wat sneller is dan XFS en veel sneller dan Ext3. We limiteren het systeem op 1 GB RAM, om veel caching te voorkomen.

We doen een reboot, om te voorkomen dat er data in de cache staat en voeren een simpele leestest uit:

8589934592 bytes (8.6 GB) copied, 20.523 s, 419 MB/s

Dit zijn toch wel zeer hoge snelheden, zeker voor een vrij goedkope oplossing, omdat het alleen vier SATA schijven met software RAID betreft. Ook een test met bonnie++ geeft mooie waarden terug:

Version 1.03c       ------Sequential Output------ --Sequential Input- --Random-
                    -Per Chr- --Block-- -Rewrite- -Per Chr- --Block-- --Seeks--
Machine        Size K/sec %CP K/sec %CP K/sec %CP K/sec %CP K/sec %CP  /sec %CP
test1            8G 95563  99 206199  27 74990  13 75902  91 357054  25 218.00

Eigenlijk kunnen we alleen maar concluderen dat voor SATA systemen de nieuwe Samsung schijven de beste keus zijn, althans op dit moment. Want andere fabrikanten zitten natuurlijk ook niet stil. Alleen voor de echte high performance servers, zoals zware database systemen, zullen we toch SAS moeten blijven gebruiken.

Version 1.03c       ——Sequential Output—— –Sequential Input- –Random-
-Per Chr- –Block– -Rewrite- -Per Chr- –Block– –Seeks–
Machine        Size K/sec %CP K/sec %CP K/sec %CP K/sec %CP K/sec %CP  /sec %CP
test1            8G 95563  99 206199  27 74990  13 75902  91 357054  25 218.00
——Sequential Create—— ——–Random Create——–
-Create– –Read— -Delete– -Create– –Read— -Delete–
files  /sec %CP  /sec %CP  /sec %CP  /sec %CP  /sec %CP  /sec %CP
16 +++++ +++ +++++ +++ +++++ +++ +++++ +++ +++++ +++ +++++ +++
test1,8G,95563,99,206199,27,74990,13,75902,91,357054,25,218.0,0,16,+++++,+++,+++++,+++,+++++,+++,+++++,+++,+++++,+++,+++++,+++

Betrouwbare storage met Open-E

22 juli 2009 door Dick Tump

Het is natuurlijk niet voor niks dat wij gecertificeerd Open-E partner zijn geworden. Wij beschouwen Open-E als een van de betere storage solutions op dit moment, zeker als shared storage binnen een virtualisatiecluster met Xen of VMware. Toch een gedurfde uitspraak, binnen een wereld waarbij veelal wordt gekozen voor prijzige oplossingen van merken als Equallogic.

iSCSI failover: uitval van een SAN is geen uitval van de storage
Een van de interessantere mogelijkheden van Open-E is wel iSCSI failover, waardoor uitval van een van de SANs niet een uitval van de storage betekent. Open-E weet binnen een seconde over te schakelen op het andere systeem, waardoor een hapering eigenlijk niet eens merkbaar is. Alle virtuele instances die op de storage hun data opslaan, blijven dus gewoon zonder problemen werken.

Betaalbaarder, maar ook beter
Een Open-E oplossing is een zeer goed betaalbare oplossing. Zo betaalbaar zelfs, dat licenties en hardware meegerekend, je in plaats van (de gebruikelijke oplossing) één enkele prijzige SAN, twee op Open-E gebaseerde SANs neer kunt zetten. Alle hardware kan altijd kapot, welk merk dan ook, maar het belangrijkst is om bij uitval toch zo min mogelijk problemen te hebben. Daarvoor kan wel een SLA worden afgesloten waarbij binnen 4 uur de SAN weer gerepareerd is door de leverancier, maar dan liggen wel alle servers er 4 uur lang uit. En een dergelijke SLA is vaak ook nog eens een behoorlijke periodieke kostenpost, naast dat 4 uur downtime natuurlijk niet is te verkopen aan klanten.

Ook de door Open-E geleverde performance is zeer goed. Door gebruik te maken van meerdere gigabit uplinks, is een zeer hoge data throughput haalbaar. In de server zelf wordt dan een goede hardware RAID controller geplaatst met zeer snelle schijven. Zo is met een SATA RAID 5 bestaande uit 4 schijven een snelheid van boven de 300 megabyte per seconde prima haalbaar. En voor de I/O intensieve applicaties is een SAS RAID 5 tegenwoordig ook goed betaalbaar.

Onze oplossing: high availability op maar 4 servers
Wij kunnen klanten dankzij Open-E en VMware of Citrix XenServer al een high availability oplossing bieden vanaf 4 ‘gewone’ dedicated servers. Op 2 servers draait de SAN met iSCSI failover en op 2 andere servers draait VMware of Citrix XenServer met automatische failover. Naast dat we hiermee een zeer stabiele oplossing bieden, is uitbreiding in de toekomst ook eenvoudig mogelijk, door bijvoorbeeld een extra fysieke server te plaatsen waar weer VMware of Xen instances op komen te draaien. En het mooie is, deze clusters ondersteunen zonder problemen zowel Windows als Linux. Of zelfs een combinatie van deze twee!

Twee dedicated servers inclusief Open-E met iSCSI failover, is al leverbaar vanaf 300 euro per maand.

Backups tot de macht drie

24 juni 2009 door Erik Jan Hofstede

Hoewel Murphy (zie de Wet van Murphy of eigenlijk de Wet van Bedrog) al een geruime tijd geleden bij ons bedrijf ontslagen is, komt deze hardnekkige en vooral niet echt populaire ex-collega toch zo nu en dan - onaangekondigd – langs om eens flink wat roet in het spreekwoordelijke eten te gooien.

Omdat wij alle systemen waarvan wij het beheer onder onze hoede nemen, proactief monitoren, trendgrafieken maken en regelmatig onderwerpen aan een grondige ‘checkup’, detecteren en verhelpen we vrijwel alle potentiële problemen voordat het problemen worden. Toch zullen er altijd problemen blijven ontstaan, die niet vooraf te voorkomen waren. Enkele voorbeelden van problemen die niet vaak proactief op te lossen zijn:

  • Spontane filesystem corruption (door software of hardware) waardoor data in extreme gevallen corrupt kan raken.
  • Zero-day exploits in gebruikte software waardoor hackers in extreme gevallen data zouden kunnen verwijderen.
  • Mensenlijke fouten waardoor data perongeluk word verwijderd.
  • Rampen en terrorisme.

De vraag die wij onszelf daarom regelmatig stellen is niet of een incident gaat plaatsvinden, maar altijd wanneer en hoe we op dat moment zo’n incident kunnen ondervangen. Deze conclusie heeft er tot geleid dat wij bijna paranoïde zijn geworden op het maken van goede backups en het redundant opslaan van data. Er zijn nooit teveel backups!

Backups en dataopslag bij Shock Media B.V.

Backups en dataopslag bij Shock Media B.V.

Hiernaast staat een illustratie over hoe wij data in ons Xen-cluster opslaan en hier backups van maken. Om het voor minder technisch onderlegde mensen begrijpbaar te houden, zijn een aantal zaken versimpeld weergegeven. Data van onze klanten wordt op de fysieke server redundant opgeslagen d.m.v. hardware RAID, hiernaast word ook alle data realtime gerepliceerd naar een andere fysieke server, die als secundairy dient en eveneens met hardware RAID is uitgerust. Wanneer een fysieke server uitvalt, kunnen de virtuele systemen (die de data bevatten) eenvoudig op een ander fysiek systeem weer gestart worden. Hierdoor is de data van bijvoorbeeld een website, e-mail, database of applicatie al op 4 verschillende mediadragers realtime opgeslagen in het cluster.

Ook worden er dagelijks meermaals een mirror gemaakt van alle data naar een fysiek andere backup-server buiten het cluster die ook weer is uitgevoerd met hardware RAID. Deze data is hooguit enkele uren oud, maar niet realtime. Dit heeft als voordeel dat bij dataverlies door een menselijke fout of door een hacker, deze weer snel kan worden gerestored.

Deze data staat allemaal nog wel in hetzelfde datacentrum. Hoewel dit datacentrum zwaar beveiligd is tegen brand, braak, water en andere soorten rampen, is wanneer bijvoorbeeld een vliegtuig land op het datacentrum een potentieel probleem voor verlies van data. Hierom maken wij ook offsite backups naar een backup-server in een fysiek ander – geografisch gescheiden – datacentrum. Wederom is deze server uitgevoerd met hardware RAID.

Als laatste maken wij periodiek complete backups naar backuptapes die weer op een geografisch gescheiden locatie worden opgeslagen. Deze data is niet via een netwerk verbonden maar is volledig offline. Dit zorgt ervoor dat de data extreem veilig staat, echter niet makkelijk toegankelijk om te gebruiken voor recovery van data. Dit is dan ook alleen in extreme situaties een extra uitwijk mogelijkheid.

Alle data van onder andere onze shared hosting, virtuele servers maar ook diverse dedicated servers en dedicated clusters worden door het gebruik van hardware RAID, netwerk-replicate, onsite backups, offsite backups en offline backups in totaal 9 keer opgeslagen.