Idenet -
Main menu

Den största orsaken till systemavbrott

Driftavbrott
I en tid där IT-system står i centrum för de flesta företags operationer blir det alltmer kritiskt att investera i lösningar som kan garantera upptid. Men var ligger det största hotet? Vilken enskild faktor orsakar flest systemavbrott?

Undersökningar av kostnad för nertid visar att de dyraste systemavbrotten oftast orsakas av dataintrång och attacker, men de står bara för en liten del av alla incidenter.

Det visar sig att svaret är den mänskliga faktorn.

 

Statistics vary but the results all conclude that human error results in anywhere from 50% to 75% of datacenter downtime. Overloading circuits, accidentally pulling cords, or inadvertently hitting an emergency power off button are common mishaps.


Misstag, drullar och gamla hederliga tabbar är alltså (och kommer kanske alltid att vara) den svagaste länken även i de mest högteknologiska IT-miljöerna.

Men vad ligger bakom alla dessa misstag? Det är lätt att säga "okunnighet", men faktum är att även de mest erfarna och tränade IT-proffs gör fel. Så kanske ligger problemet i bristande planering.

För när det handlar om IT-miljöer planerar du för misslyckande genom att inte planera. Det finns för många komponenter och processer som måste hanteras med precision, och utan noggrann förberedelse blir förvirring oundvikligt. Allt som skapas, konfigureras, ändras och integreras måste dokumenteras och hanteras enligt föreskrivna rutiner. Hårdvara ska märkas och nätverksscheman måste följas. Med så många rörliga delar och kopplingar mellan komponenter, krävs det bara att en liten detalj undgås för att orsaka stora konsekvenser

Problemet är att det är svårt för IT-personal att planera och dokumentera ordentligt - det finns sällan tillräckligt med tid eller resurser för noggrant utförande. Det är ett av de problem IT-avdelningar tampats med sedan länge. Det finns alltid nya servrar att installera eller applikationer att rulla ut, och det är ett ständigt tryck från ledningen att utföra uppgifter. 

Minimera nertid orsakat av mänskliga faktorn

Generellt kan man säga att den mänskliga faktorn inkluderar 3 delar:

  • Dåliga underhållsrutiner
  • Kompetensbrist
  • Dålig operativ styrning

Ett av de mest effektiva sätten att tackla alla områden, är med hjälp av väldokumenterade operationsprocesser för samtliga IT-procedurer. De bör innehålla procedurer för operationer, underhåll och beredskap, såväl som övergripande riktlinjer och metoder. Varje dokument bör definiera processen i fråga och innehålla detaljerad information om hur uppgiften ska utföras.

Men det räcker inte att bara skapa operationsprocesser. De är inte värda något om de inte följs. Därför är det viktigt att du ser till så att alla medarbetare håller en hög disciplin, och att rätt individ utför rätt uppgift. Dessutom bör alla processer ses efter och uppdateras med jämna mellanrum. 

Utbildning är också ett viktigt medel för att bekämpa misstag som leder till IT-avbrott. I många fall finns det bara ett fåtal individer (eller bara en) som besitter den kompetens som krävs för att sköta en specifik uppgift, och när något inträffar som bara den kan hantera uppstår det stora problem om han/hon inte finns på plats. Men genom att se till så att alla i IT-avdelningen kan sköta flera olika områden uppnår man en slags kompetensredundans.

Ett annat sätt att minimera risken för misstag är att förhandla om stressiga projekt som har en orealistisk leveranstid. Ibland behöver IT-avdelningen stå upp mot ledningen och säga "den här tidsramen är inte realistisk, och det kommer att leda till problem om vi inte kan utföra projektet noggrant".

Hur du driftsäkrar dina mest kritiska system

I framtiden måste man fortsätta att adressera den mänskliga faktorn om man vill optimera sin IT-driftsäkerhet - oavsett hur högteknologiska och automatiserade datahallar blir, kommer det alltid finnas mänsklig inblandning. Och med bristen på IT-kompetens kommer det att bli allt svårare för IT-chefer att attrahera och behålla rätt kunskaper - något som bara ytterligare befäster den mänskliga faktorn som den största orsaken till systemavbrott.

Men för vissa typer av system räcker det inte att minimera riskerna med den mänskliga faktorn.

Skydda mot andra brister i din infrastruktur

För mer kritiska system (med högre tillgänglighetskrav) räcker det inte att se till så att fullständiga rutiner och processer alltid följs. Det finns fortfarande andra hot mot tillgängligheten som måste bekämpas på infrastrukturnivå.

Kartlägg därför om det finns några som helst sårbarheter i driftsäkerheten för de applikationer som är verksamhets- eller affärskritiska. Om t.ex. ett kassasystem har höga toppar och dalar i belastning krävs en skalbarhetsförmåga, inte bara för att se till så att överbelastning inte leder till avbrott, men även för att uppehålla höga prestandanivåer. Och om ett affärssystem hanterar speciellt känslig information blir det en större måltavla för dataintrång och attacker, och kräver kanske högre säkerhet

Utvärdera också om ni har möjlighet att övervaka både på server- och applikationsnivå. Det är viktigt för att proaktivt kunna driftsäkra system, och kan hjälpa dig att undvika många eventuella driftstopp. Dessutom är det viktigt att titta på om man har den redundans och disaster recovery som krävs för respektive system. 

Applikationsdrift med hög tillgänglighet, prestanda & säkerhet:Applikationsdrift
Applikationsdrift [checklista]


För många IT-avdelningar finns inte den budget som krävs för att investera i ovan nämnda lösningar, och i vissa fall är det bättre att istället hitta en specialiserad outsourcing-partner. På så sätt kan du se till så att driftsäkerhet uppnås både genom kompetent personal med klara processer och en optimerad infrastruktur. Och om medarbetare samtidigt kan frigöras från underhåll av infrastruktur till att istället ägna tid åt verksamhetens behov så är det en mycket stor vinst.

Med ett eget privat moln hos oss får du en förlängning av din existerande IT-miljö där dina mest kritiska system kan driftas med mycket hög tillgänglighet och prestanda. Du kan vara säker på att vi har den spetskompetens som krävs - vi har varit verksamma sedan 1992 och samtliga våra medarbetare har flera års erfarenhet och är certifierade på de produkter och teknologier vi arbetar med.

Läs också:
Outsourcing av IT-drift: 5 punkter att tänka på
Driftavbrott - så här dyrt är nertid för system
Driftsäkerhet i Sverige och Europa
IT-rekrytering: 7 tips för att hitta rätt IT-kompetens