Vi människor upplever världen genom våra sinnen.
De samlar in information för hjärnan att bearbeta så att vi kan reagera och interagera med världen, men även skydda oss själva. Sinnen och hjärnan arbetar tillsammans så att vi kan fatta beslut baserat på den situation vi befinner oss i.
Om vi applicerar samma modell på hur ett datacenter fungerar så har ett typiskt datacenter mängder av system som övervakar dess hälsa. Dessa system får data från andra system, miljöer, nätverk, databaser och enheter. Mängden data som skapas enbart från infrastrukturen i form av mätvärden och händelser har växt så mycket att det i princip är omöjligt att analysera och hitta flaskhalsar när man felsöker prestandaproblem.
Övervakningssystemen är konfigurerade att larma när något utöver det normala inträffar.
Men det är ofta svårt att särskilja viktiga larm från bruset. Det är också svårt att hitta och åtgärda den underliggande orsaken vid larm från flera olika händelser. Det är därför det behövs ett system som fungerar likt den mänskliga hjärnan och som kan sortera och analysera information från olika källor, identifiera händelser som hör ihop och därefter hjälpa till att hitta orsaken.
Välkommen till AIOps
AIOps är en praxis som nyttjar AI-tekniker och -metoder för att förbättra verksamhetens effektivitet och därmed affärsvärde. Det handlar om att använda kognitiva modeller som simulerar mänskliga resonemang, självlärande maskiner som ständigt förbättrar noggrannheten i beslutsfattandet och kraftfulla analytiska motorer som väljer de lämpligaste algoritmerna för att leverera operationella insikter i rätt kontext.
AIOps är i skärningspunkten mellan tre avgörande aspekter av IT-drift – tjänstehantering, prestandahantering och automatisering. Det överbryggar dessa aspekter för att berika den information som finns tillgänglig från olika datakällor, få kontinuerlig insikt och lösa problemen i realtid.
Tänk ett scenario med en prestandaförsämring för en affärskritisk tillämpning.
Den underliggande orsaken kan finnas i vilket lager som helst – från webbgränssnittet, applikationsserver, mellanprogramvara, databaser till nätverk eller serverinfrastrukturen. Genom att använda AIOps kan larm, mätvärden och loggar från de olika övervakade systemen såväl som systemen som övervakar dem aggregeras, filtreras för att ta bort brus och passeras genom analysmodeller för att begränsa möjliga grundorsaker. Och om dessa valideras kan lösning av problemet samt testning av åtgärden helt automatiseras. Allt detta görs inom några minuter, i motsats till de timmar som det skulle ta för att göra samma sak utan AIOps.
Ett annat exempel där AIOps avsevärt kan hjälpa företag med kundnöjdhet och produktivitetsförbättring finns i kundsupporten. Vid typiska supportåtgärder läggs stor energi och tid på att förstå användarnas behov, kategorisera dem på lämpligt sätt och därefter slussa dem vidare till rätt team för att lösa problemet. Eftersom kundnöjdhet är nyckeln till alla supportåtgärder och har en direkt påverkan på verksamheten är det nödvändigt att svara och hjälpa användaren så snabbt som möjligt. Genom att nyttja händelsedata är AI-modeller byggda för att först härleda användarens problem, på lämpligt sätt kategorisera incidenten, identifiera relevanta kunskapsdokument och tilldela incidenterna till rätt grupp för att lösa problemet. Chatbots med inbyggd intelligens och självlärande funktioner hjälper supportteamet att utföra kommandon och göra resultaten tillgängliga i chattkanalen för kollaborativ felsökning. Detta kan förbättra supportteamets produktivitet med 25 – 30 procent.
AIOps-konceptet kan också breddas utanför it-verksamheten till att även omfatta säkerhet och andra delar av verksamheten.
Några viktiga fördelar med AIOps inkluderar:
Robust drift: Driftproblem identifieras, analyseras och hanteras genom intelligent automatisering för att återställa tjänster så snabbt som möjligt och därigenom förbättra deras tillförlitlighet.
Anpassningsbar hantering: Kognitiva modeller ger viktiga rekommendationer för dynamisk koordinering av arbetsflöden för att säkerställa en sömlös användarupplevelse.
Förbättrad produktivitet: En kombination av incidentanalys, -korrelation och intelligent automatisering underlättar snabbare problemlösning, vilket förbättrar driftseffektivitet såväl som produktivitet.
Kontextuell insikt: Genom att analysera mätvärden i kontext med händelser och loggar med AI skapas de insikter insikten som behövs för att förstå driften och förutsäga sannolikt beteende i framtiden.
AIOps: Den nya vägen framåt för it-verksamheten
Gartner förutspår att “Företagens användning av AIOps och självlärande digitala övervakningsverktyg för att övervaka applikationer och infrastruktur kommer att stiga från 5 procent 2018 till 30 procent 2023.” Framöver kommer AIOps att vara en viktig möjliggörare för organisationer att lyckas med sin digitala transformation eftersom det ger bättre synlighet i allt från infrastruktur till tillämpningar – ett viktigt krav med tanke på it-miljöers allt större komplexitet.