2013 10 21 A Importância do Monitoramento da Infraestrutura
Post
Cancel

A Importância do Monitoramento da Infraestrutura

To read this article in English, click here

Monitoramento é o ato de observar, em um determinado período de tempo, se as condições de um equipamento está dentro dos padrões estabelecidos. Caso, a condição do equipamento esteja diferente do padrão estabelecido, algo de anormal ocorreu. Você possui esse controle de sua infraestrutura de TI?

Além da detecção de interrupções de serviços, o monitoramento é responsável por coletar informações de determinados equipamentos/serviços e armazenar estas informações de modo que seja possível prevenir e ou dimensionar o futuro, com as informações coletadas no passado,  de forma mais assertiva.

Quando ocorre alguma alteração nas condições de um equipamento/serviço classificamos este fato como um Incidente.

Incidente:  Evento que não seja parte da operação padrão de um equipamento/serviço e que causa, ou pode causar, uma interrupção ou redução na qualidade daquele equipamento/serviço.

A identificação de incidentes e o tratamento adequado, ou seja, restabelecer o serviço de forma eficiente e eficaz minimizando o impacto negativo sobre o serviço é algo esperado e fundamental dentro de uma organização. E todo este trabalho, somente pode ser realizado se você possuir sistemas capazes de identificar os incidentes, atuando de forma pró ativa. Para todo este processo, é concedido o nome de Gerenciamento de Incidentes.

A grande vantagem do monitoramento de equipamentos/serviços (Itens de Configuração) é a capacidade de medir a qualidade do serviço que o Item de Configuração fornece. Com base nesta medição é possível analisar, identificar possíveis "pontos fora da curva", planejar de forma mais assertiva o futuro tendo como base os fatos ocorridos no passado.

Vamos analisar o gráfico abaixo:

Este gráfico contêm informações sobre a quantidade de transações (vendas) realizadas, nos anos de 2011, 2012 e 2013 (até o mês de Agosto), em uma determinada Loja Virtual.

Observe que os meses Maio, Junho, Agosto e Dezembro, possuem um volume de Transações muito acima dos demais meses do Ano. Estes meses, possuem datas comemorativas (Maio, dia das mães; Junho, dia dos namorados; Agosto, dia dos pais; e Dezembro, Natal).

Note que há um crescimento no volume de transações ano de 2013, quando comparado com o ano de 2011 no mesmo período.

No gráfico abaixo, observamos o Consumo de Memória utilizada durante o mesmo período do gráfico anterior.

Note que nos meses de Maio, Junho, Agosto e Dezembro, o consumo de memória foi elevado devido ao número de transações realizadas. Com base neste crescimento, a sua infraestrutura está preparada para responder com capacidade e em tempo hábil o volume de transações para  o próximo Natal?

Toda esta análise do consumo de memória, somente pode ser realizada através de uma ferramenta de monitoramento.

Se a sua empresa ainda não possui uma ferramenta capaz de identificar os incidentes no momento que eles ocorram, minimizando o tempo de indisponibilidade e que lhe ajude no dimensionamento assertivo de sua infraestrutura, sérios problemas você poderá ter em um futuro próximo.

Monitoring

Monitoring is the act of observing, in a determined time, if the hardware condition is within the established standard. In case the hardware condition is not within the standard, then something abnormal occurred. Do you have this monitoring in your IT infrastructure?

Beside the interruption detection over services, the monitoring is responsible to get information of some hardware/services and store the information to use preventively  and/or sizing the future, with information about the past, in a more assertive way.

When something changes in your environment, this is classified as an incident.

Incident: Event that is not part of default operation on the equipment(hardware)/service and it causes, or it can possibly interrupt a service or reduce the quality of that hardware/service

The identification of incidents and the action to repair it, that is, restoring the service, efficiently and effectively reducing the negative impact over the service, is expected and fundamental in a company. This job can only be done if you use specific tools to identify incidents in a proactive way. All this process is called Incident Management.

The big advantage of monitoring hardware/services (Configuration Items) is the capacity of measuring the quality of the Configuration Item provided by your infrastructure. With this measure it is possible to check, and identify “points outside the curve”, and make more assertive plans to the future, based in the fact occurred in the past.

Let’s check this chart.

This chart contains information about the transaction quantity (sales) done, in the years 2011, 2012 and 2013 (until August) in a specific e-commerce company.

Check the months May, June, August and December have more transactions over the other months. These months are special because they have commemorative dates (May, Mother’s day; June, Valentine’s day (in Brazil); August, Father’s day; and December, Christmas).

Check the growth on the quantity of transactions in 2013, when comparing to the same period in 2011.

In the chart below, we see the Memory Utilization in the same period (2011, 2012 and 2013).

Notice that in the months of May, June, August and December the memory utilization was high because of the number of transactions. Based on this information, is your infrastructure able to deal with next Christmas transactions?

All this analysis about the memory utilization can only be performed by using a monitoring tool.

If your company does not have a tool that is able to identify the incidents in real time, reducing downtime and helping you get the correct infrastructure sizing, you can have serious problems in a near future.

 

This post is licensed under CC BY 4.0 by the author.