Na atual conjuntura operacional das empresas, o departamento de TI e suas ramificações deixaram de ser simplesmente uma área prescindível. Com isso, sendo um setor essencial tanto em aspectos econômicos, quanto nas suas estruturas funcionais. Dessa forma, torna-se cada vez mais necessário manter a infraestrutura de redes funcional, resiliente, escalável e principalmente, com uma capacidade adequada para a demanda. Porém, acompanhar a situação e conformidade desses fatores pode ser uma tarefa difícil, primordialmente se não está sendo feito um bom planejamento de capacidade. A rede deve ser  monitorada em todas as suas áreas funcionais de gerência. Mesmo nesse cenário, talvez alguns indicadores essenciais sobre desempenho não estejam sendo contabilizados na análise do sistema.

Nesse sentido, vamos buscar neste artigo entender de forma geral como a gerência de desempenho é importante. Bem como perceber a importância da definição e acompanhamento de indicadores de performance e como esses dados podem ser demonstrados.

A IMPORTÂNCIA DOS KPIs NO CENÁRIO DE GERENCIAMENTO DE PERFORMANCE

Os Indicadores-chave de performance (KPIs) são itens utilizados de forma geral por empresas para o acompanhamento da efetividade de setores ou de procedimentos. No contexto da observabilidade de redes de computadores, os KPIs são itens imprescindíveis que podem apontar métricas sobre o comportamento dos ativos da rede. Dessa forma não só o comportamento atual, mas um histórico de desempenho. Assim, possibilitando a projeção de desempenho futuro, ajudando a elevar o nível de governança da corporação com a alocação de recursos técnicos e gerando uma tendência de gestão baseada em dados. Além disso, esses parâmetros podem ser utilizados para verificar a conformidade dos acordos de nível de serviço (SLA) pré estabelecidos entre o cliente e o fornecedor.

Os indicadores principais serão escolhidos com base na infraestrutura e na necessidade de negócio da empresa, logo, nem todas vão utilizar os mesmos parâmetros para aferir o desempenho do seu ambiente de TI. Antes da escolha destes, é importante a realização de um bom planejamento de capacidade, pois os problemas de desempenho estão diretamente relacionados com a capacidade geral da infraestrutura. Diante desse cenário, a garantia do SLA, identificação de fatores críticos para o bom funcionamento do parque tecnológico e coleta de dados através de um sistema de monitoramento serão aliados importantes.

Sendo assim, agora podemos destacar alguns dos indicadores mais utilizados como parâmetros-chave para aferição de métricas de desempenho.

DISPONIBILIDADE

Um dos itens mais elementares em relação à performance. Diante disso, podemos associar, por exemplo, a disponibilidade de um ativo de rede na totalidade ou até mesmo aferir a disponibilidade de uma interface de rede, ou de um Link. Normalmente, essa métrica está associada a uma resposta (ou ausência dela) utilizando o protocolo ICMP. Essa KPI também pode ser medida com um down operacional de uma interface. Um uptime menor que 95% pode ser considerado como crítico. A imagem abaixo mostra um componente de dashboard do SLAview da disponibilidade de links:

Relatório dashboard SLAview - Disponibilidades das interfaces de um dispositivo
Relatório dashboard SLAview – Disponibilidades das interfaces de um dispositivo

LATÊNCIA E JITTER

Esses indicadores devem ser analisados em conjunto e também são essenciais, podemos entender latência como o atraso do tempo de resposta a uma determinada solicitação, normalmente dada em milissegundos . Já o jitter pode ser compreendido como a variação das latências, em redes que utilizam aplicações sensíveis à latência, o jitter não pode ser muito alto.

CONSUMO DE CPU

Este é muito relevante principalmente para garantir a fluidez nos processos da rede, o ideal é que os gestores da rede recebam alertas baseados no alto consumo percentual da CPU dos ativos de rede. Bem como, ser capaz de listar  os dispositivos que possuem um maior consumo de CPU.

USO DA LARGURA DE BANDA

A observabilidade desse parâmetro é importante justamente para avaliar uma métrica em termos absolutos ou até mesmo percentuais de uso do link.

Existem ainda outros indicadores que podemos citar, como, taxas de congestionamento da rede, erros de ruído ou CRC, dentre outros. O mais interessante disso tudo é que existe a possibilidade de visualizar todos esses KPIs em um dashboard que possui atualização dinâmica. Nesse sentido, o SLAview é uma ferramenta ideal para essa visualização e análise. A imagem abaixo mostra um dashboard do SLAview com algumas KPIs e alertas relacionados a elas:

Dashboard do SLAview com KPIs e alertas
Dashboard do SLAview com KPIs e alertas

CONSIDERAÇÕES FINAIS

O SLAview é uma ferramenta simples de usar e com um ótimo custo/benefício. Realize gerência de falhas e de desempenho de maneira assertiva, com o SLAview, a criação de KPIs poderá ser feita, dashboards, e diversas outras análises relativas ao   gerenciamento de desempenho dos seus ativos de rede.

Portanto, não há dúvidas da importância do investimento em gerenciamento de redes. As boas práticas demonstradas aqui trazem benefícios não somente operacionais, mas também, contribuem para uma TI proativa, garante a possibilidade de alocação de recursos de TI e tudo isso causa um impacto positivo muito grande na sua governança.

Pensando nisso, a Telcomanager, líder da América Latina no setor de software para gerência de redes, desde 2002 no mercado com uma metodologia única e inovadora, disponibiliza soluções inteligentes para o monitoramento de dados de modo a prover visibilidade completa à infraestrutura do cliente, permitindo que sua empresa acompanhe os principais aspectos de sua rede.

Publicado em 18/03/2022