Tabela de conteúdos

A forma de atualização do protocolo BGP

O que acontece com o trafego quando um anuncio ou prefixo se propaga ? Vamos ver abaixo alguns gráficos e observações interessantes.

Introdução

O que acontece quando um prefixo de endereço IP é anunciado ou retirado. Como esta informação se propaga através da Internet ? E como isso afeta a quantidade de tráfego BGP na Internet quando um único prefixo é anunciado recentemente ou retirado da tabela de roteamento global? Isso não será surpreendente para nenhum especialista em BGP. A intenção é fornecer informação geral sobre o estado atual do roteamento BGP na prática.

Metodologia

O prefixo 84.205.67.0/24 não estava visível na tabela de roteamento de 2 de fevereiro de 2011 às 08:00h. Nesse ponto, foi anunciado no BGP para todos os 61 de nossos peers diretamente conectados através do nosso “Roteador Coletor” Service Routing Service (RIS) presente no Amsterdam Internet Exchange AMS-IX.

Duas horas depois, às 10:00h, o mesmo prefixo foi retirado ativamente através do mesmo conjunto de peers no AMS-IX.

Medimos o tráfego de atualização do BGP gerado por esses dois eventos de todos os coletores do RIS, observando as atualizações recebidas por meio de 90 peers de tabela completos em todo o mundo.

Resultados

Para o anúncio de prefixo que ocorre às 08:00h, a Figura 1 abaixo representa a atividade de atualização (atualizações de BGP por segundo) observadas ao longo do tempo, bem como o progresso de visibilidade do prefixo (o número de peers que o veem).

Os 0 segundos no eixo X marcam o momento em que o prefixo foi anunciado.

A visibilidade é calculada dividindo o número de peers que já estão vendo o prefixo por todos os peers no conjunto.

Para as atualizações do BGP, diferenciamos entre (1) a primeira atualização já enviada por um peer sobre esse evento e (2) atualizações adicionais de um peer que já viu o evento. Isso nos permite distinguir entre as atualizações que representam a primeira vez que são vistas por um peer e as atualizações que provavelmente representam a seleção de rotas (convergência do caminho AS, etc).

Figura 1: Anúncio do Prefixo - Atualizações do BGP e Propagação da Visibilidade

Observamos que todo o tráfego BGP gerado para este anúncio ocorre em pouco mais de um minuto após o anúncio do prefixo inicial, com 90% do volume ocorrendo nos primeiros 30 segundos. A visibilidade total (100%) de todos os peers foi alcançada após apenas 38 segundos. Uma visibilidade de 40% é realizada em apenas alguns segundos.

Quase metade das atualizações (46%) são atualizações adicionais dos peers, representando a sobrecarga da convergência do BGP

A Figura 2 abaixo mostra o volume de atualização do BGP para a retirada do prefixo que ocorreu às 10:00h. Aqui distinguimos entre as mensagens de atualização por tipo: anúncio ou retirada. Para clareza visual, as retiradas são representadas no lado negativo do eixo Y. Como antes, os dois tipos são separados entre a primeira e outras atualizações, conforme visto por um peer..

Figura 2: Retirada de Prefixo - Atualizações do BGP e Propagação da Visibilidade

É interessante notar que o volume gerado de tráfego para a retirada do prefixo é muito maior do que para o anúncio do mesmo prefixo. Quase 4 vezes mais mensagens de atualização do BGP (503 vs 139) são registradas. Além disso, a atividade dura quase 3 minutos, em comparação com pouco mais de um minuto para o anúncio do prefixo.

79% de todas as atualizações são atualizações adicionais de um peer. Isso indica que, em média, uma retirada de rota gerará cerca de 5 mensagens BGP enviadas por um peer, em comparação com apenas 1 ou 2 mensagens para um anúncio de rota.

Além disso, apenas 25% das mensagens são mensagens de retirada, indicando que um colega envia uma média de 3 anúncios de rota antes de retirá-lo. Além disso, a maioria das mensagens de retirada são concentradas mais de 1min após a retirada do prefixo inicial (quando a visibilidade ainda é de 80%), com uma explosão acentuada em cerca de 90 segundos quando a visibilidade cai de 60% para 20%, indicando o momento a retirada do prefixo das tabelas de roteamento globais começa a convergir mais abruptamente

Observe que apenas 2,6% das mensagens de atualização serão referentes a um peer que recebe o saque pela primeira vez e o encaminha imediatamente aos seus peers.

A distribuição do tráfego BGP por tipo de mensagem de atualização para todo o período é mostrada abaixo na Figura 3.

Figura 3: Retirada de Prefixo - Distribuição do Tipo de Atualização

Esse fenômeno do volume muito maior de atualizações, com várias mensagens de atualização de cada peer, pode ser explicado pela maneira como os roteadores interpretam uma retirada de rota: um roteador não tem como saber se uma retirada de rota está acontecendo porque foi retirada na origem, ou porque o seu colega simplesmente abandonou a rota devido a perda de conectividade ou outro mau funcionamento. Portanto, seguindo a natureza resiliente da Internet, ele procurará em sua tabela de roteamento por um caminho alternativo para o prefixo retirado e tentará salvar a conexão com o prefixo dessa maneira. Se conseguir, passará a atualização para seus peers, prolongando a vida útil da rota. Somente quando ele ficar sem caminhos alternativos, ele finalmente removerá o prefixo de sua tabela de roteamento e enviará a mensagem de retirada para seus peers.

Conclusão

Para concluir, observamos que as atualizações de rotas do BGP tendem a convergir globalmente em apenas alguns minutos. A propagação de novos prefixos anunciados acontece quase que instantaneamente, alcançando 50% de visibilidade em pouco menos de 10 segundos, revelando um sistema global altamente responsivo. As retiradas de prefixo levam mais tempo para convergir e geram quase 4 vezes mais tráfego de BGP, com a visibilidade caindo abaixo de 10% somente após aproximadamente 2 minutos.

Tendo tudo isso em mente, podemos concluir que muitas vezes é mais fácil e rápido ligar um prefixo do que desativá-lo.

Bibliografia

Vasco Asturiano — 14 Feb 2011, https://labs.ripe.net/Members/vastur/the-shape-of-a-bgp-update