A internet é “muito grande para falhar”

14/03/2017 20:13 Atualizado: 13/03/2017 20:21

Um erro de digitação acidental por um empregado da Amazon afetou uma grande porção da internet em 28 de fevereiro. Alguns sítios da rede relataram tempos de carregamento extremamente lentos, enquanto outros ficaram completamente inativos.

Os atrasos e interrupções nos serviços foram relatados num amplo espectro de empresas baseadas na rede, como o aplicativo de pagamentos online Venmo, o varejista Target, a Comissão de Valores Mobiliários dos EUA e, ironicamente, o Down Detector, um sítio da rede que registra a interrupção de serviços na internet.

A razão do problema foi os Serviços de Rede da Amazon (AWS), o ramo amplamente utilizado de computação e hospedagem em nuvem da gigante da internet Amazon.com Inc.

A interrupção do serviço foi um despertar brusco para as empresas que abraçam a tendência recente de mover a infraestrutura de tecnologia da informação (TI) para as nuvens. Isso mostra que computação em nuvem têm muitos benefícios, mas também riscos.

Um mea culpa longo e técnico publicado pela Amazon em 2 de março diz que o erro foi causado por técnicos que visavam corrigir um problema no sistema de faturamento do Serviço de Armazenamento Simples (S3) da AWS.

Os programadores precisaram desativar um pequeno número de servidores, mas um comando errado foi acidentalmente inserido e desativou muito mais do que o pretendido, incluindo alguns sistemas críticos de infraestrutura de alguns sítios.

Assim, um mero erro de digitação causou a queda de sítios importantes.

O erro e a interrupção do serviço afetaram as operações da Virgínia da AWS, que hospeda centros de dados para muitas empresas localizadas no leste dos Estados Unidos. O problema durou cerca de quatro horas desde a falha inicial até a recuperação total em 28 de fevereiro.

Vendas no varejo perdidas

Não há dados concretos com os quais se possam estimar as receitas perdidas devido à interrupção, mas o montante é provavelmente na casa das centenas de milhões de dólares.

A Cyence, uma startup que acompanha o impacto econômico dos riscos e ataques cibernéticos, estima que a interrupção dos serviços custou 150 milhões de dólares às empresas da S&P 500, segundo uma matéria do Wall Street Journal. Não ficou claro que fontes de dados a Cyence usou para estimar o impacto.

Mas vários varejistas de comércio eletrônico experimentaram lentidão e interrupções significativos. Mais de metade dos principais e-varejistas dos EUA acompanhados pelo Apica Systems, um provedor que monitora o desempenho das aplicações móveis e em nuvem, foi afetada pela interrupção da AWS.

Cinquenta e quatro dos 100 e-varejistas do índice de desempenho da rede do Apica foram afetados negativamente, com uma diminuição de 20% ou mais no desempenho dos sítios. Três sítios – Lululemon, Express e One Kings Lane – ficaram completamente indisponíveis. Os maiores atrasos nos tempos de carregamento foram experimentados pela Loja Disney, com um enorme atraso de 1.165%, ou 10 vezes a espera habitual.

Tempo de carregamento (em milissegundos) do site da Loja Disney em 28 de fevereiro durante uma interrupção do serviço S3 da Amazon. (Fonte: Apica Systems)

Concentração do risco

O erro humano que causou a interrupção parece um pouco trivial e provavelmente será repetido no futuro.

E o impacto sobre os consumidores é significativo devido ao enorme tamanho da AWS. O provedor de serviços em nuvem da Amazon é o líder da indústria. A sua quota de mercado global era de 40% até o quarto trimestre de 2016, o que é maior do que os próximos três concorrentes combinados, Microsoft, Google e IBM, segundo o Synergy Research Group.

A AWS é líder na chamada Infraestrutura como Serviço (comumente conhecida como IaaS), que fornece às empresas centros remotos de dados, armazenamento e rede que podem ampliar ou substituir completamente a infraestrutura local de um centro de dados.

O S3 da AWS serve como a espinha dorsal terceirizada de mais de 158 mil sítios da rede de todo o mundo, e armazena trilhões de arquivos, vídeos e fotos para desses sites, segundo a empresa de inteligência de negócios online SimilarTech. Entre os maiores clientes da AWS estão nomes como Netflix, Quora, GitHub, Business Insider, Wal-Mart e Costco.

A tendência atual das empresas é mover sua infraestrutura para as nuvens. Os provedores de computação em nuvem argumentam que a hospedagem remota permite que as empresas redirecionem seus recursos e atenção para a gestão de seus negócios, aliviando assim o oneroso planejamento, gerenciamento e atualização da infraestrutura tecnológica.

A computação em nuvem também pode adaptar-se para atender às necessidades do negócio. De acordo com o sítio de computação em nuvem da IBM, “Os usuários podem adaptar os serviços para atender às suas necessidades, personalizar aplicativos e acessar serviços em nuvem de qualquer lugar com conexão à internet.”

Mas mesmo com toda a conveniência e flexibilidade, há um risco para os consumidores e a economia: a concentração de infraestrutura de tecnologia vital para muitos sítios nas mãos de algumas empresas de computação em nuvem significa que mesmo pequenos erros podem ter consequências generalizadas.

Sem a computação em nuvem, a falha dos servidores de uma empresa afeta apenas a própria empresa. Mas como tantas empresas dependem da Amazon, uma interrupção na AWS pode afetar uma grande parte da internet.

Com uma quota de mercado global de computação em nuvem de 40%, a Amazon tornou-se sistemicamente importante para a internet e o equivalente tecnológico de “muito grande para falhar”.

O que as empresas podem fazer?

A interrupção foi um acidente isolado e não representa a qualidade do serviço da AWS. Um erro humano semelhante poderia acorrer em outros provedores de serviços de computação em nuvem, por isso a crença generalizada entre os investidores que a diminuição do risco por meio da diversificação dos provedores e da geografia seria útil para os operadores de sítios da rede.

A falha da AWS ocorreu no grande centro de dados US-EAST-1 da Amazon em Virgínia, EUA. Os clientes com dados armazenados em outros três centros norte-americanos da AWS não foram afetados.

Por exemplo, o Netflix, que utiliza vários servidores da AWS para redundância, não foi afetado. As empresas que espalham dados entre vários centros da AWS também não foram afetadas pela paralisação de 28 de fevereiro.

Mas a segurança adicional pode ser onerosa. Armazenar alguns dados num provedor e outros dados num concorrente também criam problemas para departamentos de TI, os quais que precisam se familiarizar com diferentes tecnologias.

“A divisão da capacidade em nuvem entre dois fornecedores, por exemplo, também reduz os descontos de volume pela metade”, escreve Clint Boulton, numa análise para a CIO Magazine.

Consequências para a Amazon

Desde a queda recente da AWS, os concorrentes da Amazon aumentaram seus esforços de marketing.

A Azure, a plataforma em nuvem da Microsoft, por exemplo, vem promovendo sua presença global – há “39 regiões da Azure, mais do que qualquer outro provedor em nuvem”, segundo seu sítio. Em 1º de março, a Microsoft divulgou sua tecnologia Azure Stack para servidores locais, que permite aos clientes armazenar uma plataforma de computação em nuvem em seus próprios servidores locais.

Se os concorrentes podem abocanhar parte da fatia controlada pela AWS é algo a ser visto. Mas qualquer perda de participação de mercado da AWS pode ser bastante danosa para a Amazon.

A AWS gerou 3,5 bilhões de dólares em receitas para a Amazon no quarto trimestre de 2016, o que representou cerca de 9% das receitas totais da gigante da internet. Embora isso seja pequeno em comparação com o resto da empresa, a AWS é um motor principal de crescimento para a empresa – o crescimento ano-a-ano da AWS no quarto trimestre de 2016 foi de 47%.

Receitas da AWS e crescimento anual da Amazon. (Credit Suisse)

A computação em nuvem é fundamental para a Amazon; e a AWS é seu negócio mais rentável e um grande contribuidor para seu elevado múltiplo de avaliação de ações (ganhos futuros de 165x).

Para o ano de 2016, o lucro operacional da AWS foi de 3,1 bilhões de dólares, o que representa 74% da margem operacional total da empresa de 4,2 bilhões de dólares. Em outras palavras, 9% das receitas da Amazon geraram quase três quartos do lucro bruto.

A AWS subsidia o resto dos negócios da Amazon e tem uma margem de lucro de 25%, enquanto o restante do negócio da Amazon tem uma margem de lucro de apenas 1%.