Serverless

Fonte: https://blogs.pucpr.br/sistemas-de-informacao/2022/04/25/voce-sabe-o-que-e-serverless-architecture/

Ao projetar sua arquitetura, não se concentre na questão: “Quais são os dados que estou armazenando e quais operações preciso realizar em relação a eles?” Em vez disso, pergunte: “Quais são os eventos que devem acionar uma ação no meu sistema?” - AWS

Introdução - Serverless

Nos últimos anos, uma revolução silenciosa vem transformando a forma como concebemos e desenvolvemos aplicações e serviços na era digital. Esqueça os tradicionais servidores físicos ou máquinas virtuais que costumavam ser a espinha dorsal da infraestrutura de TI. Em seu lugar, emerge uma abordagem radicalmente nova conhecida como “serverless” (sem servidor), que promete simplificar a vida dos desenvolvedores, otimizar recursos e reduzir custos operacionais.

E à medida que avançamos na era da computação em nuvem, o serverless surge como uma mudança de paradigma emocionante e disruptiva.

Neste post, apresento algumas informações sobre serverless e faço uma breve introdução de como AWS Lambda é estruturada.

O que Serverless realmente significa?

Serverless é uma tecnologia na qual não precisamos nos preocupar com servidor e sua disponibilidade, possui 4 características principais:

Sem servidor para gerenciar - não existe patch para ser aplicado;
Escalabilidade flexível - define-se uma capacidade mínima, como: memória, CPU, quantidade de leitura/escrita ou volume de dados que será enviado, e o ambiente pode escalar de forma automática essa capacidade de acordo com o a necessidade que o ambiente necessitar;
Alta disponibilidade automática e tolerância a falhas - serviços serverless possuem essas características por padrão e isso não pode ser desligado;
Sem capacidade ociosa – o custo é com base na utilização.

Do monolito ao Serverless

Existem muitos paradigmas que precisam ser revistos quando estamos tratando de uma migração para um ambiente serverless. Ao olharmos os serviços oferecidos pela AWS, com certeza os mais famosos são S3, Lambda, DynamoDB e API Gateway. Entretanto, existem vários outros serviços que devem ser utilizados para obter o máximo de aproveitamento de uma arquitetura serverless.

Quando olhamos uma aplicação com uma arquitetura monolítica, toda a gestão pelos componentes é de sua responsabilidade, ou seja, precisa de uma equipe capacitada para realizar essa gestão. Na grande maioria das vezes a gestão desse tipo de ambiente é complexa e cara. Além disso, desperdiça o tempo dos engenheiros em rotinas de manutenção ao invés de usá-los nos produtos “core” da empresa.

Ao migrar uma aplicação para um ambiente serverless, todas as preocupações com gestão do ambiente deixam de existir. A grande chave para conseguir êxito em uma mudança como essa é se preocupar em construir serviços orientados a eventos. É uma grande mudança de paradigma, pois cada solicitação ou alteração se torna um evento e desta forma os componentes deixam de estarem unidos e dependentes para se tornarem desacoplados.

Lambda

AWS Lambda é um serviço de computação, onde você executa o código de sua aplicação sem provisionar e gerenciar servidores.

5 benefícios ao usar Lambda:

executar um código sem provisionar e gerenciar servidores;
a Lambda é iniciada através de um evento;
o scaling é automático;
fornece monitoração integrada com Amazon CloudWatch;
Integração com diversos serviços da AWS.

Ao usar uma Lambda, você está automaticamente se beneficiando de uma arquitetura baseada em eventos. Muitos serviços da AWS criam eventos e estes podem ser a origem para iniciar uma Lambda por exemplo.

Como a Lambda funciona

Para que a Lambda seja executada, é necessário que um evento ocorra. Este evento pode executar a Lambda de três maneiras:

Síncrona
1. Invocação - neste caso a Lambda é invocada e executa código, realizando o processamento, em seguida e como saída um retorno ocorre. Toda a estratégia de código é definida por você.
2. Serviço AWS - a Lambda é iniciada após ser invocada por algum serviço da AWS, que pode ser: API Gateway, Cognito, CloudFormation, Alexa, Lex, CloudFront, etc
3. Tipo de erro a ser considerado: sem possibilidade de retry
Assíncrona
1. Invocação - neste modelo de execução, a Lambda é invocada e o requisito não aguarda nenhum tipo de resposta. Esse tipo de modelo pode ser muito útil em cenários onde após a execução da Lambda, um outro determinado serviço é invocado.
2. Serviço AWS - Assim como a forma síncrona, vários serviços da AWS podem ser usados neste cenário, como por exemplo SNS, S3, Event Bridge, etc
3. Tipo de erro a ser considerado: integrado, com duas tentativas de retry
Polling
1. Polling - neste cenário existe uma integração com serviços baseados em streaming ou fila. A lambda faz um poll nos serviços e uma vez identificado um evento a função Lambda é invocada. Para este cenário, estão integrados Kinesis, SQS e DynamoDB Streams.
2. Serviço AWS - os seguintes serviços podem ser integrados: DynamoDB, Kinesis, MQ, MSK, SQS, etc
3. Tipo de erro a ser considerado: depende da origem do evento

Ambiente de execução de uma Lambda

O ambiente de execução da Lambda consiste em três etapas:

Fase Inicial - ocorre a configuração inicial do ambiente onde a função Lambda será executada, contempla três etapas:
1. Extension init - inicia todas as extensões necessárias;
2. Runtime init - realiza o bootstrap do runtime;
3. Function init - executa o código estático da função.
Fase de Invocação - nesta etapa ocorre a invocação da função handler
Fase de Desligamento - aqui é onde ocorre o encerramento da execução da função Lambda, assim como uma limpeza em todo o ambiente criado e inicializado para sua execução.

Performance é um item importante e a possibilidade de otimizar a performance é algo possível de ser realizado na Lambda.

Quando a Lambda é inicializada, ocorre o que chamamos de Cold Start, ou seja, todo o ambiente é inicializado para a execução da função, o que leva um tempo (em muitas vezes é em torno de milissegundos) para ocorrer.

Visando melhorar a performance, existe a possibilidade de executar a função em um ambiente denominado Warm Start, ou seja, é um ambiente pré inicializado. Neste cenário a Lambda não exclui o ambiente preparado para executar a função, e isso reduz o tempo de inicialização do ambiente.

Segurança

Existem duas etapas relacionadas à segurança para que uma função seja executada.

É necessário ter permissão para invocar uma função;
A função precisa ter permissão para acessar os recursos necessários durante a sua execução;

Essas permissões são controladas via IAM.

Método handler

O handler é o método da função que irá processar os eventos, é composto de:

Event
- é obrigatório
- vai diferir em estrutura e conteúdo, com base no evento que iniciou a invocação da Lambda
Context object (opcional)
- possibilita que a função interaja com o ambiente em execução, como por exemplo:
  - AWS RequestID - usado para fazer um track da invocação específica
  - Runtime - tempo em milissegundos antes do timeout
  - Logging - informar qual stream de log d CloudWatch deve ser usado para o registro de logs

Boas práticas

Abaixo estão listadas algumas boas práticas ao codificar a função Lambda. Algumas linguagens de programação possuem particularidades específicas e por isso é recomendável ler atentamente a documentação oficial.

Uma recomendação é separar o código de negócio do método handler, isso facilita a portabilidade do código e também na escrita de testes unitários;
Outra recomendação é escrever funções modulares. Por exemplo, imagine o cenário onde uma função insere uma marca d’água em uma imagem e gera miniaturas desta imagem. O ideal é ter pelo menos duas funções, uma para criar a marca d’água e outra função para gerar as miniaturas da imagem;
Não salvar nenhuma informação no contexto de uma função. As funções são stateless;
Inclua apenas as dependências que for realmente utilizar na função. Isso diminui o tamanho e o tempo de inicialização de cada uma;
Inclua declarações de log em seu código. Os logs por padrão, são enviados para o CloudWatch;
Use o código de retorno ao término da função. Cada linguagem possui a sua particularidade para isso;
Faça uso de variáveis de ambiente. As variáveis de ambiente podem ser alteradas, sem alterar qualquer código na sua função. Além disso, informações sensíveis podem ser declaradas em variáveis garantindo que a informação não fique exposta diretamente no código, além de adicionar uma camada de criptografia nos dados;
Evite a recursividade. Criar uma função que durante sua execução faz uma invocação para si mesma, pode causar um escalonamento de invocações, ocasionando perda de controle.

Simultaneidade (concorrência)

A simultaneidade é um parâmetro muito importante que precisa ser definido na configuração da Lambda. Isso garante a quantidade de invocações que uma função pode executar ao mesmo tempo.

Existem três tipos:

Simultaneidade não reservada - é a quantidade de simultaneidade que não é alocada para nenhum conjunto específico de funções. O valor mínimo é de 100 reservas. Isso significa que você terá 100 reservas que podem ser utilizadas por qualquer função, minimizando qualquer tipo de impacto;
Simultaneidade reservada - garante o número máximo de instâncias reservadas para a função. Quando um valor está definido para uma função, nenhuma outra pode usar essa mesma simultaneidade. Não há custo pela reserva;
Simultaneidade provisionada - configura um número de ambientes inicializados, para que atendam às solicitações quando a função for invocada. Isso garante alto desempenho e baixa latência. Há um custo que precisa ser levado em consideração para este tipo de configuração.

Monitorando

A função Lambda é integrada com o CloudWatch e isso permite analisar de forma gráfica diversas métricas. Alguns itens que podem ser observados são:

Invocações - número de vezes que a função foi invocada e o seu status da execução;
Duração - a quantidade de tempo que a função utilizou para processar um evento;
Erros - o número de invocações que terminaram com erro;
Limitações (throttles) - a quantidade de vezes que houve uma falha no processo devido a limites de simultaneidade;
IteratorAge - refere-se ao mapeamento de origem de eventos que leem fluxos e o tempo do último evento registrado;
DeadLetterErros - quantidade de vezes que a Lambda tenta enviar um evento para uma fila de mensagens mortas, mas falha;
Execuções concorrentes - quantidade de instâncias da função que estão processando algum evento.