Recall (Revocação): o que é, como calcular e quando priorizar essa métrica em IA

Recall, também chamado de revocação, é uma métrica que indica a capacidade de um modelo de identificar corretamente os casos positivos reais. A pergunta central é simples: entre todas as situações onde a classe positiva realmente aconteceu, quantas o modelo conseguiu reconhecer. Em contextos sensíveis, essa métrica define o quanto o sistema consegue evitar perdas críticas.

O conceito está ligado à abrangência da detecção. Um modelo com alto recall erra pouco ao deixar de identificar positivos. Isso é fundamental em tarefas onde não detectar um caso pode gerar prejuízos financeiros, riscos à saúde ou falhas de segurança.

Como calcular recall

O cálculo do recall divide o total de verdadeiros positivos pelo total de casos positivos reais, incluindo aqueles que o modelo deixou escapar por erro.

Fórmula básica

Recall é obtido dividindo verdadeiros positivos pela soma de verdadeiros positivos e falsos negativos. É uma medida direta da sensibilidade do modelo e revela a capacidade de capturar eventos importantes.

O que a métrica revela

A pergunta que o recall responde é: de todos os casos que realmente eram positivos, quantos o modelo identificou. É uma forma clara de medir a proporção de eventos relevantes que não passam despercebidos.

Como otimizar recall

Um recall alto é alcançado ajustando tanto o modelo quanto os dados utilizados no treinamento. Em muitos casos, o desafio é lidar com classes desbalanceadas, onde positivos são raros.

Estratégias eficazes

Ajustar o limiar de decisão para permitir que o modelo classifique mais casos como positivos. Usar data augmentation para aumentar a representatividade de classes raras. Aplicar class weights para penalizar falsos negativos. Utilizar oversampling, como SMOTE, para equilibrar o dataset e melhorar sensibilidade do modelo. Também é comum revisar features e explorar algoritmos que lidam bem com dados desbalanceados.

Quando priorizar recall

Recall deve ser priorizado quando o principal risco está em perder um caso importante. Nesses cenários, é preferível lidar com falsos positivos do que permitir que um positivo real passe despercebido.

Exemplos de aplicação

Detecção de fraudes, onde identificar suspeitas que não se confirmam é menos grave do que ignorar transações fraudulentas. Diagnósticos clínicos que buscam doenças graves, em que não detectar o caso pode comprometer a saúde do paciente. Modelos de segurança, que precisam identificar todas as ameaças potenciais. Sistemas de recuperação de informação, cujo objetivo é mostrar todos os documentos relevantes, mesmo que isso inclua alguns extras.

A escolha entre recall e precisão sempre depende do impacto que cada tipo de erro causa no ambiente de negócio. Em tarefas de risco elevado, recall é a métrica que protege contra falhas silenciosas.