Recall (Revocação)
Recall, também chamado de revocação, é uma métrica que indica a capacidade de um modelo de identificar corretamente os casos positivos reais. A pergunta central é simples: entre todas as situações onde a classe positiva realmente aconteceu, quantas o modelo conseguiu reconhecer. Em contextos sensíveis, essa métrica define o quanto o sistema consegue evitar perdas críticas.
O conceito está ligado à abrangência da detecção. Um modelo com alto recall erra pouco ao deixar de identificar positivos. Isso é fundamental em tarefas onde não detectar um caso pode gerar prejuízos financeiros, riscos à saúde ou falhas de segurança.
Como calcular recall
O cálculo do recall divide o total de verdadeiros positivos pelo total de casos positivos reais, incluindo aqueles que o modelo deixou escapar por erro.
Fórmula básica
Recall é obtido dividindo verdadeiros positivos pela soma de verdadeiros positivos e falsos negativos. É uma medida direta da sensibilidade do modelo e revela a capacidade de capturar eventos importantes.
O que a métrica revela
A pergunta que o recall responde é: de todos os casos que realmente eram positivos, quantos o modelo identificou. É uma forma clara de medir a proporção de eventos relevantes que não passam despercebidos.
Como otimizar recall
Um recall alto é alcançado ajustando tanto o modelo quanto os dados utilizados no treinamento. Em muitos casos, o desafio é lidar com classes desbalanceadas, onde positivos são raros.
Estratégias eficazes
Ajustar o limiar de decisão para permitir que o modelo classifique mais casos como positivos. Usar data augmentation para aumentar a representatividade de classes raras. Aplicar class weights para penalizar falsos negativos. Utilizar oversampling, como SMOTE, para equilibrar o dataset e melhorar sensibilidade do modelo. Também é comum revisar features e explorar algoritmos que lidam bem com dados desbalanceados.
Quando priorizar recall
Recall deve ser priorizado quando o principal risco está em perder um caso importante. Nesses cenários, é preferível lidar com falsos positivos do que permitir que um positivo real passe despercebido.
Exemplos de aplicação
Detecção de fraudes, onde identificar suspeitas que não se confirmam é menos grave do que ignorar transações fraudulentas. Diagnósticos clínicos que buscam doenças graves, em que não detectar o caso pode comprometer a saúde do paciente. Modelos de segurança, que precisam identificar todas as ameaças potenciais. Sistemas de recuperação de informação, cujo objetivo é mostrar todos os documentos relevantes, mesmo que isso inclua alguns extras.
A escolha entre recall e precisão sempre depende do impacto que cada tipo de erro causa no ambiente de negócio. Em tarefas de risco elevado, recall é a métrica que protege contra falhas silenciosas.