O que é cache? Como os dados em cache aceleram o processo?

Posted on Jun 4, 2026 Escrito por Simon Chartan

Uma CPU moderna consegue recuperar um valor do cache mais próximo em menos de um nanossegundo. Acessar a memória principal para obter o mesmo valor leva cerca de cem vezes mais tempo. Portanto, o chip faz o óbvio: mantém uma cópia dos dados que provavelmente precisará bem próxima a si. Essa cópia é um cache, e esse processo se repete em todas as camadas da computação, desde o silício do seu processador até o servidor que entregou esta página. Este guia explica o que é um cache, como o armazenamento em cache funciona, todos os locais onde ele fica armazenado silenciosamente e se você deve ou não limpá-lo.

Definição de cache: o que é realmente um cache

Um cache é um armazenamento temporário. Pequeno, rápido e localizado o mais próximo possível de tudo que precisa dele. Ele armazena cópias de dados que o sistema espera precisar novamente, para que, quando necessário, possa recuperar a cópia em vez de refazer um trabalho lento ou custoso. Abra esta página uma segunda vez e boa parte dela será carregada de uma cópia já existente em sua máquina, e não do servidor.

A palavra-chave aqui é "temporário". Os dados em cache nunca são os originais. São duplicatas, mantidas apenas para otimizar a velocidade, e você pode descartá-las quando quiser. Apague-as e nada de valor desaparecerá. O sistema simplesmente retorna à fonte original e reconstrói a cópia. Seu saldo bancário não fica armazenado em cache; uma cópia da página da web que exibe esse saldo pode estar. Essa diferença entre a fonte original e uma cópia descartável é o principal motivo pelo qual o cache é seguro para ser implementado em praticamente tudo. Na pior das hipóteses, se a cópia estiver ausente ou incorreta, o sistema simplesmente ignora, busca os dados na fonte original e continua funcionando.

Como funcionam os caches: acerto, falha e remoção de cache

Todo cache, em qualquer lugar, funciona com base em uma única pergunta: eu já tenho uma cópia disso? "Sim" significa uma resposta rápida. Sirva a cópia, ignore o caminho lento e pronto. "Não" significa que você faz o trabalho lento uma vez: busque na origem, retorne o resultado e mantenha uma cópia na saída para que as solicitações futuras sejam rápidas. Esse é todo o mecanismo. O resto é gerenciamento em torno de dois problemas complexos: o que descartar quando o espaço estiver acabando e como evitar retornar uma cópia que se tornou obsoleta.

Acerto de cache vs falha de cache

Encontrou? Isso é um acerto de cache. Não encontrou? É uma falha de cache, o que força uma requisição ao armazenamento de dados mais lento. A porcentagem de requisições que resultam em um acerto é chamada de taxa de acerto, e é o único número que os engenheiros realmente monitoram. Uma rede de distribuição de conteúdo (CDN) que serve arquivos estáticos, como imagens e folhas de estilo, busca uma taxa de acerto entre 95% e 99%. Se essa taxa for atingida, quase todos os visitantes recebem uma cópia próxima, enquanto o servidor de origem permanece praticamente ocioso. Uma baixa taxa de acerto significa que o cache é usado principalmente como decoração.

Quando o cache estiver cheio: políticas de remoção

Um cache é propositalmente pequeno. Armazenamento rápido custa dinheiro, então nunca há espaço para tudo, e quando o cache fica cheio, algo precisa ser removido. A regra que define o item removido é a política de remoção. O padrão usual é o Menos Recentemente Usado (LRU): remove-se o item que permaneceu intocado por mais tempo, apostando que o que você ignorou recentemente continuará sendo ignorado. Outros esquemas funcionam de maneira diferente. O Menos Frequentemente Usado (LFU) rastreia a frequência com que cada item é acessado. O Primeiro a Entrar, Primeiro a Sair (FIFO) simplesmente remove a entrada mais antiga. A mesma aposta, com abordagens diferentes. Cada política é, na verdade, um palpite sobre qual cópia você sentirá menos falta.

Manter as cópias atualizadas: TTL e políticas de gravação.

Uma cópia só é válida enquanto ainda corresponde à fonte. Por isso, a maioria dos caches marca cada entrada com um tempo de vida (TTL): uma contagem regressiva, após a qual a cópia é considerada expirada e precisa ser verificada ou buscada novamente. Na web, o cabeçalho Cache-Control define esse tempo. A regra é a RFC 9111 , e sua diretiva max-age permite que uma resposta permaneça em cache por até um ano, ou 31.536.000 segundos, se você quiser o valor exato. As gravações são a outra metade do problema. O write-through salva no cache e na fonte ao mesmo tempo, o que é seguro, mas mais lento. O write-back salva no cache agora e na fonte depois, o que é rápido, mas deixa uma pequena janela de tempo em que os dois não correspondem. Escolha a sua opção.

O que é cache?

Tipos de cache: da CPU à rede de distribuição de conteúdo

Eis a parte que a maioria das explicações ignora. Um cache de navegador e um cache L1 da CPU parecem mundos completamente diferentes, mas representam a mesma ideia em perspectivas distintas. Cada camada mantém cópias de dados de acesso lento próximas a tudo que precisa deles. Percorra a hierarquia de dentro para fora e o padrão se repete por todo o caminho.

Cache de memória: níveis de cache da CPU L1, L2, L3

O cache mais rápido ocorre no próprio processador. As CPUs modernas possuem três níveis de cache construídos com SRAM, um tipo de memória muito mais rápida que a DRAM usada para a memória principal e muito mais cara por byte. O cache L1 é minúsculo e quase instantâneo, com algumas dezenas de kilobytes por núcleo, respondendo em aproximadamente um nanossegundo. O cache L2 é maior e um pouco mais lento. O cache L3 é ainda maior e compartilhado entre os núcleos; o Intel Core i9-14900K vem com 36 MB dele, e o AMD Ryzen 9 7950X3D eleva o L3 para 128 MB. Tudo isso existe para compensar uma diferença: buscar dados do cache L1 leva menos de um nanossegundo, enquanto a memória principal DDR5 leva cerca de 70, uma diferença de aproximadamente cem vezes. Os caches funcionam porque os programas reutilizam os mesmos dados e os dados próximos a eles, um hábito chamado localidade de referência.

Camada	Tamanho típico	Tempo de acesso típico	O que contém
Cache L1 da CPU	32-80 KB por núcleo	~0,7-1 ns	As próximas instruções e valores
Cache de CPU L2	0,5-2 MB por núcleo	~3-4 ns	Dados recentemente utilizados perto do núcleo
Cache de CPU L3	16-128 MB compartilhados	~10-20 ns	Dados compartilhados entre núcleos
Memória principal (RAM)	8-64 GB	~70-100 ns	Programas em execução e dados ativos
Armazenamento SSD	256 GB - 4 TB	~50-100 µs	Arquivos e o sistema operacional
nó de borda da CDN	varia	~20 ms pela rede	Cópias da web próximas ao visitante
Servidor de origem	varia	~100-200 ms entre regiões	A fonte da verdade

Caches de disco, do sistema operacional e de aplicativos

Acima do hardware, o software mantém seus próprios caches. Seu sistema operacional armazena dados acessados com frequência, como arquivos lidos recentemente, na memória RAM disponível, para que possam ser reabertos instantaneamente. Bancos de dados armazenam em cache os resultados de consultas comuns. Aplicativos adicionam uma camada dedicada na memória, geralmente Redis ou Memcached, que fica entre o aplicativo e seu banco de dados e responde a solicitações repetidas em microssegundos. A função é idêntica à da CPU: manter o que é acessado com frequência em um armazenamento mais rápido para que você não pague o custo da lentidão duas vezes.

Cache do lado do servidor e a CDN

A camada mais externa se estende por toda a internet. Quando um servidor web armazena em cache as páginas finalizadas, ele evita reconstruí-las para cada visitante. Uma rede de distribuição de conteúdo (CDN) vai além, copiando esses recursos para servidores de borda espalhados pelo mundo, de modo que cada solicitação seja atendida por uma máquina fisicamente próxima ao usuário. Uma requisição a um servidor de borda de uma CDN pode ser respondida em cerca de 20 milissegundos, contra 100 a 200 milissegundos quando a solicitação precisa atravessar continentes até a origem. Esse modelo agora domina a web: em 2024, aproximadamente 75% do conteúdo de terceiros era servido por meio de uma CDN.

Cache do navegador: o que seu navegador armazena.

O cache do navegador é o que a maioria das pessoas realmente conhece. Ao carregar um site, seu navegador silenciosamente armazena partes dele no seu dispositivo: o HTML, as folhas de estilo, os scripts, as imagens, as fontes. Ao retornar mais tarde, ele lê esses arquivos diretamente do seu disco, em vez de buscá-los novamente. É por isso que a segunda visita a uma página da web carrega mais rápido do que a primeira. O logotipo do site? Baixado uma vez e reutilizado em todas as páginas em que aparece.

O que me intriga é o seguinte: a maior parte dessa velocidade fica sem ser aproveitada. Em 2021, cerca de 90,4% das respostas de sites em computadores eram armazenáveis em cache , mas 52% dos sites ainda estavam abaixo do 25º percentil na auditoria padrão de cache do navegador. A vantagem está ali, de graça, e a maior parte da web simplesmente a ignora. Configure o cache corretamente e o retorno será imediato. As visitas subsequentes ficam mais rápidas, o consumo de dados móveis diminui e o servidor de origem para de receber as mesmas solicitações redundantes.

O que é cache?

Benefícios do armazenamento em cache: por que ele torna as coisas mais rápidas

O armazenamento em cache é uma troca. Você gasta um pouco de memória e aceita um pequeno risco de servir algo ligeiramente desatualizado, e em troca obtém velocidade, menor carga e menor custo. Esses três benefícios são o motivo pelo qual o armazenamento em cache está presente em todas as camadas, e não apenas em uma.

A velocidade é a vantagem óbvia: servir uma cópia de um armazenamento próximo é muito melhor do que recalcular um resultado ou transportá-lo pela rede. O segundo benefício é a redução da carga na origem. Cada solicitação atendida por um cache é uma solicitação que o banco de dados ou o servidor de origem não precisa processar, o que mantém os sistemas operacionais durante picos de tráfego. O terceiro benefício é simplesmente econômico: servir bytes em cache a partir de um nó de borda é mais barato do que gerá-los novamente e enviá-los de um servidor central, e quando você precisa acessar os dados repetidamente, essa economia se multiplica rapidamente.

Os benefícios para o usuário em termos de desempenho do aplicativo são reais e mensuráveis. Uma pesquisa do Google de 2018 sobre sites para dispositivos móveis descobriu que reduzir o tempo de carregamento em um único segundo aumentou as conversões em até 27%, enquanto um estudo amplamente citado do Aberdeen Group, de 2012, estimou o custo de um atraso de um segundo em uma queda de 7% nas conversões. Páginas mais rápidas retêm os usuários. O armazenamento em cache é uma das maneiras mais baratas de se conseguir isso.

Tipo de cache	Onde ele vive	O que ele armazena	Quem gerencia isso?	Vida útil típica
Cache da CPU (L1/L2/L3)	No processador	Instruções e dados importantes	Hardware, automaticamente	Microssegundos
Cache do navegador	Seu dispositivo	HTML, CSS, JS, imagens, fontes	Seu navegador web	Horas por ano
Cache do aplicativo	memória do servidor de aplicativos	Resultados da consulta, sessões	Desenvolvedores (Redis, Memcached)	Segundos a horas
Cache do servidor/CDN	Servidores de borda em todo o mundo	Páginas, mídia, respostas da API	Proprietário do site e CDN	TTL por controle de cache
cache DNS	SO, roteador, resolvedor	Pesquisas de domínio para IP	O resolvedor de DNS	5 minutos a 24 horas

Você deve limpar os dados em cache? E quando?

As pessoas encaram a limpeza do cache como uma tarefa árdua em uma lista de verificação de manutenção. Esqueça a lista de verificação. Na verdade, é uma ferramenta de solução de problemas, nada mais. Na maioria dos dias, deixe os dados em cache onde estão, pois eles estão silenciosamente fazendo com que todos os sites que você visita carreguem mais rápido.

Então, quando vale a pena limpar o cache? Honestamente, apenas em três situações. Um site quebra ou continua exibindo uma versão em cache desatualizada após uma atualização, e essa cópia antiga no cache do navegador é quase sempre a culpada; limpar o cache força um download limpo. Você usou um computador compartilhado ou público e quer apagar o registro local do que você visualizou. Ou seu celular está com apenas um gigabyte de espaço livre e você precisa liberar espaço, já que o cache do navegador pode chegar silenciosamente a alguns gigabytes. Fora esses casos, limpar o cache não traz nenhum benefício. Isso torna sua próxima visita a todos os sites mais lenta enquanto o navegador reconstrói suas cópias, e alguns navegadores até mesmo desconectam você durante o processo. O erro mais comum: limpar o cache não apaga seus cookies ou senhas salvas. Esses dados ficam armazenados separadamente e permanecem mesmo após a limpeza do cache, a menos que você marque as opções para excluí-los também.

Navegador	Onde limpar o cache
Cromo	Configurações, Privacidade e segurança, Excluir dados de navegação, Imagens e arquivos em cache
Firefox	Configurações, Privacidade e Segurança, Cookies e Dados do Site, Limpar Dados
Safári	Configurações, Safari, Limpar histórico e dados de sites
Borda	Configurações, Privacidade, Escolher o que limpar

Cache vs. cookies vs. buffer: esclarecendo as dúvidas

Três palavras, frequentemente confundidas, todas relacionadas ao armazenamento de dados. Cada uma tem uma função diferente. Um cache armazena cópias do conteúdo para que você possa acessá-lo mais rapidamente na próxima vez. Um cookie é um pequeno lembrete que um site deixa para se lembrar de você: uma sessão de login, uma configuração de idioma, uma preferência salva. Ele carrega a sua identidade, não o conteúdo. Um buffer é diferente. Ele armazena dados em trânsito, como os poucos segundos de vídeo que um streaming carrega antes do ponto em que você está assistindo. A maneira mais curta de diferenciá-los é: os dados em cache permanecem para serem reutilizados, um cookie lembra quem você é e um buffer é esvaziado instantaneamente após ser usado.

O que lembrar sobre cache e armazenamento em cache.

Quando você passa a enxergar o cache como nada mais do que "manter uma cópia da coisa lenta perto de onde ela é necessária", ele deixa de parecer um recurso de hardware e passa a ser visto como um hábito presente em toda a computação, desde uma busca de 0,7 nanossegundos em uma CPU até uma cópia desta página armazenada em um servidor de borda perto da sua cidade. A lição prática é aquela que a web ainda não aprendeu: a maior parte dessa velocidade é gratuita e a maioria dos sites ainda a ignora. Da próxima vez que uma página abrir num piscar de olhos, você saberá exatamente qual cópia lhe poupou a viagem.

Simon Chartan

A journalist with a strong technical background and a passion for decentralized finance. With degrees in MBA and Master of Engineering in Data Science, the author combines analytical expertise with a clear, engaging writing style. At Plisio, they cover topics such as cryptocurrency, blockchain, DeFi, and digital finance—helping readers make sense of a rapidly evolving fintech landscape.