Was ist Cache? Wie zwischengespeicherte Daten Prozesse beschleunigen
Eine moderne CPU kann einen Wert aus ihrem nächstgelegenen Cache in deutlich weniger als einer Nanosekunde abrufen. Der Zugriff auf den Hauptspeicher für denselben Wert dauert etwa hundertmal länger. Daher macht der Chip das Naheliegende: Er speichert eine Kopie der voraussichtlich benötigten Daten direkt neben sich. Diese Kopie ist der Cache, und dieses Prinzip wird auf jeder Ebene der Datenverarbeitung wiederholt, vom Silizium in Ihrem Prozessor bis hin zum Server, der diese Seite ausgeliefert hat. Dieser Leitfaden erklärt, was ein Cache ist, wie Caching funktioniert, wo er sich überall im Hintergrund befindet und ob es sinnvoll ist, ihn zu leeren.
Cache-Definition: Was ein Cache wirklich ist
Ein Cache ist ein temporärer Speicher. Er ist klein, schnell und befindet sich möglichst nah an dem System, das ihn benötigt. Er speichert Kopien von Daten, die das System voraussichtlich wieder benötigt, sodass es bei Bedarf die Kopie abrufen kann, anstatt rechenintensive Vorgänge erneut auszuführen. Wenn Sie diese Seite ein zweites Mal öffnen, wird ein Großteil der Daten von einer bereits auf Ihrem Rechner vorhandenen Kopie geladen, nicht vom Server.
Das Wort „temporär“ spielt hier eine entscheidende Rolle. Zwischengespeicherte Daten sind niemals das Original. Es handelt sich um eine Kopie, die nur aus Geschwindigkeitsgründen zwischengespeichert wird und jederzeit gelöscht werden kann. Selbst wenn Sie sie löschen, geht nichts Wertvolles verloren. Das System greift einfach auf die Originaldaten zurück und erstellt die Kopie neu. Ihr Kontostand befindet sich nicht im Cache; eine Kopie der Webseite, die diesen Kontostand anzeigt, hingegen schon. Genau diese Diskrepanz zwischen der Originaldatenquelle und der temporären Kopie ist der Grund, warum Caching so bedenkenlos überall eingesetzt werden kann. Im schlimmsten Fall fehlt die Kopie oder ist fehlerhaft; das System reagiert darauf, lädt die Daten von der Originalquelle und arbeitet weiter.
So funktioniert der Cache: Cache-Treffer, Cache-Fehler und Cache-Verdrängung
Jeder Cache, überall, basiert auf einer einzigen Frage: Habe ich bereits eine Kopie davon? Ja bedeutet schnelle Antwort: Kopie ausliefern, langsamer Pfad überspringen, fertig. Nein bedeutet, die langsame Arbeit einmalig zu erledigen: Daten von der Quelle abrufen, Ergebnis zurückgeben und dabei eine Kopie speichern, um zukünftige Anfragen zu beschleunigen. Das ist der gesamte Mechanismus. Der Rest ist die Verwaltung zweier komplexer Probleme: Welche Daten werden verworfen, wenn der Speicherplatz knapp wird, und wie wird vermieden, dass eine veraltete Kopie zurückgegeben wird?
Cache-Treffer vs. Cache-Fehler
Gefunden? Das ist ein Cache-Treffer. Nicht gefunden? Ein Cache-Fehler, der einen Zugriff auf den langsameren Backend-Speicher erzwingt. Der Anteil der Anfragen, die mit einem Treffer enden, wird als Trefferrate bezeichnet und ist die Kennzahl, die Entwickler besonders im Blick haben. Ein Content Delivery Network (CDN), das statische Dateien wie Bilder und Stylesheets ausliefert, strebt eine Trefferrate von 95 bis 99 Prozent an. Wird diese erreicht, erhält fast jeder Besucher eine Kopie der Datei, während der Ursprungsserver kaum ausgelastet ist. Eine niedrige Trefferrate bedeutet, dass der Cache hauptsächlich als Dekoration dient.
Wenn der Cache voll ist: Räumungsrichtlinien
Ein Cache ist bewusst klein gehalten. Schneller Speicher kostet Geld, daher ist nie genug Platz für alles, und sobald der Cache voll ist, muss etwas gelöscht werden. Die Regel, die den Leerstand bestimmt, ist die Löschrichtlinie. Üblicherweise gilt die Least Recently Used (LRU): Alles, was am längsten unberührt geblieben ist, wird gelöscht, in der Annahme, dass man das, was man zuletzt ignoriert hat, auch weiterhin ignorieren wird. Andere Verfahren zählen anders. Least Frequently Used (LFU) erfasst, wie oft auf jedes Element zugegriffen wird. First In First Out (FIFO) löscht einfach den ältesten Eintrag. Gleiches Risiko, nur anders formuliert. Jede Richtlinie ist im Grunde eine Schätzung, welche Kopie am wenigsten vermisst wird.
Kopien aktuell halten: TTL- und Schreibrichtlinien
Eine Kopie ist nur so lange gültig, wie sie mit der Quelle übereinstimmt. Daher versehen die meisten Caches jeden Eintrag mit einer Gültigkeitsdauer (Time-to-Live, TTL): einem Countdown, nach dessen Ablauf die Kopie als abgelaufen gilt und erneut geprüft oder abgerufen werden muss. Im Web wird diese Gültigkeitsdauer durch den Cache-Control-Header festgelegt. Die entsprechenden Regeln finden sich in RFC 9111 , dessen Max-Age-Direktive es ermöglicht, dass eine Antwort bis zu einem Jahr – oder genauer gesagt 31.536.000 Sekunden – im Cache gespeichert bleibt. Schreibvorgänge stellen die andere Hälfte des Problems dar. Write-Through speichert Daten gleichzeitig im Cache und in der Quelle, was zwar sicher, aber langsamer ist. Write-Back speichert Daten zunächst im Cache und später in der Quelle, was zwar schnell ist, aber ein kurzes Zeitfenster entstehen lässt, in dem die beiden Versionen nicht übereinstimmen. Hier muss man den optimalen Kompromiss finden.

Cache-Typen: vom Prozessor bis zum Content Delivery Network
Hier liegt der Punkt, der in den meisten Erklärungen fehlt. Browser-Cache und L1-CPU-Cache klingen zwar nach völlig unterschiedlichen Welten, basieren aber auf demselben Prinzip, nur in unterschiedlicher Entfernung. Jede Schicht speichert Kopien von Daten, die langsam abgerufen werden müssen, in der Nähe der Stelle, an der sie benötigt werden. Folgt man dieser Hierarchie von innen nach außen, wiederholt sich das Muster durchgehend.
Speichercaching: CPU-Cache-Ebenen L1, L2, L3
Das schnellste Caching findet direkt im Prozessor statt. Moderne CPUs verfügen über drei Cache-Ebenen aus SRAM, einem Speichertyp, der deutlich schneller als der für den Hauptspeicher verwendete DRAM, aber auch wesentlich teurer pro Byte ist. Der L1-Cache ist winzig und nahezu verzögerungsfrei: Er umfasst einige Dutzend Kilobyte pro Kern und antwortet in etwa einer Nanosekunde. Der L2-Cache ist größer und etwas langsamer. Der L3-Cache ist noch größer und wird von allen Kernen gemeinsam genutzt; Intels Core i9-14900K ist mit 36 MB ausgestattet, AMDs Ryzen 9 7950X3D sogar mit 128 MB. All dies dient dazu, einen entscheidenden Unterschied auszugleichen: Das Abrufen von Daten aus dem L1-Cache dauert weniger als eine Nanosekunde, während der DDR5-Hauptspeicher etwa 70 Nanosekunden benötigt – ein Unterschied um das Hundertfache. Caches funktionieren, weil Programme dieselben Daten und die Daten in ihrer Nähe wiederverwenden – ein Prinzip, das als lokale Referenzierung bezeichnet wird.
| Schicht | Typische Größe | Typische Zugriffszeit | Was es enthält |
|---|---|---|---|
| L1-CPU-Cache | 32–80 KB pro Kern | ~0,7-1 ns | Die nächsten Anweisungen und Werte |
| L2-CPU-Cache | 0,5–2 MB pro Kern | ~3-4 ns | Kürzlich verwendete Daten in der Nähe des Kerns |
| L3-CPU-Cache | 16–128 MB gemeinsam genutzt | ~10-20 ns | Daten, die zwischen den Kernen ausgetauscht werden |
| Hauptspeicher (RAM) | 8-64 GB | ~70-100 ns | Laufende Programme und aktive Daten |
| SSD-Speicher | 256 GB bis 4 TB | ~50-100 µs | Dateien und das Betriebssystem |
| CDN-Edge-Knoten | variiert | ~20 ms über das Netzwerk | Webkopien in der Nähe des Besuchers |
| Ursprungsserver | variiert | ~100-200 ms Cross-Region | Die Quelle der Wahrheit |
Festplatten-, Betriebssystem- und Anwendungscaches
Über der Hardware liegen die eigenen Caches der Software. Ihr Betriebssystem speichert häufig genutzte Daten, wie beispielsweise kürzlich gelesene Dateien, im Arbeitsspeicher (RAM), sodass diese sofort wieder geöffnet werden können. Datenbanken speichern die Ergebnisse häufiger Abfragen im Cache. Anwendungen fügen eine dedizierte Speicherschicht hinzu, oft Redis oder Memcached, die zwischen der Anwendung und ihrer Datenbank liegt und wiederholte Anfragen in Mikrosekunden beantwortet. Die Aufgabe ist dieselbe wie die der CPU: Häufig genutzte Daten werden in einem schnelleren Speicher abgelegt, um die Kosten für langsame Daten nicht doppelt zu tragen.
Serverseitiges Caching und das CDN
Die äußerste Schicht erstreckt sich über das gesamte Internet. Wenn ein Webserver fertige Seiten zwischenspeichert, muss er sie nicht für jeden Besucher neu generieren. Ein Content Delivery Network (CDN) geht noch einen Schritt weiter: Es kopiert diese Daten auf Edge-Server, die über den Globus verteilt sind, sodass jede Anfrage von einem Rechner in der Nähe des Nutzers beantwortet wird. Ein CDN-Edge-Aufruf kann in etwa 20 Millisekunden beantwortet werden, im Vergleich zu 100 bis 200 Millisekunden, wenn die Anfrage Kontinente zum Ursprungsserver überqueren muss. Dieses Modell dominiert heute das Web: Bis 2024 wurden voraussichtlich rund 75 Prozent der Inhalte von Drittanbietern über ein CDN ausgeliefert.
Browser-Cache: Was Ihr Webbrowser speichert
Der Browser-Cache ist das, was die meisten Nutzer tatsächlich verwenden. Lädt man eine Webseite, speichert der Browser im Hintergrund Teile davon auf dem Gerät: HTML-Code, Stylesheets, Skripte, Bilder und Schriftarten. Beim erneuten Aufruf lädt er diese Dateien direkt von der Festplatte, anstatt sie erneut herunterzuladen. Deshalb öffnet sich eine Webseite beim zweiten Besuch deutlich schneller als beim ersten. Und das Website-Logo? Einmal heruntergeladen und auf jeder Seite wiederverwendet, auf der es erscheint.
Was mich am meisten ärgert: Der Großteil dieser Geschwindigkeit bleibt ungenutzt. Im Jahr 2021 waren rund 90,4 Prozent der Web-Antworten auf Desktop-Computern cachefähig , dennoch landeten 52 Prozent der Websites im Standard-Browser-Caching-Audit unter den besten 25 Prozent. Das Potenzial liegt also direkt vor uns, kostenlos, und die meisten Webseiten verpassen es einfach. Richtet man das Caching richtig ein, sind die Vorteile sofort spürbar. Wiederholte Besuche werden schneller, der mobile Datenverbrauch sinkt und der Ursprungsserver muss nicht mehr dieselben redundanten Anfragen bearbeiten.

Vorteile des Caching: Warum es Dinge beschleunigt
Caching ist ein Kompromiss. Man investiert etwas Speicherplatz und akzeptiert ein geringes Risiko, leicht veraltete Daten auszuliefern, erhält im Gegenzug aber Geschwindigkeit, geringere Serverlast und niedrigere Kosten. Diese drei Vorteile sind der Grund, warum Caching auf jeder Ebene zum Einsatz kommt und nicht nur auf einer.
Geschwindigkeit ist der offensichtliche Vorteil: Das Ausliefern einer Kopie aus einem nahegelegenen Speicher ist schneller, als ein Ergebnis neu zu berechnen oder es über ein Netzwerk zu übertragen. Der zweite Vorteil ist die geringere Last auf dem Quellserver. Jede Anfrage, die vom Cache beantwortet wird, muss die Datenbank oder der Ursprungsserver nicht bearbeiten, wodurch die Systeme auch bei Lastspitzen stabil bleiben. Der dritte Vorteil sind die Kosten: Das Ausliefern zwischengespeicherter Daten von einem Edge-Knoten ist günstiger als deren Neugenerierung und Übertragung von einem zentralen Server. Und wenn Sie wiederholt auf Daten zugreifen müssen, summieren sich diese Einsparungen schnell.
Die positiven Auswirkungen auf die Anwendungsleistung sind für die Nutzer real und messbar. Eine Studie von Google aus dem Jahr 2018 zu mobilen Websites ergab, dass eine Reduzierung der Ladezeit um nur eine Sekunde die Conversion-Rate um bis zu 27 Prozent steigerte. Eine vielzitierte Studie der Aberdeen Group aus dem Jahr 2012 bezifferte die Kosten einer Sekunde Verzögerung auf einen Rückgang der Conversion-Rate um 7 Prozent. Schnellere Seiten binden Nutzer länger. Caching ist eine der kostengünstigsten Methoden, dies zu erreichen.
| Cache-Typ | Wo es lebt | Was es speichert | Wer verwaltet es? | Typische Lebensdauer |
|---|---|---|---|---|
| CPU-Cache (L1/L2/L3) | Auf dem Prozessor | Heiße Anweisungen und Daten | Hardware, automatisch | Mikrosekunden |
| Browser-Cache | Ihr Gerät | HTML, CSS, JS, Bilder, Schriftarten | Ihr Webbrowser | Stunden bis zu einem Jahr |
| Anwendungscache | Anwendungsserverspeicher | Suchergebnisse, Sitzungen | Entwickler (Redis, Memcached) | Sekunden bis Stunden |
| Server-/CDN-Cache | Edge-Server weltweit | Seiten, Medien, API-Antworten | Website-Inhaber und CDN | Pro Cache-Control TTL |
| DNS-Cache | Betriebssystem, Router, Resolver | Domain-zu-IP-Lookups | Der DNS-Resolver | 5 Minuten bis 24 Stunden |
Sollte man zwischengespeicherte Daten löschen und wenn ja, wann?
Viele betrachten das Leeren des Caches als lästige Pflicht auf ihrer Wartungsliste. Vergessen Sie diese Liste. Der Cache ist lediglich ein Hilfsmittel zur Fehlerbehebung. Lassen Sie die zwischengespeicherten Daten in den meisten Fällen einfach dort, wo sie sind, denn sie sorgen unbemerkt dafür, dass jede Website, die Sie erneut besuchen, schneller lädt.
Wann lohnt sich das Leeren des Caches also? Ehrlich gesagt nur in drei Situationen: Eine Website funktioniert nicht mehr oder zeigt nach einem Update immer noch eine veraltete Version aus dem Cache an. In diesem Fall ist fast immer die alte Kopie im Browser-Cache die Ursache; durch das Leeren des Caches wird ein neuer Download erzwungen. Sie haben einen gemeinsam genutzten oder öffentlichen Computer benutzt und möchten die lokalen Spuren Ihrer besuchten Inhalte löschen. Oder Ihr Smartphone hat nur noch ein Gigabyte Speicherplatz und Sie brauchen ihn wieder, da der Browser-Cache unbemerkt auf mehrere Gigabyte anwachsen kann. In allen anderen Fällen bringt das Leeren des Caches nichts. Es verlangsamt Ihren nächsten Besuch auf jeder Website, da der Browser seine Kopien neu erstellt, und einige Browser melden Sie dabei sogar ab. Der häufigste Irrtum: Durch das Leeren des Caches werden weder Ihre Cookies noch Ihre gespeicherten Passwörter gelöscht. Diese werden separat gespeichert und bleiben auch nach dem Leeren des Caches erhalten, es sei denn, Sie aktivieren die entsprechenden Einstellungen.
| Browser | Wo kann der Cache geleert werden? |
|---|---|
| Chrom | Einstellungen, Datenschutz und Sicherheit, Browserdaten löschen, Zwischengespeicherte Bilder und Dateien |
| Firefox | Einstellungen, Datenschutz und Sicherheit, Cookies und Website-Daten, Daten löschen |
| Safari | Einstellungen, Safari, Verlauf und Websitedaten löschen |
| Rand | Einstellungen, Datenschutz, Auswählen, was gelöscht werden soll |
Cache vs. Cookies vs. Puffer: Klarheit im Dschungel der Verwirrung
Drei Begriffe, die oft verwechselt werden, aber alle mit Datenspeicherung zu tun haben. Jeder Begriff erfüllt eine andere Funktion. Ein Cache speichert Kopien von Inhalten, damit Sie beim nächsten Mal schneller darauf zugreifen können. Ein Cookie ist eine kleine Notiz, die eine Website hinterlässt, um sich an Sie zu erinnern: eine Anmeldesitzung, eine Spracheinstellung, eine gespeicherte Präferenz. Er speichert Ihre Identität, nicht die Inhalte selbst. Ein Puffer funktioniert wiederum anders. Er speichert Daten während der Übertragung, wie beispielsweise die wenigen Sekunden eines Videos, die ein Stream vor dem aktuell angezeigten Video lädt. Kurz gesagt: Zwischengespeicherte Daten bleiben zur Wiederverwendung erhalten, ein Cookie merkt sich, wer Sie sind, und ein Puffer leert sich sofort nach der Verwendung.
Was Sie über Cache und Caching wissen sollten
Sobald man einen Cache als nichts anderes betrachtet, als „eine Kopie des langsamen Dateninhalts in der Nähe des Speicherorts zu halten“, erscheint er nicht mehr als Hardwarefunktion, sondern als eine Gewohnheit, die sich durch die gesamte Computerwelt zieht – vom 0,7 Nanosekunden schnellen Abrufen einer Seite durch die CPU bis hin zur Speicherung einer Kopie dieser Seite auf einem Server in der Nähe Ihres Wohnorts. Die praktische Lektion, die das Web noch nicht gelernt hat: Der größte Teil dieser Geschwindigkeit ist kostenlos, und die meisten Websites verzichten trotzdem darauf. Wenn sich das nächste Mal eine Seite blitzschnell öffnet, wissen Sie genau, welche Kopie Ihnen diese Wartezeit erspart hat.