Versagensarten bei Speicherbausteinen

Wie bei vielen anderen physischen Speichermedien ist auch der Inhalt von Speicherbausteinen nicht ewig haltbar, sondern im besten Fall nur 10-15 Jahre. Viele Maschinen, Anlagen und Geräte im Bereich der Investitionsgüter sind mechanisch oft noch in einwandfreiem Zustand, wenn sie nach einigen Betriebsjahren aufgrund unerklärlicher Elektronikprobleme ausfallen. Eine Ursache hierfür kann neben einer defekten Leiterplatte auch der Informationsverlust von Speicherbausteinen sein.

Ändert auch nur eine Speicherzelle ihren Zustand von „0“ nach „1“, entsteht hierdurch eine Maschinenanweisung mit einer gänzlich anderen Wirkungsweise. Fehler in Speicherbausteinen führen häufig zu kaum nachvollziehbaren Fehlerbildern und unerklärlichem Maschinenverhalten. Eine Unterscheidung zwischen Speicherbausteinfehlern, den Fehlern einer defekten Sensorik oder einer defekten Leiterplatte ist oftmals nur schwer möglich.

Die bereits seit den 80er Jahren nur noch selten eingesetzten ROMs und PROMs weisen bauartbedingt die höchste Datenlebensdauer aus, da die Information hier quasi als Hardware „verdrahtet“ vorliegt. Die nachfolgend entwickelten und sehr verbreiteten EPROMs, EEPROMs und Flash-EEPROMs, die auf der MOSFET-Transistor-Technologie basieren, sind dagegen anfällig für verschiedene Ausfallmechanismen, die nachfolgend kurz erläutert werden.

Bereits die natürliche Alterung eines Speicherbausteins führt zwangsläufig irgendwann zu einem Verlust der in den Speicherzellen abgelegten Information. Der Grund hierfür liegt darin, dass die Isolationsschicht der Floating Gates der für die Datenspeicherung zuständigen MOSFET-Transistoren aus physikalischen und prozesstechnischen Gründen nicht perfekt isolierend ist, sondern kontinuierlich eine geringe Anzahl an Elektronen passieren lässt. Dies führt über die Zeit zu einer kontinuierlichen Verringerung der Steuerspannung des MOSFET, bis diese irgendwann ab einer kritischen Schwelle nicht mehr den Zustand „0“, sondern plötzlich wieder den unprogrammierten Zustand „1“ repräsentiert. Dies kann zu einem instabilen Verhalten der Speicherzelle führen, das sich je nach den Umgebungsbedingungen eine zeitlang sporadisch verändern kann. Als typische Lebensdauer gaben die Hersteller bis Anfang 2000 lediglich 10- 15 Jahre an.

Einen sehr großen Einfluss haben hierbei die Qualität des Löschvorganges und der Programmieralgorithmen. Eine lange Datenlebensdauer wird nur erreicht, wenn in allen Speicherzellen ein ausreichend großer Ladungsunterschied zwischen den Speicherzellen mit „0“ bzw. mit „1“ existiert, damit der mit der Zeit fortschreitende natürliche Ladungsverlust möglichst lange hinausgezögert werden kann. Ein aus Kostengründen zu kurz dimensionierter Lösch- und Programmiervorgang kann dazu führen, dass die Unterscheidbarkeit von „0“ und „1“ in manchen Speicherzellen auf Dauer nicht gewährleistet ist. 

Ein vorzeitiger Informationsverlust findet außerdem statt, wenn durch mikroskopisch kleine Produktionsfehler in der Isolierung der Floating Gates die eingebrachten elektrischen Ladungen schneller als geplant abfließen.

Allen Fehlern ist gemein, dass sie nicht unmittelbar während oder nach der Programmierung erkennbar sind, d.h. ein Speicherbaustein kann zwar als korrekt programmiert verifiziert worden sein, jedoch ist der Ladungsunterschied einzelner Zellen nicht hoch genug, um die garantierte Datenlebensdauer zu erreichen.

Neben den oben genannten Fehlermechanismen, die zu einem Verlust des Inhalts einzelner Speicherzellen führen, gibt es elektrische Beschädigungen des Speicherbausteins als dritte Versagensart. Hierzu zählen insbesondere folgende Möglichkeiten:

  • Überspannungen, insbesondere bei empfindlichen CMOS-Halbleitertechnologie, können zum Ausfall einzelner Speicherzellen und interner Steuereinheiten führen. Sind letztere betroffen, wird eine Datenrettung in vielen Fällen unmöglich, da die Speicherzellen nicht mehr adressiert und ausgelesen werden können.
  • Der Effekt der Elektromigration führt insbesondere bei sehr kleinen Halbleiterstrukturen dazu, dass mit der Zeit eine Art „elektrischer Abrieb“ stattfindet und einzelne Zellen oder Funktionselemente eines Speicherbausteins versagen.
  • In einigen Fällen sind Adressleitungen innerhalb oder außerhalb des Speicherbausteins beschädigt, wodurch nur noch ein Teilbereich der Speichermatrix angesprochen und ausgelesen werden kann. Sind in diesem Bereich Programmcode oder Daten hinterlegt, ist eine Datenrettung in seltenen Fällen möglich, wenn die Adressleitung noch einmal reaktiviert werden kann.
  • Ähnlich wie Adressleitungen können auch Datenleitungen intern oder extern beschädigt sein. In diesen Fällen kann bei Kenntnis der verwendeten Programmiersprache der verfälschte Programmcode durch spezielle Algorithmen überprüft und rekonstruiert werden.