Eight-to-Fourteen-Modulation
aus Wikipedia, der freien Enzyklopädie
Eight-to-Fourteen-Modulation (EFM) bezeichnet das Verfahren, nach dem der Datenstrom, der auf CDs und Minidiscs gespeichert ist, codiert wird. Auch der digitale Sound von Laserdiscs ist EFM-codiert. Jedem Byte (Datenblock, bestehend aus 8 Bits), wird dabei ein 14 Bit langes Codewort aus einer Tabelle (definiert für CD-Audio im Red Book, entspricht ISO/EN/DIN 60908 und für CD-ROM im Yellow Book, entspricht ECMA-130) zugeordnet. Zwischen diesen 14-Bit-Codewörtern werden dann noch drei sogenannte Trenn-Bits eingefügt.
Auf einer CD sind die Daten in einer Spur in Form von Vertiefungen (Pits) und dazwischenliegenden Spurabschnitten ohne Vertiefungen (Lands) gespeichert. Ein kurzer Spurabschitt von ca. 1/3 Mikrometer Länge (eine Bitzelle) entspricht einem Bit. Eine Bitzelle mit einem Übergang von Pit zu Land oder von Land zu Pit repräsentiert dabei eine 1, die Bitzellen dazwischen (ohne Übergang) repräsentieren Nullen (NRZ-I-Codierung). Damit eine CD zuverlässig hergestellt und abgespielt werden kann (damit die Pits und Lands lang genug sind, um vom Laser sicher erkannt zu werden), müssen sich zwischen den Einsen mindestens 2 und höchstens 10 Nullen befinden (sogenannte d/k-Bedingung). Durch einen Code, der die d/k-Bedingung erfüllt, braucht eine Bitzelle nur noch 1/3 der Länge zu haben, die sie haben müsste, wenn zwei Einsen (zwei Bitzellen, die einen Übergang haben und damit Anfang und Ende, sprich die Länge, des Pits bzw. des Lands bestimmen) unmittelbar aufeinanderfolgen dürften. Obwohl mehr als doppelt so viele Bits abgespeichert werden müssen, passt wegen der auf 1/3 verkürzten Länge einer Bitzelle im Ergebnis 50 % mehr Information auf die CD.
Bei 14 verwendeten Bits gibt es unter den 214=16384 möglichen Kombinationen 267, die die d/k-Bedingung erfüllen.
Um sicherzustellen, dass auch im Übergangsgebiet zwischen zwei 14-Bit-Codewörtern der Mindestabstand von zwei und der Höchstabstand von 10 Nullen (d.h. mindestens drei und höchstens elf Bitzellenlängen zwischen zwei Übergängen) gewahrt bleibt, werden zwischen den Codewörtern zusätzlich drei sogenannte Trennbits (000, 001, 010 oder 100) eingefügt. Da in den Fällen, in denen 10 Nullen am Ende eines 14-Bit-Codes und 10 Nullen am Anfang des nachfolgenden 14-Bit-Codes durch keine der drei vorstehenden Trennbitkombinationen die d/k Bedingung gewährleistet werden kann, müssen von den o.a. 267 vorhandenen Codewörtern diejenigen mit 9 und 10 Nullen am Anfang und diejenigen mit 9 und 10 Nullen am Ende eliminiert werden. Dies sind 11 Kombinationen, und so können gerade alle 28=256 verschiedenen Werte der 8 Bits des zu speichernden Bytes durch je eine Kombination dargestellt werden.
Ein so codiertes Signal würde - nach dem Zufallsprinzip - mal Abschnitte mit mehr Lands und mal Abschnitte mit mehr Pits aufweisen. Dieser Wechsel würde im hochfrequenten Signal zusätzlich unerwünschte niederfrequente Signalanteile erzeugen, die den Spurfolgemechanismus des CD-Players stören würden. Das Auftreten dieser niederfrequenten Signalanteile wird bei der Codierung durch entsprechende Trennbitauswahl unterdrückt, allerdings ist dies nur möglich, soweit die d/k-Bedingung alternative Trennbitauswahl zulässt, was aber durch die vier möglichen Trennbit-Worte ausreichend abgedeckt ist.
In vielen Fällen besteht nämlich die Möglichkeit, die eine oder die andere Trennbitkombination zu wählen. Beispielsweise kann man bei drei Nullen am Ende des Codewortes und drei oder vier Nullen am Anfang des nächsten Codewortes jede der 4 vorhandenen Trennbitkombinationen wählen. Man wählt die, die zu einer Unterdrückung der niederfrequenten Signalanteile führt. Dabei berechnet man einfach laufend vom ersten Codewort an, wie viele Bitzellen auf den Lands liegen, und zieht die Bitzellen, die in den Pits liegen, davon ab. Das Ergebnis (der sogenannte laufende digitale Summenwert "DSW") liegt nach dem ersten Codewort irgendwo zwischen +8 und -8. Dann berechnet man unter Einsatz der verschiedenen in der jeweiligen Situation zulässigen Trennbitkombinationen (d/k-Bedingung), wie sich der DSW bis zum Ende des nächsten Codewortes entwickeln würde. Man wählt unter den Alternativen diejenige Trennbitkombination aus, bei der der DSW möglichst dicht bei Null liegt. So fährt man fort und wählt immer die Trennbitkombination, die den DSW nahe Null bringt. Dadurch gibt es nie mal mehr Lands und mal mehr Pits, was niederfrequente Signalanteile verursacht, sondern immer gleichmäßig viele Lands und Pits und damit ein niederfrequenzfreies Signal (auch gleichstromminimalisiert genannt).
Die EFM-Modulation wird im Red Book und im Yellow Book im Kapitel "Modulation System" beschrieben. Im DIN/EN Standard 60908 (entspricht inhaltlich dem Red Book) wird sie im Kapitel 13 "EFM-Modulation" und 15 "EFM-Modulator" beschrieben. Im ECMA-130 Standard (entspricht inhaltlich dem Yellow Book, in diesem Punkt jedoch auch dem Red Book) wird sie im Kapitel 19.1 "8-to-14 Encoding" sowie 19.3 "Mergin-Bits" und im Appendix E "Mergin Bits" beschrieben. Die EFM-Modulation war z. B. durch das deutsche Patent DE 3119529 patentiert (durch Zeitablauf erloschen).
[Bearbeiten] EFMplus
Eight-to-Fourteen-Modulation-plus (EFMplus) ist die auf DVDs benutzte Modulation des Datenstroms. Es werden 8-Bit-Bytes auf 16-Bit-Codewörter umcodiert und dann aufgezeichnet.
Die Polarität des Signals muss sich auch hier alle 2 bis 10 Takte (d/k-Bedingung, siehe EFM) ändern. Unterschiedliche Codiertabellen je nach Vorgängercodewort sorgen dafür, dass dies für alle Kombinationen von Nachbarcodeworten passiert und dass das Signalspektrum kaum niederfrequente Anteile enthält, die das Tracking stören würden. Das Verfahren ist komplexer als EFM, dafür werden nur 16 statt 17 Zeittakte für 8 Datenbits benötigt, d.h. es passen ca. 7% mehr Ursprungsdaten auf die Disc.
Bei 216=65536 möglichen Kombinationen gibt es ca. 550 16-Bit-Codewörter, die die d/k-Bedingung erfüllen. Aus diesen eliminiert man dann noch diejenigen, die 10 Nullen am Anfang und die, die 10 Nullen am Ende haben. Dann kann man 4 Codiertabellen generieren, von denen jede 256 verschiedenen Codewörter enthält, die die 256 möglichen Bytes repräsentieren können. Dabei kommen in der ersten Codiertabelle (Status 1) 256 Codewörter mit ausschließlich 2 bis 9 Nullen am Anfang vor, in der zweiten und dritten Codiertabelle (Status 2 und 3) je 256 Codewörter mit ausschließlich 0 bis 5 Nullen am Anfang, und in der vierten Codiertabelle (Status 4) 256 Codewörter mit ausschließlich 0 oder 1 Null am Anfang. In vielen Fällen gibt es Überschneidungen, d.h. dasselbe Codewort kann z.B. sowohl in der Status-1- wie auch in der Status-2-Codiertabelle stehen, repräsentiert dann aber dasselbe Byte. Gleiches gilt für Codewörter in den Status-3- und Status-4-Codiertabellen. Die Status-2- und Status-3-Codiertabellen sind so gefertigt, dass sie sich nicht überschneiden. Alle Codewörter in der Status-2-Codiertabelle haben an Bitposition 3 und 15 jeweils eine Null, alle Codewörter in der Status-3-Codiertabelle haben an Bitposition 3 und 15 wenigstens eine Eins. Anhand dieses Merkmals kann man bei den Codewörtern mit 0 bis 5 Nullen am Anfang feststellen, ob sie aus der Status-2- oder der Status-3-Tabelle stammen.
Abhängig von der Anzahl Nullen, die ein Codewort am Ende hat, wird das nächste Codewort aus der entsprechenden Status-Codiertabelle gewählt. Endet das letzte Codewort z.B. auf 6 bis 9 Nullen muss das nächste Codewort aus der Status-4-Codiertabelle gewählt werden, in der nur Codewörter mit 0 oder 1 Null am Anfang stehen, endet er z.B. auf 0 oder 1 Null, muss das nächste Codewort aus der Status-1-Codiertabelle gewählt werden, in der nur Codewörter mit 2 bis 9 Nullen am Anfang stehen. Dadurch wird sichergestellt, dass immer wenigstens 2 und nie mehr als 10 Nullen auf eine Eins folgen (d/k-Bedingung). Dies stellt eine um 50% erhöhte Datendichte sicher (siehe EFM). Dies sichert jedoch noch nicht die Unterdrückung niedriger Frequenzen, die unerwünscht sind, weil sie den Spurfolgemechanismus (Tracking) stören.
Die Besonderheit des Codes liegt bei den Codewörtern, die auf 2 bis 5 Nullen enden. Diese Codewörter stehen in derselben Status-Codiertabelle jeweils zweimal und repräsentieren dabei zwei verschiedene (8-Bit-)Bytes, sie sind also nicht eindeutig. Deshalb kann ein Decoder, wenn er im Datenstrom auf eine solches Codewort trifft, dieses nicht ohne eine Zusatzinformation entschlüsseln, die angibt, welches Byte denn durch dieses zweideutige Codewort repräsentiert wird. Diese Information befindet sich im nachfolgenden Codewort: Da diese zweideutigen Codewörter auf 2 bis 5 Nullen enden, muss das jeweils nachfolgende Codewort 0 bis 5 Nullen am Anfang haben (d/k-Bedingung), also entweder aus der Status-2- oder der Status-3-Codiertabelle stammen. Stammt dieses Nachfolge-Codewort aus der Status-2-Codiertabelle (d.h. hat es an Bitposition 3 und 15 jeweils eine Null) repräsentiert das zweideutige vorangehende Codewort das eine Byte, anderenfalls das andere.
Durch diese Doppeltbelegung von Codewörtern werden in allen vier Codiertabellen jeweils wenigstens 88 Codewörter frei, die in vier sogenannten Alternativcodiertabellen aufgenommen werden und damit 88 (der 256 möglichen) Bytes noch einmal in allen 4 Status repräsentieren (hier werden nicht zwei unterschiedliche Bytes durch dasselbe Codewort repräsentiert, sondern dasselbe Byte durch zwei unterschiedliche Codewörter). Die Codewörter der Alternativcodiertabellen sind so gewählt, dass sie den laufenden digitalen Summenwert (siehe EFM) gegenteilig beeinflussen zu dem Einfluss, den das Codewort desselben Status der Hauptcodiertabelle hat. Bei der Codierung wird in den Fällen, in denen das Codewort alternativ aus der Haupt- oder der Alternativcodiertabelle gewählt werden kann, so gewählt, dass der laufende digitale Summenwert möglichst dicht bei Null bleibt.
Bei den restlichen 168 Bytes, für die es nur die Haupttabelle und keine Alternativtabelle gibt, kann der digitale Summenwert (und damit der niederfrequente Signalanteil) noch dadurch beeinflusst werden, dass es manchmal zulässig ist, anstelle eines Codewortes aus der Status-1-Tabelle ein Codewort aus der Status-4-Tabelle (oder umgekehrt) zu verwenden. Dies ist nur zulässig, wenn die Anzahl der Nullen am Ende des vorangehenden Codewortes und die Anzahl Nullen am Anfang des nachfolgenden Codewortes insgesamt nicht die d/k-Bedingung (mindestens 2, maximal 10 Nullen) verletzen, was von Fall zu Fall geprüft werden muss. In diesen Fällen wird bei der Codierung das Codewort verwendet, das den digitalen Summenwert möglichst dicht bei Null hält.
Durch beide Maßnahmen wird – wie bei der EFM-Modulation – das Signal möglichst frei von niederfrequenten Signalanteilen gehalten.
Die EFMplus Modulation ist im Standard "DVD-Specifications for Read-Only Disc, Part 1, Physical Specifications" der DVD Format Logo Licensing Corporation (DVD-FLLC) im Kapitel 3.3 "Modulation Method (8/16 Modulation)" als Standard für alle DVD-Discs standardisiert. Im inhaltlich gleichen Standard ECMA-267 ist sie im Annex G "8-to-16 Modulation with RLL (2,10) requirements" und im Kapitel 22 "Suppress control of the d.c. component" beschrieben. Die EFMplus Modulation ist u.a. durch die Europäischen Patente EP 0 745 254 und EP 0 789 910 patentiert.
Der Erfinder von EFM und EFMPlus ist Kees A. Schouhamer Immink.
[Bearbeiten] Weblinks
- CD-Standard (physikalischer Aufbau): http://www.ecma-international.org/publications/files/ECMA-ST/Ecma-130.pdf (siehe Annex D)
- DVD-Standard (physikalischer Aufbau): http://www.ecma-international.org/publications/files/ECMA-ST/Ecma-267.pdf (siehe Annex G)
Physisch: Magnetisierung | Longitudinal Recording | Perpendicular Recording | GMR-Effekt | TMR-Effekt
Logisch: Frequency Modulation (FM) | Modified Frequency Modulation (MFM) | Group Coded Recording (GCR) | Run Length Limited (RLL) | Partial Response/Maximum Likelyhood (PRML) | Extended Partial Response/Maximum Likelyhood (EPRML) | Eight-to-Fourteen-Modulation (EFM)