CD-Player
Die CD ist eine Kunststoffscheibe mit 12cm Durchmesser (Aufbau und Fertigung einer CD siehe Anhang A). Auf ihr sind die Informationen in einer spiralförmig verlaufenden Spur aufgebracht. Die Spur verläuft hierbei von innen nach außen. Träger der Information sind kleine Vertiefungen, die sogenannten Pits . Die Pitlänge und der Abstand zwischen den einzelnen Pits bilden einen seriellen digitalen Code, der die gespeicherte Information repräsentiert.
Auf einer CD können maximal 99 Musiktitel gespeichert werden (oder bezogen auf die Computertechnik: auf einer CD finden bis über 600MB, das entspricht ca. 5*109 bit).
Neben den eigentlichen "Nutzdaten" befinden sich aber noch weitere Informationen auf der CD. Mit Hilfe eines auf der Pitspur untergebrachten Zeitcodes existiert für jedes Musikstück bzw. Track eine Angabe über Startzeit und Spieldauer. Weiterhin kann durch die Zeitcodeaufteilung jedes der 99 Musikstücke in 99 Unterabschnitte (Indizes) aufgeteilt werden. Dies hat den Vorteil, daß sich einzelne Passagen genau ansteuern lassen. Zusätzlich sind alle Zeitangaben über die Musiktitel sowie eine Angabe über die Anzahl der Musikstücke in einer Art Inhaltsverzeichnis am Anfang der Pitspur untergebracht. Dieses Verzeichnis wird im CD-System als TOC (Table of Content) bezeichnet ähnlich dem FAT (File Alocation Table) auf der Festplatte. Bei jedem Laden einer CD oder bei jedem Startvorgang wird der TOC in den Ablaufrechner eingelesen. Ebenfalls befindet sich im TOC eine Angabe über die Art der gespeicherten Informationen (Musik, Text, Computerdaten, etc.).
Die digitale Verarbeitung der Audiosignale erfolgt nach dem Prinzip der PCM-Technik (Puls Code Modulation). In der PCM-Technik wird das analoge Signal in eine Folge einzelner Impulse zerlegt, deren Amplitudenwerte in binärer Form dargestellt werden.
Vorbedingung für die PCM ist eine PAM (Puls Amplituden Modulation). Mit Hilfe der PAM wird das Audiosignal in eine Folge von zeitdiskreten Impulsen umgewandelt, wobei jeder PAM-Impuls einen (anderen) Amplitudenwert besitzt. Diese Umwandlung in Impulse ist deswegen notwendig, da ein ADC immer nur einen einzelnen Amplitudenwert verarbeiten kann.
Die einzelnen PAM-Impulse werden mit einem Sample und Hold Glied erzeugt.
Mit Hilfe eines schnellen Schalters werden aus dem analogen Eingangssignal kontinuierlich Proben entnommen. Dieser Vorgang der wiederholten Probenentnahme bezeichnet man als Abtastung . Der zum Abtastzeitpunkt vorhandene Amplitudenwert wird in dem
S&H-Kondensator bis zum nächsten Abtastwert gespeichert. Die Höhe der im
S&H-Kondensator gespeicherten Spannung entspricht dem PAM-Amplitudenwert.
Ein angetastetes Signal läßt sich dann wieder hinreichend ohne Informationsverlust rekonstruieren, wenn die Abtastfrequenz fs mindestens doppelt so hoch ist wie die höchste im abzutastenden Signal vorkommende Frequenz fmax . Dabei sollte die Abtastfrequenz konstant bleiben.
fs 2fmax
Die theoretischen Grundlagen für die Umwandlung eines wert- und zeitkontinuierlichen Signals in ein zeitdiskretes Signal wurden schon sehr früh von mehreren Wissenschaftlern, u.a. von Nyquist und Shannon erarbeitet. Shannon erbrachte den mathematischen Beweis dafür, daß ein durch Abtastung entstandenes Signal den gleichen Informationsgehalt aufweist wie das ursprüngliche zeitkontinuierliche Signal. Dieser Beweis gilt aber nur unter besonderen Voraussetzungen, welche im Shannonschen Lehrsatz oder Abtasttheorem zusammengefaßt sind (s.o.).
Nun stellt sich die Frage, warum das Abtasttheorem bei der Abtastung eines Analogsignals beachtet werden muß.
Dazu muß folgende Skizze betrachtet werden:
Bild a zeigt ein beliebiges Eingangssignal UE und dessen Spektrum.
Bild b zeigt das periodisch erscheinende Abtastsignal S. Die spektrale Darstellung des Abtastsignals zeigt eine Energieverteilung bei der Abtastfrequenz fs und deren ganzzahligen Vielfachen.
Bild c zeigt das Ausgangssignal UA der S&H-Schaltung, dargestellt mit den diskreten
PAM-Impulsen unterschiedlicher Amplitude. Die spektrale Darstellung der PAM-Impulse zeigt jetzt neben dem ursprünglichen Spektrum (Basisband) zusätzliche Energiespektren, die sich aus den Seitenbändern um das Abtastsignal und dessen Vielfachen bilden.
Ist die Abtastfrequenz nun zu klein gewählt, kann es zu Überlappungen des Basisbandes mit dem Seitenband von fs kommen.
In voriger Skizze (z.B.) ist zu erkennen, daß ein Audiosignal mit einer oberen Grenzfrequenz von 20kHz mit einer Frequenz von 35k'Hz abgetastet wird. Im Bereich von 15kHz bis 20kHz kommt es zu einer Überlappung von Basisband und Störband. Signalanteile in diesem Bereich werden verfälscht und können nicht mehr rekonstruiert werden. Man spricht in diesem Fall von Unterabtastung. Die durch die Überlappung entstehenden Signalverfälschungen werden in der digitalen Signalverarbeitung mit Aliasing- oder Faltungsverzerrungen bezeichnet.
(Details von und Maßnahmen gegen diese Verzerrungen siehe Kapitel 2.4)
Die Abtastfrequenz stellt den wichtigsten Parameter in der digitalen Audiotechnik dar. Durch die Festlegung der Abtastfrequenz werden der Frequenzbereich des zu übertragenden Audiosignals und die Bandbreite des Übertragungssignals bestimmt. Innerhalb eines digitalen Audiosystems ist eine einheitliche Abtastfrequenz erforderlich - außerdem setzen digitale Schnittstellen eine genormte Abtastfrequenz voraus.
Setzt man für eine HiFi-Wiedergabe eine obere Grenzfrequenz des Audiosignals von 20kHz fest, muß nach dem Abtasttheorem die Abtastfrequenz mindestens 40kHz betragen. Aus Sicherheitsgründen wählt man die Abtastfrequenz aber etwas höher.
Die Wahl der Abtastfrequenz hängt z.T. mit der technischen Entwicklung in der digitalen Audiotechnik und der Entwicklung in der Fernseh- und Videotechnik zusammen.
Beim Videorecorder war es notwendig, eine Abtastfrequenz zu wählen, die einerseits eine obere Grenzfrequenz von 20kHz und andererseits in einem festen Bezug zur Zeilenfrequenz des jeweiligen Fernsehsystems lag.
Daraus ergaben sich folgende Abtastfrequenzen:
CD-Systeme: 44,1kHz
Digitaler Satellitenhörfunk 32kHz
PAL 44,1kHz bzw.
NTSC 44,056kHz für PCM-Aufzeichnung am Videorecorder
Laut Abtasttheorem dürfen sich im abzutastenden Eingangssignal keine Signalanteile mit einer höheren Frequenz als 0,5fs befinden. D.h. der Frequenzbereich des Eingangssignal muß vor der Abtastung begrenzt werden.
Für diese Bandbegrenzung wird ein Tiefpaßfilter - ein sogenannter Anti-Aliasingfilter - verwendet, der folgende Eigenschaften aufweisen sollte:
Geradliniger Verlauf bis zur oberen Grenzfrequenz
Steile Flanken
Niedriger Klirrfaktor (für das menschliche Ohr bedeutet ein Klirrfaktor unter 1% "gut")
Geringe Phasenverzerrung
Konstante Gruppenlaufzeit
Eigenrauschen geringer als das des gesamten digitalen Systems
Doch auch wenn ein ideales Filter verwendet werden würde, könnten nicht alle Anforderungen völlig erfüllt werden (ideales Filter: unendliche steile Flanken; unendliche Laufzeit durch das Filter - Beweis, daß es nicht funktioniert kann aber auch nicht angetreten werden, da unendliche Laufzeit: vorne ein Signal rein T unendliche Wartezeit am Ausgang).
Reale Filter mit steilen Flanken zeigen oft starke Phasenverzerrungen beim Übergang vom Durchlaß- in den Sperrbereich, starkes Ein- und Ausschwingverhalten sowie eine große Welligkeit im Durchlaßbereich.
Durch aufwendige Dimensionierungen kommt man jedoch den gewünschten Eigenschaften schon sehr nahe. Anti-Aliasing-Filter werden in der Regel als "mehrstufige" (mehrpolige), passive LC-Tiefpaßfilter ausgeführt (nach Tschebyschev).
In der Unterhaltungsindustrie ist man jedoch schon dazu übergegangen, diese Art von Filter durch aktive zu ersetzen (Verstärkerstufen, bei denen durch geeignete Rückkopplung der gewünschte Filterverlauf bestimmt werden kann).
Mit Hilfe von einer S&H-Schaltung ist es möglich das bandbegrenzte Eingangssignal abzutasten.
Folgende Skizze zeigt das Prinzipschaltbild einer S&H-Schaltung. Sie besteht im wesentlichen aus einem Analogschalter, einem Speicherkondensator und den entsprechenden Pufferstufen.
Der Analogschalter wird vom Abtastimpuls geschlossen und geöffnet. (z.B. bei einer Abtastfrequenz von 44,1kHz geschieht das alle 22,7µs).
Ist der Schalter geschlossen, folgt die Ausgangsspannung der Eingangsspannung und der Kondensator wird auf den momentanen Amplitudenwert aufgeladen. Wird der Analogschalter jetzt geöffnet, bleibt im Kondensator die Spannung des letzten Amplitudenwertes gespeichert - am Ausgang kann jetzt diese Spannung unabhängig von der Anderung der Eingangsspannung weiterverarbeitet werden.
(Schalter geschlossen T Sample-Phase ; Schalter offen T Halte-Phase)
Alle S&H-Schaltungen produzieren Fehler. Die ersten Fehler entstehen schon während der Sample-Phase: Damit die abgetasteten Amplitudenwerte so original wie möglich abgespeichert werden, muß bei den relativ kurzen Abtastintervallen von z.B. 22,7µs der Kondensator theoretisch unendlich schnell geladen werden. Bedingt durch den Innenwiderstand des Analogschalters und der vorhergehenden Treiberstufe, erfolgt die Ladung des Kondensators nicht sprunghaft, sondern mit einer Anstiegsgeschwindigkeit, die von einer Zeitkonstanten bestimmt wird. Die Zeit, die vergeht, bis der Kondensator aufgeladen ist, wird als Acquisition Time bezeichnet.
Während der Halte-Phase wird die im Kondensator gespeicherte Spannung weiterverarbeitet - d.h. die Ladespannung darf sich nicht verändern.
In der Realität jedoch entlädt sich der Kondensator in der Halte-Phase über sein Dielektrikum, sowie über Rest- und Sperrwiderstände der Schaltung. Dieser Verlust wird als Drooping bezeichnet.
Ein weiterer Fehler tritt auf, da Ladewiderstand und Hold-Kondensator ein Tiefpaßfilter bilden, wodurch der Frequenzgang der S&H-Schaltung beeinflußt wird (Aperturfehler ).
Die mit dem S&H-Glied aus dem Eingangssignal gewonnenen zeitdiskreten Amplitudenwerte sind aber immer noch analoge Signale. Die Umwandlung der einzelnen Amplitudenwerte in ein binäres digitales Signal erfolgt in einem Analog-Digital-Wandler. Ein am Eingang des Wandlers liegender Abtastwert erscheint am Wandlerausgang als binäres Datenwort.
Theoretisch können am Eingang des ADC Abtastimpulse mit unendlich vielen unterschiedlichen Amplitudenwerten auftreten. Dem Wandler selbst steht aber nur eine bestimmte Anzahl binärer Datenwörter zur Darstellung der Eingangsgröße zur Verfügung.
z.B. 3-bit ADC:
Die Zuordnung eines Amplitudenwertes zu einem binären Datenwort nennt man Quantisieren.
Neben der Abtastfrequenz stellt die Quantisierung den wichtigsten Parameter der digitalen Signalverarbeitung dar. Je größer die Quantisierung, also die Breite des Datenwortes, ist, desto genauer kann das Eingangssignal wieder rekonstruiert werden.
Jeder quantisierte Abtastwert stellt eine Information über das ursprüngliche Signal dar und repräsentiert den statistischen Mittelwert zwischen zwei Abtastwerten. Amplitudenänderungen zwischen zwei Abtastwerten werden nicht hinreichend genau erfaßt. Es kommt zu einem Quantisierungsfehler .
Die durch den Quantisierungsfehler fehlende Information macht sich im rückgewandelten Audiosignal als Störgeräusch bemerkbar, das sich wie überlagertes weißes Rauschen verhält. Aus diesem Grund bezeichnet man dieses Störgeräusch als Quantisierungsrauschen . Reduziert werden kann das Quantisierungsrauschen durch eine Erhöhung der Quantisierung, da dann mehr Datenwörter zur Darstellung der Eingangsinformation zur Verfügung stehen.
Siehe MSRT 3. und 5. Klasse
Das Ausgangssignal des ADC liefert eine binäre Aussage über die Höhe des Amplitudenwertes am Eingang. Es enthält jedoch keine Aussage, ob der abgetastete Wert aus der positiven oder der negativen Halbwelle entnommen wurde. Demzufolge muß bei der Umwandlung eines bipolaren Signals das binäre Ausgangssignal des ADC so beeinflußt werden, daß eine automatische Polaritätserkennung stattfindet. Hierzu wird das Ausgangssignal des ADC in einen Code überführt, der eine Aussage über den Amplitudenwert und die Polarität des ursprünglichen Eingangssignals zuläßt. In der Elektronik sind verschiedene sog. Bipolare Codes bekannt, die das Vorzeichen mit berücksichtigen.
Für die digitale Audiosignalverarbeitung wird in der Regel der Zweikomplement-Code verwendet. Bei dieser Codierung werden positive Zahlen im normalen Binär-Code dargestellt. Negative Zahlen werden durch das Zweierkomplement des Zahlenwertes dargestellt. Das Zweierkomplement einer Zahl n entsteht durch Invertieren der Zahl n und Addition einer 1.
z.B. die Zahlen +5 und -5:
Die Zahl +5 wird durch den normalen Binärcode dargestellt: +5 0101
Die Zahl -5 ergibt folgendes Datenwort: 5 0101 T invertiert 1010
+1 addiert 1
1011
Das Zweierkomplement der Zahl -5 hat also den binären Wert 1011.
In diesem Code kann das Vorzeichen einer Zahl immer an der Wertigkeit des MSB festgestellt werden. Für positive Zahlen ist das MSB immer 0, für negative Zahlen immer 1.
Das so codierte Ausgangssignal des ADC stellt das eigentliche PCM-Signal dar. In der digitalen Signalverarbeitung bezeichnet man das vom Codierer abgegebene Signal als quellcodiertes Signal , den gesamten Vorgang nennt man Quellcodierung.
Dieses Blockschaltbild zeigt nochmals im Detail die einzelnen Stufen vom Analogsignal zum quellcodierten PCM-Signal.
Soll ein digitalisiertes Audiosignal wieder hörbar gemacht werden, so muß das PCM-Signal wieder in eine wert- und zeitkontinuierliche Signalform umgewandelt werden.
Im wesentlichen ist der Rückwandlungsprozeß eine Umkehrung der AD-Wandlung. Aus dem PCM-Signal werden mit Hilfe eines DAC wieder pulsamplitudenmodulierte Signale erzeugt (PAM-Impulse). Eine S&H-Schaltung vergrößert die Breite der einzelnen PAM-Impulse und beseitigt vom DAC verursachte Störungen. Ein anschließendes Tiefpaßfilter integriert die PAM-Impulse und formt die analoge Signalform.
Der DAC setzt die binäre Zahlenfolge des PCM-Signals in einen Spannungsimpuls um. Die Amplitude des Spannungsimpulses ist hierbei proportional zur Wertigkeit des angelegten PCM-Signals. Bei der niedrigsten Wertigkeit des PCM-Signals gibt der DAC seine kleinste Ausgangsspannung ULSB ab. Die maximale Ausgangsspannung ergibt sich durch die höchste Wertigkeit des PCM-Signals.
Siehe MSRT 3. und 5. Klasse
Beim Wechsel zwischen zwei Umsetzvorgängen treten im DAC zusätzliche Störsignale auf, die als Gliche bezeichnet werden.
Glitche entstehen durch ungleichmäßiges Schalten der Analogschalter am Eingang des DAC. Am häufigsten treten Glitche in der Mitte des binären Wertebereichs auf, nämlich dann, wenn der Schalter für das MSB geschlossen und alle anderen Schalter geöffnet sind. Erniedrigt sich z.B. die Eingangswertigkeit um 1, öffnet der Schalter für das MSB und alle anderen Schalter schließen. Öffnet der MSB-Schalter früher oder später als die anderen Schalter, wird für kurze Zeit ein falscher binärer Eingangswert vorgetäuscht. Der Ausgang des DAC springt demzufolge für kurze Zeit zu positiven oder negativen Werten hin.
Da sich Glitche als hörbare Verzerrungen bemerkbar machen können, dürfen sie nicht zum Ausgang gelangen. Um die Glitche zu beseitigen, schickt man das Ausgangssignal des DAC nochmals über eine S&H-Schaltung. Hier wird es mit der gleichen Abtastfrequenz wie bei der AD-Wandlung abgetastet. In der vorigen Skizze ist zu erkennen, wie hierdurch der störfreie Teil des Ausgangssignals herausgetastet wird. Die S&H-Schaltung zum Abtasten der Glitche wird als Deglitcher bezeichnet.
Durch das Halteglied wird das nur kurz andauernde Ausgangssignal des DAC verlängert. In der Regel ist die Breite der Deglitcher-Impulse so gewählt, daß sie der Hälfte eines Abtastintervalls entspricht. Vereinzelt trifft man in der Praxis auf DAC, in deren Wandlermodul der Deglitcher bereits integriert ist.
Die vom Deglitcher aus dem DAC-Signal geformten "sauberen" PAM-Impulse stellen noch nicht die endgültige analoge Signalform dar. Erst durch die integrierende Wirkung eines nachfolgenden Tiefpaßfilters wird die ursprüngliche Audioinformation wiederhergestellt.
Neben der Integration der PAM-Impulse kommt dem Ausgangstiefpaßfilter aber noch eine weitere bedeutende Aufgabe zu. Die Umwandlung der PCM- in einzelne PAM-Impulse durch den DAC stellt wieder einen Abtastprozeß dar. Folglich entsteht am Ausgang des DAC eine Frequenzspektrum aus Basisband und Störspektrum. Das Störspektrum setzt sich wieder aus den Seitenbändern um die Abtastfrequenz und deren Vielfachen zusammen. Erreichen die unerwünschten Störspektren die nachfolgenden analogen Signalstufen, kann es zur Bildung von unerwünschten Mischprodukten kommen, deren Energieanteile im Bereich des Basisbandes liegen können.
In jedem Fall muß aber sichergestellt werden, daß das von einem digitalen Audiosystem abgegebene analoge Signal frei von unerwünschten Frequenzspektren ist.
Das quellcodierte Audiosignal stellt eine Folge von 0-1-Werten dar. Da jeder einzelne binäre Wert für die Dauer eines Bits einem L- oder H-Pegel entspricht, kann eine solche Folge nicht ohne besondere Maßnahmen über eine Übertragungsstrecke geschickt werden.
Mit Hilfe der Kanalcodierung wird das digitale Audiosignal an die Eigenschaften des Übertragungskanals angepaßt. Der entstehende Kanalcode legt fest, in welchem Format die binären Werte elektrisch im Übertragungskanal dargestellt werden.
Jeder Übertragungskanal besitzt spezifische Eigenschaften, die das zu übertragende Signal mehr oder weniger stark beeinflussen (z.B. besteht ein Unterschied zw. CD und Tonband).
Elektrisch gesehen kann das Ausgangssignal des ADC (z.B. serielles 16bit digitalisiertes Audiosignal) aus mehreren ununterbrochenen Folgen von L- und H-Pegeln bestehen. Für den Übertragungskanal bedeutet eine solche Folge eine Ansteuerung mit reinen Gleichspannungswerten.
Ein nur in größeren Abständen folgender Pegelwechsel stellt für den Übertragungskanal eine sehr niederfrequente Information dar.
Für den Fall, daß die 0-1-Werte stetig wechseln, kann das Signal als hochfrequente Schwingung mit der Frequenz der halben Datenrate angesehen werden.
Nun ist zu erkennen, daß ein Übertragungskanal mit ausgeprägten Bandpaßeigenschaften nicht direkt mit diesem Signal angesteuert werden kann.
Hinzu kommt die Tatsache, daß Übertragungskanäle Zeitbasisfehler produzieren, die eine korrekte Auswertung der seriellen Datenfolge erschweren.
Aus diesem Grund muß ein quellcodiertes Digitalsignal so aufbereitet werden, daß eine störungsfreie Übertragung des gesamten Informationsgehalts des Signals möglich ist.
In der digitalen Audiotechnik wird das digitale Signal eben durch die Codierung an den jeweiligen Übertragungskanal angepaßt.
Kanalcodes sollen gleichspannungsfrei sein und keine niederfrequenten Signalanteile besitzen. Nur so können Signale auf Magnetband aufgezeichnet werden oder über Schaltungen mit Hochpaßcharakter geführt werden. (Hochpaßcharakter wird von Wiedergabeschaltungen verlangt, um niederfrequente Störungen ausfiltern zu können)
Durch die Kanalcodierung werden im seriellen Datensignal zusätzliche Pegelwechsel eingeführt. Die spektrale Energieverteilung muß hierbei so gewählt werden, daß oberhalb der Grenzfrequenz des Kanals keine Energieanteile auftreten, die noch Information enthalten. (außerdem: endlich kleine Breite des Kopfspaltes bei Magnetband !)
Bei der seriellen Datenübertragung wird kein zusätzlicher Takt mit übertragen. Demzufolge muß der Kanalcode so beschaffen sein, daß sich am Ende der Übertragungsstrecke der Takt aus den Flanken des Datensignal ableiten läßt
(siehe Taktrückgewinnung ).
Auf einer CD sind natürlich nicht nur die reinen Daten des digitalisierten Audiosignals vorhanden, sondern noch Daten der Fehlerkorrektur, des Zeitcodes sowie Steuer- und Anzeigedaten. Weitere Zusatzinformationen entstehen durch die Überführung der Quellcodierung in die Kanalcodierung. Im Aufnahmeprozeß werden alle Daten zusammengefaßt und dem "Schreiblaser" zugeführt.
Die Umwandlung der analogen Signale in digitale Signale erfolgt für jeden Stereokanal getrennt.
Ahnlich wie in normalen Audio-Recordern wird auch im CD-System eine Pre-Emphasis zur Verbesserung des Fremdspannungsabstandes bei hohen Frequenzen verwendet.
Hierbei kann zwischen den Zeitkonstanten t =50µs und t =15s gewählt werden. Je nach Wahl erfolgt die Höhenanhebung mit 6dB/Oktave bei 10,6kHz (15µs) bzw. bei 3,18kHz (50µs). Eine Kennung, welche Pre-Emphasis verwendet wurde, befindet sich in der Zusatzinformation.
Nach der Pre-Emphasis erfolgt eine Bandbegrenzung auf 20kHz. Anschließend wird das analoge Eingangssignal in einer S&H-Schaltung mit 44,1kHz abgetastet und in einem ADC linear quantisiert.
Über einen Multiplexer werden jetzt beide digitale Signale zeitlich verschachtelt und auf den weiteren Signalweg geschaltet.
Bevor die digitalen Audiosignale über den weiteren Signalweg gehen, werden Maßnahmen zur Fehlerverdeckung und Fehlerkorrektur getroffen. Hierzu fügt man den Quelldaten weitere Daten hinzu, verschachtelt die Daten untereinander und verschlüsselt die gesamte Datenstruktur nach einem bestimmten Code.
Wie schon erwähnt befinden sich auf der CD zusätzliche Daten, die Information über die Organisation der abgespeicherten Daten enthalten. Diese Daten nennt man Kontrollsignal .
Ein solches Kontrollsignal besteht aus einem 8 Bit-Symbol, das nach jeweils 6 Abtastwerten der bisherigen Frame-Struktur hinzugefügt wird.
Die 8 Bit des Kontrollsignals werden alphabetisch von P bis W gekennzeichnet.
8 Bit innerhalb eines Frames reichen jedoch nicht aus, um alle Zusatzinformationen übertragen zu können. Aus diesem Grund bildet man aus den Kontrollsignal-Symbolen von 98 aufeinanderfolgenden Frames einen weiteren Datenblock.
Einen solchen Datenblock nennt man Steuersignalblock .
Bildung des Steuersignalblocks
(Subcode) aus 98 aufeinander-
folgenden Frames
Der Informationsgehalt der einzelnen Subcode-Kanäle wurden in einer Norm festgelegt. Für das CD-System werden zur Zeit nur die Subcode-Kanäle P und Q genutzt. In den Kanälen R bis W sind Informationen für Grafik- und Schrifteinblendungen vorhanden.
Die P-Kanaldaten kündigen den Start eines Musikstücks an. Man bezeichnet die Bits des P-Kanals deshalb auch als Flag-Bits oder Kennzeichenbits .
Im Einlaufbereich der CD liefert de P-Kanal nur L-Signale. 2 bis 3 Sekunden vor dem ersten Musikstück erfolgt ein Wechsel auf H-Pegel und während des Stückes auf L-Pegel.
Zwischen den Musikstücken springt das P-Bit wieder auf H-Pegel.
Nach dem letzten Stück verweilt das P-Bit 2 bis 3 Sekunden auf H-Pegel.
Im Auslaufbereich liefert der P-Kanal für 2 bis 3 Sekunden L-Signal und dann ein mit 2Hz intermittierendes H-L-Signal.
Der Q-Kanal enthält alle Informationen, die der Mikroprozessor der Ablaufsteuerung im CD-Player zum Abspielen benötigt.
Die beiden ersten Bits S0 und S1 dienen zur Synchronisation bei der späteren Subcode-Demodulation.
Anschließend folgen 4 Kontrollbits, die Informationen über Pre-Emphasis und Anzahl der Audiokanäle enthalten. Sie sind wie folgt definiert:
0000 = 2 kanalig , keine Pre-Emphasis
1000 = 4 kanalig , keine Pre-Emphasis
0001 = 2 kanalig , mit Pre-Emphasis
1001 = 4 kanalig , mit Pre-Emphasis
Nach den Kontrollbits folgen 4 ADR-Bits, die Informationen über die verschiedenen Betriebsarten (Modi) der Q-Bits enthalten:
0001 = Modus1 = Angaben über Anzahl der Musiktitel, Indizierung, Einzel- und Gesamtspielzeit
0010 = Modus2 = Angaben über die Katalogisierung der CD
0011 = Modus3 = Angaben zur Identifizierung der Aufnahme nach ISRC
(International Standard Recording Code)
Da der Subcode von einer seriellen Information aus 98 Frames gebildet wird und er nach der CIRC-Codierung in den Datenstrom eingefügt wird, muß für ihn ein eigenes Fehlerkorrektursystem eingesetzt werden. Zur Fehlerkorrektur der Subcode-Daten wird ein CRC-Fehlerkorrekturcode (CRC = Cyclic Redundancy Check) verwendet. Der CRC-Code ist ein zyklischer Fehlerkorrekturcode, der die Redundanzbits durch Polynome aus den Informationen der Kontroll-, ADR- und der Q-Datenbits errechnet.
(Seine Arbeitsweise ist ähnlich der bei der Datensicherung in Floppy-Disc-Systemen verwendeten)
Die Informationen der Kanäle R bis W dienen zur Darstellung von Schrift- und Bildgrafik auf einem Monitorbildschirm.
Zur Wiedergabe der auf der CD gespeicherten Informationen wird die Pitstruktur berührungslos von einer Laser-Lichtquelle (Laserstrahl) abgetastet. Die Abtastung erfolgt hierbei von der Rückseite der CD. Die verspiegelte und von den Pits strukturierte Informationsebene moduliert das reflektierte Laserlicht, das dann in einer Fotodetektoreinheit in eine elektrische Signalform umgewandelt wird.
(Light Amplification by Stimulated Emission of Radiation)
Um bei der Abtastung der Informationsebene zwischen hinlaufendem und reflektiertem Licht unterscheiden zu können, muß eine Lichtquelle verwendet werden, deren Strahlen kohärent (T wenn zw. mehreren Wellenzügen des Lichtes eine gleichmäßige Phasenbeziehung besteht) und monochromatisch ist. Beide Bedingungen werden vom Laser erfüllt. Weiters besitzt der Laser den Vorteil, daß sich seine Strahlen zu einem feinen Lichtpunkt fokussieren lassen.
Zur Abtastung der CD wird ein Halbleiterlaser verwendet (einfache Herstellbarkeit, niedriger Preis).
Im Abtastsystem erfolgt die Erzeugung und Bündelung des Laserlichtes, die Trennung von hinlaufendem und reflektiertem Licht und die Auswertung des reflektierten Lichtes durch den Fotodetektor.
Ein Abtastsystem besteht aus einer Anordnung von optischen und elektrischen Bauteilen, die zu einer kompletten gekapselten Funktionseinheit zusammengefaßt werden.
Der Laserstrahl hat am Ausgang der Laserdiode einen sehr geringen Durchmesser und eine divergierende Tendenz. Aus diesem Grund befindet sich hinter der Laserdiode eine Kollimatorlinse , derer Aufgabe es ist, einen eintreffenden Lichtstrahl zu bündeln und einen definierten Durchmesser zu erzeugen.
Da ist eine Kombination aus zwei normalen Prismen, an deren Trennfläche ein Polarisationsfilter eingefügt ist (vgl. Physik 4. Klasse).
Die Aufgabe des Polarisationsprismas besteht darin, das nichtpolarisierte Licht des Lasers für den weiten Weg durch da Abtastsystem zu polarisieren. Die Funktion des Prismas beruht auf der Eigenschaft der Doppelbrechung eines Lichtstrahls durch ein nichtreguläres Kristallgefüge.
Da der Aufnahmevorgang schon detailliert dargestellt wurde, werden hier nur mehr Besonderheiten der Wiedergabe besprochen.
Der Vorverstärker verstärkt das Signal des Fotodetektors und wandelt den Fotostrom in eine elektrische Spannung um.
Da der Fotodetektor aus mehreren Einzeldioden besteht, die Information der Pitspur aber von allen Fotodioden umgewandelt wird, werden alle Diodenströme in einer Addierschaltung zusammengefaßt.
Der Fotodetektor liefert auch die Signale über den Zustand der Fokussierung und der Spurmittenabtastung.
Das Astigmatismus-Verfahren ist das am häufigsten verwendete Verfahren. Im Strahlengang des reflektierten Laserlichtes befindet sich vor dem Fotodetektor eine zylindrische (astigmatische) Linse. Bei korrektem Abstand zwischen Sammellinse und CD fokussiert die zylindrische Linse eine Kreisform auf die vier in Matrixform angeordneten Dioden des Fotodetektors. Verändert sich der Abstand zwischen Linse und CD, so entsteht ein Fokusfehler, der einen anderen Strahlungsdurchmesser zur Folge hat. Ein vom Soll-Wert abweichender Strahlduchmesser wird durch die zylindrische Linse als elliptischer Leuchtfleck auf dem Fotodetektor abgebildet. Je nach Fehler verändert sich die Ellipse in der horizontalen oder vertikalen Lage. Die unterschiedliche Ausleuchtung der einzelnen Fotodioden wird über einen Differenzverstärker ausgewertet. Am Ausgang des Verstärkers entsteht eine Spannung, welche als Fokusfehlerspannung zur Ansteuerung des Fokusregelverstärkers dient.
Bei dieser Methode wird in den Strahlengang des reflektierten Laserstrahls, kurz vor dem Fotodetektor, ein Prisma angeordnet. Dieses Prisma wird so justiert, daß bei korrektem Abstand zwischen Sammellinse und CD der Einfallswinkel des Lichtes genau dem kritischen Winkel des Prismas entspricht.
Ist das der Fall, wird das an einer Kathete einfallende Lichtbündel an der Hypotenuse um 90° abgelenkt. Ist der Einfallswinkel kleiner, wird der eintreffende Lichtstrahl nicht an der Hypotenuse abgelenkt, sondern tritt an ihr aus. Bei einem größeren Einfallswinkel als dem kritischen Winkel erfolgt eine Ablenkung an der Hypotenuse, aber nicht mit 90°.
Auch hier erfolgt die Fokusregelung wieder über Fotodioden+Differenzverstärker.
Das EFM-Signal stellt ein serielles Datensignal ohne zusätzliche Taktleitung dar. Damit die Daten aber taktsynchron eingelesen werden können, muß das im EFM-Signal vorhandene Taktelement von 2,16MHz zurückgewonnen werden. Diese Aufgabe übernimmt im
CD-Player eine PLL-Schaltung.
Der Takt wird durch einen auf der Taktfrequenz freischwingenden Oszillator (VCO) erzeugt. Eine PLL-Schaltung synchronisiert den VCO mit dem EFM-Signal.
Da die Flanken des EFM-Signals im Taktabstand oder einem Vielfachen davon erscheinen, können sie als Sollwert für den Phasenvergleich verwendet werden. Als Istwert dient die Ausgangsspannung des VCO. Bei einem zeitlichen Versatz zwischen VCO-Flanken und EFM-Flanken erzeugt die PLL-Schaltung eine Regelspannung, die den VCO so lange nachregelt, bis dessen Frequenz und die EFM-Flanken miteinander verriegelt sind.
Für eine optimale Takt-Regeneration müssen der VCO und der Fangbereich der PLL bei jedem CD-Player individuell abgegelichen werden.
Durch Integration der PAM-Impulse aus dem Deglitcher formt das Ausgangstiefpaßfilter das analoge Audiosignal.
Gleichzeitig unterdrückt es die bei der DA-Wandlung zusätzliche entstandenen Frequenzspektren und das durch den Deglitcher verursachte Impulsrauschen.
In der Praxis werden diese Filter aus passiven LC-Filtern, aus aktiven Filtern oder aus einer Kombination von aktiven und passiven Filtern realisiert. Die Qualität und Güte dieser Filter bestimmen zu einem wesentlichen Teil die Wiedergabequalität des CD-Players.
Bei der Aufnahme der CD wird wahlweise eine Pre-Emphasis zur Verbesserung des Rauschverhaltens vorgenommen. Ob eine CD mit Pre-Emphasis aufgenommen wurde, ist durch eine Codierung im Q-Kanal des Subcodes gekennzeichnet.
Bei vorhandener Pre-Emphasiskennung gibt die Ablaufsteuerung ein Schaltsignal ab, mit dem in der Ausgangsstufe die De-Emphasis ausgeführt wird.
Zu Zwecken der Stummschaltung wird in der Regel die Ausgangsstufe durch ein Mute-Signal abgeschaltet.
Oversampling bedeutet wörtlich übersetzt Überabtastung . Man versteht unter Oversampling eine (künstliche) Erhöhung der ursprünglichen Abtastfrequenz von 44,1kHz. Bei einer Erhöhung der Abtastfrequenz auf 88,2kHz spricht man von einem 2fach-Oversampling-Verfahren, bei einer "Abtastung" mit 176,4kHz von einem 4fach-Oversampling-Verfahren, usw.
Die Idee, die hinter dem Oversampling steckt ist folgende: Die Zeit zwischen zwei Abtastwerten stellt eine fehlende Information dar, die sich als überlagertes Rauschen im demodulierten PCM-Signal bemerkbar macht.
Um die fehlende Information zu ersetzen, müssen zusätzliche PCM-codierte "Abtastwerte" dem Datenstrom hinzugefügt werden. Die binäre Wertigkeit dieser Zwischenwerte wird hierbei mit Hilfe eines digitalen Interpolationsverfahrens aus den echten Abtastwerten errechnet.
Der Dynamikgewinn des Oversampling-Verfahrens besteht nun darin, daß sich das Rauschen auf den 2fachen (bei 2fach-Oversampling), 4fachen (bei 4fach-Oversampling), usw. Frequenzbereich verteilt.
Ein weiterer Vorteil des Oversampling-Verfahrens besteht nun darin, daß sich durch das Herausfiltern der unerwünschten Spektralanteile unterhalb der neuen Abtastfrequenz.
Wie aus der Skizze zu erkennen ist, genügt jetzt zur Trennung von Basisband und Störspektrum eineinfaches Tiefpaßfilter mit einem flachen Übergang vom Durchlaß in den Sperrbereich. Nennenswerte Phasenfehler treten bei diesen Filtern nicht mehr auf (z.B. aktive Filter mit Bessel-Charakteristik).
(Anm.: Die Überlagerung zwischen Basisband und Störspektrum können bei realen Filtern nie 0 werden, nur ein Minimum!!)
Bedingt durch den auf der CD gespeicherten Subcode besitzt ein CD-Player einen hohen Bedienungskomfort. So gestattet die Spurensprungfunktion jeden beliebigen Zugriff auf eine Pitspur. Da alle Daten (Anzahl der Titel, Spielzeit, etc.) zu Beginn einer jeden Abtastung in die Ablaufsteuerung eingelesen werden, ist eine numerische Verarbeitung dieser Daten möglich. So kann mit Hilfe eines Programms jede beliebige Reihenfolge der abzuspielenden Musiktitel erfolgen. Weiters übernimmt die Ablaufsteuerung folgende Aufgaben:
Steuerung des Lademechanismus
Steuerung der Motoren
Steuerung der Servos (Verstärkerumschaltung, Focus-Search-Funktion, usw.)
Ein- und Ausschalten des LASERs
Auswertung der Bedientastenbefehle und Ansteuerung der Anzeige-Einheit
Die gesamte Ablaufsteuerung wird im CD-Player mit Hilfe eines Mikroprozessors und eines externen RAM-Speichers ausgeführt.
Eine CD besteht aus einer Kunststoffscheibe mit einer Dicke von 1,2mm. Als Ausgangsmaterial wird in der Regel Polycarbonat verwendet, aber auch Materialien auf PVC- oder Acrylbasis finden Verwendung.
Die Herstellung erfolgt nach einem Spritzpreß-Verfahren mit hohem technologischen Aufwand (Abweichung der Plattendicke nicht mehr als 0,01mm, Höhenschlag von max. 0,5mm, usw.).
Der erste Schritt beginnt mit der Herstellung einer mit Fotolack beschichteten Glasplatte, dem Glasmaster. Mit einem von der Aufnahmeeinheit gesteuerten Laserstrahl wird der Fotolack in einer spiralförmigen Spur belichtet. Die Belichtung erfolgt entsprechend den 0-1-Folgen des digitalisierten Audiosignals. Im nächsten Arbeitsgang wird der Fotolack entwickelt und die belichteten Stellen werden ausgewaschen. Es entsteht eine Struktur aus Vertiefungen (Pits) und Erhebungen. Von diesem ersten Glasmaster wird in einem galvanischen Verfahren eine Negativkopie aus Nickel, der "Nickelvater", hergestellt. Mit ihm könnte schon eine CD gepreßt werden. Um diese einzig vorhandene Ur-Preßmatrize zu schonen, fertigt man in einem weiteren Arbeitsgang eine oder mehrere Zwischenkopien aus Metall an, die man als "Mutter" bezeichnet. Aus den "Müttern", die jetzt eine positive Struktur haben, werden die eigentlichen negativen Preßmatrizen ("Söhne") hergestellt.
Ahnlich der in der Lackschneidetechnik gefertigten konventionellen analogen Schallplatte sind die fertigen CDs also die fünfte Generation. Dank der digitalen Informationsstruktur entsteht jedoch kein Qualitätsverlust.
Nach dem Pressen der CD wird die mit Pits und Stegen strukturierte Oberfläche mit einer hauchdünnen, nur 40nm dünnen Aluminiumschicht verspiegelt. Diese verspiegelte, strukturierte Oberfläche wird als Informationsebene bezeichnet. Nach der Verspiegelung wird die gesamte Oberfläche mit einer ca. 6µm dünnen Schutzschicht versehen. Weil auf diese Seite später das Etikett gedruckt wird, bezeichnet man sie als Labelseite.
Dieses Bild zeigt den Querschnitt einer fertigen CD. Die Abtastung der Informationsebene geschieht an der Unterseite. Wegen ihrer durchscheinenden Eigenschaft wird die Unterseite der CD als Transparentschicht bezeichnet.
Im letzten Arbeitsgang vor dem Aufdrucken des Etiketts wird das Mittelloch von 15mm Durchmesser gestanzt. Die genaue Ausrichtung erfolgt hierbei durch eine Laserjustierung mit Bezug auf die innere Spurrille.
Wie bereits erwähnt, ist die Labelseite der CD
nur wenige millionstel Meter dünn. Deshalb ist sie sehr empfindlich gegen
mechanische Einflüsse. Kleinste Druckstellen (z.B. Beschriftung mittels
Kugelschreiber) können zur Zerstörung der Informationsebene führen. Etwas
weniger empfindlich ist die Transparentschicht, obwohl auch sie vorsichtig
behandelt werden sollte.
Die Pitstruktur bildet die digitale Information des ursprünglichen Audiosignals. In der Vergangenheit gab es zur Pitstruktur immer wieder Diskussionen, was denn mit Pit gemeint sei (Erhöhung oder Vertiefung in der Informationsebene?).
Geht man davon aus, daß beim ersten Glasmaster die Pits Vertiefungen sind, so werden die Vertiefungen letztlich auch als Vertiefungen in die CD gepreßt. Weil die Informationsebene aber von der Rückseite der CD abgetastet wird, werden die Pits aus der Sicht des Laserlichtes zu Erhöhungen (Bumps).
Die Abmessungen der Pits werden vom verwendeten Kanalcode, der Wellenlänge des Laserlichts und der Abtastgeschwindigkeit bestimmt. Pitlänge und der Abstand zwischen den Pits bilden die Daten des digitalen Codes. Die Länge eines Pits variiert zwischen 0,833µm und 3,56µm, die Breite beträgt 0,5µm. Die Tiefe eines Pits beträgt nur 0,11µm. Der Mittenabstand zwischen zwei Spurrillen beläuft sich auf 1,6µm. Auf dem gesamten verfügbaren 33mm breiten Programmbereich der CD befinden sich max. ca. 20000 Spuren.
(Anm.: Alle Angaben ohne Gewähr!)
Beim Abtasten der spiralförmigen Pitspur entsteht ein serieller digitaler Datenstrom, dessen Taktfrequenz von der Drehzahl der CD bestimmt wird. Damit dem signalverarbeitenden Mikroprozessor ein Datenstrom mit konstanter Taktfrequenz angeboten werden kann, wird die Drehzahl der CD der jeweiligen Position des Abtastsystems angepaßt. Dadurch ergibt sich an jedem Punkt auf der spiralförmigen Spur die gleiche Abtastgeschwindigkeit. Dieses Prinzip der Drehzahlregelung bezeichnet man als CLV-Regelung (CLV Constant Linear Velocity). Durch diese Regelung stellt sich bei der innersten Position des Abtastsystems eine Drehzahl von ca. 500U/min ein, die sich bis zum äusersten Rand kontinuierlich auf
ca. 200U/min verringert.
Die Spielzeit der CD wird von der Länge der spiralförmigen Spur und der Abtastgeschwindigkeit bestimmt. Für das CD-System sind zwei Abtastgeschwindigkeiten genormt, wodurch sich zwei maximale Spielzeiten ergeben haben. Standard-CDs haben eine maximale Spielzeit von 60 Minuten und einer Abtastgeschwindigkeit von 1,4m/s. Durch Reduzierung der Abtastgeschwindigkeit auf 1,2m/s wurde eine maximale Spielzeit von 75 Minuten erreicht.
v CD-Player und R-DAT-Recorder Claus Biaesch-Wiebke / Vogel Fachbuch
v Halbleiter-Schaltungstechnik U.Tietze - Ch.Schenk / Springer Verlag
v HIT 4.Klasse
Haupt | Fügen Sie Referat | Kontakt | Impressum | Nutzungsbedingungen