B. PDF - Portable Document Format
Grundlagen:
- universellen Austauschen von Dokumenten
- programm- und betriebssystemunabhängig
- Hypertextfunktionen (links)
Anforderungen an universell nutzbares Datenformat:
Unabhängigkeit von Betriebssystem, Anwendungsprogrammen und Herstellern
Einbinden von Graphik
Lösung des Fontproblems
kleine Filegrößen
Editierbarkeit
Format soll offen und erweiterbar sein
Format soll integrierbar in bestehende Arbeitsabläufe sein
Nachteil von PostScript
Dateien sehr groß
für Verarbeitung komplexer Interpreter notwendig
keine Editierbarkeit
Extrahieren von Seiten sehr schwierig
schlechte Suche nach Textstellen
lineare Anordnung der Seiten erschwert freien Zugriff auf EINE beliebige Seite
'Font not found using Courier'-Dokumente sind unbrauchbar, da sogar
Zeilenvorschübe erzeugt werden
DESWEGEN:
neues Kompressionsverfahren von PostScript Level 2:
reduziert Datenmenge
durch AI-Technologie neues, editierbares Format auch ohne Interpreter auf Basis
von DSC-Kommentare, die eine Struktur im Aufbau einer Datei gewährleisten soll.
Schlüsselelemente der Acrobat Technologie
das Dateiformat PDF:
PDF ist Basis für Acrobat. In PDF viele Bestandeile von PostScript wie
Kompressionen und Hypertextfunktionen (Sprungverweise)
Aufbau:
Drei Layer:
mittlere Schicht = Content Layer beinhält alle Objekte wie Grafik, Bild und Text
darüber = Enhancement Layer - erlaubt Aktionen wie Bookmarks, Links,
Thumbnails und digitale Signaturen oder sämtliche Arten von Attachments
(Anmerkungen)
darunter = Information Layer - alle Informationen zu Schriftdaten und die für
die Navigation in der PDF-Datei erforderlichen Querverweistabellen
Eigenschaften des PDF-Formates:
1. Grafikmöglichkeiten
PDF stellt Text und Grafik unter Verwendung des Abbildungsmodells der
PostScript-Sprache dar.
PDF-Seitenbeschreibung sagt, an welchen Stellen, Objekte mit welcher Farbe
stehen. Objekte sind:
Buchstaben, Kombinationen aus Linien und Kurven, Bilder
jede Figur kann 'geclipped' sein (Teile des Bilds sind nur sichtbar).
Objekte werden auf die zuvor weiße Seite nacheinander angebracht.
Alle Grafikmöglichkeiten aus PostScript Level 1 und 2 sind implementiert. Ab PDF
1.3 sind auch alle PostScript 3 Erweiterungen berücksichtigt worden.
Drei Einschränkungen (teilweise)
zur Simulation von Graustufen wird nur Standard-Spotfunktion (Punktaufbau)
verwendet
Füllmuster, mit denen Flächen in PS Level 2 eingefärbt werden können, sind erst
in PDF 1.3 darstellbar
Schmuckfarben werden bis PDF 1.2 in RGB oder CMYK umgerechnet (erst ab PDF1.3)
2. Portabilität
PDF sind hardware- und betriebssystemunabhängig.
PDF ist ein Binärdaten-File, daher können 8-bit-Character-Sets verwendet werden.
3. Dateigröße und Kompression
PDF reduziert die Dateigröße durch:
Kompressionsarten wie CCITT (3+4), LZW, ZIP, RunLength und JPEG
optimierte Zeichenanweisung
Downsampling (Kurzberechnung, Neuberechnung oder Bikubisches Berechnung)
Einbindung von Fontuntergruppen - nicht ganzen Fonts
Alle Kompressionsfilter produzieren Binärdaten daraus, die für bestimmte
Anwendungen in ASCII Base 85 Code portiert werden.
4. Font-Unabhängigkeit
Nicht immer sind auf jedem Rechner alle Fonts installiert Problem:
Verschiebung von Seiten- und Zeilenumbrüchen.
PDF-Dateien haben Font-Deskriptoren für jeden im File verwendeten Font, sie
beinhalten 'Fontnamen', Metrik der Zeichen und Stilinformationen zu
den einzelnen Zeichen. Dies wird zur Simulation des Fonts herangezogen.
Der Distiller und der PDF-Writer bieten die Option zum Einbetten und Erstellen
von Untergruppen von OutlineFonts, dadurch hat man immer den Originalfont.
Aber nur bei TrueTypeFonts und Typ1Fonts können der komplette Vektorfont
eingebettet werden, bzw bei der Option FontUntergruppe werden nur die
verwendeten Zeichen eingebettet.
Bei nicht eingebetteten Fonts werden Acrobat Reader durch zwei
Multiple-Master-Fonts (AdobeSerMM und AdobeSanMM) ersetzt. Mittels der
Fontmetrik werden diese Schriften entsprechend gedehnt oder gestaucht, dadurch
bleiben Seiten- und Zeilenunbrüche erhalten. Symbol-Schriften entsprechen nicht
dem Standard-ISOLatin-1-Zeichensatz. Für sie ist eine komprimierte Version der
Type-1 Beschreibung von Symbol und ZapfDingbats eingebettet. Symbol-Schriften
müssen nicht eingebettet werden.
Eingebettete Fonts werden beim Öffnen und den ATM übergeben, der Typ-1-Fonts für
die Darstellung am Monitor rastert, für TrueTypeFonts macht dies das
Betriebssystem. Typ-3-Fonts benötigt jedoch einen PostScriptInterpreter, daher
werden sie nur als Bitmap-Fonts dargestellt.
6. Wahlfreier Zugriff auf Seiten und Dateistruktur
Die einzelnen Bestandteile stehen als separate Objekte in der Datei und können
auch mehrfach auf verschiedenen Seiten verwendet werden. Eine Tabelle (xref) am
E Ende der Datei beschreibt deren Position. Die Tabelle muß nur einmal in den
Speicher geladen werden.
7. Hypertextfunktionen
erweitern digitale Dokumente um Navigationshilfen wie:
Bookmark, Links, Thumbnails, Notizen
8. Erweiterbarkeit
PDF Spezifikation 1.3
Ist das native Format von Acrobat 4.0. Neue Funktionen basieren auf neue Funktionen von PostSkript 3.
Neue Funktionen:
Konvertierung html in Postskript ( PDF)
Digitale Signaturen
Erweiterung bzw. Trennung der logischen von der Objektstruktur
Alternative Repräsentatione eines Bildes (zb. Auflösung: highres, lowres)
Einbinden jedes Dokumenttyps in eine PDF Datei
Unterstützt Java Skript
Erweiterte Seitennummerierung
Überfüllungsinformatione sind eingebettet (abfallend arbeiten)
Binding: Unterstützung von links nach rechts lesender Völker (?)
DeviceN und ICC basierende Farbräume
Smooth Shadings
Maskieren von Bildern über die Position
CID Fonts Unterstützung (ad CID - Character Identifier; können große Anzahl von Zeichen enthalten Asien; Typ 0 CID basieren auf Type-1 Fonts; Typ 1CID basieren auf TrueType)
Neue Datenstruktur effektive Suche nach "strings" und "numbers" von PDF Objekten: named Desinations
Nachteile des PDF Formats:
PDF derzeit nur von wenigen Editoren veränderbar (Verbesserung durch Programme, die direkt PDF verarbeiten) (Editoren: Acrobat Plugin "PitStop 4.0", Adobe Illustrator 8.0, Adobe Indesign ab 1.5; und es gibt Parser für Photoshop)
PDF Dateien sind auf ein best. Ausgabegerät optimiert (CD, Drucker, www)
PDF enthält keine Info über die logische Struktur des Dokuments (Adobe kündigt Intergration von SGML an)
Farbseperation in Standardapplikationen nur über Umweg Postskript möglich. Abhilfe: Acrobat PluIn "PDF Out Pro" und "CrackerJack".
Interne Art der Textspeicherung ist ungünstig für die Textsuche
Komponenten von Acrobat 4.0
1. Acrobat Distiller
konvertiert Postskript Dateien in PDF Dokumente
2. Acrobat PDF Writer (PDF Maker)
Ist ein Druckertreiber der über den Standarddruckbefehl von Programmen in eine PDF Datei "druckt"
3. Acrobat 4.0 (Exchange)
ist ein Anzeigeprogramm in dem man zusätzlich kann: PDF ändern und mit Kennwortschutz, Anmerkungen, Verknüpfungen, Lesezeichen, Thumbnails, Digitale Signaturen, Movies und Sound versehen.
4. Acrobat Capture
ist ein PlugIn von Acrobat 4.0: steuert über Twain Schnittstelle direkt Scanner an und konvertiert gescanntes in PDF.
5. Acrobat Catalog
6. Acrobat Reader
Anzeigeprogramm für PDF, gratis für alle Plattformen
2. Erzeugen von PDF Dokumenten:
beginnt damit, existierende Dokumente in PDF Dokumente zu konvertieren. Acrobat ertellt Kopie Schutz des Originals.
Verschieden Formen des Ausgangsmaterials:
Elektronische Dateien von Anwendungen (Hauptanwendungsbereich)
Konvertierung meist über Umweg Postskript.
Webseiten
Seit Version 4.0 möglich html Inhalt zu laden und zu konvertieren
Gedruckte Seiten
Können von Acrobat aus direkt gescannt und danach in PDF Dateien konvertiert werden. Wiederum Entscheidungsmöglichkeit wie oben beschrieben (Pixel oder indiziert).
Bilddateien
Acrobat kann importieren und konvertieren: gängige Grafikformate einschl. tiff, bmp, pcx, gif und jpeg
Konvertieren elektronischer Dateien zu PDF:
Benutzer hat 2 versch. Dienstprogramme zur Auswahl (zusätzl. Nativ Export anderer Applikatione, wenn vorhanden): PDF-Writer und Acrobat Distiller.
Möglichkeit der Konvertierung:
Drag&Drop des Dateisymbols auf Acrobat Distiller oder PDF-Writer (Achtung Plattformunterschiede)
In Microsoft Office Anwendungen über ein Makro (PDF Writer oder PDF Maker)
Unter Windows: in Acrobat eine Datei aus einer anderen Applikation heraus öffnen wird in PDF Datei konvertiert. Achtung: Konvertierungsfehler, insb. Seitenformat.
In jeder Ausgangsanwendung: über Druckbefehl PS Datei generieren und diese distillieren. Aber: bereits Utilities (Create Adobe PDF unter Mac) PDF Datei in einem Schritt generieren.
Manche Anwendungen: über Export PS Datei generieren und diese anschließend über Distiller konvertieren. Anm: Export ist meist in Makro.
Acrobat verwendet zum Konvertieren der Dateien in das PDF Format PDF Writer oder Distiller.
Wann verwende ich was?
Frage hängt vom jeweiligen Arbeitsablauf ab.
PDF Writer?
ist Druckertreiber, der Daten schnell zu PDF Dateien konvertiert.
Schnelligkeit zählt und nicht die Form
Geschäftsberichte sollen in das PDF Format gebracht werden
Dokument enthält keine EPS Grafiken
System verfügt über begrenzten Arbeitsspeicher
Distiller?
Erstellt aus Postskript PDF Dokumente. Eine mit Distiller erstellte PDF Datei enthält alle Formatierungen, Grafiken und Fotos des Originaldokuments und bietet mehr Steuerungselemente als PDF Writer.
Konvertierung von Dokumenten aus DTP Anwendung heraus
Dokumente EPS Grafiken enthalten
Spez. Neuberechnung und Kompr.Methode für Bitmap Bilder erfolgen soll
Dokumente Farbverarbeitungsinformationen enthalten, die weiter verwendet werden
DSC Kommentare einer PostSkript Datei erhalten bleiben sollen
HighEnd PDF erzeugt werden sollen (Druckvorstufe)
Mehre PostSkript Dateien im Stapel konvertiert werden sollen
In Word97 Lesezeichen und Verknüpfungsinformationen erstellt wurden und diese beibehalten sollen
Asiatische Schrift eingebettet werden soll.
Einbetten von Schriften in PDF Dateien:
Mit dem PDF Writer möglich: Type1 Fonts, TrueType und Grundschriften (nur Windows) in eine PDF Datei einbetten. Einbinden von Type1 Schriften erfordert Installation des Adobe TypeManagers. PDFWriter betet keine asiatischen Schriften ein.
T1 Type 1 Schrift, TT TrueType Schrift. Unterstrichene Schriftnamen stehen für Symbolschriften. In Windows zusätzlich Farbinformation: schwarz normale Schriften, blau Grundschriften, rote TrueType Schriften (die nicht eingebettet werden können) und grün asiatische Schriften.
PDFWriter bettet nur ganze Schriftinformation bei Verwendung von mehr als 35% der Zeichen einer Schrift. Sonst nur Fontuntergruppe erzeugt und eingebettet.
Drucken mit dem PDFWriter:
PDF-Datei anzeigen: öffnet die erzeugte PDF Datei automatisch in Acrobat.
Dokumenteninfo anzeigen: Titel, Thema, Verfasser und andere Stichwörter.
Haupt | Fügen Sie Referat | Kontakt | Impressum | Nutzungsbedingungen