Linux
Metadaten
Aktualisiert: 20. Juli 2008
Bild-Metadaten – eine kleine Einführung
Exif-Metadaten
Das Exchangeable Image File Format (Exif) ist ein Standard der Japan Electronic and Information Technology Industries Association (JEITA) für ein Dateiformat, in dem moderne Digitalkameras Aufnahmeinformationen speichern; er wurde Mitte der 1990er Jahre entwickelt und ist inzwischen fester Bestandteil fast jeder Digitalkamera. Exif ist Teil des DCF-Standards (Design Rule for Camera File System), der die Zusammenarbeit von Geräten aus dem Bereich der Bildbearbeitung (z. B. Digitalkamera und Drucker) gewährleistet.
Exif-Metadaten befinden sich im sogenannten «Header» – einem Bereich am Anfang der Bilddatei vor der eigentlichen Bildinformation – von Bildern der Formate JPEG oder TIFF, aber auch von Audiodateien des Formats WAV. Die von Kamera zu Kamera variierenden technischen Exif-Metadaten inklusive ein kleines Vorschaubild werden bereits beim Fotografieren gespeichert, so dass man später nur noch die bildbeschreibenden Texte (Titel, Kommentar, Copyright oder Schlüsselwörter), welche die Kamera nicht selber erraten kann, von Hand nachtragen muss. Dafür und für das kleine «Thumbnail») stehen folgende Exif-Felder zur Verfügung (aus: Exif Version 2.2, April 2002):
| ImageDescription (type: ASCII) |
A character string giving the title of the image. It may be a comment such as «1988 company picnic» or the like. Two-byte character codes cannot be used. When a 2-byte code is necessary, the Exif Private tag UserComment is to be used. |
| Artist (type: ASCII) |
This tag records the name of the camera owner, photographer or image creator. The detailed format is not specified, but it is recommended that the information be written as in the example below for ease of Interoperability. When the field is left blank, it is treated as unknown. Example: «Camera owner, John Smith; Photographer, Michael Brown; Image creator, Ken James». |
| Copyright (type: ASCII) |
Copyright information. In this standard the tag is used to indicate both the photographer and editor copyrights. It is the copyright notice of the person or organization claiming rights to the image. The Interoperability copyright statement including date and rights should be written in this field; e.g., «Copyright, John Smith, 19xx. All rights reserved.» In this standard the field records both the photographer and editor copyrights, with each recorded in a separate part of the statement. (...) |
| UserComment (Type: -) |
A tag for Exif users to write keywords or comments on the image besides those in ImageDescription, and without the character code limitations of the ImageDescription tag. The character code used in the UserComment tag is identified based on an ID code in a fixed 8-byte area at the start of the tag data area. The unused portion of the area is padded with NULL («00.H»). ID codes are assigned by means of registration. The value of Count N is determined based on the 8 bytes in the character code area and the number of bytes in theuser comment part. Since the TYPE is not ASCII, NULL termination is not necessary. The ID code for the UserComment area may be a Defined code such as JIS or ASCII, or may be Undefined. The Undefined name is UndefinedText, and the ID code is filled with 8 bytes of all «NULL» («00.H»). An Exif reader that reads the UserComment tag shall have a function for determining the ID code. This function is not required in Exif readers that do not use the UserComment tag. When a UserComment area is set aside, it is recommended that the ID code be ASCII and that the following user comment part be filled with blank characters [20.H]. |
| Thumbnail Data | Thumbnail data is recorded in the 1st IFD similarly to primary images, using two existing image formats. No limit is placed on the size of thumbnail images. Thumbnails are not mandatory, but it is recommended that they be recorded if possible, unless hardware or other restrictions preclude this. Thumbnail data does not necessarily have to adopt the same data structure as that used for primary images. If,however, the primary images are recorded as uncompressed RGB data or as uncompressed YCbCr data, thumbnail images cannot be recorded as JPEG compressed data. When thumbnails are recorded in uncompressed format, they are to be recorded in the 1st IFD in conformance with Baseline TIFF Rev. 6.0 RGB Full Color Images or TIFF Rev. 6.0 Extensions YCbCr Images. An Exif-specific recording method is used to record compressed thumbnails. In this case the Compression tag value is set to "6" and tags in the 1st IFD (JPEGInterchangeFormat, JPEGInterchangeFormatLength) are used to designate the location and size. The images are recorded at the designated location as a JPEG stream (from SOI to EOI) conforming to the JPEG Baseline DCT format. No APPn marker, COM marker, nor restart marker is recorded in the JPEG stream. To avoid duplicate definitions, the 1st IFD is not used to record a tag indicating a TIFF image or information recorded elsewhere as a JPEG marker segment. |
Um mit diversen Programmen und System kompatibel zu bleiben, ist der Exif-Header in den letzten Jahren extrem aufgebläht worden. Es gibt inzischen nicht nur spezielle Bereiche für Photoshop, zu denen Adobe keinerlei Informationen preisgibt und die nur von Adobe-Produkten (halbewegs) korrekt beschrieben werden können, sondern auch für Windows XP, GPS-Daten, Fotostation, Fotomechanic etc. – nicht zu vergessen: den ICC-Bereich für Farbinformationen aller Art. Es gilt beim Exif-Header daher, Balast abzuwerfen und wirklich nur die nötigen Metadaten im Bild zu lassen. Schauen Sie sich in aller Ruhe einmal den überfrachteten Header (272 Zeilen Code) eines Bildes an, der von Photoshop und Lightroom maltraitiert wurde (Sorry, Othmar, aber eines deiner Bilder muss hier herhalten), und vergleichen Sie ihn mit einem sauberen Header (80 Zeilen Code), der mit den «exiftools» erstellt wurde.
IPTC-Metadaten
Der IPTC-NAA-Standard (kurz: IPTC) wurde um 1990 vom International Press Telecommunications Council (IPTC) zusammen mit der Newspaper Association of America (NAA) entwickelt und ist grundsätzlich für alle Arten von Medien, also Text, Fotos, Grafiken, Audio oder Video geeignet. Der Standard ist Teil des Information Interchange Model (IIM) und erlaubt es, Hinweise zu den Bildrechten, den Namen des Autors, Titel oder Schlagwörter direkt in der Bilddatei zu speichern. Diese Art der Speicherung von Metadaten ist in Bildagenturen und Bildarchiven sehr verbreitet, denn derart angereicherte Dateien lassen sich einfach nach bestimmten Angaben (z. B. Schlagwörter) durchsuchen, was die Verwaltung, Pflege und Nutzung grosser Bildarchive sehr vereinfacht.
Die IPTC-Metadaten werden in einem eigenen Bereich des «Headers», innerhalb des Abschnitts «Photoshop» abgelegt. Diese seltsame Verknüpfung zwischen IPTC und Photoshop geht wohl darauf zurück, dass IPTC-Metadaten einst haupsächlich mit Adobes Photoshop verarbeitet und abgespeichert wurden. Achtung: Gemäss Berichten aus dem Freundeskreis kann es sein, das nach Entfernen des Photoshop-Header Photshop und Lightroom abstürzen!
In der Theorie schreibt der IPTC-Standard keinen bestimmen Zeichensatz vor, allerdings benutzen viele Programme noch immer Latin-1 (ISO 8859-1) oder den noch stärker eingeschränkten ASCII-Zeichensatz zur Speicherung der Metadaten. Genauere Angaben zu den einzelnen Feldern finden Sie im IPTC Photo Metadata White Paper Revision 11 (2007). Beim Speichern von IPTC-Metadaten – sofern überhaupt möglich (siehe unten unter XMP) – ergeben sich jedoch grössere Probleme, welche zwischen den Systemen Apple und Windows zusätzlich auch noch variieren. So konnten z. B. mit der Windows-Version von Lightroom IPTC-Metaden problemlos als Unicode geschrieben und mit PHP ausgelesen werden, was die Apple-Version jedoch nicht zustande brachte. Da Adobe eine amerikanische Firma ist, begnügt sie sich bei der Unterstützung dieser «alten» Metadaten wohl mit ASCII oder Latin-1 – und solange sie ihren Produkten nicht eigene, hunderprozent Unicode kompatible Zeichensätze mitliefert, ist man auf Gedeih und Verderben jenen Fonts ausgeliefert, die augenblicklichlich gerade auf dem eigenen Computer installiert sind. Damit bleibt das Bearbeiten von Metadaten mit dem Unicode-Zeichensatz aber weiterhin ein Glücksspiel – vom vielgesagten «professionellen Arbeiten» kann hier keine Rede sein.
XMP-Metadaten
Die Definitionen des IPTC wurden von der Firma Adobe Systems Inc. teilweise übernommen und in ihr eigenes Format XMP (Extensible Metadata Platform) integriert. Da die neusten Versionen von Photoshop und Lightroom XMP einsetzten, könnte sich dieses Format – ganz zweifellos auch aufgrund von Adobes Marktbeherrschung – in naher Zukunft als Standard für bildbeschreibende Textinformationen – nicht Aufnahmeinformationen! – durchsetzen.
Das Jahr 2008 dürfte einen Umbruch in Sachen Metadaten mit sich bringen, sofern sich der von Adobe entwickelte XMP-Standard durchsetzen kann. Es gibt einen guten und einen bedenklichen Grund, warum dies vermutlich so geschehen wird. Zuerst der bedenkliche: Die fast schon monopolisitische Vormachtstellung im Bereich Bildbearbeitung erlaubt Adobe natürlich, ihre eigenen Standards problemlos durchzudrücken, indem andere Standards einfach nicht mehr unterstützt werden. Dies geschieht im Augenblick mit dem Exif-Standard, der von neuen Produkten wie Photoshop CS oder Lightroom nicht mehr in den Header geschrieben wird. Vermutlich würde man auch gerne den IPTC-Standard eliminieren – zumal er keine Eigenentwicklung ist –, was aber zweifelsohne zu einem Aufschrei in den weltweiten Pressarchiven führen würde. So übt man sich im Hause Adobe in Geduld, zwingt die Leute, immer wieder auf neue Versionen ihrer Produkte umzusteigen, indem man den Support für alte auslaufen lässt, und kann so ohne grossen Effort – und beschleunigt durch die menschliche Trägkeit und Abhängigkeitliebe – unbemerkt XMP als Standard einfliessen lassen. Modernes Marketing eben ...
Das positive an XMP ist jedoch, dass es auf dem offenen Standard XML beruht, eine eigentlich Grössenbeschänkung nicht kennt und Unicode vollumfänglich unterstützt. Dies ist ein riesiger Vorteil gegenüber dem schon leicht angestaubten Exif-Standard, der zwar von fast allen Kameraherstellern benutzt wird, dies jedoch auf immer leicht unterschiedliche Art und Weise, weshalb man von einem Standard im eigentlichen Sinne gar nicht sprechen kann – eher von Richtlinien. Hinzu kommt, dass gewisse Software ebenfalls eigene Exif-Metadaten schreibt, so z. B. (wie auch nicht anders zu erwarten) Windows, das für seinen Explorer spezielle XP-Tags (XPTitle, XPComment etc.) in den Header schreibt. Auch die Spachenbarriere ist mit Exif nicht ganz überwunden. Seltsam ist, dass gemäss den Richtlinien der JEITA fast alle Exif-Tags nur ASCII verstehen sollen, diese sich aber mit dem «exiftool» problemlos mit Unicode beschreiben und auslesen lasssen.
Im Augenblick bestehen überdies noch erhebliche Zweifel, ob Photoshop und Lightroom Metadaten wirklich korrekt in die Bilddateien zurückschreiben. Da weder den Handbüchern der erwähnten Programme noch den zusätzlichen Dokumentation auf der Adobe-Homepage tiefergehende Informationen zu entnehmen sind, ist man den Programmen einfach ausgeliefert. Man kann nur beten, dass die Programmierer ihre Arbeit gut gemacht haben und alles richtig funktioniert. Man darf jedoch davon ausgehen, dass zumindest die XMP-Metadaten korrekt zurückgeschrieben werden. Immerhin ...
Fazit zu Beginn des Jahres 2008
Das Durcheinander in den Exif-Metadaten ist nicht gerade förderlich und schreit geradezu nach einem neuen, wirklich einheitlichen Standard. Die XMP muss jedoch erst noch beweisen, dass es die Bezeichnung Standard auch verdient und nicht verwässert wird. Im Augenblick sollte man daher das Augenmerk auf XMP richten und Exif aufgrund seiner immensen Verbreitung weiterhin benutzten. IPTC darf man wohl getrost als «ehemaligen Standard» beiseite legen.

