a.out ist das ursprüngliche Dateiformat für ausführbare Dateien und Objektdateien von Unix-ähnlichen Betriebssystemen. In der Praxis wurde dieses Format weitgehend durch seine Nachfolger Common Object File Format (COFF) und Executable and Linking Format (ELF) verdrängt, obwohl es auch heute noch teilweise unterstützt wird.[1] Vom Linux-Kernel wurde das Format von Version 1.1.52 (August 1994)[2] bis einschließlich Version 5.0 (März 2019)[3] unterstützt.

Geschichte

Bearbeiten

Viele unixoide C-Compiler bzw. die diesen normalerweise automatisch nachgeschalteten Assembler erzeugen eine ausführbare Ausgabedatei mit dem voreingestellten Dateinamen a.out (Abkürzung für Assembler Output), sofern der Benutzer nicht ausdrücklich einen anderen Namen wählt; davon erhielt das zunächst namenlose Format seine Bezeichnung, sobald sich die Notwendigkeit ergab, mehrere verschiedene Formate zu unterscheiden[4]. Mit der Weiterentwicklung von UNIX wurden die Mängel von a.out immer offensichtlicher, unterstützt das Format doch weder Debugging-Informationen (die deshalb in der Symboltabelle untergebracht werden mussten) noch dynamische Bibliotheken. Mit der Einführung von Unix System V Release 3 wurde es deshalb durch das neue, flexiblere Common Object File Format (COFF) abgelöst.[5]

Unter Linux war a.out bis 1995 das Standardformat. Aufgrund der Limitierungen des Formates wurde es unter Linux zunehmend schwerer, moderne Techniken wie z. B. Dynamisches Linken zu unterstützen[6]. Deshalb wurde mit der Veröffentlichung der Kernel Version 1.2 Unterstützung für das Executable and Linking Format (ELF) eingeführt.[7] Der Linux Loader ld.so unterstützt das a.out Format jedoch bis heute[8]. Da BSD eine flexiblere Variante von a.out implementierte, war der Wechsel nicht so dringend. FreeBSD stellte im Jahr 1998 mit Version 3.0 auf ELF um.[9]

Die Ausgabedatei eines Unix-Compilers bzw. Assemblers trägt auch heute noch dann standardmäßig den Dateinamen a.out, wenn sie nicht im Dateiformat a.out, sondern in einem der neueren Dateiformate erzeugt wird.

Ein Programm im a.out-Format besteht aus mehreren Teilen:

  • Der Kopfdatenbereich enthält Metainformationen über die Datei, wie zum Beispiel die Größe der folgenden Segmente.
  • Text: Das eigentliche Programm als Maschinencode (nicht zu verwechseln mit dem Quelltext des Programms)
  • Data: Initialisierte Daten, wie Konstanten und Variablen, die beim Programmstart bereits einen definierten Anfangswert haben.
  • BSS: Uninitialisierte Daten. Das Akronym BSS steht für Block Started by Symbol und ist auf den gleichnamigen Pseudo-Operator zurückzuführen, mit dem in der Assemblersprache des Großrechners IBM 7090 Speicherplatz für uninitialisierte Daten reserviert wurde.[10] Während die Text- und Data-Segmente aus der Datei in den Speicher kopiert werden, ist das BSS-Segment nur als Größenangabe in den Kopfdaten der Datei vorhanden. Der Programmlader legt das Segment in der gewünschten Größe an und initialisiert es meist byteweise mit dem Wert 0.
  • Weitere optionale Informationen wie Symboltabelle und, wenn nötig, Relokationstabelle.

Literatur

Bearbeiten

Einzelnachweise

Bearbeiten
  1. Binärformate (Memento vom 24. September 2015 im Internet Archive), Das FreeBSD-Handbuch, aufgerufen am 4. April 2019
  2. LKML: a.out coredumping: fix or delete?
  3. LKML: x86: Deprecate a.out support (Linus Torvalds)
  4. a.out -- assembler and link editor output Dennis Ritchie, Bell Labs, 3. November 1971. Aufgerufen am 11. März 2014
  5. Gintaras Gircys: Understanding and Using COFF, 1988
  6. How to write shared libraries, Ulrich Drepper, abgerufen am 12. März 2014
  7. Linux 1.2 und 1.3 Uni Wuppertal, abgerufen am 12. März 2014
  8. Manpage von ld.so Linux Programmer's Manual, abgerufen am 12. März 2014
  9. FreeBSD 3.0 Release Notes, FreeBSD Project, abgerufen am 11. März 2014
  10. Maurice J. Bach: The Design of the UNIX Operating System, Prentice-Hall International, Englewood Cliffs, NJ 1986, ISBN 0-13-201757-1. Seite 25