Vorabveroeffentlichung zur INETBIB 99. Rechnen sie mit "broken links" und Links, die noch auf die Version 1.0 verweisen. Das Script zur Ausgabe des URL zu einer Stelle wird z.Zt. vom Microsoft IE nicht ausgefuehrt!

[3] Zitieren und Zitiert-Werden

[3.0] Einführung

[3.0.1] In wissenschaftlichen Veröffentlichungen hat sich die Angabe der Seitenzahl bei Verweisen und Zitaten durchgesetzt. Bei Zitaten ist diese Angabe sogar nach dem Urheberrecht(1) notwendig. Obwohl die technische Möglichkeit besteht, hat sich bei Online-Dokumenten im Web noch kein Standard etabliert, der eine ähnlich genaue Angabe der Fundstelle erlaubt. Zwar liest man immer wieder, durch das Web sei Information auf Mausklick verfügbar, doch ist dies erst erreicht, wenn Hyperlinks mindestens so genau zu einer Textstelle verweisen, wie es die sonst übliche Seitenzahl erlaubt. Ohne ein praktikables System solcher Verweise wird es nur wenige wissenschaftliche Veröffentlichungen im Web geben - man will schließlich ordentlich zitiert werden können.

[3.0.2] Erstaunlicherweise kommt man aber von der Idee der Seitenzahlen nicht los,(2) obwohl Seiten nur beim Buchdruck Sinn machen. Elektronische Publikationen wie auch mittelalterliche Handschriften entziehen sich dieser Logik. Andererseits gibt es seit jeher Bücher, die nicht mit Seitenzahlen zitiert werden: Die Bibel ist wohl das bekannteste Beispiel. Ist einmal das Konzept "Seite" aus dem Kopf, ist die Lösung ganz einfach:

[3.0.3] Zur Ersetzung der Seitenzahlen in Zitaten und Verweisen kann die seit langem in der Wissenschaft verbreitete Dezimalklassifikation angewandt werden. Alle Teile eines Dokuments, die derselben Hierarchiestufe angehören, werden in jeder Ebene fortlaufend numeriert: Also z.B. erster Teil, erstes Kapitel, erster Absatz: "1.1.1", zweiter Absatz "1.1.2", zweiter Teil, zehntes Kapitel, vierter Absatz "2.10.4". Als einzige Änderung zum üblichen Verfahren schlage ich vor, daß auch Textabschnitte,(3) die keine eigene Überschrift haben, mit in die Klassifikation einbezogen werden. Damit entstehen Einheiten, die auf keinen Fall den Umfang einer Druckseite überschreiten, und das Auffinden von Zitaten bleibt auf die Suche in kleinen Textabschnitten beschränkt. Statt "Autor X, Y-Werk, Seite 5" heißt es dann z.B. "Autor X, Y-Werk, 2.9.12".

[3.1] HTML-Codierung

[3.1.1] Codierungsschema HTML

(Die Hyperlinks in diesem Abschnitt führen zu den jeweiligen Erläuterungen in Abschnitt 3.1.2.)

[3.1.2] Erläuterungen zum Codierungsschema HTML

(Die Hyperlinks der erläuterten Code-Bestandteile führen zum Anfang des Schemas zurück.)
[3.1.2.1] <DIV>...</DIV>

Alle Abschnitte eines Dokuments sind durch die Verwendung eines DIV-Tags gekennzeichnet. Dies mag zwar auf den ersten Blick umständlich erscheinen, doch ist dies auf lange Sicht ein Vorteil für die Autoren: Auf diese Weise können zusammengehörige Teile auch gemeinsam mit CSS formatiert werden, z.B. eine Überschrift inklusiver der untergeordneten Absätze. Des weiteren ist es zwar vorgesehen, daß je eine Überschrift oder ein Absatz je eine Ziffer der Dezimalklassifikation erhält, in der Praxis ist aber nicht immer vermeidbar, einen logischen Abschnitt des Dokuments mit mehr als einem P-Element zu realisieren. Mittels der Verwendung des DIV-Elements werden diese Teile auf jeden Fall zusammengehalten.

[3.1.2.2] id="IDsec..."

Die Identifikation der DIV-Elemente (s.o. 3.1.2.1) geschieht mittels des Wertes eines Id-Attributs. Da sich in HTML id- und name-Attribute denselben Namensraum teilen, dürfen nicht zwei identische Werte in einer HTML-Datei vorkommen. Zur Unterscheidung beginnen die id-Attribute der DIV-Elemente mit den beiden Buchstaben "ID". (Es wurde für die id-Attribute das komplexere Schema gewählt, da diese Auszeichnung nur die Autoren betrifft, die name-Attribute aber auch von Lesern des Dokuments verwendet werden sollen (s.u. 3.1.2.6); letztere sollen es etwas leichter haben).

[3.1.2.3] class="sec"

Das class-Attribut mit dem Wert "sec" markiert Anker (A) und Abschnitte (DIV) als und Abschnitte zur Gliederung des Textes. Der Attributwert "sec" ist als Abkürzung des englischen Wortes "section" zu verstehen. Dieses Attribut dient zur einfachen automatischen Bearbeitung der Dokumente und als Selektor für Style-Sheet-Angaben.

[3.1.2.4] <A ... </A>

Die Möglichkeit, zu einer bestimmten Stelle in einem Dokument zu verweisen, wird durch die name-Attribute des A-Elements erreicht. Dieses Element ist das Sprungziel des Verweises.

[3.1.2.5] name="secX.Y", name="secX.Y.1"

Notwendige Bedingung für den Sprung zu einer vorbestimmten Textstelle ist das Vorhandensein von Ankern mit Name-Attributen. Zwar wären id-Attribute in den eigentlich gemeinten Überschrift-Tags bzw. den P-Tags eine wesentlich bessere Lösung, doch wird dies von einigen Browsern nicht unterstützt; daher werden die name-Attribute in einem A-Tag verwendet.(4) Es ist Aufgabe des Autors dafür zu sorgen, daß sein Dokument diese Bedingung erfüllt. Wie bereits besprochen (s.o. 3.0.3) schlage ich die Verwendung einer leicht erweiterten Dezimalklassifikation vor, mit der jede Überschrift und jeder Absatz eindeutig identifiziert werden kann. (Im obigen Beispiel wird die Ziffernfolge mit "U.V.W." bzw. "X.Y.Z." angedeutet. Dies erlaubt - wie gesagt - den Verzicht auf Seitenangaben beim Zitieren und ermöglicht den Spung zu einem so bezeichneten Abschnitt im Text. In der Regel dürften diese Angaben sogar präziser sein als Seitenangaben. Die Dezimalklassifikation kann dann in URLs als Zielposition innerhalb einer HTML-Datei, als sog. fragment-identifier, benutzt werden.(5) Die führenden Buchstaben "sec" wurden gewählt, weil alle id- und name-Attribute nur Werte haben dürfen, die mit einem Buchstaben beginnen.

[3.1.2.6] [X.Y.], [X.Y.1]

Sind die Anker vorhanden, so besteht die Problematik darin, daß in den Quelltext eingestreute name-Attribute für den Leser nicht sichtbar sind. Zwar ist es im Prinzip möglich, diese Anker in Erfahrung zu bringen, doch kann dies nur eine Notlösung sein, da diese Verfahren zeitaufwendig sind und gute HTML-Kenntnisse beim Zitierenden voraussetzen.(6) Somit ergibt sich für den Autor eine zweite Aufgabe neben dem Einfügen der name-Attribute: Er muß die Leser über die möglichen Sprungziele in Kenntnis setzen. Eine praktische Möglichkeit mittels JavaScript wird unten vorgestellt, doch im Sinne einer medien-neutralen Fassung des Dokuments ist vom Autor dafür Sorge zu tragen, daß dergleichen auch bei ausgedruckten Dokumenten möglich ist. Dies geschieht dadurch, daß er im Text die Attribute wiederholt. Ich schlage vor, Überschriften und Absätzen in eckigen Klammern die Dezimalklassifikation, die dem name-Attribut des Ankers der jeweiligen Textstelle entspricht, voranzustellen. So ist für einen Leser jederzeit sichtbar, daß er mit einer Referenz auf "DateiX.HTML" durch Zusatz des fragment-identifiers "secX.Y.Z", also durch "DateiX.HTML#secX.Y.Z" auf die jeweilige Textstelle verweisen kann. Selbstverständlich bedarf es noch einer eingehenden Erläuterung dieses Verfahrens:

[3.1.2.7] (Explizite Erläuterung ...)

An geeigneter Stelle im Dokument - etwa als Abschnitt im Vorwort - sollte der Leser über die Möglichkeiten informiert werden. Z.B.

"Vor Überschriften oder einzelnen Absätzen finden Sie im Text eingestreut eine Dezimalklassifikation in der Form "[X.Y.Z]". Diese Dezimalklassifikation sollte anstelle der bei Druckwerken üblichen Angabe der Seitenzahl bei Zitaten und Verweisen auf einzelne Teile dieses Dokuments benutzt werden. Der Inhalt der eckigen Klammern kann auch in Verbindung mit dem Dateinamen als Ziel von Hyperlinks benutzt werden. Z.B: können sie durch "<A HREF="DateiX.html#sec1.1.2"> ... </A>" einen Hyperlink direkt zu Abschnitt 1.1.2 dieses Dokuments definieren."

Vgl. auch oben (0.3.3) die Erläuterung des Verfahrens für das vorliegende Dokument.

[3.1.2.8] href="javascript:info('secX.Y')"

Die beschriebene Möglichkeit, mit der ein Leser auf eine bestimmte Stelle in einem Dokument Bezug nehmen kann hat leider einen Nachteil: Sie ist noch fehleranfälliger als die Verwendung von Seitenzahlen: Ein Tippfehler und aus dem Hyperlink wird ein sog. "broken link". Hier hilft die automatische Erzeugung des Links durch den Computer. Mit dem href-Attribut wird eine Funktion aufgerufen, die diese Berechnung leistet. Da das entsprechende Script im Kapitel "Wissenschaft interaktiv" (s. X.Y) eingehend beschrieben ist, mag hier der Hinweis genügen. (Ausprobieren können sie dies - sofern sie keine gedruckte Fassung dieses Dokuments lesen - gleich hier durch einen Klick auf die Klassifikationen der Form [X.Y.Z]).

[3.2] CSS-Codierung

[3.2.1] Codierungsschema CSS

(Die Hyperlinks in diesem Abschnitt führen zu den jeweiligen Erläuterungen in Abschnitt 3.2.2.)

[3.2.2] Erläuterungen zum Codierungsschema CSS

(Die Hyperlinks der erläuterten Code-Bestandteile führen zum Anfang des Schemas zurück.)
[3.2.2.1] color:black

Ich schlage vor, die Dezimalklassifikation nicht besonders auszuzeichnen, sie erhält die normale Textfarbe schwarz. Anders gesagt, die Klassifikation ist durch die Stellung im Text und die eckigen Klammern bereits deutlich genug sichtbar. (Sind sie anderer Meinung, so können hier selbstverständlich andere Angaben stehen).

[3.2.2.2] text-decoration:none

Die eckigen Klammern haben Unterlängen; da dies einen Konflikt mit der standardmäßigen Unterstreichung von Hyperlinks führt, wird diese unterbunden.


Fußnoten

1.) Vgl. G. Schulze: Meine Rechte als Urheber, S. 89-91.

2.) So z.B. Bleuel:

"Wie kann ein bestimmter Teil einer Online Publikation zitiert werden? (...) Es sollten Mindeststandards für elektronische Dokumente entwickelt werden, die beispielsweise die Angabe von Seitennummern im Text ermöglichen. (Als Fußnote 14: Diese muß nicht der gedruckten Seite entsprechen, aber dient als Orientierung (...)) Als ein Ausweg besteht bisher die Möglichkeit, Kapitel oder Absätze anzugeben; bei großen Passagen ist dies aber auf lange Sicht unbefriedigend. Es besteht die Möglichkeit, einen bestimmten Artikel als Orientierung anzugeben, mit zunehmendem Umfang entsteht allerdings auch hier dasselbe Problem." (J. Bleuel, Online Publizieren im Internet, im Abschnitt 1.5.2 *"Zitation von bestimmten Teilen einer Online Publikation":, ip-zitl.htm#ZIEL15, Text identisch mit dem Text des Buches S. 66).

3.) Für Tabellen und Abbildungen gelten besondere Regeln, die in den entsprechenden Kapiteln (s. x. bzw. y.) diskutiert werden. Das hier gesagte bezieht sich lediglich auf normale Überschriften und Absätze.

4.) Nach der HTML-4-Spezifikation sind id-Attribute in allen Elementen erlaubt. Ein <P id="sec1.2"> würde somit die passende Auszeichnung für das eigentlich gemeinte sein: Dieser Abschnitt ist der Abschnitt 1.2. Da aber erst neuere Browser das id-Attribut für fragment-identifier implementieren wird hier (noch) darauf verzichtet, zumal die gleichzeitige Verwendung derselben Werte in id- und in name-Attributen nicht erlaubt ist.

5.) Fragment identifier unterliegen in ihrem Zeichensatz den Bedingungen des URL, denn sie werden mit dem URL über das Netzwerk übertragen. Da einige Zeichen für spezielle Zwecke benutzt werden, z.B. "/", "&", "+" und "?" verbleiben die Buchstaben a - z sowie A- Z (ohne Umlaute u.a. nationale Sonderzeichen), die Ziffern 0 - 9 sowie Punkt und Bindestrich. Leerzeichen sind nicht erlaubt. Des weiteren müssen die Werte von id- und name-Attributen mit einem Buchstaben beginnen. Die Dezimalklassifikation, die nur aus Ziffern und Punkten besteht und mit den drei Buchstaben "sec" beginnt, läßt sich somit uneingeschränkt verwenden.

6.) Der Leser kann den HTML-Quelltext selbst analysieren oder er versucht, über die Browser-Anzeigen der Links im Inhaltsverzeichnis die Codierung des Sprungziels zu ermitteln. Etwas anderes bleibt einem nicht übrig, will man Hyperlinks zu Abschnitten in Dokumenten anlegen, die nicht - wie hier vorgeschlagen - die Möglichkeit der Referenzierung explizit darlegen.


Aus: Grönemann, Olaf: Wissenschaftliches Publizieren mit HTML. (Version 2.0) (1999-02-??). Online im Internet: URL: http://www.groenemann.com/wphtml.htm

© 1997, 1999 Olaf Grönemann,
E-Mail: og@groenemann.com
Homepage: http://www.groenemann.com/