News Codes bringen Semantik in den Nachrichtenstrom
- Details
- Erstellt am Samstag, 02. April 2011 13:39
- Zugriffe: 266
Ob die Gründung der Grünen oder die Atomkatastrophe in Fukushima - seit mehr als 30 Jahren folgt die Agenturberichterstattung über alle aktuellen Ereignisse einem einheitlichen Schema: Das Meldungsformat IPTC 7901 enthält Meldungskopf, Meldungstext und Schlussinformationen. Nach den Regeln für die Gestaltung dieser Teile richten sich die Redaktionssysteme der Agenturen wie der Medien, die ihre Dienste beziehen.

"Das gute alte IPTC 7901 Format ist noch immer der Ackergaul unter den Formaten", erklärt der geschäftsführende Direktor des IPTC (International Press Telekommunikation Council), Michael Steidl, auf eine Anfrage von agenturjournalismus.de. Aber inzwischen werde zunehmend gefragt, ob es nicht etwas Besseres gebe. "Gibt es", antwortet Steidl, "die G2-Standards haben nach ihrer Erstveröffentlichung im März 2008 eine gute Stabilität und eine Unterstützung der großen Player in der Branche".
Passend zu diesen G2-Nachrichtenformaten hat der IPTC als Standardisierungsgremium einen Satz von sogenannten Vokabularen entwickelt, die als NewsCodes bezeichnet werden und mit denen Nachrichten nach unterschiedlichen Aspekten sehr viel detaillierter kategorisiert werden können, als dies mit den Stichwörtern in IPTC 7901 möglich ist. Nachrichtenagenturen oder andere Anbietern von aktuellem Content können dabei diejenigen NewsCodes verwenden, die für sie besonders relevant sind - und auf andere verzichten. Die Newscodes sind Sammlungen von Werten für Metadaten von Nachrichten, dargestellt im universellen Datenformat XML, womit sie sich zum einen jederzeit gut lesen lassen und zum anderen alle Voraussetzungen für das crossmediale Publizieren erfüllen: Ein- und dieselbe Meldung lässt sich so mit wenigen Zeilen Software-Code für unterschiedliche Medien aufbereiten - von Zeitungen über die Redaktionssysteme des Rundfunks und der News-Portale im Netz bis zur Präsentation auf mobilen Geräten.
Von den insgesamt etwa 60 NewsCodes sind besonders diejenigen Vokabulare interessant, welche den journalistischen Inhalt beschreiben und in Kategorien einteilen. Damit ließe sich endlich mehr Semantik in den Nachrichtenstrom bringen. Die Stichwortzeile im Meldungskopf von IPTC 7901 mit ihren maximal 48 Zeichen lässt nur vage Hinweise auf den Inhalt zu. Zudem haben die Agenturen jeweils eigene Gepflogenheiten für diese Stichwörter entwickelt, was den Beziehern der Nachrichtendienste den Umgang damit erschwert.
Als Alternative gibt es schon seit 15 Jahren die SubjectCodes des IPTC, die in zunehmend detaillierten Ebenen eine recht präzise thematische Kategorisierung von Nachrichteninhalten ermöglichen. "Zumindest die oberste Ebene und die zweite Ebene von deren baumartiger Struktur werden von vielen Agenturen weltweit als Basis-Kategorisierung verwendet", erklärt Steidl.
In der obersten Ebene gibt es 17 Top-Subjects von subj:01000000 für Kultur, Kunst und Unterhaltung über subj:04000000 (Wirtschaft und Finanzen) und subj:05000000 (Erziehung, Ausbildung) bis zu subj:11000000 (Politik), subj:16000000 (Krise, Krieg, Konflikt) und schließlich subj:17000000 für alle Informationen zum Wetter. "Nach unserer Kenntnis werden die Subject Codes von AFP, Reuters, PA, EFE, Kyodo, teilweise auch dpa und anderen verwendet", sagt IPTC-Direktor Steidl.
Allerdings sind die Workflows der Agenturen so eingespielt, dass viele den Aufwand einer großen Umstellung in ihren Basisdiensten scheuen und bei ihren vertrauten Stichwort-Vokabularen bleiben. Der IPTC will nun versuchen, eine Brücke zu schlagen und hat "ein etwas breiter aufgestelltes, nicht so ins Detail gehendes Vokabular" entwickelt, "bei dem sich dessen Begriffe leicht mit entsprechenden aus den agenturspezifischen Vokabularen verbinden (verlinken) lassen". Dies soll der neue NewsCode der Media Topics leisten, die laut Steidl "aus den Subject Codes hervorgegangen, aber etwas sauberer strukturiert sind". Die Media Topics umfassen 1100 Begriffe - rund 300 weniger als bei den Subject Codes. Die oberste Ebene der Media Topics ist mit den 17 Top-Subjects identisch, auch in den weiteren (bis zu 5) Ebenen gibt es teils identische, teils neu gefasste Kategorien - hier ein Beispiel für das Vokabular zur IT-Branche:

Ob die G2-Formate mit den Newscodes einmal die gleiche Standardisierungskraft entwickeln können wie IPTC 7901, hängt nicht zuletzt von der Akzeptanz in den Redaktionen ab. Es gibt bereits Software für eine automatische Kategorisierung, die eine Meldung analysiert und dann einen Code dafür vorschlägt, der vom Redakteur oder der Redakteurin akzeptiert oder geändert werden kann. "Der Knackpunkt dabei ist, dass der Kategorisierer mit den IPTC-Vokabularen umzugehen gelernt haben muss, was eben etwas Training erfordert", erklärt Steidl. Daneben gebe es auch Systeme, die in einem ersten Anlauf die üblichen Stichworte einer Meldung entgegennehmen, diese dann intern in entsprechende Newscodes übersetzen und gegebenenfalls noch eine Auswahlliste anbieten.
Weitere Newscodes definieren Metadaten für administrative Zwecke wie die Kennung von Agenturdiensten (News Provider und News Product) oder für das Management von Nachrichten (News Item Nature). Die NewsCodes sind auf der IPTC-Website verfügbar. Um sie auch auf dem Computer oder mobilen Geräten zu nutzen, hat die Organisation jetzt eine von dpa-mediatec entwickelte Java-Software bereitgestellt, den IPTC G2 Scheme Browser.