Stephan Lehmke
Schema ST4 Dokumente vollautomatisch optimal publizieren
Siegenia-Aubi erstellt komplexe technische Print-Dokumente vollautomatisch aus medienneutralen Daten

Bei der Einführung eines Redaktionssystems für technische Dokumentation liegt der Schwerpunkt meist auf der Erfassung, Strukturierung und nachhaltigen Pflege medienneutraler, mehrsprachiger Inhalte für komplexe technische Zusammenhänge.
Die Publikation der Inhalte in unterschiedlichen Medien soll möglichst vollautomatisch basierend auf dem aktuell freigegebenen Datenstand in den einzelnen Sprachen erfolgen.
Bei der Publikation von Print-Dokumenten ergibt sich meist das übliche Dilemma: bei vollautomatischer Erzeugung müssen Abstriche bei Corporate Design, Layout und Gestaltung gemacht werden; will man anspruchsvolle Ideen zur Gestaltung umsetzen, dann müssen Dokumente nachbearbeitet werden, und man verliert die Vorteile vollautomatischer Erzeugung in beliebig vielen Sprachen.
Bei der Siegenia-Aubi KG, Hersteller moderner Systeme rund um Fenster-, Türen- und Komfort-Lösungen mit Sitz in Wilnsdorf, ist man seit über 10 Jahren die vollautomatische, optimierte Publikation von Datenblättern mit DocScape gewohnt.
Daten werden aus SAP exportiert, vollautomatisch aufbereitet und gemäß Corporate Design Vorgaben zu Datenblättern mit optimalem Seitenlayout gestaltet.
Bei der Einführung des Redaktionssystems Schema ST4 für die technische Dokumentation wurde schnell klar, dass die gewohnte Layout-Qualität von Print-Dokumenten bei vollautomatischer Dokumenterzeugung mit „Bordmitteln“ nicht würde erreicht werden können.
Insofern wurde der Weg eingeschlagen, Schema ST4 als Datenquelle mit dem bestehenden DocScape-System für das vollautomatische, optimierte Print-Publishing zu verbinden.
Hierdurch wurde eine
best of breed Lösung geschaffen, welche sowohl für den Redaktions- als auch für den Print-Publishing-Prozess optimale Leistung erzielt.
Case Study zum Einsatz von Schema ST4 mit DocScape
Laden Sie hier die von der Unternehmensberatung Melaschuk-Medien erstellte Case Study herunter:
Fazit der Case Study
Laut Case Study bringt der Einsatz von Schema ST4 und DocScape für Siegenia-Aubi die folgenden Vorteile:
- Konzentration auf den Content
Die technischen Redakteure können sich weitgehend auf die Bearbeitung der Inhalte konzentrieren, da die manuelle
Layoutarbeit entfällt. - Dynamisches Layout
Das Printlayout wird für die verschiedensten Publikationen dynamisch
auf Basis eines einzigen intelligenten Regelwerks erstellt und ersetzt zahlreiche limitierte Layoutvorlagen. - Automation
Der einmalige konzeptionelle Aufwand wird durch den Wegfall von wiederkehrenden manuellen Tätigkeiten amortisiert und ermöglicht die Skalierung im Hinblick auf weitere Ausgabekanäle, Produkte und Sprachen.
Highlights der DocScape-Umsetzung
Da sich die Case Study vor allem mit Interface, Prozess und der Bedeutung für den Kunden befasst, sollen hier noch einige Besonderheiten des DocScape-Regelwerks für die vollautomatische Generierung der Dokumente gezeigt werden.
Verarbeitung des Schema ST4 Exports


Für die Anbindung von Schema ST4 an DocScape sind keine zusätzlichen Anpassungen oder Plugins des Redaktionssystems vonnöten.
Stattdessen wird ein Standard-Export-Format „04_uniqueids“ von Schema ST4 gelesen und verarbeitet.
Alle für die Dokumenterzeugung benötigten Inhalte und Informationen können diesem Export entnommen werden, insbesondere
- Textformatierung, Tabellen und eingebettete Bilder.
- Dokumentstruktur zur Einteilung in Kapitel und Abschnitte und Erzeugung von Verzeichnissen, inkl. spezieller Metadaten, z.B. über eingebettete Subdokumente.
- Metadaten für Titeleite sowie Kopf- und Fußbereich.
- Metadaten, die die Darstellung beeinflussen, z.B. Art der Bindung, Zusatzinformationen zur Ausgabe von Grafiken oder Tabellen, Ausgabe der Titelseite ja/nein usw.
Automatische Spalteneinteilung der Seiten


Die Vorgabe für das Seitenlayout sieht normalerweise eine zweispaltige Darstellung vor, die nur auf volle Breite „umgeschaltet“ wird, wenn die Inhalte für die zweispaltige Darstellung zu breit werden.
Wenn Inhalte im Redaktionssystem erfasst werden, ist insbesondere bei Tabellen kaum abzuschätzen, ob ein Element zu breit ist oder nicht.
Daher werden Inhalte, besonders Tabellen, durch DocScape automatisch abgemessen, um zu bestimmen in welcher Breite sie dargestellt werden sollten.
Insgesamt übernimmt das Regelwerk bei der Spalteneinteilung folgende Aufgaben:
- Breite der Inhalte bestimmen und Inhalte gleicher Breite gruppieren.
- Inhalte in zwei- oder einspaltiger Darstellung ausgeben. Nach Bedarf Wechsel der Darstellung mehrfach pro Seite.
- „Austreiben“ der Inhalte auf die jeweilige Breite.
- Automatischer Umbruch und Ausgleich der Spalten.
- Seitenumbruch automatisch an günstigen Stellen.
Kombination von Bild und Text


Eine Herausforderung bei der automatischen Erstellung der technischen Kataloge sind die vielen Seiten, auf denen die konkrete Anordnung von Beschlagteilen im jeweiligen Fenster- oder Türrahmen gezeigt wird.
Diese Seiten bestehen aus einem Grafikelement mit einem großen Leerraum in der Mitte, in dem Piktogramme, Tabellen und Texte platziert werden.
Im Redaktionssystem wird der jeweilige Abschnitt einfach als Grafik gefolgt von den Textinhalten angelegt, mit einem Meta-Attribut, das signalisiert, dass es sich um eine Rahmengrafik handelt.
DocScape ordnet dann die Inhalte automatisch folgendermaßen an:
- Seitenfüllende Ausgabe der Rahmengrafik.
- Bestimmung der Größe und Position des in der Grafik vorhandenen Leerraums.
- Formatierung und mittige Positionierung der Textinhalte im vorhandenen Leerraum.
- Um sicherzustellen, dass alles passt, darf der Textinhalt innerhalb vorgegebener Grenzen automatisch „skaliert“ werden (Schriftgröße und Abstände).
- Kann der Inhalt mit der minimalen Skalierung nicht im Leerraum platziert werden, so wird automatisch ein Seitenumbruch eingefügt und die Rahmengrafik wird auf der/den Folgeseiten wiederholt.
Da die Rahmengrafik sehr unterschiedlich geformt sein kann, muss die Weißraumberechnung, Skalierung und Positionierung für jede Seite individuell erfolgen.
Die Animation zeigt, wie die Inhalte auf den Rahmenseiten platziert werden. Dargestellt wird eine Debugging-Ansicht, bei der die Rastereinteilung der Seite sowie die Belegung der Rasterzellen markiert wird (leere Rasterzellen werden Gelb gefärbt).
Die Ausgabe der Inhalte erfolgt in folgenden Schritten:
- Rahmengrafik auf der Seite platzieren. Es ist zu erkennen, dass die Rasterzellen in der Mitte der Grafik leer bleiben.
- Die innen zu platzierenden Inhalte werden zunächst auf „virtuellen Seiten“ (auf der rechten Seite dargestellt) formatiert und abgemessen. Dabei werden nach Bedarf verschiedene Schriftgrößen ausprobiert.
- Falls der Textinhalt auch bei verringerter Schriftgröße nicht in den Leerraum passt, wird ein Seitenumbruch ausgelöst und die Rahmengrafik auf allen betreffenden Seiten wiederholt.
Berechnung der Spaltenbreiten von Tabellen



Bei den vielen komplexen Tabellen, die in verschiedenen Sprachen erstellt werden, ist es sehr wichtig, keine Spaltenbreiten vorgeben zu müssen.
Dies würde unweigerlich erheblichen Pflege- und Nachbearbeitungsaufwand nach sich ziehen.
Die in den Tabellen abgebildeten technischen Daten bezieht das Redaktionssystem vom verknüpften PIM; die Tabelleninhalte sind also einer großen Dynamik und ständigen Veränderungen unterworfen.
Daher werden die Breiten der Tabellenspalten stets automatisch aufgrund der in den Spalten enthaltenen Inhalte berechnet.
Die Abbildung zeigt die gleiche Tabelle in verschiedenen Sprachen. Unterschiedliche Textlauflängen in der Produktbezeichnung bewirken unterschiedliche Spaltenbreiten.
Optimierung der Schriftgröße in Tabellen


Eine Vorgabe für die Dokumenterstellung ist, dass in sehr umfangreichen Tabellen die Schrift verkleinert werden darf, um Umbrüche zu minimieren.
Dabei sollen sowohl Seitenumbrüche in einer Tabelle als auch
Zeilenumbrüche in Tabellenzellen möglichst vermieden werden.
Erreicht wird das dadurch, dass eine Tabelle in mehreren Schriftgrößen formatiert wird. Dabei wird gemessen, ob
- die Tabelle ganz auf die Seite passt;
- sich durch die Schriftgrößenänderung wesentliche Änderungen an den Zeilenumbrüchen innerhalb der Tabelle ergeben haben.
Aufgrund dieser Kriterien wird dann die „optimale“ Schriftgröße ermittelt und die Tabelle in dieser ausgegeben.
Die Animation zeigt, wie Tabellen während der Verarbeitung mehrfach formatiert werden, um die optimale Schriftgröße zu bestimmen, bis schließlich die Ausgabe in der ermittelten optimalen Schriftgröße erfolgt.
Im Bild unten sind noch einmal die Tabellendarstellung in der normalen Schriftgröße sowie in der letztlich gewählten optimalen Schriftgröße gegenüber gestellt.
Man erkennt, dass viele Zeilenumbrüche in Tabellenzellen vermieden werden konnten.
Regressionstest


Ein DocScape-Regelwerk, das komplexe Darstellungs- und Optimierungsaufgaben erfüllt, ist modular aufgebaut und enthält diverse Regeln auf verschiedenen Abstraktionsebenen, die bei der Dokumenterzeugung ineinandergreifen.
Eine Herausforderung bei der Pflege und Weiterentwicklung eines solchen Regelwerks besteht darin, dass Änderungen zur Verbesserung der Ausgabe an einer bestimmten Stelle sich potentiell an vielen anderen Stellen in unterschiedlichen Dokumenten auswirken können.
In den meisten Fällen ist dies erwünscht (zur Verbesserung der Darstellung), aber wie können unerwünschte Nebenwirkungen einer Änderung entdeckt werden?
Hier kommt der Regressionstest ins Spiel.
- Referenzdokumente werden als Quelldaten sowie als formatiertes Dokument hinterlegt.
- Nach jeder Änderung am System werden automatisch die betreffenden Dokumente neu erzeugt und mit den hinterlegten Referenzdokumenten verglichen.
- Ein Testbericht mit allen Seiten, auf denen es Unterschiede gegeben hat, wird erstellt. Dabei werden die Unterschiede klar auf einer separaten Ebene markiert.
So kann nach jeder Anpassung am Regelwerk ohne Mühe geprüft werden, ob es zu unerwünschen Nebenwirkungen der Änderung gekommen ist.
Bedeutung für Schema ST4 Nutzer
Mit dem Konnektor für Schema ST4 steht DocScape zur vollautomatischen Erzeugung technischer Dokumente für alle Nutzer des Redaktionssystems zur Verfügung.
Der Einsatz von DocScape zusammen mit Schema ST4 bietet die folgenden Vorteile:
- Komplexe Dokumente vollautomatisch erzeugt: DocScape generiert Ausgabedokumente grundsätzlich vollautomatisch; jegliche Nachbearbeitung entfällt. Damit können die Redakteure ihre Kapazitäten ganz der Content-Pflege widmen und werden nicht durch Layoutarbeiten abgelenkt.
- Ihr Corporate Design: Machen Sie keine Kompromisse bei der Umsetzung der Gestaltungsregeln, die Ihre technischen Dokumente besonders lesbar und übersichtlich machen. Ein Redaktionssystem einzuführen muss nicht bedeuten, sich bei der Gestaltung einem kleinsten gemeinsamen Nenner anzupassen. Mit DocScape lassen sich trotz Vollautomatisierung auch anspruchsvolle Gestaltungsregeln optimal umsetzen.
- Einfache Integration: Der DocScape Enterprise Publishing Server ist als Docker-Container oder VM leicht intergriert und kann direkt die Schema ST4 Exporte verarbeiten. Der Initialaufwand ist also minimal, und die vollautomatische Publikation mit DocScape lässt sich problemlos parallel zu anderen Ausleitungskanälen betreiben.
- Keine Lizenzkosten: DocScape ist Open Source und frei von Lizenzkosten. Das erleichtert den Einstieg mit einem einfachen Pilotprojekt, um abzuschätzen, ob die eigenen Ziele erreicht werden können.
- Performant und skalierbar: DocScape erzeugt Ihre technischen Dokumente schnell und vollautomatisch, Falls Sie mehr Kapazität benötigen (z.B., um regelmäßig große Mengen an Einzeldokumenten in vielen Sprachen zu generieren), lässt sich die Leistung leicht durch Parallelbetrieb mehrer Server als Docker-Container, sei es on premise oder in einer IaaS Umgebung, skalieren.
Interesse geweckt?
Die umfangreichen technischen Kataloge, die mit DocScape vollautomatisch erzeugt wurden, können im Siegenia Media Center unter https://www.siegenia.com/de/service/portal#/downloads heruntergeladen werden.
Einige weitere Informationen über diesen und andere best of breed Ansätze finden Sie im Vortrag von Ira Melaschuk unter https://www.programmatic-print.org/res/Downloads/PDC_2022/vortrag-PDC-2022-Schnittstellen.pdf
Nehmen Sie einfach Kontakt auf, um einen Termin für eine unverbindliche Online-Präsentation zu vereinbaren.








