Tool zum Schwärzen?

Schwärzen ist leider je nach Tool (verwende lokal PDF-XChange-Editor) eine Sisyphusarbeit, und ich muss sagen, FragDenStaat macht das sehr bequem. Kann man das Tool von Euch auch für Dokumente verwenden, die man nicht auf FragDenStaat laden will? Am einfachsten online, aber ich kann mir auch vorstellen Eure Software oder Teile davon lokal zu installieren. Wo muss ich da starten? Froide oder eine andere Zulieferung?
Vielen Dank
Joachim

Hallo!

Die Frage gab es schon öfter, leider gibt es noch keine befriedigende Antwort.

Es ist alles Open Source, aber leider noch sehr integriert in FragDenStaat. Das Frontend lädt das nicht-öffentliche PDF über eine autorisierte URL, generiert eine Reihe von Schwärzungsanweisungen, die dann im Backend verarbeitet werden, wo das geschwärzte PDF dann separat abgelegt wird.

Die Entkopplung des Frontends ist nicht so schwer (ist auch nur eine Vue-Komponente), aber das Backend mit Lesen und Schreiben von PDFs, die ja nicht zum Schwärzen-Service selbst gehören: da fiel mir auf die Schnelle keine gute alleinstehende Lösung ein, die aber gleichzeitig wieder in FDS integriert werden kann. Gibt aber sicherlich einen Weg, bin für Vorschläge offen.

wenn die Entkoppllung schwierig ist wäre eine andere Lösungsidee vielleicht einen anderen Wunsch nach oben zu bringen: manchmal würde ich gerne schon beim Stellen einer Anlage ein oder mehrere Dokumente geschwärzt mitschicken. Wenn ich das dann auch bei einem Entwurf machen könnte, dann könnte ich FDS zum schwärzen benutzen und einen unnötigen Entwurf auch mal wieder löschen. Im Extremfall kann das natürlich einiges mehr Last auf Eurer Persistenz bewirken, aber das könnt Ihr ja irgendeinem Quota überlassen, und ggfs. auch an der Stelle Spenden einwerben.

Ansonsten: wo ist denn die Backendlogik um die Scharzliste und das PDF zu verarbeiten? Da nehmt Irh doch bestimmt auch irgendwas öffentliches?

1 „Gefällt mir“

Ohne da jetzt genauer rein geschaut zu haben: rein theoretisch wäre da sicher so eine Art Microservice-Architektur (mehr oder weniger) angemessen, dann kann da jeder Service PDFs + Schwärzungsinfos etc. hin schicken und schwärzen lassen. Und das ließe sich evt. separat auch lokal bezreiben.
Wirklich realistisch nutzbar klingt das aber nicht, da es django integriert ja ist und man lokal wohl kaum nen Webserver betreiben will für sowas. Eher würde man das komplette vorgehen dann wohl zu nodejs/JS portieren und dann irgendwie in ne Electron-Anwendung packen wohl.:upside_down_face:

Ein Problem bei einem Micro-Service ist das Speichern der fertigen, potentiell sehr großen PDFs. Eine Callback-URL ist vermutlich nicht ausreichend, sondern der Micro-Service braucht dann Schreibzugang zu einem Blob/Object-Storage, was das ganze dann wieder weniger entkoppelt, als gedacht.

Wir nutzen eine wilde Mischung aus PDF rewriting tools, um das PDF ordentlich lesbar zu bekommen und dann reportlab, um ein geschwärztes PDF zu konstruieren.

Code hier: froide/redaction.py at main · okfde/froide · GitHub

1 „Gefällt mir“