MRC Compressor

MRC Compressor
  • Version 1.0
  • Download
  • Dateigröße 33.7MB
  • Datei-Anzahl 1
  • Erstellungsdatum 17. Dezember 2025
  • Zuletzt aktualisiert 17. Dezember 2025
Download

Das Tool ist ein hybrider MRC-Kompressor (Mixed Raster Content), der speziell entwickelt wurde, um gescannte Dokumente (TIFF/JPEG) in extrem kompakte PDF-Dateien zu wandeln, ohne die Lesbarkeit zu beeinträchtigen.

Anstatt das gesamte Bild mit einem einzigen Verfahren zu komprimieren, zerlegt die Software das Bild intelligent in zwei Ebenen (Layering-Verfahren):

A. Der Vordergrund-Layer (Text-Maske)

  • Ziel: Maximale Schärfe für Text und Linien.
  • Technik:

    1. Segmentierung: Jeder Pixel wird analysiert. Ist er dunkel und unbunt (Text) oder hell/farbig (Hintergrund)? Dies geschieht über konfigurierbare Schwellenwerte (TextThreshold, MaskSensitivity).
    2. Binarisierung: Der Text wird in ein 1-Bit Monochrom-Bild umgewandelt (nur Schwarz oder Weiß).
    3. Stencil Masking: Im PDF wird dieser Layer als Schablone definiert. "Schwarze" Pixel werden in der Textfarbe gemalt, "weiße" Pixel sind zu 100% transparent.

  • Kompression: CCITT Group 4 (Fax-Standard) oder Flate (ZIP). Beides sind verlustfreie Verfahren, ideal für 1-Bit-Daten.

B. Der Hintergrund-Layer (Farbe & Struktur)

  • Ziel: Erhalt von Stempeln, Unterschriften und Papierstruktur bei minimaler Dateigröße.
  • Technik:

    1. Downsampling: Das Bild wird stark verkleinert (z.B. Faktor 3 oder 4, entspr. ca. 75-100 DPI). Da Farbinformationen (Chroma) für das menschliche Auge weniger Auflösung benötigen als Kanten (Luma), ist dies visuell kaum wahrnehmbar.
    2. Bleaching (Reinigung): Ein Filter erkennt graues Rauschen und Papier-Flecken und setzt diese auf Reinweiß. Dies verhindert, dass "Schmutz" komprimiert werden muss.
    3. Posterization: Die Anzahl der Farbnuancen wird reduziert, um glattere Flächen für die Kompression zu schaffen.
    4. Sättigungs-Boost: Farben (z.B. blaue Stempel) werden künstlich verstärkt, um trotz der Verkleinerung lesbar zu bleiben.

  • Kompression: JPEG. Da der scharfe Text bereits in die Maske extrahiert wurde, kann hier eine hohe Kompression gewählt werden, ohne dass der Text "ausfranst".

C. Das Assembly (Zusammenbau)

Mithilfe der Bibliothek iTextSharp (LGPL Version) werden beide Layer im PDF übereinandergelegt. Das Ergebnis ist ein Dokument, das wie ein 300 DPI Scan aussieht, aber speichertechnisch so klein ist wie eine stark komprimierte Datei (~60–200 KB).

Konformität zur BSI TR-Resiscan (TR-03138)

Das Verfahren erfüllt die technischen Anforderungen der Technischen Richtlinie des BSI für das ersetzende Scannen:

  1. Erhalt der Bildinformation (Integrität):
    Die TR-Resiscan fordert, dass keine bildwichtigen Informationen verloren gehen.

    • Da der Text-Layer nicht herunterskaliert wird (er bleibt bei vollen 300 DPI Originalauflösung), bleiben selbst feinste Linien und Serifen pixelgenau erhalten.
    • Die Trennung von Farbe und Text sorgt dafür, dass Textkanten nicht durch JPEG-Artefakte "vermatschen".

  2. Zulässige Kompressionsverfahren:
    Die Richtlinie erlaubt verlustbehaftete Kompression (wie JPEG), solange die Lesbarkeit nicht beeinträchtigt wird.

    • Für den informationsrelevanten Teil (Text) nutzt das Tool verlustfreie Verfahren (CCITT/Flate).
    • Für den dekorativen Teil (Hintergrund) wird JPEG genutzt, was laut Standard zulässig ist.

  3. Verkehrsfähigkeit / Standard:
    Das erzeugte PDF entspricht dem PDF-Standard (Version 1.5) und kann von jedem Standard-Viewer geöffnet werden. Es nutzt keine proprietären Formate.

Warum das Tool "Pattern-Safe" ist

Ein großes Risiko bei der Archivierung ist die sogenannte Symbol-Substitution (Pattern Matching), bekannt durch Probleme bei aggressiven JBIG2-Encodern (wo z.B. eine "6" durch eine "8" ersetzt wurde).

Dieses Tool ist technisch zu 100% sicher gegen diesen Fehler:

  1. Kein Wörterbuch: Der verwendete Algorithmus arbeitet pixelbasiert, nicht zeichenbasiert. Es findet keine Analyse von Formen oder Buchstaben statt.
  2. Keine Referenzierung: Das Programm legt keine Bibliothek von "ähnlichen Zeichen" an. Jeder Pixel wird individuell bewertet.
  3. Deterministisch: Ein schwarzer Pixel im Original bleibt ein schwarzer Pixel im PDF. Es findet keine Interpretation des Inhalts statt (kein OCR, keine Vektorisierung).

Damit ist das Risiko einer inhaltlichen Verfälschung durch den Kompressionsalgorithmus mathematisch ausgeschlossen.

Kurzanleitung: MRC Tuner & Kompressor

Dieses Tool konvertiert gescannte Bilder (TIF, JPG) in hochkomprimierte, durchsuchbare PDFs. Es nutzt das MRC-Verfahren (Mixed Raster Content), um Text gestochen scharf zu erhalten, während der Hintergrund (Papier, Stempel) stark komprimiert wird. Das Ergebnis ist TR-Resiscan konform und sicher vor Zeichenfehlern.

1. Der visuelle Modus (GUI)

Starten Sie die .exe per Doppelklick, um die Oberfläche zu öffnen. Dieser Modus dient dazu, die perfekten Einstellungen für Ihre Dokumententypen zu finden.

  1. Bild laden: Öffnen Sie einen Scan (TIF/JPG).
  2. Vergleich: Links sehen Sie das Original, rechts die echte PDF-Vorschau.
  3. Live-Tuning: Ändern Sie die Regler links. Sobald Sie loslassen, wird die PDF im Hintergrund neu berechnet.
  4. Kontrolle:

    • Zoomen Sie rein (Mausrad + STRG), um die Schärfe zu prüfen.
    • Achten Sie auf die Dateigröße (wird oben rechts in Blau angezeigt).

  5. Speichern: Speichern Sie das Ergebnis als PDF.
  6. Befehl kopieren: Unten links generiert das Tool automatisch den passenden Kommandozeilen-Befehl für Ihre aktuellen Einstellungen.

2. Der Automatik-Modus (Kommandozeile / CLI)

Für die Stapelverarbeitung oder Einbindung in Skripte. Starten Sie das Tool über die Eingabeaufforderung (CMD/PowerShell).

Syntax:
ToolName.exe "Eingabe.tif" "Ausgabe.pdf" [Parameter]

Beispiel:
ScanTool.exe "Rechnung.tif" "ArchivRechnung.pdf" --threshold 160 --sens 20 --scale 3

(Wenn keine Parameter angegeben werden, nutzt das Tool Standardwerte.)


3. Erklärung der Einstellungen (Parameter)

Hier finden Sie, was die Regler bewirken:

Regler / Parameter CLI-Switch Empfohlen Beschreibung
Text Threshold --threshold 150 - 180 Bestimmt, ab welcher Dunkelheit ein Pixel als schwarzer Text erkannt wird. <br>• Höher: Text wird dicker/fetter.<br>• Niedriger: Text wird dünner, weniger Rauschen.
Farb Sensitivity --sens 20 - 40 Wie empfindlich wird auf Farbe reagiert? <br>• Niedrig (20): Schützt auch dunkle Stempel davor, schwarz zu werden.<br>• Hoch (80): Nur knallige Farben bleiben bunt, Rest wird schwarz.
Hintergrund Skalierung --scale 3 Verkleinert den Farbhintergrund. <br>• 3: Sehr scharf (guter Kompromiss).<br>• 6: Sehr klein, aber unscharf/verwaschen.
Hintergrund Qualität --quality 10 - 15 JPEG-Qualität des Hintergrunds.<br>• Dank spezieller Filter reichen hier sehr niedrige Werte (10-15) völlig aus.
Hintergrund Bleaching --white 230 "Digitaler Radiergummi". Alles, was heller ist als dieser Wert (z.B. graues Papier), wird reinweiß. Spart massiv Speicherplatz.
Farb-Vereinfachung --step 48 Reduziert die Anzahl der Farbnuancen (Posterization). <br>• Macht Flächen glatter und JPEGs kleiner.
Sättigung --sat 1.5 Verstärkt Farben. Da der Hintergrund verkleinert wird, hilft das, Stempel und Unterschriften lesbar zu halten.
Schärfen --sharpen 1 Zeichnet den verkleinerten Hintergrund künstlich nach, damit farbiger Text knackig wirkt.

4. Best Practice (Empfehlung)

Für typische Rechnungen und Briefe (Schwarztext mit blauem Stempel/Unterschrift):

  • Größe: ~150 - 190 KB
  • Settings:

    • Threshold: 160
    • Sensitivity: 20 (wichtig für dunkle Stempel!)
    • Scale: 3
    • Quality: 45
    • Bleaching: 230
    • Sharpen: 1

Damit erreichen Sie eine Qualität, die kommerziellen Lösungen in nichts nachsteht, bei minimaler Dateigröße.

Dies ist eine Demoversion. Sie hat keine Einschränkungen. Es wird ein "Demo" auf die PDF gedruckt.

DateiAktion
MRC_Compressor.zipDownload

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahren Sie, wie Ihre Kommentardaten verarbeitet werden.

Nach oben scrollen
WordPress Cookie-Hinweis von Real Cookie Banner