Janitor bietet neu auch die Möglichkeit, Dokumenten-Inhalte zu extrahieren. Da Janitor die Formate der Dokumente nicht alle selber kennen kann, können Konverter-Applikationen in den Prozess eingebunden werden, um den textuellen Inhalt zu extrahieren. Danach nutzt Janitor die Stopwords-Analyse um den Inhalt auf das Wesentliche zu reduzieren. Welche Dokumente extrahiert werden sollen, kann individuell konfiguriert werden.