Hallo allerseits,
ich habe vor vielen Jahren damit angefangen, einen digitalen Zettelkasten aufzubauen. Dieser besteht zum größten Teil aus Textdateien und einigen anderen Formaten (JPG, PDF, ODF, LaTeX), insgesamt knapp 40.000 Dateien.
Ich hatte den Zettelkasten damals aus diesem klassischen Grund nur mit Textdateien angefangen: "Die Sachen sollen nach Möglichkeit noch in 20 Jahren lesbar sein."
Vor ein paar Wochen habe ich mich allerdings dazu entschlossen, den Zettelkasten zukünftig einer Software anzuvertrauen und den alten Bestand nach und nach umzustellen. Der hauptsächliche Grund ist hierbei die ziemlich langsame und unflexible Windows-Suche. Ab einer gewissen Größe dauert es trotz guter Hardware schon extrem lange, Dinge im Zettelkasten wiederzufinden. Zudem, und das habe ich jetzt schon oft festgestellt, findet die Windows-Suche leider auch nicht alles. Summa summarum ist sie mir zu unzuverlässig geworden.
Ein weiterer Knackpunkt bezogen auf die Größe einer derartigen Sammlung ist deren Ordnung. Bei 40.000 Dateien kann man sich anstrengen wie man will, es wird irgendwann unübersichtlich und chaotisch.
Als Software bietet sich da natürlich ein Wiki an. Ich habe die letzten Wochen damit verbracht, die gängigen Kandidaten auf einem lokalen Server auf Herz und Nieren zu prüfen. Übrig blieben schließlich:
– MediaWiki
– DokuWiki
Was mir hierbei sehr wichtig ist: es muss unbedingt zukunftssicher sein. Bei MediaWiki habe ich da keine großen Bedenken. So lange es Wikipedia gibt, wird es diese Software auch geben, darauf würde ich wetten.
Ich muss jetzt aber zugeben, dass DokuWiki es mir wirklich angetan hat. Im Wesentlichen würde sich bei meiner Sammlung bis auf die Syntax ja nichts ändern, alles wird weiterhin in Textdateien gespeichert. Sollte ich die Nase also irgendwann doch mal voll haben, könnte ich meine Daten problemlos und schnell "befreien". Bei MediaWiki wäre das ein umständliches Gefrickel mit dem XML-Export.
Auf der anderen Seite hat mir die fehlende Datenbank ein wenig Kopfzerbrechen bereitet. So wie ich meinen Zettelkasten führe, wird er in 15 Jahren sicherlich 80.000 bis 100.000 "Zettel" haben.
Also habe ich auf einer Linux-Shell 100.000 Test-Dateien mit Inhalt erstellt. Die Erstellung des Indexes hat natürlich eine halbe Ewigkeit gedauert.[1] Alles andere verlief zu meiner Überraschung aber sehr gut. Das Wiki ist eigentlich genau so schnell wie mit wenigen Seiten. Sogar das Suchen eines zigtausendfach vorkommenden Wortes ist in vertretbarer Zeit machbar, wenn man die Skript-Ausführungszeit in der php.ini entsprechend verlängert. Ich brauche lediglich eine Volltextsuche und keine komplizierten Datenbankabfragen. Und da die DokuWiki-Suche die Windows-Suche zeitlich und in Hinsicht auf die Zuverlässigkeit der gefundenen Wörter um Längen schlägt, bin ich hier grundsätzlich sehr zufrieden.[2]
Wie dem auch sei; nun zu dem Punkt, wieso ich dieses Posting überhaupt schreibe. Ich habe gestern durch Zufall in Andreas' Wiki Notizen zu seinen Vortrag "Quo vadis, DokuWiki?" vom Hackfest 2015 in Paris gefunden:
http://notes.splitbrain.org/s5:quovadis
Vor allem die Punkte unter "Is DokuWiki dead?" beunruhigen mich jetzt natürlich. Im Besonderen das "myself included".
Mein digitaler Zettelkasten ist für mein Wissensmanagment derart wichtig, dass ich ungern auf eine Software setzen würde, deren Entwicklung in naher Zukunft vielleicht tatsächlich schon "tot" ist.
Wie die Zukunft aussehen wird, das kann natürlich niemand wissen. Aber die Stichpunkte zum Vortrag hören sich teilweise schon ein klein wenig nach Weltuntergangsstimmung an.
Vielleicht kann mir ja jemand, der sich ein wenig mehr mit der DokuWiki-Community bzw. -Entwicklerschaft auskennt, ein paar Worte zu meinen Befürchtungen schreiben.
Wie gesagt, ich tendiere stark zu DokuWiki, sonst hätte ich mir die Mühe mit diesem Beitrag nicht gemacht. Ich hoffe auch, dass er nicht zu lang ist.
Vielen Dank jedenfalls für's Lesen! :-)
Schöne Grüße
natt
[1] Ich hab' das dann irgendwann abgebrochen und in kleinere Schritte aufgeteilt (mal hier 10.000 Seiten, neur Index; mal dort 10.000 Seiten, neuer Index usw.). Allein damit habe ich mich ein paar Tage beschäftigt. Ich bin jetzt kein Prof, wahrscheinlich gibt es da schlauere Methoden. :-)
[2] Ich weiß, das sind eher theoretische Überlegungen. Wenn die Texte nicht nur aus "Lorem ipsum" und "/dev/urandom"-Gedöns bestehen, wird die Suchfunktion bei entsprechender Hardware vermutlich auch bei 100.000 Seiten einigermaßen erträglich sein. Aber mit Windows macht das wie gesagt schon seit langem keinen Spaß mehr.