Grid Wiki - The next Wiki generation

Ich bin heute mal wieder über einen Artikel “Wikipedia? Ist doch irrelevant…” zur Relevanzdiskussion in der Wikipedia gestolpert und habe mich dabei an eine Idee erinnert die ich dazu mal hatte. Und damit ich später sagen kann, die Idee hatte ich auch, schreibe ich sie heute einfach mal nieder.

Da es so unterschiedlich ist, was die Leute als Relevant genug sehen, ist ein dezentrales System nötig. Nun gut, jetzt fragt man sich natürlich, wieso nicht einfach eine eigene Wiki aufsetzen und fertig. Schließlich braucht man ja nur den Inhalt kopieren und schon ist es in der eignen Wiki. Das liegt daran, dass wir in einer Zeit angekommen sind wo Komfort ein wichtiger Punkt ist um viele Nutzer anzuziehen. Deshalb sollte der Nutzer auch nicht dazu genötigt werden, irgendwas manuell in vielen Schritte zu kopieren. Man sollte nur die URL zum Wiki Artikel angeben müssen und nach einem Knopfdruck hat man die Seite bei sich im Node.

Ich gehe jetzt erst mal davon aus, dass wir nur zwischen Nodes einer Grid Wiki Artikel austauschen. Dadurch vereinfachen wir den internen Ablauf nämlich, da wir praktischer weise eine API zum Abfragen der Artikel inklusive Metadaten und History anbieten. Jetzt sind wir an dem Punkt, wo ich sogar auf ein existierendes Projekt verweisen kann, da ich selbstverständlich vorher gesucht habe, ob es vielleicht schon etwas vergleichbares gibt. Gefunden habe ich dabei Gollum, ein Projekt welches Git zum speichern der Artikel und verwalten der History nutzt. Durch den guten branching Support von Git liegt der Gedanke natürlich nahe, dass dies für ein verteiltes Wiki eine tolle Basis ist. Zudem verwaltet ja auch Github seine Wikis auf Basis von Git. Für ein gemeinsames Wiki halte ich das auch für gut. Aber um auf das Ausgangsproblem mit der Relevanz zu verweisen, wir wollen gar nicht alle die selben Dinge in der Wiki. Wir wollen größten Teils eben nur einzelne Artikel in unsere Wikis übernehmen. Nun kann das sicher auch gut mit Git umgesetzt werden, aber es fühlt sich für mich so an, als ob man ganz schöne Verbiegungsarbeit leisten müsste, wenn man nur Commits von bestimmten Files übernehmen will. Man stelle sich mal vor, da sind Leute, die haben in einem Commit gleich einen ganzen Satz von Artikeln bearbeitet.

Wir benötigen also ein System, was nicht nur ganze Wikis, sondern auch nur einzelne Artikel übernimmt. Und um das ganze noch spannender zu machen, erlauben wir nicht nur das übernehmen von Artikeln aus anderen Grid Wiki Nodes, sondern bauen auch noch einen Parser dazu der in der Lage ist, Artikel aus der Wikipedia oder auch anderen Wikis zu übernehmen. Da wir selbstverständlich eine hoch modular aufgebaute Architektur haben werden, könnte man das ganze noch so weit treiben, dass Inhalte übernommen werden, die gar nichts mit Wikis zu tun haben. Ein Beispiel wären da die Webartikel der öffentlich-rechtlichen Rundfunkanstalten, die ja der vertraglichen Löschwut zum Opfer fallen.

Zusätzliche Funktionen die man sich dann noch wünschen könnte wären zum Beispiel eine automatisierte Überprüfung, ob sich übernommene Inhalte verändert haben und diese entweder automatisiert zu übernehmen oder per Verweis dem aufrufenden Besucher darüber zu informieren. Auch das informieren von Autoren wäre praktisch, wenn man ihre Inhalte übernommen und dann verändert hat.

Nun bleibt noch ein Hauptproblem, um es mit Wikipedia aufnehmen zu können. Da es viele Leute mit eigenen Nodes geben wird, fehlt es erst mal an durch Reviews gesicherte Qualität und Richtigkeit. Außerdem wird ein Grid Wiki von den Suchmaschinen wohl nicht sonderlich gemocht werden, da es für sie wohl eher nach Spam Seiten aussieht durch identischer Content der auf vielen unterschiedlichen Domains vorhanden ist.

Die Lösung für dieses Problem würde ich von einer eigenen Anwendung erledigen lassen, die sich auf das sammeln der Inhalte von verschiedensten Nodes konzentriert und dessen Qualität sicherstellt oder zumindest bewertet. Durch die API, welche das abfragen der Artikel mit allem drum und drann ermöglicht, sollte dies also kein großes Problem sein. Außerdem ermöglicht es die Freiheit unterschiedlichste Systeme aufzubauen für diesen einen Zweck. Zum Beispiel ein System, welches wenigen gewählten Mitgliedern überlässt, über die Aufnahme und Freischaltung oder auch die Ablehnung zu entscheiden, so wie es momentan bei Wikipedia ist. Ein anderes System führt vielleicht ein Communitybasiertes Bewertungssystem ein. Dann gibt es sicher auch das entsprechende Gegenstück zu Wikipedia, eine Gruppe bezahlter Experten, die über die Qualität bestimmen bzw. Inhalte liefern sollen. Möglicherweise entwickelt auch jemand(zb. Google) einen angepassten Algorithmus, der eine automatisierte Auswertung vornimmt. Wobei mir einfällt, die hatten ja auch mal so was wie ein Wiki per User. Was ist daraus eigentlich geworden? Man stolpert bei Google Suchen ja gar nicht darüber. Mal nachgesehen, Knol hieß der. Passt von der Beschreibung her eigentlich recht gut zu meinen Vorstellungen. Auf der Ebene des Hosters fehlt nur leider das dezentrale, da ja alles bei Google gehostet wird.

So, das waren erst mal meine Gedanken zu Grid Wiki selbst. Nun noch ein paar Gedanken die ich mir dazu gemacht habe, die aber mehr das darum herum betreffen.

technische Sichtweise

Ein Vorteil den dezentrale Systeme mit sich bringen ist der Punkt, dass sie nie komplett ausfallen. Somit sind sie gegen potenzielle DOS Angriffe nicht sonderlich anfällig. Andererseits werden einzelne Grid Wiki Nodes vermutlich nur auf eher Leistungssachwachen Servern laufen, wodurch sie besonders empfindlich gegenüber dem Slashdot-Effekt sind.

rechtliche Sichtweise

Das betreiben einer Wiki birgt durchaus rechtliche Risiken. Oft genug gab es schon versuche mit rechtlichen Mitteln Inhalte aus der Wikipedia zu streichen. Diesem Risiko würde sich dann jeder aussetzen, der ein eigenen Grid Wiki Node betreibt. Die Entwicklung wird dann vermutlich in die selbe Richtung gehen, wie es das derzeitige Abmahngeschäft bei illegalen Downloads ist.

ideologische Sichtweise

Ideologisch gesehen, wäre ein derartig dezentrales System eine logische Entwicklung in unserer Informationsgesellschaft, die immer wieder gegen die Zensur ins Land zieht. Sie würde es aber auch die Verbreitung von falschen Informationen und Verunglimpfungen verschärfen, da es möglicherweise unmöglich wird, sämtliche Hoster einer Grid Wiki dazu zu bewegen, einzelne übernommene Änderungen wieder zurück zu spielen.