Semantische Blogs

Nachdem mich Nico gestern telefonisch darauf aufmerksam gemacht hat, dass man in MoveableType auch Kategorie-Pings eintragen kann, habe ich mir die Kategorie-Pings von beta.blogg.de mal angeschaut. Das ist aber garnicht so einfach, meine Kategorien mit denen von blogg.de unter einen Hut zu bringen.
So habe ich z.B. die Kategorien Aus dem Netz und Der tägliche Wahnsinn. Wo ein Beitrag eingeordnet wird, hängt mehr oder weniger davon ab, wie ich den Beitrag für mich einordne. Das hat noch lange nichts mit dem Inhalt des Beitrages zu tun.

Das ist auch das ganze Problem mit den Kategorien. Zusätzlich gibt es bei Blogg.de neben den Kategorien noch eine Orts- und eine Personenangabe. Aber was bedeutet das? Wenn man bei Ort „Deutschland“ angibt, geht es in dem entsprechenden Beitrag um Deutschland, ist der Autor in Deutschland beheimatet, oder ist der Beitrag deutschsprachig? Das gleiche gilt auch für die Kategorien und die Personenangaben.

OK, schauen wir uns also mal an, wofür Blogg.de den Aufwand überhaupt treibt. Zitat:Wir wollen eine Art Yahoo oder Open Directory Project für Blog-Artikel bieten. Da kaum jemand immer nur zu einem Thema schreibt, macht es wenig Sinn, die Blogs nach Kategorien zu sortieren, wohl aber die Artikel. Yahoo, Lycos und ODP sind aber moderierte Systeme, bei denen die Sites von Hand zugeordnet werden. Das wird wohl seinen Grund haben…

Vom Ansatz her erlaubt Blogg.de wenigstens eine mehrfache Kategorisierung, ein Artikel über Brotbacken in der Antarktis könnte also sowohl in der Kategorie „Kochen“, als auch in der Kategorie „Antarktis“ auftauchen – oder muss letzteres doch wieder über die Ortsangabe katalogisiert werden?

Meiner Meinung nach macht die Kategorisierung von Blogg.de so im Moment keinen Sinn. Das Ziel ist löblich, aber da würde es momentan doch auch eine ganz normale Suchmaschine für RSS-Feeds tun, oder? Wenn ich heute bei Google „+Brot + Antarktis“ eingebe, weiss Google ja in dem Moment auch nicht, ob ich nach Brot-Rezepten aus der Antarktis, oder aber nach einem Brot der Firma „Antarktis“ suche. Um dieses Problem kümmert sich gerade das W3C unter der Bezeichnung Semantisches Web. Und das ist sehr viel komplizierter als eine Verschlagwortung.

Ich werde die Kategorie-Pings von Blogg.de erstmal nicht benutzen, weil ich sie nicht passend bedienen kann. Und jetzt extra die Kategorien Aus dem Netz und Der tägliche Wahnsinn bei Blogg.de einzutragen, ist ja irgendwie auch nicht im Sinne der Erfinder. Ich bin aber mal gespannt, wie es da weiter gehen wird.

9 Gedanken zu „Semantische Blogs

  1. Hallo Dirk,

    hast ja recht, semantisches Netz ist besser, nur werde weder ich noch Nico eine Ontologie für blogg.de zusammenbasteln :)

    Die Kategorien, wie sie jetzt bei blogg.de bestehen, sind beta, ob welche hinzukommen oder entfernt werden, wird sich zeigen. Aber es werden nur die Kategorien da sein, die blogg.de anbietet.
    Sonst wird es zu unübersichtlich.

    Das mit den Orts- und Personenangaben hat den Sinn, dass du neben einer allgemeinen Zuordnung, noch Angaben über Ort und Personen machen kannst, wenn du möchtest. In groben Zügen nennt man das dann Facettenklassifikation, oder so.

    Wenn du in Movable-Type nicht streng Kategorie auf Kategorie mappen möchtest, versuch es doch mal mit dem bookmarklet ( http://beta.blogg.de/extras.php ). Das ist ein bisschen flexibler.

  2. Ob sich das semantische Web wirklich durchsetzt, wird sich zeigen. Ich bin da skeptisch. Es gibt ja schon seit Jahren Diskussionen um Metadaten in Websites. Das semantische Web macht es da nur noch komplizierter.

    Einen Vorteil hat es aber, und das ist das, was bei Blogg.de fehlt: die Bedeutung der Auswahl der Kategorien, Orte und Personen bleibt unscharf. Jemand schreibt über seinen Hund und der Artikel landet in der Kategorie „Tier“, ein anderer schreibt über Tierquälerei und der Artikel landet auch in der Kategorie „Tier“. Aber machen diese beiden Artikel nebeneinander Sinn? Bringt es mir als „Tier“-Interessierter etwas, wenn ich durch diese Kategorie gehe?
    Dadurch, dass sich ein Autor beim Einstellen des Artikels entscheiden muss, welcher Kategorie er zugeordnet sein soll, beschränkt ihr die Möglichkeiten der Suchenden. Deshalb finde ich eine „klassische“ Suchmaschine besser.

  3. Diesen Artikel würde ich über euer Bookmarklet übrigens folgenden Kategorien zuordnen: Computer (schliesslich geht es hierbei ja um Computer), Internet (ja, auch darum geht es), Weblogs (darum auch), Technik (ist ja eher ein technischer Beitrag), Software (das ganze wird in Software gelöst), Programmierung (und muss irgendwie entwickelt werden), Freizeit (Blogs sind ja was für die Freizeit), Gesellschaft (und beeinflussen somit die Gesellschaft, zukünftig immer mehr), Wissen (es wird Wissen über den Zusammenhang zwischen Inhalt und Metadaten vermittelt), Wissenschaft (im Zuge des Semantischen Webs ist das sogar sehr wissenschaftlich).

    Ein bisschen viel, oder?

  4. Mag sein, aber wenn du Tierquälerei neben Kategorie Tier, noch in Kategorie Verbrechen steckst, kommst du schon eher in die gewüschte Richtung. Das der Hund ein Tier und Tierquälerei ein Verbrechen ist, stimmt ja soweit.

    Und wenn du viele Kategorien für einen Artikel wählst, dann verliert das zwangsläufig auch an Schärfe.

    Was fehlt ist ein Suchformular, wo man Kategorien kombinieren kann, und einige „dutzend“ verschlagwortete Artikel. Dazu noch ein Suchwort, oder auch nicht, und deine Suche ist relativ genau. Vorausgesetzt es gibt genügend verschlagwortete Artikel!

  5. Aber wo ist dann der Unterschied zur normalen Suchmaschine? Die Verschlagwortung sollte automatisch passieren, also durch einfaches Indizieren der Artikel.
    Der Bonus wäre dann ein Clustering wie bei http://vivisimo.com/. Ihr wollt aber das Clustern vorweg nehmen. Und da bin ich skeptisch, ob das klappen kann. Ich kann eurer System nicht nutzen, weil ich einfach die Kategorien nicht finde. Meine Auswahl oben war übrigens ernsthaft gemeint. Diese Verschlagwortung wäre meiner Meinung nach für diesen Artikel angemessen gewesen. Dass Du das anders siehst, ist ja gerade das Problem. Deshalb sollten die Daten unverfälscht in den Index eingehen.

  6. Pingback: Noch'n Blogg.

  7. Du hast die Idee hinter den Kategorien etwas missverstanden. Es geht nicht um die allergenaueste Verschlagwortung deines Artikels, sondern lediglich darum, den Lesern eine Handreichung zu geben, so dass sie deinen Artikel wiederfinden. Wie in der Stadtbücherei, wo es Romane, Reiseführer, Krimis, Sachbücher, etc. gibt, nicht alles passt 100%, aber der Leser bekommt eine Idee, worum es geht.

    Muss ich dich wieder anrufen, um Dir das zu erklären? :)

  8. @Nico: keine Drohungen, bitte :-)

    Zu Deinem Bücherrei-Beispiel: der Vorteil einer Volltextsuche im Gegensatz zu Kategorien ist aber doch, dass ich bei einer Suche über „London“ mich nicht auf Reiseführer einschränken muss, sondern vielleicht ganz andere Ergebnisse bekomme, z.B. einen Roman über London, den ich interessant finde, oder aber eine Kriminalstatistik. In der Bücherrei muss ich hin- und herlaufen um das alles zu finden. Bei euch müsste ich verschiedene Kategorien auswählen um alle möglichen Ergebnisse zu bekommen.
    Meine Frage ist ja: warum dann überhaupt Kategorien vorgeben, wo sie doch implizit vorhanden sind?

    Das einzige Problem ist, dass bei einer Volltextsuche natürlich nichts gefunden werden kann, was nicht im Text drinsteht. Wenn also jemand nach „Stadt an der Themse“ sucht, wird er einen Beitrag über London nicht finden, wenn die Begriffe „Stadt“ und „Themse“ nicht darin vorkommen. Hier wäre dann eine intelligente Suchmaschine gefragt, die erkennen kann, dass es um London geht, weil vielleicht in vielen anderen Beiträgen die Begriffe „Themse“ und „London“ zusammen vorkommen.
    Aber das ist ein anderes Thema, soll Dir dennoch zeigen, dass mir eure Intention schon bewusst ist. Ich kann sie nur nicht benutzen und suche deshalb die Diskussion :-)

Schreibe einen Kommentar zu Nico Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert