RDFa mit Nutzeffekt

Um den Wert von RDFa und semantischen Daten anzuzeigen, kann das WordPress-Plugin GoodRelations for WP e-Commerce benutzt werden. Dieses wurde von Christian Junghanns im Rahmen seine Bachelor Arbeit an der Universität der Bundeswehr München für das e-Commerce-Plugin entwickelt. So können beispielsweise durch das Plugin bei einem Webshop auf Basis von WordPress (ein Artikel pro Seite ) auf den Seiten e-Commerce Daten auf Basis von Good Relations angezeigt werden. Diese können von Crawlern der Suchmaschinen gelesen werden und führen zu besseren Suchergebnissen.

Um das ganze in der Praxis zu sehen, kann man das Google Tool Rich Snippets Testing Tool verwenden: hier  werden eben dem reinen Suchergebnis-Snippet auch Metadaten sowie der Preis angezeigt.

W3c publiziert die erste Recommendation mit XHTML+RDFa

Neben der bereits seit 2 Jahren existierenden Recommendation RDFa in XHTML: Syntax and Processing, mit dem Hintergrund, dass Maschinen besser die Seiten “verstehen”, die sie gerade analysieren, wurde nun erstmals auch eine Recommendation vom W3C mit RDFa ausgezeichnet: XHTML™ Modularization 1.1.

Freebase Suggest

Eine kleine Applikation um eineindeutige Tags zu vergeben ist Freebase Suggest. Es ist ein ca. 30k großes jQuery Plugin, welches mit wenig Programmier-Code aufgerufen werden kann. Vorschläge können hierbei thematisch eingegrenzt werden, alelrdings ist dieses Plugin nur in Englisch.

Eine neue Suchmaschine

In sechs Wochen geht eine neue Suchmaschine an den Start: blekko. Das klingt in einer Zeit, wo die Suchwelt von Google beherrscht wird und sich Microsoft und ein paar andere mit viel Geld um die Reste streiten, ziemlich irre. Aber immerhin hat blekko eine Besonderheit: Schon während des Crawlens werden die Seiten kategorisiert, so dass das Suchergebnis über sogenannte Slashtags (z.B. /date, /demblogs, /people, /health, /satire) eingeschränkt und sortiert werden kann. Zudem sollen Informationen – wie der Rankingalgorithmus – publiziert werden und nicht geheim bleiben.

Die Suchmaschine ist noch für ein paar Wochen in einer privaten Betaphase, aber Neugierige können sich bei Techcrunch schon mal genauer informieren.

Google kauft Metaweb

Freebase gehört jetzt Google. Laut einer Ankündigung in ihrem
Bloggehört Metaweb jetzt Google. Damit ist die wesentlich strukturierte Alternative zur Wikipedia (und auch der DBPedia) mitsamt ihrer Technologie beim Suchgiganten gelandet. Ich bin neugierig, was Google daraus machen wird.

Aber laut Blog soll Freebase frei bleiben und die Database Dumps sogar noch häufiger erscheinen.

Die Fussball WM und das semantische Web

Das das Semantic Web reif für den Mainstream ist, zeigt die Website der BBC zur Fussball WM 2010. Statt ein herkömmliches CMS auf Basis einer relationalen Datenbank zu benutzen, wurde als Grundlage ein Triplestore gewählt, aus dessen Daten automatisch die Website erzeugt wurde. Die journalistischen Inhalte wurden ebenfalls automatisch getaggt, noch mal manuell geprüft und dann mit den umfangreichen Spieler und Spieledaten über eine passende Ontologie verknüpft. Andere externe Quellen liefen ebenfalls automatisiert als Triple in den Store.

Den Blogeintrag bei der BBC zum Thema gibt es hier:
BBC World Cup 2010 dynamic semantic publishing

Was ist eine semantische Suchmaschine?

Im Blog zur semantischen Suchmaschine Hakia haben sich die Macher mal ein paar Gedanken gemacht um den Unterschied zwischen den neuen Features in der Google-Suche und einer richtigen semantischen Suchmaschine.

  • Automatische Verarbeitung von morphologischen Variationen (verbessern, Verbesserung, verbessert…) und Synonymen (heilen, behandeln …)
  • Generalisierung: Aus “Welche Krankheit hat als Symptom Husten” sollte über die Generalisierung “Refluxösophagitis -> Krankheit” auch diese Form der Erkrankung der Speiseröhre gefunden werden.
  • Erkennung von Konzepten: Anspruchsvoll und interessant, denn die Suchmaschine soll verstehendas zum Konzept “politische Instabilität” auch Begriffe wie Unsicherheit und Unruhe gehören.

Die Autoren listen noch einige Punkte mehr auf und letzendlich wird klar, dass Google zwar eine hocheffektive Suchmaschine betreibt, aber sicherlich keine semantische Suchmaschine.

Die Top 100 der SemWeb-Tweeter

Und hier noch ein paar Anregungen, bei wem es sich lohnt Follower zu werden The Top 100 SemWeb Tweeters

Streit um Nepomuk

Im Blog von Aaron Seigo ist ein heftiger Streit um die Integration von Nepomuk in die KDE entbrannt: Die User beklagen sich über zu viel Resourcenverbrauch und keinem ist so recht klar, wofür das Semantic Dektop eigentlich gut sein soll. Da ist dringend bessere PR nötig.

RDFa in WordPress

Besser spät, als nie. Schon seit April gibt es ein Plugin um WordPress mit RDFa anzureichern: wp-rdfa. Nach Installation und Aktivierung werden alle Artikel mit Dublin Core Elementen ausgezeichnet und die User stehen als FOAF File zur Verfügung.