Projektidee: Semantisches Web. < Softwaretechnik+Pro < Praktische Inform. < Hochschule < Informatik < Vorhilfe
|
Hallo an alle!
Ich bin Student und muss eine Projektarbeit anfertigen, deren Thema ich frei wählen kann
und welches einen Umfang von acht Wochen haben soll.
Als Thema habe ich mir das "semantische Web" ausgesucht mit folgender Idee, die ich realisieren
will:
Es gibt in meinem gestellten Szenario mehrere Betreiber von Shops, die PC-Hardware verkaufen. Diese
nehme ich als gegeben an. Auf der anderen Seite stehen private Webseiten, die Geld verdienen wollen durch Einblendung von Werbung. Diese Seiten auf denen die Werbung stehen soll, nehme ich auch als gegeben an.
Auf diesen Seiten steht natürlich Inhalt. Und die Werbung muss auf diesen Inhalt bestmöglich abgestimmt sein, also im Prinzip so als Google Adwords, bei denen Schlüsselwörter der Seite "analysiert" werden und aus diesem wird der passende Werbebalken eingeblendet.
Mein eigentliches Projekt soll nun sein, die Shop-Artikel einzulesen über eine Schnittstelle, die ich schreiben will und diese Attribute der Artikel (Artikelname, Artikelbeschreibung, Hersteller, direkter Link zum Anbieter) automatisiert semantisch aufbereiten. So will ich es schaffen "bessere-passende" Werbung auf den privaten Webseiten anbieten zu können. Dies will ich erreichen, dass Schlüsselwörter extrahiert werden und diese semantisch aufbereitet werden soll.
Nun kann ich nicht abschätzen ob diese Idee umsetzbar ist. Beispielsweise weiß ich nicht wie ich diese semantische Aufbereitung machen soll. Ich denke hierbei wohl zu sehr an die "klassische Umsetzung" bei der man einfach an die Datenbank eine select-Anweisung absendet mit where-Bedingung like 'suchbegriff'.
Ich will ja bspw. schaffen, wenn "USB" im Text der privaten Webseite auftaucht, dass gesucht wird, welche Artikel einen USB-Anschluss haben. Das Abbilden in der Datenbank der semantischen Tripel -Artikel-Nr.1 hat USB-Anschluss- (Subjekt - Prädikat - Objekt) ist mir auch nicht ganz klar, denn Abfragen tut man ja eigentlich über SPARQL, aber das muss ja in eine relationale Datenbank gepackt werden. Denke ich klassisch so müssten ja zum Schluss sicherlich 60-70 Tabelle entstehen, die eindeutige Artikelnummern abbildet auf eine USB-Tabelle, auf bspw. eine FireWire-Tabelle, ...
Vielleicht hat jemand ein paar Ideen bzw. ob das was ich machen will in acht Wochen grundlegend umsetzbar ist (an Programmierkenntnissen fehlt es bei mir nicht ) und ob das noch semantisch und sinnvoll ist.
Ich habe mir das Buch "Semantisches Web" gekauft für einen Einstieg in dieses Themengebiet, jedoch kann ich trotz meines Grundwissens daraus nicht abschätzen ob meine Projektidee realisierbar ist.
Gruß PHANTOMIAS
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 10:32 So 19.10.2008 | Autor: | Infinit |
Hallo Phantomias,
Deine Idee finde ich recht interessant, den Zusammenhang zur Semantik sehe ich jedoch noch nicht, außer dass es ein nettes Modewort ist, das gerne benutzt wird.
Deine Ideen lesen sich wie eine solide Beschreibung einer Datenbankauswertung, das ist auch schon anspruchsvoll, hat aber nichts mit Semantik zu tun. Du bräuchtest hierfür erstmal eine Onthologie, die den Zusammenhang zwischen den einzelnen "entities", wie es so schön heisst, beschreibt. Dies ist mehr als die Hintereinanderschaltung von Tabelleneinträgen, denn die Bezüge zwischen den Entities erweitern je gerade das klassische Ergebnisfeld einer relationalen Datenbank, aber irgendwo muss man naturgemäß aufhören, Zusammenhänge herzustellen, sonst kommt man nie zu einem Ergebnis. Es gibt von Firmen vertriebene Darstellungsmöglichkeiten zu Ergebnismengen, diese sind jedoch meist kostenpflichtig und nicht gerade günstig. Für den Endnutzer stellt sich die Frage, was er mit so einer Ergebnisdarstellung anfangen soll oder kann und das hängt einfach davon ab, mit welchem Vorwissen er über die Art der Ergebnisaufbereitung behaftet ist.
Meistens kommt man nicht umhin, die Ergebnisse in Form irgendeiner Herarchie darzustellen und hier kommt die Taxonomie ins Spiel. Wie sollen die Ergebnisse klassifiziert und (meist sequentiell) dargestellt werden? Die klassische Listenform ist das, was ein Webnutzer gewohnt ist, auch wenn dies nicht unbedingt immer eine optimale Darstellungsform ist.
Ich habe mich vor circa 5 Jahren mit diesem Thema mal recht intensiv auseinandergesetzt, unterschätze bitte nicht die Zeit, die man benötigt, um eine "sinnvolle" Onthologie aufzubauen und die Ergebnisse dann zu bewerten.
Das Extrahieren von Begriffen aus Webseiten ist sicherlich möglich, den semantischen Bezug in dieser Aufgabe sehe ich noch nicht, zur Zeit liesst sich Deine Idee wie eine (eventuell verschachtelte) Datenbankanalyse. Auch das ist keineswegs einfach und in Anbetracht der 8 Wochen würde ich mich darauf konzentrieren und nicht noch den Anspruch haben, eine Semantik miteinzubeziehen.
VielErfolg,
Infinit
|
|
|
|