Differences between revisions 2 and 7 (spanning 5 versions)

Triple Stores

We tested the performance of two triple stores: Virtuoso and RDF-3X. We compare them to our own triple score on a couple of benchmarks.

TODO: Specify the dataset and the benchmark.

Software Installation

Installation von Virtuoso Open-Source Edition:

Runterladen
Anweisungen in README-Datei folgen.

Installation von rdf3x:

Runterladen
Kompilieren

Data Import

Um den Datensatz in die beide Stores laden zu können, musste dieser Satz in einen für RDF-Speicherung gängigen Format umgewandelt werden. Ausgewählt wurde "*.nt"-Format. Der ursprünglicher Satz enthielt Values und Enteties. Values waren schon nt-conform, die dagegen Eneteties mussten umgewandelt werden. Dafür wurde ein kleiner Research gemacht, dessen Ergebnisse hier zusammengefasst wurden. Schlussendlich wurde entschieden aus den Enteties UriRefs zu machen. Dafür wurden die Enteties in die eckigen Klammer gesetzt und die unzulässige Zeichen durch die entsprechende Prozent-Kodierungen ersetzt. Die Ersetzungsregeln entsprechen denen von DBpedia 3.7. Als nächstes musste der konvertierter Datensatz in die beiden RDF-Stores geladen werden.

Data Import Virtuoso: Datenladen in den Virtuoso wurde mit Bulk loading process gemacht. Bei diesem Prozess muss der Name des RDF-Graphen als graph_iri eingegeben werden. Unter dieser Namen ist der RDF-Satz bei Virtuoso erreichbar und man benutzt graph_iri als prefix bei jeder Entety, wenn man eine Spqrql-Anfrage an den Store erstellt. Z.B.: 'Mikel%20Jackson' --> '<http://foo/Mikel%20Jackson>'

Data Import Rdf3x: Das Datenladen in den Rdf3x-Store erfolgt durch einen Skript <Installationsordner von Rdf3x>/bin/rdf3xload <DB-Name> <RDF-Satz-Pfad> TODO: Describe the data import process and any particularities / problems encountered.

TODO: Put a table with the import times for each software.

Queries

TODO: Describe the data import process and any particularities / problems encountered.

TODO: Put a table with the query times for each software.

-  ⇤ ← Revision 2 as of 2014-12-07 16:54:43 → 
  Size: 771
  Editor: Hannah Bast
  Comment:
+   ← Revision 7 as of 2014-12-10 19:28:46 → ⇥
  Size: 2569
  Editor: kg-0-177
  Comment:
-Deletions are marked like this.
+Additions are marked like this.
 Line 1:
-#acl Simon Skilevic:read,write Björn Buchhold:read,write all:read
+#acl Simon Skilevic:read,write Björn Buchhold:read,write All:read,write
 Line 11:
-TODO: Describe the Software used/downloaded. In particular: which version, and if there were any problems downloading.
+'''Installation von Virtuoso Open-Source Edition:'''
 1. [[http://virtuoso.openlinksw.com/dataspace/doc/dav/wiki/Main/VOSDownload|Runterladen]]
 2. Anweisungen in README-Datei folgen.
'''Installation von rdf3x:'''
 1. [[https://code.google.com/p/rdf3x/downloads/list|Runterladen]]
 2. Kompilieren 
== Data Import ==
Um den Datensatz in die beide Stores laden zu können, musste dieser Satz in einen für RDF-Speicherung gängigen Format umgewandelt werden. Ausgewählt wurde "*.nt"-Format.
Der ursprünglicher Satz enthielt Values und Enteties. Values waren schon nt-conform, die dagegen Eneteties mussten umgewandelt werden. Dafür wurde ein kleiner Research gemacht, dessen Ergebnisse [[https://docs.google.com/document/d/1n3p-lpQdCB-2dCIqqAJUC6s5RG01e_y6Fp1xLRbY5HU/edit?usp=sharing|hier]] zusammengefasst wurden. Schlussendlich wurde entschieden aus den Enteties [[http://www.w3.org/TeamSubmission/turtle/#sec-uris|UriRefs]] zu machen. Dafür wurden die Enteties in die eckigen Klammer gesetzt und die unzulässige Zeichen durch die entsprechende Prozent-Kodierungen ersetzt. Die Ersetzungsregeln entsprechen denen von [[http://wiki.dbpedia.org/URIencoding|DBpedia 3.7]]. Als nächstes musste der konvertierter Datensatz in die beiden RDF-Stores geladen werden.
-Line 13:
+Line 21:
-== Data Import ==
+'''Data Import Virtuoso:'''
Datenladen in den Virtuoso wurde mit [[http://virtuoso.openlinksw.com/dataspace/doc/dav/wiki/Main/VirtBulkRDFLoader|Bulk loading process]] gemacht. Bei diesem Prozess muss der Name des RDF-Graphen als graph_iri eingegeben werden. Unter dieser Namen ist der RDF-Satz bei Virtuoso erreichbar und man benutzt graph_iri als prefix bei jeder Entety, wenn man eine Spqrql-Anfrage an den Store erstellt.
Z.B.: '' 'Mikel%20Jackson' --> '<http://foo/Mikel%20Jackson>' ''
-Line 15:
+Line 25:
+'''Data Import Rdf3x:'''
Das Datenladen in den Rdf3x-Store erfolgt durch einen Skript ''<Installationsordner von Rdf3x>/bin/rdf3xload <DB-Name> <RDF-Satz-Pfad>''