Verteilte Graph-Datenverarbeitung mit Neo4j und Apache Spark.
In diesem Vortrag werden zuerst die grundlegenden Konzepte hinter Graphenmodellierung und Abfrage der Graphdaten vorgestellt. Apache Spark arbeitet standardmäßig mit tabellarischen Daten und wird zur parallelen Prozessierung großer Datenmengen genutzt. Es werden verschiedene Tools und Wege vorgestellt, wie eine Anbindung und Verarbeitung auch von Graphdaten funktionieren kann. Anhand von einem Beispieldatensatz werden wir abwechselnd die Abfragesprache Cypher (Neo4j) und die Apache Spark API (unter anderem auch GraphX) verwenden um die Daten zu analysieren. Dann konzentrieren wir uns darauf, die Leistungsfähigkeit beider Tools für eine reibungslose Verarbeitung Ihrer verlinkten Daten zusammenzubringen.
Iryna Feuerstein ist Graph-Enthusiastin, Mitorganisatorin des Graph-Databases-NRW-Meetups, Software-Entwicklerin seit 2010, seit über 5 Jahren als Beraterin bei PRODYNA SE tätig, und in der Freizeit hauptsächlich mit Mathe beschäftigt.
Anmeldung:
Eine Veranstaltung des iJUG e.V., organisiert durch die JUG Ostfalen.