Januar 2017  | GVL nutzt Semantic Data Cleansing

Die Arbeit mit unstrukturierten Daten kann viel Zeit und Geld kosten – das weiß die Gesellschaft zur Verwertung von Leistungsschutzrechten (GVL) aus eigener Erfahrung. Regelmäßig steht sie vor der Herausforderung, Produktinformationen in Nutzungsmeldungen aus verschiedenen Quellen und Formaten mit ihrer zentralen Künstler- und Titeldatenbank abzugleichen. Lange war diese Aufgabe nur mit hohem Personalaufwand und manueller Prüfung zu bewältigen – bis die GVL die Semantik-Experten der Berliner Condat AG engagierte, die das Problem analysierten und eine Lösung zur automatisierten Datenbereinigung entwickelten.

In dem nun erfolgreich abgeschlossenen Beratungs- und Bereinigungsprojekt wurden elf Millionen Datensätze der GVL mit der Condat Smart Media Engine semantisch analysiert, über acht Millionen davon konnten von dem Tool automatisch korrigiert werden. In einem Folgeprojekt wird es die Aufgabe der Condat-Berater sein, eine Lösung für die verbliebenen, zum großen Teil qualitativ sehr schwierigen Datensätze zu erarbeiten.

Die vollständige Pressemeldung zum Projekt steht hier zum Download bereit.