Ausgangslage
Es liegt eine grössere Menge von Werbebannern vor (z.B. 1000 bis 1 Million), und zu jedem Werbebanner gibt es einige Stichwörter oder einen Textblock (deutsch, englisch, französisch, italienisch oder spanisch).
Ziel
Zu irgendeinem beliebigen Dokument (in D; E, F, I oder ES) sollen diejenigen Werbebanner gefunden werden, die inhaltlich am besten zu diesem Dokument passen.
Mögliche Lösung mit InfoCodex
In einem ersten Schritt werden die gegebenen Werbebanner aufgrund der vorhandenen Stichwörter bzw. Kurztexte inhaltlich analysiert und automatisch in eine sachlogisch gegliederte Informationslandkarte (“virtuelles Bücherregal”) eingeordnet. Werbebanner mit ähnlichem Inhalt werden dabei im gleichen Fach abgelegt. Die Gliederung erfolgt durch InfoCodex ohne menschliches Zutun, kann aber im Bedarfsfall beeinflusst werden.
Die sporadisch eingehenden Dokumente (denen passende Werbebanner zugeordnet werden sollen) werden laufend inhaltlich analysiert und aufgrund eines fundierten Ähnlichkeitsmasses in der Informationslandkarte “platziert”. Als Resultat wird eine kurze Liste mit den am besten passenden Werbebannern zurückgegeben:
Werbebanner 37: 95% Relevanz
Werbebanner 2021: 92% Relevanz
Werbebanner 195: 87% Relevanz
etc.
Technische Angaben
Die Software-Komponenten von InfoCodex stehen als API-Module zur Verfügung und können auch in der Form von Web Services angeboten werden.
Die Software läuft unter Windows, Linux (Debian, Suse, Red Hat) oder Unix (Solaris, IBM AIX, HP Unix).
Weitere Unterlagen
Die vorgeschlagene Lösung entspricht im Prinzip der beiliegend beschriebenen Einordnung von neuen Dokumenten in ein vorgegebenes Klassifikationsschema (“Matching a Fixed Classification System with InfoCodex”).