Entscheidungshilfe

Die optimale Suche

Welche Recherche-Verfahren sind für welchen Einsatz geeignet?

Schnell zur gewünschten Information

Interview mit Petra Greiffenhagen, Vertriebspartnerin von ALPHA COM und Inhaberin der Unternehmensberatung Pro Konzept

 

Wie suchen Sie im Büro nach einem Dokument? Und wie schnell geht das? Die stetig wachsende Datenflut fordert neue Methoden, um eine gewünschte Information möglichst effizient zu finden. Die physische Ablage in Ordnern bietet keine gute Basis für die intelligente Suche, so dass wir uns hier auf elektronische Dokumente als Datenbasis konzentrieren.

Hier finden Sie einen Überblick, welche Methoden am besten geeignet sind:

 

Feste Suchbegriffe und Freitextsuche

Viele Fachanwendungen bieten eine Recherche nach festen Begriffen wie Auftragsnummer, Aktenzeichen, Lieferantennummer oder Kundenname. Das setzt voraus, dass die hinterlegten Dokumente vorher klassifiziert und Indexdaten vergeben wurden.

Ideale Einsatzbereiche: Die Suche nach festen Metadaten stellt die häufigste Methode im Büro dar. Sie ist – auch in Kombination mehrerer Stichworte – ist für standardisierte, wiederkehrende Arbeitsabläufe gut geeignet.

Grenzen: Die festen Stichworte schränken den Nutzer in seiner Suche ein. Zudem können keine neuen Begriffe ergänzt werden, ohne den Bestand nachindexieren zu müssen.

Mehr Freiheiten bietet die Freitextsuche, die sich dank moderner OCR-Tools ohne große IT-Investitionen realisierbaren lässt.

Ideale Einsatzbereiche: Wer ohne nennenswerte Investition flexibel in kleinen, unstrukturierten Datenbeständen recherchieren möchte, ist mit der Freitextsuche gut bedient. Diese Suchmethode gehört – dank Adobe Acrobat Reader – mittlerweile fest zum Büroalltag.

Grenzen: Diese Form der Datenanalyse ist bei großen Dokumenten-Beständen wenig hilfreich, da die Analyse dauert und ohne Datenbank oder DMS-System nur in einem Dokument möglich ist. Außerdem muss die Schreibweise des gesuchten Begriffes exakt übereinstimmen.

 

Data Mining und Big Data

Unter Data-Mining versteht man die systematische Durchforstung und Auswertung großer Datenbestände („Big Data“ bzw. Massendaten, vornehmlich in Datenbanken) mit dem Ziel, neue Querverbindungen und Trends zu erkennen. Solche Datenbestände lassen sich nicht manuell verarbeiten, so dass computergestützte Methoden nötig sind. Korrekt verwendet bezeichnet es die Extraktion von Wissen, das bisher unbekannt und potentiell nützlich ist.

Ideale Einsatzbereiche „inhouse“: Große Mittelständler und Konzerne aller Branchen investieren in immer bessere Datenanalysen, um ihre Strategien zu untermauern, ihr Reporting zu verbessern und gewonnenes Wissen einzelner Mitarbeiter auch anderen zugänglich zu machen. Ideale Einsatzbereiche in öffentlichen Portalen: Diese Methode nutzen werbetreibende Unternehmen im WorldWideWeb wie Handelsketten, um ihre Angebote individuell auszurichten. Kauft ein Kunde im Portal Windeln ein, würde ihn vielleicht auch die neue Babynahrung interessieren.

Grenzen: Wegen der nötigen Investitionen gehört diese Art von Datenanalyse (noch?) nicht zum üblichen Büroalltag.

 

Semantische Suche

Eine Untergruppe des Data Mining ist das Text Mining, wozu gehört auch die Technik der Semantischen Suche gehört. Diese Suchmethode fokussiert auf die Bedeutung einer Anfrage und lässt damit unscharfe und mehrsprachige Suchen zu. So findet der Nutzer zum Begriff „Auto“ nicht nur Ergebnisse wie „Autoleasing“ oder „Autowäsche“, sondern auch „Pkw“ und „LKW“, die üblichen Hersteller-Marken ebenso wie „Tankstellen“ oder „Führerschein“.

Ideale Einsatzbereiche: Versicherungen, Pharmafirmen, Inkasso-Dienstleister und Universitäten sind klassische Nutzer der semantischen Suche. Aber auch bei Zusammenschlüssen von Firmen, Insolvenzen und Ermittlungen dient diese Methode dazu, sich aus großen, unsortieren Datenbeständen zeitnah einen ersten Überblick zu verschaffen.

Grenzen: Eigentlich keine. Daher scheint es wenig nachvollziehbar, dass die semantische Suche bislang nicht zum Standard-Angebot im Dokumenten-Management gehört.

Weitere Infos zur semantischen Suche: Pro Konzept Content Finder