Die unternehmensinterne Informationssuche mit Suchmaschinen - eine Problemabgrenzung

Rapide wachsende Datenmengen, dazu unzählige Kommunikationskanäle wie Chat, E-Mail, Wikis oder Dokumente. Helfen Enterprise-Suchmaschinen hier weiter?

Lesedauer: ca. 3 Minuten

Wir befinden uns längst in einem Zeitalter des ungebremsten Datenwachstums. Durch das beinahe grenzenlose Erfassen jeder Interaktion, jeder Tätigkeit und jeden Vorgangs fallen mehr und mehr Daten an.
Die IDC (International Data Corporation) rechnet damit, dass bis 2025 weltweit ein Datenvolumen von 175 Zettabytes generiert werden wird.

| 1 Zettabyte (1ZB) = 10^21 Bytes
| Auf gestapelten Festplatten würden 175 Zettabytes 2,31 x zum Mond reichen

Die Daten beschränken sich nicht nur auf Big-Data-relevante IoT-Telemetrie oder Messdaten aus Produktionsstraßen: Zusätzliche parallele Informationsquellen werden durch die wachsende Anzahl an internen Kommunikationswegen sowie durch die Versuche erzeugt, Ressourcen zusammenzulegen und zusammenzufassen. Fehlende Verschlankungsprozesse interner Ressourcen, Strukturen und Wissensmanagementtools führen zu einer stetigen Vergrößerung der Datenmengen in Unternehmen.

Mitarbeiter verbringen Stunden mit der Suche nach Informationen

Einen substanziellen Teil der Arbeitswoche, ca. 8,8h, verbringen Mitarbeiter damit, in diesen Daten nach Informationen zu suchen -- sei es nach dem Port eines bestimmten Services oder der internen Durchwahl des Chefs [9]. Nicht in allen Systemen ist eine vollumfängliche Suche "wie bei Google" möglich, teilweise gar keine. Falls Suchmaschinen existieren, unterscheiden sich diese stark in ihrer Funktion und in ihrem Umfang - Tools wie Jira bieten beispielsweise eine Query Language, während Chats teilweise nicht einmal eine channelübergreifende Suche erlauben. Ist keine Suchmaschine vorhanden, müssen sich Mitarbeiter durch Ordnerstrukturen und Seiten-Hierarchien kämpfen und zumindest ungefähr wissen, wo sich das Gesuchte befindet.

Das Versprechen der Enterprise Search 

Das Feld Enterprise Search nimmt sich dieser Problematik an und versucht, unternehmensintern, eine einzelne allumfassende Suche zur Verfügung zu stellen, die die Informationsbedürfnisse aller Mitarbeiter befriedigen kann. Kommerzielle Anbieter wie Splunk und Amazon bieten Cloud-basierte Lösungen, aber auch Open-Source-Software wie Elastic Search und Solr kann als Enterprise Search verwendet werden.
Das Versprechen ist simpel: Durch die Verwendung von Enterprise Search soll die Zeit, die die Mitarbeiter mit der Suche nach Daten verbringen, deutlich reduziert werden. Dazu werden alle Datenquellen mit einer einzigen Suche durchsuchbar gemacht.

Die Anbieter versprechen hohe Return of Investments:
Google geht bei der Kalkulation des RoI mit „konservativen Zahlen“ [4, S. 4] in mittelgroßen Unternehmen von über 22 Mio. Euro aus [4], John Lenker von LucidWorks kalkuliert einen 15- bis 20-fachen RoI pro Jahr [5].

Es ist komplexer als im Web

Ob diese Zahlen allerdings korrekt sind, ist fraglich. Grundsätzlich handelt es sich um grobe Überschlagsrechnungen, meist werden potenziell hohe Trainings- und Supportkosten gar nicht berücksichtigt.
Die Ergebnisse der wenigen wissenschaftlichen Untersuchungen zu Rentabilität und Effektivität von Enterprise Search sind ernüchternd: Unternehmensweite Suchmöglichkeiten stoßen aufgrund immer gleicher Muster schnell an ihre Grenzen: Je größer ein Unternehmen und je diverser die Wissensinseln, desto ineffizienter kann eine Suche über alle Informationen werden. Weitere weiche Faktoren sind die Strukturen und Hierarchien in einem Unternehmen, das Vorhandensein eines Grundverständnisses für die Suche sowie die Qualität und Aufbereitung der zugrunde liegenden Daten [6].

Die Suche in einem Intranet oder in internen Datenbeständen ist deutlich komplexer als eine Suche im Web:
Relevant sind Daten aus diversen Quellen, in den unterschiedlichsten Formaten, die unter Umständen bausteinartig oder unvollständig sind und erst bei einer Sichtung aggregiert werden. Zusätzlich müssen individuelle und feingranulare Berechtigungsmodelle berücksichtigt werden. Die Anforderungen des Datenschutzes erhöhen den Aufwand nochmals.
Der Suchende erwartet nicht nur, dass verschiedene strukturierte Daten durchsuchbar gemacht werden, sondern auch, dass er das richtige, nicht das bestmögliche Ergebnis findet [7,8].

Auch auf die Mitarbeiter kommt es an

Weitere Probleme entstehen durch die Suchgewohnheiten und das Suchverhalten der Mitarbeiter.
Es lassen sich drei Gruppen von Intranet-Suchenden unterscheiden, deren Ansprüchen teilweise unvereinbar (z. B. Recall vs. Precision [10]) sind [11]: unerfahrene Benutzer und Gelegenheitssucher (ca. 80%), interaktive Benutzer und Intensivnutzer (ca. 14%) und „Informationssuche-versierte Mitarbeiter“, . Um die kognitive Last zu verringern, haben die Benutzer teilweise unterschiedliche Strategien entwickelt. So navigieren sie teilweise durch Ordner- und Seitenhierarchien, um die Formulierung einer komplexen Query zu vermeiden, mit der ein direktes Springen zum Ergebnis möglich gewesen wäre.

 

Der aktuelle Hype um Enterprise Search ist mit Vorsicht zu genießen. Bei der Kalkulation des RoI sind nicht nur potenzielle Kosten, sondern auch eine Eignung der unternehmensinternen Strukturen und Kompetenzen der Mitarbeiter zu beachten.

Quellen:

[1] https://www.seagate.com/files/www-content/our-story/trends/files/idc-seagate-dataage-whitepaper.pdf
[2] https://sci-hub.se/10.1145/2637748.2638425
[3] https://sci-hub.se/10.1145/985692.985745
[4] https://static.googleusercontent.com/media/194.78.99.204/en/204/enterprise/search/files/Internal_Search_ROI.pdf
[5] https://de.slideshare.net/lucidworks/measuring-roi-on-enterprise-search-john-lenker-lucidworks
[6] https://edoc.hu-berlin.de/bitstream/handle/18452/17001/bertram.pdf?sequence=1&isAllowed=y
[7] Mani Abrol, Neil Latarche, Uma Mahadevan, Jianchang Mao, Rajat Mukherjee, Prabhakar Raghavan, Michel Tourn, John Wang, and Grace Zhang. Navigating large-scale semi-structured data in business portals. very large data bases, pages 663–666, 2001.
[8] Rajat Mukherjee and Jianchang Mao. Enterprise Search: Tough Stuff. ACM Queue, 2(2):36–46, 2004.
[9] McKinsey Global Institute. The social economy: Unlocking value and produc- tivity through social technologies. 2012.
[10] https://de.wikipedia.org/wiki/Beurteilung_eines_bin%C3%A4ren_Klassifikators#Anwendung_im_Information_Retrieva
[11] Dick Stenmark. Identifying clusters of user behavior in intranet search engine log files. Journal of the American Society for Information Science and Technology, 59(14):2232–2243, dec 2008. doi:10.1002/asi.20931.

Teilen:

Weitere Beiträge

:(){ :|:& };:
Wolfgang Medina-Erhardt, DevOps bei punkt.de
Arbeiten bei punkt.de