OpenSearch-Herausforderungen kennen und bewältigen

OpenSearch bewältigen

Die Such- und Analyse-Suite OpenSearch, ein Fork der Suchmaschine Elasticsearch, gewinnt als reine Open-Source-Software zunehmend an Bedeutung. Bei der Nutzung gibt es aber auch einige Herausforderungen, die der Anwender kennen sollte. Managed-Platform-Anbieter Instaclustr nennt die fünf größten Stolpersteine.

Unternehmen und Entwickler, die eine robuste Such- und Analyse-Lösung benötigen, finden in OpenSearch eine willkommene Ergänzung ihres Technologie-Stacks. OpenSearch unterstützt eine breite Palette unterschiedlichster Anwendungsfälle. Dazu gehören die Log-, Security- und Clickstream-Analyse sowie die Volltextsuche.

Anzeige

OpenSearch-Nutzung

Der Anwender sollte bei der OpenSearch-Nutzung im Eigenbetrieb aber auch einige Punkte beachten, um mögliche Performancebeeinträchtigungen zuverlässig auszuschließen. Laut Instaclustr gibt es dabei vor allem fünf zentrale Herausforderungen. Sie betreffen

  • die Clustergröße: OpenSearch ist prinzipiell flexibel skalierbar. Größere Implementierungen erfordern allerdings eine durchdachte Knoten- und Shard-Verteilung, um die Performance und Verfügbarkeit aufrechtzuerhalten und zugleich die erforderliche Last zu bewältigen. Die Lösung besteht darin, Sharding und Replikate zu nutzen, um Indizes zu verteilen und performante Antwortzeiten sicherzustellen.
  • die Anzahl der Shards: Bei OpenSearch sind die Indizes in physische Bereiche unterteilt, die Shards genannt werden. So können Anwender Daten zwischen Hosts aufteilen. Der Haken an der Sache ist jedoch, dass die Anzahl der Shards zum Zeitpunkt der Indexerstellung festgelegt werden muss und die Shard-Zuweisung später nicht mehr änderbar ist, ohne alle Quelldaten neu zu indizieren. Bei der Shard-Zuweisung sollten Anwender also auch bedenken, dass ihr Datenbestand im Laufe der Zeit wachsen kann. Eines der häufigsten Probleme im Hinblick auf die OpenSearch-Performance ist die Zuweisung von zu vielen Shards für kleine Datenmengen. Es gibt keine feste Regel dafür, aber im Allgemeinen sollte die Shard-Größe zwischen 20 GB und 40 GB liegen.
  • Abstürze aufgrund einer „Mapping Explosion“: OpenSearch bietet manuelles und dynamisches Mapping, um zu bestimmen, wie Daten in Indizes gespeichert werden. Es besteht dabei das Risiko, dass ein nicht richtig begrenztes dynamisches Mapping zu einer „Mapping-Explosion“ führt, die OpenSearch zum Absturz bringen kann. Um dieses Risiko zu vermeiden, sollten Anwender sicherstellen, dass für jedes dynamische Mapping Limitierungen existieren.
  • Abstürze aufgrund von „Combinatorial Explosions“: Wenn Daten auf verschachtelte Weise aggregiert werden, kann die „Bucket“-Generierung exponentiell werden und zu einem Absturz führen. Zur Vermeidung dieses Problems müssen die „Collection Mode“-Einstellungen exakt beachtet werden.
  • umfangreiche Index-Templates: Index-Templates tragen zu einer erheblichen Zeiteinsparung bei, da sie bei Bedarf die schnelle Erstellung leistungsstarker neuer Indizes ermöglichen. Allerdings führt ein zu großes Template zu großen Mappings sowie zu langen Update- und Debugging-Zeiten. Es ist folglich am besten, Index-Templates zu vereinfachen, indem man dynamische Templates nutzt oder die Templates so leichtgewichtig wie möglich gestaltet.

Die Kenntnis dieser Herausforderungen ist für den Anwender der erste Schritt für die effiziente und problemlose OpenSearch-Einführung und -Verwendung. Als Alternative zum aufwendigen Eigenbetrieb kann er allerdings auch eine Managed Platform nutzen, bei der der Provider alle Aufgaben hinsichtlich Implementierung, Integration, Verwaltung oder Wartung übernimmt.

„Die OpenSearch-Nutzung ist durchaus mit einer gewissen Komplexität verbunden. Für Nutzer ohne entsprechendes Know-how kann es folglich sinnvoll sein, auch ein Managed-Platform-Angebot in Betracht zu ziehen“, erklärt Ralph Völter, VP Sales EMEA bei Instaclustr. „Mit unserer Managed-Lösung für OpenSearch etwa erhält der Anwender alles aus einer Hand: von der sicheren Bereitstellung über die Verwaltung und den Betrieb bis hin zur Skalierung der Lösung – wobei die spezifischen Anforderungen des Kunden hinsichtlich Echtzeit-Suche, Analyse oder Datenvisualisierung punktgenau abgedeckt werden können.“

Instaclustr.com

Anzeige

Weitere Artikel

Jetzt die smarten News aus der IT-Welt abonnieren! 💌

Mit Klick auf den Button “Zum Newsletter anmelden” stimme ich der Datenschutzerklärung zu.