Staukontrollmechanismus für Ultra-High-Speed-Rechenzentren

Die Alibaba Group gibt einen selbst entwickelten Datenverkehrskontrollmechanismus namens HPCC (High Precision Congestion Control) bekannt. Die Technologie ermöglicht Datenübertragung mit extrem geringer Latenzzeit, hoher Bandbreite und hoher Stabilität.

Dies ist ein wichtiger Meilenstein auf dem Weg zu Ultra-High-Speed-Rechenzentren, die unerlässlich sind, um das volle Potenzial von KI und IoT zu schöpfen.

Anzeige

Das Unternehmen machte diese Ankündigung jetzt innerhalb eines Forschungspapiers, das auf der ACM SIGCOMM’19 in Peking, China, veröffentlicht wurde. Forscher von Alibaba haben in Laborexperimenten und groß angelegten Simulationen bewiesen, dass HPCC im Vergleich zu anderen Alternativen schneller auf verfügbare Bandbreite und Überlastung reagiert und dabei Warteschlangen nahe Null hält. In den Simulationen für unter 50 Prozent Verkehrslast verkürzt HPCC die Ablaufzeiten um bis zu 95 Prozent und verursacht selbst bei größeren Incasts wenig Staus.

Das Papier diskutiert, wie die Leistung des Rechenzentrumsnetzwerks heutzutage für die Servicequalität einer Cloud wesentlich ist und dass eine schnellere Netzwerkgeschwindigkeit die Erfahrung der Cloud-Nutzer erheblich verbessern kann. Angetrieben von der Notwendigkeit schnellerer Netzwerke hat die Siliziumindustrie in den letzten zehn Jahren die Verbindungsgeschwindigkeit in Rechenzentren erfolgreich von 1 Gbit/s auf 100 Gbit/s erhöht, eine Wachstumsrate, die sogar die Prognose des Mooreschen Gesetzes übertrifft. Schnellere Hardware allein reicht nicht aus, um zu einer extrem schnellen Vernetzung in Rechenzentren zu führen. Eine weitere Überlegung ist, dass eine höhere Verbindungsgeschwindigkeit auch der Netzwerkstabilität schaden kann, da bei schnelleren Sendern, die gleichzeitig Daten im Netzwerk übertragen können, eine Überlastung wahrscheinlicher ist. Überlastung ist auch schädlich für die Netzwerklatenz, die Anwendungen aufgrund von Warteschlangenverzögerungen und möglichen Paketverlusten erleiden.

Aus jahrelanger Erfahrung im Betrieb von großen und schnellen RDMA-Netzwerken sind die inhärenten Einschränkungen der vorhandenen Staukontrolllösungen bekannt, darunter langsame Konvergenz, unvermeidliche Warteschlangen für Pakete und komplizierte Parametereinstellung. Der neue HPCC soll diese Lücke schließen.

Die Forscher fanden heraus, dass die Hauptursache für solche Einschränkungen in den bestehenden Lösungen der Mangel an granularen Netzwerklastinformationen in älteren Netzwerken ist. Dieser Zustand hat sich jedoch in jüngster Zeit mit der Verfügbarkeit neuer Funktionen wie In-Band Netzwerk Telemetrie (INT) geändert. Insbesondere neue Switching-ASICs sind in der Lage, detaillierte Netzwerklastinformationen zu erhalten und diese zu nutzen, um eine Art Überlastungssteuerungsmechanismus bereitzustellen, der ein stabiles und extrem schnelles Netzwerk liefern kann. Die Forscher haben HPCC als Mechanismus vorgeschlagen, da es das Potenzial hat, INT zu nutzen, um Linklastinformationen zu erhalten und den Verkehr mit hoher Präzision zu steuern.

Indem es Herausforderungen wie verzögerte INT-Informationen während einer Überlastung oder Überreaktion auf INT-Informationen löst, kann HPCC schnell die freie Bandbreite nutzen und beinahe Null Warteschlangen innerhalb des Netzwerks und damir extrem niedrige Latenzzeiten erreichen. HPCC hat den zusätzlichen Vorteil, dass nur drei Parameter zur Konfiguration benötigt werden; es ist zudem einfach in der Hardware zu implementieren.

www.alibabacloud.com
 

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.