Co oznacza DCI

Sep 15, 2025|

We współczesnym krajobrazie cyfrowym centra danych stały się kręgosłupem infrastruktury przetwarzania w chmurze, przetwarzając ogromne ilości danych przy jednoczesnym spożywaniu znacznych ilości energii.

Pytanie „co oznacza DCI” często pojawia się w dyskusjach na temat nowoczesnych architektury centrów danych, w których DCI oznacza interconnect Center Data, technologię łączącą wiele centrów danych, aby umożliwić udostępnianie zasobów i dystrybucję obciążenia.

Energy - Wydajne planowanie okazało się kluczowym wyzwaniem, wymagającym wyrafinowanych podejść do zrównoważenia wymagań wydajności z optymalizacją zużycia energii. Metodologia planowania sieci centrum danych (DES) stanowi znaczący postęp w rozwiązywaniu tych wyzwań poprzez modelowanie hierarchiczne i inteligentne strategie alokacji zasobów.

Kluczowe pojęcia w sieciach danych

Centrum danych interconnect (DCI)

Technologia, która łączy wiele centrów danych, aby umożliwić udostępnianie zasobów, dystrybucję obciążenia i odzyskiwanie po awarii w obiektach rozproszonych geograficznie.

Przeciążenie sieciowe

Występuje, gdy ruch sieciowy przekracza pojemność, często spowodowane ograniczeniami bufora w infrastrukturze Ethernet i niedopasowaniach przepustowości między linkami.

Metodologia Densa

Hierarchiczne podejście do planowania centrów danych, które optymalizuje efektywność energetyczną przy jednoczesnym zachowaniu wydajności poprzez inteligentne przydział zasobów.

Przeciążenie sieciowe w środowiskach centrów danych

Wyzwanie infrastruktury opartej na Ethernet -

Nowoczesne centra danych obejmują filozofię wykorzystania mediów Ethernet do przenoszenia różnych rodzajów ruchu, w tym komunikacji LAN, SAN i IPC. Chociaż technologia Ethernet oferuje dojrzałość, łatwość wdrożenia i stosunkowo proste zarządzanie, stanowi znaczące wyzwania pod względem ograniczeń wydajności sprzętu, szczególnie w zakresie pojemności bufora.

Typowe rozmiary buforu Ethernet działają na poziomie wielkości 100 kb, podczas gdy routery internetowe zazwyczaj mają rozmiary buforu o wielkości 100 Mb. Ta istotna różnica 1000x pojemności bufora, w połączeniu z wysokim - wzorcami ruchu przepustowości, stanowi podstawową przyczynę przeciążenia sieci w środowiskach centrum danych.

Porównanie pojemności bufora

Ethernet przełącza 100 kb

Routery internetowe 100 MB

Różnica 1000x w pojemności bufora stwarza poważne wyzwania związane z obsługą wysokiego - wzorców ruchu przepustowości w centrach danych.

Manifestacja zatorów w przełącznikach centrum danych

Manifestacja zatorów w przełącznikach centrum danych może wystąpić w wielu kierunkach. W kierunku łącza w dół zator pojawia się, gdy łączna zdolność łączy wnikania przekracza pojemność linków wyjściowych. W przypadku kierunków łącza w górę niedopasowanie przepustowości zależy przede wszystkim na podstawie współczynnika konwergencji przepustowości, z zatłoczeniem, gdy zagregowana przepustowość wszystkich portów serwerowych przewyższa całkowitą pojemność łącza w górę przełącznika.

Te punkty przeciążenia, często określane jako hotspoty, mogą poważnie wpłynąć na zdolność sieci centrum danych do wydajnego przesyłania danych, potencjalnie zmniejszając przepustowość nawet o 70% w skrajnych przypadkach.

Przeciążenie łącza w dół

Występuje, gdy całkowity przychodzący ruch przekracza wychodzącą pojemność portu przełącznika, tworząc wąskie gardła w przepływie danych z wyższych do niższych poziomów sieciowych.

Przeciążenie łącza w górę

Zdarza się, gdy zagregowany ruch serwerowy przekracza pojemność łącza w górę, zwykle określoną przez współczynnik konwergencji przepustowości projektu sieci.

Standardy IEEE 802.1QAU i zarządzanie zatorami

Jak działa 802.1qau

Przeciążone przełączniki wykrywają przeciążenie i generują sygnały powiadomień

Sygnały zatorów są propagowane z powrotem do wysyłania urządzeń

Nadawcy dławią swoje prędkości transmisji, aby zmniejszyć zator

Wykorzystanie sieci jest utrzymywane na wysokim poziomie (do 95%)

Utrata pakietu jest minimalizowana poprzez proaktywną kontrolę stawki

Grupa zadań mostkowania centrum danych (IEEE 802.1) opracowała rozwiązania kontroli zatorów warstwy 2, w szczególności specyfikację IEEE 802.1qau. Ten standard wprowadza pętle sprzężenia zwrotnego do powiadomienia o przeciążeniu między przełącznikami centrów danych, umożliwiając przeciążone przełączniki w celu korzystania z sygnałów powiadomienia z przeciążenia, aby przepustnicy wysoko - nadawcy.

Chociaż technika ta skutecznie zapobiega utratę pakietów z powodu zatorów i utrzymuje wysokie wskaźniki wykorzystania sieci do 95%, zasadniczo nie rozwiązuje podstawowego problemu.

„Bardziej wydajne podejście obejmuje strategiczne wdrażanie danych - intensywne zadania, aby uniknąć dzielenia się wspólnymi ścieżkami komunikacyjnymi. Na przykład, aby w pełni wykorzystać charakterystyki izolacji przestrzennej według ich wymagań -.

Te dane - Intensywne zadania, podobne do aplikacji udostępniania wideo -, generują stałe strumienie bitów, aby jednocześnie komunikować się z innymi zadaniami działającymi w centrum danych. Jednak ta proporcjonalnie rozłożona metoda wdrażania jest sprzeczna z Energy - wydajne cele planowania, które mają na celu wykorzystanie minimalnych zestawów serwerów i zestawów zasobów komunikacyjnych do obsługi wszystkich obciążeń.

Ramy metodologii Dens

Hierarchiczne podejście do modelowania

Metodologia Dens reprezentuje przejście paradygmatu od tradycyjnych podejść, które modelują centra danych jako jednorodne pule zasobów komputerowych serwerów. Zamiast tego Dens proponuje model hierarchiczny zgodny z głównym topologią centrum danych.

Dla trzech centrów danych poziomu -, metryka miernika m jest zdefiniowana jako łączna kombinacja serwera - funkcja poziomu F_S, Rack - funkcja poziomu F_R i moduł - funkcja F_M:

M = × f_s + × f_r + × f_m

Gdzie, i reprezentują współczynniki ważenia, które określają, w jaki sposób odpowiednie komponenty (serwery, stojaki, moduły) wpływają na wskaźniki oceny.

Współczynniki ważenia

(Serwer - Waga poziomowa) Zazwyczaj 0,7

Favors wybieranie serwerów ładowania wysokiego - w lekko załadowanych stojakach

(Rack - Waga poziomowa) Zazwyczaj 0,2

Priorytety priorytetów stojaków obliczeniowych o niskich obciążeniach sieciowych

(Moduł - Waga poziomowa) Zazwyczaj 0.1

Sprzyja wybieraniu lekko załadowanych modułów, kluczowych dla konsolidacji zadań

Weighting Coefficients

Obciążenie serwera i potencjał komunikacji

Połączenie ładunku serwera L_S (L) i jego potencjału komunikacji Q_S (Q) stanowi podstawową podstawę wyboru serwera. Ten związek jest wyrażany przez:

f_s(l,q) = L_s(l) × (Q_s(q)^φ)/δ_t

L_s(l)

Zależy od obciążenia serwera, obliczonego za pomocą specjalistycznej funkcji sigmoidalnej

Q_s(q)

Definiuje obciążenie przy łącznikach podnoszących stojaki, analizując warunki zatoru w kolejce wyjściowej przełącznika Q

δ_t

Przepustowość nad - współczynnik udostępniania u góry - z - przełączniki (tor)

Współczynnik definiujący stosunek między L_S (L) i Q_S (q) w metryce

Definicja i optymalizacja współczynnika obciążenia

Współczynnik obciążenia Dens jest zdefiniowany jako suma dwóch funkcji sigmoidalnych, aby rozwiązać wyzwanie, które serwery bezczynne spożywają około 67% ich szczytowego zużycia energii:

L_s(l) = 1/(1 + e^(-10(l - 0.5))) - 1/(1 + e^(-2(l - (1 - ε/2))))

Pierwszy komponent określa podstawowy kształt sigmoidalny, podczas gdy drugi służy jako funkcja karna zaprojektowana do zbieżności maksymalnych wartości obciążenia serwera. Parametr ε określa zakres i nachylenie malejącej części krzywej.

Krzywa optymalizacji obciążenia serwera

Server Load Optimization Curve

To wyrafinowane podejście zapewnia, że serwery działają w optymalnych zakresach obciążenia, zwykle od 70% do 85% wykorzystania, równoważąc efektywność energetyczną z problemami niezawodności sprzętu.

Wskaźniki zarządzania kolejką i zatorami

Analiza obłożenia kolejki

Wszystkie serwery w stojaku dzielą przełącznik TOR do komunikacji w górę łącza w górę. Przy wskaźnikach gigabita określenie dokładnego odsetka komunikacji łącza w górę zajmowanej przez poszczególne serwery lub przepływy staje się intensywne obliczeniowo. Aby rozwiązać to wyzwanie, metodologia Dens zawiera komponent związany z obłożeniem kolejki wyjściowej Q (q), co różni się w zależności od przepustowości w stosunku do współczynnika udostępniania -.

Wskaźnik obłożenia Q jest niezależny od bezwzględnej wielkości kolejki, ale zmienia się w zależności od wielkości kolejki Q_max, od [0,1], gdzie 0 i 1 odpowiadają odpowiednio pustym i pełnym stanom kolejki. Wprowadzając komponent obłożenia kolejki, metryka Dens może reagować na zmiany zatorów w stojakach lub modułach, a nie zmiany szybkości transmisji.

Wdrożenie dystrybucji Weibull

Funkcja Q (Q) wykorzystuje odwrotną funkcję rozkładu skumulowanego Weibulla:

Q (q)=e^(- (3q/q_max)^2)

Ten preparat sprzyja wybieraniu pustych kolejek podczas karania mocno załadowanych kolejek. Gdy poziomy zatłoczenia pozostają niskie, przepustowość nad - współczynnik udostępniania δ w równaniach lepiej obsługuje symetrię między pojemnością łącza w górę i łącza w dół.

Obłożenie kolejki a wydajność

Wraz ze wzrostem zatłoczenia i przepełnienia buforów niedopasowanie przepustowości staje się niemiecalne, potencjalnie prowadząc do degradacji wydajności do 40% na dotkniętych ścieżkach

Wskaźniki wydajności i wyniki optymalizacji

Bell - Funkcja wyboru w kształcie

Funkcja F_S (L, Q) tworzy powierzchnię w kształcie Bell - w stosunku do obciążenia serwera L i obciążenie kolejki q. Ta funkcja preferencyjnie wybiera serwery powyżej średniego poziomu obciążenia znajdującego się w stojakach z minimalnym lub nie zatorowym. Badania empiryczne pokazują, że takie podejście może osiągnąć oszczędności energii 25 - 35% w porównaniu z tradycyjnym harmonogramem okrągłego robiny przy jednoczesnym zachowaniu wydajności w ciągu 5% optymalnych poziomów.

Oszczędności energii

25-35%

W porównaniu do tradycyjnej rundy - algorytmów planowania Robina

Wydajność

95%+

Utrzymuje wydajność w ciągu 5% optymalnych poziomów

Wykorzystanie

70-85%

Optymalna wydajność i niezawodność zakresu wykorzystania serwera

Hierarchiczna analiza wpływu

Czynniki wpływu stojaków i modułów są wyrażone jako:

Rack - współczynnik poziomu

f_r (l, q)=l_r (l) × (q_m (q)^φ)/δ_m=(q_m (q)^φ)/δ_m × (1/n) σ (i=1 do n) l_s (l) (l)

Tam, gdzie L_R (L) reprezentuje obciążenie stojaka jako znormalizowaną sumę wszystkich obciążeń serwera w stojaku, N jest liczbą serwerów na stojak, Q_M (Q) jest proporcjonalne do obciążenia ruchem na przełącznikach modułu, a δ_m jest przepustowością nad - współczynnik udostępniania na przełącznikach modułu.

Moduł - współczynnik poziomu

f_m (l)=l_m (l)=(1/k) σ (j =0 do k) l_r (l)

Gdzie L_M (l) reprezentuje obciążenie modułu jako znormalizowaną sumę wszystkich obciążeń stojakowych w module, a K to liczba stojaków na moduł. Moduł - współczynnik poziomu zawiera tylko komponent powiązany z ładowaniem -, ponieważ wszystkie moduły łączą się z tymi samymi przełącznikami rdzenia.

Praktyczne względy wdrażania

Handel efektywnością energetyczną - Offs

Badając, co DCI oznacza dla wydajnego planowania Energy -, staje się jasne, że implementacje DCI muszą ostrożnie zrównoważyć lokalną optymalizację w poszczególnych ośrodkach danych w stosunku do globalnej optymalizacji w połączonych obiektach.

Metodologia Dens pokazuje, że wydajne harmonogramy energii - muszą skonsolidować zadania centrum danych w możliwym zestawie serwera, osiągając współczynniki konsolidacji 3: 1 lub więcej w typowych scenariuszach.

Jednak ciągłe działanie przy szczytowych obciążeniach może zmniejszyć niezawodność sprzętu o 15-20% i wpływać na czas wykonywania pracy nawet o 30%.

Energy Efficiency Trade-Offs

Kluczowy handel - Offs

Wyższa konsolidacja zmniejsza zużycie energii

Optymalne równoważenie obciążenia poprawia wydajność sieci

Ponad - konsolidacja zwiększa ryzyko awarii (15-20% redukcja niezawodności)

Szczytowe obciążenia mogą wpłynąć na czas wykonywania pracy nawet o 30%

Multi - Bilansowanie obciążenia ścieżki

Moduł - Współczynnik poziomu F_M zawiera tylko komponent powiązany z obciążeniem -, ponieważ wszystkie moduły łączą się z tymi samymi przełącznikami rdzeniowymi i uzyskują identyczną przepustowość za pośrednictwem ECMP (równy - Koszt multi- techniki ścieżki). Ta konstrukcja zapewnia, że rozkład ruchu pozostaje zrównoważony na dostępnych ścieżkach, z zmierzoną poprawą przepustowości 40 - 50% w porównaniu z podejściami routingu z pojedynczą ścieżką.

Korzyści z routingu ECMP

Rozkłada ruch na wielu równych ścieżkach kosztów -

Poprawia przepustowość o 40 - 50% vs. routing pojedynczej ścieżek

Zwiększa tolerancję błędów poprzez redundancję ścieżki

Działa płynnie z modelem hierarchicznym Dens

Zaawansowane strategie optymalizacji

Dynamiczna regulacja masy

Ostatnie badania zbadały dynamiczną regulację współczynników ważenia, a na podstawie prawdziwych charakterystyk obciążenia czasowego -.

Compute - intensywne obciążenia =0.8, + =0.2

Komunikacja - intensywna =0.4, =0.3, =0.3

Usługi dostosowywania produktu

„Integracja odnawialnych źródeł energii z algorytmami planowania opartego na Dens - wykazała niezwykły potencjał zmniejszania śladów węglowych w centrach danych hiperskalnych”.

Do 45% zmniejszenie zużycia energii siatki

Źródło: Zhang i in. (2024), Transakcje IEEE w zakresie zrównoważonego obliczeń

Bezpłatna próbka

Włączenie algorytmów uczenia maszynowego w celu przewidywania wzorców ruchu i optymalizacji parametrów Dens wykazało obiecujące wyniki.

85% dokładności prognozowania przeciążenia

5-minutowy horyzont prognozy

10-15% dodatkowych oszczędności energii

Walidacja eksperymentalna i wyniki

Środowisko symulacyjne

Obszerne symulacje z wykorzystaniem dyskretnych symulatorów zdarzeń zatwierdziły metodologię Dens w różnych konfiguracjach centrum danych. Scenariusze testowe obejmowały centra danych od 1000 do 100 000 serwerów, z różnymi wzorcami ruchu, w tym usługami internetowymi (80% odczytu, 20% zapisu), przetwarzania partii (zrównoważone odczyt/zapis) i aplikacje do przesyłania strumieniowego (95% zapisu, 5% odczytu).

Skala serwera

1000 do 100 000 serwerów

Wzorce ruchu

Usługi internetowe, przetwarzanie wsadowe, przesyłanie strumieniowe

Typ symulacji

Dyskretne symulatory zdarzeń

Wskaźniki wydajności

Kluczowe wskaźniki wydajności

Efektywność energetyczna

28-42% Redukcja energii w porównaniu z harmonogramami wyjściowymi

Wykorzystanie sieci

Utrzymano 85 - 92% Wykorzystanie sieci bez utraty pakietów wywołanej przez zator

Czas wykonywania pracy

Ulepszone przeciętne czasy wykonywania pracy o 15-25%

Wykorzystanie serwera

Osiągnięte optymalne zakresy wykorzystania serwera 72-83%

Opóźnienie w kolejce

Zmniejszone średnie opóźnienie kolejki o 35–45%

Porównanie wydajności

← Para: Gruboziarniste systemy multipleksowania długości fali

Następny: Łączność centrum danych →

Wyślij zapytanie