Planowanie wydajności optycznej: jak w przyszłości-zabezpieczyć swoją sieć światłowodową

Apr 30, 2026|

Rynek komponentów optycznych do transmisji danych wzrósł o ponad 60% w 2025 r., przekraczając 16 miliardów dolarów przychodów (Liczenie światła poprzez Introl). Liczba ta ma znaczenie z jednego powodu: każda organizacja konkurująca o moduły 400G i 800G czerpie z tej samej puli dostawców. Zespoły planujące pojemność sieci optycznej proaktywnie zabezpieczają alokację, dźwignię cenową i okna instalacyjne. Zespoły, które reagują, aktualizując dopiero po osiągnięciu nasycenia łączy kręgosłupa, płacą przyspieszone stawki za moduły, które docierają po procesorach graficznych, które miały łączyć.

 

Nieplanowana zmiana-okablowania jest zwykle większym problemem. Widzimy to regularnie: organizacja zamawia transceivery 400G QSFP-DD, instaluje je i odkrywa, że ​​połowa istniejących-ścieżek połączeń krzyżowych nie jest w stanie obsłużyć sygnalizacji PAM4 przy wymaganej bitowej stopie błędów. Włókno było w porządku przy 100G. Już nie jest w porządku. To wymiana światłowodów, a nie transiwerów, staje się dominującym elementem kosztów projektu modernizacji.

High-density data center fiber optic cabling management in a server rack showing organized blue and orange fiber patches

 

Ocena gotowości fabryki włókien: zacznij tutaj, a nie od katalogu transiwerów

 

Pierwszym krokiem w każdej ocenie gotowości instalacji światłowodowej w centrum danych jest zmierzenie tego, co faktycznie posiadasz, a nie tego, co przewiduje specyfikacja instalacji.

 

PAM4 koduje dwa bity na symbol zamiast jednego, co podwaja przepustowość na linię, ale radykalnie zmniejsza marginesy szumów. Instalacje światłowodowe, które działały dobrze przy prędkości 100 G, zwykle zawodzą przy prędkościach 400 G, ponieważ skumulowane straty wtrąceniowe na złączach, spawach i zagięciach zjadają zmniejszony margines sygnału wymagany przez PAM4.

Oto jak to wygląda w praktyce. Budżet łącza 400G SR4 na IEEE 802,3 cm pozwala na około 1,5 dB całkowitego tłumienia wtrąceniowego na złączu. Pojedyncze zanieczyszczone złącze zwykle dodaje 0,3–0,5 dB. Trzy zabrudzone złącza na ścieżce-połączeń krzyżowych, co nie jest niczym niezwykłym w środowisku produkcyjnym, w którym regularnie przeprowadza się łatanie, pochłaniają cały budżet strat złącza, zanim uwzględni się tłumienie samego światłowodu. Przy 100G NRZ ta sama ścieżka przeszłaby z marginesem 1–2 dB. W naszym laboratorium testowym wielokrotnie to mierzyliśmy na platformach przełączników Cisco, Arista, Juniper i Dell: zanieczyszczenie powodujące zerowy zauważalny efekt przy 10G powoduje sporadyczne błędy CRC przy szybkości linii 400G PAM4, które są trudne do zdiagnozowania w środowisku produkcyjnym, ponieważ nie powodują zdarzeń awarii-twardego łącza.

W środowiskach wielomodowych ograniczenia odległości znacznie się zaostrzają przy każdym generowaniu prędkości. Moduł 10GBASE-SR sięga 300 metrów nad OM3; przy 400G SR8 oznacza to 70 metrów na tym samym włóknie w standardzie IEEE 802,3 cm. Jeśli długość liścia-do-kręgu przekracza tę granicę,Ścieżka aktualizacji 400G QSFP-DDwymaga albo migracji-jednomodowej, albo zmian architektonicznych w celu skrócenia odległości fizycznych, a obie te czynności zajmują miesiące i należy je zaplanować na długo przed zakupem transceivera.

 

Professional close-up of 400G and 800G optical transceiver modules with gold-plated connectors and technical labeling

Wybór odpowiedniego poziomu prędkości: decyzja, która definiuje całkowity koszt posiadania

Planowanie wydajności sieci optycznej dla centrów danych sprowadza się do trzech-problemów zmiennych, które nie pojawiają się w arkuszu danych żadnego dostawcy: dojrzałości łańcucha dostaw, trajektorii obciążenia oraz tego, jaka część całkowitego kosztu modernizacji wykracza poza cenę modułu.

 

400G zapewnia czterokrotnie większą przepustowość niż 100G przy około 2,5 do 3 razy większym koszcie modułu, co oznacza znaczną poprawę kosztu w przeliczeniu na gigabit. Jednak w przypadku obsługiwanych przez nas migracji z 400G-do 800G koszt modułów był zawsze mniejszą pozycją. Obudowa przełącznika, infrastruktura zasilania i chłodzenia, naprawa instalacji okablowania i szkolenie zespołu operacyjnego łącznie przeważają nad tym. Planując wyłącznie cenę modułu, organizacje uzyskują urządzenia nadawczo-odbiorcze, które technicznie działają, ale sieć, która nie działa operacyjnie.

 

QSFP-DD zachowuje kompatybilność wsteczną z klatkami QSFP28co oznacza, że ​​możesz zainstalować przełączniki obsługujące technologię 400G-i kontynuować pracę z istniejącymi modułami 100G podczas etapowej migracji. Ta kompatybilność wsteczna pozwala rozłożyć wydatki kapitałowe na wiele cykli budżetowych, jednocześnie uzyskując jednocześnie korzyści platformy wynikające z nowszego krzemu przełącznikowego, co jest szczegółem, który ma znaczenie, gdy trzeba uzasadnić przejście na dyrektora finansowego, który chce zobaczyć zwrot z inwestycji w ciągu 18 miesięcy.

 

Transceivery 800Gponownie podwoić przepustowość dzięki liniom 8×100G PAM4OSFPlub QSFP-DD800, z modułami pobierającymi 14–20 W w zależności od wariantu zasięgu (IEEE 802.3df). Dynamika łańcucha dostaw różni się znacznie od 400G: mniej wykwalifikowanych dostawców, mniejsza presja cenowa na konkurencję i dłuższe czasy realizacji. Dane dotyczące wdrożeń branżowych stale pokazują cykle alokacji 90+ dni dla modułów 800G w wolumenie (Vitex).

1

Jeśli budujesz lub rozwijasz infrastrukturę szkoleniową AI, gdzie czas bezczynności procesora graficznego spowodowany wąskimi gardłami w sieci kosztuje tysiące na godzinę, wdróż 800G na łączach Spine już teraz. Koszt modułu zwraca się w ciągu kilku miesięcy dzięki obniżonym kosztom bezczynności procesora graficznego, a przejście 2×FR4 do istniejącej infrastruktury liściastej 400G chroni ścieżkę migracji.

 

2

Jeśli odświeżasz rdzeń kampusu lub brzeg sieci WAN, który będzie przenosił tradycyjne obciążenia korporacyjne przez następne 3–5 lat bez ruchu-powiązanego ze sztuczną inteligencją w horyzoncie planowania, dojrzały ekosystem 400G zapewni lepszy-roczny całkowity koszt posiadania. Konkurencyjna baza dostawców oferuje obecnie ceny 400G znacznie niższe niż 800G na wczesnym etapie-cyklu życia w przeliczeniu na-gigabit.

 

3

Jeśli zakres obciążeń jest niepewny, a dotyczy to większości centrów danych średniej-rynku, należy domyślnie zastosować platformy przełączników-obsługujące 800G, ale początkowo należy je wyposażyć w transceivery 400G. Otrzymujesz przestrzeń nad platformą bez premium modułu i aktualizujesz porty indywidualnie, zgodnie z wymaganiami ruchu.

Transceivery 1,6T wchodzą na wczesną fazę produkcji z myślą o hiperskali i zastosowaniach-specyficznych dla NVIDIA, a OSFP-XD zyskuje wsparcie w zakresie standaryzacji w ramach projektu Open Compute Project (OCP). Ceny hurtowe nie zostaną wprowadzone przed 2027 r. Zaprojektuj swoją instalację światłowodową i zmień obudowę tak, aby obsłużyła przepustowość 1,6 T, ale nie pozwól, aby opóźniło to wdrożenie sieci 800G, której potrzebuje Twój dzisiejszy ruch.

DWDM jako mnożnik wydajności

 

Jeden wymiar, który pomija prawie każdy konkurencyjny przewodnik na ten temat: nie zawsze potrzebujesz szybszych transceiverów, aby uzyskać większą przepustowość z istniejącego światłowodu.

 

W przypadku łączy DCI metra o długości mniejszej niż 80 km, gdzie dostępny jest dostęp do ciemnego światłowodu, zwiększenie przepustowości DWDM przewyższa koszty układania nowego kabla w niemal każdym wdrożonym przez nas scenariuszu. Prawidłowo zaprojektowany system DWDM w-pasmie C obsługuje niezależne kanały 80+ na jednej parze włókien. Rozszerzenie do pasma L-podwaja tę wartość. Badania nad wielopasmowymi-przezroczystymi sieciami optycznymi potwierdziły, że takie podejście jest często tańsze niż oświetlanie dodatkowych ciemnych włókien, zapewniając jednocześnie porównywalny wzrost przepustowości (ScienceDirect).

 

Technical schematic of DWDM Dense Wavelength Division Multiplexing showing multiple light frequencies travelling through a single fiber core

 

Wdrożyliśmy to dla klienta świadczącego usługi finansowe, łączącego główne centrum danych z 12 oddziałami w obszarze metropolitalnym. Oryginalna infrastruktura obejmowała łączność 10G-punkt--z wykorzystaniem dzierżawionego ciemnego światłowodu. Kończyły im się długości fal, a nie pojemność światłowodów. Rozwiązanie: moduły FB-LINK CWDM-10G w sieci18-kanałowy pasywny multiplekser/demuxw każdym punkcie końcowym, zapewniając dedykowane długości fal 10 Gb/s dla wszystkich 12 lokalizacji oraz 6 kanałów zapasowych na potrzeby przyszłej rozbudowy, bez dotykania ani jednej żyły fizycznej instalacji. Całkowity czas wdrożenia wyniósł niecałe trzy tygodnie na plac budowy, w porównaniu z harmonogramem 4–6 miesięcy, jaki wykonawca robót budowlanych podał w sprawie dodatkowych przeciągów włókien.

 

Prawdziwą barierą dlaWdrożenie DWDMnie ta technologia. Jeśli Twój zespół korzysta wyłącznie z sieci Ethernet-, przeznaczyć 3–6 miesięcy na transfer umiejętności. Dokładna ścieżka szkoleniowa zależy od tego, czy wdrażasz pasywny CWDM, wzmocniony DWDM, czy rozszerzasz na pasmo L-, a każda opcja ma inne implikacje dla profilu strat w światłowodzie i wymagań dotyczących wzmocnienia.

 

LPO, CPO i ich znaczenie dla harmonogramu planowania

 

Dwie nowe technologie zmienią metodologię planowania wydajności optycznej w ciągu najbliższych trzech lat, a dzisiejsze decyzje dotyczące infrastruktury muszą uwzględniać obydwie te technologie, mimo że żadna z nich nie zmienia tego, co należy wdrożyć już teraz.

 

Napęd liniowy-Pluggable Optics (LPO) eliminuje energochłonny-procesor DSP wewnątrz modułu nadawczo-odbiorczego, łącząc liniowe układy TIA i sterowniki bezpośrednio z przełącznikiem ASIC. Wynik: o 30–50% niższe zużycie energii i redukcja opóźnień poniżej 15 nanosekund w porównaniu z konwencjonalnymi modułami o zmienionym czasie (LightCounting przez Introl). W przypadku gęstych klastrów procesorów graficznych, gdzie każdy wat mocy optycznej to wat, którego nie można obliczyć, LPO znacząco zmienia równanie wydajności-na-szafę. Dzięki OIF postępuje standaryzacja, a początkowe wdrożenia w sieciach-o dużej skali spodziewane są w latach 2026–2027.

 

Wspólna-optyka osadza silnik fotoniczny bezpośrednio w pakiecie ASIC przełącznika, zmniejszając-moc warstwy optycznej z około 15 pJ/bit do około 5 pJ/bit, co stanowi 3-krotny wzrost wydajności wykazany przez platformę Bailly 51.2T CPO firmy Broadcom. Jednak CPO eliminuje optykę-wymienną w terenie, co oznacza, że ​​awaria-warstwy fotonicznej może wymusić wymianę całej płytki. Dzięki temu kompromisowi-CPO będzie ograniczać się do operatorów hiperskalowych tworzących niestandardowe układy krzemowe co najmniej do 2027 r. (więcej informacji na temat kompromisów-wtyczkowych i CPO).

Praktyczne implikacje dla planowania: już dziś zaprojektuj swoją infrastrukturę zasilania i chłodzenia tak, aby obsłużyła 15–20 W na moduł 800 G. Kiedy LPO osiągnie dojrzałość, odzyskasz 30–50% budżetu mocy bez zmiany infrastruktury fizycznej. Odzyskany zapas mocy to ścieżka rozbudowy wolnej mocy.

Wdrażanie etapowe: sekwencja migracji z 400G-do 800G

 

Rozpocznij aktualizację Spine, gdy dowolny port Spine utrzymuje wykorzystanie powyżej 70% w okresach szczytowego ruchu, a nie 80%, ponieważ w tym momencie występują już mikropęknięcia powodujące przepełnienie bufora, a czas realizacji zamówienia dla alokacji 800G wydłuży okno przeciążenia o 90+ dni.

 

Kręgosłup-najpierw jest standardową praktyką w przypadku tkanin Clos. Aktualizacja kręgosłupa do 800G przy jednoczesnym utrzymaniu przepustowości liścia na poziomie 400G działa bezproblemowo poprzez przerwanie: pojedynczy port 800G 2×FR4 łączy się z dwoma portami 400G FR4, podwajając przepustowość kręgosłupa bez dotykania warstwy liścia. Thearchitektura modułów wtykowychco sprawia, że ​​jest to możliwe, jest również powodem, dla którego możesz przeprowadzić aktualizację bez przestojów: wyciągaj jedno łącze kręgosłupa na raz, przywracaj równowagę ECMP, aktualizuj, sprawdzaj odczyty DDM, przejdź do następnego.

Krytyczne szczegóły zamówienia

Zamów moduły optyczne co najmniej 90 dni przed datą dostawy procesora graficznego lub serwera. Dane dotyczące wdrożeń w branży konsekwentnie pokazują, że w przypadku planów migracji do 800G nie udaje się zrealizować planów migracji do sieci 800G, a nie technologii. Pojawiają się procesory graficzne, infrastruktura optyczna nie, a koszty bezczynności obliczeniowej kumulują się. Jeśli planujesz wdrożenie portu 500+, zapewnij alokację na 120 dni i co miesiąc potwierdzaj terminy dostaw od dostawców. Zmienność łańcucha dostaw przy prędkościach 800G pozostaje wyższa niż przy 400G.

Co idzie nie tak: wnioski z wdrożeń produkcyjnych

 

Firma AWS opublikowała szczegółowy opis tego, jak przejście z sieci 100G-na-400G początkowo zwiększyło współczynnik awaryjności wzajemnych połączeń w dziesiątkach milionów łączy optycznych, co jest sprzecznym z intuicją wynikiem modernizacji technologii. Główną przyczyną nie były same transceivery, ale kombinatoryczna eksplozja interoperacyjności wielu dostawców: wiele przełączników ASIC × wielu dostawców DSP × wielu dostawców modułów stworzyło matrycę testową, której nie był w stanie w pełni objąć żaden pojedynczy cykl kwalifikacyjny (AWS-a).

 

Większość przedsiębiorstw nie jest w stanie odtworzyć dźwigni dostawców AWS. Ale lekcja jest mniejsza: przed wdrożeniem produkcyjnym przetestuj konkretną kombinację przełącznika-na-nadajnik-odbiornik we własnym środowisku laboratoryjnym, używającTelemetria przed-FEC BER i VDM jako kryteria akceptacji, a nie tylko link-w górę/link-w dół. W tym procesie wyłapaliśmy konkretną klasę awarii: moduły, które przeszły podstawową kwalifikację, ale wykazują marginalną czułość Rx pod wpływem naprężeń termicznych, powodując wystąpienie błędów Pre-FEC powyżej 1e-4 tylko przy ciągłym obciążeniu produkcyjnym. Ten wzór pojawia się najczęściej w przypadku niektórych kombinacji DSP-przełączających-ASIC. Nasze wstępnie zweryfikowane dane dotyczące kompatybilności dla platform Cisco, Arista, Juniper i Dell są dostępne na żądanie.

 

Budowanie-przyszłościowej infrastruktury światłowodowej oznacza także zapewnienie odpowiedniego marginesu nadmiernej alokacji. Corning zaleca nadprodukcję włókien światłowodowych o 25–100% w oparciu o niepewność popytu (Corning). Ten zakres jest zbyt szeroki, aby można go było zastosować bez kontekstu, więc podzielimy go na segmenty w następujący sposób:

 

Scenariusz A

Jeśli Twój 3-letni plan nakładów inwestycyjnych zostanie zatwierdzony, a powierzchnia Twojego obiektu zostanie ustalona, ​​wystarczy 25–30% nadmiaru włókien. Wiesz, gdzie będą stojaki; zapewniasz wzrost gęstości, a nie zmiany topologii.

Scenariusz B

Jeśli jesteś w fazie wzrostu i masz-rozbudowę otwartych zasobów obliczeniowych, ale masz określony kampus, rozsądną minimalną wartością dolną jest 50%. Górny koniec, 75–100%, należy zarezerwować na trasy kablowe od podstaw, gdzie późniejsze ciągnięcie dodatkowego kabla oznaczałoby rozbijanie betonu. Światłowód linkowy to realny koszt, ale prawie zawsze jest tańszy niż przyszła konstrukcja.

Tworzenie planu wydajności optycznej

 

Pięć decyzji po kolei. Każdy z nich otwiera następny.

 

1. Opracuj bazę dla swojej obecnej rośliny włóknistej.

Zmierz tłumienność wtrąceniową i stratę odbiciową na każdej ścieżce, którą planujesz zaktualizować, nie na podstawie zapisów instalacji, ale na podstawie aktualnych odczytów OTDR i miernika mocy. Jeśli jakakolwiek ścieżka połączenia-przekracza budżet strat złącza dla docelowego poziomu prędkości (1,5 dB dla 400G SR4, ciaśniej dla 800G), napraw to przed zamówieniem transceiverów. Nasze laboratorium testowe może działaćweryfikacja budżetu linkówwzględem konkretnej platformy przełączników, jeśli potrzebujesz drugiej pary oczu.

 

2. Prognozuj zapotrzebowanie na przepustowość według warstwy sieci.

Połączenia kręgosłupa, liści i DCI rosną w różnym tempie. Klastry szkoleniowe AI mogą podwoić wykorzystanie kręgosłupa w ciągu 12 miesięcy; rdzenie kampusów korporacyjnych rzadko rosną szybciej niż 15–20% rocznie. Dopasuj prognozę do poziomu, a nie do jednej ogólnej liczby.

 

3. Wybierz poziom szybkości dla każdej warstwy sieci.

Skorzystaj z powyższych-scenariuszy. W przypadku opcji transceiverów obecnej-generacji w zakresie od 100G do 800G,-odnieś-odniesienie do linii bazowej swojej instalacji światłowodowej z kroku 1. Wybrany moduł jest użyteczny tylko wtedy, gdy twoje okablowanie może go udźwignąć.

 

4. Najpierw uporządkuj kręgosłup wdrażania.

Wyzwalaj przy 70% trwałego wykorzystania kręgosłupa. Użyj optyki typu breakout, aby wypełnić lukę pomiędzy ulepszonym grzbietem a istniejącym skrzydłem. Zaplanuj zerowe-przestoje, modernizując jedno łącze na raz, przywracając równowagę ECMP.

 

5. Dostosuj zaopatrzenie do obliczenia dostawy.

Minimalny czas realizacji zamówienia wynoszący 90-dni w przypadku alokacji 800G. Potwierdź co miesiąc. Jeśli Twoje wdrożenie przekracza 500 portów, wydłuż okres do 120 dni i zdywersyfikuj dostawców. Ryzyko związane z jednym źródłem przy wolumenie 800G jest realne.

 

Jeśli wykonujesz kroki 1–3 i potrzebujesz pomocy w dopasowaniu warunków instalacji światłowodowej do specyfikacji transceivera, warto rozpocząć tę rozmowę przed zakończeniem cyklu zakupów. Nasze standardowe modele 400G są dostarczane z magazynu; niestandardowe-warianty z kodem zajmują 7–10 dni roboczych.

 

 
Często zadawane pytania

P: Na czym polega planowanie pojemności optycznej?

Odp.: Jest to proces prognozowania wymagań dotyczących przepustowości sieci światłowodowej i dopasowywania technologii urządzeń nadawczo-odbiorczych, infrastruktury okablowania i harmonogramów wdrażania w celu zaspokojenia zapotrzebowania bez nadmiernych inwestycji i tworzenia wąskich gardeł.

P: Jak mogę ocenić, czy moja roślina włóknista obsługuje 400G lub 800G?

Odp.: Przeprowadź ocenę budżetu łącza obejmującą każde złącze, złącze i zagięcie. Sygnalizacja PAM4 ma węższe marginesy szumów niż NRZ, więc instalacje światłowodowe pracujące przy 100 G często zawodzą przy wyższych prędkościach.

P: Czy powinienem wdrożyć 800G teraz, czy poczekać na 1,6T?

Odpowiedź: Wdrażaj w oparciu o bieżące zapotrzebowanie na ruch, a nie przyszłą dostępność produktu. Zaprojektuj infrastrukturę tak, aby obsłużyła przepustowość 1,6 T, ale nie zwlekaj z wdrożeniem sieci 800 G, której wymaga Twoje obciążenie już dziś.

P: Jaki jest najczęstszy błąd w modernizacji układu optycznego?

Odp.: Skupianie się na prędkości transiwera, ignorując gotowość instalacji światłowodowej. Nieplanowana zmiana-okablowania podczas migracji zazwyczaj kosztuje więcej niż same moduły.

P: Gdzie DWDM pasuje do planowania wydajności?

Odp.: DWDM zwielokrotnia przepustowość istniejącego światłowodu poprzez dodanie długości fal,-co stanowi opłacalną alternatywę dla układania nowego kabla, szczególnie w przypadku łączy DCI metra o długości poniżej 80 km z dostępem do ciemnego światłowodu.

Wyślij zapytanie