Zrozumienie modułu optycznego 400g
Dec 16, 2025|
TheModuł optyczny 400Greprezentuje fundamentalną zmianę w sposobie, w jaki centra danych projektują swoją sieć połączeń. Transceivery te, pracujące z szybkością 400 gigabitów na sekundę, wykorzystują sygnalizację PAM4 (poziom modulacji amplitudy impulsu na poziomie 4-) w ośmiu torach elektrycznych-każdy o szybkości 50 Gb/s-, aby zagregować przepustowość, która jeszcze kilka lat temu wymagałaby czterech oddzielnych łączy 100G. Specyfikacje te reguluje standard IEEE 802.3bs, a główne grupy MSA, w tym QSFP-DD i OSFP, stworzyły konkurencyjne definicje obudów, które w dalszym ciągu wpływają na decyzje zakupowe zarówno wśród operatorów hiperskalowych, jak i sieci korporacyjnych.

Dlaczego 400G wydarzyło się, kiedy tak się stało
Zwiększenie przepustowości jest pewną nieuchronnością, której weterani branży przyzwyczaili się oczekiwać. Przeskok z 10G do 40G wydawał się wówczas znaczący. Potem pojawiła się sieć 100G i nagle wszyscy zaczęli mówić o architekturze kręgosłupa-i liściach i wzorcach ruchu na wschodzie-zachodzie. Ale 400G? To przejście było inne.
Schemat modulacji NRZ, który dobrze nam służył od 1G do 25G, po prostu nie mógł być ekonomicznie skalowany powyżej 100G. Fizyka stała się droga. Integralność sygnału stała się koszmarem. Z technicznego punktu widzenia można byłoby mocniej naciskać na NRZ,-ale krzywe kosztów nie miały sensu w przypadku wdrażania masowego. Dlatego branża zwróciła się ku PAM4.
To, co robi PAM4-i warto to zrozumieć, jeśli określasz specyfikację infrastruktury,-koduje dwa bity na symbol zamiast jednego. Cztery poziomy amplitudy zamiast dwóch. Dwukrotna przepustowość danych bez podwajania szybkości transmisji. Kompromis? Twój stosunek sygnału-do-szumu wynosi około 10 dB w porównaniu z NRZ. To nie jest trywialne. To dlatego każdy moduł 400G jest dostarczany z wbudowaną korekcją błędów w przód i dlatego DSP (cyfrowy procesor sygnału) stał się tak krytycznym elementem tych transceiverów.

Wojny o współczynnik kształtu
Od lat obserwuję debatę QSFP-DD kontra OSFP na targach i spotkaniach dotyczących zakupów. Obie strony mają ważne argumenty. Żaden z nich nie wygrał definitywnie.
QSFP-DD powstał w wyniku sojuszu QSFP-DD MSA, a jego zabójczą funkcją jest kompatybilność wsteczna. Masz kilka modułów QSFP28, których nie chcesz wymienić? Zmieszczą się prosto w klatce QSFP-DD. Wymiary-18,35 mm szerokości i 89,4 mm długości zapewniają znajomą formę. Na przednim panelu o wysokości 1U można zmieścić 36 portów. Daje to łączną przepustowość 14,4 Tb/s, jeśli zapełnisz każde gniazdo. Dla operatorów dokonujących stopniowej modernizacji ma to ogromne znaczenie.
OSFP przyjął inne podejście. Grupa Octal Small Form-Factor Pluggable stwierdziła: zapomnij o kompatybilności wstecznej, zoptymalizujmy pod kątem zarządzania temperaturą i przyszłej skalowalności. Przy szerokości 22,58 mm i długości 107,8 mm moduły OSFP mają większą powierzchnię do rozpraszania ciepła. Obsługują zakres mocy do 15-20 watów w porównaniu z sufitem QSFP-DD o mocy 12–15 W. Kiedy używasz spójnej optyki lub planujesz 800G, ten zapas staje się istotny.
Firma NVIDIA włożyła-całość w OSFP w swojej platformie Quantum-2 InfiniBand. To nie jest nic. Jednak przełączniki korporacyjne firm Cisco i Arista nadal dostarczają głównie porty QSFP-DD.
Co właściwie oznaczają te litery
Jeśli kiedykolwiek przeglądałeś specyfikację i zastanawiałeś się, dlaczego DR4 kosztuje mniej niż FR4, mimo że oba są „modułami 400G”, nie jesteś sam. Nazewnictwo opiera się na wzorcach, ale te wzorce mają wyjątki, a wyjątki mają swoją własną logikę.
- SR (krótkiego zasięgu): Światłowód wielomodowy, długość fali 850 nm. 400G-SR8 wykorzystuje osiem równoległych torów 50G PAM4 przez złącze MPO-16. Zasięg sięga około 100 metrów w przypadku światłowodu OM4-70 metrów w przypadku światłowodu OM3. Dostępny jest również SR4, który zapewnia 100 G na każdym z czterech pasów przy użyciu szybszych VCSEL. Ten sam zasięg, mniej włókien. Wariant 400G-SR4.2 (czasami nazywany BIDI) jest sprytny dzięki transmisji dwukierunkowej, obsługującej dwie długości fal w każdym kierunku, aby osiągnąć 400G na zaledwie czterech włóknach.
- DR4: Światłowód jedno-modowy, 1310 nm, 500 metrów. To jest główny czynnik w przypadku połączeń wewnątrz-centrów danych, dłuższych niż może obsłużyć SR. Każdy z czterech torów optycznych przenosi 100G PAM4 przez dedykowaną parę włókien. Złącze MPO-12. Możliwość rozdzielania jest tutaj znacząca.-Jeden DR4 można podzielić na cztery niezależne łącza 100G-DR, co jest pomocne przy podłączaniu starszego sprzętu 100G.
- FR4: Dwa kilometry,-tryb pojedynczy. Oto, gdzie architektura skrzyni biegów zasługuje na swoje utrzymanie. Moduł wykorzystuje osiem torów elektrycznych 50G, konwertuje je na cztery tory optyczne 100G za pomocą procesora DSP, a następnie-multipleksuje wszystkie cztery długości fali na jedną parę włókien przy użyciu odstępów CWDM4 (1271, 1291, 1311, 1331 nm). Podwójne złącze LC. Znacznie bardziej uporządkowane okablowanie niż podejście równoległe DR4.
- LR4 i nie tylko: Taki sam schemat długości fal jak FR4, ale zoptymalizowany pod kątem zasięgu 10 km. ER4 pcha do 40km. ZR4 osiąga zasięg 80 km, ale wymaga spójnego wykrywania-całkowicie innej technologii, innego przedziału cenowego i innego przypadku użycia. Standard 400ZR firmy OIF jest specjalnie przeznaczony do zastosowań DCI w metropolii, w których potrzebna jest wymienna, spójna optyka w płycie czołowej przełącznika.

Pytanie dotyczące DSP
Każdy transceiver 400G zawiera cyfrowy procesor sygnałowy. Każdy. To nie jest opcjonalne.-Modulacja PAM4 po prostu nie działa bez zaawansowanego kondycjonowania sygnału.
Co właściwie robi DSP? Korekcja sygnału-w przód, aby zrekompensować utratę kanału. Wyrównanie ze sprzężeniem zwrotnym decyzji w przypadku interferencji między-symbolami. Odzyskiwanie zegara i danych w celu wyodrębnienia czasu z odebranego sygnału. Kodowanie FEC przy transmisji, dekodowanie FEC i korekcja błędów przy odbiorze. W spójnych modułach dodaj do tej listy kompensację dyspersji chromatycznej i zarządzanie dyspersją w trybie polaryzacji.
DSP zużywa energię. Dużo tego. W wielu modułach 400G procesor DSP odpowiada za ponad połowę całkowitego zużycia energii. Marvell, Broadcom i Inphi (obecnie część Marvell) konkurują ze sobą, aby zmniejszyć węzły procesowe i poprawić wydajność. Przeskok z procesorów DSP 7 nm do 5 nm zapewnił znaczące-oszczędności energii rzędu 20% przy równoważnej funkcjonalności.
Trwa debata na temat tego, czy procesory DSP powinny zostać zastosowane w samym przełączniku ASIC (co niektórzy nazywają „liniową optyką wtykaną” lub LPO). Argument jest następujący: jeśli już przetwarzasz sygnał na przełączniku, po co powielać to w każdym transiwerze? Kontrargument- dotyczy interoperacyjności modułów i praktycznych wyzwań związanych z kwalifikacją optyki na różnych platformach przełączników. Ta sytuacja będzie rozgrywać się przez kilka następnych lat.
Wkracza fotonika krzemowa
Pamiętasz, kiedy wszyscy zakładali, że lasery InP (fosforek indu) zdominują 400G? Narracja się zmieniła.
Intel i Cisco wcześnie postawiły na fotonikę krzemową-integrującą komponenty optyczne z podłożami krzemowymi przy użyciu standardowych procesów produkcyjnych CMOS. Obietnica zawsze dotyczyła kosztów w skali. Tradycyjna optyka dyskretna wymaga ręcznego montażu chipów laserowych, modulatorów, fotodetektorów, każdy z innego materiału. Fotonika krzemowa pozwala zbudować większość silnika optycznego na jednej matrycy.
Oferowane obecnie krzemowe moduły fotoniczne 400G-DR4 oferują atrakcyjną ekonomikę w przypadku wdrożeń hiperskalowych. Nie są one ogólnie tańsze niż alternatywy oparte na EML-jeszcze{5}}-ale trajektoria kosztów faworyzuje krzem w miarę wzrostu wydajności fabryk. Korzyści wynikają również ze zużycia energii, szczególnie w sekcji modulatora.
To powiedziawszy, krzem jest przeciętnym laserem. Problem pośredniego pasma wzbronionego nie został rozwiązany. Dlatego nawet krzemowe moduły fotoniczne zazwyczaj wykorzystują zewnętrzny układ wzmacniający InP lub GaAs, hybrydowy-zintegrowany z platformą krzemową. To elegancka inżynieria, ale „fotonika krzemowa” pozostaje terminologią nieco aspiracyjną.
Realia energetyczne i cieplne

W pełni zapełniony przełącznik 400G nagrzewa się. Nie da się tego obejść.
Rozważmy: 32 porty modułów 400G-DR4, każdy pobierający 10–12 watów. To 320–384 W bezpośrednio z transceiverów, bez uwzględnienia układu ASIC przełącznika, pamięci, wentylatorów i strat konwersji mocy. Gęstość cieplna w rzędzie nowoczesnych centrów danych podwoiła się w ciągu ostatnich pięciu lat. Zespoły zajmujące się obiektami nas nienawidzą.
Większa obudowa OSFP uwzględnia nieco-większą powierzchnię, lepsze kanały przepływu powietrza i konstrukcję zintegrowanych radiatorów, która może bezpośrednio łączyć się z systemami chłodzenia przełączników. Moduły QSFP-DD w większym stopniu opierają się na architekturze termicznej sprzętu głównego. Żadne z tych rozwiązań nie jest „złe”, ale względy termiczne absolutnie powinny wpłynąć na decyzję dotyczącą kształtu, jeśli budujesz komputer pod kątem długotrwałych obciążeń-przepustowości.
Chłodzenie powietrzem osiąga swoje praktyczne granice dla tych gęstości. Chłodzenie cieczą-płyty zimne w przełącznikowych układach ASIC, potencjalne zanurzenie całych szaf-nie jest już czymś egzotycznym. To po prostu kosztowna infrastruktura, którą organizacje wciąż uczą się określać i utrzymywać.
Scenariusze przełamania
Jedna funkcja nie przyciąga wystarczającej uwagi: moduły 400G często można skonfigurować do pracy w trybie rozdzielania, prezentując wiele interfejsów o niższej-szybkości z systemem hosta.
Sieć 400G-SR8 może służyć jako dwa łącza 200G-SR4, dwa łącza 100G-SR4 działające z połową szybkości lub nawet osiem niezależnych kanałów 50G (wariant „kanałowy” lub SR8-C). 400G-DR4 można podzielić na cztery połączenia 100G-DR, co jest przydatne, gdy trzeba podłączyć port przełącznika 400G do czterech oddzielnych serwerów 100G.
Okablowanie staje się tutaj interesujące. Dwustronna wiązka rozdzielająca MPO-12 do 4xLC wykorzystuje pojedynczy port DR4 i rozdziela go na cztery niezależne pary SMF. Architekci sieci uwielbiają tę elastyczność, ale konsekwencje związane z zarządzaniem kablami są realne. Twój plan okablowania strukturalnego musi uwzględniać scenariusze awarii od pierwszego dnia, w przeciwnym razie kable krosowe ad hoc będą uruchamiane sześć miesięcy po wdrożeniu.
Co 800G oznacza dla 400G
Branża rozwija się szybko.. 800W ofercie znajdują się obecnie transceivery G-głównie warianty SR8 i DR8 do połączeń klastrów AI. Czy to sprawia, że 400G jest przestarzałe? Nawet nie blisko.
Ekosystem 400G dojrzał. Koszty modułów znacznie spadły. Interoperacyjność różnych dostawców jest-dobrze ugruntowana. W przypadku większości potrzeb związanych z siecią korporacyjną i chmurową sieć 400G stanowi idealne rozwiązanie pod względem wydajności, kosztów i znajomości obsługi. Przez lata pozostanie to gra zwiększająca głośność w przypadku materiałów-z grzbietem liścia i-ogólnego zastosowania łączności z centrami danych.
800G, a ostatecznie 1,6T będzie dominować w środowiskach AI/ML, w których procesory graficzne muszą przesyłać dane szkoleniowe z absurdalną szybkością. Inny rynek, inne wymagania, inne rozmowy budżetowe. Większość sieci nie będzie musiała podążać za tą krzywą.

Względy praktyczne, o których nikt nie pisze
Niektórych rzeczy nauczyłem się na własnej skórze:
Zgodność modułu EEPROM ma większe znaczenie, niż przyznają producenci. „Kompatybilne” transceivery, które działają dobrze w jednym modelu przełącznika, mogą generować błędy w innym z tym samym układem ASIC, ale innym oprogramowaniem sprzętowym. Wykorzystaj czas testowania podczas kwalifikowania-optyki innej firmy.
Złącze LC w modułach FR4 i LR4 jest dupleksowe-w sumie dwa włókna-ale złącze MPO w DR4 i SR8 wykorzystuje polerowanie APC (ang. kątowy styk fizyczny). Mieszanie złączy APC i UPC spowoduje utratę sygnału zwrotnego na poziomie ponad 20 dB i sporadyczne błędy. Kodowanie kolorami istnieje nie bez powodu.
Moduły PAM4 różnych producentów mogą mieć nieznacznie różne implementacje FEC. Standardy pozostawiają pole do interpretacji. Jeśli widzisz niewytłumaczalnie dużą liczbę poprawionych błędów na łączu, spróbuj zamienić jeden koniec na moduł tego samego-dostawcy, zanim zrzucisz winę na fabrykę włókien.
Temperatura ma znaczenie. Moduły te są przystosowane do pracy w temperaturach obudowy do 70 stopni, ale ich wydajność spada, zanim osiągną ten pułap. Zachowaj spokój, jeśli chcesz spójnego zachowania.
Droga Naprzód
Moduły optyczne 400G przeszły z infrastruktury najnowocześniejszej do infrastruktury głównego nurtu. Decyzje technologiczne-QSFP-DD kontra OSFP, równoległe kontra WDM, krzem kontra dyskretna optyka-nie wiążą się już z takim samym ryzykiem jak trzy lata temu. Istnieją solidne łańcuchy dostaw. Wielu kwalifikowanych dostawców konkuruje ceną i funkcjami. Organy normalizacyjne rozwiązały większość przypadków brzegowych interoperacyjności.
Dla architektów sieci planujących obecnie wdrożenia schemat wyboru jest prosty: dopasuj współczynnik kształtu do strategii platformy przełącznika, wybierz typ transceivera (SR/DR/FR/LR) w oparciu o rzeczywiste wymagania dotyczące zasięgu i nie przekraczaj-specyfikacji. Urządzenie 400G-LR4 kosztuje znacznie więcej niż urządzenie 400G-DR4 – jeśli najdłuższe przebiegi wynoszą 300 metrów, marnujesz budżet bez korzyści operacyjnych.
Następne kilka lat przyniesie stopniowe ulepszenia: procesory DSP o niższej mocy, lepsze uzyski fotoniki krzemowej, być może pewna standaryzacja w zakresie architektur liniowych z wtykami. Jednak podstawowa platforma technologiczna ustabilizowała się.. 400G już się nie pojawia. Teraz to tylko infrastruktura,-którą można bezpiecznie zaplanować.
I szczerze? Po chaosie początków ery 100G warto docenić tę przewidywalność.


