Redes neuronales fotónicas programables que combinan WDM con óptica lineal coherente

Blog

HogarHogar / Blog / Redes neuronales fotónicas programables que combinan WDM con óptica lineal coherente

Aug 13, 2023

Redes neuronales fotónicas programables que combinan WDM con óptica lineal coherente

Scientific Reports volumen 12, número de artículo: 5605 (2022) Cite este artículo 4884 Accesos 19 Citas 1 Detalles de Altmetric Metrics La fotónica neuromórfica se ha basado hasta ahora únicamente en sistemas coherentes o

Scientific Reports volumen 12, número de artículo: 5605 (2022) Citar este artículo

4884 Accesos

19 citas

1 altmétrica

Detalles de métricas

Hasta ahora, la fotónica neuromórfica se ha basado únicamente en diseños coherentes o de multiplexación por división de longitud de onda (WDM) para permitir la multiplicación de productos escalares o vector por matriz, lo que ha dado lugar a una impresionante variedad de arquitecturas. Aquí, vamos un paso más allá y empleamos WDM para enriquecer el diseño con capacidades de paralelización a través de etapas de fan-in y/o ponderación en lugar de servir al propósito computacional y presentamos, por primera vez, una arquitectura neuronal que combina óptica coherente con WDM hacia una plataforma de red neuronal programable multifuncional. Nuestra plataforma reconfigurable admite cuatro modos operativos diferentes en el mismo hardware fotónico y admite capas multicapa, convolucionales, totalmente conectadas y de ahorro de energía. Validamos matemáticamente el rendimiento exitoso en los cuatro modos operativos, teniendo en cuenta la diafonía, el espaciado de canales y la dependencia espectral de los elementos ópticos críticos, concluyendo una operación confiable con error relativo MAC \(< 2\%\).

El crecimiento explosivo de la Inteligencia Artificial (IA) y el Aprendizaje Profundo (DL), junto con la maduración de la integración fotónica, han creado una nueva ventana de oportunidades para el uso de la óptica en tareas computacionales1,2,3,4,5. Se prevé que el uso de fotones y tecnologías ópticas relevantes en el hardware de redes neuronales (NN) ofrecerá un impulso significativo en las operaciones de multiplicación y acumulación (MAC) por segundo en comparación con las respectivas plataformas electrónicas de NN, y se estima que la energía computacional y la eficiencia del área alcanzarán < fJ/MAC y > TMAC/s/mm\(^{2}\), respectivamente6,7. El camino hacia la realización de este cambio de paradigma del hardware NN tiene como objetivo explotar las altas velocidades de línea respaldadas por tecnologías fotónicas integradas junto con la función de ponderación de tamaño pequeño y bajo consumo de energía que se puede ofrecer a escala de chip4,8. Hasta ahora, la gran mayoría de los dispositivos fotónicos utilizados con fines de ponderación se han centrado en elementos lentamente reconfigurables, como los desfasadores termoópticos (T/O)9,10 y las estructuras de memoria no volátiles basadas en materiales de cambio de fase (PCM)4,8 , lo que implica que las aplicaciones de inferencia se consideran actualmente como el objetivo principal dentro del área de la fotónica neuromórfica3.

De hecho, los motores de inferencia requieren una arquitectura neuronal bastante estática y un gráfico de conectividad de capas que generalmente se define para realizar de manera óptima una determinada tarea de IA. El seguimiento de objetos y la clasificación de imágenes, por ejemplo, normalmente se realizan a través de varias capas convolucionales seguidas de una o más capas completamente conectadas (FC), mientras que los codificadores automáticos requieren etapas en cascada de capas FC11,12. Aunque las capas convolucionales y FC comprenden elementos arquitectónicos críticos en casi todas las plataformas de inferencia, un gran conjunto de parámetros (como el número de capas y/o neuronas por capa y el gráfico de conectividad) pueden variar significativamente según la arquitectura y la aplicación de DL de destino. Las implementaciones electrónicas pueden concluir en circuitos integrados de aplicaciones específicas (ASIC) personalizados para una tarea de inferencia específica, pero el uso de GPU, TPU o incluso FPGA se vuelve inevitable cuando se requiere reprogramabilidad y reconfigurabilidad para utilizar el mismo hardware para múltiples aplicaciones13.

Transferir la capacidad de reconfiguración a implementaciones fotónicas (P)-NN requiere una plataforma que pueda admitir de manera flexible diferentes diseños funcionales sobre el mismo hardware neuronal. La programabilidad en fotónica ha logrado avances significativos en los últimos años14,15,16 y se ha demostrado que los circuitos fotónicos integrados (PIC) programables ofrecen ventajas importantes para el lanzamiento de plataformas fotónicas rentables, flexibles y multifuncionales que pueden seguir de cerca el concepto de FPGA electrónicos17. En este esfuerzo, también se ha destacado que el simple uso de interruptores interferométricos Mach-Zehnder (MZI) \(2 \times 2\) reconfigurables lentamente dentro de un esquema arquitectónico apropiado puede producir un gran conjunto de conectividades de circuitos y opciones de funcionalidad14,15 . Sin embargo, la idiosincrasia de las arquitecturas NN tiene que avanzar hacia funcionalidades alternativas que actualmente aún no ofrecen las implementaciones fotónicas programables. Aunque la reconfiguración del valor del peso puede ser ofrecida por la tecnología de ponderación fotónica de última generación4,8,9,10 y también ha comenzado a surgir un cambio de perspectiva hacia funciones de activación programables16,18,19, las arquitecturas fotónicas neuromórficas demostradas hasta el momento no soportan ningún mecanismo de reconfiguración para sus etapas de neuronas lineales. Hasta ahora, las PNN han progresado a lo largo de dos categorías arquitectónicas principales para realizar capas neuronales lineales, donde las plataformas multiplexadas por división de longitud de onda (WDM) y coherentes parecen seguir hojas de ruta discretas y paralelas: (i) diseños incoherentes o basados ​​en WDM, donde una longitud de onda discreta se utiliza para cada axón dentro de la misma neurona3,4,20, y (ii) esquemas interferométricos coherentes, donde se utiliza una única longitud de onda en toda la neurona, explotando la interferencia entre campos eléctricos coherentes para operaciones de suma ponderada9,10.

Aquí, presentamos una arquitectura novedosa que puede combinar eficientemente WDM y fotónica coherente para admitir PNN programables (PPNN) con cuatro modos operativos de capa neuronal lineal diferentes. A partir de nuestra arquitectura de neuronas lineales coherentes de doble IQ propuesta recientemente21, que se ha demostrado recientemente también como un PIC con velocidades de cálculo innovadoras por axón22,23, ampliamos la arquitectura de una sola neurona empleando múltiples canales de longitud de onda y la respectiva desmultiplexación WDM. (DE/MUX) para crear etapas de entrada (entrada) y de peso de elementos múltiples y únicos por cada axón. Luego, la programabilidad se aplica a través de \(2 \times 2\) conmutadores MZI que pueden definir de manera flexible la conectividad entre las etapas de entrada y ponderación, permitiendo de esta manera topologías de capas neuronales definidas por software. Formulamos el marco matemático para esta arquitectura neuromórfica programable y procedemos con un estudio en profundidad de los deterioros de rendimiento previstos que se originan por el uso de múltiples longitudes de onda dentro de la misma disposición interferométrica. Concluimos con un mecanismo simple para contrarrestar el comportamiento dependiente de la longitud de onda de moduladores y desfasadores en las etapas de entrada y ponderación, respectivamente, mostrando que nuestro diseño programable funciona igualmente bien para cualquier número de canales ópticos empleados en cualquiera de los 4 modos distintos. de operación, con todas las neuronas soportadas ofreciendo siempre un error relativo inferior a \(2\%\) siempre y cuando la diafonía entre canales se mantenga en valores típicos inferiores a \(-\,20 \, \mathrm {dB} \).

En nuestro estudio reciente21 hemos demostrado cómo se pueden construir neuronas lineales coherentes, que ofrecen funcionalidad de producto escalar, a partir de bloques moduladores de IQ, lo que permite preservar la información de signos (codificada en la fase de la señal) mediante la introducción de la señal de polarización, \( \Sigma w_i x_i + b\), haciendo que la neurona sea compatible con funciones de activación no lineales totalmente ópticas, \(f_\mathrm {NL}(\cdot )\), adaptadas ya sea para campo eléctrico o para potencia óptica, sin sufrir información pérdida. Al tener el dominio de longitud de onda sin explotar, avanzamos en nuestra arquitectura neuronal original para acomodar múltiples canales y lograr la paralelización como se muestra en la Fig. 1.

(a) Representación esquemática de PPNN que muestra M diodos láser (LD), un MUX, un divisor X de 3 dB seguido de una rama de polarización (\(W_\mathrm {b}\)) y un OLAU reconfigurable que abarca 1 a N etapa de división, bancos de moduladores de entrada (\(X_n\)) y peso (\(W_n\)) y una etapa combinadora N a 1, cuya salida interfiere con la señal de polarización dentro del acoplador X de 3 dB y enviado al DEMUX. Una mirada más cercana a (b) la división 1 a N y (d) su etapa de acoplamiento N a 1 rotada \(\pi\). Amplíe los (c) pesos selectivos de longitud de onda de la rama de polarización y moduladores de fase y (e) un axón del OLAU que consta de interruptores para el enrutamiento de la señal y moduladores para las entradas (\(x_{n,m}\)) y pesos ( \(w_{n,m}\)).

Como revela la Fig. 1a, la columna vertebral de nuestra capa neuronal sigue siendo similar a la de 21, con las principales diferencias: (i) una única señal óptica de entrada de onda continua (CW) ahora se reemplaza por M señales CW multiplexadas, cada una centrada en \(\ lambda _m\) y que soporta una neurona virtual independiente, y (ii) los moduladores de entrada y peso ahora se reemplazan por bancos de moduladores más elaborados que se muestran en la Fig. 1c, e, delimitados por interruptores controlables por software en el caso de este último. La señal multicanal de entrada se divide primero mediante un acoplador X de 3 dB en la parte dirigida a la rama de polarización y el resto ingresa a la Unidad Algebraica Lineal Óptica (OLAU). Dentro de OLAU, la señal se divide aún más en términos de potencia mediante un divisor de 1 a N, un ejemplo del cual se muestra en la Fig. 1b, y, después de ser modulada adecuadamente por las entradas \(x_{n,m} \) y ponderado por pesos \(w_{n,m}\), se envía al combinador N a 1, que se muestra en la Fig. 1d. En esta etapa, la señal de salida interfiere con la polarización dentro de un acoplador X de 3 dB y se envía al DEMUX para generar las salidas \(y_m\). Finalmente, cada canal m tendrá su propia suma algebraica de las entradas ponderadas con un sesgo designado, lo que concluye en un total de M neuronas N-fan-in independientes.

Dependiendo de la configuración de los interruptores, cuya descripción general se ofrece en la Tabla 1, los canales dentro de un solo axón de la Fig. 1e se pueden controlar individualmente o mediante un modulador común, lo que permite que la red funcione como:

multineurona (M neuronas N a 1 independientes), que permite un gráfico de interconexión lógica arbitraria, admitiendo incluso una operación de múltiples capas al designar diferentes neuronas para diferentes capas de la NN;

convolucional (M entradas de N elementos independientes con un único núcleo de tamaño N), donde todos los diferentes vectores de entrada pasan por el mismo conjunto de pesos, Fig. 2c, logrando el uso simultáneo de M veces del mismo núcleo, acelerando la operación de convolución desde Figura 2b;

completamente conectado (FC) (entrada única de N elementos sobre M neuronas), donde una sola entrada pasa a través de todos los M conjuntos de pesos disponibles, cada uno de tamaño N, lo que permite una conectividad total entre todas las entradas y salidas, Fig. 3a, c;

ahorro de energía (neurona única N a 1), que, aunque no es un modo de operación principalmente objetivo debido a la gran penalización de la huella y el bajo rendimiento agregado, aún permite la conservación de recursos al apagar los canales sobrantes y puede ser útil si ocasionalmente se requiere que NN funcione de manera secuencial (una neurona a la vez).

(a) CNN simplificada inspirada en LeNet-5, empleada en la clasificación de imágenes. (b) Esquema de una capa convolucional con pares de entrada/salida codificados por colores y (c) su implementación sobre PPNN en el modo #2 donde cada canal m corresponde a un par de entrada/salida.

(b) Esquema de un codificador automático y (a), (c) sus dos capas FC implementadas sobre PPNN en el modo #3 donde los canales corresponden a vectores de peso y salidas únicos \(y_m\). Según el gráfico de conectividad de (b), la implementación supone el uso de (a) 4 ramas y 2 longitudes de onda en la primera capa y (c) 2 ramas y 4 longitudes de onda en la segunda. Si el número de ramas disponibles N es mayor de lo necesario, todas las ramas sobrantes tendrán las entradas establecidas en 0 (observe la enésima rama en (a), (c), donde se cumple la condición \(N>4\) y \( N>2\) se impone, respectivamente). El índice n en la implementación (a) se establece en \(n \le 4\) para indicar que la enésima rama iluminada lleva una entrada distinta de cero. De manera similar, si el número de longitudes de onda M disponibles excede el número de longitudes requeridas, los LD sobrantes se apagan.

En la Sección 1, Documento complementario, se puede encontrar un mapeo detallado entre la arquitectura de la Fig. 1 y los modos de operación enumerados, con algunos ejemplos también en las Figs. 2 y 3. Los modos de operación convolucional y FC son particularmente importantes debido a su presencia ubicua en NN profundas, especialmente en los NN convolucionales (CNN) ampliamente utilizados, Fig. 2a11. Tanto en la capa convolucional como en la de agrupación, se aplica un núcleo único (ventana de filtrado o ponderación) a las entradas de manera de escaneo con cierto paso, lo que produce un valor de salida único, como se muestra esquemáticamente en la Fig. 2b y se implementa sobre PPNN en la Fig. 2c. Por otro lado, la capa FC, que se muestra implementada sobre PPNN en la Fig. 3a, c, tiene un único conjunto de entradas que pasan a través de múltiples conjuntos de pesos para producir las salidas y es el componente principal de los codificadores automáticos, Fig. 3b, junto con siendo necesario en las CNN, Fig. 2a. Ambas operaciones consumen tiempo y energía si se abordan de manera secuencial, lo que implica que se benefician enormemente de la paralelización.

Aunque los interruptores de diferentes axones se pueden controlar de forma independiente, la capa NN de tipo mixto resultante no tiene ninguna aplicación prevista por el momento. Por lo tanto, asumimos que los interruptores en todas las ramas están sincronizados de la siguiente manera \(S_{\mathrm {X},n} = S_\mathrm {X}\), \(S_{\mathrm {W},n} = S_\mathrm {W}\) y \(S_{\mathrm {O},n} = S_\mathrm {O}, \forall n\). Las matrices que encapsulan los valores de las entradas, \(X_n\), y los pesos, \(W_n\), para diferentes modos de operación se resumen en la Tabla 2, donde \(I_M\) representa \(M \times M\) matriz de identidad. Las entradas no requieren más de un modulador de amplitud por valor, ya que están definidas en el dominio positivo \(x_{n,m} \in [0,1]\), mientras que, en el caso de los pesos, que pueden ser tanto positivos como negativo, \(w_{n,m} \in [-1,1]\), se requieren dos moduladores, uno para la amplitud, que será proporcional a la magnitud del peso, \(|w_{n,m}| \), y el resto para la fase, que llevará el signo del peso, \(\varphi _{n,m} = [1 - \mathrm {sgn}(w_{n,m})]\pi /2\).

La rama de polarización, que se muestra en la Fig. 1c, difiere de la rama del axón, Fig. 1e, en dos aspectos: (i) no tiene moduladores de secuencia de entrada; (ii) tiene sólo una ruta posible que puede tomar la señal, con un control separado de la fase y amplitud de cada canal. Esto último viene como una medida para contrarrestar la variación anticipada dependiente de la longitud de onda de las magnitudes de entrada y peso cuando se usa un modulador de fase y amplitud único en cada axón del OLAU. Además, permite compensar coeficientes de transmisión y desfases de fase potencialmente diferentes que se acumularán en diferentes canales dentro de OLAU, cumpliendo así las condiciones para la interferencia constructiva en el último acoplador de 3 dB del PNN. La matriz de polarización sigue siendo la misma para todos los modos de operación y lee \(W_\mathrm {b} = \mathrm {diag} [w_{\mathrm {b},1}, \ldots , w_{\mathrm {b},M }]\), donde \(w_{\mathrm {b},m} = |w_{\mathrm {b},m}| \exp ( i\varphi _{\mathrm {b},m} )\) .

Supongamos que la portadora óptica consta de M canales \(\lambda _m\) y se representa mediante un vector columna \(M \times 1\) de campos eléctricos \(\mathrm {E}_\mathrm {LD } = [E_{\mathrm {LD},1}, \ldots , E_{\mathrm {LD},M}]^\mathrm {T}\), que están normalizados de manera que su magnitud al cuadrado produce potencia óptica, es decir , \(E_{\mathrm {LD},m} = \sqrt{P_{\mathrm {LD},m}} \exp (i \varphi _{\mathrm {LD},m})\). Siguiendo la arquitectura dada en la Fig. 1 y la derivación detallada presentada en la Sección 2 del Documento complementario, encontramos el vector columna de campos eléctricos en la salida de PPNN como

donde, para garantizar una interferencia constructiva en el último acoplador X de 3 dB de la Fig. 1a, se realiza la coincidencia de fase entre la polarización y la señal proveniente de OLAU. Lo primero se hace mediante \({\widetilde{W}}_\mathrm {b} = W_\mathrm {b} \exp (-i \pi /2)^{\log _2 N}\), que denota el Matriz de transferencia de canal de rama de polarización que tiene en cuenta la alineación de fase, siendo su elemento m \({\widetilde{w}}_{\mathrm {b},m} = |w_{\mathrm {b},m}| \ exp ( i\varphi _{\mathrm {b},m} ) \exp (-i \pi /2)^{\log _2 N}\). Sin tener en cuenta el cambio de fase acumulado y las pérdidas que son idénticas para todos los canales, la matriz de transferencia del PPNN, \(\mathrm {Q}_\mathrm {t}\), se puede escribir como

El elemento m de la matriz \(\mathrm {Q}_\mathrm {t}\), \(q_{\mathrm {t},m}\), dado por la ecuación. (2b) para el modo de operación de múltiples neuronas (n.° 1), revela el principio subyacente de operación de nuestra PPNN, lo que demuestra cómo se normaliza el producto escalar entre los vectores de N elementos representados en los axones, \([w_{1,m} , \ldots , w_{N,m}]\) y \([x_{1,m}, \ldots , x_{N,m}]\), se pueden lograr en la salida de la neurona del canal m con sesgo \( {\widetilde{w}}_{\mathrm {b},m}\) superpuesto a él. La reconfigurabilidad de PPNN está oculta en la ecuación. (2a), donde la elección de las matrices \(X_n\) y \(W_n\) se rige por el modo de operación según la Tabla 2, lo que lleva a funcionalidades alternativas. En modo convolucional (#2), un único núcleo como en la Fig. 2b, es decir, un único conjunto de pesos en diferentes canales \([w_{1,0}, \ldots, w_{N,0}]\), requiere un modulador de peso común por axón ya que \(w_{n,m} = w_{n,0}, \forall m\), mientras que los vectores de entrada siguen siendo diferentes entre los canales, \([x_{1,m}, \ldots , x_{N,m}]\), concluyendo con una paralelización de M veces y, en consecuencia, con una aceleración de la operación de convolución. Por otro lado, en modo FC (#3), un único vector de entrada \([x_{1,0}, \ldots , x_{N,0}]\), que requiere un modulador de entrada \(x_{n) ,0}\) por enésimo axón, pasa a través de múltiples pesos selectivos de canal, \([w_{1,m}, \ldots , w_{N,m}]\), lo que produce una conectividad total entre todas las N entradas \ (x_{n,0}\) y todas las M salidas \(y_m\), como se muestra en la Fig. 3b. Finalmente, en el modo de ahorro de energía (#4), pesos únicos y vectores de entrada, \([w_{1,0}, \ldots , w_{N,0}]\) y \([x_{1,0} , \ldots , x_{N,0}]\), permiten utilizar solo un canal y apagar los restantes, ofreciendo la misma funcionalidad que nuestro motor de producto punto IQ dual de21 sin penalizaciones adicionales en potencia consumo o rendimiento por canal, aunque sufre la penalización de la huella impuesta por la programabilidad PPNN y el diseño multicanal. Este modo de operación ciertamente no es el preferido, pero, en caso de que la reconfigurabilidad sea una característica necesaria del sistema, como en las etapas de creación de prototipos, se puede ahorrar energía cuando se enfrenta a operaciones secuenciales, generalmente abarcando las paralelas, en forma de Procedimientos de configuración y análisis.

Como se señaló anteriormente, la Ec. (2b) se proporciona para el modo #1, pero se puede actualizar a cualquier otro reemplazando el canal específico \(x_{n,m}\) y/o \(w_{n,m}\), por una unión \(x_{n,0}\) y/o \(w_{n,0}\). En lo que sigue, excepto cuando se indique explícitamente lo contrario, usaremos la notación \(x_{n,m}\) y \(w_{n,m}\) para un modo de operación arbitrario por simplicidad y claridad.

En ciertos escenarios de aplicación, como la clasificación de imágenes, Fig. 2a, b, es conveniente elegir el número de axones como un cuadrado de la dimensión del filtro lineal (núcleo), que normalmente es un número impar, lo que da como resultado, por ejemplo, \( N = 3 \veces 3\) o \(N = 5 \veces 5\). Algunas otras aplicaciones pueden requerir un N arbitrario, no necesariamente un cuadrado. En este caso, se pueden adoptar dos enfoques para explotar la arquitectura PPNN de la Fig. 1, teniendo en cuenta que el divisor y el combinador de la Fig. 1b, d se diseñaron asumiendo que N es una potencia de 2. El primer enfoque es sencillo y supone usando los N axones necesarios e ignorando los restantes que se están complementando al número de potencia de 2 más cercano mayor que N. En este caso, se perderá cierta cantidad de potencia óptica, pero siendo proporcional a \(N/ 2^{ \lceil \log _2 N \rceil }\), la pérdida nunca excederá los 3dB. El segundo enfoque tiene como objetivo eliminar las pérdidas de energía a expensas de rediseñar el divisor y el combinador, afirmando un cambio de fase idéntico en todos los caminos, lo que resulta en la preservación de la coherencia entre las señales que viajan a lo largo de diferentes axones. El algoritmo para diseñar dicho divisor y el combinador correspondiente se presenta en la Sección 3 del Documento complementario.

Operar PPNN en modo de ahorro de energía con un solo canal activo abre la posibilidad de omitir los DE/MUX en los axones y centrar todos los componentes pasivos (divisores, combinadores) y activos (conmutadores, moduladores de entrada y peso) en la longitud de onda central del canal. sin dejar lugar a la degradación de la salida debido a las propiedades dependientes de la longitud de onda de los componentes ópticos. Por otro lado, tener un PPNN multicanal (modos #1 a #3) plantea con razón la preocupación sobre si todos los canales funcionarán de la misma manera, teniendo un error relativo similar entre la salida objetivo, dado por el elemento de matriz \(q_{\mathrm) {t},m}\) en la ecuación. (2b), y valor obtenido experimentalmente \(q_{\mathrm {e},m}\). La pérdida dependiente de la longitud de onda y la acumulación de fase junto con la diafonía en DE/MUX podrían conducir a una degradación del rendimiento de algunos canales en mayor medida que de otros, medido por el aumento absoluto, \(\Delta q_m = q_{\mathrm {e} ,m} - q_{\mathrm {t},m}\), y error relativo, \(\delta q_m = |\Delta q_m|/q_{\mathrm {t},m}\), entre los elementos de la matriz . Establecer el límite de error relativo tolerable puede ser una tarea desafiante ya que la tolerancia a errores de la red depende de la tarea en la que se emplea y del algoritmo de entrenamiento. Como regla general, un error PPNN aceptable debe ser menor que el error de entrenamiento, que comúnmente se encuentra en el rango de un pequeño porcentaje21,22,23. Además, se ha demostrado que el empleo de algoritmos de entrenamiento sensibles al ruido aumenta la resiliencia de los modelos NN incluso en entornos ruidosos24, donde el ruido debe entenderse como un término amplio que encapsula cualquier desviación distribuida aleatoriamente de la salida objetivo. Siguiendo lo dicho anteriormente, en esta sección nos proponemos investigar cuánto se desviará la matriz de transferencia PPNN experimental, \(\mathrm {Q}_\mathrm {e}\), de la matriz objetivo, \(\mathrm {Q} _\mathrm {t}\), y si esta desviación se puede contrarrestar.

Comenzamos nuestro análisis examinando el efecto de la dependencia de la longitud de onda de los acopladores X, utilizados para dividir y combinar etapas, así como de los interruptores ópticos, utilizados para el enrutamiento de señales dentro de los axones. En lo que sigue, se supone que el número de axones N es una potencia de dos, lo que implica que las etapas de división y combinación están compuestas por acopladores X de 3 dB en cascada. Sin embargo, todas las conclusiones se pueden generalizar a un número arbitrario de axones N, siguiendo el diseño del divisor/combinador descrito en la Sección 3 del Documento complementario. La relación de división de potencia dependiente de la longitud de onda del acoplador para el canal m-ésimo se puede escribir como \(\alpha _m = 1/2 + \Delta \alpha _m\), donde \(\Delta \alpha _m\) denota la desviación del coeficiente del valor objetivo de 1/2. Se supone que los tres conmutadores, \(S_\mathrm {X}\), \(S_\mathrm {W}\) y \(S_\mathrm {O}\), introducen una penalización por pérdida dependiente de la longitud de onda, de modo que el La cantidad de potencia óptica enviada al puerto activo es proporcional a \(s_m \le 1\). Según el estudio detallado informado en la Sección 4 del Documento complementario, encontramos el campo eléctrico de salida de PPNN en forma de vector de columna.

donde \(\mathrm {S} = \mathrm {diag} \left[ \sqrt{s_1} , \ldots , \sqrt{s_M} \right]\) denota la matriz de transferencia del interruptor y \(\mathrm {A }_\mathrm {barra/cruz} = \mathrm {diag} \left[ \sqrt{1 \mp 2 \Delta \alpha _1} , \ldots , \sqrt{1 \mp 2 \Delta \alpha _M} \right ]\) representa la matriz de transferencia cruzada/barra de un acoplador X, ambas dependen de la longitud de onda. Garantizar la interferencia constructiva en el acoplador de 3 dB de salida y preservar la integridad de la señal del campo de salida resultante requiere compensación de fase y equilibrio de pérdida por canal dentro de la rama de polarización, lo que se logra mediante la matriz de pesos modificada \({\widetilde{W}}_ \mathrm {b}\), con su elemento m-ésimo

Tanto el coeficiente que pondera \(w_{\mathrm {b},m}\) en (4) como el que pondera \(\mathrm {Q}_\mathrm {t}\) en (3) dependen sólo de las propiedades de los interruptores y acopladores X, y permanecen sin cambios independientemente de la secuencia de entrada y/o pesa. Comparando (3) con el caso ideal dado por (1)-(2), se puede ver que la condición de interferencia se cumple con éxito mediante el control individual de la amplitud y fase de polarización de acuerdo con (4). Sin duda, diferentes canales acumularán diferentes cantidades de pérdida; sin embargo, este desequilibrio se puede contrarrestar fácilmente empleando un conjunto de atenuadores ópticos variables (VOA) en la salida demultiplexada del PPNN (consulte la Fig. 1a). Teniendo la posibilidad de resolver este desafío fuera del núcleo de PPNN, a partir de este momento asumimos que la dependencia de la longitud de onda de los acopladores e interruptores X no es crítica y nos centramos en los deterioros que pueden causar la degradación de la matriz objetivo \( \mathrm {Q}_\mathrm {t}\).

Para implementar las entradas \(x_{n,c}\), utilizamos moduladores Mach-Zehnder (MZM) en nuestro estudio, siendo c el índice del canal \(\lambda _c\) en el que está centrado el MZM. Suponemos que los MZM tienen desfasadores (PS) controlados por voltaje en ambos brazos (indexados como "1/2" para el brazo superior/inferior, respectivamente) y funcionan en configuración push-pull con cambios de fase inducidos por CC dados como \(\ phi _{\mathrm {DC},1/2} = 2\pi n(V_{\mathrm {DC},1/2}, \lambda ) L_\mathrm {DC}/\lambda\) y RF inducida como \(\phi _{1/2}(\pm V_\mathrm {RF}, \lambda ) = \phi _0 (\lambda ) \pm \Delta \phi (V_\mathrm {RF}, \lambda )\) con \(\phi _0 = 2\pi n_0(\lambda ) L /\lambda\) y \(\Delta \phi = 2\pi \Delta n(V_\mathrm {RF}, \lambda ) L /\lambda \) donde L y \(L_\mathrm {DC}\) denotan las longitudes de las regiones activas de RF y DC y \(n = n_0 + \Delta n\), con \(n_0\) y \(\Delta n\ ) siendo el índice de refracción con voltaje aplicado cero y su desviación cuando se aplica el voltaje. La función de transferencia del MZM está dada como

y está diseñado de manera que \(t_\mathrm {MZM} (\lambda _c) = x_{n,c}\) eligiendo los voltajes de CC (sesgos) que inducen cambios de fase separados por \(\pi\), implicando \ (\phi _{\mathrm {DC},1} = \phi _\mathrm {DC} - \pi\) y \(\phi _{\mathrm {DC},2} = \phi _\mathrm {DC }\). Suponiendo que la variación de fase inducida por la modulación no contribuye significativamente a la dependencia general de la longitud de onda, la función de transferencia MZM puede aproximarse mediante

Para los modos de operación #3 y #4, la función de transferencia MZM se centrará en un cierto \(\lambda _c\), es decir, se optimizará para entregar la entrada objetivo \(x_{n,c}\) en el canal dado al hacer cumplir \(\Delta \phi (V_\mathrm {RF}, \lambda _c) = \arcsin x_{n,c}\) y estableciendo el argumento de la función exponencial en la ecuación. (5) a un múltiplo de \(2\pi\). Para cualquier otro canal m, el valor impreso \(x_{n,m,c}\) se desviará del objetivo. Siguiendo el análisis detallado de la operación del modulador de entrada proporcionado en la Sección 5 del documento complementario, basándose en la expansión de Taylor de orden 1\(\mathrm{{st}}\) de las fases \(\phi _0 (\lambda )\) y \(\phi _\mathrm {DC} (\lambda )\) alrededor de \(\lambda _c\), encontramos que el m-ésimo canal del enésimo axón lleva el valor de entrada dado por

donde \(p_x = n_0(\lambda _c) L/\lambda _c\) y \(q_x = n(V_\mathrm {DC},\lambda _c) L_\mathrm {DC}/\lambda _c\) representan longitudes normalizadas de desfasadores de RF y CC dentro del MZM y están restringidas a \(p_x, q_x \in {\mathbb {N}}\), \(n_\mathrm {g}\) es el índice de refracción del grupo, y \ (\Delta \lambda _1 = \lambda _{m+1} - \lambda _m\) denota el espaciado entre canales (asumiendo canales equidistantes). El parámetro \(\xi _{m,c}^{(x)}\) representa el cambio de fase acumulado por el canal m y revela cuatro hechos importantes: (i) no depende del objetivo \(x_{n,c} \) valor que implica que la acumulación de fases no varía con la secuencia de entrada; (ii) no depende del índice de axón n, lo que implica que todos los axones introducen la misma cantidad de acumulación de fase que puede compensarse fuera de la OLAU en lugar de dentro de la propia OLAU; (iii) depende de la diferencia entre myc, lo que implica que todos los canales laterales del mismo orden tienen la misma acumulación de fase cuya magnitud aumenta con \(|mc|\); (iv) aumenta con el espaciado entre canales \(\Delta \lambda _1\).

Para implementar los pesos \(w_{n,c}\) se puede utilizar una combinación de MZM y un PS independiente. Dependiendo de la aplicación específica, la modulación de amplitud se puede lograr mediante el control de la absorción4,8,23 o empleando módulos interferométricos9,10,22 utilizando PS T/O o E/O. Alineándonos con la mayoría de los diseños coherentes de última generación que apuntan a la inferencia y, por lo tanto, permiten velocidades de reconfiguración lentas, elegimos PS térmicamente controlados tanto dentro de los brazos de MZM como en el PS que sigue. Aquí observamos que la cointegración de los moduladores E/O (entrada) y T/O (peso) requiere una planificación cuidadosa para evitar la diafonía térmica, pero se ha convertido en un proceso bien establecido durante los últimos años, con importantes demostraciones en chip. de estructuras cointegradas E/O y T/O tanto en los campos de los transceptores basados ​​en silicio25, como en la fotónica neuromórfica22,23. Si es necesario, se puede emplear adicionalmente la adopción de zanjas aislantes térmicamente y/o derivaciones térmicas26,27 o enfoques más elaborados, como la descomposición térmica en modo propio28, para garantizar el funcionamiento confiable de ambos tipos de dispositivos en diversas plataformas PIC, incluidas las de Si e InP. A diferencia de E/O MZM, T/O MZM no se puede operar en configuración push-pull; en cambio, se puede hacer asimétrico cambiando la longitud de la(s) guía(s) de onda en uno o ambos brazos para lograr una diferencia de fase incorporada de \(2 \theta\) a la temperatura nominal \(T_0\) y \(\lambda _c\), o, en otras palabras, estará sesgado en el punto \(2\theta\). En cualquier momento, solo se utiliza un PS para ajustar la magnitud del peso dependiendo de la relación de \(|w_{n,c}|\) y \(\cos \theta\). Esto se refleja en la función de transferencia de campo eléctrico del sistema MZM-PS.

donde \(\phi (T_0, \lambda ) = 2\pi n (T_0, \lambda ) L/\lambda\) es la fase acumulada en MZM en \(T_0\), \(\Delta \phi (\Delta T, \lambda ) = 2\pi \Delta n (\Delta T, \lambda ) L/\lambda\) es el cambio de fase debido a la temperatura diferencial aplicada \(\Delta T\), y \(\phi _3 ( T, \lambda ) = 2\pi n (T, \lambda ) L_3/\lambda\) es la fase acumulada en el PS independiente. De manera similar al caso de la entrada MZM, podemos ignorar la contribución de la variación \(\Delta \phi\) con la longitud de onda y aproximar la función de transferencia MZM-PS mediante

teniendo en cuenta que estará centrado en \(\lambda _c\) dando como resultado \(t_\mathrm {MZM-PS} ( \lambda _c ) = w_{n,c}\), implicando también \(\phi (T_0) , \lambda _c) = 2 p_w \pi\) y

donde \(p_w, p_s \in {\mathbb {N}}\). Para cualquier canal \(m \ne c\), restringiéndose a la aproximación de primer orden y suponiendo \(p_w, p_s \gg 1\) que se espera en todos los casos de interés práctico, siguiendo la derivación detallada dada en la Sección 6 de Documento complementario, encontramos que el canal m del enésimo axón lleva el peso

donde \(p_w = n(T_0,\lambda _c) L/\lambda _c\) y \(p_s = n(T_0,\lambda _c) L_3/\lambda _c\) representan longitudes normalizadas de los PS dentro de la MZM y el PS independiente, respectivamente, siendo L y \(L_3\) sus longitudes. Las mismas conclusiones enumeradas anteriormente para \(\xi _{m,c}^{(x)}\) son válidas para \(\xi _{m,c}^{(w)}\).

Para la multiplexación y demultiplexación de señales se utilizan rejillas de guía de onda en matriz (AWG), con una respuesta espectral plana por canal sobre la banda de frecuencia de interés. Suponemos que la función de transferencia de potencia del AWG está dada como una parábola en dominio logarítmico, simétrica y centrada en la longitud de onda del canal, y que introduce pérdidas globales insignificantes. En el dominio lineal, la función de transferencia corresponde a la forma del campo lejano, es decir, una función gaussiana versus la longitud de onda29. La diafonía del AWG, definida como la relación de potencias del primer canal suprimido y el canal de paso, se denota como \(r_\mathrm {AWG}\) en términos lineales, o \(R_\mathrm {AWG}\) en dominio logarítmico (dB). En lo que sigue, asumimos una pérdida de inserción (IL) cero y nos restringimos a la aproximación de orden 1\(\mathrm{{st}}\) donde se supone que la diafonía es relevante solo entre canales adyacentes. También asumimos que la curvatura de la región de propagación libre de salida del AWG coincide con la curvatura del campo gaussiano (su línea equifase en el plano transversal), lo que produce una diferencia de fase cero entre guías de ondas de salida adyacentes.

Al pasar por el DEMUX, el canal m se distribuirá no solo al mésimo puerto de salida, sino también a los puertos \((m \pm 1)\), estando la relación de potencias determinada por \(r_\mathrm {AWG} \). Esto hará que el canal m en las guías de ondas adyacentes sea modulado por la entrada o el peso dirigido a los canales \((m \pm 1)\). Posteriormente, cuando MUX las recoja, seguirá el proceso inverso, que reunirá todas las señales en la salida, lo que dará lugar a la mezcla de entradas o pesos pertenecientes a los tres caminos adyacentes, con los coeficientes adecuados. Siguiendo la derivación detallada dada en la Sección 7 del Documento complementario, encontramos que el valor real impreso de la entrada en los modos de operación #1 y #2 se desvía del objetivo como

bajo la restricción \(x_{n,0} = x_{n,M+1} = 0\) y con el mismo formalismo aplicado a los pesos en los modos #1 y #3, y a los sesgos en todos los modos de operación. A diferencia de la desviación resultante del uso de un único modulador para múltiples canales, que puede compensarse hasta cierto punto, la diafonía que se origina en el AWG no puede contrarrestarse fácilmente fuera de la OLAU ya que depende de su patrón y, en consecuencia, depende tanto del índice como del índice. del axón n e índice del canal m.

Habiendo identificado el comportamiento dependiente de la longitud de onda de los componentes constituyentes de PPNN, su matriz de transferencia diagonal experimental, \(Q_\mathrm {e}\), se puede derivar en función de la configuración de PPNN para diferentes modos de operación, según las Tablas 1 y 2. siguiendo la ruta de la señal en la Fig. 1e, basándose en la ecuación. (12) para modelar la respuesta AWG, y las Ecs. (5) y (8) para funciones de transferencia de modulador de peso y entrada no aproximadas. Similar al caso de \(Q_\mathrm {t}\) en la ecuación. (2a), ignoramos el cambio de fase acumulado en \(Q_\mathrm {e}\) y restringimos nuestro enfoque solo a la diferencia de fase entre la rama de polarización y el OLAU y entre los axones en el propio OLAU, ya que estos conducen a potencial deterioro del rendimiento debido al deterioro de las condiciones de interferencia. Para realizar la alineación de fase entre la rama de polarización y el OLAU en modos de operación que suponen el uso de un único modulador para aplicar entradas o pesos a múltiples canales (modo n.° 3 para entradas y n.° 2 para pesos), modificamos la transferencia de la rama de polarización. matriz de \({\widetilde{W}}_\mathrm {b}\) a \({\widetilde{W}}_\mathrm {b} \Xi _c^{(w)}\) en modo #2 o \({\widetilde{W}}_\mathrm {b} \Xi _c^{(x)}\) en el modo #3, donde

con \(\xi _{m,c}^{(x)}\) y \(\xi _{m,c}^{(w)}\) definidos por las ecuaciones. (7b) y (11b), respectivamente. De esta manera, la acumulación de fase selectiva del canal que se origina en las Ecs. (7a) y (11a) se cancela, como se detalla en la Sección 8 del Documento Complementario. Cabe destacar que \(Q_\mathrm {e}\) derivado de las Ecs. (7), (11) y (12) es aproximada y, aunque la compensación de fase se realiza a través de los PS en la rama de polarización, permanecerá cierta desviación de \(Q_\mathrm {t}\). En el próximo análisis, estos se cuantificarán mediante el error absoluto, \(\Delta q_m = q_{\mathrm {e},m} - q_{\mathrm {t},m}\), y relativo, \(\delta q_m = |\Delta q_m|/q_{\mathrm {t},m}\), entre lo experimental, \(q_{\mathrm {e},m}\) y el objetivo, \(q_{\mathrm { t},m}\), elementos de la matriz diagonal. Los errores se pueden derivar en función de las expresiones que correlacionan \(q_{\mathrm {e},m}\) y \(q_{\mathrm {t},m}\) en la Sección 8 del Documento complementario.

Para nuestro caso de estudio, asumimos una plataforma de silicio, con un índice de refracción que depende de la longitud de onda a diferentes temperaturas tomado de 30. En \(\lambda _c = 1.55 \, \mu \mathrm {m}\) y \(T_0 = 293 \, \mathrm {K}\) tenemos \(n = 3.4757\) y \(n_\mathrm { g} = 3,5997\). En el caso de los moduladores E/O, a menos que el dopaje sea severo y/o se utilicen materiales compuestos, las propiedades ópticas del silicio no dopado (donde la mayor parte de la luz está confinada) siguen siendo las mismas que antes, mientras que la dependencia del índice de refracción del Se supone que el voltaje es aproximadamente lineal para los rangos de voltaje de interés.

Usando el método Monte-Carlo, observamos \(10^4\) conjuntos de valores de entrada y peso aleatorios, distribuidos uniformemente, elegidos en el dominio \(x_{n,m} \in [0,1]\) y \( w_{n,m} \in [-1,1]\) y mantenga el sesgo fijo en \({\widetilde{w}}_{\mathrm {b},m} = 1\) para garantizar que la información sobre el signo de la suma se conserva al pasar al dominio de potencias. Cuando se emplea PPNN en un entorno entrenado, el peso del sesgo puede tomar cualquier valor de \({\widetilde{w}}_{\mathrm {b},m} \in [-1,1]\) impuesto por el algoritmo de entrenamiento. Después de la simulación, los elementos diagonales de la matriz \(q_{\mathrm {t},m}\) y \(q_{\mathrm {e},m}\) se agregan y se analizan diagramas de dispersión 2-D utilizando un enfoque estadístico multivariado. para determinar las desviaciones en términos de error absoluto y relativo.

Comparación entre el modo convolucional (#2, lado izquierdo) y completamente conectado (#3, lado derecho) de operación PPNN con canales \(M=4\), optimizado para operación en el canal \( c=2\), y \(N=8\) axones para \(\Delta \lambda _1 = 0.8 \, \mathrm {nm}\) y \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\). Gráficos de dispersión 2-D codificados por colores por canal del elemento de matriz objetivo \(q_{\mathrm {t},m}\) y (a), (b) la magnitud y (c), (d) el argumento de el elemento de la matriz experimental \(|q_{\mathrm {e},m}|\) y (e), (f) la magnitud algebraica de la desviación absoluta del elemento de la matriz experimental respecto del objetivo, \(\mathrm {sign} ( {\mathfrak {R}}{\mathfrak {e}} \{ \Delta q_m \} ) |\Delta q_m|\), con \(\Delta q_m = q_{\mathrm {e},m} - q_ {\mathrm {t},m}\), todos con gráficos de densidad de probabilidad kernel univariados mostrados en los ejes horizontal y vertical correspondientes de los diagramas de dispersión.

La Figura 4 muestra diagramas de dispersión 2-D para dos modos diferentes de operación, convolucional (lado izquierdo) y FC (lado derecho), para el punto de polarización T/O MZM \(\theta = \pi /3\ ), longitudes normalizadas \(p_x = q_x = 100\) y \(p_w = p_s = 50\), espaciado nominal entre canales \(\Delta \lambda _1 = 0.8 \, \mathrm {nm}\), traduciéndose a aproximadamente \ (100 \, \mathrm {GHz}\) en el dominio de la frecuencia, y \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\). La alineación de fase entre la rama de polarización y la salida de OLAU se ha realizado siguiendo la ecuación. (13).

En términos de magnitud del elemento de la matriz experimental, \(|q_{\mathrm {e},m}|\), versus el elemento de la matriz objetivo, \(q_{\mathrm {t},m}\), ambos modos de operación muestran un rendimiento similar, como lo confirman las Fig. 4a, b, cuando se optimizan para el mismo canal, \(c = 2\), de \(M=4\) canales codificados por colores en el PPNN cuando se usa un solo modulador se utiliza, u optimizado para m si se utiliza un modulador por canal. El coeficiente de correlación de rango de Spearman \(\rho\) en ambos casos dados en la Fig. 4a, b excede 0,999 para los 4 canales observados, lo que indica una relación monótona casi perfecta entre las dos cantidades. Las funciones de densidad de probabilidad (PDF) univariadas de \(q_{\mathrm {t},m}\) y \(|q_{\mathrm {e},m}|\) conservan la forma gaussiana, cumpliendo con el teorema del límite central (CLT). Sin embargo, se puede observar una ligera reducción en las medias de las PDF de los canales de borde (\(m=1\) y \(m=4\)), o, en otras palabras, una reducción en el valor medio del elemento de la matriz experimental. en comparación con el objetivo. El cambio descendente implica que los canales de borde encuentran una mayor pérdida de potencia que los internos durante la propagación a través de PPNN, lo que puede atribuirse a los pares DEMUX/MUX que abrazan los moduladores en los bancos de entrada y peso. Es decir, a medida que el canal de borde se demultiplexa, la fracción de su potencia óptica que es proporcional a la intensidad de la diafonía (\(r_\mathrm {AWG}\)) y se envía a un canal adyacente no compatible con PPNN (canal 0 para \ (m=1\) y el canal \(M+1\) para \(m = M\)) se pierde irreversiblemente durante el paso de demultiplexación. Este efecto no se observa en los canales internos, ya que distribuyen sus señales de diafonía a los canales adyacentes que son compatibles con PPNN y luego pueden ser recopiladas por MUX, como se describe en la Sección 7 del Documento complementario. Esta penalización por pérdida del canal de borde es capturada por \(x_{n,0} = x_{n,M+1} = 0\) y \(w_{n,0} = w_{n,M+1} = 0 \) en la ecuación. (12) y su contraparte para \(w_{n,m}^\mathrm {AWG}\).

Los diagramas de dispersión del argumento de \(q_{\mathrm {e},m}\) versus \(q_{\mathrm {t},m}\), dado en la Fig. 4c, d, revelan que la alineación de fase basada en la expresión aproximada dada por las Ecs. (7b) y (11b) producen excelentes resultados, llevando los cambios de fase residuales por debajo de \(0.01\pi \, \mathrm {rad}\). La distribución de \(\mathrm {arg}(q_{\mathrm {e},m})\) se aproxima bien mediante gaussiano debido a CLT y depende en cierta medida del elemento de matriz objetivo \(q_{\mathrm { t},m}\) valor. También se puede observar que los canales de borde (\(m=1\) y \(m=4\)) sufren un desplazamiento de las PDF como fue el caso con las PDF que describen la magnitud de \(q_{\mathrm { e},m}\), que surgen de cambios de fase no simétricos vistos por el canal 1\(\mathrm{{st}}\) y \(M\mathrm{{th}}\). Esta vez, sin embargo, el desplazamiento de la media es de diferente signo: positivo para el canal 1\(\mathrm{{st}}\) y negativo para el canal \(M\mathrm{{th}}\). En ambos casos, el cambio se origina por la diafonía en la rama de polarización, donde se realiza la compensación de fase. Observando la contraparte de sesgo de (12), el término de diafonía es proporcional a \(r_\mathrm {AWG} ( {\widetilde{w}}_{\mathrm {b},m-1} - 2 {\widetilde{ w}}_{\mathrm {b},m} + {\widetilde{w}}_{\mathrm {b},m+1} )\), y, teniendo \({\widetilde{w}}_ {\mathrm {b},m} = 1\) para todos los canales admitidos \(m \in [1,M]\), debería ser 0. Sin embargo, cuando \(m = 1\) o \(m = M\), las señales no están contrapesadas ya que \({\widetilde{w}}_{\mathrm {b},0} = {\widetilde{w}}_{\mathrm {b},M+1} = 0\), dejando un término de diafonía residual proporcional a \(-r_\mathrm {AWG}\), que se multiplica por \(\Xi _c^{(x)}\) o \(\Xi _c^{(w )}\) dependiendo del modo de operación, según se detalla en el Apartado 8 del Documento Complementario. Por otro lado, los elementos de \(\Xi _c^{(x/w)}\) dependen de la diferencia entre el canal observado m y el canal con respecto al cual estaba centrado el modulador, c, como (7b) y (11b) mostrar. Esto conduce a cambios de fase de diferentes signos para el canal 1\(\mathrm{{st}}\) y \(M\mathrm{{st}}\), ya que la elección típica es \(c = \lceil M /2 \rceil\). Independientemente del cambio de medias, las desviaciones estándar de las FDP cuasi-gaussianas correspondientes siguen siendo similares a las de los canales internos (\(m = 2\) y \(m = 3\)).

Finalmente, en la Fig. 4e, f, observamos la magnitud algebraica del error absoluto entre los elementos de la matriz de transferencia experimental y objetivo, \(\mathrm {sign}( {\mathfrak {R}}{\mathfrak {e}} \{ \Delta q_m \} ) |\Delta q_m|\). El efecto de la deriva media para los canales de borde, observado en la Fig. 4a, b, ahora se puede cuantificar y, para todos los casos analizados, se mantiene por debajo de \(|\Delta q_m| < 0,06\), lo que produce el error relativo máximo del orden de \(4 \%\) para canales de borde. En el caso de canales internos, el error se centra en la proximidad de 0 y, para un dado \(\Delta \lambda _1\) y \(R_\mathrm {AWG}\) permanece por debajo de \(2 \%\) en \(> 90\%\) de los conjuntos aleatorios analizados.

Extendemos nuestro análisis a todos los modos multicanal de operación PPNN de acuerdo con la Tabla 1 para \(\Delta \lambda _1\) de 0,4 a \(1,6 \, \mathrm {nm}\) (lo que se traduce en un espaciado de cuadrícula de 50–\( 200 \, \mathrm {GHz}\)) y \(R_\mathrm {AWG}\) de \(-\,40\) a \(-\,5 \, \mathrm {dB}\), lo que representa \(M=8\) canales centrados en \(c = 4\) cuando se utiliza un único modulador para todos los canales, y en m en caso contrario, con el objetivo de determinar la influencia de varios parámetros del sistema en el error relativo del elemento de la matriz, \(\delta q_m\). La Figura 5 muestra los valores medios de los errores relativos sobre la colección de \(10^4\) muestras analizadas, junto con límites de confianza del 5 al 95 % frente a \(\Delta \lambda _1\) para la diafonía AWG de \(-15 \, \mathrm {dB}\) y frente a \(R_\mathrm {AWG}\) para un espaciado entre canales de \(0,8 \, \mathrm {nm}\). Como se observa en los diagramas de dispersión de la Fig. 4, confirmamos nuevamente con base en la Fig. 5 que los canales de borde (\(m=1\) y \(m=8\)) introducen una cantidad similar de error (las líneas se superponen), que es mayor que el error encontrado por los canales internos (\(2 \le m \le 7\)), que también se superponen entre sí. La causa subyacente está relacionada con la asimetría en la magnitud del campo y los cambios de fase acumulados por los canales de borde al pasar por AWG, como se explicó anteriormente. La conclusión importante que surge de esta superposición es que el número de canales M empleados no plantea un desafío para ninguno de los modos de operación PPNN, siempre que la compensación de fase se realice dentro de la rama de polarización que sigue a la ecuación. (13).

Errores relativos medios del elemento de la matriz \(\delta q_m\) (dados en porcentaje) con límites de confianza de \(5 \%\) a \(95 \%\) para (a), (b) multineurona, ( c), (d) convolucional y (e), (f) modo de operación FC, dependiendo de (a), (c), (e) espaciado de canales para \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\) y (b), (d), (f) diafonía AWG para \(\Delta \lambda _1 = 0,8 \, \mathrm {nm}\).

La comparación de diferentes modos de operación en la Fig. 5 revela que el error relativo medio, ya sea mayor para los canales de borde o menor para los internos, sigue siendo bastante similar para diferentes modos de operación (excluyendo los muy altos \(R_\mathrm {AWG} \)), teniendo una dependencia más débil de \(\Delta \lambda _1\) que de \(R_\mathrm {AWG}\). Para \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\) no excede \(4 \%\) para cualquier \(\Delta \lambda _1\) analizado), sin embargo, como la diafonía aumenta, el error medio se dispara exponencialmente, superando \(10 \%\) para los canales de borde en \(R_\mathrm {AWG} = -10 \, \mathrm {dB}\) y permaneciendo dentro de valores manejables de hasta \(6\%\) para los internos incluso en \(R_\mathrm {AWG} = -5 \, \mathrm {dB}\). Por otro lado, existe una diferencia significativa en el intervalo de confianza entre los modos de operación: es más amplio para el modo de operación multineurona, indicado en la Fig. 5a, b, y se reduce para los modos convolucional y FC, indicados en Fig. 5c-f, lo que implica que, aunque no es común, pueden ocurrir grandes errores en casos de múltiples neuronas. Se puede ver la misma evolución del intervalo de confianza con respecto a la diafonía AWG, Fig. 5b, d, f, lo que revela que tener más etapas DE/MUX en el modo #1 en comparación con los 2 modos de operación restantes es en realidad responsable de su considerable dispersión. de errores, como se espera con base en la ecuación. (12).

Al observar el modo de operación convolucional, Fig. 5c, d, y FC, Fig. 5e, f, se puede observar una diferencia en los intervalos de confianza y, hasta cierto punto, en el error relativo medio para los canales internos, lo que indica que el modo convolucional de operación parece exhibir un mejor rendimiento general. Sin embargo, desde el punto de vista arquitectónico, las Figs. 1, 2 y 3, los dos son casi intercambiables. Al mismo tiempo, nuestro análisis muestra que las longitudes normalizadas de los moduladores \(p_x\), \(q_x\), \(p_w\) y \(p_s\) juegan un papel marginal en las medias de error relativas y los intervalos de confianza, como se esperaba. teniendo en cuenta que la fase acumulada dada por las Ecs. (7b) y (11b) se compensa con los PS dentro del banco de moduladores de polarización siguiendo la ecuación. (13). La diferencia, por lo tanto, surge en respuesta a diferentes dominios de entradas y ponderaciones, es decir, las cantidades impuestas conjuntamente a todos los canales y las impuestas por canal. Repitiendo el análisis de la Fig. 5 para pesos restringidos al mismo dominio que las entradas, es decir \(w_{n,m} \in [0,1]\), se confirma que los intervalos de confianza se reducen ligeramente para ambos modos de operación y, más importante aún, se vuelven similares en magnitud. Esto se puede explicar reduciendo la magnitud de la diafonía en el banco de moduladores de peso en el modo de operación FC al dividir a la mitad el rango de valores que \(w_{n, m \pm 1}\) puede tomar en el equivalente de la ecuación. (12) para \(w_{n,m}^\mathrm {AWG}\).

Error relativo Intervalo de confianza del 5 al 95 % (dado en %) frente al abanico de neuronas N en \(\Delta \lambda _1 = 0,8 \, \mathrm {nm}\) y \(R_\mathrm {AWG} = - 15 \, \mathrm {dB}\) para (a) modo convolucional y (b) completamente conectado.

El estudio del rendimiento de PPNN en fan-in se llevó a cabo para N en un rango de 2 a 64 y se informa en la Fig. 6 para configuración convolucional y FC. Se puede observar una tendencia clara para ambos modos de operación donde el intervalo de confianza se reduce con el aumento de N, lo que surge del estrechamiento de la PDF univariada tanto de \(q_{\mathrm {t},m}\) como de \(|q_ {\mathrm {e},m}|\), cumpliendo con CLT, por lo que la desviación estándar disminuye con \(1/\sqrt{N}\). Los valores del error relativo medio siguen siendo similares a los de la Fig. 5 en diferentes valores de N, lo que implica que, al igual que otros parámetros analizados, el número de axones no plantea un desafío para el funcionamiento de PPNN.

Aquí analizamos los aspectos prácticos de la implementación de PPNN, centrándonos en las pérdidas de inserción (\(\mathrm {IL}_\mathrm {PPNN}\)), el consumo de energía (\(P_{\mathrm {PPNN},m}\)) , huella (\(A_{\mathrm {PPNN},m}\)) y rendimiento (\(T_{\mathrm {PPNN},m}\)), que configuran conjuntamente la eficiencia energética y la huella, definida como la relación del rendimiento y el consumo de energía o el área PPNN, respectivamente. Reconocemos las penalizaciones introducidas por el empleo subóptimo de recursos, como apagar algunos de los LD o mantener algunos de los axones oscuros, es decir, usar menos canales (\(M_A \le M\)) o menos axones (\(N_A \le N\)) de lo que admite PPNN. Según el estudio detallado informado en la Sección 9 del documento complementario, encontramos los valores respectivos por número de canales activos para etapas de división y combinación de potencia de 2.

donde \(\mathrm {IL}_i\), \(L_i\) y \(P_i\) denotan pérdidas de inserción por dispositivo, longitud y consumo de energía, con la excepción de \(P_\mathrm {LD}\) que representa la potencia óptica del LD por canal. Los índices \(i\in \mathrm {\{MUX,S,C,X,W,R\}}\) se refieren, en el orden indicado, a DE/MUX, interruptor, acoplador X, modulador de amplitud de entrada, peso modulador de amplitud y fase y guías de ondas de enrutamiento. Además, \(\eta _\mathrm {wp}\) es la eficiencia de conexión a la pared del LD, \(L_\mathrm {A}\) es la longitud total de un axón, \(L_\Delta\) distancia entre guías de ondas laterales, \(B_\mathrm {X}\) es la velocidad de datos del modulador de entrada, y \(\mathrm {S}_\mathrm {\{X,W,O\}}\) son los estados del interruptor definido en la Tabla 1 dependiendo del modo de operación.

Los primeros dos términos de \(\mathrm {IL}_\mathrm {PPNN}\) en (14a) denotan la penalización introducida por la operación multicanal (\(\sim \mathrm {IL}_\mathrm {MUX}\)) y programabilidad (\(\sim \mathrm {IL}_\mathrm {S}\)), mientras que el último término denota la penalización en forma de potencia óptica perdida irreversiblemente cuando se utilizan \(N_A < N\) axones. No se observa ninguna penalización de IL cuando se emplean canales \(M_A < M\).

El consumo de energía PPNN por canal, dado por (14b), está gobernado por todos sus componentes activos, los cuales, a su vez, se encienden en función de los estados de los interruptores y modos de operación. El consumo de energía del amplificador de transimpedancia (TIA) y el controlador de temperatura (TEC) opcionales se excluyen del análisis, ya que contribuirían al consumo de energía total de manera similar, independientemente de la operación multicanal o la programabilidad de PNN. En comparación con su predecesora, la neurona lineal coherente dual-IQ21, el consumo de energía de PPNN en los modos #1 y #4 es similar al de dual-IQ, con una penalización menor \(\sim P_\mathrm {S}\) en PPNN caso debido a su programabilidad. Sin embargo, operar en el modo #2 (convolucional) o #3 (completamente conectado) genera ahorros de energía en el caso PPNN al compartir el modulador de peso (#2) o de entrada (#3), ya que los coeficientes ponderan \(P_\mathrm { W}\) y \(P_\mathrm {X}^\mathrm {(DC)/(RF)}\), respectivamente, se dividen por el número de canales activos, \(M_A\), lo que implica una mayor eficiencia energética del PPNN en comparación con el uso de neuronas \(M_A\) de doble IQ.

Comparando la huella PPNN por canal, dada por (14c), con la del IQ dual, podemos observar una penalización tanto longitudinal como lateral, la primera debido a DE/MUX y conmutadores que hacen que \(L_\mathrm {A}\) sea más largo. para PPNN que para dual-IQ, y este último debido a la existencia de dos rutas alternativas que una señal puede tomar dentro de los bancos de entrada y/o de peso. Centrándonos en dos escenarios de esquina, cuando (i) \(M_A = M \sim N\) y (ii) \(M_A = 1\), la penalización de la huella lateral debido a la operación multicanal y la programabilidad oscila entre factores multiplicativos de (i) \(\sim (1 + 2/N)\) (mejor escenario) a (ii) \(M (1 + 1/N) + 1 - 1/N\) (peor escenario). El segundo caso revela que el modo de operación de ahorro de energía tiene un precio de penalización de huella proporcional al número de canales para los que se diseñó PPNN.

El estudio exhaustivo sobre la dependencia de la longitud de onda de los componentes individuales podría ampliarse aún más para incorporar el funcionamiento de los dispositivos dependiente de la temperatura y las diferencias estadísticas entre los componentes empleados. La operación dependiente de la temperatura proporcionaría información útil sobre la confiabilidad del rendimiento en condiciones realistas donde se pueden encontrar temperaturas en el chip de hasta 80-100\(^\circ\)C. Un análisis ampliado en el que se tengan en cuenta las diferencias estadísticas entre los componentes empleados proporcionaría una visión más clara con respecto a sus perspectivas prácticas, ya que las plataformas fotónicas de silicio actuales no garantizan un rendimiento idéntico para dispositivos idénticos, lo que exige un análisis de tolerancia del sistema. El estudio también se puede ampliar a diferentes tipos de moduladores de entrada/peso que se rigen por diferentes ecuaciones de amplitud y fase, con el objetivo de concluir con expresiones analíticas para la compensación de la desviación.

A nivel del sistema, se pueden tomar dos direcciones de ampliación. Uno se relaciona con la interconexión de múltiples PPNN y su empleo en tareas de inferencia para estimar su precisión bajo una carga no aleatoria. El segundo se basa en el impacto positivo que tiene el aumento del número de axones en la reducción del intervalo de confianza del error relativo informado en la Fig. 6. Esto indica que la arquitectura PPNN se puede extender de manera confiable a una disposición bidimensional, similar a nuestra barra transversal fotónica recientemente propuesta31, que produce K salidas de neuronas separadas espacialmente. Impulsada por WDM, la barra transversal podría admitir un total de \(K \times M\) salidas lógicas, al mismo tiempo que ofrece flexibilidad para cambiar entre los diferentes modos de operación, acercándose al concepto fotónico FPGA.

En este manuscrito presentamos un PNN coherente reconfigurable in situ, que explota el dominio de la longitud de onda para lograr el funcionamiento paralelo de múltiples neuronas con un gráfico de interconexión flexible y definido por el usuario, que admite cuatro modos distintos de funcionamiento, entre otros, una capa convolucional y totalmente conectada. Llevamos a cabo un estudio analítico detallado de la dependencia de la longitud de onda del modulador y DE/MUX, ofreciendo un enfoque simple para restaurar la fidelidad del PNN a través del alineamiento de fase de la señal de polarización, revelando que la mayoría de los errores residuales provienen de la diafonía en DE/MUX. etapas. El enfoque analítico se compara con la simulación Monte-Carlo y muestra que el error relativo residual generalmente permanece dentro del rango manejable del 2% para una diafonía AWG de hasta \(-20 \, \mathrm {dB}\). Más importante aún, el rendimiento de PNN no se degrada con el aumento del número de canales o el fan-in de neuronas, siempre y cuando se lleve a cabo la alineación de fase en la rama de polarización, lo que admite una mejora continua de la red, incluida la extensión a disposiciones de múltiples columnas para vectores. -multiplicación por matriz. La dependencia relativa del error en el espaciado de canales es débil, lo que permite que el PNN funcione igualmente bien en sistemas WDM gruesos y densos.

Los conjuntos de datos generados y/o analizados durante el estudio actual están disponibles del autor correspondiente a solicitud razonable.

Kitayama, K.-I. et al. Nueva frontera de la fotónica para el procesamiento de datos: acelerador fotónico. Fotónica APL https://doi.org/10.1063/1.5108912 (2019).

Artículo de Google Scholar

De Marinis, L., Cococcioni, M., Castoldi, P. y Andriolli, N. Redes neuronales fotónicas: un estudio. Acceso IEEE 7, 175827–175841. https://doi.org/10.1109/ACCESS.2019.2957245 (2019).

Artículo de Google Scholar

Shastri, BJ y cols. Fotónica para inteligencia artificial y computación neuromórfica. Nat. Fotónica 15, 102-114. https://doi.org/10.1038/s41566-020-00754-y (2021).

Artículo ADS CAS Google Scholar

Feldmann, J. y col. Procesamiento convolucional paralelo utilizando un núcleo tensor fotónico integrado. Naturaleza 589, 52–58. https://doi.org/10.1038/s41586-020-03070-1 (2021).

Artículo ADS CAS PubMed Google Scholar

Porte, X. y col. Una red neuronal fotónica completa, paralela y autónoma en un láser semiconductor multimodo. J. Física. Fotónica. https://doi.org/10.1088/2515-7647/abf6bd (2021).

Artículo de Google Scholar

Totović, AR, Dabos, G., Passalis, N., Tefas, A. & Pleros, N. Femtojoule per MAC fotónica neuromórfica: una hoja de ruta de energía y tecnología. IEEE J. Sel. Arriba. Electrón cuántico. 26, 1-15. https://doi.org/10.1109/JSTQE.2020.2975579 (2020).

Artículo de Google Scholar

Nahmias, MA y cols. Operaciones fotónicas de acumulación múltiple para redes neuronales. IEEE J. Sel. Arriba. Electrón cuántico. 26, 1–18. https://doi.org/10.1109/JSTQE.2019.2941485 (2020).

Artículo de Google Scholar

Miscuglio, M. & Sorger, VJ Núcleos tensores fotónicos para aprendizaje automático. Aplica. Física. Rev.https://doi.org/10.1063/5.0001942 (2020).

Artículo de Google Scholar

Zhang, H. y col. Un chip neuronal óptico para implementar redes neuronales de valores complejos. Nat. Comunitario. 12, 457. https://doi.org/10.1038/s41467-020-20719-7 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Shen, Y. et al. Aprendizaje profundo con circuitos nanofotónicos coherentes. Nat. Fotónica 11, 441–446. https://doi.org/10.1038/nphoton.2017.93 (2017).

Artículo ADS CAS Google Scholar

Gu, J. y col. Avances recientes en redes neuronales convolucionales. Reconocimiento de patrones. 77, 354–377. https://doi.org/10.1016/j.patcog.2017.10.013 (2018).

ADS del artículo Google Scholar

Leijnen, S. & Veen, FV El zoológico de redes neuronales. Actashttps://doi.org/10.3390/proceedings2020047009 (2020).

Artículo de Google Scholar

Shawahna, A., Sait, SM y El-Maleh, A. Aceleradores de redes de aprendizaje profundo basados ​​en FPGA para aprendizaje y clasificación: una revisión. Acceso IEEE 7, 7823–7859. https://doi.org/10.1109/ACCESS.2018.2890150 (2019).

Artículo de Google Scholar

Bogaerts, W. y col. Circuitos fotónicos programables. Naturaleza 586, 207–216. https://doi.org/10.1038/s41586-020-2764-0 (2020).

Artículo ADS CAS PubMed Google Scholar

Pai, S. y col. Programación paralela de una red fotónica feedforward arbitraria. IEEE J. Sel. Arriba. Electrón cuántico. 26, 1-13. https://doi.org/10.1109/JSTQE.2020.2997849 (2020).

Artículo de Google Scholar

Huang, C. y col. Procesador de señales ópticas no lineales programables en chip y sus aplicaciones. IEEE J. Sel. Arriba. Electrón cuántico. 27, 1-11. https://doi.org/10.1109/JSTQE.2020.2998073 (2021).

Artículo CAS Google Scholar

Bogaerts, W. & Rahim, A. Fotónica programable: una oportunidad para un ecosistema PIC accesible de gran volumen. IEEE J. Sel. Arriba. Electrón cuántico. 26, 1-17. https://doi.org/10.1109/JSTQE.2020.2982980 (2020).

Artículo de Google Scholar

Fard, MMP y cols. Realización experimental de funciones de activación arbitrarias para redes neuronales ópticas. Optar. Expreso 28, 12138–12148. https://doi.org/10.1364/OE.391473 (2020).

Artículo ADS CAS Google Scholar

Crnjanski, J., Krstić, M., Totović, A., Pleros, N. & Gvozdić, D. Funciones adaptativas de activación sigmoidea y PReLU para perceptrones totalmente ópticos. Optar. Letón. 46, 2003-2006. https://doi.org/10.1364/OL.422930 (2021).

Artículo ADS PubMed Google Scholar

Xu, X. y col. 11 mejores aceleradores convolucionales fotónicos para redes neuronales ópticas. Naturaleza 589, 44–51. https://doi.org/10.1038/s41586-020-03063-0 (2021).

Artículo ADS CAS PubMed Google Scholar

Mourgias-Alexandris, G. et al. Fotónica neuromórfica con neuronas lineales coherentes que utilizan células de modulación de coeficiente intelectual dual. J. Tecnología Lightwave. 38, 811–819. https://doi.org/10.1109/JLT.2019.2949133 (2020).

Artículo ADS CAS Google Scholar

Mourgias-Alexandris, G. et al. Una neurona fotónica coherente de silicio con una velocidad de línea de procesamiento de 10 GMAC/s. En Proc. Conferencia de comunicación por fibra óptica (OFC) 2021., Tu5H.1 (Conferencia virtual, 2021).

Giamougiannis, G. et al. Neuronas coherentes integradas en silicio con velocidades de línea de cálculo de 32 GMAC/seg/axón utilizando células de ponderación y entrada basadas en EAM. En Proc. Conferencia Europea sobre Comunicación Óptica (ECOC) 2021. (Burdeos, Francia, 2021).

Passalis, N. y col. Entrenamiento de redes fotónicas recurrentes resistentes al ruido para el análisis de series temporales financieras. En 2020, 28.ª Conferencia europea sobre procesamiento de señales (EUSIPCO), 1556–1560, https://doi.org/10.23919/Eusipco47968.2020.9287649 (2021).

Pitris, S. y col. Transmisor fotónico de silicio de 400 Gb/s y tecnologías WDM de enrutamiento para interconexiones de chip a chip de 8 zócalos sin pegamento. J. Tecnología Lightwave. 38, 3366–3375. https://doi.org/10.1109/JLT.2020.2977369 (2020).

Artículo ADS CAS Google Scholar

Gilardi, G. y col. Zanjas profundas para la reducción de la diafonía térmica en circuitos integrados fotónicos basados ​​en InP. J. Tecnología Lightwave. 32, 4864–4870. https://doi.org/10.1109/JLT.2014.2366781 (2014).

Artículo CAS Google Scholar

Krochin-Yepez, P.-A., Scholz, U. & Zimmermann, A. Medidas compatibles con Cmos para la gestión térmica de sistemas fotónicos de silicio sensibles a la fase. Fotónica https://doi.org/10.3390/photonics7010006 (2020).

Artículo de Google Scholar

Milanizadeh, M., Aguiar, D., Melloni, A. y Morichetti, F. Cancelación de efectos de diafonía térmica en circuitos integrados fotónicos. J. Tecnología Lightwave. 37, 1325-1332. https://doi.org/10.1109/JLT.2019.2892512 (2019).

Artículo ADS CAS Google Scholar

Takahashi, H., Oda, K., Toba, H. e Inoue, Y. Características de transmisión del multiplexor de longitud de onda N × N de guía de ondas en matriz. J. Tecnología Lightwave. 13, 447–455. https://doi.org/10.1109/50.372441 (1995).

ADS del artículo Google Scholar

Li, HH Índice de refracción del silicio y el germanio y sus derivados de longitud de onda y temperatura. J. Física. Química. Árbitro. Datos 9, 561–658. https://doi.org/10.1063/1.555624 (1980).

Artículo ADS CAS Google Scholar

Giamougiannis, G. et al. Barra transversal fotónica coherente como operador lineal universal. Reseñas de láser y fotónica (2021). Enviado para publicación.

Descargar referencias

Este trabajo de investigación fue parcialmente apoyado por la Fundación Helénica para la Investigación y la Innovación (HFRI) en el marco de la "Primera convocatoria de proyectos de investigación de HFRI para apoyar a los miembros de la facultad y a los investigadores y la adquisición de subvenciones para equipos de investigación de alto costo" (DeepLight, número de proyecto: 4233 ).

Departamento de Informática, Centro de Investigación e Innovación Interdisciplinarias - CIRI, Universidad Aristóteles de Tesalónica, Centro Balcánico - Edificio A, 10th Km Thessalonikis-Thermis Av, 57001, Tesalónica, Grecia

Angelina Totovic, George Giamougiannis, Apostolos Tsakyridis y Nikos Pleros

Celestial AI, 3001 Tasman Drive, Santa Clara, CA, 95054, EE. UU.

David Lazovski

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Todos los autores concibieron la idea y diseñaron el flujo de trabajo. AT llevó a cabo el análisis matemático y GG y AT implementaron el código para el análisis de rendimiento. Todos los autores contribuyeron al análisis de los resultados y coescribieron el artículo.

Correspondencia a Angelina Totovic.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Totovic, A., Giamougiannis, G., Tsakyridis, A. et al. Redes neuronales fotónicas programables que combinan WDM con óptica lineal coherente. Representante científico 12, 5605 (2022). https://doi.org/10.1038/s41598-022-09370-y

Descargar cita

Recibido: 22 de septiembre de 2021

Aceptado: 22 de marzo de 2022

Publicado: 04 de abril de 2022

DOI: https://doi.org/10.1038/s41598-022-09370-y

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.