Estimación continua de la inercia del sistema eléctrico mediante redes neuronales convolucionales.
Nature Communications volumen 14, número de artículo: 4440 (2023) Citar este artículo
1037 Accesos
5 altmétrico
Detalles de métricas
La inercia es una medida de la capacidad de un sistema eléctrico para contrarrestar las perturbaciones de frecuencia: en las redes eléctricas convencionales, la inercia es aproximadamente constante en el tiempo, lo que contribuye a la estabilidad de la red. Sin embargo, a medida que aumenta la proporción de fuentes de energía renovables, la inercia asociada a los generadores síncronos disminuye, lo que puede suponer una amenaza para la estabilidad general. Por lo tanto, estimar de manera confiable la inercia de los sistemas de energía dominados por fuentes conectadas invertidamente se ha vuelto de suma importancia. Desarrollamos un framework para la estimación continua de la inercia en un sistema de energía eléctrica, explotando técnicas de inteligencia artificial de última generación. Realizamos una investigación en profundidad basada en análisis de espectros de potencia y correlaciones de entrada-salida para explicar cómo opera la red neuronal artificial en este ámbito específico, arrojando así luz sobre las características de entrada necesarias para el entrenamiento adecuado de la red neuronal. Validamos nuestro enfoque en una red eléctrica heterogénea que comprende generadores síncronos, compensadores estáticos y generación con interfaz de convertidor: nuestros resultados resaltan cómo los diferentes dispositivos se caracterizan por huellas espectrales distintas, una característica que los operadores de sistemas de transmisión deben tener en cuenta al realizar operaciones de red en línea. análisis de estabilidad.
En los últimos años, la fracción de la capacidad de generación de energía asignada a fuentes de energía renovables ha ido creciendo a un ritmo cada vez mayor1: esto a su vez ha provocado un aumento sustancial en la proporción de fuentes de energía conectadas a la red mediante una interfaz electrónica de potencia conocida como un inversor, de ahí el nombre de recursos basados en inversores (IBR). En comparación con los generadores síncronos, que constituyen la principal fuente de energía en los sistemas eléctricos convencionales, los IBR tienen un comportamiento dinámico fundamentalmente diferente, lo que se espera que tenga implicaciones significativas para la dinámica general y la estabilidad de la red eléctrica2,3.
En general, los sistemas de energía se mantienen estables limitando las excursiones de frecuencia: una medida común de la capacidad de un sistema de energía para contrarrestar los cambios de frecuencia es su inercia, que, en los sistemas de energía convencionales, está relacionada con la energía cinética almacenada en las masas giratorias de los generadores síncronos. e inmediatamente disponible en caso de desequilibrios repentinos de energía4 (pero consulte la referencia 5 para una investigación del papel desempeñado por la amortiguación de carga del generador en el mantenimiento de una sincronización estable). Por otro lado, las fuentes de energía renovables interconectadas con IBR normalmente no proporcionan inercia a la red eléctrica. Una consecuencia del aumento de la penetración de los IBR ha sido, por tanto, una reducción de la cantidad de energía generada por las centrales eléctricas convencionales, lo que a su vez ha llevado a una disminución general de la inercia junto con un aumento de su variabilidad6: esto podría dificultar la capacidad de un sistema eléctrico para contrarrestar adecuadamente las oscilaciones de frecuencia debidas a desequilibrios de potencia activa7. Por lo tanto, además de estudiar formas de hacer que los IBR imiten la respuesta inercial de los generadores tradicionales8, recientemente se han dedicado importantes esfuerzos de investigación al desarrollo de métodos para la estimación de la inercia de un sistema de energía, algunos de los cuales se han revisado en la ref. 9. Estos pueden clasificarse a grandes rasgos en dos categorías amplias: (i) algoritmos desencadenados por una perturbación considerable (es decir, un evento significativo en el sistema eléctrico bajo estudio); (ii) métodos que utilizan las mediciones en condiciones normales de funcionamiento o se basan en la respuesta transitoria a las señales de sondeo inyectadas para estimular sin problemas el sistema de energía. Los enfoques del primer grupo analizan las medidas de frecuencia eléctrica y potencias activas tras la detección de una perturbación significativa10,11. Cuando están destinados a una estimación en línea, encontrar el instante exacto en que se produjo la perturbación es de suma importancia, ya que los errores de cálculo afectan significativamente el proceso de estimación. Además, estos algoritmos no proporcionan valores de inercia actualizados de forma continua, ya que necesitan un evento desencadenante12,13. Con respecto al segundo grupo de métodos, las técnicas que necesitan una señal de sondeo para alimentar los sistemas de energía no son prácticas para sistemas de energía grandes, y la señal perturbadora sí influye en la estimación14. Por otro lado, las metodologías que emplean mediciones ambientales necesitan ejecutar un procedimiento de identificación del sistema15,16 o depender del conocimiento de datos precisos en tiempo real17, ambas limitaciones potenciales de las técnicas. Remitimos al lector interesado a18,19 para revisiones en profundidad sobre el tema de la estimación de la inercia en sistemas de energía.
Como se explica con más detalle en los Métodos, una forma equivalente de describir las características inerciales de una red eléctrica es mediante su impulso. De hecho, la inercia de una red que comprende N generadores síncronos está dada por \(\mathop{\sum }\nolimits_{i=1}^{N}{H}_{i}{S}_{i}/\mathop {\sum }\nolimits_{i=1}^{N}{S}_{i}\), donde Hi y Si son, respectivamente, la constante de inercia y la potencia nominal aparente del i-ésimo generador: esto efectivamente coincide con la Inercia del centro de inercia (COI) de la red. El impulso, por otro lado, viene dado por \(2\mathop{\sum }\nolimits_{i=1}^{N}{H}_{i}{S}_{i}/{f}_{ n}\), donde fn es la frecuencia nominal de funcionamiento de la red. Si bien estas dos medidas transmiten el mismo tipo de información, el impulso tiene la ventaja de ser una cantidad "incremental", es decir, si se agrega un dispositivo con inercia a una red eléctrica, el impulso siempre aumentará. La inercia del COI, por otro lado, podría permanecer sin cambios si la inercia del nuevo dispositivo fuera la misma que la del COI (es decir, la inercia promedio de la red). Para poder distinguir entre estos dos escenarios –y en línea con otros trabajos en la literatura20–, a continuación utilizaremos impulso en lugar de inercia.
En este artículo, desarrollamos un marco para la estimación en línea del impulso basado en una red neuronal convolucional (CNN)21,22: Las CNN son una categoría particular de redes neuronales artificiales (ANN)23 que se han convertido en el estándar de facto para tareas de clasificación24 , particularmente en el campo de la visión por computadora25. Las entradas a la CNN son las series temporales de un conjunto de cantidades eléctricas registradas en un número reducido de autobuses de la red, mientras que la salida es el impulso de una o más zonas de la red eléctrica. Por lo tanto, nuestro objetivo es que una CNN aprenda la relación entre series temporales de variables eléctricas y los valores correspondientes de impulso. Nuestro enfoque se basa completamente en datos: en lugar de hacer suposiciones sobre el modelo subyacente de un sistema eléctrico (como se hace, por ejemplo, en las referencias 15,16,26,27,28,29), utiliza mediciones de voltaje en un número limitado de autobuses durante el funcionamiento normal aprovechando las perturbaciones continuas atribuibles a las fluctuaciones estocásticas de las cargas, es decir, del equilibrio de potencia. Además, proporciona una estimación continua y, como tal, puede utilizarse para predecir en tiempo real el impulso de un sistema eléctrico. La validación de este enfoque se realizó utilizando datos sintéticos generados mediante la simulación del conocido sistema de referencia de bus IEEE 39 modificado para modelar adecuadamente las fluctuaciones intrínsecas de las cargas de energía en la red. Al utilizar el análisis espectral de las entradas y estudiar las correlaciones de entrada-salida de las capas convolucionales, proporcionamos una explicación sistemática de cómo funciona la CNN, lo cual es crucial para indicar la cantidad y tipología de datos que deben incluirse en el conjunto de entrenamiento para alcanzar el nivel deseado de desempeño.
Modificamos el sistema de bus IEEE 3930 que se muestra en la Fig. 1 y lo utilizamos como punto de referencia para ilustrar nuestro enfoque para la estimación del impulso. La red original, un modelo simplificado del sistema eléctrico de Nueva Inglaterra, contiene 46 líneas y 10 generadores, con G1 modelando el comportamiento agregado de un gran número de generadores: esto se refleja en su potencia nominal (SG1 = 10 GVA), que es un orden de magnitud mayor que los de los otros generadores. Para agregar a la red un dispositivo capaz de proporcionar inercia pero diferente a los generadores síncronos, conectamos un compensador síncrono en la barra 8. Además, cada carga en la red es estocástica, lo que tiene como objetivo perturbar la red desde su punto de operación, exponiendo así la riqueza de su dinámica. En los Métodos se dan más detalles sobre el compensador y las cargas.
Diferentes colores resaltan las áreas en las que se subdividió la red. Las líneas discontinuas grises son líneas de transmisión que conectan áreas distintas. El área 1 contiene un compensador estático (etiquetado C) que no está presente en la red original. El área 4 contiene sólo el generador G1, barra 39 y la carga asociada.
A menos que se indique lo contrario, nos centramos en la estimación del impulso del área 1, que contiene los generadores G2 y G3 y el compensador, ya que proporciona un excelente banco de pruebas para mostrar nuestro método. Por supuesto, nuestro enfoque puede extenderse fácilmente a áreas adicionales o escenarios más complejos.
Como primer paso para comprender cómo un modelo de aprendizaje automático (ML) puede aprender a asociar la dinámica de un conjunto dado de cantidades eléctricas a valores específicos de impulso, analizamos las propiedades espectrales del voltaje en un bus de la red. Aquí presentamos resultados para el componente de eje directo del voltaje en el bus 3 (en adelante indicado como Vd,3), pero consideraciones análogas son válidas para los voltajes (directo y en cuadratura) en otros buses de la red. La Figura 2 muestra un resumen del comportamiento dinámico de Vd,3 para diferentes valores de momento del área 1, obtenido variando la constante de inercia de los generadores G2 y G3, según la grilla mostrada en la Fig. 2a. La constante de inercia del compensador conectado al bus 8 se fijó en 0,1 s para que el impacto adicional en el impulso total del área fuera insignificante. Los valores nominales de la constante de inercia de G2 y G3 son 4,33 s y 4,47 s, respectivamente: por lo tanto, decidimos abarcar un intervalo de (−1, +1) s con respecto a los valores nominales para cada uno de los dos generadores y tomamos muestras. el plano de inercia en la Fig. 2a en los puntos indicados con marcadores circulares blancos. Cada uno de estos puntos corresponde a un valor distinto del impulso del área, que oscila entre 0,17 y 0,27 GW2. Si bien el efecto de cambiar el impulso del área no es evidente en las trazas de voltaje de ejemplo que se muestran en la Fig. 2b (que están normalizadas, en todo el conjunto de datos, para tener una media cero y una desviación estándar unitaria, ver Métodos), se vuelve más evidente cuando se mira en la forma de las distribuciones de las muestras de voltaje durante tiempos de simulación más largos, como se muestra en la Fig. 2c. En efecto, las medias de las distribuciones son aproximadamente 0 para todos los valores de momento: esto es consecuencia de haber restado, al normalizar, el valor de tensión de la solución de flujo de potencia (PF), que no se ve afectada por la inercia de los generadores. La desviación estándar de las distribuciones, por otro lado, se ve afectada por los valores de inercia y aumenta con el impulso del área general, como se muestra en el recuadro de la Fig. 2c. El efecto de la variación del impulso del área es aún más evidente cuando se observan los espectros promedio de cientos de simulaciones de 60 s de duración (Fig. 2d, e). En estos paneles, los colores de las trazas indican el par correspondiente de constantes de inercia de G2 y G3, según el código de colores que se muestra en la Fig. 2a. Vemos que valores más altos de impulso (es decir, constantes de inercia más altas, ejemplificadas por las trazas naranja y amarilla) causan una contracción de las distribuciones de las muestras de voltaje y un cambio hacia frecuencias más bajas del pico de los espectros de voltaje ubicados alrededor de 1 Hz. Este mismo cambio del pico es evidente al observar los espectros en el panel e, donde las trazas rojas (azules) corresponden a niveles más altos (más bajos) de impulso del área. De hecho, como se mostrará con mayor detalle a continuación, la banda de frecuencia en el rango (0,5, 2) Hz es aquella donde los cambios en la constante de inercia de los generadores síncronos son más evidentes. Estos espectros son una huella de cómo los generadores, en un sentido amplio, aportan inercia al sistema eléctrico. La ubicación de frecuencia y el ancho de banda de estos picos de magnitud también pueden permitir la identificación de tipos de "equipos" que aportan inercia a la red, como generadores síncronos, condensadores síncronos y convertidores formadores de red. Por ejemplo, se puede ver claramente que los picos en la banda de frecuencia (4, 10) Hz en la Fig. 2d, e no cambian sustancialmente cuando se varía la inercia de G2 y G3: de hecho, estos picos están relacionados con la oscilación entre áreas. modos31 y, como se mostrará a continuación, se deben principalmente a la inercia de los compensadores síncronos.
a Valores de constante de inercia de los generadores síncronos en el área 1 y momento del área correspondiente (codificados en tonos de gris según la barra de colores de la derecha). Los marcadores circulares blancos indican todos los pares \({H}_{{G}_{2}}\) y \({H}_{{G}_{3}}\) utilizados para construir el conjunto de entrenamiento. Los marcadores circulares de colores en la diagonal corresponden a los rastros de ejemplo que se muestran en los siguientes paneles, mientras que los marcadores cuadrados azules y rojos indican valores adicionales de impulso utilizados para entrenar una CNN más simple, siendo las cruces magenta sus valores promedio (consulte el texto principal). b Ejemplo de trazas de voltaje normalizado para los seis valores del momento del área en la diagonal de la cuadrícula en a. c Distribuciones de las trazas de voltaje normalizadas que se muestran en b calculadas en varios cientos de simulaciones de 60 s de duración. Recuadro: desviación estándar de las distribuciones en función del impulso del área. d Espectros de potencia promedio de las trazas de voltaje en b. e Espectros de potencia promedio de las trazas de tensión correspondientes a los puntos indicados con marcadores cuadrados en a.
Como primera prueba de la capacidad de una CNN para estimar correctamente el impulso de un sistema eléctrico, entrenamos una red cuya tarea era diferenciar entre dos valores de impulso bien separados: razonamos que al entrenar una CNN para realizar esta tarea más simple , podríamos comprender cómo la red resuelve este problema y, en particular, qué características de la entrada son cruciales para una predicción exitosa. Los dos valores de impulso son los indicados con cruces magenta en la Fig. 2a y corresponden a los momentos promedio de los cuatro puntos de impulso bajo (alto) indicados con marcadores cuadrados azules (rojos) en el mismo panel, es decir, 0,176 GWs2 y 0,266 GW2. La razón para elegir cuatro puntos relativamente cercanos en lugar de solo uno radica en el hecho de que queríamos exponer la CNN, durante el entrenamiento, a diferentes combinaciones de constantes de inercia de los generadores G2 y G3 que conducen a valores de impulso relativamente similares, para para maximizar las capacidades de generalización de la CNN. Las constantes de inercia y los momentos correspondientes utilizados para el conjunto de entrenamiento se resumen en la Tabla S1. La Figura 3a muestra cinco trazas de voltaje normalizadas para cada una de las condiciones de momento bajo y alto (trazas verde y magenta, respectivamente), mientras que las distribuciones generales de las trazas de entrenamiento se muestran en la Fig. 3b: estas muestran una firma clara del efecto. del aumento del impulso del área en la dinámica del voltaje. Esto se ejemplifica aún más en los espectros de potencia que se muestran en la Fig. 3e: como se analizó anteriormente, las diferencias más marcadas se encuentran en el rango de frecuencia (0,5, 2) Hz. Los conjuntos de validación y prueba también estaban compuestos por ocho combinaciones diferentes de constantes de inercia cada una y se promediaron para dar momentos bajos y altos: para los conjuntos de validación y prueba, los valores de la constante de inercia para los dos generadores se compensaron en 67 ms y 133 ms. , respectivamente. En esta configuración, la CNN sólo tiene una entrada: el componente del eje directo del voltaje en el bus 3, es decir, Vd,3. Los resultados del entrenamiento se muestran en la Fig. 3: el panel c muestra la evolución de las pérdidas de entrenamiento y validación en función de la época de entrenamiento, mientras que el panel d muestra gráficos de violín de la predicción de la red en el conjunto de prueba (media absoluta error porcentual (MAPE) igual al 1,79%). Estos resultados indican que la CNN es capaz de aprender la relación entre la dinámica del voltaje y el impulso correspondiente. Se pueden obtener resultados similares entrenando una CNN usando Vq,3, es decir, el componente del eje de cuadratura del voltaje en el bus 3, como se muestra en la Fig. S2b.
Trazas de ejemplo (a) y distribuciones correspondientes (b) para los casos de momento bajo y alto (trazas verde y magenta, respectivamente). c Evolución de las pérdidas de formación y validación en función de la época de formación: no se aprecia sobreajuste. d Gráficos de violín de las predicciones de CNN en los datos del conjunto de prueba que indican una buena concordancia entre los valores objetivo y predichos. e Densidades espectrales de potencia (PSD) de las trazas de voltaje que muestran diferencias claras entre los niveles de impulso en la banda (0,5, 2) Hz. f, g Mapas de correlación de la última capa convolucional para la red entrenada (f) y no entrenada (g), ordenados según los valores de correlación en la banda de 1,1 Hz y con el rango de frecuencia subdividido en 60 contenedores espaciados logarítmicamente. Consulte la Fig. S1 para conocer el efecto sobre la magnitud de la correlación al cambiar el número de subdivisiones. h Correlación absoluta media calculada sobre todos los filtros para las redes entrenadas (trazo rojo sólido) y no entrenadas (trazo verde discontinuo). El rastro negro es la diferencia entre los dos.
Para comprender el mecanismo subyacente a la capacidad de la red para predecir correctamente el impulso del área, realizamos un análisis similar al descrito en la ref. 32, que consiste en construir los llamados “mapas de correlación de entrada-unidad de característica-salida”: estos mapas miden la correlación entre la salida de una unidad determinada (una neurona) en una de las capas convolucionales de la CNN y la potencia de la muestras en el campo receptivo (RF) de la neurona, es decir, el subconjunto de muestras en la traza completa de 60 s de duración que afecta la salida de cada unidad en una capa convolucional (consulte la referencia 33 para una explicación detallada de los RF y 34 para una explicación práctica). implementación). Este análisis se realiza para diferentes bandas de frecuencia: así, dado que los cambios en el momento del área tienen un efecto claro en los espectros de potencia de las señales de entrada (ver Figs. 3e y 2d), los mapas de correlación son una herramienta poderosa para visualizar las bandas de frecuencia que CNN es más sensible a la hora de predecir el impulso del área. Brevemente, para calcular un mapa de correlación, la señal de entrada se filtra por paso de banda en una de varias bandas de frecuencia en el rango (0,1, 20) Hz. La elección de esta banda de frecuencia está dictada por la ubicación en el dominio de la frecuencia de los modos electromecánicos de un sistema de energía eléctrica que muestran sensibilidad a la inercia de las máquinas/motores síncronos y de la inercia virtual proporcionada por los recursos basados en inversores: de hecho , todos ellos se encuentran dentro del límite de frecuencia superior de 20 Hz que hemos elegido. Para cada banda de frecuencia, se calcula la envolvente media al cuadrado para cada campo receptivo en una capa determinada y luego se calcula la correlación entre la envolvente y la salida de la misma capa en respuesta a la señal de entrada sin filtrar. Para obtener una descripción más detallada de cómo calcular mapas de correlación, se remite al lector a la ref. 32. Los resultados de este análisis se resumen en la Fig. 3f-h: el panel f muestra la correlación medida en la red entrenada en función de la frecuencia para cada uno de los 64 filtros de la última capa convolucional antes de la capa densa, ordenados según a los valores de correlación a una frecuencia de 1,1 Hz. Se pueden observar valores de correlación altos en dos bandas que no se superponen: la primera cubre aproximadamente el rango (0,5, 1) Hz, mientras que la segunda cubre el rango (1, 3) Hz. Sin embargo, es probable que los valores de correlación altos en el primer rango sean un subproducto del hecho de que la señal es más fuerte en esa banda de frecuencia: esto se confirma por valores de correlación casi igualmente altos en el mapa obtenido con la red no entrenada (es decir, una red con la misma arquitectura, pero con pesos establecidos aleatoriamente) como se muestra en la Fig. 3g. Esto se confirma aún más en el panel h, que muestra el valor absoluto medio de la correlación sobre todos los filtros en función de la frecuencia, para las redes entrenadas (línea roja continua) y no entrenadas (línea verde discontinua), junto con su diferencia (línea roja continua) y no entrenadas (línea verde discontinua). Línea negra): esta última traza, en particular, muestra un pico de correlación importante alrededor de aproximadamente 1,2 Hz, correspondiente a la presencia del pico en los espectros de las trazas de bajo momento (traza verde en la Fig. 3e). Estos resultados sugieren que las características de las señales de entrada que más importan para la predicción del momento se encuentran en el rango de frecuencia que comienza justo por debajo de ~ 1 Hz y se extiende hasta ~ 3 Hz. Como se muestra en la Fig. S2, este análisis de correlación se llevó a cabo en CNN entrenados para predecir los valores de impulso del área 1 o del área 2 utilizando los componentes del eje directo o de cuadratura de los voltajes en el bus 3. En todos los casos, el CNN fue capaz de predecir correctamente el impulso, aunque con MAPE significativamente más altos en el caso del área 2, ver Fig. S2c, d—, y con mapas de correlación caracterizados por estructuras sorprendentemente similares en todos los casos.
Para validar aún más nuestra hipótesis de que las distintas bandas de frecuencia contribuyen de manera diferencial a la predicción del impulso, filtramos las trazas de voltaje de entrada con filtros de eliminación de banda que eliminaron selectivamente las bandas de frecuencia que no se superponen que cubren el rango (1, 20) Hz. Estos rastros filtrados luego se enviaron a la CNN y la precisión de la predicción se comparó con la obtenida con los rastros originales sin filtrar, con el objetivo de establecer qué banda de frecuencia tiene el mayor impacto en la salida de la CNN. Los resultados de este experimento se muestran en la Fig. 4: el panel superior contiene un resumen de la precisión de la predicción para cada una de las frecuencias eliminadas. En la mayoría de los casos, la predicción es muy cercana a la obtenida con la señal sin filtrar (banda ancha), excepto para las bandas de frecuencia (0,7, 1) Hz, (1, 1,5) Hz y (1,5, 3) Hz. La eliminación de la primera banda de los rastros de entrada provoca un empeoramiento de la predicción para valores altos de impulso (marcadores morados y barras de error, que indican la media y el error estándar de la media (SEM) de los valores predichos, respectivamente), mientras que se elimina la última. dos provocan un empeoramiento de la predicción con valores bajos de impulso (marcadores naranjas y amarillos y barras de error). El panel inferior muestra, para cada banda de frecuencia eliminada de las trazas de entrada, la puntuación R2 correspondiente, es decir, la concordancia entre la predicción en el caso de banda suprimida y la de la señal de banda ancha: una concordancia perfecta correspondería a un R2 de 1, mientras que una concordancia inferior los valores indican predicciones progresivamente peores. Las puntuaciones R2 se superponen a los espectros de potencia promedio correspondientes a los niveles alto y bajo de impulso e indican claramente que las bandas de frecuencia más importantes para una predicción precisa son aquellas en los rangos (0,7, 1) Hz, (1, 1,5) Hz. , y (1,5, 3) Hz, donde el primero desempeña el papel más crucial, de acuerdo con los resultados que se muestran en la Fig. 3.
a Valores de impulso previstos cuando se eliminaron las bandas de frecuencia que no se superponen de las trazas de voltaje de entrada (barras de error: media ± desviación estándar). b Puntuación R2 entre los valores de impulso previstos obtenidos cuando no se eliminó ninguna frecuencia de la entrada y los obtenidos cuando se filtró cada banda de frecuencia, superpuestos a los PSD promedio de las condiciones de impulso bajo y alto.
En conjunto, estos resultados indican que una CNN entrenada en trazas de voltaje registradas en un bus es capaz de estimar correctamente el impulso del área, y lo hace sintonizando los filtros en su canal de preprocesamiento para "enfatizar" aquellas bandas de frecuencia de las señales de entrada que transmitir la mayor cantidad de información sobre el impulso de un área determinada de una red eléctrica.
Hasta ahora, el impulso del área se variaba cambiando la constante de inercia de los generadores síncronos G2 y G3. Sin embargo, como se mencionó anteriormente, se conectó un compensador al bus 8 de la red de 39 buses IEEE (ver Fig. 1) con el objetivo de tener un dispositivo adicional capaz de agregar impulso al área 1. En las simulaciones descritas hasta ahora, el La constante de inercia de este compensador se fijó en 0,1 s, por lo que su contribución al impulso del área era insignificante.
La peculiaridad de los compensadores es que pueden inducir oscilaciones entre áreas en una red eléctrica que se reflejan en picos en la densidad espectral de potencia (PSD) alrededor de 5 Hz, es decir, en un rango de frecuencia que no es utilizado por la CNN entrenada anteriormente para predecir el impulso: por lo tanto, esperamos que la CNN cometa grandes errores de predicción cuando el impulso del área varía actuando sobre la constante de inercia del compensador en lugar de sobre la de los generadores síncronos. Para probar esto directamente, realizamos simulaciones con los parámetros enumerados en la Tabla S2: los momentos de área más bajo y más alto (primera y cuarta fila) corresponden a los valores utilizados para el conjunto de prueba y sirven como grupo de "control", mientras que las constantes de inercia en la segunda y tercera fila conducen al mismo valor del impulso del área aumentando las constantes de inercia de G2 y G3 (segunda fila) o la inercia del compensador de 0,1 sa 6,1 s (tercera fila). Este aumento relativamente mayor se debe al hecho de que la potencia nominal del compensador (100 MVA) es significativamente menor que la del G2 y el G3 (700 MVA y 800 MVA, respectivamente). Las PSD correspondientes a estas cuatro condiciones se muestran en la parte superior de la Fig. 5a: las trazas azul y naranja son los momentos bajo y alto utilizados para el conjunto de prueba, respectivamente, mientras que la traza verde (magenta) corresponde a un impulso de 0,197 GW2. con constante de inercia del compensador baja (alta). El cambio en el pico alrededor de 5 Hz y la separación de los espectros en frecuencias superiores a ~6 Hz debido al aumento en la inercia del compensador son evidentes en la traza magenta, mientras que las otras tres trazas se superponen en ese rango de frecuencia. La parte inferior de la Fig. 5a muestra versiones ampliadas de los PSD: en el rango (0,4, 1,5) Hz, las trazas magenta y azul se superponen efectivamente, ya que las constantes de inercia de G2 y G3 en estas dos condiciones son muy similares. En el rango de (8, 15) Hz, las trazas azul, naranja y verde son idénticas, mientras que la magenta muestra un pico prominente alrededor de 11 Hz y tiene un espectro de potencia general más bajo.
a Arriba, PSD de las trazas de voltaje en las diversas condiciones descritas en la Tabla S2. Observe cómo hasta ~1,5 Hz las trazas magenta y azul se superponen, mientras que por encima de este valor de frecuencia la traza azul coincide con la verde. Abajo, vistas ampliadas de los PSD en dos bandas de frecuencia importantes para la operación de CNN. b Los marcadores cuadrados (circulares) indican los valores de impulso predichos por una CNN entrenada sin (con) datos de compensador variable. Los colores de los marcadores corresponden a las condiciones que se muestran en a (barras de error: media ± desviación estándar). c, d Mapas de correlación ordenados según los valores de correlación en las bandas de frecuencia de 1,1 Hz (c) y 10 Hz (d).
Como se esperaba, una CNN entrenada sin inercia de compensador variable puede estimar correctamente el impulso del área cuando se varían las constantes de inercia de G2 y G3 (marcador cuadrado verde en la Fig. 5b), pero no cuando la inercia del compensador se establece en 6,1 s: de hecho, en este último caso la predicción de la CNN es 0,184 ± 0,003 GWs2 (media ± SEM, marcador del cuadrado magenta en la Fig. 5b) cuando el impulso real es 0,197 GWs2, como se detalla en la Tabla S2. Para tener en cuenta la presencia de un compensador en el área 1, ampliamos el conjunto de entrenamiento para incluir una condición en la que la constante de inercia del compensador se incrementó a 5 s: en otras palabras, agregamos a la cuadrícula que se muestra en la Fig. 2a. una “dimensión” adicional (la tercera constante de inercia), duplicando así efectivamente la cantidad de datos utilizados para entrenar la CNN. El entrenamiento con esta mayor cantidad de datos evolucionó de manera similar a la que se muestra en la Fig. 2c y la CNN correspondiente tuvo un MAPE en el conjunto de prueba del 0,87%, lo que indica una vez más que una red neuronal convolucional es una herramienta adecuada para aprender el relación entre la dinámica de la red y el impulso correspondiente. Además, esta segunda CNN es capaz de predecir correctamente el impulso en ambas condiciones correspondiente a un impulso de área de 0,197 GWs2, como se detalla en la Tabla S2: cuando se varía la inercia de G2 y G3, dejando la del compensador igual a 0,1 s , la predicción de la CNN es 0,192 ± 0,013 GWs2 (marcador circular magenta en la Fig. 5b); por otro lado, cuando la inercia del compensador aumenta a 6 s, la predicción es 0,197 ± 0,002 GWs2 (marcador circular verde en la Fig. 5b), mucho más cerca del valor real que lo que se logró con la primera CNN.
Para comprender mejor los cambios en la “sintonización” de los filtros que componen la parte de preprocesamiento de la CNN, recurrimos una vez más al análisis de correlación introducido anteriormente. Los resultados de la CNN entrenada en el conjunto de datos que incluyen los datos del compensador variable se muestran en la Fig. 5c, d (filtros ordenados según los valores de correlación en la banda de frecuencia alrededor de 1,1 Hz y 10 Hz, respectivamente). Estos mapas de correlación resaltan cómo la CNN es sensible no sólo al rango de frecuencia (1,5, 3) Hz, sino también a frecuencias superiores a aproximadamente 7 Hz, que de hecho corresponden a un rango donde la presencia del compensador provoca un desplazamiento hacia abajo significativo del espectro. Como se analiza en la Fig. 3, los altos valores de correlación en el rango (0,5, 1) Hz se deben a los fuertes componentes de la señal que están presentes en los espectros para todos los valores de impulso: estos impulsan de manera confiable la salida de las tuberías de preprocesamiento incluso en el caso de la red no entrenada (ver Fig. 3g) y, por lo tanto, la CNN no los utiliza para realizar la clasificación. En general, estos resultados indican que, para lograr una predicción lo más precisa posible, una CNN debe entrenarse con datos que cubran tantas “condiciones espectrales” como sea posible, ya que esto es necesario para tener una adecuada sintonía de los filtros que constituyen la tubería de preprocesamiento de la red.
Hasta ahora, para obtener una comprensión mecanicista de cómo una CNN puede aprender a predecir el valor del impulso del área, hemos considerado redes entrenadas en un subconjunto limitado de los datos que se muestran en la Fig. 2. Para ampliar nuestro enfoque, utilizó el conjunto de datos completo (es decir, la cuadrícula de puntos que se muestra en la Fig. 2a) para entrenar una CNN capaz de generar una estimación continua del impulso del área en el rango (0,17, 0,28) GWs2. Incluimos en el conjunto de datos de entrenamiento no solo el voltaje directo registrado en el autobús 3, sino también los registrados en los autobuses 14, 17 y 39. Si bien todavía es posible usar solo un voltaje y entrenar CNN con suficiente precisión, la precisión de la predicción aumenta sustancialmente cuando se utilizan múltiples trazas de voltaje, sin comprometer la viabilidad práctica de esta elección. La Figura 6 muestra la evolución de la función de pérdida durante el entrenamiento (panel superior) y el rendimiento de la CNN en el conjunto de prueba (panel inferior). Como puede verse, la red no se sobreajusta y aprende a predecir con precisión el impulso del área (MAPE en el conjunto de prueba: 2,67%). Curiosamente, el rendimiento del CNN es ligeramente inferior sólo en el centro del rango de impulso: esto probablemente se deba al hecho de que varias combinaciones de inercia de los generadores pueden conducir a los mismos valores de impulso en el rango (0,21, 0,23) GWs2 , probando así las capacidades de generalización de la red.
Panel superior: pérdida de entrenamiento y validación en función del número de época. Panel inferior: media y desviación estándar (marcadores circulares y barras de error, respectivamente) de las predicciones de CNN en el conjunto de prueba. El número de valores distintos de impulso a predecir es igual al número de puntos en la cuadrícula de la Fig. 2a y suma 36.
Para probar hasta qué punto esta red puede predecir cambios graduales en el impulso del área, realizamos los experimentos que se muestran en la Fig. 7, que constan de cuatro condiciones diferentes (una para cada panel):
el impulso del área cambió al cambiar la inercia de los generadores de área;
el impulso del área es constante mientras cambia la inercia de los generadores de área;
el impulso del área aumentó al aumentar la inercia de los generadores de área;
El impulso del área aumentó en los mismos valores que en (C) pero con aumentos en la inercia del compensador de área.
Los valores exactos de inercia de los generadores G2 y G3 y del compensador en el área 1 se informan en la Tabla S3. Para cada una de las cuatro condiciones, se realizó una simulación de 3 horas de duración, durante la cual la inercia de los generadores síncronos o del compensador se cambió dos veces, lo que llevó a tres intervalos de 1 hora de duración con impulso constante. Las trazas de la Fig. 7 son una media móvil (en pasos de 1 s) de las predicciones de la CNN: como puede verse, la calidad de la predicción es excelente en todas las condiciones, excepto en el panel d, donde el impulso del área se incrementa elevando la inercia del compensador de 0,1 s (valor más bajo de impulso, 0,2206 GW2) a 2,5 s y 5 s (correspondientes a valores de impulso de 0,2286 y 0,2369 GW2, respectivamente). La razón de este fallo radica en el hecho de que variar la inercia del compensador cambia los espectros de las trazas de voltaje en un rango de frecuencia que la CNN pasa por alto al predecir el impulso, como se analizó anteriormente para el caso más simple de valores altos y bajos de impulso. (ver figura 5). Para resolver este problema, aumentamos el conjunto de entrenamiento incluyendo dos valores adicionales de inercia del compensador, a saber, 2,5 s y 5 s: esto efectivamente triplicó la cantidad de datos utilizados en el entrenamiento, ya que la cuadrícula que se muestra en la Fig. 2a se replicó para cada de los dos valores adicionales de inercia del compensador. Como se esperaba, una CNN entrenada en este conjunto de datos más grande (MAPE en el conjunto de prueba: 2,24%) es capaz de predecir correctamente cambios en el impulso del área incluso cuando solo aumenta la inercia del compensador (trazas verdes en la Fig. 7).
En todos los paneles, la traza negra es el valor del impulso predicho por una CNN entrenada en un conjunto de datos donde la inercia del compensador se fijó en 0,1 s, mientras que las trazas verdes son las predicciones de una CNN entrenada en un conjunto de datos extendido en el que, para cada par de valores de inercia que se muestran en la cuadrícula de la Fig. 2a, se consideraron tres valores de inercia del compensador, a saber, 0,1 s, 2,5 s y 5 s. a Diferentes valores de impulso obtenidos cambiando la inercia de G2 y G3. b Valor fijo del impulso obtenido para diferentes combinaciones de la inercia de G2 y G3. c Diferentes valores de impulso obtenidos aumentando progresivamente la inercia de G2 y G3. d Mismos valores de impulso que en c, obtenidos aumentando la inercia del compensador en el área 1.
Como anteriormente, recurrimos al análisis espectral de las trazas de voltaje para justificar la necesidad de incluir en el conjunto de entrenamiento simulaciones adicionales con valores variables de inercia del compensador. Los resultados de este análisis se muestran en la Fig. 8: el panel a contiene espectros representativos para diferentes valores de inercia de generadores y compensadores. Para cada valor de inercia del compensador, las trazas rojas son los espectros de las trazas de voltaje con un impulso más bajo (es decir, 0,17, 0,18 y 0,19 GWs2 en el panel b), que se obtienen cuando la inercia de cada generador se establece en su valor más bajo. El aumento de la inercia de los generadores provoca un cambio en los picos de los espectros en el rango (0,5, 1,5) Hz, lo que conduce a las trazas azules (valores más altos de impulso, 0,27, 0,28 y 0,29 GWs2 en el panel b). Por otro lado, aumentar la inercia del compensador de 1 s a 6 s provoca un desplazamiento hacia la izquierda (es decir, hacia valores de frecuencia más bajos, como lo ejemplifica la flecha en el panel a) del pico en los espectros ubicados entre 5 y 20 Hz (diferentes tonos de las trazas rojas y azules). La Figura 8b muestra espectrogramas obtenidos para tres valores diferentes de inercia del compensador (es decir, 1, 3 y 6 s). En estos paneles, cada fila corresponde a un PSD como los que se muestran en el panel a, con colores más cálidos (más fríos) que indican valores más altos (más bajos) de PSD. La inercia del compensador se fija en el valor indicado en la esquina superior derecha de cada panel, mientras que el impulso del área se varía cambiando la inercia de los generadores G2 y G3. Esto da como resultado un desplazamiento hacia la izquierda del segundo pico de PSD a medida que aumenta el impulso, como lo muestra la línea discontinua azul. La línea discontinua blanca muestra la ubicación del primer pico significativo de la PSD, que permanece sin cambios a pesar de los cambios en la inercia de los generadores. La punta de flecha blanca indica la ubicación del pico de alta frecuencia modulado por el valor de inercia del compensador. La Figura 8b resalta claramente cómo los picos de baja y alta frecuencia se modulan diferencialmente cambiando la inercia de los generadores o del compensador. Finalmente, la Fig. 8c muestra la ubicación del pico de alta frecuencia a medida que aumenta la inercia del compensador: la monotonicidad de esta curva permite a la CNN aprender correctamente la relación entre los espectros de voltaje y el impulso. Los espectros de la Fig. 8 provienen de las trazas de voltaje directo registradas en el bus 3, pero consideraciones análogas son válidas para los otros voltajes utilizados para entrenar las CNN utilizadas en esta sección.
a Ejemplos de PSD para diferentes valores de impulso: consulte el texto para obtener una explicación del código de color. b Espectrogramas en el rango de frecuencia (0,1, 20) Hz para diferentes valores de momento y para los tres valores de inercia del compensador. Las líneas discontinuas blancas y azules indican la posición de los dos picos de baja frecuencia de los PSD y se ajustan a las posiciones reales con funciones de la forma y = axb, con los parámetros a y b ajustados a los datos. Se colocan puntas de flecha blancas en la ubicación del pico de alta frecuencia de los PSD. c La ubicación del pico de alta frecuencia muestra una dependencia monótona de la inercia del compensador.
Estos resultados resaltan una vez más la capacidad de una CNN para predecir correctamente el impulso del área en varios escenarios operativos, asumiendo que la red ha sido entrenada en un conjunto de datos construido apropiadamente. En particular, habiendo demostrado que la parte convolucional de la CNN realiza un filtrado lineal de las trazas de entrada que preserva las partes más ricas en información del espectro, no incluir en el conjunto de entrenamiento condiciones operativas que activen bandas de frecuencia específicas dará como resultado resultados incorrectos. predicciones cuando un componente significativo del espectro está realmente presente en dichas bandas de frecuencia.
Hemos presentado un enfoque basado en CNN para estimar continuamente el impulso de un sistema eléctrico, enmarcando el problema de estimación como una tarea de clasificación en la que las entradas a la CNN son las series de tiempo de un conjunto de cantidades eléctricas registradas en un número reducido de autobuses, mientras que la salida es el impulso de una o más áreas de la red eléctrica. La arquitectura CNN utilizada aquí se inspiró en35 y se modificó para tener en cuenta las peculiaridades de los datos de los sistemas de energía. Entrenamos CNN que, dados 60 s de voltaje en un número limitado de buses (cuatro como máximo), pueden estimar el impulso de un área de una red eléctrica. Hemos demostrado que los pesos de las capas convolucionales están sintonizados para explotar características espectrales peculiares de la dinámica del sistema de energía con el fin de extraer los valores del momento. Este es un aspecto relevante ya que muchas veces es difícil obtener una comprensión completa de los mecanismos que subyacen al funcionamiento de una CNN. En los casos de prueba considerados en el presente estudio, el MAPE de la predicción rara vez superó el 4%, lo que indica que las CNN se pueden emplear con éxito en este tipo de tareas. La ventaja de este enfoque sobre los algoritmos de estimación de inercia más convencionales es que proporciona una predicción continua y, por lo tanto, no requiere eventos de red para actualizar su salida. En particular, nuestro método es capaz de detectar rápidamente cambios en el impulso del área (como se muestra en la Fig. 7) y puede usarse cuando estos son atribuibles tanto a cambios en la inercia de los generadores como a los compensadores (ver Fig. 8).
Al adoptar un enfoque reduccionista, hemos demostrado que el mecanismo en la base del funcionamiento de la CNN consiste en un filtrado lineal de las entradas por parte de la parte de preprocesamiento convolucional que preserva las características espectrales más destacadas de las trazas de entrada (ver Figs. 3). y 4), que luego pueden clasificarse eficientemente mediante la parte densa de la CNN. La principal ventaja de utilizar una CNN para realizar esta tarea radica en el hecho de que las bandas de frecuencia que transportan la mayor cantidad de información son determinadas por el algoritmo de optimización durante el entrenamiento, en lugar de tener que seleccionarse "a mano".
Sin embargo, una consecuencia directa de este enfoque basado en datos es que agregar a la red eléctrica un dispositivo que no estuvo presente durante el entrenamiento no ofrece garantía de que la CNN pueda predecir correctamente el impulso del área. Para ilustrar este punto, reemplazamos el generador síncrono G3 con un generador síncrono virtual (VSG), es decir, un dispositivo que emula las propiedades mecánicas y parcialmente eléctricas de un generador síncrono, permitiendo así que los recursos basados en IBR imiten, entre otras cosas , las características inerciales de los generadores síncronos36. Como en los experimentos anteriores que se muestran en la Fig. 7, probamos tres valores diferentes de impulso de área y cambiamos entre ellos cambiando instantáneamente la inercia tanto del generador G2 como del VSG en t = 60 y 120 min. La Figura 9a muestra las PSD promedio de la tensión en el bus 3 para cada valor de impulso en presencia del VSG (trazas negras) en comparación con la configuración normal de la red (es decir, con G2 y G3, trazas rojas): la presencia de un VSG altera significativamente el espectro en dos bandas de frecuencia, alrededor de 1,5 Hz y 5 Hz. En particular, la ubicación del pico de 1,5 Hz varía con el impulso, mientras que los otros dos picos de baja frecuencia ubicados en ~0,6 Hz y ~1 Hz, que también están presentes en las trazas rojas, no cambian de posición. Como consecuencia, la CNN es capaz de predecir correctamente el valor del impulso del área solo cuando las PSD roja y negra se superponen para frecuencias <1 Hz, como se muestra en la Fig. 9b, donde las trazas magenta discontinuas son los valores correctos del impulso y el El rastro negro es el promedio móvil de la predicción de CNN. Sin embargo, lo que este sencillo ejemplo muestra claramente es que diferentes dispositivos normalmente agregarán su “firma” característica al espectro, por lo que nuestro método es aplicable a otras configuraciones de red y dispositivos de alimentación, siempre que el usuario realice una evaluación preliminar de los efectos. ) de cambiar los parámetros de un dispositivo en el contenido espectral de las señales utilizadas para estimar el impulso del área.
a Trazas negras, PSD del voltaje en el bus 3 de la red de 39 buses IEEE cuando G3 se reemplaza por un VSG. Trazas rojas, PSD de la misma señal en la red eléctrica por defecto, es decir, con el generador síncrono G3 presente. Los valores de impulso indicados en cada panel se han obtenido cambiando la inercia del generador G2 y del VSG (trazas negras) o la inercia de los generadores G2 y G3 (trazas rojas). Las puntas de flecha vacías (rellenas) indican las posiciones de los picos de PSD en los trazos negros que (no) cambian de posición cuando varía el impulso del área. b Predicción del momento por la CNN: la traza negra es el promedio móvil del momento predicho, mientras que las líneas discontinuas magenta indican el valor correcto del momento del área. La predicción es precisa sólo cuando los trazos negro y rojo en el panel se superponen para frecuencias de hasta ~1 Hz.
Un parámetro importante que afecta la estabilidad del sistema en las redes eléctricas es la amortiguación de carga37: aunque aparece en la ecuación de oscilación que modela el comportamiento de las máquinas síncronas, los operadores de sistemas de transmisión (TSO) no pueden cambiar libremente la amortiguación, y al mismo tiempo es difícil de modificar. estimación en escenarios del mundo real. Por lo tanto, es importante determinar si una CNN entrenada en un conjunto de datos generado con una cierta cantidad de amortiguación de carga es robusta, en la fase de predicción, a variaciones en su valor real. Todos los generadores en la red de bus IEEE 39 tienen un valor predeterminado de amortiguación de carga igual a 0: variamos este parámetro en el rango D = (0, 4) mientras manteníamos fija la inercia de los generadores y probamos si una CNN previamente entrenada (es decir, uno entrenado en un conjunto de datos generado con D = 0) predeciría correctamente el valor del impulso del área. Como se muestra en la Fig. 10a, el MAPE de la predicción solo se ve ligeramente afectado por los cambios en la amortiguación de carga, lo que indica que una CNN entrenada con un valor específico (o, de hecho, desconocido) de amortiguación de carga es robusto a los cambios en su valor. que están dentro del rango de lo que uno esperaría tener en una red eléctrica real. Una vez más, esto se puede explicar observando las PSD que se muestran en la Fig. 10b: muestran claramente que el efecto de la amortiguación de carga se limita a frecuencias muy bajas (es decir, hasta aproximadamente 0,1 Hz) o consiste en modular la amplitud de uno de los picos del PSD. Dado que, como hemos demostrado antes, la CNN se basa principalmente en la ubicación de los picos, más que en su amplitud, no se espera que las incertidumbres en la amortiguación de la carga afecten negativamente la estimación del impulso del área.
a Violín traza los valores predichos de impulso cuando la amortiguación de carga de los generadores G2 y G3 aumenta de 0 a 4. Cada violín representa la distribución de N = 300 valores de impulso predichos, con las líneas discontinuas interiores indicando, de abajo hacia arriba, el percentil 25, 50 y 75, respectivamente. La línea roja representa el valor correcto del impulso, obtenido con valores de inercia de G2 y G3 iguales a 4,33 s y 4,47 s, respectivamente. Los marcadores circulares son los valores de MAPE, indicados en el eje derecho. b PSD de \({V}_{d,bu{s}_{3}}\) para diferentes valores de amortiguación de carga de G2 y G3. Los recuadros muestran la PSD en aquellas regiones donde el efecto de la variación de la amortiguación de carga de los generadores es más prominente.
Investigaciones anteriores han investigado la aplicación de las RNA38,39 en general y de las CNN en particular40 al problema de la estimación de la inercia. Si bien es similar en el enfoque general y la precisión de la predicción, nuestro método presenta dos ventajas claras: primero, se basa completamente en datos, ya que se basa exclusivamente en las fluctuaciones de voltaje atribuibles a la estocasticidad de las cargas de energía. Este no es el caso con otros métodos, como el40, que en cambio requieren señales de sondeo para perturbar el sistema desde su punto de operación en estado estacionario. En segundo lugar, por primera vez proporcionamos un análisis en profundidad de los mecanismos subyacentes al funcionamiento de la CNN, proporcionando así pautas cruciales para la elección del conjunto de entrenamiento más apropiado para lograr el nivel deseado de precisión en la predicción del impulso de la red.
Si bien los enfoques que acabamos de mencionar se centran específicamente en la estimación de la inercia de la red, se pueden utilizar varios algoritmos de ML de “propósito general” para abordar problemas de regresión: entre ellos, elegimos el perceptrón multicapa (MLP), la regresión de vector de soporte (SVR), el kernel Ridge, K-vecino más cercano y bosque aleatorio para una comparación directa en términos de precisión con nuestro enfoque basado en CNN. Otros métodos, como la regresión lineal, dieron resultados insatisfactorios o requirieron, en nuestras manos, un ajuste adicional excesivo. Para esta comparación, utilizamos como datos de entrenamiento el Vd,3 normalizado del conjunto de datos de momento bajo y alto (ver Fig. 3): lo más importante es que, para que la comparación sea lo más justa posible, todos los algoritmos fueron entrenados exactamente con el Los mismos datos de entrada utilizados para la CNN y, cuando fue posible, hicimos coincidir (aproximadamente) el número de parámetros del modelo con los de la CNN. Los resultados de este análisis se presentan en la Tabla S4: como puede verse, el enfoque basado en CNN es superior a todos los demás modelos probados. La razón más obvia detrás del peor rendimiento de estos modelos podría residir en el hecho de que no están destinados específicamente a manejar datos de series temporales: el preprocesamiento de los datos de entrada, aplicando, por ejemplo, técnicas de Fourier y/o de reducción de dimensionalidad, podría mejorar su rendimiento. , pero estaba fuera del alcance de este trabajo.
Como se mencionó anteriormente, nuestro método emplea datos de voltaje de un número limitado de buses de la red: investigar en detalle las heurísticas para la elección del bus y las variables eléctricas que darán la mejor precisión de predicción está fuera del alcance de este trabajo ya que, en última instancia, depende de la topología de la red eléctrica y su subdivisión en áreas: sin embargo, hallazgos recientes sobre las estadísticas teóricamente esperadas de cada variable eléctrica41 permitirán elegir el mejor conjunto de variables para usar durante las fases de entrenamiento y predicción.
Además, en este trabajo no hemos tenido en cuenta variaciones diarias o estacionales en las cargas estocásticas presentes en la red. Dado que estos podrían desempeñar un papel importante en la determinación del nivel general de impulso presente en una red eléctrica, el trabajo futuro se centrará en modelar estos aspectos con mayor precisión para obtener una mejor comprensión de los posibles cambios en nuestro método necesarios para hacerlo aplicable. a una gama más amplia de condiciones operativas. A pesar de esto, creemos que nuestro método es lo suficientemente robusto y flexible como para ser empleado con éxito en una gran cantidad de configuraciones de redes eléctricas y tiene una amplia aplicabilidad a escenarios del mundo real.
La energía cinética almacenada en un generador síncrono se puede expresar como \({E}_{{{{{{{{\rm{kin}}}}}}}}}=\frac{1}{2}J{ \omega }_{n}^{2}\), donde J es el momento de inercia del generador y ωn es la frecuencia angular nominal del rotor. A partir de esta ecuación, se pueden definir varias cantidades que miden diferentes características de un generador síncrono. La primera que consideramos aquí es la constante de inercia, que se define como H = Ekin/S, donde S es la potencia nominal del generador. H se mide en segundos y da una indicación del tiempo durante el cual un generador síncrono es capaz de proporcionar/absorber su potencia nominal utilizando únicamente la energía cinética de sus masas en rotación17,42.
La ecuación de oscilación43 proporciona una descripción simplificada pero precisa de la dinámica electromecánica de un generador de una masa.
donde f y fn son las frecuencias real y nominal del generador, Pm y Pe son sus potencias mecánica y eléctrica, respectivamente, Δf = f − fn, y D es el coeficiente de amortiguación de carga. La ecuación (1) muestra claramente que la constante de inercia da una medida de cómo las fluctuaciones en la potencia conducen a cambios de frecuencia: una constante de inercia grande (o, de manera análoga, un Ekin grande) permite que un generador síncrono limite efectivamente las fluctuaciones de frecuencia inmediatamente después de los desequilibrios de energía eléctrica. (Generalmente se supone que la potencia mecánica es constante a corto plazo). La ecuación (1) se puede reescribir como
donde M = 2HS/fn está relacionado con el momento angular del generador (para ser más precisos, en mecánica clásica el momento angular es igual a \(L=\frac{1}{2}J\omega=M/(4 \pi )\), y por lo tanto su unidad de medida es la misma que M, es decir, kg ⋅ m2 ⋅ s−1 o W ⋅ s2). Estas tres cantidades, H, M y Ekin = HS (que tiene las unidades de medida de una energía, es decir, kg ⋅ m2 ⋅ s−2 o W ⋅ s), están relacionadas entre sí y fundamentalmente proporcionan la misma información: por tanto , se pueden usar (casi) indistintamente cuando se trata de describir la dinámica de un sistema de energía y, en particular, su capacidad para contrarrestar los inevitables desequilibrios de poder que ocurrirán en la red. Siguiendo lo hecho en 20, decidimos utilizar en este trabajo el impulso M para describir una red eléctrica.
Nuestro enfoque para estimar el impulso de una red eléctrica se basa en subdividirla en un número finito de áreas, como se hizo anteriormente en otros trabajos11,20. La razón de esto es doble: en primer lugar, a menudo las redes eléctricas pueden subdividirse “naturalmente” en subáreas estrechamente conectadas que están débilmente interconectadas con el resto de la red. En segundo lugar, la combinación de varios generadores síncronos reduce la cantidad de predicciones que la CNN tiene que hacer, aumentando así su capacidad para aprender con precisión la relación entre la dinámica del sistema y el impulso. El impulso Mi de la i-ésima área está dado por
donde Ni es el número de generadores síncronos en el área i, y Hj y Sj son las constantes de inercia y las potencias nominales, respectivamente, del j − ésimo generador en el área i. A diferencia del enfoque propuesto en la ref. 20, no imponemos ninguna restricción sobre cómo se definen las subáreas: dicha subdivisión debe determinarse caso por caso y, si uno está interesado en el impulso de un generador síncrono específico, pueden "colapsar" un área de tal manera que su impulso coincidirá con el del generador en cuestión. De hecho, esto es lo que se hace en nuestra subdivisión de la red de bus IEEE 39 que se muestra en la Fig. 1, en la que el área 4 contiene sólo el generador G1: en nuestro caso específico, esto se hizo porque asumimos que el área 4 tiene un valor conocido. impulso constante.
Se conectó un compensador síncrono con una potencia nominal SC = 100 MVA al bus 8 de la red IEEE de 39 buses. Su potencia activa se fijó en 0 MW y su punto de consigna de tensión se eligió de manera que su potencia reactiva sea nula en PF, no alterando así el punto de operación de la red pero aportando el nivel de inercia deseado. Para encontrar el punto de ajuste adecuado, antes de cada simulación en el dominio del tiempo se realizó una optimización para minimizar la potencia reactiva absorbida por el compensador, que viene dada por
donde Vd (Id) y Vq (Iq) son las componentes directa y en cuadratura del voltaje (corriente) del compensador, respectivamente, y la barra indica el conjugado complejo. vg establece el punto de funcionamiento del compensador como una fracción de SC. La optimización se realizó utilizando la función fsolve de SciPy44.
Un generador síncrono virtual (VSG) es un esquema de control de formación de red que simula el comportamiento dinámico de una máquina síncrona mediante un convertidor de potencia. El objetivo es dotar de inercia, amortiguación, control primario de frecuencia y control de tensión a una red con una importante penetración de fuentes de energía renovables y por tanto de reducida inercia. Para los experimentos que se muestran en la Fig. 9, utilizamos el modelo de VSG descrito en la ref. 45: brevemente, proporciona inercia virtual al implementar la ecuación de oscilación con control de caída de frecuencia y contiene un bucle de bloqueo de fase (PLL) y varios algoritmos de control que en conjunto replican el comportamiento dinámico de una máquina síncrona convencional. Es importante destacar que la gran mayoría de los VSG que proporcionan inercia sintética reproducen exclusivamente el comportamiento mecánico de una máquina síncrona (es decir, la ecuación de oscilación), aunque no logran replicar su comportamiento electromecánico completo debido a los devanados, incluidos los amortiguadores. El modelo VSG en ref. 45 pertenece a esta categoría y por lo tanto implementa solo la ecuación de oscilación, lo que lleva a una huella espectral diferente con respecto a un generador síncrono real.
Todas las cargas en nuestra versión de la red de bus IEEE 39 son estocásticas: la potencia activa absorbida por cada carga se describe mediante un proceso de Ornstein-Uhlenbeck (OU) con media igual al valor de la carga original, desviación estándar igual a 0,5 % de la media y una tasa de reversión a la media de 2 s. Elegimos los procesos OU porque tienen un espectro de potencia que es un modelo más preciso de la variabilidad estocástica de las cargas de potencia que el ruido blanco gaussiano46,47. La varianza de los procesos OU es suficientemente baja como para que las fluctuaciones de las cargas estocásticas puedan verse como una pequeña señal frente al valor medio de estas últimas. Por lo tanto, es posible relacionar las variaciones estocásticas de todas las variables del modelo del sistema de energía con las fluctuaciones de las cargas estocásticas explotando la linealización del modelo del sistema de energía en su solución FP26,48. En particular, el modelo de sistema de energía linealizado, aumentado por las ecuaciones diferenciales estocásticas (SDE) que generan los procesos OU a partir de un conjunto adecuado de procesos de Wiener no correlacionados, da lugar a un conjunto de SDE que es lineal en sentido estricto49. Bajo esta hipótesis, cada variable de estado del modelo del sistema de potencia resulta estar caracterizada por una distribución gaussiana. La media asintótica de esta distribución viene dada por el valor asumido por la variable de estado en la solución PF. La variación, a su vez, depende de la variación de los procesos de la OU. Esto también es válido para las variables algebraicas del modelo del sistema eléctrico, es decir, aquellas variables que no son variables de estado41. En particular, es válido para todas las tensiones del bus, destacando así su relación con la fluctuación estocástica de las cargas.
Las redes neuronales artificiales (RNA) son una clase de algoritmos de aprendizaje automático23 que emplean el paradigma de aprendizaje supervisado para aprender la relación de mapeo entre los valores de entrada y salida utilizando una gran cantidad de pares de ejemplos. El componente básico de las RNA es el perceptrón50, que modela neuronas reales transformando un vector de entradas (reales) x en una salida escalar y = f(wTx + b), donde w y b son los llamados pesos y sesgos. del perceptrón y f es una función de activación no lineal. Aunque limitado en la gama de tareas que puede resolver, el perceptrón impulsó el desarrollo de RNA compuestas por varias capas interconectadas capaces de aprender cualquier función con un grado arbitrario de precisión51. Esto se logra mediante los llamados algoritmos de aprendizaje que calculan los pesos y sesgos óptimos para resolver una tarea particular. Hoy en día, el algoritmo de aprendizaje más utilizado en las RNA es la retropropagación: brevemente, consiste en propagar, en cada iteración de aprendizaje, el error del conjunto de entrenamiento hacia atrás desde las capas de salida a las de entrada, para ajustar los pesos de las RNA. la red52.
Las redes neuronales convolucionales (CNN) son un tipo de ANN que contienen capas convolucionales, es decir, núcleos con pesos compartidos cuya tarea principal es extraer características destacadas de partes de la entrada de CNN53. Compartir pesos entre neuronas en la misma capa convolucional hace que el entrenamiento sea más eficiente, permitiendo así un aumento sustancial en el número de capas convolucionales que pueden “apilarse” una encima de otra, imitando la organización de alto nivel de la corteza visual de los mamíferos54. Esto, junto con el aumento de la potencia computacional en los últimos años, ha provocado un crecimiento exponencial en el número de aplicaciones de aprendizaje profundo, en particular en tareas relacionadas con la clasificación y el procesamiento de datos52. La arquitectura de la CNN utilizada en este trabajo se basa en la red de filtrado profundo introducida en la ref. 35 para resolver un problema de estimación de parámetros similar al nuestro. Como se muestra en la Fig. S3, contiene tres bloques de preprocesamiento, cada uno compuesto por una convolución y una capa de agrupación máxima. Este proceso de preprocesamiento se replica tantas veces como el número de variables eléctricas utilizadas como entradas a la CNN: por ejemplo, si uno usara voltajes directos y de cuadratura (M = 2) en dos buses (N = 2), el número total de tuberías de preprocesamiento ascenderían a cuatro. Cada uno de estos pipelines recibe como entrada 60 s de datos muestreados a 40 Hz, sumando un total de 2400 muestras. Las salidas de las tuberías se concatenan y aplanan en una matriz de M × N × 64 × 36 = 9216 muestras, que se alimenta a dos capas completamente conectadas que realizan la “clasificación” real, produciendo así el valor estimado del impulso. La función de pérdida utilizada durante el entrenamiento es el error absoluto medio convencional (MAE):
donde n es el número de trazas de entrenamiento y yi y xi son los valores previstos y verdaderos del impulso, respectivamente. Los valores de tamaño indicados en la Fig. S3 y utilizados a lo largo de este trabajo se refieren a capas convolucionales con 16, 32 y 64 neuronas, tamaño de núcleo y zancada iguales a 5 y 1, respectivamente, capas de agrupación máxima con un tamaño de agrupación de 4 y una primera capa densa. que contiene 64 neuronas. El número de neuronas en la segunda capa densa es igual al número de valores predichos de impulso y, por lo tanto, L = 1 en este trabajo, dado que queremos estimar el impulso de solo un área a la vez. La función de activación no lineal en las capas densamente conectadas es la unidad lineal rectificada (ReLU) (no indicada explícitamente en la Fig. S3), mientras que las capas de preprocesamiento no tienen una función de activación no lineal.
En las fases preliminares de este trabajo, probamos el efecto sobre la precisión de la CNN de varios hiperparámetros del modelo, a saber, el tamaño y el paso de los núcleos en las capas convolucionales y el número de unidades en las capas de agrupación máxima. Los resultados de esta investigación, en el escenario simple de predecir solo dos valores de impulso, se resumen en la Fig. S4 y la Tabla S5: en esta última, la columna de tamaño de salida indica el número de salidas de la última capa de agrupación máxima, que corresponde a el número de entradas a la capa descendente totalmente conectada. Cada par de capas convolucionales y de agrupación máxima convierte sus muestras de entrada Nin en muestras de salida Nout de acuerdo con la siguiente fórmula:
donde Ksz y Kstr son el tamaño del núcleo y la zancada, respectivamente, y Psz es el número de unidades en las capas de agrupación. La aplicación de esta función de forma recursiva tres veces (es decir, el número de pares de convolución/agrupación máxima en las tuberías de preprocesamiento) con Nin inicial = 2400 (es decir, el número total de muestras utilizadas por la CNN), conduce a los valores de tamaño de salida indicados en la Tabla S5. Tenga en cuenta que no todas las combinaciones de tamaño del núcleo, zancada y número de unidades en las capas de agrupación son factibles (es decir, conducen a Nout = 0 en la ecuación (6)), de ahí que falten gráficos de violín en el panel derecho de la Fig. S4. . En general, encontramos que las combinaciones de 6 unidades en las capas de agrupación máxima, paso del núcleo igual a 1 y tamaños del núcleo iguales a 3 o 5 dieron el error de validación más bajo. Sin embargo, elegimos utilizar un conjunto de hiperparámetros que en nuestras pruebas solo dieron una pérdida de validación marginalmente mayor (pérdida mediana = 0,00386 frente a 0,00374): la razón de esto radica en el hecho de que este conjunto particular de hiperparámetros conduce a un mayor número de neuronas de salida de la tubería de preprocesamiento (36 en lugar de solo 10) que luego constituyen la entrada a la capa descendente completamente conectada. Razonamos que esta mayor dimensionalidad de la entrada a la capa completamente conectada podría dotarla de capacidades de generalización superiores en tareas más complicadas, como las descritas en las Figs. 5-7.
Usamos el optimizador Adam55 con una tasa de aprendizaje fija de 5 × 10−4 o con una tasa de aprendizaje cíclica56 con tasas de aprendizaje inicial y máxima de 5 × 10−5 y 2 × 10−3, respectivamente, y un tamaño de paso igual a 10 veces el número de iteraciones en una época. Los pesos de la red se inicializaron utilizando el enfoque Glorot como se describe en la ref. 57.
Todos los modelos de ML se implementaron en TensorFlow 258.
Las simulaciones en el dominio del tiempo se realizaron con el simulador PAN59, explotando su capacidad de resolver numéricamente adecuadamente las ecuaciones diferenciales estocásticas que gobiernan el modelo de sistema de potencia considerado. Para construir el conjunto de entrenamiento, como se muestra en la Fig. 2, tomamos muestras del plano \(({H}_{{G}_{2}},{H}_{{G}_{3}})\) usando una cuadrícula regularmente espaciada de 6 × 6 puntos: para cada combinación de valores de inercia simulamos la red durante 300 × 103 s (es decir, aproximadamente 83 h) y usamos estos datos para entrenar la CNN. Los datos se normalizaron para tener media cero y desviación estándar unitaria según la fórmula
donde xij es la j-ésima muestra de tiempo de la i-ésima traza de entrenamiento, μx y σx son la media y la desviación estándar de x en todo el conjunto de datos de entrenamiento y yij son los valores normalizados correspondientes. Elegimos esta normalización para preservar la distribución normal de las trazas de voltaje y tener en cuenta el rango de magnitudes de voltaje en diferentes buses en la red de 39 buses IEEE. No se aplicó ningún otro preprocesamiento (por ejemplo, filtrado) a los datos. Los conjuntos de validación y prueba se construyeron de manera similar, pero con simulaciones más cortas, como se detalla en la Tabla S6. Es importante destacar que tanto el conjunto de validación como el de prueba también se normalizaron de acuerdo con la ecuación. (7) utilizando la media y la desviación estándar del conjunto de entrenamiento.
Utilizamos modelos de ML disponibles en Scikit-learn60 como puntos de referencia para el rendimiento de nuestro enfoque basado en CNN. Para cada uno de los siguientes modelos, indicamos aquí solo los hiperparámetros cuyos valores eran diferentes de los valores predeterminados de implementación de Scikit-learn. No investigamos exhaustivamente si otras combinaciones de hiperparámetros condujeron a mejores resultados, ya que esto estaba fuera del alcance de este trabajo.
SVR61: Regresión del vector de soporte Nu, con núcleo de función de base radial (RBF), ν = 0,5 y parámetro de penalización C = 1. La tolerancia para la detención se estableció en 10-4.
MLP: un perceptrón multicapa densamente conectado con 1 capa oculta que contiene 67 unidades, lo que da lugar a una serie de parámetros entrenables comparables a los de la CNN. El entrenamiento se realizó durante 2000 iteraciones, con detención anticipada si la función de pérdida no disminuía durante más de 200 iteraciones.
K-vecinos más cercanos: k = 5 vecinos ponderados por la inversa de su distancia en la fase de predicción (es decir, los vecinos más cercanos tienen una mayor influencia en el valor predicho). La función de distancia se basó en la medida de similitud de deformación dinámica del tiempo entre series temporales62, tal como se implementa en el paquete Python tslearn63.
Kernel ridge64: regresión de cresta con un kernel RBF y fuerza de regularización α = 0,1.
Bosque aleatorio65: método de conjunto basado en ajustar varios regresores de árboles de decisión binarios a los datos de entrenamiento y luego promediar su salida en la fase de predicción. El número de parámetros de cada árbol depende principalmente de su profundidad, que es elegida automáticamente por el algoritmo de entrenamiento si no se especifica ningún valor máximo permitido. Usamos N = 150 árboles de decisión para igualar aproximadamente el número total de parámetros entrenables de la CNN correspondiente, como se muestra en la Tabla S4.
Además, los datos procesados se han depositado en Figshare con el código de acceso (https://doi.org/10.6084/m9.figshare.23652730). Los datos originales se proporcionan con este documento.
El código Python utilizado para (i) generar los datos sintéticos utilizados en este artículo, (ii) entrenar la CNN y los otros modelos ML, y (iii) generar las Figs. 2-10 está disponible en Zenodo bajo el código de acceso (https://doi.org/10.5281/zenodo.8123317) y en GitHub (https://github.com/danielelinaro/inertia).
Zhongming, Z. y col. El mundo agrega nueva capacidad récord de energía renovable en 2020. https://www.reuters.com/article/us-climate-change-renewables/record-260-gw-of-new-renewable-energy-capacity-added-in- 2020-identificación-de-investigaciónUSKBN2BT0UL.
Gu, Y., Green, TC Estabilidad del sistema de energía con una alta penetración de recursos basados en inversores. Actas del IEEE, 1–22 https://doi.org/10.1109/JPROC.2022.3179826 (2022).
Kenyon, RW et al. Estabilidad y control de sistemas de energía con alta penetración de recursos basados en inversores: una revisión accesible del conocimiento actual y preguntas abiertas. Energía solar 210, 149-168 (2020).
ADS del artículo Google Scholar
Tielens, P. & Van Hertem, D. La relevancia de la inercia en los sistemas de energía. Renovar. Sostener. Energía Rev. 55, 999–1009 (2016).
Artículo de Google Scholar
Sajadi, A., Kenyon, RW y Hodge, B.-M. Sincronización en redes de energía eléctrica con heterogeneidad inherente hasta generación 100% renovable basada en inversores. Nat. Comunitario. 13, 2490 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Heylen, E., Teng, F. & Strbac, G. Desafíos y oportunidades de estimación y pronóstico de inercia en sistemas de energía de baja inercia. Renovar. Sostener. Energía Rev. 147, 111176 (2021).
Artículo de Google Scholar
Ulbig, A., Borsche, TS y Andersson, G. Impacto de la baja inercia rotacional en la estabilidad y el funcionamiento del sistema eléctrico. Procedimiento de la IFAC. vol. 47, 7290–7297 (2014). XIX Congreso Mundial de la IFAC.
Artículo de Google Scholar
D'Arco, S., Suul, JA & Fosso, OB Implementación de una máquina síncrona virtual para el control distribuido de convertidores de potencia en SmartGrids. eléctrico. Sistema de energía. Res. 122, 180-197 (2015).
Artículo de Google Scholar
Tan, B. y col. Estimación de la inercia del sistema de energía: revisión de los métodos y los impactos de las generaciones interconectadas por convertidores. En t. J. Electr. Sistema de energía eléctrica. 134, 107362 (2022).
Artículo de Google Scholar
Zhao, J., Tang, Y. & Terzija, V. Estimación robusta en línea de la frecuencia del centro de inercia del sistema eléctrico. Transac IEEE. Sistema de energía. 34, 821–825 (2019).
ADS del artículo Google Scholar
Ashton, PM, Saunders, CS, Taylor, GA, Carter, AM y Bradley, ME Estimación de inercia del sistema de energía de gb mediante mediciones de sincrofasor. Transac IEEE. Sistema de energía. 30, 701–709 (2015).
ADS del artículo Google Scholar
del Giudice, D. & Grillo, S. Análisis de la sensibilidad del método de estimación de inercia extendido basado en el filtro de Kalman al tiempo supuesto de perturbación. Energías 12, 483 (2019).
Artículo de Google Scholar
Wall, P. & Terzija, V. Estimación simultánea del tiempo de perturbación e inercia en sistemas eléctricos. Transac IEEE. Entrega de energía. 29, 2018-2031 (2014).
Artículo de Google Scholar
Zhang, J. & Xu, H. Identificación en línea de la constante de inercia equivalente del sistema de energía. Transac IEEE. Industria eléctrica. 64, 8098–8107 (2017).
Artículo de Google Scholar
Zeng, F. y col. Estimación en línea de la constante de inercia del sistema de potencia en condiciones normales de operación. Acceso IEEE 8, 101426–101436 (2020).
Artículo de Google Scholar
Baruzzi, V., Lodi, M., Oliveri, A., Storace, M. Análisis y mejora de un algoritmo para la estimación de inercia en línea en redes eléctricas con RES. En: Simposio internacional sobre circuitos y sistemas (ISCAS) del IEEE de 2021, págs. 1 a 5 https://doi.org/10.1109/ISCAS51556.2021.9401229 (2021).
Allella, F., Chiodo, E., Giannuzzi, GM, Lauria, D. & Mottola, F. Evaluación de estimación en línea de la inercia de sistemas eléctricos con alta penetración de generación renovable. Acceso IEEE 8, 62689–62697 (2020).
Artículo de Google Scholar
Kontis, EO, Pasiopoulou, ID, Kirykos, DA, Papadopoulos, TA y Papagiannis, GK Estimación de la inercia del sistema eléctrico: una evaluación comparativa de técnicas basadas en mediciones. eléctrico. Sistema de energía. Res. 196, 107250 (2021).
Artículo de Google Scholar
Prabhakar, K., Jain, SK y Padhy, PK Estimación de la inercia en el sistema eléctrico moderno: una revisión exhaustiva. eléctrico. Sistema de energía. Res. 211, 108222 (2022).
Artículo de Google Scholar
Tuttelberg, K., Kilter, J., Wilson, D. y Uhlen, K. Estimación de la inercia del sistema eléctrico a partir de mediciones ambientales de área amplia. Transacción IEEE. Sistema de energía. 33, 7249–7257 (2018).
ADS del artículo Google Scholar
Li, Z., Liu, F., Yang, W., Peng, S., Zhou, J. Un estudio de redes neuronales convolucionales: análisis, aplicaciones y perspectivas. Transac IEEE. Red neuronal. Aprender. Sistema. 33, 6999–7019 (2021).
O'Shea, K., Nash, R. Una introducción a las redes neuronales convolucionales. Preimpresión de arXiv arXiv:1511.08458 (2015).
Yegnanarayana, B. Redes neuronales artificiales. (PHI Aprendizaje Pvt. Ltd., 2009).
Dhillon, A. & Verma, GK Red neuronal convolucional: una revisión de modelos, metodologías y aplicaciones para la detección de objetos. Progr. Artif. Intel. 9, 85-112 (2020).
Artículo de Google Scholar
Rawat, W. & Wang, Z. Redes neuronales convolucionales profundas para clasificación de imágenes: una revisión exhaustiva. Computación neuronal. 29, 2352–2449 (2017).
Artículo MathSciNet PubMed MATH Google Scholar
Bizzarri, F. et al. Estimación de inercia mediante matriz de covarianza. Transac IEEE. Sistema de energía. 1–10 https://doi.org/10.1109/TPWRS.2023.3236059 (2023).
Yang, D. y col. Estimación de la inercia basada en datos para sistemas eléctricos interconectados de múltiples áreas mediante descomposición en modo dinámico. Transac IEEE. Indiana Informar. 17, 2686–2695 (2020).
Artículo de Google Scholar
Yang, D. y col. Enfoque basado en identificación modal basado en datos ambientales para estimar la inercia de un sistema eléctrico interconectado. Acceso IEEE 8, 118799–118807 (2020).
Artículo de Google Scholar
Sagar, V., Jain, SK Estimación de la inercia del sistema eléctrico mediante la identificación del sistema. En: 2019 IEEE Innovative Smart Grid Technologies-Asia (ISGT Asia), págs. (IEEE, 2019).
Athay, T., Podmore, R., Virmani, S. Un método práctico para el análisis directo de la estabilidad transitoria. Transacciones IEEE sobre sistemas y aparatos de energía (2), 573–584 (Transacciones IEEE sobre sistemas y aparatos de energía, 1979).
Hadavi, S., Phu Me, S., Bahrani, B., Fard, M., Zadeh, A. Generador síncrono virtual versus condensadores síncronos: una comparación basada en simulación de transitorios electromagnéticos. CIGRE Ciencia e Ingeniería 2022(24) (2022). Copyright del editor: ⓒ 2022- CIGRE.
Schirrmeister, RT y cols. Aprendizaje profundo con redes neuronales convolucionales para decodificación y visualización de EEG. Mapeo del cerebro humano 38, 5391–5420 (2017).
Artículo PubMed PubMed Central Google Scholar
Luo, W., Li, Y., Urtasun, R., Zemel, R. Comprensión del campo receptivo efectivo en redes neuronales convolucionales profundas. En Avances en sistemas de procesamiento de información neuronal, vol. 29 (eds Lee, D., Sugiyama, M., Luxburg, U., Guyon, I. y Garnett, R.) (Curran Associates, Inc., 2016).
Araujo, A., Norris, W., Sim, J. Computación de campos receptivos de redes neuronales convolucionales. Destilar https://doi.org/10.23915/distill.00021. https://distill.pub/2019/computing-received-fields (2019).
George, D. & Huerta, E. Redes neuronales profundas para permitir la astrofísica multimensajero en tiempo real. Física. Rev. D 97, 044039 (2018).
Artículo ADS CAS Google Scholar
Sang, W. y col. Generador síncrono virtual, una descripción completa. Energías 15, 6148 (2022).
Artículo de Google Scholar
del Giudice, D., Brambilla, A., Grillo, S. & Bizzarri, F. Efectos de la inercia, amortiguación de carga y bandas muertas en histogramas de frecuencia y control de frecuencia de sistemas de energía. En t. J. Electr. Sistema de energía eléctrica. 129, 106842 (2021).
Artículo de Google Scholar
Paidi, ER, Marzooghi, H., Yu, J. & Terzija, V. Desarrollo y validación de herramientas basadas en redes neuronales artificiales para la previsión de la inercia del sistema eléctrico con penetración de parques eólicos. Sistema IEEE J. 14, 4978–4989 (2020).
ADS del artículo Google Scholar
Schmitt, A., Lee, B. Estimación de la inercia en estado estacionario utilizando un enfoque de red neuronal con información modal. En: Asamblea General de IEEE Power & Energy Society de 2017, págs. 1 a 5 (IEEE, 2017).
Poudyal, A. et al. Estimación de inercia multiárea mediante redes neuronales convolucionales y aprendizaje federado. Sistema IEEE J. 16, 6401–6412 (2022).
ADS del artículo Google Scholar
Adeen, M. y col. Sobre el cálculo de la varianza de variables algebraicas en modelos dinámicos de sistemas eléctricos con procesos estocásticos. Transacciones IEEE sobre sistemas de energía, 1–4 https://doi.org/10.1109/TPWRS.2022.3226076 (2022).
Lugnani, L., Dotta, D., Lackner, C. & Chow, J. Método basado en ARMAX para la estimación constante inercial de unidades de generación utilizando sincrofasores. eléctrico. Sistema de energía. Res. 180, 106097 (2020).
Artículo de Google Scholar
Kundur, P.: Estabilidad y control del sistema eléctrico. (McGraw-Hill, Nueva York, 1994).
Virtanen, P. y col. Scipy 1.0: algoritmos fundamentales para la computación científica en Python. Métodos de la naturaleza 17, 261–272 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Barać, B., Krpan, M., Capuder, T. & Kuzle, I. Modelado e inicialización de una máquina síncrona virtual para simulaciones de frecuencia fundamental de sistemas de energía. Acceso IEEE 9, 160116–160134 (2021).
Artículo de Google Scholar
Hirpara, RH & Sharma, SN Dinámica de un sistema de energía impulsado por procesos de Ornstein-Uhlenbeck. IFAC-PapersOnLine 48, 409–414 (2015). 9º Simposio IFAC sobre Control de Sistemas de Potencia y Energía CPES 2015.
Artículo de Google Scholar
Nwankpa, CO y Shahidehpour, SM Modelado de ruido coloreado en la evaluación de confiabilidad de sistemas de energía eléctrica. Aplica. Matemáticas. Modelo. 14, 338–351 (1990).
Artículo MathSciNet MATEMÁTICAS Google Scholar
Milano, F. & Zárate-Miñano, R. Un método sistemático para modelar sistemas de potencia como ecuaciones algebraicas diferenciales estocásticas. Transacción IEEE. Sistema de energía. 28, 4537–4544 (2013).
ADS del artículo Google Scholar
Arnold, L.: Ecuaciones diferenciales estocásticas. Una publicación de Wiley-Interscience. (Wiley, 1974).
Rosenblatt, F. El perceptrón: un modelo probabilístico para el almacenamiento y organización de información en el cerebro. Psicólogo. Rev. 65, 386 (1958).
Artículo CAS PubMed Google Scholar
Hornik, K., Stinchcombe, M. & White, H. Las redes de alimentación directa multicapa son aproximadores universales. Red neuronal. 2, 359–366 (1989).
Artículo MATEMÁTICAS Google Scholar
Schmidhuber, J. Aprendizaje profundo en redes neuronales: una descripción general. Red neuronal. 61, 85-117 (2015).
Artículo PubMed Google Scholar
Albawi, S., Mohammed, TA, Al-Zawi, S.: Comprensión de una red neuronal convolucional. En: Conferencia Internacional sobre Ingeniería y Tecnología (ICET) de 2017, págs. (IEEE, 2017).
Goodfellow, I., Bengio, Y., Courville, A. Aprendizaje profundo. (Prensa del MIT, 2016).
Kingma, DP, Ba, J. Adam: Un método para la optimización estocástica. Preimpresión de arXiv arXiv:1412.6980 (2014).
Smith, LN Tasas de aprendizaje cíclico para el entrenamiento de redes neuronales. En: Conferencia de invierno del IEEE de 2017 sobre aplicaciones de visión por computadora (WACV), págs. (IEEE, 2017).
Glorot, X., Bengio, Y. Comprender la dificultad de entrenar redes neuronales profundas. En: Actas de la Decimotercera Conferencia Internacional sobre Inteligencia Artificial y Estadísticas, págs. 249-256 (2010). Actas de conferencias y talleres de JMLR.
Abadi, M. et al. TensorFlow: aprendizaje automático a gran escala en sistemas heterogéneos. Software disponible en tensorflow.org (2015). https://www.tensorflow.org/.
Linaro, D., del Giudice, D., Bizzarri, F. & Brambilla, A. PanSuite: Un entorno de simulación gratuito para el análisis de sistemas híbridos de energía eléctrica. eléctrico. Sistema de energía. Res. 212, 108354 (2022).
Artículo de Google Scholar
Pedregosa, F. et al. Scikit-learn: aprendizaje automático en Python. J. Mach. Aprender. Res. 12, 2825–2830 (2011).
MathSciNet MATEMÁTICAS Google Scholar
Platt, J. y col. Resultados probabilísticos para máquinas de vectores de soporte y comparaciones con métodos de probabilidad regularizados. Adv. Grande. Marg. Clasificadores 10, 61–74 (1999).
Google Académico
Müller, M. Deformación dinámica del tiempo. Recuperación de información para música y movimiento, 69–84 (Springer Berlin, Heidelberg, 2007).
Tavenard, R. y col. Tslearn, un conjunto de herramientas de aprendizaje automático para datos de series temporales. J. Mach. Aprender. Res. 21, 1–6 (2020).
Google Académico
Murphy, KP: Aprendizaje automático: una perspectiva probabilística. (Prensa del MIT, 2012).
Breiman, L. Bosques aleatorios. Mach. Aprender. 45, 5–32 (2001).
Artículo MATEMÁTICAS Google Scholar
Descargar referencias
Trabajo parcialmente financiado por Terna Rete Italia SpA, bajo el contrato de investigación número ST236-DSC018.
DEIB, Universidad Politécnica de Milán, Piazza Leonardo da Vinci 32, Milán, 20133, Italia
Daniele Linaro, Federico Bizzarri, Davide del Giudice, Samuele Grillo y Angelo M. Brambilla
ARCES, Universidad de Bolonia, Bolonia, 41026, Italia
Federico Bizzarri
Terna Rete Italia SpA, V.le Egidio Galbani, 70, Roma, 00156, Italia
Cosimo Pisani y Giorgio M. Giannuzzi
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
Conceptualización y metodología, DL, FB y AB; investigación, DL, FB, DdG y AB; análisis formal y software, DL; recursos, CP y GMG; escritura: borrador original, DL; redacción: revisión y edición, todos los autores. Supervisión, FB, AB y SG
Correspondencia a Daniele Linaro.
Los autores declaran no tener conflictos de intereses.
: Nature Communications agradece a los revisores anónimos por su contribución a la revisión por pares de este trabajo. Un archivo de revisión por pares está disponible.
Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Linaro, D., Bizzarri, F., del Giudice, D. et al. Estimación continua de la inercia del sistema eléctrico mediante redes neuronales convolucionales. Nat Comuna 14, 4440 (2023). https://doi.org/10.1038/s41467-023-40192-2
Descargar cita
Recibido: 01 de febrero de 2023
Aceptado: 17 de julio de 2023
Publicado: 24 de julio de 2023
DOI: https://doi.org/10.1038/s41467-023-40192-2
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.
Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.