Codea Blog  

Blog Details

CONTROLADOR PID CON INTELIGENCIA ARTIFICIAL PARA EL CONTROL DE UNA COLUMNA DE DESTILACIÓN

CONTROLADOR PID CON INTELIGENCIA ARTIFICIAL PARA EL CONTROL DE UNA COLUMNA DE DESTILACIÓN

 

1. INTRODUCCIÓN

¿QUÉ ES UNA COLUMNA DE DESTILACIÓN?

 

Es un elemento esencial utilizado en la destilación de mezclas líquidas para separar la mezcla en sus partes componentes o fracciones, en función de las diferencias en las volatilidades. Ampliamente utilizadas en industrias de procesos químicos tales como el procesamiento del petróleo, producción petroquímica, procesamiento de gas natural, separación de aire licuado, producción de solventes de hidrocarburos, etc.

Las partes básicas de una columna de destilación son: la columna de destilación que separa la mezcla aprovechando su punto de ebullición, una entrada (alimentación) y dos salidas (superior e inferior). La salida superior, llamada el destilado o producto ligero, salen los componentes más volátiles con un punto de ebullición mas bajo, mientras que la parte inferior, llamada los fondos o producto pesado, los mas pesados. Las columnas también tienen un elemento en la parte superior llamada el condensador, que condensa los vapores que salen por la parte superior y los resircula a la columna y otros que salen como producto, en la parte inferior se tiene otro elemento llamado hervidor que realiza el proceso contrario, resircula los líquidos y sale un producto.

EL funcionamiento de toda columna de destilación se basa en que existe un vapor que asciende por la columna el cual se encuentra con un líquido que desciende, entonces se produce una transferencia de materia y energía en cada etapa (bien sea un plato o una porción de relleno). Aunque la alimentación sea un líquido subenfriado, el vapor aparece como consecuencia del hervidor situado en la parte inferior de la columna, hay que tener en cuenta que los únicos aporte de calor a lo largo de la columna se realizan en el hervidor y en el condensador.

El vapor a medida que se aproxima a la parte superior de la columna, se enriquece en los componentes volátiles de la mezcla, mientras que el líquido que circula en contracorriente arrastra los componentes más pesados.

Las corrientes que salen de cada etapa se encuentran en equilibrio pero las que entran no lo están. Las corrientes de líquido están en sus puntos de burbuja y las corrientes de vapor en sus puntos de rocío, por tanto se produce un intercambio calorífico entre ambas corrientes.

 

PLANTEAMIENTO DEL PROBLEMA

 

Más de 40 000 columnas de destilación en los EE. UU. consumen entre el 40% y el 60% de la energía total de la industria petroquímica (6% del total de energía de los EE. UU.). Reducir el uso de energía de destilación tendría un gran impacto en la independencia energética, las emisiones de gases de efecto invernadero y daría una ventaja competitiva a cualquier fabricante que esté mejor capacitado para implementar mejoras (optimización del proceso).

El objetivo de este trabajo es mantener una fracción molar aérea para el componente de luz en una columna de destilación binaria que separa el ciclohexano y el n-heptano. El estado estacionario nominal para la columna es una relación de reflujo en 3.0 con un rango permisible de 1.0 a 10.0. Esta relación de reflujo produce un producto de ciclohexano con una pureza de 0.935 (fracción molar), pero la composición objetivo es de 0.970 con un rango permisible de 0.960 a 0.980.

Inicialmente el objetivo era diseñar un controlador PID para cumplir con este valor objetivo y mantenerse dentro de la gama de productos especificada. Sin embargo, en el contexto de la industria 4.0 y  la evolución de los gemelos digitales, se plantea la posibilidad de sustituir el controlador PID por modelos basados en Machine Learning, específicamente un modelo de regresión polinómica y un modelo LSTM (Long Short-Term Memory). Estos modelos no solo replican el comportamiento del sistema físico (gemelo digital), sino que también pueden optimizar el control del proceso en tiempo real.

 

Figura 1. Columna de destilación.

Descripción de la imagen

 

2. MODELO MATEMATICO DEL SISTEMA Y MODELO DEL CONTROLADOR PID

MODELO MATEMÁTICO DEL SISTEMA (MODELO DE ESTADOS)

 

El sistema de columna de destilación fue modelado para simular la separación de ciclohexano y n-heptano, generando datos que describen el comportamiento de la columna bajo una condición operativa. Los dos componentes están separados sobre 30 bandejas teóricas para la separación de una mezcla binaria. Las concentraciones en cada etapa o bandeja están altamente correlacionadas. La dinámica del proceso de destilación puede describirse mediante un número relativamente pequeño de estados dinámicos subyacentes.

La columna tiene 32 estados y se supone que tiene una volatilidad relativa constante de 1.6 y composición de productos simétricas. El flujo de alimentación se introduce en el centro de la columna en la etapa 17 y tiene una composición de x

La funcionón "distill" simula la columna verdadera, los datos de entrada son los valores iniciales de reflujo (x), ratio de reflujo (rr), radio del caudal (Feed) y los valores de la concentración (x_Feed) de la entrada de la sustancia a la entrada de la columna. La variable "x" es el valor del producto final, se quiere que este valor llegue a 0.97 modificando la variable "rr". El valor de "x" es un conjunto de 32 valores iniciales representando todos los estadios de la columna de destilación.

Cálculo de y[i]: Esta parte del código calcula la fracción molar de vapor de cada componente en cada bandeja utilizando la volatilidad relativa. Esto se basa en la suposición de que existe un equilibrio entre las fases líquida y vapor en cada etapa.

Cálculo de xdot: Aquí se calculan las tasas de cambio de las concentraciones en cada bandeja (xdot). Este vector describe cómo cambia la composición en cada etapa de la columna debido a la interacción entre el líquido y el vapor. Las ecuaciones diferenciales que se usan provienen de balances de masa y energía.

  • Condensador (xdot[0]): La tasa de cambio de la concentración en el condensador depende del balance entre el vapor que viene de la primera bandeja y el líquido que regresa desde el condensador.
  • Bandejas 1 a 15 (xdot[1] a xdot[15]): Las tasas de cambio en estas bandejas dependen del balance entre el líquido que desciende de la bandeja superior y el vapor que asciende de la bandeja inferior.
  • Bandeja de alimentación (xdot[16]): Aquí se tiene en cuenta el flujo de alimentación que entra en la bandeja 17, afectando la concentración en esta etapa.
  • Bandejas 17 a 30 (xdot[17] a xdot[30]): Similar a las bandejas anteriores, pero en la sección de agotamiento de la columna, donde el líquido desciende desde la bandeja superior y el vapor asciende desde la bandeja inferior.
  • Reboiler (xdot[31]): La última ecuación corresponde al reboiler, que es el punto donde el líquido se vaporiza y asciende nuevamente por la columna.

 

Figura 2. Código de modelo matemático de la columna de destilación.

Descripción de la imagen

 

El modelo simula cómo cambia la composición de la mezcla a lo largo de la columna bajo diferentes condiciones operativas (por ejemplo, cambios en la relación de reflujo). Esto permite analizar y diseñar un controlador PID que ajuste la relación de reflujo para mantener la pureza del producto deseado en el tope de la columna (0.97 fracción molar de ciclohexano).

 

DISEÑO DEL CONTROLADOR PID

 

Un controlador PID (Proporcional-Integral-Derivativo) es un mecanismo de retroalimentación de bucle de control ampliamente utilziado en sistemas de control industrial, debido a su aceptable desempeño en la mayoria de aplicaciones para mantener una variable de proceso (como temperatura, velocidad o presión) en un valor deseado. Estos controladores utilizan un algoritmo que calcula continuamente la diferencia entre valor deseado y el valor actual de la variable de proceso (error) y ajusta la salida del controlador en consecuencia para minimizar el error.

Un controlador PID consta de tres componentes que se ajustan segun la diferencia entre un punto de ajuste (SP) y una variable de proceso medido (PV). La salida del controlador PID (u(t)) se calcula utilizando la suma de los términos Porporcional, Integral y Derivado donde KP, KI y KD son constantes que se pueden ajustar para mejorar el rendimiento del controlar.

 

Figura 3. Ecuaciones del controlador PID.

Descripción de la imagen

 

El componente Proporcional ajusta la salida del proceso en función del error actual entre el punto de ajuste y la variable de proceso (PV), cuanto mayor es el error, mayor es la correción aplicada. El componente Integral ajusta la salida en función del error acumulado a lo largo del tiempo, ayuda a eliminar el error de estado estacionario y puede mejorar la estabilidad del sistema de control. El componente Derivativo ajusta la salida en función de la tasa de cambio del error, ayuda a amortiguar las oscilaciones y mejorar la estabilidad del sistema de control. Los filtros son importantes para obtener una mejor estimación de la tasa de cambio de variable del proceso.

Los controladores digitales se implementan con periodos de muestreo discretos y se necesita una forma discreta de la ecuación PID par aproximisar la integral del error y la derivada. Esta modificación reemplaza la forma continua de la integral con una suma del error y usos. Como el tiempo entre las instancias de muestreo y como el número de instancias de muestreo. también reemplaza la derivada con una versión filtrada de la derivada u otro método para aproximizar la pendiente instantánea de la (PV).

 

Figura 4. Modelo de controlador digital PID.

Descripción de la imagen

 

Las mismas correlaciones de sintonización se utilizan tanto para las formas continuas como discretas del controlador PID.

Windup Anti-Reset es una característica importante de un controlador con un término integral es considerar el caso donde sale el controlador  $u(t)$ se satura en un límite superior o inferior durante un período prolongado de tiempo. Esto hace que el término integral se acumule a una suma grande que hace que el controlador permanezca en el límite de saturación hasta que se reduzca la suma integral. El windup anti-reset es que el término integral no se acumula si la salida del controlador está saturada en un límite superior o inferior.

El objetivo es diseñar un controlador PID para cumplir con este valor objetivo y permanecer dentro del rango de productos especificado.

  • Variable manipulada: Relación de reflujo definada por RR (Relación del caudal de destilado que regresa a la columna dividido por el caudal del producto que sale)
  • Variable controlada: composición del destilado (X_d) fracción molar.
  • Perturbaciones medidas: (1) Caudal de alimentación, (2) Composición de la alimentación (fracción molar)

 

Figura 5. Control PID en Python,

Descripción de la imagen

Figura 6. Datos generados del modelo de la planta y el controlador PID.

Descripción de la imagen

La línea azul discontinua muestra cómo el controlador PID ajusta la relación de reflujo a lo largo del tiempo para mantener la fracción molar deseado en el destilado (xd). Se observan picos en la relación de reflujo cuando hay cambio significativos en la fracción molar del destilado  o cuando el set point cambia, estos picos indican que el controlador está realizando ajustes para corregir desviaciones de la fracción molar del destilado respecto al set point. Cuando la relación de reflujo se estabiliza (lineas mas planas), significa que el sistema ha alcanzado un nuevo equilibrio o que la fracción molar está cerca del valor deseado.

La linea negra muestra los set points, que son los valores objetivos para la fracción molar en el destilado a lo largo del tiempo. La linea roja muestra la fracción molar real del ciclohexano en el destilado, que es la variable del proceso que el controlador está tratando de mantener cerca del set point. Las oscilaciones o desviaciones indican cómo responde el sistema a cambios en el set point, y cómo el controlador PID trabaja para minimizar esas desviaciones.

 

Con el procedimiento anterior se ha encontrado el valor del ratio de reflujo rr, las variable de entrada serían el valor de concentración a la salida xd y el valor se set point sp.

Con el sistema a partir de xd se encuentra el valor de rr, lo que modifica el funcionamiento de la columna de destilación con la ayuda del controlador PID. Ahora en el caso de este articulo quien debe modelar el proceso es un modelo de regresión lineal multiple o una LSTM.

Figura 7. Diagrama de bloques del control realimentado.

Descripción de la imagen

 

3. MODELO DE REGRESION LINEAR MULTIPLE PARA PREDICCIÓN DE LA SEÑAL RR

 

Se debe tener presente lo siguiente con los modelos polinómicos, son altamente flexibles y buenos aproximadores pero sobreajustan con facilidad. Para evitar este sobreajuste se puede optar por las siguientes estrategias:

  • Separar un conjunto de datos de validación para la selección del modelo-
  • Seleccionar manualmente las características.
  • Mantener todas las características pero reduce el valor de los parámetros wd.

 

PARTICIONAMIENTO DE DATOS

 

Conjunto de ENTRENAMIENTO: conjunto de datos más grande usado para entrenar el modelo, es decir se ajusta los parámetros del modelo en función de las características y etiquetas de los datos de entrenamiento. El objetivo es encontrar los parámetros óptimos que minimicen la función de error o pérdida de su modelo.

Conjunto de VALIDACIÓN: conjunto de datos pequeño que se utiliza para evaluar el modelo durante el proceso de entrenamiento. No se usa para ajustar los parámetros del modelo, sino para medir como generaliza el modelo de datos no vistos. Este conjunto ayuda a ajustar los hiperparámetros del modelo, como la taza de aprendizaje, número de épocas o el factor de regularización.

Conjunto de TEST: conjunto final de datos que se usa para probar el modelo después del proceso de entrenamiento y validación. No se usa para entrenar o ajustar el modelo, sino para evaluar el rendimiento del modelo en datos nuevos e independientes. El objetivo es estimar el verdadero error o la presición de su modelo en el conjunto de pruebas y compararlos con otros modelos o puntos de referencia.

El conjunto de ENTRENAMIENTO debe ser lo suficientemente grande para capturar patrones y características de los datos, evitando al mismo tiempo un ajuste insuficiente o un sesgo alto. El conjunto de VALIDACIÓN debe ser lo suficientemente pequeño como para no reducir el conjunto de ENTRENAMIENTO, pero la suficientemente grande como para evitar el sobreajuste o la alta varianza y el conjunto de TEST debe ser representativo de la distribución de datos. Una proporción común para dividir los datos es de 60% para ENTRENAMIENTO, 20% para VALIDACIÓN y 20% para TEST, puede variar según los datos y el problema.

Se seleccionan las variables independientes (sp, xd, err) y la variable dependiente (rr) para el modelo. X contendrá las características y y será el vector objetivo.

 

Figura 8. Particionamiento de datos.

Descripción de la imagen

 

ENTRENAMIENTO DEL MODELO DE REGRESIÓN LINEAL MÚLTIPLE

 

Se construye un modelo de regresión simple con Keras, usando una capa densa (Dense) con una unidad de salida. Se compila el modelo con el optimizador adam y se utiliza mean_squared_error como función de pérdida.

Se emplea la técnica de EarlyStopping para detener el entrenamiento si la pérdida de validación no mejora durante 25 épocas consecutivas, evitando así el sobreajuste. En la curva de pérdidas se utiliza para evaluar el rendimiento y ajuste de los modelos durante el entrenamiento, verificando si el modelo está aprendiendo correctamente.

 

Figura 9. Curva de pérdidas.

Descripción de la imagen

Para seleccionar el mejor valor de ventana (window) en el modelo, se esta considerando los valores de MSE y R2.

MSE significa "Mean Squared Error" (Error Cuadrático Medio) es una medida de la cantidad de error entre un conjunto de valores observados y los valores predichos por un modelo de regresión. El MSE se calcula como la media de los errores al cuadrado entre los valores observados y los valores predichos. Es decir, se calcula la diferencia entre los valores observados y los valores predichos, se eleva al cuadrado, y se promedian para obtener el MSE. Cuanto menor sea el valor de MSE, mejor será el modelo.

El valor de R2 indica la proporción de la variabilidad en los datos que es explicada por un modelo de regresión. Por lo tanto, cuanto más cercano a 1 sea el valor de R2, mejor será el modelo.

Algunos valores típicos de R2 pueden ser los siguientes:

  • R2 cercano a 1: Indica que el modelo explica la mayoría de la variabilidad en los datos y se considera un modelo muy bueno.
  • R2 cercano a 0.7-0.9: Indica que el modelo explica una gran parte de la variabilidad en los datos y se considera un modelo bueno.
  • R2 cercano a 0.5-0.7: Indica que el modelo explica una cantidad moderada de la variabilidad en los datos y se considera un modelo aceptable.
  • R2 cercano a 0: Indica que el modelo no explica bien la variabilidad en los datos y se considera un modelo pobre.

 

Figura 10. Validando hiperparámetro windows.

Descripción de la imagen

 

El valor de ventana de 20 resulta una buena opción para que el modelo pueda generalizar, dado que tiene el mejor equilibrio entre un MSE bajo y un R² alto, especialmente en el conjunto de validación, lo que es crucial para evaluar la capacidad del modelo para generalizar a datos no vistos. Si se busca que el modelo se ajuste mejor al conjunto de prueba, la ventana 15 se podría considerar (las diferencias son mínimas). 

 

VALIDANDO EL ORDEN DEL POLINOMIO

 

Figura 11. Validando grado de polinomio.

Descripción de la imagen

 

Con el polinomio de grado 4 se obtuvo un MSE menor y R2 cercano a 1, sin embargo no hay mucha diferencia con un polinomio de grado 3, "En igualdad de condiciones, la explicación más sencilla suele ser la más probable" (Nabaja de Ockham). En este caso es preferible escoger el menor orden al tener curvas mas suaves. 

 

Figura 12. 

Descripción de la imagen

 

4. MODELO LSTM PARA LA SEÑAL RR

 

Una Long Short-Term Memory (LSTM) es un tipo de red neuronal recurrente (RNN) que se utiliza para modelar secuencias y datos que dependen del tiempo. A diferencia de las RNN tradicionales, las LSTM pueden aprender dependencias a largo plazo debido a su arquitectura interna que incluye "puertas" que regulan el flujo de información. Evita el Problema del Desvanecimiento del Gradiente: Gracias a su arquitectura de puertas, las LSTM pueden mitigar el problema del desvanecimiento del gradiente, común en las RNN tradicionales. Para que el modelo generalice bien, las LSTM a menudo requieren una gran cantidad de datos de entrenamiento, además que son más complejas y requieren más tiempo de entrenamiento en comparación con las RNN tradicionales.

 

Figura 13. Escalamiento de los datos de entrada y salida.

Descripción de la imagen

 

SELECCION DE HIPERPARAMETROS

 

El modelo se beneficia de la experimentación con diferentes configuraciones de valores de hiperparámetros. Un ajuste cuidadoso de estos hiperparámetros es crucial para obtener un rendimiento óptimo.

El uso de EarlyStopping es esencial para detener el entrenamiento en el momento adecuado, asegurando que el modelo no aprenda demasiado los detalles del conjunto de entrenamiento y generalice mejor a datos no vistos.

 

Figura 14. Selección de hiperparámetro.

Descripción de la imagen

Figura 15.. Curva de pérdidas.

Descripción de la imagen

Para este caso se considera que un valor óptimo de "nH" es de 40, puede considerarse a partir de 35. 

 

Figura 16. Entrenamiento con el valor óptimo de hiperparámetro.

Descripción de la imagen

Figura 17. Predicción con los datos de prueba.

Descripción de la imagen

 

Figura 18. Predicción con los datos de validación.  

Descripción de la imagen

Se conigue una buena aproximación de la señal "rr", con la utilización de un modelo LSTM.

 

5. CONCLUSIONES

 

La regresión múltiple es un modelo más simple y fácil de interpretar. Permite entender directamente cómo cada variable independiente afecta a la variable dependiente. Si el modelo ha logrado resultados comparables en términos de MSE (Error Cuadrático Medio) y R² a los obtenidos con el modelo LSTM, esto sugiere que las relaciones entre las variables son predominantemente lineales o casi lineales.

La regresión múltiple es menos costosa en términos de tiempo de computación y recursos. Esto es especialmente relevante si se trabaja con grandes volúmenes de datos o en entornos con recursos limitados.

Las LSTM son capaces de capturar relaciones complejas y dependencias temporales en los datos que no pueden ser capturadas por modelos lineales. Esto es particularmente útil en series de tiempo o cuando la dependencia temporal es clave. Tienen la capacidad de modelar relaciones no lineales más complejas, lo que puede ser ventajoso en sistemas donde la dinámica no es puramente lineal.

La implementación de gemelos digitales basados en machine learning, representa un paso adelante en la optimización del control de procesos industriales, ofreciendo ventajas significativas en términos de eficiencia energética y calidad del producto final.

 

6. REFERENCIAS

 

  • Juergen Hahn, Thomas F. (17 Abril, 2002). An improved method for nonlinear model reduction using balancing of empirical gramians. Computers and Chemical Engineering 26.
  • A. Benallou, D. Seborg, D. Mellichamp (Julio, 1986). Dynamic Compartmental Models for Separation Processes. AIChE Journal Vol. 32
  • H. Tan, L. Cong (16 Febrero, 2023). Modeling and Control Design for Destillation Columns Based on the Equilibrium Theory. Processes 2023, 11, 607.
  • DYNAMICS AND CONTROL (26 Septiembre, 2020). TCLAB PID CONTROL. Recuperado de: https://apmonitor.com/pdc/index.php/Main/TCLabPIDControl
  • MACHINE LEARNING FOR ENGINEERS (20 Noviembre, 2023). AUTOMATION WITH LSTM NETWORK. Recuperado de: https://apmonitor.com/pds/index.php/Main/LSTMAutomation
  • DYNAMICS AND CONTROL (26 Septiembre, 2020). DISTILLATE COMPOSITION CONTROL. Recuperao de: https://apmonitor.com/pdc/index.php/Main/DistillationControl
  • APMONITOR (17 Marzo, 2019). DISTILLATION COLUMN. Recuperado de: https://apmonitor.com/wiki/index.php/Apps/DistillationColumn
  • DYNAMICS AND CONTROL (7 Diciembre, 2023). PROPORTIONAL INTEGRAL DERIVATIVE PID. Recuperado de: https://apmonitor.com/pdc/index.php/Main/ProportionalIntegralDerivative
  • DYNAMICS AND CONTROL (17 Junio, 2024). TEMPERATURE CONTROL LAB. Recuperado de: https://apmonitor.com/pdc/index.php/Main/ArduinoTemperatureControl
  • DYNAMICS AND CONTROL (26 Octubre, 2021). ADVANCED TEMPERATURE CONTROL. Recuperado de: https://apmonitor.com/do/index.php/Main/AdvancedTemperatureControl
  • DYNAMICS AND CONTROL (17 Septiembre, 2021). BALANCE EQUATIONS. Recuperado de: https://apmonitor.com/pdc/index.php/Main/PhysicsBasedModels

Comentarios

Registrate o Inicia Sesión para comentar y obtener Cursos de pago gratis

function loadurl(){ var val1 = document.getElementById("valor3").value; console.log(val1); if(val1){ window.location = "/comunidad/blog/filtrar/"+val1+"/"} }