Los atascos de tráfico deberían desaparecer con la inteligencia artificial y los vehículos autónomos

Barcelona, 17 de mayo del 2022.- Para los vehículos completamente autónomos pueden quedar aún entre 5 y 10 años. Mientras tanto, el MIT investiga si se puede aplicar la inteligencia artificial para solucionar definitivamente los atascos de tráfico. Este es el reportaje publicado por la revista Motor.

Los semáforos de las intersecciones fueron concebidos para organizar el tráfico, pero en ocasiones la impaciencia o las prisas hacen que se acabe produciendo un embotellamiento. Esto acaba ralentizando el tráfico aún más, generando de paso mayor contaminación ambiental y acústica.

Recientemente, te hablábamos de un experimento de Ford con el que la marca estadounidense intenta agilizar los desplazamientos de los vehículos de emergencia en las grandes ciudades.

Ahora conocemos otro de corte similar, aunque más ambicioso todavía. Se trata de una investigación iniciada por ingenieros del MIT que tiene como objetivo acabar con las esperas en los semáforos en rojo y, de paso, con los atascos en las intersecciones.

Eso sí, este proyecto está encaminado a su aplicación a largo plazo, pues el objetivo es implementarlo en los vehículos autónomos. El plan es conseguir que, mediante un proceso de aprendizaje con inteligencia artificial, este tipo de vehículos no tengan que esperar parados en los semáforos en rojo.

Para ello, los investigadores del MIT demuestran un enfoque de aprendizaje automático que puede aprender a controlar una flota de vehículos autónomosa medida que se acercan y viajan a través de una intersección señalizada de una manera que mantiene el tráfico fluido.

«Una sola intervención con una reducción del 20 al 25% en combustible o emisiones es realmente increíble»

Esto, según los integrantes del estudio, genera varias ventajas. Por un lado, se reduce el consumo de combustible y las emisiones. Por otro lado, mejora la velocidad promedio del vehículo, acortando así el tiempo necesario para cada trayecto.

Las simulaciones muestran que la técnica obtiene los mejores resultados si todos los automóviles son autónomos, pero incluso si sólo el 25% usa su algoritmo de control, se siguen generando beneficios sustanciales de combustible y emisiones.

«Este es un campo realmente interesante para intervenir», dice la autora principal Cathy Wu, profesora asistente de desarrollo profesional de Gilbert W. Winslow en el Departamento de Ingeniería Civil y Ambiental y miembro del Instituto de Datos, Sistemas y Sociedad (IDSS) y el Laboratorio de Sistemas de Información y Decisión (LIDS).

«Estar atrapado en una intersección no mejora la vida de nadie. Con muchas otras intervenciones de cambio climático, se espera una diferencia en la calidad de vida, por lo que hay una barrera de entrada. En este caso, la barrera es mucho más baja», apunta Wu.

En las grandes ciudades, en muchas ocasiones no es tan simple como cruzar una intersección de dos calles, ya que existen muchas variables que complican múltiples puntos de circulación. Varios carriles, señales, cantidad de vehículos, velocidad, peatones, ciclistas, patinetes… son muchos los elementos a tener en cuenta. 

Para lidiar con estas complejidades, el proyecto para la mejora del tráfico del MIT adopta un enfoque distinto al habitual: una técnica sin modelo conocida como aprendizaje de refuerzo profundo.

El aprendizaje por refuerzo es un método de prueba y error en el que el algoritmo de control aprende a tomar una secuencia de decisiones. Es recompensado cuando encuentra una buena secuencia. Con el aprendizaje de refuerzo profundo, el algoritmo aprovecha las suposiciones aprendidas por una red neuronal para encontrar atajos a buenas secuencias, incluso si hay miles de millones de posibilidades.

Esto es útil para resolver un problema a largo plazo como el del tráfico en las ciudades. Para ello, «el algoritmo de control debe emitir más de 500 instrucciones de aceleración a un vehículo durante un período de tiempo prolongado», explica Wu.

«Y debemos tener la secuencia correcta antes de saber que hemos hecho un buen trabajo mitigando las emisiones y llegando a la intersección a buena velocidad», agrega. Pero se plantea un reto más: los investigadores quieren que el sistema aprenda una estrategia que reduzca el consumo de combustible y limite el impacto en el tiempo de viaje. Estos objetivos pueden ser contradictorios.

«Para reducir el tiempo de viaje, queremos que el automóvil vaya rápido, pero para reducir las emisiones, queremos que el automóvil disminuya la velocidad o no se mueva en absoluto. Esas recompensas competitivas pueden ser muy confusas para el agente de aprendizaje», admite Wu.

Si bien es un desafío resolver este problema en toda su complejidad, los investigadores emplearon una solución alternativa utilizando una técnica conocida como modelado de recompensas. Con la configuración de recompensas, le dan al sistema un conocimiento de dominio que no puede aprender por sí solo. En este caso, penalizaban al sistema cada vez que el vehículo se detenía por completo, para que aprendiera a evitar esa acción.

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.