La Universidad de Nantes recibe un premio Emmy por la creación de un algoritmo de compresión de vídeo para Netflix

Es un acontecimiento para las universidades en Francia, es la primera vez que una universidad francesa tiene este premio. Es el laboratorio de ciencias digitales (LS2N) de Polytech Nantes el que está detrás de este trabajo.

«Estaba en una reunión en Zoom, vi pasar un correo electrónico, pensé, aquí, es un spam», dice Patrick Le Callet, profesor de Polytech Nantes e investigador del Laboratorio de Ciencias Digitales de Nantes (LS2N – Universidad de Nantes – CNRS – Centrale Nantes – IMT Atlantique).

«Al día siguiente, recibo otro mensaje de la academia de los Emmy: una persona me pide mi dirección física, ahí, me digo que hace dos veces y respondo amablemente mientras me digo que puedo estar respondiendo a un spam».

Durante una reunión con Netflix, Patrick Le Callet entiende que esto no es ni un spam, ni una broma, sino bien la realidad. «Detrás de una enorme comunicación, es la primera vez que una universidad recibe un premio así.»

Esto es realmente algo enorme y no es nuestra cultura en Francia premiar la tecnología. Los americanos lo están haciendo y yo ni siquiera sabía que existía.

Patrick Le Callet

Un codificador llamado VMAF (Video Multimethod Assessment Fusion)

Los investigadores del IPI (Image Perception and Interaction) han estado estudiando la percepción visual, o cómo mejorar simplemente un flujo de vídeo.
La idea es mejorar la compresión de vídeo para aligerar los flujos de vídeo sin perder calidad.

«Hemos desarrollado una forma de predecir la calidad de un vídeo tal y como la percibirá el ser humano. El Emmy, lo tenemos para la innovación abierta, cuando pongamos un vídeo, el algoritmo va a ser capaz de decir cuál es la calidad percibida por los humanos. Esto nos permite optimizar las recetas de compresión», explica Patrick Le Callet.

El hecho de comprimir es interesante, ya que podremos emitir en tuberías más constreñidas, donde tengamos flujos limitados, el peso del almacenamiento y la difusión también es importante porque disminuirá la huella ecológica

«El objeto de la innovación es un algoritmo de código abierto que permite comprimir lo máximo posible, manteniendo un máximo de calidad. Ahí, con Netflix, tuvimos la oportunidad de probar a una escala muy-muy grande el resultado, es inmediatamente visible», continúa el investigador.

Un trabajo en equipo

«En su momento tuvimos los formatos de audio tipo MP3 que se reproducían en lo mismo. La pregunta era: ¿qué se puede sacar de las frecuencias o sonidos que no se oyen? Si no tenemos que transmitirlo, comprimirlo y archivarlo, ya hemos ganado».
Este fue el comienzo de la gran aventura, que empujaría a Patrick Le Callet a interesarse no por el sonido, sino por el vídeo. «Trabajamos mucho en eso, en cómo optimizar la compresión, en entender el sistema visual humano, en comprender mejor sus límites».
Estudios significativos, durante varios años, interactuando con varias disciplinas, como «un profesor oftalmólogo especializado en neurociencia, especialistas en interfaz humano-ordenador, informáticos, estudiantes de doctorado, que me trajeron para supervisar, venían bien del procesamiento de señales, de la informática, o de la psicología cognitiva».

Los tres pilares de la investigación

«El primer pilar es desarrollar tecnologías experimentales con humanos para entender cómo funciona. El segundo es más bien cómo crear modelos algorítmicos que exploten esos datos para determinar cómo percibimos los colores, qué nos llama la atención, etc… Y luego, el último pilar, es cómo aplicar eso en la tecnología que produce y entrega la imagen con, al final de la cadena, los humanos».
Mucho trabajo, mucho éxito, y un día llegan los gigantes digitales. «Yo lo fecho en 2014, el ecosistema europeo se preguntaba entonces mucho sobre esto, y nos estaban adelantando los gigantes digitales, pero los gigantes digitales vienen a mí. Para algunos de ellos, era la primera vez que salían de Estados Unidos para tratar estos temas. Era Netflix!», y su capacidad de financiación en modo mecenazgo.

Pudimos hablar rápidamente de la propiedad intelectual, de los aspectos legales y, como resultado, no tardamos tres meses en ponernos de acuerdo. Así que Netflix es el primero que nos financia en modo mecenazgo.

«Las herramientas que desarrollamos y por las que obtuvimos el premio Emmy, son herramientas de innovación abierta, han pasado a ser de dominio público. La financiación también pudo funcionar porque había dos apoyos, CAPACITÉS que es la filial privada de la Universidad de Nantes, especializada en la ingeniería de proyectos innovadores y el Laboratorio de Ciencias Digitales de la Universidad de Nantes, era un poco un ovni en el mundo académico francés».
También fue muy decisivo para responder a los grandes grupos estadounidenses, como Netflix: «Estamos en Francia, pero tenemos, enfrente, buenos jugadores capaces de discutir. Hablamos de donaciones, tenemos la fundación Capacity, hablamos de innovación, tenemos el Laboratorio.»

Facebook, YouTube, Amazon, vienen los otros gigantes

«Desde entonces, están Facebook, YouTube y también tenemos otros contratos vivos como ByteDance, Amazon y otros, nos identifican como un gran centro de referencia, nuestros estudiantes de doctorado son cazados furtivamente antes de terminar la tesis, con salarios inimaginables.»

Para que conste, me voy con un estudiante de doctorado a Silicon Valley, he vuelto solo porque Apple me ha pillado. Yo, soy el único que queda, pero tengo mi libertad, no tengo el cartel de Netflix aunque fue Netflix el primero.

Patrick Le Callet

«Hay empresas con las que sí abro negociaciones y hay algunas con las que no. Es un modelo de financiación que funciona bien y que nos ha hecho muy visibles.»

Este premio Emmy es el árbol que esconde el bosque

Patrick Le Callet no quiere quedarse ahí, con esta experiencia y su algoritmo en torno a los humanos y el vídeo, apunta a otras áreas de aplicación. «Todo este conocimiento, sobre todo en el aspecto del protocolo experimental y el modelo asociado, podemos hacerlo en muchas cosas como los alimentos, los productos manufacturados, la ergonomía en la interacción entre humanos y robots, todo eso, son cosas que no puedo esperar a traer a nuestro ecosistema, ya sea Loira, nacional o europeo».

«Yo, uso mucho la IA (inteligencia artificial) para entender lo que hacen los humanos. Hoy, con los algoritmos de IA, quiero entender cómo funcionan, porque llegan a ser casi tan complicados como los humanos, para mejorar la colaboración entre humanos y máquinas.»

Universidad de Nantes / Patrick Le Callet
Un laboratorio de investigación de la Universidad Nantes – © Universidad de Nantes / Patrick Le Callet

¿Cuáles son los ámbitos de aplicación? «Obviamente está todo lo audiovisual, la compresión, hoy me interesa cómo interactuamos con una inteligencia artificial, cómo podemos entender y hacer aceptable la colaboración hombre-máquina sobre todo con los Tchatbots».

«También estamos trabajando en la experiencia del gusto, en la robótica agrícola para saber cómo podemos ayudar, asistir, sobre todo en la huerta con máquinas inteligentes para evitar el desperdicio de alimentos. Siempre me ha interesado entender cómo funciona el ser humano y qué podemos hacer con él en la tecnología. Es enorme, es la computación cognitiva en el centro de mis actividades», concluye el investigador de la Universidad de Nantes.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *