Antonio Pita, premio al Mejor Data Scientist de España 2016

"El Big Data es una verdadera revolución industrial que va a cambiar toda la sociedad"

Emocionado, privilegiado y aún asumiendo que ha sido elegido como el mejor científico de datos de España. Así se encuentra Antonio Pita Lozano, director de Business Analytics de Liberbank y flamante ganador del premio al Mejor Data Scientist de España 2016, especialidad Analítica de Datos, en la primera edición de los Data Science Awards 2016 que concede Synergic Partners, del Grupo Telefónica, y en la que participaron más de 300 científicos de datos.

Alumno de la primera edición del Máster Universitario en Análisis y Visualización de Datos Masivos/Visual Analytics & Big Data, Pita utilizó parte de lo desarrollado en su Trabajo de Fin de Máster (TFM) para dar forma a Sigefilms. El proyecto, que le hizo merecedor de dicho galardón, es un sistema de recomendación de películas personalizado que facilita la selección y mejora la experiencia del usuario gracias al uso de técnicas de Machine Learning sobre tecnología Big Data, y que además incluye un novedoso sistema de validación colaborativa innovador en el sector.

Licenciado en Matemática, DEA en Álgebra, Pita es un firme defensor del Big Data, disciplina en la que cuenta con una dilatada trayectoria como especialista -ha impartido multitud de conferencias al respecto- y sobre la que es un firme convencido. No en vano, la valora como “una revolución industrial que va a cambiar toda la sociedad” y sobre la que la demanda laboral continuará creciendo.

P. ¿Cómo se siente al ser reconocido como el mejor Data Scientist de España en 2016?

Muy emocionado, es un honor y un privilegio. Y lo más importante es que este premio ayuda a conocer esta disciplina, Data Science, que en pocos años tendrá un peso importante en las empresas.

P. Para muchos, trabajar con semejante volumen de datos a diario puede ser un verdadero dolor de cabeza, ¿qué le apasiona de ello?

Es muy complicado trabajar con grandes volúmenes de datos, precisa de gran capacidad de abstracción. Es, en efecto, un trabajo duro, pero cuando tras realizar numerosos análisis encuentras un patrón de comportamiento, una regla que va a ayudar a la empresa a mejorar la experiencia de los clientes, la calidad del trabajo de los compañeros o los resultados de la propia compañía, sientes una gran satisfacción. Es un momento de ‘¡Eureka!’, como el de un minero que encuentra oro.

P. ¿Por qué se decantó por el proyecto Sigefilms? ¿En qué consiste?

La segunda fase del concurso era común para todos y consistía en el desarrollo de un sistema de recomendación de películas. El reto era que solo contábamos con un mes y no disponíamos de datos, teníamos que buscarlos en Internet. Sigefilms contiene más de 120.000 películas por las que el cliente puede navegar mediante las categorías clásicas como género, director o actor o también a través de las películas más parecidas a las seleccionadas, que se consigue mediante técnicas de text-mining que permiten calcular la similitud entre dos películas.

Una revista concluyó, en 2012, que el trabajo más sexy del siglo XXI sería el de científico de datos

P. ¿Y qué es lo realmente novedoso?

Que hay tres tipos de sistemas de recomendación. El primero se basa en los gustos del usuario, que se propagan al resto de películas en función de la similitud entre ellas y permite calcular un valor para cada película y seleccionar las más adecuadas. El segundo se basa en los parecidos entre los usuarios, el algoritmo selecciona las películas mejor valoradas por usuarios con gustos similares. Por último, un sistema que utiliza la información de las películas y el parecido de los gustos de los usuarios para poder, mediante técnica de Machine Learning, seleccionar aquellas a recomendar. Estos algoritmos están continuamente aprendiendo por ellos mismos en tiempo real y, cada vez que un usuario valora una película, esta es utilizada por el resto en tiempo real. Para que esto sea posible es necesario contar con tecnología Big Data.

P. El análisis de datos está cobrando una importancia vital en todos los ámbitos de la sociedad actual, ¿es un área laboral a tener en cuenta?

En 2012, la revista Harvard Business Review concluyó que el trabajo más sexy del siglo XXI sería el de científico de datos. En EE.UU y Gran Bretaña tienen serios problemas para encontrar profesionales porque la demanda excede la oferta. En España proliferan también las ofertas. El mercado laboral está muy activo. Pero, ¿esta será una demanda pasajera? Creo que no.

P. ¿Por qué?

Porque el crecimiento de los datos es exponencial y en las empresas se capturan cada vez más datos de todas las áreas: ventas, producción, publicidad, etc. Son fundamentales para optimizar los procesos y mejorar la experiencia del cliente, lo que requiere de profesionales cada vez más cualificados. Es una tendencia creciente que se verá desbordada en los próximos años, cuando se generalice el Internet de las Cosas (IoT) y el uso de sensores.

P. ¿Cómo afectará la tecnología Big Data al futuro de las empresas y de las personas?

Nos permite mejorar nuestra toma de decisiones procesando cada vez más información en menos tiempo y, mediante técnicas de Machine Learning, aprender continuamente. Ello nos permite externalizar en las máquinas decisiones rutinarias como elegir la mejor ruta para ir al trabajo, controlar mi ritmo cardíaco al realizar deporte, elegir una película, seleccionar las noticias que me interesan o ayudarme a encontrar el regalo que quiero.

Desde un punto de vista empresarial, ya acometen tareas como comprar y vender acciones en Bolsa, realizar subastas de publicidad, detectar máquinas que van a fallar, optimizar las rutas de transporte, realizar diagnósticos médicos y conducir de forma autónoma. Es una verdadera revolución industrial que va a cambiar toda la sociedad. Siempre que se tenga que tomar una decisión en cualquier ámbito, profesional o personal, ¿por qué no apoyarse en los datos y técnicas analíticas que te permiten elegir la mejor alternativa?

Mi experiencia en UNIR fue muy buena y el Máster en Visual Analytics & Big Data resultó exactamente lo que necesitaba

P. Ha comentado que los datos de los usuarios son el nuevo petróleo. En algunas ocasiones, ¿deberíamos tener más cuidado con la información que facilitamos online?

Es normal temer a la pérdida de privacidad. Por suerte, en España contamos con la Ley Orgánica de Protección de Datos que regula la captura, almacenamiento y uso de la información. Además, cuando analizas grandes volúmenes de datos, se buscan patrones y no detalles concretos. Cuanta más información se tenga de una persona, se podrá mejorar su experiencia de usuario. Queremos que nos conozcan para darnos un servicio más personalizado y rápido, mejor. Ahora bien, si hay algo que no quieres que se sepa, la regla es fácil, no lo cuentes ni por Internet ni fuera de Internet.

P. ¿Cómo le ayudó el Máster Universitario en Análisis y Visualización de Datos Masivos / Visual Analytics & Big Data en su formación? ¿Qué destacaría de su experiencia en UNIR?

Me ayudó a definir los conceptos clave del Big Data, Arquitecturas Distribuidas, Bases de Datos, Estadística, Machine Learning, Visualización y Marketing. Lo cursé en la primera edición, era el único online disponible en España y esto fue fundamental ya que en Murcia no tenía ninguna opción formativa presencial relacionada con el mundo del Big Data. Mi experiencia en UNIR fue muy buena, la plataforma es muy amigable y dispones de los materiales para organizarte y compaginarlo con el trabajo. Conocí a compañeros fabulosos con los que mantengo contacto. El Máster fue exactamente lo que necesitaba.