" />
0 COMENTARIOS

Jorge Peñalva, CEO de Séntisis

Hay muchos patrones dentro de las redes sociales que sirven para hacer predicciones

Todavía no hemos sido capaces de desarrollar una máquina que lea el pensamiento o conozca de antemano las intenciones de las personas, pero mientras eso llega lo que sí tenemos es la capacidad de usar toda la información a nuestro alcance (como la de las redes sociales) para intentar tomarle el pulso a la gente. Las empresas son conscientes de que una de las cosas que más les aleja de sus clientes es la forma en la que se relacionan con ellos. Muchas veces no pueden prever cómo ni cuándo se va a producir una crisis que se salde con la pérdida de una parte de sus fieles, y aunque invierten grandes cantidades en encuestas de satisfacción, la gente no siempre dice la verdad. ¿Cómo saber entonces qué está pasando con mi empresa?

En las redes sociales la gente habla de todo, públicamente y, en la mayoría de los casos, sin tapujos. Puede que en una encuesta de satisfacción decidan no ser del todo sinceros, pero en las redes suelen despacharse a gusto. Son un púlpito desde el que desahogan sus enfados, critican la atención que han recibido o ponen en entredicho el servicio prestado. En las redes se acumula una valiosa información para las compañías, y estas buscan la forma de obtenerla y analizarla de forma fidedigna, pero no se puede tener a una persona explorando Twitter o Facebook en busca de comentarios al azar, ni siquiera a cien. En este caso están demostrando ser mucho más eficientes los algoritmos basados en la estructura semántica, capaces incluso de diferenciar la actividad humana de la de los bots.

Ser capaces de desarrollar la fórmula del entendimiento, la que permita a las máquinas detectar en tiempo real todo lo que se dice de nosotros y, a la vez, saber si lo que se está diciendo es positivo o negativo, es uno de los santos griales de nuestro tiempo. Nos fuimos hasta Séntisis, una de estas compañías, especializada en el análisis semántico de las conversaciones públicas en castellano de redes sociales, foros, chats y noticias, y hablamos con su CEO y uno de los cuatro socios fundadores: Jorge Peñalva.

Equipo-sentisis
Una parte del equipo de Séntisis en las oficinas de la compañía en Madrid.

Séntisis nació en 2012 de la oportunidad que ofrecía el desarrollo de tecnologías en español. “Esto podía permitir comprender la profundidad del lenguaje, lo que hay detrás de una conversación en español“, explica Peñalva, “y el objetivo más evidente eran las redes sociales, donde muchas veces las conversaciones son abiertas“. Con esto podían decir a las marcas qué pasa con ellas, acerca de ellas y cómo están respecto a la competencia.

Enseñar a las máquinas a contextualizar

Saber poner en contexto lo que está pasando es fundamental para entender lo que se está diciendo, no lo que pone, y muchas veces “se trata de un contexto que no es semántico“. Alguien podría escribir en Twitter: “Qué bien que el Banco Sabadell le de un préstamo a Pablo Iglesias”, pero sin saber quién es Pablo Iglesias, qué implica que sea el Banco Sabadell, que hay dificultad de acceso al crédito para determinados grupos de personas o que existe gente viviendo con menos de 400 euros al mes, no se puede comprender ni el sentido ni la intención de esa frase. Los ciudadanos españoles pueden entender rápidamente el sentido del comentario porque conocen el contexto, y eso hay que llevarlo hasta la máquina.

Una de las fortalezas de Séntisis es la capacidad contextualizar las conversaciones en castellano que tienen lugar en distintos países de habla hispana, lo que implica conocer las circunstancias y usos particulares del lenguaje de cada país. La tecnología de Séntisis no sólo adapta el motor de análisis a la industria que hay que analizar, sino que son capaces de analizar cualquier texto escrito en lengua castellana, teniendo en cuenta las distintas expresiones y particularidades que se expresan en cada país.

Preguntamos a Jorge Peñalva hasta qué punto es capaz la máquina de detectar posibles problemas para las empresas. Como ejemplo señala que tienen procesos para identificar cuándo un cliente está harto de la compañía y se quiere ir o dejar de usar el servicio. Esos patrones se extraen mediante algoritmos de machine learning, pero con la participación imprescindible de su equipo de lingüistas, que son los que modelan luego los patrones que se extraen.

El motor aprende con retroalimentación y con la enseñanza que le viene de fuera, “pero somos nosotros los que le tenemos que enseñar que los instrumentos musicales son el piano, el tambor, el violón, la flauta… de manera que cuando alguien diga que toca el violín, sepa que habla de un instrumento, y no es otra cosa lo que está tocando“, explica Peñalva.

Con este tipo de aprendizaje ya somos diferentes a otras herramientas -explica el CEO- porque lo hacemos en casa, y se encargan lingüistas expertos. Es fundamental para nosotros darle un criterio al sistema, y si ya es difícil que dos personas se pongan de acuerdo en una cosa, imagina con algo tan delicado como esto. Por eso no es trabajo para un becario, porque el criterio de clasificación de los textos tiene que ser el mismo, y todos los que sean neutros se clasifiquen como neutros, y los que sean positivos o negativos como tales“.

En los recovecos del lenguaje

Hablábamos antes de contextualizar, pero a veces los juegos de dobles sentidos son tan finos que no es fácil. Claro que tampoco es fácil entonces para muchas personas. La palabra “chorizo” es una de las que más frecuentemente se emplean en un sentido diferente al alimenticio. Cada palabra, explica Peñalva, tiene una representación, pero también tiene sinónimos. Evidentemente “hay cosas a las que es difícil llegar“, dice Peñalva. Imaginemos que no sabemos que una de las cosas de la que se puede acusar a una persona es de ladrón. Este conocimiento tiene que aprenderlo la herramienta, para saber también que cuando queremos señalar a alguien como ladrón podemos usar diferentes palabras distintas a ladrón.

La mayor parte de las veces los problemas de comunicación están en el lenguaje y en cómo lo usamos. A la hora de generar un módulo inteligente que entienda lo que se dice, este tiene que ser capaz de diferenciar cosas como la ironía, el sarcasmo, etc. Por eso, según explica Peñalva, el motor diferencia primero por industrias, por ejemplo aerolíneas, cadenas de comida, aseguradoras… y luego distingue si lo que se dice es bueno o malo. Para unas aerolíneas, el motor debe poder distinguir incluso cuándo un agradecimiento no tiene un sentido positivo como cuando alguien escribe “Gracias, Iberia, por las tres horas de retraso que ha tenido el avión”.

Esta es una de las razones por las que Séntisis no trabaja con keywords, sino con patrones semánticos. Cuando se usan algoritmos más machine learning se establecen patrones: “A más gracias, más positivo para la compañía“, pero tal y como explica Peñalva, eso puede hacer que se cuelen ironías, por lo que lo que se necesita es entender el contexto.

A la hora de aplicar el motor en los distintos países donde Séntisis tiene oficinas y clientes (México, Colombia, Chile, EE.UU. y Perú) tienen que contextualizar y “explicar” a la máquina los giros particulares del lenguaje. “En todas partes una mesa es una mesa, pero las expresiones cambian, y es raro que en hispanoamérica el mismo léxico signifique cosas diferentes“, explica. Quizá el reto esté entonces en contextualizar la realidad migratoria de los países, donde en un chat español pueden combinarse las diferentes expresiones de los hispanohablantes.

En la brecha?!

Cuando la tecnología da pasos tan grandes en un sentido, no es raro que se produzcan brechas entre los desarrollos y las aplicaciones o, incluso, entre el aprovechamiento de las aplicaciones. Es el problema habitual de vender a las compañías algo que permite hacer un seguimiento en tiempo real de lo que la gente opina y comparte sobre ellos, incluso predecirles las posibles crisis que se avecinan… pero luego te encuentras con que las empresas no saben reaccionar ante esa información, o los jefes consideran que lo que necesitan es otro tipo de datos. Peñalva comenta que a veces se encuentran también con casos así entre sus clientes.

El sector todavía tiene que avanzar mucho. En el caso de Séntisis su core es trabajar con el lenguaje, pero tomar muestras significativas en redes sociales es muy complejo, porque tienes que asegurarte de que la muestra es realmente representativa del conjunto. Por eso la compañía decidió que lo mejor era analizar el 100% de las conversaciones en español que se dan en las redes sociales, y hacerlo en tiempo real. “Analizar cada comentario junto con el contexto es extremadamente importante, y los clientes que nos contratan ven ese valor y ven el valor semántico, incluso algunos de ellos aplican nuestro motor semántico a otras cosas como emails, llamadas traducidas a texto, etc. En definitiva, todo lo que sea texto, porque no nos expresamos igual por escrito que por teléfono que en persona“, apunta Peñalva.

¿Hasta qué punto sería posible también realizar predicciones sobre cómo va a funcionar un producto, un estreno de cine o unas elecciones? Peñalva explica que el Séntisis son “transparentes“. Las redes sociales tienen un sesgo, y algunas como Twitter tienen un perfil de usuario. Aunque hay de todo, la mayor parte de los usuarios de esta red se ajustan a una tipología, y “tenemos eso en cuenta a la hora de recoger y analizar la información de estos grupos“, de manera que las predicciones que se pueden hacer se ajustan a ese sesgo. Peñalva nos cuenta un conocido caso de predicción que se hizo sobre la caída en bolsa de la cadena Chipotle gracias al análisis de datos en FourSquare, que mostraban un descenso paulatino de los checkin en sus locales. “Hay muchos patrones dentro de las redes sociales que sirven para hacer predicciones, y en política, entendiendo las claves del sesgo de las redes, a menudo se puede saber lo que la gente opina e, incluso, prever algunos comportamientos“, añade Peñalva.

No sólo en redes sociales

Si tienes un motor capaz de analizar el lenguaje las posibilidades que se te abren son muchas, por eso, aunque el motor de Séntisis está pensado para analizar fundamentalmente redes sociales se puede usar en otro tipo de fuentes. “Si el motor entiende el lenguaje se puede usar para más cosas como un chatbot“, dice. A fin de cuentas los asistentes personales como Siri o Cortana, y herramientas de inteligencia artificial que se usan en robótica también se basan en la interpretación del lenguaje, en entender qué se dice y en dar la respuesta adecuada. “La complejidad aquí -dice Peñalva- es que muchos otros hacen NLP (procesamiento del lenguaje natural), pero nosotros añadimos una capa de inteligencia, porque no es lo mismo que el motor entienda que una persona tiene un problema, que está enojado o que ese problema puede suponer una crisis para la compañía”. No sería la primera vez que un comentario incendia las redes sociales.

Si volvemos a tocar el tema del aprendizaje de la máquina, de momento no es algo que el motor pueda hacer por sí mismo. Tal y como cuenta Peñalva, “podemos meterle al motor todos los conocimientos de la Wikipedia, pero alguien externo tiene que decirle a la máquina qué es lo que puede ser un riesgo y lo que no“. En tal caso se trata de un aprendizaje supervisado, como la mayoría, porque es la forma de que el motor aprenda realmente, “pero también hacemos un tipo de aprendizaje no supervisado en el que el motor detecta patrones sin que tengamos que decirle nada, para ganar en eficacia; luego serán los lingüistas quienes revisen esos patrones y apliquen las reglas“.

¿Futuro?

Peñalva se muestra muy optimista de cara el futuro en este sector. “La investigación ha crecido mucho, y hay algoritmos que están cambiando ya la forma de analizar el lenguaje. Es un sector en alza, muy demandado porque, al fin y al cabo, el lenguaje es la forma que tenemos de comunicarnos, y aunque cambien cosas, siempre tiene que haber comunicación y nos comunicamos mediante el lenguaje. En ese sentido las máquinas pueden usar el lenguaje como un humano, o mejor que un humano, porque solemos decir “como los humanos“, pero es que a veces los humanos nos entendemos bastante peor”.

Otro de los puntos interesantes que se plantean a futuro es el de las profesiones vinculadas a este sector. Si antes decir a tus padres que querías ser filólogo o lingüista era un trago peor que salir del armario, hoy vemos que estamos ante una de las profesiones más demandadas. Tal es así que existe la especialidad de lingüista computacional, y tanto en el área de la lingüística como en el de la ingeniería, hay másters para combinar las habilidades tecnológicas con el conocimiento profundo del lenguaje.

 

No comments yet.

Deja un comentario