" />
Alejandro Campoy
0 COMENTARIOS

Alejandro Campoy, responsable de Cortana

Un asistente personal debe entender a su jefe y anticiparse a sus necesidades

Hace unos días Cortana le sacó los colores a Satya Nadella, CEO de Microsoft, en público. Alabar sus capacidades como asistente personal y que, acto seguido, falle tres veces antes de darte la información solicitada no es el mejor reclamo para los usuarios. Sin embargo, para ser totalmente justos, quizá una parte del problema esté en que nuestras expectativas están más condicionadas por la ciencia ficción que por el conocimiento de la realidad. La otra parte es que no entendemos que es un producto enormemente complejo en desarrollo, que va evolucionando progresivamente. Casi esperamos que nada más encenderlo se comporte como J.A.R.V.I.S., sin tener en cuenta que, incluso con un asistente personal muy bueno, este necesita aprender previamente sobre tus gustos, preferencias y hábitos antes de ofrecer su práctica ayuda al usuario. A pesar del resbalón de Nadella, las posibilidades de este asistente ya empiezan a asomar seriamente, como la integración con el coche que están probando los de Redmond. Para conocer más acerca del asistente personal de Microsoft estuvimos hablando con Alejandro Campoy, responsable del desarrollo de la personalidad de Cortana para Europa y América Latina.

«El reto más difícil del desarrollo de la Inteligencia Artificial es la intención«, explica Campoy. Los humanos somos expertos en el arte de leer entre líneas, sabemos interpretar las entonaciones, los gestos, las expresiones corporales y los silencios. Incluso disponemos de cierta intuición que nos hace captar señales muy sutiles e incorporarlas a la traducción del lenguaje implícito. Y si a eso le sumamos nuestro conocimiento del interlocutor, un solo movimiento puede bastarnos para saber lo que quiere decirnos. Las máquinas no pueden (de momento) hacer esto. Para ellas es muy complejo saber si lo que le estás diciendo es una pregunta o una exclamación, si estás enojado o estás buscando algo.

Cuanto más le hablas más aprende

Si le preguntas a Cortana cuánto es cero entre cero te responderá que te imagines que tienes cero galletas y las repartes entre cero amigos. «Cuántas galletas le tocan a cada amigo? No tiene sentido, ¿lo ves? Así que el monstruo de las galletas está triste porque no tiene galletas y y tú estás triste porque no tienes amigos«, concluye. Esta gracieta del asistente de Microsoft se hizo viral al poco de salir. Aunque estas respuestas desenfadadas tienen su razón de ser, al difundirse masivamente muchas personas prueban a preguntar sólo para reírse con la respuesta, y a Cortana le resulta algo más complejo distinguir si el usuario quiere escuchar el chiste o saber realmente cuánto es cero entre cero. Igualmente, explica Campoy, si un usuario le dice a Cortana «tengo hambre» tiene que aprender a distinguir si lo que quiere la persona es conversar o que el asistente le busque un restaurante en las proximidades. «Ese es el reto del aprendizaje. La respuesta está en usarlo cada vez más para que el programa aprenda«, dice. Un aprendizaje en el que están involucradas muchos expertos, desde filólogos, lingüistas, informáticos, psicólogos… todo lo que le ayude a conocer el sentido del lenguaje y las intenciones de las personas.

El lanzamiento de la versión alfa de Cortana fue una decisión muy acertada, según Campoy. Cuanto más se usa Cortana más aprende sobre la forma de hablar de la gente. Por eso, aunque las expectativas sean en ocasiones más altas que las posibilidades reales de Cornana, dice Campoy que el usuario no tiene que cambiar su expectativa, «somos nosotros los que tenemos que resolver las cuestiones para que cumpla las expectativas del usuario«. En ocasiones lo que ocurre, cuenta Campoy, es que no sabemos qué decirle a Cortana, ni qué es lo que podemos pedirle y qué no. Entonces la gente se desespera y pierde las ganas de usarlo. Para los niños, manejar este programa es mucho más sencillo, y son capaces de hacerlo mucho mejor y mucho más rápido. Las mejoras de Cortana en Windows 10 son bastante profundas, «mi recomendación es que los que quieran explorarlo actualicen el sistema operativo. Ahí está la mejor experiencia«, dice, «igual que en los desarrollos que otros hacen sobre la API, como pasó con Kinect«.

Campoy comenta uno de los guiños que Cortana le hará a los alemanes durante el Oktoberfest de este año. Dado que la mayor parte son jóvenes y solteros, habrá una respuesta lista para los que le pregunten «¿Cómo ligar?». Sin embargo, una de las cosas curiosas de los idiomas es que evolucionan, y la realidad es que los alemanes apenas usan la palabra alemana para ligar, sino la inglesa, y mientras se hacían las pruebas Cortana no lograba entender lo que le decían los usuarios. «Por eso trabajamos con lingüistas que le explican a Cortana cómo se escucha la palabra y todas las variantes, pero teniendo en cuenta que lo que escuchamos son las ondas sonoras, que son muy parecidas entre sí. El sistema mete ondas de sonido, no palabras, algo en lo que hemos avanzado mucho«, señala Campoy.

Lo que toca ahora es trabajar en la intención, que Cortana pueda distinguir cuando el usuario pregunta para pasar el rato, cuando busca información o cuando espera una respuesta más activa, como que preguntes «¿Cuándo juega Nadal?» y te de la opción de comprar entradas para un partido. Quizá una posibilidad sería integrar lecturas biométricas en los móviles para detectar las emociones del usuario. Campoy explica que «son cosas que se pueden hacer, pero son difíciles de interpretar correctamente«.

cortana-habla-espanol

Entonces, ¿los chistes tienen alguna finalidad?

Los chistes sirven para algo. Si hablarle al teléfono en público para que te recuerde una cita o que llame a tu madre puede dar reparos a mucha gente, la idea de que encima te pase como a Nadella durante su keynote termina de poner la puntilla a esto de los asistentes personales. Para aprender, Cortana necesita que le hables, que le preguntes, que le digas cuáles son tus ubicaciones habituales y tus medios de transporte. Si no le hablas no puede aprender, si no aprende, las posibilidades de que mejore sus respuestas con el tiempo disminuyen. En medio de este círculo vicioso el chiste, y lo que Campoy llama los «momentos», son la clave.

La gente desconfía. Piensa que el asistente no podrá ayudarle, que no le entenderá, intenta hablarle como si dictara un telegrama y siente reparos de usarlo delante de otras personas. Psicológicamente los chistes y las respuestas «simpáticas» ayudan a que la persona se sienta más cómoda, «para que se suelten, prueben y vean que no es complicado«, dice. Los momentos son a los que se refiere Campoy son casi azarosos. Un ejemplo: si le pides a Cortana que te cante una nana y resulta que es la que te cantaban de pequeño, se produce un breve pero importante momento de conexión entre la persona y el asistente. La barrera de desconfianza va cayendo y el usuario comienza a sentirse más cómodo en su uso.

Otro elemento importante para generar confianza en el usuario es el de la voz. Explica Campoy que en el desarrollo de Cortana se ha trabajado mucho en la humanización de las entonaciones, inflexiones, el acento, la emoción. En el caso específico del acento se trabaja mucho para que sea un español neutro que ninguna región en particular pueda identificar como propio.

A pesar de que la gente dice que los chistes de Cortana son muy malos, lo cierto es que los usuarios los piden. Campoy explica que necesariamente tienen que ser chistes «blancos», gracias que no resulten ofensivos para nadie los cojas por donde los cojas. Quizá es un requisito limitante y sea difícil hacer reír a la gente con eso, pero es que no sabes si tu hijo pequeño va a coger tu teléfono para pedir un chiste verde. En tal caso puedes estar tranquilo, porque Cortana le contará uno sobre frutas y verduras.

Hola Cortana, ¿para qué sirves?

Esa es la gran pregunta que los usuarios deben responderse antes de intentar acciones que nunca tendrán la respuesta que esperan. «La intención real de Cortana es que te facilite la vida«, explica. Es muy útil trabajando en el entorno, diciéndote el clima que va a hacer, dándote los horarios del transporte público, la situación del tráfico… A Cortana puedes pedirle que los miércoles te recuerde que tienes que dejarle la llave a la asistenta, que debes recoger un paquete de Correos o hacer una llamada a un cliente a una hora determinada. Le puedes pedir también que te recuerde que la próxima vez que hables con tu jefe tienes que decirle tal cosa, y podrá hacerlo tanto si te llama él como si lo llamas tú.

Si le dices «Llévame al colegio de mis hijos» o  «Llama a mi marido», primero te pedirá que le digas dónde está el colegio y quién es tu marido, pero una vez que lo aprende, la acción será inmediata. Igual si le pides que te indique rutas alternativas desde tu casa al trabajo. Antes deberás indicarle cuál es tu casa y cuál tu trabajo, a partir de ahí ofrecerte información se vuelve más fácil. Hacer algunas de estas tareas requieren más pasos si las haces manualmente, pero con un asistente puede ser sólo activarlo y decir lo que quieres. Claro que para lograr ese nivel de respuesta es necesario que Cortana esté embebida en el sistema, accede a los contactos, a los datos de geolocalización, a la alarma, al calendario, etc.

Campoy explica que, para aterrizar la personalidad de Cortana en los distintos países contratan a gente que conozca bien cómo se dicen las cosas, que sea nativa pero con facilidad para no regionalizarse y sepa cómo se habla de forma natural en la calle. «En España, cuenta Campoy, no puedes estar constantemente dando las gracias, pero en Latinoamérica hay que hacerlo«. Detrás de cada particularidad regional, «la personalidad de Cortana es alegre, positiva, con sentido del humor y deseos de ayudar en todo momento«, comenta Campoy.

cortana-espanol-01

Soy tu asistente personal, ¿en qué puedo ayudarte?

A falta de «pulirle algunas esquinas«, dice Campoy, «es un producto lo suficientemente bueno como para que ya esté en manos de los usuarios«. Hoy por hoy, según explica Campoy, Cortana es muy reactiva, le tienes que decir lo que quieres que haga. El reto está en volverla más proactiva, de manera que si el usuario recibe un SMS de confirmación de viaje la añada automáticamente a los recordatorios. En este sentido está siendo muy útil todo el feedback de los usuarios. A través de las redes sociales se reciben muchos comentarios acerca de la funcionalidad del asistente. «Todas se leen, y muchas se tienen en cuenta«, dice, «y estamos empezando«.

Con el tiempo y el uso, los asistentes personales de dos usuarios diferentes serán, también, diferentes. En sus archivos manejarán gustos, preferencias, ubicaciones y contactos distintos. Las interlocuciones con sus «jefes» les habrán enseñado a entender el lenguaje de forma ligeramente distinta. ¿Hasta qué punto esas diferencias pueden llegar a ser significativas? Según explica Campoy el 70% de Cortana es lo que se comparte entre todos los Cortanas del mundo. Un 20% es la regionalidad, lo que hace que Cortana España no sea igual que Cortana EE.UU. Es la que incluye la cultura del país, el lenguaje, etc. Finalmente queda un 10% construido con la mayor o menos información que le damos y las preferencias. Ese uso particular de cada usuario enriquece a todos los Cortanas de todos los usuarios.

Sin compartir información personal de los usuarios, el aprendizaje del lenguaje natural ayuda a mejorar la forma en la que se relaciona con el resto de las personas. También es cierto que los usuarios aprenden igualmente, se adaptan un poco a la forma en la que Cortana les entiende mejor y refuerzan la forma de expresarse que entiende es la que la aplicación mejor comprende. Si bien esto ayuda a que persona y máquina se acerquen, para que aprenda realmente es importante que usemos el leguaje natural con el acento que cada uno tenga. En estos momentos, según relata Campoy, Cortana acierta en el reconocimiento de las frases que escucha, en una gama muy variada de acentos, en un 90%. Y es que la mayor parte del trabajo de los desarrolladores se ha centrado, hasta el momento, en hacer que Cortana entienda lo que dices. Otra cosa es que logre entender lo que quieres.

Quizá uno de los elementos más interesantes de Cortana es la escucha activa. Una función que ya está en el PC y en los teléfonos cuando puedan descargarse Windows 10. Cortana está pendiente, esperando que le digas «Hola Cortana» para encenderse y escuchar lo que le dices. Es incluso posible configurarlo para que reconozca tu voz por encima de otras y sepa cuándo te diriges a ella y cuándo estás hablando con otras personas. Para eso es capaz también de filtrar muy bien el ruido ambiente y entender cuándo hablas con ella o con otras personas. Hasta que no se usa el comando «Hola Cortana» no oye nada de lo que se dice, según cuenta Alejandro Campoy, ese es su botón de encendido, «hasta que no lo enciendes no pasa nada, está pendiente, pero no escucha».

¿Y la privacidad?

Evidentemente, si para que Cortana aprenda y sea útil al usuario hay que proporcionarle nuestra información personal, estamos poniendo en sus manos la privacidad de nuestras vidas. Según explica Campoy, en cualquier momento puedes decirle que «olvide» todos los datos que le has dado. Imagina que aquella a la que llamabas «esposa» deja de serlo, o que tienes a otra, o que te mudas de casa, o que cambias de trabajo. La configuración del asistente permite que Cortana borre la información complementaria que tú has añadido a los contactos o a las ubicaciones. Igualmente, si alguien siente reparos a dirigirse a Cortana en público puede activarla en silencio y pedir que le ayude a través del teclado. O elegir si se quiere que la información de casa no esté en el PC y sólo en el móvil.

También están los usuarios para los que la privacidad es más importante que todo lo que Cortana pueda hacer por él. Desde las opciones del teléfono se puede configurar todo el conocimiento que queremos que Cortana tenga de nosotros y de nuestra vida. «El éxito de cualquier asistente personal es que entienda a su jefe, al usuario, y que se anticipe a sus necesidades sin que este se sienta invadido«, resalta Campoy. Por eso en cualquier momento podemos decirle qué queremos que aprenda y qué no, o qué queremos que olvide.  Si no, vender el teléfono o dárselo a otra persona sería un problema para la seguridad de los datos almacenados. «Creemos que el ángulo es bueno, que aprenda dónde vivo y dónde trabajo, y que te ayude a anticiparte en tu día a día«, dice Campoy. «Si llegan las 18:30 horas y sigo en el trabajo me manda un aviso diciéndome que si salgo ya tardaré 15 minutos en llegar a casa. Así puedo valorar si me voy ya para no coger tráfico o me espero si me avisa de que hay retenciones. Puedo avisar a casa de que voy a llegar tarde en ese momento, y no cuando me veo en medio del atasco«, explica.

A futuro, si un usuario está jugando y no quiere interrumpir la partida, puede activar Cortana y pedirle que pida una pizza. Si Cortana tiene los datos de la tarjeta de crédito y sabe dónde sueles comprar las pizzas y la que te gusta, sólo le preguntará si quiere lo de siempre antes de hacer el pedido. Puedo usar la función de «No molestar» que activa el silencio, y decirle a qué hora quiero que lo haga y qué personas y circunstancias están autorizadas para interrumpirme. Lo que Cortana puede hacer es mucho, desde tomar notas a escribir mensajes pero, según explica Campoy, eso no es diferenciador, «lo que queremos hacer con Cortana como asistente personal sí que lo es«.

No comments yet.

Deja un comentario