Data Center
ZOOM
GALERÍA
0 COMENTARIOS

El nuevo sistema busca ayudar a tomar decisiones a las personas

Las máquinas ya pueden transmitir su experiencia a los humanos

El ser humano creó las máquinas para que hiciera por él las tareas a las que no llegaba por sí solo o para sustituirle en las más penosas. Hasta ahora, el ser humano ha enseñado a las máquinas cómo calcular, cómo procesar, cómo fabricar, cómo diseñar, cómo construir. El ser humano también ha querido que las máquinas puedan aprender, que verifiquen posibles errores y los corrijan ellas mismas. Ahora se ha dado un paso más. Hay máquinas destinadas a identificar patrones dentro de grandes bases de datos. Patrones que, hasta el momento eran fundamentalmente interpretados por las personas. Pero un sistema desarrollado por investigadores del MIT ha logrado que sean las máquinas las que transmitan a las personas lo aprendido al identificar esos patrones.

Según sus desarrolladores, el sistema aprende a hacer valoraciones por medio del cálculo de los datos, pero filtra lo aprendido por medio de ejemplos sencillos. Durante los experimentos realizados se comprobó que las personas que usaban este sistema llegaban a ser un 20% más eficientes que los que usaban un sistema similar pero basado en algoritmos preexistentes.

Lo que hace el sistema es aumentar la capacidad de aprendizaje automático (denominada “sin supervisión”) del ordenador para que estos puedan servir de apoyo a las personas en la toma de decisiones sobre los mejores patrones. Según explica Julie Shah, profesora de astronáutica y aeronáutica en el MIT, se trata de crear una simbiosis entre la experiencia humana y la de las máquinas, destinada a tomar las mejores decisiones, de la misma manera que profesionales como los bomberos, que cuando tienen que intervenir en un nuevo escenario tratan primero de encontrar las relaciones con situaciones anteriores para aplicar la experiencia ya adquirida al nuevo entorno.

En una máquina de aprendizaje supervisado el ordenador se nutre de una serie de datos previamente marcados por los seres humanos, y lo que tiene que hacer es tratar de buscar correlaciones entre esos datos. Un ejemplo sería el descubrir las características visuales más frecuentes en las imágenes etiquetadas. Por otra parte, el aprendizaje no supervisado busca similitudes en datos no estructurados. En este último caso el resultado será un conjunto de datos agrupados cuyos componentes están relacionados de alguna manera, pero esa manera no es evidente a simple vista.

¿Cómo funciona el aprendizaje no supervisado? Por ejemplo, si tenemos un conjunto de documentos agrupados por sus palabras más características. Como los datos no están previamente marcados el sistema no puede llegar a deducir la temática de los documentos. Sin embargo, las personas que revisen esa producción sí que podrían llegar a conclusiones como que los documentos agrupados que cuenten con las palabras “jurisprudencia” y “apelaciones”  son documentos legales, y los que contienen las palabras “tonalidad” y “armonía” son textos de teoría de la música.

El equipo del MIT modificaron algunos de los aspectos fundamentales del aprendizaje no supervisado. Primero haciendo que la agrupación no se base sólo en los rasgos compartidos de los documentos, sino que incorpore la similitud con algún ejemplo representativo, lo que se denomina un “prototipo”. El otro aspecto incorporado es que en vez de clasificar sólo los rasgos compartidos en los documentos, el nuevo sistema trata de discernir la lista de características resumidas de un conjunto representativo; algo llamado por los investigadores “subespacio”. Para trabajar con este sistema, a la hora de agrupar conjuntos de datos se tienen que cumplir tres requisitos de agrupación que en ocasiones pueden competir entre sí: similitud al prototipo, tamaño del subespacio y demarcaciones claras entre las agrupaciones. Todo esto supone que para describir un buen subespacio hay que escoger un buen prototipo.

Para probar el buen funcionamiento del sistema a la hora de ayudar a tomar decisiones a las personas, se seleccionaron varias recetas de una base de datos online en la que estas recetas ya habían sido clasificadas por categorías, filtrándolas luego únicamente por su lista de ingredientes. Luego se aportaron los datos a los dos sistema, al del algoritmo tradicional y al nuevo. Para cada categoría, el nuevo sistema encontró un ejemplo representativo, mientras que el algoritmo tradicional sólo reveló una lista de ingredientes comunes. El nuevo sistema proporcionó un éxito del 86% del tiempo, mientras que con el algoritmo convencional el tiempo fue del 71%. 

No comments yet.

Deja un comentario