ZOOM
GALERÍA
0 COMENTARIOS

Crean sistemas neuronales que comprenden el contenido de las fotos que ven

Dave, sé lo que estáis haciendo. Lo sé.

La Inteligencia Artificial, (Artificial Intelligence o AI) es un campo del que hace décadas, muchas décadas, que el gran público espera avances milagrosos que no acaban de llegar. No se han desarrollado todavía los dispositivos “casi humanos” como robots que se comuniquen con las personas mediante la vista, el oído y el habla. Y es que algo así es lo que se dio a entender que la AI traería en breve. Aún así, los desarrollos en Inteligencia Artificial avanzan día tras día con paso firme. Ganando pequeñas cotas que, por separado no parecen gran cosa, pero que de cuando en cuando, al reunir varios de estos avances en una línea de investigación nueva, permiten dar importantes saltos. Ahora científicos de Stanford y de Google han creado, por separado, sistemas que reconocen la situación mostrada en una foto. Y esto sí que es un gran paso.

Tal y como avanza GigaOm, los enfoques de recientes investigaciones de científicos de Stanford (que puedes consultar aquí) y de Google (que puedes leer aquí) son distintos pero llegan a resultados parecidos. Emplean una combinación de redes neuronales convolucionales muy densas (que replican la estructura cerebral responsable del reconocimiento de imágenes) con redes neuronales recurrentes especialmente indicadas para el análisis de texto y el trabajo con lenguaje natural. El resultado de esta fusión son sistemas capaces de expresar, con frases cortas, el contenido mostrado en una imagen. Esto tiene implicaciones muy grandes en multitud de campos: la búsqueda de imágenes en archivos, los vehículos autónomos, sistemas de vigilancia y muchos otros.

El sistema descompone la imagen en distintas zonas para determinar qué es cada una de ellas. Una vez tiene definido qué elementos forman la imagen, algo que ya se hace con relativa facilidad, es cuando entra el avance que marcan estas investigaciones. Ahora deduce la relación entre los elementos de la imagen basándose en la experiencia acumulada (su entrenamiento) y el conjunto de reglas que ha inferido de ello. Como puedes ver en la imagen inferior, los resultados son bastante espectaculares.

Montaje-regiones-IA-Stanford

En la imagen de la parte inferior puedes ver algunos de los ejemplos analizados por el sistema de Stanford. Para evitar perder matices por la traducción, lo he dejado tal y como aparece en inglés en el original. En verde se muestra la frase escrita por una persona al describir la imagen, en rojo se muestra la descripción más compatible que se encontró en el conjunto de información empleado en el entrenamiento del sistema y en violeta aparece la descripción generada por este nuevo sistema experto. A continuación tienes las traducciones de estos resultados finales.

Ejemplos-de-reconocimiento-IA-Stanford

En la primera de las cuatro fotos, el resultado del análisis es “Hombre con camiseta negra tocando la guitarra”. La siguiente foto muestra, según el sistema experto, a un “obrero con chaleco naranja de seguridad que trabaja en una carretera”. La foto con el niño produce el siguiente resumen: “dos niñas pequeñas juegan con un juguete Lego”. Y la última da como resultado “un chico que da un salto mortal hacia atrás (backflip) en un wakeboard”. Obviamente no son todas completamente acertadas, pero es realmente sorprendente que un frío y analítico ordenador digital sea capaz de detectar los elementos de las imágenes y extraer el posible significado de lo que en ellas se muestra. Y cuanto más sepas de informática, seguramente más te sorprenderá.

Es curioso, pero en la ciencia ha habido varios casos de grandes descubrimientos e invenciones que se ha producido por separado, con muy poco tiempo de diferencia, en distintas partes del mundo. Uno de los casos más conocidos es el descubrimiento/invención de la tabla periódica de los elementos. Se le atribuye oficialmente al ruso Mendeleiev en 1869 pero, de forma paralela, la descubrió también el alemán Julius Lothar Meyer en 1870 extendiendo unos desarrollos previos de 1864. Y lo hicieron cada uno por su cuenta sin coordinarse (ni espiarse).

Algo parecido ha sucedido en esta ocasión. Es más, se sabe que otros equipos en las universidades de Toronto y California Berkeley están trabajando en líneas de investigación muy cercanas. Y es que en la ciencia determinados avances necesitan de otros previos. Y cuando los pasos previos ya están ahí, y allanan el camino a metas más altas, es más que posible que no seas el único científico que se atreva a seguir avanzando hacia la cumbre.

Imagen de apertura: By Cryteria (Own work) [CC-BY-3.0]

Resto de imágenes: Andrej Karpathy & Li Fei-Fei, Department of Computer Science, Stanford University

No comments yet.

Deja un comentario