CNET también está disponible en español.

Ir a español

Don't show this again

Cultura tecnológica

Reconocimiento de imagen de Google transmite un toque surreal

La red neuronal artificial de la gigante de tecnología no sólo puede reconocer imágenes sino que también las puede generar — los resultados son estrambóticos y espectaculares.

dream.jpg
Un caballero hecho de perros. Google Research

El reconocimiento de imagen es un negocio complicado. Para Google, eso significa la creación de una red neuronal artificial, lo que vendría siendo como un software que es capaz de aprender.

El software está basado en la estructura de los cerebros biológicos, y se entrena al mostrársele millones de imágenes. Se ajusta constantemente hasta que es capaz de reconocer con precisión a, por un ejemplo, un perro de raza Schnauzer o una estufa. La información se filtra de una capa de neuronas a otra capa de neuronas hasta que alcanza la última capa de neurona para emitir una respuesta.

Al concederle a este red neuronal la capacidad de reconocer imágenes es sólo un pequeño paso para conferirle las herramientas para generar estas imágenes. Y, resulta ser que al permitirle a la red neuronal generar sus propias imágenes es algo extremadamente útil.

Entrenamos redes con simplemente ofrecerle muchos ejemplos de lo que queremos que vean, con la esperanza de que extraigan la esencia del asunto a tratar (por ejemplo, un tenedor que debe tener un mango y de dos a cuatro dientes), y aprender a ignorar lo que no cabe en esta descripción (un tenedor puede ser de cualquier forma, tamaño, color u orientación), según el equipo de ingeniería de software de Google Research en un blog.


"Pero, ¿cómo te das cuenta de que la red ha aprendido correctamente las características del tenedor? Puede ayudar a visualizar la representación que ha hecho la red de un tenedor", dice el equipo.

De esta manera, cuando la red neuronal produce una imagen que no es totalmente correcta, el equipo puede ajustar los parámetros de la red neuronal. El ejemplo utilizado fue una pesa, a lo que la red neuronal generó resultados de imágenes que incluyen una brazo musculoso sosteniendo una pesa. Se corrigió al remover el brazo.

Pero se pone bien divertida la cosa cuando a la red neuronal se le suministra una imagen y se le pide que busque por cosas pequeñas y sutiles. La red encuentra imágenes que el ojo humano no capta.

"Empezamos con una imagen existente y se lo damos a la red neuronal. Le pedimos a la red: 'Lo que sea que veas en la imagen, ¡quiero ver más!'", según el equipo.

"Esto crea un loop de retroalimentación: si una nube se parece a un pájaro, la red hará que se vea aun más a un pájaro. Esto, por su parte, hará que la red reconozca mejor al pájaro en la siguiente fase y así sucesivamente, hasta que aparece un pájaro con todos sus detalles, casi que de la nada".

Los resultados son espectaculares. Uno de mis favoritos es la pintura de Edvard Munch, El grito, que se hace más estremecedor con ojos y perros. La red neuronal artificial se entrenó mayormente con imágenes de animales, por lo que esperamos ver a muchos perros, pescados, lagartijas y pájaros.