El proyecto Oxford suma CaptionBot, que describe el contenido en las imágenes

El proyecto Oxford suma CaptionBot, que describe el contenido en las imágenes

portada captionbot

Microsoft en la primera presentación de la Build 2016 nos presentó el emotivo caso de uno de sus empleados que es invidente habiendo perdido el sentido de la visión a temprana edad, y que finalmente podrá usar la tecnología de Microsoft para mejorar su calidad de vida con CaptionBot, una tecnología capaz de describir el contenido de las imágenes.

Seeing AI 2016 Prototype - A Microsoft research project

CaptionBot es un nuevo hermano en el Proyecto Oxford, y que suma (en la demostración al menos) todas las tecnologías anteriores para poder describir qué hay en una imagen. Esto quiere decir que CaptionBot es capaz de reconocer personas en las imágenes, sus expresiones, edad, texto en las imágenes, colores y lugares, pero también mucho más como se aprecia en el vídeo.

Esta tecnología se encuentra disponible para cualquier usuario, aunque está en fase temprana de desarrollo. En la Build 2016, Microsoft ya nos ha demostrado las formas en las que puede ser usado CaptionBot, y es que no solo sirve para ayudar a personas invidentes, sino también para que los bots puedan aprender sobre los usuarios o a manejar lenguajes no verbales o textos escritos a mano.

captionbot cara

Puedes ver y experimentar con esta tecnología desde su web oficial aquí. Para encontrarse en un desarrollo temprano, es bastante buena con las imágenes que hemos probado, incluso detecta el rostro de celebridades, un gran paso sin duda para la inteligencia artificial.

¿Has probado CaptionBot?, ¿Crees qué es lo suficientemente exacto?

Nueva API para Visión de Microsoft ahora detecta imagenes para adultos

Nueva API para Visión de Microsoft ahora detecta imagenes para adultos

proyectoxfordProyectOxford es parte de un nuevo programa de Microsoft dedicado al procesamiento de imagenes, presentado ayer en funcionamiento en la segunda Keynote de la Build 2015. Al parecer Microsoft se ha extendido mucho mas lejos que intentar detectar la edad de una persona por su rostro.

Hoy ha presentado la nueva API de Visual, parte del ProyecOxford, con muchas nuevas características, como la detección de imágenes pornográficas y contenido para adultos, entre las mas importantes, también su bloqueo para proteger al usuario de búsquedas no deseadas principalmente a los menores.

Otra parte importante de la nueva API es la categorización de las imágenes, ya que puede hacerlo por si solo y las etiqueta para poder organizarlas en grupos o en temáticas diferentes. También como crear miniaturas de las imágenes de acuerdo a su categoría o según las necesidades del usuario.

Tambien se ha añadido a esta API un reconocedor de texto que lo trancribe, para ahorrar tiempo a muchos en pasarlos a formato digital, ya se con fotografias de hojas de papel o imagenes escaneadas.

Los usos de estas APIs pueden ser innumerables ya que pueden facilitar a la compresión del usuario. Uno de esos usos puede ser Cortana, para ayudar a mejorar los resultados de búsqueda o poder hacer que su comprensión del usuario sea mayor, aprendiendo mucho más rápido.

Puedes probar algunas de estas nuevas funcionalidades Aquí.

¿Que os parecen estas nuevas funciones? ¿Será en gran paso que necesita la inteligencia artificial?

Windows Central

Salir de la versión móvil