Nueva IA de Google, MIT puede editar las fotos de su teléfono inteligente antes de tomarlas
Un nuevo sistema de investigadores de Google y el MIT utiliza el aprendizaje automático para retocar profesionalmente fotos tomadas con teléfonos inteligentes en tiempo real.
La inteligencia artificial (IA) pronto podría facilitar la edición de fotos: esta semana en Siggraph, una conferencia de gráficos digitales, investigadores de Google y el MIT anunciaron un nuevo sistema que utiliza el aprendizaje automático para ajustar los teléfonos inteligentes. Retoque profesional en tiempo real de fotos tomadas en la web. antes de tomar las fotos.
Según se informa, con esta tecnología, los fotógrafos pueden ver la versión final de la imagen en la pantalla mientras aún están componiendo la toma en su teléfono. Noticias del MIT.
El sistema es energéticamente eficiente y no agota la batería de su teléfono. También podría acelerar los algoritmos de procesamiento de imágenes existentes, dice MIT News.probando otro algoritmo de Google Para generar imágenes con alto rango dinámico, que pueden capturar colores complejos que tradicionalmente se pierden en las fotografías digitales, el nuevo sistema produce resultados que son «visualmente indistinguibles» de los creados mediante algoritmos, y una de las veces toma solo diez minutos.
La tecnología utiliza el aprendizaje automático para entrenar miles de pares de imágenes, una en bruto y otra retocada, para determinar la mejor manera de editar fotos profesionalmente antes de que realmente se tomen.
Mirar: Paquete de aprendizaje automático e inteligencia artificial (Colegio Técnico de la República)
Una proyectos anteriores Investigadores del MIT han reducido el ancho de banda consumido por el procesamiento de imágenes basado en servidor hasta en un 98,5 por ciento y el consumo de energía hasta en un 85 por ciento. Según MIT News, los investigadores pudieron enviar una versión altamente comprimida de la imagen al servidor, que envió un archivo más pequeño que contenía una «receta de conversión» o instrucciones simples para modificar la imagen original.
«Google se enteró de mi trabajo sobre la transformación de recetas», dijo Michaël Gharbi, estudiante graduado en ingeniería eléctrica y ciencias de la computación en el MIT y autor principal de ambos artículos. «Ellos mismos hicieron un seguimiento de esto, así que encontramos y fusionamos los dos enfoques. La idea era hacer todo lo que solíamos hacer, pero en lugar de tener que procesar todo en la nube, aprenderlo. Aprenderlo El primer objetivo es ponerse al día.»
MIT News señala que gran parte del procesamiento de imágenes se realiza en imágenes de baja resolución, lo que reduce el tiempo y el consumo de energía. En el pasado, ha sido difícil usar el aprendizaje automático para aumentar la resolución de las imágenes, pero los investigadores del MIT y Google pudieron abordar el problema utilizando dos enfoques.
La primera es que la salida del sistema de aprendizaje automático es una fórmula que corrige los colores de los píxeles de la imagen, en lugar de la imagen en sí, lo que permite una mejor aproximación de la versión retocada. La segunda es una técnica que aplica una fórmula a píxeles individuales en una imagen de alta resolución. Los investigadores entrenaron el sistema en conjuntos de datos creados por MIT y Adobe Systems, que fabrica Photoshop. El conjunto de datos incluye 5000 imágenes, cada una retocada por cinco fotógrafos profesionales diferentes. El sistema también se entrenó en miles de pares de imágenes generadas por algoritmos de procesamiento de imágenes, como los que se usan para crear imágenes de alto rango dinámico (HDR).
Google y el MIT comparan su tecnología con un sistema de aprendizaje automático que procesa imágenes a máxima resolución en lugar de a baja resolución. La versión de resolución completa requiere alrededor de 12 GB de memoria para ejecutarse, mientras que la versión de los investigadores requiere alrededor de 100 MB, aproximadamente el uno por ciento de ese espacio. La versión de resolución completa también tardó unas 10 veces más en generar imágenes que el algoritmo original, o 100 veces más que el sistema de los investigadores.
Google ha aplicado la inteligencia artificial a otro tipo de proyectos de visión: en 2014, la empresa compró Word Lens, una aplicación que utiliza la cámara integrada de un teléfono inteligente para traducir idiomas extranjeros en tiempo real. Además, Google anunció en julio que había renovado sus algoritmos de aprendizaje automático para proporcionar una fuente de noticias más personalizada para los usuarios de la aplicación móvil de Búsqueda de Google.
Si este sistema está ampliamente disponible, podría ahorrarles a los fotógrafos y a los departamentos de marketing el tiempo y el dinero que gastan editando fotos para las redes sociales u otros materiales de marketing. Si se amplía, podría tener otros usos comerciales, como que los diseñadores de interiores muestren cómo se verá una habitación en tiempo real.
«Esta tecnología tiene el potencial de ser muy útil para la mejora de imágenes en tiempo real en plataformas móviles», dijo a MIT News Jon Barron, científico investigador sénior de Google Research. «El uso del aprendizaje automático para la fotografía computacional es una perspectiva emocionante, pero está limitada por las severas limitaciones computacionales y de potencia de los teléfonos móviles. Este documento puede proporcionarnos una forma de eludir estos problemas y generar nuevos e intrigantes. -Experiencia fotográfica en el tiempo sin agotar la batería ni brindarle una experiencia de visor retrasado”.
3 conclusiones de los lectores de Tecnopedia
1. Esta semana en Siggraph, los investigadores de Google y el MIT anunciaron un nuevo sistema que utiliza el aprendizaje automático para retocar fotos tomadas con teléfonos inteligentes de manera profesional en tiempo real.
2. La mayor parte del procesamiento de imágenes se realiza en imágenes de baja resolución, lo que reduce el tiempo y el consumo de energía.
3. Si se usa ampliamente, la tecnología podría ahorrar tiempo y dinero a los fotógrafos y departamentos de marketing en la edición de fotografías.