Técnico

Marvik Digest #2

Share

🚀 Bienvenido a la última edición de Marvik Digest 🚀 Este mes tenemos algunas historias interesantes sobre la optimización de múltiples GAN, el nuevo IoT Insider Lab de Microsoft, los modelos de traducción de voz a voz, los avances en las arquitecturas de transformadores y más. ➡️ ¿Quieres que tratemos un tema específico? Envíanos un mensaje de texto o envíanos un mensaje a [email protected] para enviarnos tus sugerencias. ¡Estén atentos!

en Setgan

En el ámbito de #ComputerVision, la generación de imágenes humanas de cuerpo entero sigue siendo un gran desafío 🧍 ‍ ♀️🧍 ‍ ♂️. Como seres humanos, todos somos diferentes unos de otros. En términos de apariencia, tenemos nuestra identidad, apariencia, forma y pose únicas. #Generativeadversarialnetworks (#GANs) surgió como un paradigma exitoso de generación de imágenes. 🔴 Sin embargo, surgen problemas cuando se trata de clases que muestran variaciones complejas 🔴 En un artículo reciente publicado por Adobe Research, Kaust y University College London, proponen 🟢#InsetGAN🟢, un método innovador que combina varias GAN previamente entrenadas, donde una #GAN genera un lienzo global y una serie de GAN especializadas que se centran en diferentes partes del cuerpo que pueden insertarse en el primero. ➡️ Conclusiones principales: 📌 Introduce un marco de optimización de múltiples GAN que optimiza conjuntamente los códigos latentes de dos o más generadores colaborativos, de modo que la imagen final, formada al insertar las partes insertadas en el lienzo, no muestre ninguna costura (por ejemplo, un rostro, cuando se añade al cuerpo, será uniforme en cuanto al tono de la piel, los límites de la ropa) y flujo del cabello). 📌 Se pueden entrenar diferentes GAN de lienzo o parte con diferentes resoluciones, por lo tanto reduciendo los requisitos de datos (calidad). 📌 Configuración demostrada al combinar un GAN para todo el cuerpo con un GAN facial dedicado de alta calidad para producir humanos de aspecto plausible. 📌 Se probó en un conjunto de datos personalizado y se evaluaron los resultados con métricas cuantitativas y estudios de usuarios. 👉 Obtenga más información aquí https://bit.ly/3tjNJuP 👉 Visita www.marvik.ai o escribe a [email protected] para obtener más información sobre nuestra experiencia con el uso de las GAN.

escapada de fin de semana

Hace unos días tuvimos la oportunidad de compartir algunos momentos increíbles durante nuestro equipo #getaway. Pasamos todo el fin de semana en una hermosa casa, rodeados de naturaleza y paisajes impresionantes 🍂 🌳 🌅. Había espacio para todo. Jugando juegos de mesa cerca de la chimenea 🔥, animadas competiciones de ping-pong 🏓 y improvisando canciones de guitarra y canciones 🎤 🎸. Además, parte del equipo se ofreció como voluntaria para cocinar y nos deleitaron con una deliciosa barbacoa uruguaya y unas deliciosas arepas 🇻🇪. Aún más gratificante fue presenciar la presencia de la mayoría de Marvik equipo, tanto de Uruguay 🇺🇾 como de diferentes partes de Argentina 🇦🇷. Para algunos de ellos, era la primera vez que visitaban 🇺🇾 y, sin duda, la primera vez que nos veíamos en persona. Nuestro equipo sigue creciendo y creciendo, y esto es solo el principio. 🚀 ¿Te arriesgarás a perderte nuestra próxima escapada? Asegúrate de que eso no suceda. 👉 Haz clic aquí https://bit.ly/3yYYIh4 para ver todos nuestros puestos vacantes, o envíenos un correo electrónico a [email protected] para obtener más información.

Laboratorio Microsoft IoT Insider

📢 Buenas noticias para el #artificialintelligence comunidad en Latinoamérica 📢 Microsoft ha elegido #Uruguay 🇺🇾 para albergar su nueva #AI&#IoT Insider Lab, el primero de su tipo en la región y solo el tercero fuera de EE. UU. 🇺🇸 💡 Esto supone un punto de inflexión dado el creciente impacto de la IA y el IoT en la forma en que las personas, los dispositivos y los datos interactúan en todos los aspectos de la vida. Además, coloca a Uruguay en el camino de convertirse en un «centro de innovación» para la región, ya que actúa como facilitador de #innovation y creatividad para transformar la realidad empresarial. 🚀 La misión del laboratorio es mostrar a las empresas emergentes, corporaciones y organizaciones de todos los sectores cómo aprovechar las tecnologías de IA e IoT para resolver los desafíos relacionados, al tiempo que proporciona orientación y recomendaciones de expertos para que puedan alcanzar su máximo potencial. ➡️ El laboratorio ofrecerá: 📌 Conocimientos basados en la experiencia de expertos: #electricalengineers, #cloudengineers, #datascientists, #programmanagers, #projectmanagers, y #softwareengineers. 📌 Dedicación bajo demanda por parte de personas altamente calificadas #Microsoft colaboradores. 📌 Gestión de proyectos, diseño, arquitectura, creación de prototipos y orientación posterior a la implementación para clientes y socios. 👉 Más información sobre esta iniciativa aquí https://bit.ly/3NPyNgk 👉 Si tienes curiosidad por saber cómo funcionan los laboratorios de IA e IoT de Microsoft, haz clic aquí https://bit.ly/3NSyu46

Nuevo modelo de traducción de voz a voz

Meta IA ha publicado recientemente un nuevo artículo de investigación sobre la traducción de voz a voz (#S2ST) que no depende de #textgeneration como paso intermedio 💡 Este método permite una inferencia más rápida y admite la traducción entre idiomas no escritos (importante ya que más del 40 por ciento de los idiomas del mundo no tienen sistemas de escritura de texto). En lugar del enfoque tradicional (traducir la voz original en espectrogramas de voz objetivo), utilizaron unidades de voz discretizadas obtenidas de la agrupación de representaciones de voz autosupervisadas. 🟢 Principales logros: 📌 Los primeros de su tipo se capacitaron en datos de audio de código abierto del mundo real para varios pares de idiomas 📌 Supera a los sistemas S2ST directos anteriores en términos de #runtime , #FLOPS, y #maxmemory 📌 Aprovecha el entrenamiento previo con datos de voz sin etiquetar 👉 Haga clic aquí para obtener más información https://bit.ly/3HEetvS

Transformador DIET

En nuestra última entrada de blog, nuestro #mlengineerDiego Sellanes trata #DIET, Rasala arquitectura de transformadores más reciente, que funciona para el reconocimiento de entidades y la clasificación de intenciones. Continúa explicando cómo funciona, sus diferentes módulos y sus principales ventajas en comparación con modelos similares. «El transformador DIET de RASA tiene una arquitectura muy potente. Propone una nueva forma de entender los transformadores de última generación, con una inteligente función de pérdida que resume todos los aspectos del modelo». 👉 Visite nuestro blog para ver la historia completa https://bit.ly/3zZ1rqY 👉 En Marvik, hemos utilizado Transformers para ejecutar varios #NLP proyectos. Envía un mensaje de texto o ponte en contacto con [email protected] si tienes curiosidad por saber cómo puedes aplicarlos para mejorar tu #NLPmodels. [caption id="attachment_1000" align="aligncenter» width="685"]

Ejemplo de respuesta del modelo [/caption]

Yolo V6

🚀 YoloV6 ya está disponible 🚀 #YOLOv6 es un marco de detección de objetos de una sola etapa dedicado a aplicaciones industriales, con un diseño eficiente y un alto rendimiento que no daña el hardware. 🟢 Conclusión principal: 📌 Cabezal desacoplado eficiente con pérdida de SiOU 📌 Diseño compatible con el hardware para la columna vertebral y el cuello 📌 La precisión de detección y la velocidad de inferencia superan con creces las del #YOLOv5 📌 anterior Publicado bajo GNU General Public v3.0 📌 Próximamente: + opciones de despliegue y herramientas de cuantificación 👉 Consulte repo aquí https://bit.ly/3AaQHpy

Modelo Parti

📢 Inteligencia artificial de Google ha lanzado recientemente el modelo autorregresivo de texto a imagen de Pathways (#Parti), su segundo modelo generador de texto a imagen 📢 Parti utiliza un modelo autorregresivo que permite generar imágenes fotorrealistas de alta fidelidad y admite la síntesis rica en contenido que implica composiciones complejas y conocimientos mundiales. 🟢 Aspectos destacados: 📌 Trata la generación de texto a imagen como un problema de modelado secuencia a secuencia (similar a la traducción automática) → le permite beneficiarse de los avances en los modelos lingüísticos de gran tamaño. 📌 Muestra mejoras de calidad consistentes al escalar su codificador-decodificador hasta 20 MB de parámetros. 📌 Logra un rendimiento sin disparos de última generación #FID puntuación. 📌 Complementario a #Imagen (su predecesora) al explorar dos familias diferentes de modelos generativos: el autorregresivo y el de difusión → abre interesantes oportunidades para combinar ambos. Es emocionante presenciar todos estos avances en la generación de texto a imágenes 🚀 👉 Haga clic aquí para obtener más información sobre Parti https://bit.ly/3I4lMxe [caption id="attachment_1144" align="aligncenter» width="452"]

Un osito de peluche que lleva un casco de moto y una capa está haciendo surf en un taxi en la ciudad de Nueva York [/caption]

Cada viaje de IA comienza con una conversación

Hablemos
Hablemos