Técnico

Marvik Digest #5

Share

🚀 Bienvenido a la última edición de Marvik Digest 🚀 El mes pasado cubrimos algunas historias interesantes relacionadas con los transformadores multimodales, la difusión estable, los modelos lingüísticos multilingües y más. ➡️ ¿Quieres que tratemos un tema específico? Envíanos un mensaje de texto o envíanos un mensaje a [email protected] para enviarnos tus sugerencias. ¡Estén atentos!

El nuevo multimodal de Hugging Face Transformador modelo

Es una gran noticia saber que el #TF version de #LayoutMv3 multimodal #Transformer el modelo ya está disponible en Cara abrazada! 🚀 Su arquitectura simple pero revolucionaria mejoró muchos puntos de referencia con respecto a sus predecesores, al ser el primer modelo de IA documental que no se basa en una red troncal de CNN o R-CNN funciones para extraer visuales. 🟢 Aspectos destacados principales: 📌 Una de sus mayores ventajas es que se trata de un modelo de uso general para la IA documental centrada en el texto y la imagen 📌 Unifica el concepto de transformadores para fines centrados en el texto con los modelos de OCR y centrados en la imagen que se utilizan para las tareas de IA en Marte Vik, hemos utilizado este modelo para tareas relacionadas con la detección de objetos y ha arrojado resultados asombrosos 🤩 💡 Si se enfrenta a un problema similar o tiene una idea que discutir en Document AI, hablemos. Ponte en contacto con [email protected] y descubre cómo podemos ayudarte. ➡️ Para acceder al modelo: https://bit.ly/3CXm7B8

#ai#artificialintelligence#machinelearning#ml#tensorflow#nlp#naturallanguageprocessing#languagemodels#multimodaltransformer#transformers

Estabilidad: IA. 's Difusión estable

Dame «Un corgi con gafas de sol conduciendo un tesla» y obtendrás... 🤔 La IA generativa ha recorrido un largo camino. La introducción de #GANs permitió alcanzar nuevas cotas en el #ML espacio, pero un nuevo desarrollo impulsará la próxima generación de #AI generación de imagen. 🚀 Estamos hablando de Estabilidad: IA. 's Stable diffusion 🚀 ¿En qué se diferencia este de los otros modelos de difusión, como #GLIDE, #DALL ·E 2 (IA abierta), #Imagen (Google)? 📌 Verdaderamente gratuito y de código abierto, tanto en modelos como en código 📌 Al utilizar la difusión latente, el modelo se puede ejecutar con un consumidor #GPU o incluido en un chip m1. Esto significa que, por fin, todos podemos utilizar esta poderosa técnica en nuestros proyectos y jugar todo lo que queramos con las increíbles capacidades que ofrece, como: 📌 La generación de texto a imagen (similar a #DALL ·E) 📌 Súper resolución (#Denoising) 📌 Pintura de imágenes (elimina elementos de las imágenes) 📌 Pintura externa de imágenes (genera más imágenes a partir de una) 📌 Maquetación/segmentación (generación de imágenes) 📌 Generación de imágenes de clase (genera imágenes siguiendo una sola clase, por ejemplo, un automóvil) Todo esto suena bien, pero ¿por qué es relevante? Aunque los modelos Diffusion están en una fase muy temprana, ya funcionan a la par o mejor que las GAN, una de las opciones más sólidas para la generación de imágenes. Imagina todas las posibilidades que se abren 🤩 🤩 Algunas ideas que se me vienen a la mente: 📌 Imágenes de archivo infinitas 📌 Generación de texturas para juegos 📌 Inspiración artística para crear arte 📌 Creación de logotipos 📌 Ropa, inspiración para la moda 📌 Coloración de imágenes En Marvik tenemos una amplia experiencia en el uso #GAN modelos y tienes algunas ideas muy interesantes sobre cómo aprovechar esta nueva era de IA generativa 🙌🏻 ¿Quieres unirte y ver hacia dónde nos dirigimos? Ponte en contacto con [email protected] para averiguarlo 🔍 ➡️ Para obtener más información sobre Stability.ai: https://bit.ly/3Br5fBJ ➡️ Para acceder al documento completo: https://bit.ly/3QpeV3T ➡️ Para acceder al código: https://bit.ly/3QorcG1

#generativeai#imagegenetation#machinelearning#stablediffusion#diffusionmodels#artificialintelligence#deeplearningai#deepneuralnetworks#neuralnetworks#deeplearning#nlp#computervision#AI

Amazonla nueva AlexaTM 20B

Other advance in the field of #NLP (#naturallanguageprocessing) 🚀 AmazonEl nuevo modelo lingüístico multilingüe de AlexaTM 20B supera al GPT-3 y a otros modelos lingüísticos basados en decodificadores en varias tareas de PNL 🤩 🟢 Aspectos destacados 📌 Logra un rendimiento de vanguardia en tareas de resumen de una sola toma y supera a las más grandes #PaLM decodificador model with 540 mil millones de parámetros 📌 En una configuración de tiro cero, incluso supera a la GPT3 en #SuperGLUE y #SQuADv2 conjuntos de datos. 📌 También ofrece un rendimiento de última generación en tareas multilingües como #XNLI, #XCOPA, #Paws-X, y #XWinograd. ➡️ Github Repository: https://bit.ly/3QDOuHV ➡️ Más información sobre AlexaTM 20B: https://bit.ly/3RY7qSP

#machinelearning#ml#deeplearning#languagemodels#LLM#gpt3

El susurro de OpenAI

🚀 Other hit in the voice recognition 🚀 IA abierta es de código abierto #Whisper, un reconocimiento automático de voz (#ASR) sistema que se acerca a la robustez y precisión a nivel humano en el reconocimiento de voz en inglés. 🟢 Aspectos destacados 📌 Se capacitó en 680 000 horas de datos supervisados multilingües y multitarea recopilados de la web 📌 Permite la transcripción en varios idiomas y la traducción de esos idiomas al inglés 📌 El uso de un conjunto de datos tan grande y diverso mejora la solidez de los acentos, el ruido de fondo y el lenguaje técnico 📌 Aproximadamente una parte del conjunto de datos no es inglés 📌 ASR muestra buenos resultados en casi 10 idiomas 📌 Los modelos y el código de inferencia son de código abierto ➡️ Más información sobre Whisper aquí: https://bit.ly/3R9tvgm

#speechrecognition#speechprocessing#speechanalytics#ml#ai#machinelearning#artificialintelligence#naturallanguageprocessing#nlp

Recomendación de tallas para moda de comercio electrónico

Para todos los compradores en línea, ¿alguna vez se han esforzado por encontrar la opción perfecta? 🤔 En el mercado mundial de la moda, las tallas de las prendas tienden a variar de una marca a otra e incluso dentro de la colección de una sola marca. Los compradores deben confiar en las tablas de tallas, las descripciones de los productos y las imágenes 👚👖👔. Para los usuarios, esto supone un gran desafío ya que el cuerpo humano, con su diversidad de formas y dimensiones, no sigue un patrón estándar 🧍 ‍ ♂️🧍. Esto a menudo conduce a pedidos excesivos, devoluciones y compras que no satisfacen las necesidades de los consumidores. 💡 A medida que el comercio electrónico se convierte en la forma predominante de venta minorista de moda, existe una necesidad urgente de que las marcas de moda resuelvan este desafío, creando experiencias que eliminen la fricción de los clientes y hagan que las compras sean rápidas y fluidas. 🟢 En Marvik trabajamos con #deeplearning y #computervision técnicas para crear un sistema de recomendación de tallas que permita a los compradores de comercio electrónico conocer sus medidas corporales y la talla de ropa recomendada simplemente subiendo un par de imágenes 👩🏻🧔🏽 ‍ ♂️ Nos estamos comunicando con nuestra comunidad para solicitar tu apoyo en este emocionante proyecto 🙏🏻 ➡️ Para participar en esta iniciativa, rellena este formulario https://bit.ly/3dNWBo1#sizerecommender#cv#machinelearning#ml#artificialintelligence#fashion#ecommerce#onlineshopping#fashionretail#recsys

Cada viaje de IA comienza con una conversación

Hablemos
Hablemos