
Resumo de Marvik #5
🚀 Bem-vindo ao último Marvik Digest 🚀 No mês passado, abordamos algumas histórias interessantes envolvendo transformadores multimodais, difusão estável, modelos de linguagem multilíngue e muito mais. ➡️ Quer que abordemos um tópico específico? Envie um DM ou envie um e-mail para [email protected] para nos enviar suas sugestões. Fique ligado!
O novo multimodal do Hugging Face Transformador modelo
Ótima notícia saber que o #TF versão do #LayoutMv3 multimodais #Transformer o modelo está agora disponível em Abraçando o rosto! 🚀 Sua arquitetura simples, mas revolucionária, melhorou muitos benchmarks de seus antecessores, ao ser o primeiro modelo de IA de documentos que não depende de um backbone CNN ou R-CNN para extrair recursos visuais. 🟢 Principais destaques: 📌 Uma de suas maiores vantagens é que é um modelo de uso geral para IA de documentos centrada em texto e imagem 📌 Unifica o conceito de transformadores para fins centrados em texto com o OCR e o visual modelos centrados usados para tarefas de IA Na Marvik, usamos esse modelo para tarefas relacionadas à detecção de objetos e ele resultou em resultados incríveis resultados 🤩 💡 Se você está enfrentando um problema semelhante ou tem uma ideia para discutir no Document AI, vamos conversar. Entre em contato com [email protected] e descubra como podemos ajudá-lo. ➡️ Para acessar o modelo: https://bit.ly/3CXm7B8

#ai#artificialintelligence#machinelearning#ml#tensorflow#nlp#naturallanguageprocessing#languagemodels#multimodaltransformer#transformers
IA de estabilidade. ' s Difusão estável
Dê-me “Um corgi com óculos escuros dirigindo um tesla” e você terá... 🤔 A IA generativa percorreu um longo caminho. A introdução do #GANs autorizado a alcançar novos patamares no #ML espaço, mas um novo desenvolvimento está definido para impulsionar a próxima geração de #AI geração de imagens. 🚀 Estamos falando sobre IA de estabilidade. ' s Difusão estável 🚀 Como este difere dos outros modelos de difusão, como #GLIDE, #DALL ·E 2 (Inteligência artificial aberta), #Imagen (Google)? 📌 Verdadeiramente gratuito e de código aberto, tanto modelos quanto códigos 📌 Usando difusão latente, o modelo pode ser executado com um consumidor #GPU ou mesmo em um chip m1. Isso significa que todos nós podemos finalmente usar essa técnica poderosa em nossos projetos e jogar o quanto quisermos com os incríveis recursos que ela oferece, como: 📌 Geração de texto para imagem (semelhante a #DALL ·E) 📌 Super resolução (#Denoising) 📌 Pintura interna de imagem (remove itens das imagens) 📌 Pintura externa de imagem (gera mais imagens com base em uma) 📌 Layout/segmentação (geração de imagem) 📌 Geração de imagem de classe (gera imagens seguindo uma única classe, por exemplo, um carro) Tudo isso parece bom, mas por que é relevante? Embora seja muito cedo na vida útil dos modelos de difusão, eles já têm um desempenho igual ou melhor do que os GANs, uma das opções mais fortes para geração de imagens. Imagine todas as possibilidades que se abrem 🤩 🤩 Algumas ideias que vêm à mente: 📌 Imagens de estoque infinitas 📌 Geração de texturas para jogos 📌 Inspiração artística para criar arte 📌 Criação de logotipo 📌 Roupas Inspiração na moda 📌 Colorização de imagens Na Marvik, temos uma vasta experiência no uso #GAN modelos e tem algumas ideias muito interessantes sobre como aproveitar essa nova era de IA generativa 🙌🏻 Quer participar e ver para onde estamos indo? Entre em contato com [email protected] para descobrir 🔍 ➡️ Para saber mais sobre Stability.ai: https://bit.ly/3Br5fBJ ➡️ Para acessar o artigo completo: https://bit.ly/3QpeV3T ➡️ Para acessar o código: https://bit.ly/3QorcG1

#generativeai#imagegenetation#machinelearning#stablediffusion#diffusionmodels#artificialintelligence#deeplearningai#deepneuralnetworks#neuralnetworks#deeplearning#nlp#computervision#AI
AmazôniaO novo AlexaTM 20B
Outro avanço no campo da #NLP (#naturallanguageprocessing) 🚀 AmazôniaO novo modelo de linguagem multilíngue da (AlexaTM 20B) supera o GPT-3 e outros modelos de linguagem baseados em decodificador em várias tarefas de PNL 🤩 🟢 Highlights 📌 Alcança desempenho de última geração em tarefas de resumo de uma única tentativa e supera tarefas maiores #PaLM modelo de decodificador com 540 bilhões de parâmetros 📌 Na configuração de zero, ele supera até mesmo o GPT3 em #SuperGLUE e #SQuADv2 conjuntos de dados. 📌 Ele também oferece desempenho de última geração em tarefas multilíngues, como #XNLI, #XCOPA, #Paws-X e #XWinograd. ➡️ Repositório Github: https://bit.ly/3QDOuHV ➡️ Mais sobre AlexaTM 20B: https://bit.ly/3RY7qSP

#machinelearning#ml#deeplearning#languagemodels#LLM#gpt3
O sussurro da OpenAI
🚀 Outro marco no campo do reconhecimento de fala 🚀 Inteligência artificial aberta é de código aberto #Whisper, um reconhecimento automático de fala (#ASR) sistema que aborda robustez e precisão em nível humano no reconhecimento de fala em inglês. 🟢 Destaques 📌 Treinado em 680.000 horas de dados supervisionados multilíngues e multitarefas coletados da web 📌 Permite a transcrição em vários idiomas e a tradução desses idiomas para o inglês 📌 O uso de um conjunto de dados tão grande e diversificado melhora a robustez de sotaques, ruído de fundo e linguagem técnica 📌 Cerca de ⅓ do conjunto de dados não está em inglês 📌 O ASR mostra resultados sólidos em quase 10 idiomas 📌 Os modelos e o código de inferência são de código aberto ➡️ Mais no Whisper aqui: https://bit.ly/3R9tvgm

#speechrecognition#speechprocessing#speechanalytics#ml#ai#machinelearning#artificialintelligence#naturallanguageprocessing#nlp
Recomendação de tamanho para moda de comércio eletrônico
Para todos os compradores on-line, você já se esforçou para encontrar a opção perfeita? 🤔 No mercado global de moda, o tamanho das roupas tende a variar de marca para marca e até mesmo dentro da coleção de uma única marca. Os compradores devem confiar em tabelas de tamanhos, descrições de produtos e imagens 👚👖👔. Como usuários, esse é um grande desafio, pois o corpo humano, com sua diversidade de formas e dimensões, não segue um padrão padrão 🧍 ♂️🧍. Isso geralmente leva a pedidos excessivos, devoluções e compras que não atendem às necessidades dos consumidores. 💡 À medida que o comércio eletrônico se torna a forma predominante de varejo de moda, há uma necessidade urgente de as marcas de moda resolverem esse desafio, criando experiências que eliminem o atrito do cliente e tornem as compras rápidas e fáceis. 🟢 Na Marvik, estamos trabalhando com #deeplearning e #computervision técnicas para criar um sistema de recomendação de tamanho que permita que os compradores de comércio eletrônico conheçam suas medidas corporais e o tamanho recomendado de roupas simplesmente enviando duas fotos 👩🏻🧔🏽 ♂️ Estamos entrando em contato com nossa comunidade para pedir seu apoio neste projeto empolgante 🙏🏻 ➡️ Para participar desta iniciativa, preencha este formulário https://bit.ly/3dNWBo1#sizerecommender#cv#machinelearning#ml#artificialintelligence#fashion#ecommerce#onlineshopping#fashionretail#recsys