Técnico

Resumo de Marvik #2

July 5th, 2022

Marvik

🚀 Bem-vindo ao mais recente Marvik Digest 🚀 Este mês, temos algumas histórias interessantes envolvendo otimização multi-GAN, o novo IoT Insider Lab da Microsoft, modelos de tradução de fala para fala, avanços nas arquiteturas de transformadores e muito mais. ➡️ Quer que abordemos um tópico específico? Envie um DM ou envie um e-mail para [email protected] para nos enviar suas sugestões. Fique ligado!

em Setgan

No reino de #ComputerVision, a geração de imagens humanas de corpo inteiro ainda é um grande desafio 🧍 ‍ ♀️🧍 ‍ ♂️. Como humanos, somos todos diferentes uns dos outros. Em termos de aparência, temos nossa identidade, aparência, forma e pose únicas. #Generativeadversarialnetworks (#GANs) surgiu como um paradigma bem-sucedido de geração de imagens. 🔴 No entanto, surgem problemas ao lidar com classes que mostram variações complexas 🔴 Em um artigo recente publicado pela Adobe Research, Kaust e University College London, eles propõem 🟢#InsetGAN🟢, um método inovador que combina vários GANs pré-treinados, onde um #GAN gera uma tela global e uma série de GANs especializados com foco em diferentes partes do corpo que podem ser inseridas na primeira. ➡️ Principais conclusões: 📌 Apresenta uma estrutura de otimização multi-GAN que otimiza em conjunto os códigos latentes de dois ou mais geradores colaborativos, de forma que a imagem final, formada pela inserção das peças inseridas na tela, não exiba nenhuma costura (por exemplo, uma face, quando adicionada ao corpo, será consistente em tom de pele, limites de roupas e fluxo de cabelo). 📌 Diferentes GANs de tela/peça podem ser treinados em diferentes resoluções, portanto reduzindo os requisitos de dados (qualidade). 📌 Configuração demonstrada pela combinação de um GAN de corpo inteiro com um GAN facial dedicado de alta qualidade para produzir humanos com aparência plausível. 📌 Testado em um conjunto de dados personalizado e avaliado resultados com métricas quantitativas e estudos de usuários. 👉 Saiba mais aqui https://bit.ly/3tjNJuP 👉 Visita www.marvik.ai ou entre em contato com [email protected] para saber mais sobre nossa experiência usando GANs.

Escapada de fim de semana

Alguns dias atrás, tivemos a chance de compartilhar alguns momentos incríveis durante nossa equipe #getaway. Passamos o fim de semana inteiro em uma linda casa, cercada pela natureza e paisagens de tirar o fôlego 🍂 🌳 🌅. Havia espaço para tudo. Jogando jogos de tabuleiro perto da lareira 🔥, animadas competições de pingue-pongue 🏓 e músicas improvisadas de guitarra e cantar junto 🎤 🎸. Além disso, parte da equipe se ofereceu para cozinhar e nos deliciou com um bom churrasco uruguaio e arepas de dar água na boca 🇻🇪. Ainda mais gratificante foi testemunhar a presença da maioria dos Marvik equipe, tanto do Uruguai 🇺🇾 quanto de diferentes partes da Argentina 🇦🇷. Para alguns deles, foi a primeira vez que visitaram 🇺🇾 e, certamente, a primeira vez que nos conhecemos pessoalmente. Nossa equipe continua crescendo e crescendo, e isso é só o começo. 🚀 Você correrá o risco de perder nossa próxima escapada? Certifique-se de que isso não aconteça. 👉 Clique aqui https://bit.ly/3yYYIh4 para ver todas as nossas vagas abertas, ou envie um e-mail para [email protected] para saber mais.

Laboratório Microsoft IoT Insider

📢 Ótimas notícias para o #artificialintelligence comunidade na América Latina 📢 Microsoft escolheu #Uruguay 🇺🇾 para hospedar seu novo #AI&#IoT Insider Lab, o primeiro desse tipo na região e apenas o terceiro fora dos EUA 🇺🇸 💡 Isso é revolucionário, dado o crescente impacto da IA e da IoT na forma como pessoas, dispositivos e dados interagem em todos os aspectos da vida. Além disso, coloca o Uruguai no caminho de se tornar um “centro de inovação” para a região, atuando como facilitador de #innovation e criatividade para transformar as realidades dos negócios. 🚀 A missão do laboratório é mostrar às startups, corporações e organizações de todos os setores como aproveitar as tecnologias de IA e IoT para resolver desafios relacionados, ao mesmo tempo em que fornece orientação e recomendações de especialistas para que possam atingir seu potencial máximo. ➡️ O laboratório oferecerá: 📌 Conhecimento baseado na experiência de especialistas: #electricalengineers, #cloudengineers, #datascientists, #programmanagers, #projectmanagers, e #softwareengineers. 📌 Dedicação sob demanda de pessoas altamente qualificadas #Microsoft colaboradores. 📌 Gerenciamento de projetos, design, arquitetura, prototipagem e orientação pós-implementação para clientes e parceiros. 👉 Saiba mais sobre essa iniciativa aqui https://bit.ly/3NPyNgk 👉 Se você está curioso sobre como os laboratórios de IA e IoT da Microsoft funcionam, clique aqui https://bit.ly/3NSyu46

Novo modelo de tradução de fala para fala

Meta AI lançou recentemente um novo artigo de pesquisa sobre tradução de fala para fala (#S2ST) que não depende de #textgeneration como uma etapa intermediária 💡 Esse método permite uma inferência mais rápida e oferece suporte à tradução entre idiomas não escritos (importante, pois +40% dos idiomas do mundo não têm sistemas de escrita de texto). Em vez da abordagem tradicional (traduzir a fala de origem em espectrogramas de fala alvo), eles usaram unidades de fala discretizadas obtidas do agrupamento de representações de fala autosupervisionadas. 🟢 Principais conquistas: 📌 A primeira desse tipo, treinada em dados de áudio de código aberto do mundo real para vários pares de idiomas 📌 Supera os sistemas S2ST diretos anteriores em termos de #runtime , #FLOPS, e #maxmemory 📌 Aproveita o pré-treinamento com dados de fala não rotulados 👉 Clique aqui para saber mais https://bit.ly/3HEetvS

Transformador DIET

Em nossa última postagem no blog, nosso #mlengineer Diego Sellanes discute #DIET, Rasada mais recente arquitetura de transformadores, que funciona para reconhecimento de entidades e classificação de intenções. Ele explica como funciona, seus diferentes módulos e suas principais vantagens em comparação com modelos similares. “O transformador DIET da RASA tem uma arquitetura muito poderosa. Ele propõe uma nova maneira de entender os transformadores de última geração, com uma função de perda inteligente que resume todos os aspectos do modelo.” 👉 Visite nosso blog para ver a história completa https://bit.ly/3zZ1rqY 👉 Na Marvik, usamos Transformers para executar vários #NLP projetos. Envie um DM ou entre em contato com [email protected] se estiver curioso sobre como aplicá-los para aprimorar seu #NLPmodels. [caption id="attachment_1000" align="aligncenter” width="685"]

Exemplo de resposta do modelo [/caption]

YoLoV6

🚀 YoLoV6 finalmente foi lançado 🚀 #YOLOv6 é uma estrutura de detecção de objetos de estágio único dedicada a aplicações industriais, com design eficiente e fácil de usar em hardware e alto desempenho. 🟢 Principais conclusões: 📌 Cabeça desacoplada eficiente com perda de SiOU 📌 Design compatível com hardware para coluna e pescoço 📌 A precisão de detecção e a velocidade de inferência excedem em muito as do #YOLOv5 📌 anterior Lançado sob GNU General Public v3.0 📌 Em breve: + opções de implantação e ferramentas de quantização 👉 Verifique baixe o repositório aqui https://bit.ly/3AaQHpy

Modelo de peças

📢 Inteligência artificial do Google lançou recentemente o modelo Pathways Autorregressive Text-to-Image (#Parti), seu segundo modelo gerador de texto para imagem 📢 O Parti usa um modelo autorregressivo que alcança a geração de imagens fotorrealistas de alta fidelidade e suporta síntese rica em conteúdo envolvendo composições complexas e conhecimento mundial. 🟢 Destaques: 📌 Trata a geração de texto para imagem como um problema de modelagem de sequência a sequência (semelhante à tradução automática) → permite que ela se beneficie dos avanços em grandes modelos de linguagem. 📌 Mostra melhorias de qualidade consistentes ao escalar seu codificador-decodificador em até 20B de parâmetros. 📌 Alcança o tiro zero de última geração #FID pontuação. 📌 Complementar ao #Imagen (seu antecessor) ao explorar duas famílias diferentes de modelos generativos - autorregressivos e difusão → abre oportunidades empolgantes de combinar ambos. É empolgante testemunhar todos esses avanços na geração de texto para imagem 🚀 👉 Clique aqui para saber mais sobre o Parti https://bit.ly/3I4lMxe [caption id="attachment_1144" align="aligncenter” width="452"]

Um ursinho de pelúcia usando capacete e capa de motocicleta está surfando em um táxi na cidade de Nova York [/caption]

Resumo de Marvik #2

em Setgan

Escapada de fim de semana

Laboratório Microsoft IoT Insider

Novo modelo de tradução de fala para fala

Transformador DIET

YoLoV6

Modelo de peças

News, Insights & Impact

Model Context Protocol: Supercharge your Agents with MCP

Exploring – Nvidia CuOpt

Explorando o NVIDIA Isaac GR00T

Genesis: Redefining Robotics and Physics Simulations

Toda jornada de IA começa com uma conversa