Nvidia GPU Technology Conference (GTC) 2024

A GTC ocorreu entre os dias 18 e 21 de março de 2024 no San Jose Convention Center, na Califórnia.

O CEO da Nvidia, Jensen Huang, fez a abertura do evento com uma palestra sobre os avanços da inteligência artificial que estão moldando o futuro.

A GTC 2024 teve um foco total em inteligência artificial e foi considerada a “conferência número um de IA para desenvolvedores” pela marca.

Eis aqui os principais temas abordados:

Projeto Groot da Nvidia

Nvidia acaba de mudar a robótica para sempre com seu modelo básico inovador, projetado para revolucionar a forma como os robôs humanóides aprendem e interagem com o mundo.

Alimentado por instruções multimodais e experiências anteriores, o Groot permite que os robôs adquiram novas habilidades simplesmente observando demonstrações humanas.

Além disso, Groot usa um modelo básico de ponta que capacita facilmente robôs humanóides com uma série de capacidades inteligentes, como ser capaz de compreender a linguagem natural, imitar movimentos humanos simplesmente nos observando e adquirir rapidamente quaisquer outras novas habilidades, como coordenação, destreza, navegação e muito mais.

E em seu coração está o Jetson Thor da Nvidia, um computador especialmente desenvolvido para robôs humanóides alimentado pelo novo sistema Thor da empresa em um chip.

Este feito microscópico de engenharia possui uma GPU de próxima geração baseada na nova arquitetura Blackwell, fornecendo impressionantes 800 teraflops de desempenho de IA de ponto flutuante de oito bits.

E com esse poder computacional tão imensos, Thor executa facilmente modelos de IA generativos multimodais como Groot e outros, permitindo que robôs com cognição de próxima geração trabalhem com segurança com humanos e seus ambientes.

Atualizações da Plataforma Isaac Robotics

Mas a visão da Nvidia vai muito além do hardware, já que a empresa também revelou atualizações significativas para sua plataforma Isaac Robotics, fornecendo aos desenvolvedores um conjunto abrangente de ferramentas para aproveitar todo o potencial de Groot e Jetson Thor.

Além dessas ferramentas, há também o Isaac Lab, que é um aplicativo acelerado por GPU projetado especificamente para executar milhares de simulações paralelas de instâncias de aprendizagem de robôs, permitindo o florescimento de técnicas de aprendizagem por reforço de ponta.

Aqui está a reviravolta para orquestrar os fluxos de trabalho complexos envolvidos no desenvolvimento de robôs.

A Nvidia também introduziu o Osmo, um serviço de orquestração de computação que coordena a geração de dados, software de treinamento de modelo e hardware nas tarefas de loop em ambientes distribuídos.

Em suma, esta poderosa ferramenta garante uma colaboração perfeita e uma utilização eficiente dos recursos, acelerando o ritmo da inovação.

Isaac Manipulator e Perceptor

E a visão da Nvidia vai além dos robôs humanóides.

O Isaac Manipulator oferece destreza de última geração e recursos modulares de IA para braços robóticos, proporcionando uma velocidade de até 80x no planejamento de trajetória e percepção de tiro zero(zero shot perception), permitindo que os desenvolvedores automatizem uma maior várias novas tarefas robóticas com facilidade.

E muitos parceiros do ecossistema já estão a adoptar esta poderosa ferramenta de manipulação.

E o novo Isaac Perceptor da Nvidia traz recursos de visão surround 3D multicâmera para robôs móveis autônomos para melhorar ainda mais sua consciência situacional em ambientes de trabalho.

Na verdade, empresas como Arcbest, BYD e Kion Group já estão entre alguns dos primeiros a adotar que estão aproveitando ativamente o Isaac Perceptor para alcançar todos os novos níveis de autonomia nas operações de manuseio de materiais, maior eficiência, taxas de erro reduzidas e maior segurança do trabalhador.

E embora a empresa espere que a IA incorporada resolva alguns dos maiores desafios da humanidade, há um mundo totalmente separado que a Nvidia também revelou.

Expansão do Omniverse da Nvidia

Este é o poderoso mecanismo de simulação da Nvidia que recria o mundo físico com detalhes digitais impressionantes, que também serve como uma academia digital onde os robôs podem treinar e aprender com segurança antes de se aventurarem no mundo real.

Com cinco novas APIs, o Omniverse da Nvidia agora possui ferramentas para renderização de dados fotorrealistas, consultas de cenas de interação, rastreamento de alterações e colaboração em tempo real em ambientes 3D.

Além disso, com a atualização mais recente do Omniverse Cloud, os usuários agora podem transmitir diretamente para o Vision Pro da Apple.

Isso permite que eles naveguem e interajam perfeitamente com esse espaço digital usando realidade aumentada para que possam construir espaços virtuais, manipular modelos 3D e colaborar com colegas de qualquer lugar do mundo, tudo dentro do espaço virtual compartilhado da Nvidia.

GPU Blackwell e NVLink

No coração da Blackwell está o chip de IA mais poderoso do mundo, com impressionantes 208 bilhões de transistores combinando duas matrizes de GPU de última geração, que são conectadas por um chip extremamente rápido de dez terabytes por segundo , formando um gigante computacional unificado.

Mas a Blackwell vai muito além da potência bruta ao apresentar também seu mecanismo transformador de segunda geração, que aproveita algoritmos avançados e inferência de IA de ponto flutuante de quatro bits para suporte duplo.

Além disso, a Blackwell também suporta a quinta geração do rendimento bidirecional sem precedentes de 1,8 TB por segundo da Nvidia.

Isso garante comunicação contínua de alta velocidade de até 576 GPUs, permitindo que os mais complexos modelos de IA de trilhões de parâmetros operem com eficiência máxima.

Além disso, o mecanismo de corrida dedicado da Blackwell e os recursos avançados de computação confidencial reforçam a confiabilidade, a disponibilidade, a capacidade de manutenção e a segurança, que são fatores críticos para implantações de IA bem-sucedidas.

NVLink

O novo NVLink que complementa a Blackwell é um chip switch revolucionário que facilita a comunicação extremamente rápida entre todas as GPUs.

Além disso, com impressionantes 50 bilhões de transistores e quatro portas NVLink, esse switch permite que cada GPU em um sistema se comunique com todas as outras GPUs em velocidade máxima simultaneamente.

Isso finalmente torna possível criar sistemas de IA em escala que reúnem o poder de vários sistemas DGX em um único rack, tudo graças à incrível largura de banda e conectividade fornecidas pelo mais novo NVLink número cinco.

Microsserviços de Inferência e Plataforma NeMo

Reconhecendo a necessidade crescente de ferramentas de IA acessíveis, a Nvidia também introduziu seus microsserviços de inferência atualizados e plataformas NeMo, por um lado.

Nims é uma coleção de modelos de IA otimizados e pré-treinados, prontos para implantação no vasto ecossistema de hardware da Nvidia.

NeMo, por outro lado, é um microsserviço que simplifica o processo de curadoria e ajuste fino de modelos de IA, permitindo que os usuários os adaptem às suas necessidades específicas, ao mesmo tempo que impõem barreiras de proteção para o desenvolvimento responsável de IA.

Juntas, essas plataformas democratizam o desenvolvimento de IA e tornam mais fácil para empresas e pesquisadores usarem os mais recentes avanços de IA com mais facilidade, sem a necessidade de qualquer conhecimento ou recursos especializados .

AI Foundry para Assistentes Virtuais

Para acelerar ainda mais a adoção da IA em todos os setores, a Nvidia ajudará uma série de empresas de tecnologia no desenvolvimento de copilotos de IA, assistentes virtuais e agentes inteligentes adaptados aos seus respectivos domínios.

É importante ressaltar que a AI foundry aproveita as plataformas NeMo e Nims da Nvidia,
juntamente com sua poderosa infraestrutura de nuvem DGX, a fim de fornecer uma solução completa de desenvolvimento e implantação de IA .

Novo serviço de texto para 3D da Shutterstock

O texto para 3D Shutterstock revelou seu mais novo serviço de texto para 3D baseado na arquitetura multimodal edify de ponta da Nvidia , permitindo aos usuários gerar ativos 3D diretamente a partir de prompts de texto.

Além disso, a Getty Images também oferece às empresas a capacidade de personalizar o modelo Edify Base para alinhá-lo ao estilo visual de sua própria marca.

Além disso, a partir de maio, novas APIs fornecerão em breve acesso a recursos avançados, como profundidade e segmentação de esboços, proporcionando aos profissionais criativos um controle sem precedentes sobre a geração de imagens de IA.

Os modelos edify pré-construídos da Getty Images e Shutterstock podem ser testados como APIs por meio da inferência de microsserviços da Nvidia.

Research, Edição, formatação e finalização: Werney Lima, March 22, 2024 (Friday)
Fonte: https://www.youtube.com/watch?v=ByUeUHt79Yw
Resumido e Traduzido pelo ChatGPT 3.5
Ferramentas normalmente usadas: Harpa.AI, Feedly, Canva, Affinity Photo, Obsidian, Google Docs.