Principais Lançamentos e Novidades do Google I/O 2024
O Google I/O 2024 foi repleto de novidades focadas em inteligência artificial. Durante a conferência, a empresa revelou novas ferramentas de chatbot com IA, melhorias na busca e várias atualizações para o Android. Aqui estão os principais destaques:
Avanços no Gemini
O modelo de linguagem móvel do Google, o Gemini Nano, recebeu uma atualização significativa e agora é chamado de Gemini Nano com Multimodalidade. Segundo Sundar Pichai, CEO do Google, isso permitirá “transformar qualquer entrada em qualquer saída”. O modelo pode processar informações de texto, fotos, áudio, vídeos sociais e vídeos ao vivo da câmera do seu telefone, sintetizando esses dados para fornecer resumos ou responder a perguntas. Um vídeo demonstrou a funcionalidade escaneando livros em uma estante e registrando os títulos em um banco de dados.
Além disso, o Gemini 1.5 Pro, um sistema de IA robusto baseado em nuvem, está agora disponível globalmente para desenvolvedores.
Busca de Fotos Aprimorada
O Google Fotos recebeu novas ferramentas robustas de busca visual com o recurso Ask Photos. Este recurso permite que o Gemini pesquise suas fotos e ofereça resultados detalhados. Por exemplo, você pode pedir para encontrar seu carro em todas as fotos usando o número da placa.
Jerem Selier, engenheiro de software do Google Fotos, afirmou em um post no blog que o Ask Photos não coleta dados para exibir anúncios ou treinar outros modelos de IA. O lançamento está previsto para o verão.
IA no Google Workspace
A IA está sendo integrada ao Google Workspace. A partir de hoje, um botão para ativar a IA Gemini estará disponível no painel lateral de aplicativos como Gmail, Google Drive, Docs, Sheets e Slides. Esse assistente pode ajudar a redigir e-mails, fornecer resumos de documentos e auxiliar os alunos com suas lições de casa.
O AI Teammate, uma nova funcionalidade, permite personalizar um assistente virtual para coordenar comunicações, rastrear arquivos e gerenciar listas de tarefas. Outro novo recurso, Gems, permite configurar rotinas automatizadas para tarefas digitais.
Novos Modelos Gemini
O Google introduziu dois novos modelos de IA. O Gemini 1.5 Flash é otimizado para tarefas rápidas, enquanto o Project Astra é um chatbot visual avançado, uma versão aprimorada do Google Lens. O Astra permite que os usuários façam perguntas sobre objetos apontando a câmera do telefone. Ele possui compreensão espacial e contextual aprimorada, identificando objetos no mundo real.
Ferramentas de Criatividade
A área criativa dos esforços de IA do Google também recebeu destaque. O VideoFX, baseado no gerador de vídeos Veo do Google DeepMind, cria vídeos em 1080p a partir de prompts de texto, oferecendo mais flexibilidade na produção. O ImageFX, gerador de imagens de alta resolução, foi aprimorado para reduzir artefatos digitais indesejados.
Além disso, o MusicFX ganhou o DJ Mode, permitindo que músicos criem loops e samples de música a partir de prompts. Este recurso foi demonstrado durante uma performance do músico Mark Rebillet.
Inovações na Busca
As novas capacidades de IA do Google representam uma grande evolução para o produto principal da empresa. A busca organizada por IA oferece resultados mais claros e legíveis, e resumos de IA agregam informações de várias fontes para responder perguntas diretamente na página de resultados.
O novo recurso Raciocínio em Múltiplas Etapas permite obter informações detalhadas sobre um tópico, como planejamento de viagens, mostrando hotéis, restaurantes e opções de refeições. Uma demonstração do Google Lens mostrou como o recurso pode identificar e fornecer instruções para ajustar um toca-discos.
Segurança e Proteção
Uma das novidades mais destacadas foi a função de detecção de golpes para Android. Este recurso monitora chamadas telefônicas em busca de linguagem suspeita e sugere que o usuário desligue se detectar uma tentativa de golpe. A análise é feita no próprio dispositivo, garantindo privacidade.
O Google também expandiu a ferramenta de marca d’água SynthID, que ajuda a detectar desinformação e deepfakes. A marca d’água é invisível a olho nu, mas pode ser detectada por software que analisa os dados dos pixels. O Google planeja lançar o SynthID como uma ferramenta de código aberto no final deste verão.
Essas inovações mostram como o Google está investindo na inteligência artificial para melhorar seus produtos e garantir a segurança dos usuários.
Para ter acesso a mais conteúdos e as palestras, acesse este link: Google I/O