• CloneX
  • Posts
  • Número cento e cinquenta e três

Número cento e cinquenta e três

A 153 volta

Tempo de leitura: 1 min e 53 seg

INTELIGÊNCIA ARTIFICIAL

A IA de voz mais natural já criada

A Sesame desenvolveu o Conversational Speech Model (CSM), um novo modelo de IA de voz que utiliza dois transformers autorregressivos para processar texto e fala simultaneamente.

O Backbone Multimodal compreende o conteúdo e o contexto da fala, enquanto o Decodificador de Áudio gera áudio de baixa latência.

O modelo ajusta o ritmo da fala, sabe quando intervir ou esperar e mantém um fluxo natural de conversa.

Fonte: Sesame

Mais detalhes:

  • Testamos aqui, por 12 minutos e a conversa foi fluida e não cansativa, realmente impressionante.

  • Superou modelos tradicionais, como os da OpenAI e ElevenLabs.

  • A Sesame é liderada pelo ex-fundador da Oculus, vendida à Meta por $2 bilhões.

  • Ainda não disponível em português. E API não liberada.

TECNOLOGIA EXPLICADA

O que é um modelo de IA?

Um modelo de IA é treinado para reconhecer padrões e tomar decisões com base em dados, aprendendo com exemplos para aprimorar seu desempenho.

Criar um novo modelo vai além de ajustar parâmetros. É preciso mudar como ele aprende e processa informações.

O Conversational Speech Model (CSM), da Sesame, exemplifica essa inovação ao integrar áudio e texto, gerando respostas mais naturais e contextuais.

Fonte: CloneX

Mais detalhes:

  • Arquitetura nova: Novos modelos trazem redes neurais mais avançadas e formas inéditas de aprendizado.

  • Treinamento intensivo: Eles são ajustados com grandes volumes de dados para aumentar a precisão e eficiência.

  • Caso brasileiro: A Neospace, investida pelo Itaú, é um exemplo nacional de criação de um novo modelo.

CLONEX CLUB

Voltamos

Na Clonex, só criamos conteúdo que realmente consumiríamos.

No feriado, o foco é família e amigos, não uma newsletter.

Agora estamos de volta

Bom dia. Até amanhã. Tchau.

Aqui você encontra os links que mostramos nos vídeos do Insta da CloneX.

Para acessar é só clicar no nome.

  • OmniParser V2: Ferramenta que faz uma IA utilizar seu computador.

  • Adobe Firefly Software com IA para geração de imagens e vídeos.

  • Data Formulator: Software open-source da Microsoft para análisar dados sem precisar programar.