- CloneX
- Posts
- Número cento e cinquenta e três
Número cento e cinquenta e três
A 153 volta

Tempo de leitura: 1 min e 53 seg
INTELIGÊNCIA ARTIFICIAL
A IA de voz mais natural já criada

A Sesame desenvolveu o Conversational Speech Model (CSM), um novo modelo de IA de voz que utiliza dois transformers autorregressivos para processar texto e fala simultaneamente.
O Backbone Multimodal compreende o conteúdo e o contexto da fala, enquanto o Decodificador de Áudio gera áudio de baixa latência.
O modelo ajusta o ritmo da fala, sabe quando intervir ou esperar e mantém um fluxo natural de conversa.
Fonte: Sesame
Mais detalhes:
Testamos aqui, por 12 minutos e a conversa foi fluida e não cansativa, realmente impressionante.
Superou modelos tradicionais, como os da OpenAI e ElevenLabs.
A Sesame é liderada pelo ex-fundador da Oculus, vendida à Meta por $2 bilhões.
Ainda não disponível em português. E API não liberada.
TECNOLOGIA EXPLICADA
O que é um modelo de IA?

Um modelo de IA é treinado para reconhecer padrões e tomar decisões com base em dados, aprendendo com exemplos para aprimorar seu desempenho.
Criar um novo modelo vai além de ajustar parâmetros. É preciso mudar como ele aprende e processa informações.
O Conversational Speech Model (CSM), da Sesame, exemplifica essa inovação ao integrar áudio e texto, gerando respostas mais naturais e contextuais.
Fonte: CloneX
Mais detalhes:
Arquitetura nova: Novos modelos trazem redes neurais mais avançadas e formas inéditas de aprendizado.
Treinamento intensivo: Eles são ajustados com grandes volumes de dados para aumentar a precisão e eficiência.
Caso brasileiro: A Neospace, investida pelo Itaú, é um exemplo nacional de criação de um novo modelo.
CLONEX CLUB
Voltamos

Na Clonex, só criamos conteúdo que realmente consumiríamos.
No feriado, o foco é família e amigos, não uma newsletter.
Agora estamos de volta
Bom dia. Até amanhã. Tchau.
CLONEX LINKS
Link dos vídeos

Aqui você encontra os links que mostramos nos vídeos do Insta da CloneX.
Para acessar é só clicar no nome.
OmniParser V2: Ferramenta que faz uma IA utilizar seu computador.
Adobe Firefly Software com IA para geração de imagens e vídeos.
Data Formulator: Software open-source da Microsoft para análisar dados sem precisar programar.