Inteligência Artificial avança e empresas já podem criar vozes oficiais

Mascotes e garotos propaganda em geral costumam ter uma voz, que até hoje, eram feitas de maneira natural, isto é, através da dublagem feita por um ator que emprestava sua voz para o personagem. Agora isso vai mudar.

Nesta semana, a NVIDIA anunciou uma ferramenta que permite a criação de vozes humanas personalizadas em apenas um dia, com apenas 30 minutos de dados de áudio.

Batizado de NVIDIA Riva Custom Voice, um recurso do software de Inteligência Artificial (IA) de fala do NVIDIA Riva, torna prática a conversão personalizada de texto em fala para milhões de empresas. Oferece ainda recursos para desenvolver vozes expressivas e ajustá-las em horas, e não mais em semanas, usando uma pequena quantidade de dados.

As empresas podem usar o Riva Custom Voice para criar um assistente virtual com uma voz única. Já os call centers podem usá-lo para desenvolver rapidamente uma voz de marca reconhecível para atender aos clientes. Além disso, os desenvolvedores podem utilizá-lo para criar uma grande variedade de aplicações para apoiar as pessoas com déficits de fala e idioma.

“As interações humanas têm sido um dos maiores desafios para a inteligência artificial, especialmente para empresas com jargões específicos do setor”, explica Kari Briski, vice-presidente de gerenciamento de produtos para software de IA da NVIDIA. “Agora, essas empresas podem usar a IA de fala para ouvir e responder aos clientes com uma voz expressiva que é exclusiva da sua marca e promove interações mais envolventes e agradáveis.”

O Riva Custom Voice está disponível na versão mais atual do kit de desenvolvimento de software de IA de fala NVIDIA Riva. O Riva SDK inclui reconhecimento automático de voz de classe mundial e recursos de conversão de texto em fala que são personalizáveis para diferentes sotaques e domínios. Também oferece a capacidade de dimensionar serviços de fala para centenas de milhares de fluxos no cloud, data center ou edge.

“Desde o início das criações de vozes digitais, a NVIDIA busca por soluções cada vez mais naturais. Esses lançamentos permite que as empresas utilizem os sistemas para criações que atendam cada vez mais neste sentido”, enfatiza Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.

Voz do ecossistema

Em menos de três anos, o software de IA conversacional da NVIDIA foi baixado mais de 250 mil vezes, com ampla adoção em uma variedade de setores.

A RingCentral, uma das principais fornecedoras de comunicações corporativas globais em cloud, reuniões em vídeo, colaboração e soluções de centro de contato, está usando o reconhecimento automático de fala do Riva para o recurso de legendas de suas videoconferências ao vivo para criar experiências de reunião mais envolventes.

“Nosso objetivo é tornar as reuniões mais inteligentes e, com o NVIDIA Riva, agora é possível treinar modelos de transcrição ao vivo em GPUs NVIDIA para precisão contra sotaques variados”, afirma Nat Natarajan, vice-presidente executiva e gerente geral de produtos e engenharia da RingCentral. “No futuro, esperamos que haja muitos fluxos simultâneos, e o Riva pode facilmente ser escalado, executando esses fluxos em tempo real, em menos de 300 milissegundos. Estamos entusiasmados com a nossa parceria com a NVIDIA e com as perspectivas futuras.”

A Ping An, uma das maiores empresas de serviços financeiros do mundo, está melhorando as experiências dos clientes ao reduzir o tempo de espera através de seus agentes virtuais. O uso do Riva permite que ela desenvolva aplicações de fala em tempo real que estão constantemente melhorando em precisão.

“A Ping An aborda milhões de consultas de clientes por dia usando agentes de chatbot”, diz Jing Xiao, cientista-chefe da Ping An. “Usando os modelos pré-treinados da NVIDIA para reconhecimento automático de voz, mais ajustados com nossos dados, o sistema obteve uma melhoria de 5% na precisão, permitindo-nos fornecer serviços mais envolventes e autênticos.”

Dezenas de fabricantes de software também estão usando a IA conversacional da NVIDIA na produção. A Gosoft Contact Center está trabalhando com a CP All, que tem mais de 20 domínios de negócios. Seu domínio de varejo atende mais de 10 mil lojas de conveniência 7-11 na Tailândia. No total, 240 mil chamadas são processadas por dia através da ajuda de bots de voz de IA altamente precisos, treinados no idioma tailandês.

A Plabook Education e a Data Monsters também estão trabalhando com distritos escolares nos EUA para ajudar crianças a aprender a ler através de seu assistente de leitura com avatares digitais ativados por IA que ajuda a identificar palavras mal pronunciadas e medir sua precisão de leitura.

Disponibilidade e preços

Para pesquisa e desenvolvimento em pequena escala, o NVIDIA Riva está disponível sem custo no registro de contêiner do NVIDIA NGC. Os desenvolvedores podem participar do programa beta aberto do Riva para experimentar o software e receber notificações sobre os próximos recursos.

Para clientes com implantações em larga escala e que buscam suporte técnico de especialistas, a NVIDIA também anuncia o programa NVIDIA Riva Enterprise, que deve estar disponível no início do próximo ano. 

Riva no GTC

Em sua palestra no GTC, o fundador e CEO da NVIDIA, Jensen Huang, apresentou os recursos de IA de fala da Riva, incluindo uma demonstração com o Riva Custom Voice que destacou como novas vozes humanas podem ser criadas com apenas 30 minutos de dados.

Riva também foi mostrado no Omniverse Avatar – uma plataforma para a criação de avatares interativos – através do Project Tokkio, DRIVE Concierge e Project Maxine. O Project Tokkio e o DRIVE Concierge exibiram avatares em ambientes de atendimento ao cliente e em veículos, enquanto o Project Maxine destacou a tradução e transcrição em tempo real para vários idiomas.

No GTC, há mais de duas dezenas de palestras focadas em IA de conversação, incluindo Hugging Face, Snap, T-Mobile e mais. Os tópicos incluem algoritmos de última geração, ferramentas, desafios e impacto do desenvolvimento e integração de aplicativos de fala e linguagem de IA acelerados por GPU.

Marx Walker , Observatório de Games.

Fonte: Observatório de Games.

dom, 14 nov 2021 11:11:39 -0300

Publicidade

Jogue agora!

Veja as últimas noticias!

12489

Publicidade