sexta-feira, 9 de novembro de 2012

Microsoft apresenta tecnologia que usa a voz do usuário para falar outros idiomas


Microsoft Research mostra um avanço significativo na tecnologia de tradução da fala
A Microsoft publicou na última quinta-feira um vídeo em que mostra uma tecnologia capaz de não só traduzir as falas de um usuário numa transcrição em legenda, como também reproduzir a tradução em áudio, num novo idioma e com tom de voz original. Segundo Rick Rashid, diretor de pesquisa da Microsoft, a técnica utilizada chama-se Deep Neural Networks, ela segue o modelo de comportamento do cérebro humano, e permitiu aos pesquisadores treinar o reconhecimento com um critério melhor do que métodos anteriores. "Nós conseguimos reduzir a taxa de erro por fala em 30% na comparação com as técnicas usadas antes. Isso significa que em vez de ter uma palavra errada em cada quatro ou cinco, a taxa é de uma em cada sete ou oito", disse Rashid. Numa primeira etapa, o computador entende a voz do usuário e a converte em um texto escrito. Depois, o texto escrito é traduzido, ainda textualmente, para outra língua. No passo seguinte, um áudio de uma hora com a voz do usuário foi utilizado para reproduzir o texto traduzido em som, fazendo a voz do interlocutor inicial falar no novo idioma. No vídeo, um executivo apresenta a tecnologia com uma tradução do inglês para o mandarim. Ao final da apresentação, por exemplo, ao agradecer - thank you, na sua própria voz, em mandarim, se ouviu xiè xiè.

Nenhum comentário: