Anúncio fechado

Apple em seu blog Machine Learning Journal Publicados um novo artigo que descreve algumas coisas interessantes sobre o reconhecimento de voz e o uso do Siri no alto-falante HomePod. Trata-se principalmente de como o HomePod é capaz de capturar os comandos de voz do usuário mesmo em condições operacionais prejudicadas, como reprodução de música muito alta, alto nível de ruído ambiente ou grande distância do usuário do alto-falante.

Devido à sua natureza e foco, o alto-falante HomePod deve ser capaz de funcionar em diversas condições. Alguns usuários o colocam na mesinha de cabeceira ao lado da cama, outros o “limpam” no canto da sala ou colocam o alto-falante sob a TV que está tocando alto. Na verdade, existem muitos cenários e possibilidades, e os engenheiros da Apple tiveram que pensar em todos eles ao projetar a tecnologia que faz o HomePod “ouvir” em quase todas as situações.

Para que o HomePod consiga registrar comandos de voz em um ambiente não muito favorável, ele possui um sistema bastante complexo de recepção e processamento de sinais sonoros. O processo de análise do sinal de entrada consiste em vários níveis e um mecanismo que opera com base em algoritmos de autoaprendizagem que podem filtrar e analisar suficientemente o sinal sonoro recebido para que o HomePod receba apenas o que necessita.

Níveis individuais de processamento removem assim, por exemplo, o eco do som recebido, que aparece no sinal recebido devido à produção do HomePod como tal. Outros cuidarão do barulho, que é demais em condições domésticas – ligado forno microondas, um aspirador de pó ou, por exemplo, uma televisão para jogar. E a última sobre o eco causado pela disposição da sala e pela posição a partir da qual o usuário pronuncia os comandos individuais.

A Apple discute o acima mencionado com bastante detalhe no artigo original. Durante o desenvolvimento, o HomePod foi testado em diversas condições e situações para que os engenheiros pudessem simular tantos cenários quanto possível durante os quais o alto-falante será usado. Além disso, o sistema de processamento de som multicanal fica a cargo de um processador A8 relativamente poderoso, que fica ligado o tempo todo e está constantemente “ouvindo” e aguardando um comando. Graças a cálculos relativamente complexos e poder de computação relativamente decente, o HomePod pode funcionar em quase todas as condições. Infelizmente, é uma pena que o hardware de última geração seja prejudicado por um software relativamente imperfeito (onde quer que já tenhamos ouvido isso antes...), porque o assistente Siri está ficando atrás de seus maiores concorrentes ano após ano.

HomePod Facebook
.