Solução VoIP: Facilidade na transmissão de conteúdo de voz e multimídia pela Internet

A Espressif possui uma solução de Internet Phone baseada no ESP32. A tecnologia em que esta solução se baseia é o Voice over Internet Protocol (VoIP), que facilita a transmissão de conteúdo de voz e multimídia pela Internet.

Historicamente, o VoIP se refere ao uso de um IP (Internet Protocol) para conectar PBXs, mas agora o termo é usado de forma intercambiável com a telefonia IP. Na prática, isso significa que o VoIP usa codecs para encapsular o áudio em pacotes de dados, transmitir esses pacotes por uma rede IP e "desencapsular" os pacotes de volta ao áudio na outra extremidade da conexão.

Mais especificamente, a solução baseada em ESP32 usa VoIP para codificar e compactar dados gravados, que são então empacotados, de acordo com o padrão TCP/IP, e transmitidos por uma rede IP. Dessa forma, o ESP32 realiza uma chamada de voz pela Internet.

Para os fins desta solução específica, a equipe de áudio da Espressif trabalhou com a China Mobile, que contribuiu com o link E para esta solução. O And-link é um protocolo de interoperabilidade para acessar o ecossistema Smart-Home da China Mobile. Em outras palavras, o And-link funciona como uma ponte entre o ESP32 e o outro usuário que se deseja chamar pela Internet, independentemente da outra pessoa estar usando um PC, tablet, smartphone ou telefone fixo.

O que a Espressif oferece aqui é uma solução realmente econômica, com ótimo desempenho. Conforme mostrado no diagrama abaixo, a solução da Espressif realiza cancelamento de eco acústico de dois canais (AEC) e redução de ruído, o que torna as interações de voz homem-máquina mais suaves.

 

Além disso, devido à tecnologia ESP32, a solução Internet Phone da Espressif define um exemplo de como operar dispositivos controlados por voz. Para isso, ele suporta ativação de voz, interação por voz, serviço de correio de voz, música sob demanda, etc. Portanto, se você quiser ouvir sua música favorita após uma ligação telefônica com um amigo, use sua voz e solicite o aplicativo para fazer isso por você. 

O módulo ESP32 usado nesta versátil solução de telefonia via Internet é o ESP32-WROVER-B, um chip combinado de Wi-Fi e Bluetooth de 2,4 GHz, com um processador de núcleo duplo. Tendo integrado a tecnologia de 40 nm da TSMC, o ESP32 possui um alto desempenho de RF, estabilidade, versatilidade, confiabilidade e consumo de energia ultrabaixo, o que o torna o SoC de escolha para vários cenários de aplicação. As principais características do chip são:

  • Processador Xtensa® de 32 bits LX6 de núcleo duplo
  • Até 600 DMIPS
  • SRAM de 520 KB e ROM de 448 KB
  • 2,5 μA de baixa potência
  • Rico conjunto de periféricos, incluindo I2C, I2S, UART, SPI, SDIO, ADC.