Síntesis de Voz en iPhone vs Android

Speech Central depende de las voces proporcionadas por el dispositivo. Como tal, puede ser útil para los usuarios potenciales estar informados sobre las diferencias en las voces proporcionadas por los sistemas operativos móviles más populares que Speech Central admite: iOS (iPhone y iPad) y Android (con servicios de Google Play).

Tanto iOS como Android vienen con voces integradas. Como esas voces están disponibles sin costo adicional para el usuario, su calidad es muy importante. Hay algunas diferencias notables entre iOS y Android con respecto a estas:

  • En iOS, la función de texto a voz está integrada en el sistema. La versión de código abierto de Android no tiene la funcionalidad de texto a voz integrada en el sistema. Sin embargo, casi todos los teléfonos o tabletas Android vienen con los servicios de Google implementados en Android, que incluyen Servicios de voz de Google. Esto puede afectar su experiencia con las aplicaciones de texto a voz, ya que en Google este servicio puede no estar siempre activo y si la aplicación inicia el servicio, puede suspenderse en cualquier momento. Si bien esto abre un gran potencial para una peor experiencia del usuario, creo que la mayoría de los usuarios de Speech Central no deberían experimentar problemas relacionados por dos razones:
    • Speech Central tiene algoritmos inteligentes que son tolerantes a errores y esperan que puedan aparecer problemas como este.
    • Speech Central ha establecido requisitos mínimos de hardware de manera que este problema es menos probable que aparezca (ya que el potencial problema de suspensión está más relacionado con dispositivos de gama muy baja).
  • En Android, Google proporciona voces en línea y fuera de línea. Las voces en línea son de mayor calidad, pero se generan en el servidor y, como tales, dependen de su conexión de datos. Si la conexión de datos no es suficiente, puede causar una experiencia de usuario degradada debido a la latencia (que se manifiesta como pausas más largas entre las oraciones). Apple solo proporciona voces fuera de línea.
  • iOS admite tres niveles de calidad para la mayoría de las voces: Estándar, Mejorada y Premium. A diferencia de Apple, Android solo tiene un nivel de calidad por voz (aunque la calidad de las voces puede variar según los idiomas y las voces, pero las voces no están categorizadas de esta manera). Es importante tener en cuenta que no todos los niveles de calidad están instalados por defecto en iOS. Si bien todas las voces están instaladas en calidad Estándar, generalmente solo una o dos voces pueden estar instaladas en calidad Mejorada y la calidad Premium requiere instalación manual por parte del usuario. Es posible que desee leer más detalles sobre cómo instalar esas voces desde la configuración del sistema. Tenga en cuenta que algunas voces/idiomas pueden no tener todos los niveles de calidad.
  • La percepción de la calidad de las voces se reduce a las preferencias personales y puede verse influenciada por la experiencia previa del usuario. Proporcionaré algunas estimaciones generales basadas en la retroalimentación proporcionada por los usuarios de Speech Central y mi opinión personal. Como tal, vale la pena comparar varios niveles de calidad proporcionados por Apple con las voces de Google. Las voces Estándar de Apple parecen sonar significativamente peor que las voces de Google. Las voces Mejoradas de Apple generalmente suenan un poco mejor que las voces fuera de línea de Google y son de calidad similar o un poco inferior en comparación con las voces en línea de Google. Las voces Premium de Apple suenan mejor que todas las voces de Google. También es importante destacar que esto se basa en la calidad de voz de Google para idiomas populares. Para algunos idiomas menos populares, la calidad de las voces de Google puede ser significativamente más baja.
  • Tenga en cuenta que no todas las versiones de los sistemas operativos proporcionan las mismas voces. Google proporciona nuevas voces a través de la actualización de la aplicación, por lo que todas las versiones de Android deberían poder tener las últimas voces. Apple ha proporcionado múltiples actualizaciones a sus tecnologías de texto a voz, pero la actualización más notable que debe considerar viene con iOS 16 que proporciona un nuevo nivel de calidad llamado Premium que trae mejoras significativas sobre las voces de calidad Mejorada.

Este análisis no se detiene aquí. Ambos sistemas operativos tienen soporte para voces de terceros. Si bien esas voces generalmente no son gratuitas (al menos las que ofrecen niveles más altos de calidad), aún son solo un pago único en el rango de 5$ que son notablemente menos costosos que las soluciones de transmisión de voz por Internet y, como tal, pueden ser una alternativa digna. Con respecto a esta capacidad, debe tener en cuenta lo siguiente:

  • En el iPhone, esta opción está disponible solo desde septiembre de 2022 y se espera que lleguen más aplicaciones de voz. Actualmente solo hay una aplicación eSpeak.
  • Google Play ofrece una gama mucho más amplia de tales aplicaciones. Notables voces de alta calidad provienen de Acapela TTS Voices, CereProc TTS y IVONA TTS.

En resumen, tanto iOS como Android ofrecen una gran variedad de opciones para las voces de texto a voz. Al elegir un sistema operativo, hay muchas variables a considerar, pero en general, el usuario puede encontrar voces de alta calidad en ambas plataformas. Sin embargo, la elección de voces de terceros puede ofrecer una mayor calidad, y actualmente, Android parece ofrecer más opciones en este sentido. Si necesita más detalles sobre las voces, puede leer la sección de ayuda en el sitio web oficial de Speech Central.