Con ADENA: Cómo cambiar los modelos de lenguaje en la KS-CC1

Apr 17
2 min read

Updated: May 11

La actualización de firmware 2.1.0.4 para la KS-CC1 introdujo varios cambios importantes, entre ellos la incorporación de nuevos modelos de lenguaje, incluyendo la API Speech-to-Text de OpenAI y la actualización a la versión V2 de la API Speech-to-Text de Google.

Los modelos de Google y OpenAI presentan diferencias importantes en el tipo y volumen de datos utilizados para su entrenamiento, la forma en que procesan fragmentos de audio, los idiomas compatibles y otras características específicas. Existen muchas comparaciones detalladas entre estos modelos, pero para resumirlo brevemente, a continuación se presentan sus principales diferencias y sus efectos prácticos:

Característica	Google API	OpenAI API
Tamaño y origen de los datos de entrenamiento	Millones de horas de datos multilingües auto-supervisados procedentes de distintas fuentes	680.000 horas de datos procedentes de la web, semi-supervisados. Al menos un tercio corresponde al inglés
Umbral de confianza (porcentaje mínimo requerido para mostrar una palabra subtitulada)	Alto	Bajo
Método de reconocimiento de audio	Comparación con bases de datos de pronunciación, priorizando el umbral de confianza	Análisis y predicción contextual, priorizando la completitud de la transcripción
Efectos prácticos de estas diferencias	Mayor precisión en el texto transcrito, aunque puede omitirse una mayor cantidad de palabras durante la transcripción.	Transcripciones más completas, aunque con mayor probabilidad de errores o palabras “alucinadas”

Los usuarios pueden cambiar libremente entre estos modelos desde la página web Administrador de la KS-CC1. Para hacerlo, introduce la dirección IP de la estación en un navegador y accede a Administrador → Transcripción en vivo → Configuración de subtítulos en vivo. Después, selecciona el modelo que deseas utilizar en la opción Speech to Text → Configuración del servicio. El cambio se aplica de inmediato y no es necesario reiniciar el sistema, por lo que es posible probar fácilmente qué modelo funciona mejor en cada escenario.

Es importante tener en cuenta que ambos modelos utilizan el mismo sistema de licencias de traducción y transcripción, por lo que no es necesario adquirir claves de licencia diferentes para utilizar otro modelo de lenguaje.

Aunque la lista de idiomas compatibles continúa ampliándose, los nuevos modelos todavía no admiten la misma cantidad de idiomas que la versión 1 de la API Speech-to-Text de Google. Puedes consultar la lista de idiomas compatibles con ambos modelos en la versión 2.1.0.4 aquí.

Si el idioma que necesitas no está disponible, es posible instalar la versión de firmware 2.0.0.18 en la estación para utilizarla con la versión 1 de la API Speech-to-Text de Google, la cual ofrece compatibilidad con una mayor variedad de idiomas (lista completa aquí). Para realizar este cambio, contáctanos a través de nuestra página web o envíanos un correo a info@a-dena.com y podremos asistirte de forma remota.

La actualización 2.1.0.4 incluye otras nuevas funciones destacadas que presentaremos en un próximo artículo. Como siempre, si deseas conocer más sobre los dispositivos AREC o verlos en funcionamiento, contáctanos en www.a-dena.com y estaremos encantados de ayudarte.

Con ADENA: Cómo cambiar los modelos de lenguaje en la KS-CC1

Recent Posts

Newsletter