Con ADENA: Cómo cambiar los modelos de lenguaje en la KS-CC1
- Apr 17
- 2 min read
Updated: May 11
La actualización de firmware 2.1.0.4 para la KS-CC1 introdujo varios cambios importantes, entre ellos la incorporación de nuevos modelos de lenguaje, incluyendo la API Speech-to-Text de OpenAI y la actualización a la versión V2 de la API Speech-to-Text de Google.

Los modelos de Google y OpenAI presentan diferencias importantes en el tipo y volumen de datos utilizados para su entrenamiento, la forma en que procesan fragmentos de audio, los idiomas compatibles y otras características específicas. Existen muchas comparaciones detalladas entre estos modelos, pero para resumirlo brevemente, a continuación se presentan sus principales diferencias y sus efectos prácticos:
Característica | Google API | OpenAI API |
Tamaño y origen de los datos de entrenamiento | Millones de horas de datos multilingües auto-supervisados procedentes de distintas fuentes | 680.000 horas de datos procedentes de la web, semi-supervisados. Al menos un tercio corresponde al inglés |
Umbral de confianza (porcentaje mínimo requerido para mostrar una palabra subtitulada) | Alto | Bajo |
Método de reconocimiento de audio | Comparación con bases de datos de pronunciación, priorizando el umbral de confianza | Análisis y predicción contextual, priorizando la completitud de la transcripción |
Efectos prácticos de estas diferencias | Mayor precisión en el texto transcrito, aunque puede omitirse una mayor cantidad de palabras durante la transcripción. | Transcripciones más completas, aunque con mayor probabilidad de errores o palabras “alucinadas” |
Los usuarios pueden cambiar libremente entre estos modelos desde la página web Administrador de la KS-CC1. Para hacerlo, introduce la dirección IP de la estación en un navegador y accede a Administrador → Transcripción en vivo → Configuración de subtítulos en vivo. Después, selecciona el modelo que deseas utilizar en la opción Speech to Text → Configuración del servicio. El cambio se aplica de inmediato y no es necesario reiniciar el sistema, por lo que es posible probar fácilmente qué modelo funciona mejor en cada escenario.

Es importante tener en cuenta que ambos modelos utilizan el mismo sistema de licencias de traducción y transcripción, por lo que no es necesario adquirir claves de licencia diferentes para utilizar otro modelo de lenguaje.
Aunque la lista de idiomas compatibles continúa ampliándose, los nuevos modelos todavía no admiten la misma cantidad de idiomas que la versión 1 de la API Speech-to-Text de Google. Puedes consultar la lista de idiomas compatibles con ambos modelos en la versión 2.1.0.4 aquí.
Si el idioma que necesitas no está disponible, es posible instalar la versión de firmware 2.0.0.18 en la estación para utilizarla con la versión 1 de la API Speech-to-Text de Google, la cual ofrece compatibilidad con una mayor variedad de idiomas (lista completa aquí). Para realizar este cambio, contáctanos a través de nuestra página web o envíanos un correo a info@a-dena.com y podremos asistirte de forma remota.
La actualización 2.1.0.4 incluye otras nuevas funciones destacadas que presentaremos en un próximo artículo. Como siempre, si deseas conocer más sobre los dispositivos AREC o verlos en funcionamiento, contáctanos en www.a-dena.com y estaremos encantados de ayudarte.
.png)


