Metodología de clasificación contextual

Anterior Siguiente

Visión general

El modelo de clasificación de categorías contextuales de Sounder identifica temas de conversación a nivel de segmento de episodios de podcast de acuerdo con la Taxonomía de contenido de IAB (3.0).

Metodología

Clasificación contextual

Los episodios de podcast se transcriben con el motor de reconocimiento automático de voz (ASR) patentado de Sounder. Aprovechando el procesamiento del lenguaje natural (NLP), analizamos aún más las transcripciones para identificar entidades nombradas, temas, sentimientos y tono, entre otros identificadores, que admiten la identificación de categorías contextuales.

Para ilustrar, si el episodio procesado más reciente de un programa fue el 15 de abril, entonces cualquier episodio publicado y procesado entre el 15 de enero y el 14 de abril se incluiría en el cálculo del puntaje a nivel de programa.

so-UI-show-level-categories

Resultados de categorías contextuales

Todas las categorías contextuales se clasifican exhaustivamente en el nivel de segmento, luego se suman dentro de la misma ventana de 90 días y se heredan a nivel de programa.

Interpretación de las puntuaciones de confianza de la categoría contextual

Sounder identifica categorías contextuales de contenido de podcast a nivel de segmento y, en última instancia, resume las clasificaciones a nivel de episodio y programa. Para que una categoría se describa en el nivel de episodio, un solo episodio de podcast debe contener al menos tres segmentos de la misma categoría.

La concentración y la profundidad de las conversaciones de las categorías identificadas determinan los puntajes de confianza. Por ejemplo, una discusión centrada en un solo tema de aproximadamente 6-8 minutos de duración probablemente resulte en una puntuación de confianza del 100% de la categoría contextual relacionada. Por el contrario, una conversación sobre el mismo tema que dura solo un par de minutos o menos probablemente solo resultará en un puntaje de confianza del 60% o menos.

Dado que los modelos de Sounder no se basan en palabras clave y se basan en señales contextuales como el sentimiento y el tono, el número preciso de identificadores no garantiza resultados de puntuación de confianza.