Procedimientos de filtración de tráfico no válido general

Anterior Siguiente

Triton Digital emplea técnicas basadas en identificadores, actividad y patrones, según los datos de los archivos de registro, con el fin de identificar y filtrar (excluir) la actividad no válida. La actividad no válida incluye, entre otros, actividad no humana conocida y sospechosa y actividad humana sospechosa no válida. Sin embargo, la red, el anunciante o sus respectivos agentes no siempre logran detectar o reconocer la identificación e intención del usuario, y es poco probable que pueda identificarse toda la actividad no válida y excluirse de los resultados del informe. Los detalles relativos a nuestras técnicas se describen a continuación.

Regla de un minuto

Dada la naturaleza de la actividad de podcasting y al comportamiento general del tráfico relacionado con robots/arañas, Triton Digital utiliza un proceso mediante el cual el contenido descargado con una duración inferior a un minuto se considera inválido y se elimina de todos los datos recopilados, a menos que el episodio/longitud del archivo también sea inferior a un minuto, en cuyo caso se descargará el archivo completo. Esta regla reduce el ruido de sesiones sumamente cortas, actividades robóticas y problemas de conectividad inicial.

Si la información necesaria para medir la longitud del contenido descargado no está disponible, aplicamos factores de ajuste para eliminar sesiones cortas equivalentes. Este proceso ha sido auditado por IAB Tech Lab.

Identificación específica de actividad no humana

Triton Digital utiliza la lista negra internacional de bots y arañas 1 de IAB/ABCe para excluir el tráfico del sitio asociado con la actividad robótica de los datos recopilados. Por ejemplo, este proceso de filtrado nos permite excluir las solicitudes http de las arañas de los motores de búsqueda, como Google, Bing y Yahoo, entre otros. El Interactive Advertising Bureau (IAB) lleva esta lista y la actualiza mensualmente.

Triton Digital emplea y actualiza listas adicionales para excluir los agentes de usuario inválido o incluir los agentes de usuario conocido y válido, si estos últimos no aparecen en la lista interna de robots/arañas de IAB/ABCe.

Triton Digital también sigue la guía de filtrado de IAB con respecto a las descargas de watchOS de Apple, ya que la mayoría de las descargas de watchOS son duplicados automáticos de descargas de iPhone y no son iniciadas por el usuario. Específicamente, filtramos:

  • Agentes de usuario que comienzan con atc/ e incluyen watchOS (por ejemplo: atc/1.0 watchOS)
  • Agentes de usuario que contienen (null)/(null) watchOS*

Exclusión de centros de datos

Triton Digital usa la lista de direcciones IP del centro de datos del TAG para excluir el tráfico no humano del centro de datos identificado por la industria. Esta lista es administrada por el Trustworthy Accountability Group (TAG) y actualizada mensualmente.

Solicitudes incorrectas o no identificadas

Triton Digital solo acepta solicitudes de transferencia de archivos válidas, como GET con 200 y 206 códigos de error, con un rango de bytes válido. Las solicitudes de archivos que no se puedan identificar como parte de un podcast/programa no se atribuirán a ningún episodio, podcast o programa.

Duplicación de datos

Todos los datos duplicados se eliminan del conjunto de datos utilizado para elaborar las mediciones finales.

Otra filtración en función de la actividad

Triton puede marcar el tráfico como no válido en función de patrones de tráfico anormales o sospechosos según lo determinen las reglas de filtrado basadas en actividades.  En los casos en que se haya eliminado el tráfico sospechoso, Triton puede ajustar el período de informe y los promedios semanales correspondientes.