domingo, 20 de enero de 2013

Buscando patrones de llamadas para detectar robots y fraudes relefónicos

Hoy he encontrado uno de esos artículos que lo tienen casi todo. En primer lugar es de acceso libre, y luego el tema. Tiene estadística, patrones de conducta, Big Data y aplicaciones prácticas que pueden ahorrar mucho dinero a un sector tan importante como es el de las telecomunicaciones.

El paper es el siguiente: Calling patterns in human communication dynamics. Lo que han hecho es analizar los patrones de llamada de los 100.000 usuarios más activos de un operador chino y han visto que, en contra de los que se pensaba, la probabilidad del tiempo entre llamadas no sigue una distribución exponencial, sino una distribución Weibull.

Lo interesante es que los usuarios que tenían una distribución exponencial no eran humanos, sino que pertenecían a números de llamada automática, robots, fraudes telefónicos, etc. Esta información puede ser muy útil para los operadores, ya que pueden poner a ciertos números en "listas grises" como sospechosos de prácticas sospechosas y analizarlos más tarde en detalle.

Os copio el abstract:

Modern technologies not only provide a variety of communication modes (e.g., texting, cell phone conversation, and online instant messaging), but also detailed electronic traces of these communications between individuals. These electronic traces indicate that the interactions occur in temporal bursts. Here, we study intercall duration of communications of the 100,000 most active cell phone users of a Chinese mobile phone operator. We confirm that the intercall durations follow a power-law distribution with an exponential cutoff at the population level but find differences when focusing on individual users. We apply statistical tests at the individual level and find that the intercall durations follow a power-law distribution for only 3,460 individuals (3.46%). The intercall durations for the majority (73.34%) follow a Weibull distribution. We quantify individual users using three measures: out-degree, percentage of outgoing calls, and communication diversity. We find that the cell phone users with a power-law duration distribution fall into three anomalous clusters: robot-based callers, telecom fraud, and telephone sales. This information is of interest to both academics and practitioners, mobile telecom operators in particular. In contrast, the individual users with a Weibull duration distribution form the fourth cluster of ordinary cell phone users. We also discover more information about the calling patterns of these four clusters (e.g., the probability that a user will call the cr-th most contact and the probability distribution of burst sizes). Our findings may enable a more detailed analysis of the huge body of data contained in the logs of massive users.


ResearchBlogging.orgJiang, Z., Xie, W., Li, M., Podobnik, B., Zhou, W., & Stanley, H. (2013). Calling patterns in human communication dynamics Proceedings of the National Academy of Sciences DOI: 10.1073/pnas.1220433110

No hay comentarios:

Publicar un comentario