Tomado de Razones y Personas. Esta obra está bajo una Licencia Creative Commons Atribución 3.0 No portada.
Usando datos no tradicionales para explorar un concepto tradicional: como podemos usar Twitter para entender la discusion sobre castigo en la opinión pública en Uruguay
Ezquerra Pablo
Trajtenberg Nico
Porque no los encerramos y tiramos la llave?
De un tiempo a esta parte las Ciencias Sociales han estudiado las actitudes punitivas, o dicho más en criollo, cuando hay un delito qué tipo de castigo creemos que es legítimo y válido aplicar al ofensor. Es esto un mero onanismo académico? Probablemente si, para que engañarnos... pero también es cierto que las opiniones y preferencias por el castigo que tienen los ciudadanos pueden tener consecuencias serias. Por ejemplo, pueden determinar que los políticos y gobiernos promuevan políticas de prevención del crimen ineficaces o incluso contraproducentes en términos de incremento del delito (Enns, 2014; Jennings et al., 2017) y altamente costosas en términos económicos (Jaitman et al., 2017; Welsh, 2018). Y este escenario puede volverse más probable cuando la población esta atemorizada y victimizada por altos niveles de delitos violentos, como es el caso de Uruguay.
Ahora bien, qué son estas actitudes punitivas y cómo podemos saber sobre ellas? Durante las últimas tres o cuatro décadas los criminólogos han intentado resolver estas dos preguntas apelando a métodos tradicionales generalmente basados en el uso de escalas y encuestas. Cuáles son los limites de usar estas fuentes de datos? Qué otras alternativas existen y qué posibilidades y limites ofrecen? El objetivo de esta nota justamente es contarles un poco sobre estas alternativas no tradicionales de datos y de la llamada criminología computacional y, de paso, mostrar algunos hallazgos empíricos iniciales de un proyecto en el que estamos trabajando asociado a la tesis de doctorado de Pablo en la Universidad de Cardiff y a un proyecto en el Centro de Confianza Digital y Sociedad de la Universidad de Manchester.
En que medida estas de acuerdo con “encerrémoslos y tiremos la llave?”: Totalmente de acuerdo, de acuerdo, algo de acuerdo...
Si queremos saber acerca de actitudes punitivas y en que medida la población o ciertos grupos las poseen, hay ya bastante investigacion, si bien probablemente más focalizada en Norteamérica y Europa (Costelloe et al. (2009), Kornhauser (2015), pero ver también Singer et al. (2020)). Inicialmente los estudios sólo incluían medidas muy generales de las actitudes hacia las sentencias y los castigos, generalmente basadas en una única pregunta en encuestas de opinión, y con muy poco contexto (por ejemplo, referidas al apoyo a la pena de muerte o al aumento general de las sentencias). Este tipo de diseño tiende a sobreestimar las actitudes punitivas de los individuos, ya que no proporcionan información sobre otro tipo de medidas (como las rehabilitadoras) y no tienen en cuenta las características del delito, la víctima o el delincuente (Stalans, 2013). Progresivamente se fueron sofisticando las estrategias de medición, por ejemplo, a traves del uso de viñetas lo cual permite no sólo controlar las características del delito, sino también manipularlas en contextos experimentales (Horstman et al., 2021; Socia et al., 2019). Tambien se empezaron a aplicar baterías de preguntas para reforzar la validez de las medidas utilizadas mediante estrategias de análisis psicométrico (Armborst, 2017; Maguire & Johnson, 2015). Más allá de los avances, medir las actitudes punitivas de esta manera enfrenta algunos desafíos.
Un primer problema es que las escalas que aplicamos en las encuestas suelen ser instrumentos poco flexibles que no permiten capturar en forma válida y confiable las opiniones mas profundas, los estados de ánimo y reacciones emocionales de los individuos en relación al castigo (Smith et al., 2017). Cuando los encuestados tienen que expresar su opinión sobre temas delicados o controversiales, como puede ser el castigo, hay un sesgo de deseabildiad social y en muchos casos se adapta la respuesta a lo que cree que espera el entrevistador o la comunidad (Stephens-Davidowitz, 2018). En segundo lugar, ese tipo de estudios involucran en el mejor de los casos una fotografía estática y bastante costosa de implementar que no es sensible a la dinámica y volatilidad en tiempo real de la opinión de los ciudadanos a lo largo de las semanas y meses (Williams et al., 2020). Finalmente, las medidas de punitividad basadas en las encuestas están centradas en individuos atomizados y difícilmente logran captar las redes de comunicación, intercambio y discusión existentes (Edelmann et al., 2020).
Qué hacer entonces? Acá es donde la criminología computacional nos llama a complementar y abordar las limitaciones de estas medidas tradicionales con el uso de las nuevas fuentes de datos emergentes no tradicionales o New and Emerging Forms of Data (NEFD). Qué son? Basicamente es un nombre pomposo para referirse a los datos multimedia que son registrados digitalmente a través de distintos tipos de conexiones digitales (Radanliev & De Roure, 2023). La expansión del Internet para uso personal y su aplicación en diversos tipos de procesos cambió la forma en que los individuos se informan y comunican, generando un crecimiento exponencial de los datos disponibles sobre comportamientos en línea que son de gran interés para las ciencias sociales en general (Edelmann et al. 2020; Williams et al. 2020). Las NEFD ofrecen información detallada sobre el desarrollo de las relaciones sociales en grandes poblaciones a medida que se producen, a diferencia de los conjuntos de datos tradicionales que suelen recopilar los científicos sociales (Hofman et al., 2021; Radanliev & De Roure, 2023). Sin embargo, sólo recientemente los criminologos han empezado a explotar estos datos y empezar a estudiar fenomenos tales como el desorden social, policiamiento, delitos en línea, o crímenes de odio racial (Lynch, 2018; O’brien et al., 2015; Smith et al., 2017; Williams et al., 2020). Hasta ahora nadie que sepamos se ha metido a estudiar de esta forma las actitudes punitivas (bah, nadie salvo Pablo en su tesis de doctorado). Nosotros queremos, en esta nota dar, cuenta de las potencialidades de este tipo de datos y técnicas en base a los primeros resultados del estudio que estamos llevando a cabo en Uruguay (y también en Reino Unido).
La caja negra
Con el objetivo de analizar las actitudes punitivas en Twitter, se recolectó la siguiente información: En primer lugar se seleccionaron 20 portales de noticias con presencia en Twitter en función de su relevancia según encuestas de opinión pública y cantidad de seguidores. De estos 20 portales de noticias se descargaron todos los tweets relacionados al crimen a través de un conjunto de palabras clave (ej. “homicidio”, “asalto”, “rapiña”, etc.) en 2022. Las palabras clave fueron seleccionadas a partir del análisis exploratorio de los medios de prensa. Una vez descargados estos tweets, se descargaron todas las citas o respuestas realizadas por los usuarios a estas noticias. Este último conjunto de datos es el que resulta de interés para nuestro análisis, al agrupar las reacciones de los usuarios a las noticias sobre delito. Es acá donde esperamos encontrar reacciones punitivas, aquellas que de una forma u otra piden el incremento del costo del delito (es decir, que cometer un delito le cueste más al criminal a través de penas más duras).[1]
El primer paso, una vez obtenidos estos datos– y habiéndose limpiado spam, bots, y todas esas palabras en inglés – es intentar, de alguna forma, resumir esta información. El análisis cualitativo de todos los tweets resultaría una tarea titánica, sin embargo, es acá donde las estrategias de Topic Modeling[2] vienen al rescate. ¿De qué se trata? El Topic Modeling esta en el set de herramientas del aprendizaje automatizado (o Inteligencia Artificial - IA). Esto quiere decir que la técnica de análisis utilizada se basa en una sucesión de pasos o instrucciones donde la máquina intentará optimizar una tarea específica, modificando valores de un modelo estadístico en base a la variación en algún tipo de indicador que utilizará como criterio de calidad iterativamente (esto es lo que podríamos llamar un “algoritmo” en el contexto de la ciencia de datos). Más específicamente, se trata de una técnica de aprendizaje no-supervisado, esto quiere decir, que no le estamos dando ejemplos al algoritmo respecto al resultado esperado – como ocurre en una tarea de clasificación – sino que le estamos dando datos y un objetivo. En este caso, el objetivo es la agrupamiento (o clusterización si querés sonar copado) de la información textual. Cómo? A través de la identificación de palabras que co-ocurren comúnmente entre sí en los documentos (tweets) y que no tienden a ocurrir en otros contextos (Blei, 2012; Blei et al., 2003).[3]
Por qué? Al hacer esto, podemos realizar de forma automática e inductiva la codificación de nuestros documentos de interés (Mohr & Bogdanov, 2013). Al detectar estas palabras que distinguen temas de discusión, podemos dar cuenta de cuáles son los principales ejes de las comunicaciones naturalmente ocurridas en redes sociales, en este caso, en el contexto de la “crónica roja”. Así, podemos responder la pregunta respecto a cómo se discute el delito en redes sociales y más especialmente, en qué medida el castigo y la punitividad es un tema emergente. Todo esto en un precioso paquete replicable, automatizado, y con software libre.
Si todo esto resulta confuso, no nos abandones (todavía): es posible que muchos de estos puntos se aclaren con el análisis.
El Topic 14
Pasado por la etapa anterior, se procedió al análisis. En base a un conjunto de indicadores cuantitativos se optó por un modelo con 15 topics. La distribución de los mismos y sus palabras clave se presentan a continuación. Las palabras fueron recortadas a su raíz para evitar contar como diferntes palabras que de alguna forma refieren al mismo concepto (e.g.: “delincuente” y “delincuentes” se incluyen en el modelo como “delincuent”)
Figura 1 Palabras clave por tema en función de valores phi
Figura 2 Proporción de documentos por topic basados en su clasificación
Cómo podemos interpretar estas figuras? El primer gráfico da cuenta de las palabras más importantes por topic – aquellas cuya presencia predicen en mayor medida la probabilidad del tweet de ser parte de ese topic. El segundo gráfico da cuenta de la proporción de tweets asociados a cada uno de los topics. Detenernos en cada uno supera el objetivo de esta nota (y lo que probablemente el público este dispuesto a leer). Nos vamos a centrar en un topic en particular, el topic 14, que parece sustentar la intuición inicial: el castigo es un tema de relevancia en la reacción de los usuarios frente a las noticias sobre delito en Twitter. Y existe más evidencia que nos permite concluir esto:
En primer lugar, no sólo observamos las 10 palabras clave, sino que lo hicimos con hasta 30. Además, modificamos el criterio de selección de las palabras, para analizar aquellas que son más específicas para cada topic (Figuras 3 y 4) y volvemos a encontrar que buena parte de estas palabras centrales parecen asociarse al castigo (e.g.: “justici”, “carcel”, “pres”) y el enojo frente al delito (e.g.: “hdp”, “enferm”, “put”).
Figura 3 Palabras más importantes dentro del topic 14
Figura 4 Palabras más importantes dentro del topic 14 (sensibilidad ajustada)
En segundo lugar, analizamos cualitativamente (dicho menos grandilocuentemente: leímos e interpretamos) aquellos tweets que fueron clasificados en este topic. Tomemos una muestra aleatoria de 10 tweets a modo de ejemplo (se omiten las menciones a los usuarios - @):
Lo mejor que podés hacer! Siempre digo si los viejitos estafados no tienen familia que les advierta.
Y a donde lo mandan ?....a Cancún con todo pago ?...jajajaja...mata a 23 !!!...Perpetua mínimo...LPM !!
Maldito hdp, estaba cantado, te esperaba el infierno!!
2x1 de dignidad en tristan narvaja! No corras que hay stock.
Veo estas noticias y me entra un dolor en el pecho… Que hijo de re mil puta https://t.co/xpvYrDUKsX
Mi querida amiga, Uruguay, tarde o temprano tendra que prestar atencion al numero de criminales sueltos, que no tienen en su futuro, nada mas que seguir delinquiendo, porque la sociedad los va marginando. Y desde tiempos inmemoriales, el hombre tiene que eliminar las bestias.
En la cadena del si dijeron que no les tengamos miedo a los delincuentes🌝🌝🌝
Buenisima la justicia de nuestro Pais...tendra que pasar algo mas????
Pena de muerte hermano, dejate de derecho que esos no son personas https://t.co/OGd73Cajci
Aún así roba menos haciendo de juez https://t.co/ygPmwrQG01
Qué podemos inferir con esta información? Un aspecto claro es que este topic esta recolectando la mayoría de la discusión sobre castigo (también en base al análisis comparado con respecto a los tweets que observarmos en los demás topics). Esta discusión tiene tres componentes específicos: en primer lugar, hay una respuesta emocional importante con un componente no menor de enojo e indignación (varios insultos emergen como palabras clave). Ademas, incluye menciones a la justicia por mano propia y la pena de muerte. Y un componente clave en las actitudes punitivas presente en estos tweets es son tanto la deshumanización del delincuente comoel deseo de que el ofensor sufra. Al comparar este topic con su homólogo en una base de datos de Reino Unido se observa que la respuesta uruguaya parece tener como particularidad el elemento emocional del enojo, con una respuesta menos articulada en torno a la pena y no asociada explicita y directamente en el pedido de penas mas severas (volver a la horca o encerrarlos y tirar la llave).
No obstante, es importante destacar que si bien las estrategias de Topic Modeling son buenas para dar una idea general de la conversación a gran escala, no son ideales para la clasificación precisa del texto. Por tanto, podemos ver que si bien parece haber un hilo común en esta clasificación, también hay algo de ruido.
También podemos observar que este topic parece agrupar más de un 15% de la discusión, siendo el segundo más importante. Es decir, los uruguayos no sólo estamos preocupados por el castigo al leer las noticias sobre crimen en Twitter, sino que es una de las discusiones más importantes, al menos cuantitativamente.
Los usuarios y el tiempo
El análisis no se limita a la descripción del topic y puede utilizar la la información alrededor de los tweets (los usuarios, la fecha y las características de la noticia original, en este caso) para profundizar en su dinámica temporal.
Una característica particular de la expresión de actitudes punitivas en redes es su variabilidad en el tiempo. Si bien no tenemos muchos datos longitudinales para el Uruguay, analizando el caso de Reino Unido se observa que esto contrasta con la relativa estabilidad de los datos por encuesta (Kirk, 2022)[4]. Claro que se trata de dos poblaciones radicalmente diferentes (en la medida en que los usuarios de Twitter no son una muestra representativa ni del Uruguay, ni de Reino Unido, y menos aún los que siguen portales de prensa, y menos aún los que participan activamente en la discusión…). Sin embargo, más allá de que se trate de un grupo pequeño, se trata también de un grupo ruidoso, y no sabemos exactamente cómo este ruido esta afectando a la sociedad y las instituciones. La relativa estabilidad de las actitudes no quiere decir que el sistema no pueda verse afectado por la movilización específica causada por eventos relevantes (sólo hace falta recordar cómo algunos crímenes especialmente impresionantes han generado oleadas de pedidos por más “mano dura”).
Por su parte, a nivel de usuarios se observa que poco más del 36% de los usuarios analizados (aquellos que comentan estas noticias) participa de la discusión en este topic referido al castigo, y dentro de este grupo el 5% más activo produce un 33% de las respuestas. Las reacciones punitivas, entonces, no se distribuyen uniformemente a través de los diferentes perfiles de usuarios. Quiénes son los más punitivos? Qué características tienen? Qué podemos aprender de ellos? Estas preguntas también buscan ser respondidas por este proyecto más adelante.
Finalmente, se observa, de forma esperada, que este tipo de reacciones parece florecer frente a noticias vinculadas a crímenes violentos (homicidios, asesinatos, violaciones). Esto va de la mano de la literatura tradicional (McCorkle, 1993), y si bien parecería obvio, es un indicador prometedor de validez concurrente. Más adelante puede ser muy interesante intentar entender en mayor detalles qué tipo de delitos genera en el público reacciones particularmente punitivas y violentas.
Tridentes y antorchas virtuales
Este es un primer paso, bastante tímido, en términos de análisis. Pero también creemos que resulta prometedor. Esa primera intuición, que parece compartirse por varios de quienes pasamos a ver lo que ocurre en redes sociales en materia de opinión pública y crimen, parece sustentarse en los datos. Twitter – en este caso – es una vía de emergencia, comunicación y difusión de actitudes punitivas. Esto abre un nuevo campo para el análisis de este problema. Estos datos en interacción con datos tradicionales pueden ayudarnos a entender elementos que hasta ahora resultaban muy difíciles o costosos de medir: por ejemplo, el efecto de las redes con las que interactúan los individuos sobre las actitudes punitivas, el efecto de eventos específicos sobre las actitudes, las características emocionales vinculadas al deseo de castigo, y podríamos seguir.
El siguiente paso, será profundizar en técnicas de clasificación más sofisticadas, que tengan mayor precisión en la captación de actitudes punitivas - por ejemplo, a través del uso de Transformers (Bugueño & Mendoza, 2020). Con esta información podremos analizar la variación en el tiempo de las actitudes punitivas, a qué se asocian, qué tipo de efectos generan, qué usuarios participan de esta discusión, y cómo interactúan entre sí.
Las actitudes punitivas de los individuos pueden tener efectos perversos sobre el funcionamiento del sistema. La criminología computacional tiene la potencialidad de ser una herramienta que permita el seguimiento de la opinión pública y la mejor comprensión del fenómeno con bajo costo – no olvidemos nuestra economía latinoamericana. Esto puede ser utilizado por la sociedad, el sistema político, y la academia, para evitar desbordamientos punitivistas y que no sólo pueden ser crueles o injustos (algo que puede no convencer a muchos), sino ineficaces y que minen la legitimidad de las institutuciones.
Referencias
Armborst, A. (2017). How fear of crime affects punitive attitudes. European Journal on Criminal Policy and Research, 23(3), 461–481. https://doi.org/10.1007/s10610-017-9342-5
Blei, D. M. (2012). Probabilistic topic models. Communications of the ACM, 55(4), 77–84.
Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of Machine Learning Research, 3(Jan), 993–1022.
Bugueño, M., & Mendoza, M. (2020). Learning to Detect Online Harassment on Twitter with the Transformer. In P. Cellier & K. Driessens (Eds.), Machine Learning and Knowledge Discovery in Databases (pp. 298–306). Springer International Publishing. https://doi.org/10.1007/978-3-030-43887-6_23
Costelloe, M. T., Chiricos, T., & Gertz, M. (2009). Punitive attitudes toward criminals: Exploring the relevance of crime salience and economic insecurity. Punishment & Society, 11(1), 25–49. https://doi.org/10.1177/1462474508098131
Edelmann, A., Wolff, T., Montagne, D., & Bail, C. A. (2020). Computational social science and sociology. Annual Review of Sociology, 46, 61–81.
Enns, P. K. (2014). The Public’s Increasing Punitiveness and Its Influence on Mass Incarceration in the United States. American Journal of Political Science, 58(4), 857–872. https://doi.org/10.1111/ajps.12098
Hofman, J. M., Watts, D. J., Athey, S., Garip, F., Griffiths, T. L., Kleinberg, J., Margetts, H., Mullainathan, S., Salganik, M. J., Vazire, S., Vespignani, A., & Yarkoni, T. (2021). Integrating explanation and prediction in computational social science. Nature, 595(7866), 181–188. https://doi.org/10.1038/s41586-021-03659-0
Horstman, N. J., Bond, C. E., & Eriksson, L. (2021). Sentencing domestic violence offenders: A vignette study of public perceptions.Journal of Interpersonal Violence, 36(21–22), NP11916–NP11939.
Jaitman, L., Caprirolo, D., Ochoa, R. G., Keefer, P., Leggett, T., Lewis, J. A., Mejía-Guerra, J. A., Mello, M., Sutton, H., & Torre, I. (2017). The Costs of Crime and Violence: New Evidence and Insights in Latin America and the Caribbean. https://doi.org/10.18235/0000615
Jennings, W., Farrall, S., Gray, E., & Hay, C. (2017). Penal Populism and the Public Thermostat: Crime, Public Punitiveness, and Public Policy. Governance, 30(3), 463–481. https://doi.org/10.1111/gove.12214
Kirk, I. (2022, March 30). Criminal sentencing is too soft, say two-thirds of Britons | YouGov. Https://Yougov.Co.Uk/. https://yougov.co.uk/topics/politics/articles-reports/2022/03/30/criminal-sentencing-too-soft-say-two-thirds-briton
Kornhauser, R. (2015). Economic individualism and punitive attitudes: A cross-national analysis. Punishment & Society, 17(1), 27–53.
Lynch, J. (2018). Not even our own facts: Criminology in the era of big data. Criminology, 56(3), 437–454.
Maguire, E., & Johnson, D. (2015). The structure of public opinion on crime policy: Evidence from seven Caribbean nations. Punishment & Society, 17(4), 502–530. https://doi.org/10.1177/1462474515604385
McCorkle, R. C. (1993). Research note: Punish and rehabilitate? Public attitudes toward six common crimes. Crime & Delinquency, 39(2), 240–252.
Mohr, J. W., & Bogdanov, P. (2013). Introduction—Topic models: What they are and why they matter. Poetics, 41(6), 545–569. https://doi.org/10.1016/j.poetic.2013.10.001
O’brien, D. T., Sampson, R. J., & Winship, C. (2015). Ecometrics in the age of big data: Measuring and assessing “broken windows” using large-scale administrative records. Sociological Methodology, 45(1), 101–147.
Radanliev, P., & De Roure, D. (2023). New and emerging forms of data and technologies: Literature and bibliometric review. Multimedia Tools and Applications, 82(2), 2887–2911. https://doi.org/10.1007/s11042-022-13451-5
Singer, A. J., Chouhy, C., Lehmann, P. S., Stevens, J. N., & Gertz, M. (2020). Economic anxieties, fear of crime, and punitive attitudes in Latin America. Punishment & Society, 22(2), 181–206. https://doi.org/10.1177/1462474519873659
Smith, G. J. D., Bennett Moses, L., & Chan, J. (2017). The Challenges of Doing Criminology in the Big Data Era: Towards a Digital and Data-driven Approach. The British Journal of Criminology, 57(2), 259–274. https://doi.org/10.1093/bjc/azw096
Socia, K. M., Rydberg, J., & Dum, C. P. (2019). Punitive Attitudes Toward Individuals Convicted of Sex Offenses: A Vignette Study. Justice Quarterly, 0(0), 1–28. https://doi.org/10.1080/07418825.2019.1683218
Stalans, L. J. (2013). Measuring attitudes to sentencing. In Changing attitudes to punishment (pp. 33–50). Willan.
Stephens-Davidowitz, S. (2018). Everybody lies: What the internet can tell us about who we really are. Bloomsbury Publishing.
Welsh, B. (2018). Costs and benefits of preventing crime. Routledge.
Williams, M. L., Burnap, P., Javed, A., Liu, H., & Ozalp, S. (2020). Hate in the Machine: Anti-Black and Anti-Muslim Social Media Posts as Predictors of Offline Racially and Religiously Aggravated Crime. The British Journal of Criminology, 60(1), 93–117. https://doi.org/10.1093/bjc/azz049
Yan, X., Guo, J., Lan, Y., & Cheng, X. (2013). A biterm topic model for short texts. Proceedings of the 22nd International Conference on World Wide Web, 1445–1456. https://doi.org/10.1145/2488388.2488514
Yin, J., & Wang, J. (2014). A dirichlet multinomial mixture model-based approach for short text clustering. Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 233–242.
[1] El doctorado también incluye el análisis de las comunicaciones políticas (de los miembros del parlamento), sin embargo, en este artículo nos centramos en al análisis de las noticias.
[2] Mantendremos la acepción en inglés que resulta fácilmente googleable y se utiliza comúnmente incluso en contextos de uso del castellano. Traduciendolo podemos referirnos al Modelado de Temas.
[3] Específicamente se utilizaron técnicas optimizadas para textos cortos – BTM (Yan et al., 2013) y GSDMM (Yin & Wang, 2014)
[4] https://yougov.co.uk/topics/politics/explore/topic/Death_Penalty?content=all