Sebastian Gomez
Análisis de la criminalidad cerca a los sitios turísticos en Medellín
Mucho se ha hablado de la inseguridad de una ciudad, y más aún cuando la ciudad contiene muchos atractivos turísticos. ¿Podríamos decir entonces que la mayor cantidad de actos delictivos ocurren cerca o lejos de las atracciones turísticas de una ciudad? El presente artículo pretende analizar el comportamiento de la criminalidad cerca a los atractivos turísticos de la ciudad de Medellín mediante técnicas de análisis de datos.
Introducción
La criminalidad es inherente a la conducta del ser humano y ha existido a lo largo de la historia de la humanidad. Los países en la actualidad luchan día a día contra este fenómeno, el cual se clasifica en muchos tipos y modalidades. Colombia no es la excepción, dado que posee una tasa de criminalidad particularmente alta, la cual podemos asociar a su historia contemporánea [1].
Esta problemática se ha visto reflejada en todo el territorio, destacando sus ciudades principales como Bogotá, Cali, Barranquilla y Medellín; esta última será el objeto de nuestro estudio. Medellín, durante su historia reciente, alcanzó a tener tasas de 400 homicidios por cada 100.000 habitantes, e inclusive aportando entre los años 1990 y 1993 unos 6.809 homicidios en un solo año. Pero la ciudad se ha recuperado en los últimos años, bajando significativamente estas tasas de homicidios: 34 en 2007, 52 en 2012, 38 en 2013 y menos de 20 por 100.000 habitantes en 2015. La ciudad ha logrado romper el estigma ante el mundo, alcanzando importantes avances en desarrollo, seguridad e infraestructura que le valieron en 2013 el premio a la ciudad más innovadora [2].
Este importante galardón ha generado alto impacto en el mundo, implicando un auge en el turismo. Es por esta razón que en las calles de esta ciudad es habitual ver personas de diferente nacionalidad intrigadas por conocer la historia de este lugar.
Por todo lo anterior, en el presente artículo se aborda la siguiente hipótesis: "la mayor cantidad de actos delictivos ocurren cerca a los lugares turísticos" (cuando se habla de cercanía se establece una distancia entre 0 y 2 km de la ubicación del lugar turístico). Se demostrará, mediante el estudio de los datos recopilados, si esta hipótesis se cumple o no, para posteriormente dar las conclusiones sobre la criminalidad en la ciudad y cómo se ve reflejada en los lugares más importantes, que a su vez representan alta afluencia de público tanto extranjero como local.
Definiciones
- Homicidio: De acuerdo con la Oficina de las Naciones Unidas contra la Droga y el Delito (UNODC), "el homicidio intencional es el delito por antonomasia. Sus incuestionables consecuencias físicas, manifiestas en un cuerpo muerto, también lo convierten en el más categórico y calculable" [3].
- Hurto: "La acción de sustraer una cosa mueble de ajena pertenencia con ánimo de lucro" [4].
- Lugar turístico: "Se entiende como turismo al conjunto de actividades que realizan las personas durante sus viajes y estancias en lugares distintos al de su entorno habitual, por un período de tiempo consecutivo inferior a un año, con fines de ocio, por negocios y por otros motivos turísticos, siempre y cuando no sea desarrollar una actividad remunerada en el lugar visitado" [5].
Desarrollo del tema
### Selección de bases de datos
El primer paso fue buscar las bases de datos útiles para construir la bodega de datos que permitiera analizar la información y tomar decisiones para comprobar o rechazar la hipótesis. En la página de Open Data Medellín [7] se tomó el conjunto de datos que relaciona los sitios turísticos de la ciudad, clasificados por imperdibles y no imperdibles, informando su respectiva ubicación (en latitud y longitud) y el nombre de la comuna. Para evaluar la hipótesis, tomamos los atractivos turísticos imperdibles.
Por otro lado, se buscó otra base de datos que permitiera visualizar los diferentes delitos ocurridos en la ciudad de Medellín. En la página medata.gov.co se encontró el histórico de hurtos y homicidios, dado que son los delitos más comunes y relacionados con nuestra hipótesis. Al unir las dos bases de datos quedaron muchos registros (más de 90 mil) pero muchas celdas sin datos, por lo cual se eliminaron todos los registros sin información, lo que provocó descartar campos de la víctima como ocupación, testigo, discapacidad y grado de escolaridad, entre otros. Se dejaron solo los casos de enero a octubre de 2019, dado que no había datos del final del año, pero igualmente quedaron 33.900 registros con los cuales se podrían sacar buenas conclusiones.
La base de datos resultante de delitos en Medellín también contaba con los campos de latitud y longitud, pero, a diferencia de la de sitios turísticos, tenía los datos agrupados por barrio y no por comuna. Por ello se buscó en qué barrio estaba situado cada lugar turístico para tener el campo común "barrio" y hallar de forma más precisa la distancia entre el delito ocurrido y la ubicación del lugar turístico, y así evaluar si los delitos ocurrían cerca o lejos.
### Unión de las bases de datos
Para unir las dos bases de datos se realizó un proceso manual, dado que se intentó por Python y por BigQuery sin éxito. Se necesitaba un nuevo archivo donde, por cada delito ocurrido, se informara si en el barrio de su ubicación había un lugar turístico o, de lo contrario, escribir "no aplica". En BigQuery la base de datos debía estar "normalizada", es decir, un solo delito y sitio turístico por barrio, pero nuestra fuente contaba con varios registros por barrio, por lo cual se realizó un "buscar V" sobre el campo "Barrios".
Para hallar la distancia entre dos puntos utilizamos Python con la fórmula de Haversine, una ecuación empleada para calcular la distancia entre dos puntos geográficos a partir de sus longitudes y latitudes. Este método brinda distancias más exactas porque tiene en cuenta el ángulo entre la recta de cierta ubicación y el plano ecuatorial [8].
Donde R es el radio de la Tierra (6373 km), lon1/lat1 son la longitud y latitud del primer punto y lon2/lat2 las del segundo. El código en Python, ya corregido para que sea ejecutable, es el siguiente:
import csv
from math import sin, cos, sqrt, atan2, radians
R = 6373.0 # radio de la Tierra en kilómetros
with open("criminalidad_medellin.csv") as fichero_csv:
lector = csv.reader(fichero_csv)
next(lector, None) # saltar la cabecera
for fila in lector:
# Ajusta estos índices a las columnas reales de tu CSV
lat1 = radians(float(fila[0])) # latitud del delito
lon1 = radians(float(fila[1])) # longitud del delito
lat2 = radians(float(fila[2])) # latitud del punto turístico
lon2 = radians(float(fila[3])) # longitud del punto turístico
dlon = lon2 - lon1
dlat = lat2 - lat1
a = sin(dlat / 2) ** 2 + cos(lat1) * cos(lat2) * sin(dlon / 2) ** 2
c = 2 * atan2(sqrt(a), sqrt(1 - a))
# R ya está en km, así que R * c es la distancia en km (sin dividir entre 1000)
distance = R * c
print(f"{distance:.2f}")Nota sobre las correcciones del código original: el import decía coss (debe ser cos); al bucle for le faltaban los dos puntos y la indentación del cuerpo; las variables de latitud y longitud no se leían de cada fila; el resultado se dividía erróneamente entre 1000 (con R en km, R * c ya está en km); y el print usaba una cadena de formato inválida.
Con lo anterior se hizo el análisis para entender a qué distancia del atractivo turístico se cometió cada delito. Un ejemplo de los resultados:
- Hurto: 1.06 km, barrio Calazans.
- Homicidio: 2.06 km, barrio Manrique.
### Modelamiento de la bodega de datos
Como primer paso se realizaron diferentes diagramas para modelar la bodega de datos, como el Cubo y el Esquema de Estrella.
Nota: el cubo se realizó con las dimensiones de tiempo, lugar turístico y tipo de arma utilizada en el delito, para representar el total de delitos ocurridos cerca al Museo de Arte Moderno, Plaza Botero y la UD Atanasio Girardot en los primeros tres trimestres de 2019, donde se utilizó arma de fuego, escopolamina o ningún arma para atacar a la víctima.
Con el objetivo de refutar o afirmar la hipótesis se formularon preguntas que nos encaminaran no solo a la solución de la hipótesis, sino a una contextualización de la actualidad de esta problemática:
En la ciudad, durante 2019, se presentaron 33.900 delitos, donde el 99% de los casos fueron hurtos a personas, con 33.572 casos.
De acuerdo con el hallazgo anterior, se indagó cuál fue la modalidad de delito más frecuente, destacándose tres en particular: el atraco, con 16.500 casos, y una diferencia mínima entre el segundo y tercer lugar (el descuido y el cosquilleo). Las demás modalidades no resultan tan significativas como las primeras tres.
Conociendo las modalidades más empleadas, se procedió a determinar la jornada en la que más casos se presentan, con el fin de contextualizar en qué momento se corre mayor riesgo. A pesar de que existe una leve diferencia, podemos considerar que la ciudad es más peligrosa en la noche.
Teniendo en cuenta lo anterior, se consultó el instrumento más utilizado según el tipo de delito. Sorprende este hallazgo: la mayoría de los hurtos se realizan sin emplear ningún tipo de arma (17.063 casos), mientras que en los homicidios sí se utilizan armas en su mayoría (250 casos).
Medellín cuenta con diferentes medios de transporte, donde destaca su sistema masivo conformado por el metro, por lo que se consultó en qué medio se movilizaban las víctimas. Se encontró que más de 25 mil casos se presentaron en la vía pública mientras las personas se desplazaban por su cuenta, lo que abre preguntas sobre la seguridad en las calles y aceras de la ciudad.
Con una percepción general del comportamiento de los delitos en la ciudad, procedimos a indagar sobre los delitos en los lugares donde se encuentran los sitios turísticos. Se presentaron un total de 7.604 delitos, donde el barrio con mayor cantidad es La Candelaria, con 3.648 casos, seguido por El Poblado con 755 y luego San Benito con 633. La Candelaria concentra el 48% de todos los delitos, y su más inmediato perseguidor es El Poblado con el 9.9%. Cabe mencionar que La Candelaria es un sector ubicado en el centro de la ciudad, donde lamentablemente se evidencia mucha marginalidad y habitantes de calle que hacen que esta zona sea potencialmente peligrosa en cualquier momento del día.
Con la información anterior se indagó sobre las modalidades más frecuentes cerca a los lugares turísticos (recordando que "cerca" alude a una distancia entre 0 y 2 km), pues el visitante, en su desplazamiento entre su residencia y el lugar turístico o viceversa, puede ser víctima. Los datos validan que la modalidad más utilizada fue el atraco, con 3.010 casos; le siguen el cosquilleo y el descuido, con 2.192 casos cada uno. El cosquilleo presenta cierta coherencia, debido a que en esos lugares la aglomeración de personas puede ser aprovechada por los delincuentes.
Conociendo la distribución de los casos cerca a los lugares turísticos y las modalidades utilizadas, se analizó el género más afectado. Se encontró que las mujeres sufren un poco más este tipo de situación, con 3.723 casos (50.4%), mientras que los hombres registran 3.670 casos (49.6%). No es una diferencia muy significativa, lo que indica que los delincuentes aprovechan el menor descuido sin discriminar por género.
Estos lugares turísticos prestan atención los 7 días de la semana, salvo excepciones mínimas, por lo que se indagó el comportamiento de los delitos según el día. Los resultados muestran que la mayoría de casos se presentan los viernes (1.323 casos) y sábados (1.476 casos). El día con menos casos fue el domingo, con 658.
Asimismo, se revisó la cantidad de delitos ocurridos en barrios sin lugares turísticos frente a barrios con ellos: 26.296 casos (77%) ocurrieron en barrios sin sitios turísticos, frente a 7.604 casos en barrios con lugares turísticos.
Por último, se analizó la distancia entre la ubicación de los lugares turísticos y la ocurrencia de los delitos. Primero se examinaron los delitos ocurridos a una distancia de 3 a 8 km (211 casos en total) y luego los ocurridos entre 0 y 2 km (cerca al lugar turístico), dando como resultado 7.393 casos para esta última categoría.
Para presentar de forma gráfica el análisis y los resultados de la hipótesis se creó un informe interactivo.
Nota: el informe original se publicó en Google Data Studio, herramienta que en octubre de 2022 fue renombrada a Looker Studio. Si republicas este artículo, verifica que el enlace del informe siga activo en Looker Studio y actualízalo, ya que la URL antigua de datastudio.google.com puede haber dejado de resolver.
Conclusiones
Se evidencia, mediante la presente práctica, la importancia de los datos que se generan a cada instante en cualquier ámbito de la vida cotidiana. Por esta razón, las organizaciones, los gobiernos y la sociedad en general deben aprovecharlos y así generar bodegas de datos. Este procedimiento, a pesar de que puede ser costoso, demorado y requerir diferentes procesos de consulta y limpieza, se puede convertir en una poderosa herramienta para comprender la dinámica y los cambios del entorno y llegar a la toma de decisiones eficientes para el bienestar de la sociedad.
Se demostró que el hurto es la problemática más significativa, superando ampliamente a los homicidios, algo impensado debido al estigma que posee Colombia en el ámbito internacional. En 2019, el 99% de los casos correspondían a hurtos, realizados en su mayoría mediante atraco, cosquilleo y descuido, sin utilización de arma.
Tras los análisis se encontró que, de los 33.900 casos de delitos de 2019, solo 7.604 ocurrieron en los barrios donde se encuentran los sitios turísticos "imperdibles", representando el 22%. Esto permite concluir que la mayor cantidad de actos delictivos no ocurrieron cerca a los lugares turísticos. Sin embargo, al clasificar por cercanía, la mayoría de esos casos ocurrieron a una distancia entre 0 y 2 km ("cerca", según este artículo), con 7.393 casos, frente a 211 que se presentaron entre 3 y 8 km.
Se encontró que, en los barrios con sitios turísticos, la mayoría de los delitos ocurrieron a corta distancia, y se demuestra que la razón es que la mayor cantidad de estos atractivos se encuentran cerca al centro de la ciudad ("Comuna 10, La Candelaria"), un lugar potencialmente peligroso por la alta incidencia de habitantes de calle.
Agradecimientos
Este artículo se realizó junto con los estudiantes Edward Alexander Pérez Betancur y Sara Yelen Valencia Vélez, de la maestría y especialización en analítica predictiva de la Universidad Nacional sede Medellín, en el curso de Sistemas de Bases de Datos Masivos 2020-I.
Referencias
- A. Montenegro y C. Posada. "Criminalidad en Colombia". Borradores de Economía, n.º 4, 1994. Disponible en: repositorio Fedesarrollo
- L. Dávila. "Violencia urbana, conflicto y crimen en Medellín: una revisión de las publicaciones académicas al respecto". Revista Criminalidad, vol. 58, n.º 2, pp. 107-121, 2016.
- Instituto Nacional de Estadística e Informática (INEI). "Importancia de la medición de los homicidios dolosos". Perú. Disponible en: inei.gob.pe
- E. González. "El delito de hurto y su evolución histórica". Caribeña de Ciencias Sociales, 2019. Disponible en: hacienda.go.cr
- INDEC. "Turismo, conceptos y definiciones", 2020. Disponible en: indec.gob.ar
- Medata. Alcaldía de Medellín, 2020. Disponible en: medata.gov.co
- OpenData. Alcaldía de Medellín, 2020. Disponible en: geomedellin opendata
- E. Pérez. "Diseño y desarrollo de una aplicación para la planeación de rutas con condiciones de flota capacitada y ventanas de tiempo por medio de algoritmos heurísticos y metaheurísticos", 2018.
Eso es todo, espero que este post te sea de utilidad. Si tienes alguna duda, no dudes en dejarme un comentario en la parte de abajo. Recuerda que, si te gustó, también puedes compartirlo usando los enlaces a las redes sociales aquí abajo.
Sebastian Gomez
Creador de contenido principalmente acerca de tecnología.