31 March 2026
La gentrificación. Podemos definirla en términos puramente económicos: el precio de la propiedad y el alquiler experimentan una subida en un barrio donde han sido históricamente bajos. O en términos demográficos. La familia trabajadora histórica del barrio, el artista de pocos ingresos o el inmigrante de primera generación desaparecen; les sustituyen jóvenes profesionales, de alta formación y alto poder adquisitivo. Además cabe distinguirla de otros fenómenos, como puede ser la turistificación o el mero enriquecimiento generalizado de una población.
Es un fenómeno polifacético y un tanto escurridizo teóricamente. Y sin embargo, ¿quién no siente claramente la gentrificación allá donde esta se presenta? En la discusión cotidiana cabe poca discrepancia sobre que barrio está o no gentrificado, o hasta que punto lo está. El vestir de los transeúntes, el número y tipo de obras y rehabilitaciones, los idiomas que oímos al pasar... Todo ello revela la gentrificación a aquel que pasea el barrio.
Y de entre estos "indicadores de gentrificación", algunos elementos se presentan como pruebas de diagnóstico definitivas: eliminan toda duda de que este fenómeno está presente en el barrio. Tal vez su mayor exponente sea el café de especialidad. El local pequeño, minimalista e impoluto, con tan solo una barra y una maquina de café, actúa como prueba PCR del fenómeno gentrificador... O por lo menos esta es la intuición.
Pero, ¿es esta intuición correcta? ¿Podemos, en lugar de medir multiples variables socioeconómicas, centrarnos en los cafés de especialidad para medir la gentrificación de un barrio? En otras palabras, ¿puede asistir esta intuición cotidiana a las consideraciones teóricas? Veamoslo.
En términos concretos vamos a necesitar dos cantidades:
En estos términos nuestra hipótesis es: podemos utilizar 2 para estimar 1 con gran precisión. El énfasis en la precisión es clave, pues nuestra intuición se refiere a estos negocios como prueba diagnóstica y no como mero indicador.
La medida de gentrificación la obtenemos de un artículo de la Universitat Autónoma de Barcelona: Com la gentrificació ha redefinit les ciutats espanyoles: l’expansió del procés en la dècada 2011-2021. Los autores se centran en 8 variables socioeconómicas (e.g. población joven, población con estudios universitarios, población ocupada en categorías laborales más altas, el precio del alquiler). El índice resultante está normalizado entre 0 y 1 y se basa en el incremento de estas variables (2011-2021) así como su magnitud actual (2021). Se calcula el valor de este índice para las 10 ciudades más pobladas de España.
Un detalle de relevancia, el estudio subdivide los distritos de dichas ciudades en secciones de realización propia. Con tal de obtener el valor del índice por distrito, hemos agregado los valores de las secciones mediante una media ponderada en base al área de cada sección.
La medida de cafés de especialidad (CEs) la realizamos a partir de datos de la Places API de Google Maps. Por cada distrito de las 10 ciudades estudiadas: hacemos una búsqueda de "specialty coffee"/"café de especialidad" y contamos el número de resultados estrictamente dentro del distrito. Los resultados de la API son pocos y estrictamente coincidentes con la búsqueda, haciendo cualquier filtro posterior innecesario. A continuación, dividimos el número de CEs por el área del distrito. Hacemos esto por considerar que un distrito con 4 manzanas y 4 CE tiene una mayor presencia de CEs que uno con 20 manzanas y 8 CE. Así, por cada distrito estudiado tenemos una medida de CEs por $km^2$. La llamaremos densidad de CEs.
Tal vez el lector se pregunte por qué hemos empezado hablando de barrios y ahora nos referimos a distritos. Bien, aquello a lo que cotidianamente nos referimos como "barrio" se corresponde en ocasiones con un barrio o con un distrito en términos administrativos. El primero siendo una subdivisión del segundo. En el estudio decidimos centrarnos en el segundo por considerarlo una escala más apropiada. Si el análisis se realizase por calles (i.e. CE en la calle - nivel de gentrificación de la calle) es seguro que no observaríamos ninguna relación. Por mucho que se gentrifique una zona, la mayoría de calles en esta no tendrán un café de especialidad porque nunca habría suficiente demanda. Pensamos que un estudio por barrio sufriría de una limitación similar, y optamos por el distrito en consecuencia.
Tenemos ~700 distritos para los que conocemos el índice de gentrificación y la densidad de CEs ¿Podemos estimar el primero a partir de la segundo?
Nos estamos preguntando aquí si existe una relación que podamos modelizar entre ambas variables. Y cuando uno investiga una relación entre dos variables, el primer paso es hacer un gráfico de dispersión. También añadimos un gráfico menos detallado: la gentrificación media en cuatro intervalos iguales de densidad de CEs.

El segundo gráfico es bastante claro: a mayor densidad de CEs mayor gentrificación. Eso sí, con mucha variación en cada intervalo. Además, el incremento parece lineal (i.e. constante entre intervalos). Para comprobar esto podemos computar la $r$ de Pearson.
El gráfico de dispersión es bastante menos claro: una aglomeración de puntos en niveles bajos de CE y una tendencia positiva a partir de CE$>2$. Lo que sucede aquí es bastante habitual: la escala del eje $X$ es suficientemente grande como para representar todos los valores, pero esto hace imposible representar con precisión diferencias pequeñas entre valores y los puntos se aglomeran. Para solucionar este problema podemos utilizar una escala logarítmica.

En primer lugar, $r=0.75$ parece confirmar que la relación positiva entre gentrificación y densidad de CEs es lineal. Eso sí, vuelve a mostrar que dicha relación dista de ser determinística. El gráfico de dispersión es congruente con este resultado. Una línea dibujado con un eje $X$ logarítmico tendrá una mayor pendiente a cada posterior intervalo de 10, pues este constituye un cambio 10 veces mayor en la variable $X$. En suma parece que estamos ante una relación lineal con bastante varianza.
A partir de este punto parece razonable modelar la relación con una simple regresión lineal. Sin embargo, y como una amiga física me hizo notar, tal modelo tendría un inconveniente: el índice de gentrificación está limitado al intervalo $[0,1]$, mientras que el modelo lineal puede tomar cualquier valor.
Resulta más apropiado modelo logístico:
$$y = \frac{1}{1+e^{-k(x-x_0)}}$$
Este modelo es capaz de representar la relación lineal entre variables, y al mismo tiempo impone una restricción en el valor de gentrificación que lo mantiene en $[0,1]$. En términos técnicos: es physically feasible.
Procedemos a ajustar el modelo logístico a nuestros datos y a evaluar la bondad de ajuste (i.e. el goodness-of-fit):

En primer lugar $R^2 = 0.56$. Es decir, casi el 60% de la varianza en el índice de gentrificación desaparece (i.e. es explicada) si tenemos en cuenta la densidad de CEs. Esto nos evidencia una relación entre ambas variables que no cabe pasar por alto. Si alguien se propusiese estimar el nivel de gentrificación sin acceder a medidas socioeconómicas, la densidad de CEs es sin duda una gran candidata a ser incluida en el modelo. No obstante, este valor de $R^2$ dista de corroborar nuestra hipótesis: "podemos estimar el índice de gentrificación con gran precisión".
Por otro lado, MAE = 0.06 ¿Es este un error medio grande o pequeño? Teniendo en cuenta que un 50% de los datos se encuentra en $[0.12,0.37]$, estamos hablando de un error medio de entre el 50% y el 16% para estos valores. Y esto es el error medio. Si inspeccionamos la visualización del modelo vemos que errores $>0.1$ son habituales, empeorando este cálculo de error porcentual. Es decir, el error no es pequeño. Si bien este tampoco es muy grande, de nuevo, dista de confirmar nuestra hipótesis que exige una gran precisió, o nuestra intuición, que cataloga la presencia de CEs como prueba diagnóstico.
Nuestra intuición no va desencaminada: la presencia de cafés de especialidad es un fuerte indicador de gentrificación. No obstante, esta no parece ser una prueba diagnóstico que nos revele todo lo que cabe saber sobre el nivel de gentrificación de un barrio. Habrá que fijarse también en otras cosas.