Las puntuaciones ambientales, sociales y de gobernanza (ESG) se están convirtiendo en una herramienta cada vez más importante para que los administradores de activos diseñen e implementen estrategias de inversión ESG. Sin embargo, existen inconvenientes en el uso de puntajes ESG principales que limitan su utilidad. Las puntuaciones ESG combinan una amplia gama de factores fundamentalmente diferentes, lo que genera ambigüedad. Los puntajes bajos en un pilar pueden compensar los puntajes altos en otro pilar.
Contribución
Demostramos una estrategia de inversión basada en la deconstrucción de las puntuaciones ESG. La estrategia se centra en categorías ESG subyacentes específicas, como la reducción de emisiones y los derechos humanos. Para implementar nuestra estrategia de inversión, excluimos empresas con las puntuaciones más bajas en ciertas categorías de interés ESG e implementamos una estrategia de inversión de primera clase.
Este enfoque ayuda a los inversores a superar la «confusión agregada» inherente a las puntuaciones ESG. Además, permite a los inversores realizar un mejor seguimiento de la trayectoria de rendimiento de sostenibilidad de su cartera frente a sus objetivos de inversión sostenible declarados.
Recomendaciones
Descubrimos que las exclusiones simples permiten mejoras sustanciales en el puntaje ESG principal de la cartera. Aquí, el rendimiento financiero de la cartera solo sufre un impacto marginal en relación con un punto de referencia amplio del mercado de valores. Sin embargo, la exclusión da como resultado sesgos regionales y sectoriales en comparación con el punto de referencia.
Para contrarrestar esto, adoptamos la mejor estrategia de su clase que excluye a las empresas con los puntajes de categoría más bajos y reinvierte las ganancias en las empresas con los puntajes más altos. Este enfoque ayuda a reducir el error de seguimiento de la cartera y mejora ligeramente su rendimiento ajustado al riesgo al mismo tiempo que genera una gran ganancia en la puntuación ESG principal.
Los puntajes ambientales, sociales y de gobierno (ESG) se están convirtiendo en una herramienta cada vez más importante para que los administradores de activos diseñen e implementen estrategias de inversión ESG. Combinan una amplia gama de factores fundamentalmente diferentes, creando ambigüedad para los inversores en cuanto a las señales de puntajes ESG más altos o más bajos. Exploramos la viabilidad y el rendimiento de estrategias de inversión más específicas basadas en categorías específicas mediante la deconstrucción de las puntuaciones ESG en sus componentes granulares. En primer lugar, investigamos las características de las distintas categorías subyacentes a las puntuaciones ESG. No todos los tipos de categorías ESG se prestan a estrategias más específicas, lo que está relacionado tanto con los límites de la divulgación de datos ESG como con el desafío fundamental de traducir las características cualitativas en medidas cuantitativas. Segundo, consideramos un esquema de inversión basado en la exclusión de empresas con los puntajes más bajos en cada categoría de interés. En la mayoría de los casos, esta estrategia específica aún permite a los inversionistas mejorar sustancialmente el puntaje ESG principal de la cartera, con solo un impacto marginal en el desempeño financiero en relación con un punto de referencia amplio del mercado de valores. La exclusión da como resultado sesgos regionales y sectoriales en relación con el índice de referencia, lo que puede ser indeseable para algunos inversores. Luego implementamos una estrategia de «mejor en su clase», basada en la exclusión de empresas con los puntajes de categoría más bajos y la reinversión de las ganancias en empresas con los puntajes más altos que mantienen la misma composición regional y sectorial.
Deconstrucción de puntajes ESG:
Los puntajes ambientales, sociales y de gobernanza (ESG) se están convirtiendo en una herramienta cada vez más importante para que los administradores de activos diseñen e implementen estrategias de inversión ESG. Amalgaman una amplia gama de factores fundamentalmente diferentes, creando ambigüedad para los inversores en cuanto a las señales de puntuaciones ESG más altas o más bajas. Exploramos la viabilidad y el rendimiento de estrategias de inversión más específicas basadas en categorías específicas mediante la deconstrucción de las puntuaciones ESG en sus componentes granulares. En primer lugar, investigamos las características de las diversas categorías subyacentes a las puntuaciones ESG. No todos los tipos de categorías ESG se prestan a estrategias más específicas, lo que está relacionado tanto con los límites a la divulgación de datos ESG como con el desafío fundamental de traducir las características cualitativas en medidas cuantitativas. En segundo lugar, consideramos un esquema de inversión basado en la exclusión de las empresas con los puntajes más bajos en cada categoría de interés. En la mayoría de los casos, esta estrategia específica aún permite a los inversores mejorar sustancialmente la puntuación ESG principal de la cartera, con solo un impacto marginal en el rendimiento financiero en relación con un punto de referencia amplio del mercado de valores. La exclusión da lugar a sesgos regionales y sectoriales en relación con el índice de referencia, lo que puede ser indeseable para algunos inversores. Luego implementamos una estrategia de «mejor en su clase», basada en excluir a las empresas con los puntajes de categoría más bajos y reinvertir los ingresos en las empresas con los puntajes más altos manteniendo la misma composición regional y sectorial. Este enfoque reduce el error de seguimiento de la cartera y mejora ligeramente su rendimiento ajustado al riesgo, al tiempo que produce una gran ganancia en la puntuación ESG general.
Introducción
La inversión ambiental, social y de gobernanza (ESG) ha experimentado un rápido crecimiento y, en cierta medida, ya ha alcanzado los 35 billones de dólares, más de un tercio de los activos totales globales bajo gestión (GSIA, 2020). Se espera un crecimiento más rápido. Los activos bajo gestión de los fondos ESG podrían superar los 50 billones de dólares para 2025 (Bloomberg, 2021). Esta tendencia presenta una oportunidad para los gestores de inversiones y, potencialmente, para la sociedad en su conjunto.
Las puntuaciones ESG son una herramienta clave para implementar las estrategias ESG de los gestores de inversiones (Amel-Zadeh y Serafeim, 2021). Entre las estrategias más populares se encuentran la integración ESG, que emplea factores ESG junto con factores financieros para la selección de carteras, y la selección negativa, mediante la cual se excluyen los activos con las peores (o «peores características» de ESG»). Por lo general, los gestores de inversiones confían en las puntuaciones ESG de uno o varios proveedores de datos para medir el rendimiento ESG. Por lo tanto, las puntuaciones ESG son fundamentales para la inversión ESG y, por extensión, para una proporción sustancial y creciente de las asignaciones de inversión a nivel mundial.
Sin embargo, el uso de puntajes ESG enfrenta algunos desafíos bien conocidos. Un desafío clave para los gestores de inversiones es la muy baja correlación de puntuaciones entre los diferentes proveedores de datos principales. Por lo tanto, los gestores de inversiones pueden llegar a diferentes selecciones de cartera utilizando la misma estrategia, pero diferentes proveedores de datos ESG. Si bien la correlación entre las calificaciones crediticias suele ser cercana al 99%, Berg et al. (2019) encuentran que, en promedio, la correlación entre las calificaciones ESG es solo ligeramente superior al 50%.
En este documento, adoptamos una perspectiva de gestor de inversiones y nuestro objetivo es eludir las inconsistencias de las puntuaciones ESG deconstruyéndolas y centrándonos en los puntos de datos subyacentes. Nuestra pregunta principal es la siguiente: ¿Puede un gestor de inversiones construir una cartera de acciones (a partir de un amplio universo de inversión) que logre un rendimiento financiero determinado, pero con mejores características ESG subyacentes?2 Llegar directamente a las características subyacentes no solo protege contra posibles inconsistencias en los métodos de puntuación y ponderación ESG, sino que también ofrece a los gestores de activos la flexibilidad para centrarse en aspectos específicos dentro de la esfera ESG, mitigando la ambigüedad que la amalgama de un gran conjunto de diversos factores ESG crea inherentemente. El logro de determinadas características de riesgo-retorno aísla el efecto de implementar diferentes grados de detección ESG. Es importante destacar que también se asemeja al problema en la implementación de su estrategia ESG que enfrentan muchos grandes inversores, que generalmente primero buscan fondos de renta variable que coincidan con su rendimiento financiero deseado. De hecho, para la mayoría de los fondos de inversión, el mandato principal sigue siendo el rendimiento financiero, mientras que las consideraciones ASG deben apoyar o ser neutrales al mandato principal.
Para definir el alcance del análisis, naturalmente tenemos que tomar algunas decisiones fundamentales. El primero se refiere al alcance de los puntos de datos ESG subyacentes. Nuestro análisis utiliza datos de Refinitiv (anteriormente Thomson Reuters Asset4), que hasta donde sabemos es el único proveedor importante de datos ESG que pone a disposición del público los puntos de datos subyacentes. Utilizamos todos los puntos de datos ESG que Refinitiv utiliza para calcular sus puntajes ESG: 186 medidas comparables que Refinitiv utiliza para definir diez categorías ESG, que luego se combinan en los tres pilares E, S y G. La segunda opción se refiere al conjunto de características ESG subyacentes de interés. Esta elección es naturalmente subjetiva y depende del esquema ESG deseado de un gestor de inversiones. En nuestro análisis, consideramos las categorías ESG en el conjunto de datos de Refinitiv, que probablemente sean representativas de los objetivos temáticos que los gestores de inversiones pueden querer implementar. La tercera opción se refiere al índice de referencia para el rendimiento financiero, cuyos componentes abarcan nuestro universo de activos invertibles. Aquí tomamos un índice de renta variable muy amplio como nuestro punto de referencia, el MSCI All Country World Index (ACWI), para mostrar la aplicabilidad geográfica y sectorial general de nuestros resultados. La elección de un índice de referencia amplio es posible dada la amplia cobertura de las empresas que cotizan en bolsa en los datos ESG de Refinitiv.
Dos desafíos relacionados con la forma en que se divulgan y registran los datos ESG son el tratamiento de los datos faltantes y la traducción de la información cualitativa en un valor numérico. Como principio general, los puntos de datos numéricos (por ejemplo, las emisiones anuales de CO2 en toneladas) son más adecuados para una estrategia de inversión de selección, ya que permiten una distinción más nítida entre las empresas. Sin embargo, tal distinción no es realmente posible, cuando las empresas no divulgan la información relacionada, ya que el punto de datos asignado entonces es el mismo valor que si la empresa obtuviera una puntuación deficiente en el indicador específico. Las preguntas booleanas, por otro lado, solo permiten una diferenciación limitada entre las empresas si muchos o todos los puntos de interés de datos ESG subyacentes son valores lógicos.3 Como resultado de ambos problemas, las estrategias de selección solo son adecuadas para estrategias ESG donde el grado de exclusión aceptable es lo suficientemente alto, ya que los puntos de datos booleanos pueden estar muy sesgados hacia un valor faltante o cero. Si bien estos desafíos son algo específicos de los datos que utilizamos (en los datos ESG de Refinitiv, los valores faltantes y cero son indistinguibles), sin embargo, apuntan a problemas más generales con respecto a la divulgación y la representación numérica de los datos ESG.
Nuestro resultado clave es que la construcción de una cartera con un objetivo ESG basado en puntos de datos ESG subyacentes prácticamente no tiene ningún costo en términos de rendimiento financiero. Los gestores de inversiones pueden construir carteras con beneficios ESG específicos, sin depender de puntuaciones ESG potencialmente confusas, al tiempo que pueden igualar un rendimiento financiero deseado determinado. Por ejemplo, con el umbral de selección del 33%, la puntuación de la cartera mejora en 18 puntos porcentuales (pp) en promedio en todas las categorías ESG (de 62 a 80, con una puntuación máxima posible de 100), mientras que el aumento es igual a 11 pp solo para la puntuación ESG general. El proceso de selección tiene un impacto sustancial en las exposiciones regionales y sectoriales de la cartera, que un inversor pasivo podría no ser capaz de aceptar. Por lo tanto, implementamos una estrategia de «mejor en su clase» al excluir a las empresas con los puntajes más bajos y reinvertir los ingresos en las empresas con los puntajes más altos en la misma región-sector. Las puntuaciones asociadas a esta estrategia mejoran ligeramente, mientras que las carteras tienen las mismas exposiciones regionales y sectoriales que el índice de referencia. El principal costo de la estrategia de selección es el error de seguimiento en relación con el MSCI ACWI, aunque la mayor parte de este costo proviene del uso de un punto de referencia intermediario (basado en los componentes del índice con una puntuación ESG): El error de seguimiento de este punto de referencia en relación con el MSCI ACWI es en promedio igual al 0,9% por año. El costo adicional debido a la detección es inferior al 0,7% por año, incluso con un umbral de detección del 33%.
Literatura relacionada. Nuestro documento es parte de la literatura más amplia sobre la divulgación de información no financiera y tiene implicaciones para los esfuerzos globales en curso para mejorar las divulgaciones corporativas de tipo ESG. El impacto de la divulgación obligatoria de sostenibilidad se ha analizado en varios artículos, incluidos Khan et al. (2016) e Ioannou y Serafeim (2017). En particular, Khan et al. (2016) encuentran que las empresas con altas calificaciones en temas de sostenibilidad material superan significativamente a las empresas con calificaciones bajas en estos temas en términos de rendimientos ajustados al riesgo. Por el contrario, las empresas con buenas calificaciones en temas de sostenibilidad inmaterial no superan significativamente a las empresas con calificaciones bajas en los mismos temas. Jouvenot y Krueger (2020) evalúan el efecto de una ley en el Reino Unido que exige que las empresas que cotizan en bolsa divulguen sus emisiones de gases de efecto invernadero (GEI) de manera estandarizada en sus informes anuales. Los autores encuentran que las empresas responden a la ley reduciendo las emisiones de GEI en aproximadamente un 16% por ciento. Relacionadamente, Mésonnier y Nguyen (2020) investigan el impacto de una regulación francesa que requiere que los inversores institucionales (excepto los bancos) informen anualmente sobre su exposición relacionada con el clima y su política de mitigación del cambio climático. Concluyen que los inversores sujetos a los requisitos de divulgación reducen su financiación de las empresas de energía fósil en un 40% en comparación con los inversores del grupo de control.
En la práctica, en los Estados Unidos, la Comisión de Bolsa y Valores (SEC) requiere que las empresas hagan divulgaciones que sean importantes para las decisiones de inversión, incluidas las divulgaciones de tipo ESG relacionadas con la gestión del capital humano, las métricas clave de rendimiento y los riesgos climáticos. Sin embargo, actualmente no exige divulgaciones ESG. Un obstáculo importante para exigir la divulgación de información ESG es la necesidad de definir con precisión qué información es importante para una decisión de inversión.4 La divulgación voluntaria de ESG puede basarse en un gran conjunto de marcos, como la Global Reporting Initiative (GRI), el Sustainability Accounting Standards Board (SASB) o el Task Force on Climate-related Financial Disclosures (TCFD).5
La Unión Europea ha introducido varios instrumentos relacionados con la divulgación de información no financiera (denominados colectivamente reglamentos de la UE sobre finanzas sostenibles). La Directiva sobre información no financiera (NFRD) ha exigido a las grandes empresas que informen sobre información ESG desde 2018. El Reglamento de Taxonomía de la UE, introducido en julio de 2020, define seis objetivos medioambientales (como la mitigación del cambio climático y la transición a una economía circular) y considera sostenible una actividad económica si contribuye al menos a uno de estos objetivos sin causar, al mismo tiempo, un perjuicio significativo a ninguno de los demás objetivos. El nuevo Reglamento de Divulgación de Información de Finanzas Sostenibles (SFDR), introducido en marzo de 2021, impone requisitos más estrictos para las instituciones de servicios financieros sobre las divulgaciones relacionadas con la sostenibilidad realizadas por estas instituciones con respecto a los riesgos de sostenibilidad.
A nivel mundial, la Junta Internacional de Normas de Sostenibilidad se lanzó en noviembre de 2021. Su objetivo es establecer estándares de divulgación de sostenibilidad que cubran tanto las divulgaciones relacionadas con el clima como otras divulgaciones de sostenibilidad.
Nuestro artículo está además relacionado con la literatura que investiga los problemas de calidad de los datos ESG. No es sorprendente que, dado que el desarrollo de las calificaciones ESG es relativamente reciente, existan discrepancias considerables entre las calificaciones ESG producidas por diferentes proveedores de datos, lo que plantea problemas sobre su confiabilidad y comparabilidad. Berg et al. (2019) identifican tres fuentes de divergencia en las calificaciones ESG (divergencia en el alcance, en la medición y en las ponderaciones) y encuentran que las diferencias en la medición explican la mayoría de las diferencias entre las calificaciones ESG, lo que significa que el mismo atributo ESG se mide utilizando diferentes indicadores subyacentes. Gibson et al. (2021), Billio et al. (2021) y Serafeim y Yoon (2021) analizan el desacuerdo entre los proveedores de datos y evalúan su impacto en los rendimientos futuros de las acciones. El alto desacuerdo con respecto a la calidad ESG de una empresa tiende a asociarse con menores rendimientos posteriores de las acciones.
Se han identificado otros problemas para los datos ESG. Berg et al. (2020) documentan cambios grandes y repetidos en los puntajes ESG históricos. Si bien encuentran una relación positiva entre las puntuaciones ESG y los rendimientos de las acciones cuando se utilizan datos actualizados, los autores no observan tal relación con los datos iniciales. Sahin et al. (2021) documentan la gran proporción de información faltante, lo que pone en duda la confiabilidad de los puntajes ESG.
Finalmente, nos basamos en la literatura sobre la inversión ESG y su desempeño financiero, que ha crecido muy rápidamente, como lo demuestran Friede et al. (2015). Durante mucho tiempo, se esperaba que las empresas con bajas puntuaciones ESG y «sin stocks» disfrutaran de un rendimiento superior (Fabozzi et al., 2008 y Hong y Kacperczyk, 2009). El análisis reciente también se ha visto impulsado por el rendimiento financiero superior de las empresas con altos puntajes ESG durante la gran crisis financiera (Lins et al., 2017) y el shock COVID-19 (Garel y Petit-Romec, 2021), aunque hay algunas pruebas de lo contrario (Demers et al., 2021, Pástor et al., 2021b, Scatigna et al., 2021). Una posible explicación para estas conclusiones de investigación divergentes es la heterogeneidad e inconsistencia de los datos, incluidos los métodos de imputación divergentes empleados en la puntuación ESG para abordar las brechas de datos (Kotsantonis y Serafeim, 2019). La deconstrucción de las puntuaciones ESG en sus elementos individuales tiene como objetivo arrojar luz sobre esta cuestión.
En equilibrio, la selección ESG debería dar lugar a rendimientos esperados más bajos para las empresas con puntuaciones ESG altas si los inversores tienen preferencia por empresas con alta calidad ESG. Pedersen et al. (2021) describen un modelo en el que la relación entre la puntuación ESG y el rendimiento financiero de las empresas depende del papel de la puntuación ESG en las decisiones de los inversores. Si los inversores tienen preferencias ESG, el rendimiento esperado de las empresas de puntuación alta debe ser menor que el de las empresas de puntuación baja. Pástor et al. (2021a) también encuentran que en un modelo de equilibrio con preferencias ESG, los activos verdes tienen alfas negativas y los activos marrones tienen alfas positivas. Sin embargo, como señalan Pástor et al. (2021b), los activos verdes han entregado mayores rendimientos realizados en el período reciente debido a la presión de la demanda impulsada por las preocupaciones climáticas de los inversores.
El resto del documento está estructurado de la siguiente manera. La sección 2 describe nuestros datos. En la Sección 3, presentamos los principales resultados con respecto a la divulgación de información ESG por parte de las empresas. En la sección 4 se resumen los principales resultados de la selección de carteras. Concluye la sección 5.
Datos
Construcción de las puntuaciones
La metodología adoptada por Refinitiv para calificar a las empresas es relativamente compleja, ya que combina una gran cantidad de diferentes tipos de datos y diferentes esquemas de agregación (ver Refinitiv, 2021). Al mismo tiempo, está fuertemente basado en datos y es transparente, debido sobre todo a la divulgación tanto de la metodología subyacente como de los puntos de datos. En primer lugar, la base de datos se basa en 450 puntos de datos (o métricas), que pueden ser indicadores booleanos e indicadores numéricos, como ratios y análisis. De estas 450 métricas, 186 medidas comparables se utilizan realmente para la puntuación ESG. Otros puntos de datos cubren diferentes temas de interés, pero no se utilizan directamente para la puntuación ESG. Las 186 medidas comparables se agregan, utilizando diferentes ponderaciones, en 10 categorías. Las 10 categorías, a su vez, se agregan aún más para calcular los tres pilares (E, S y G).
La definición y las características de los pilares y categorías se resumen en la siguiente tabla (Refinitiv, 2021). Las puntuaciones de los pilares ESG se obtienen multiplicando las puntuaciones de las categorías por sus ponderaciones de categoría. Para los pilares E y S, las ponderaciones de categoría varían entre las industrias dependiendo de la materialidad de los indicadores asociados. Algunos indicadores son importantes para algunas industrias, pero no se incluyen en el cálculo de las puntuaciones para las otras industrias.6 Para el pilar G, los pesos de las tres categorías son los mismos en todas las industrias, como se indica en la tabla. La puntuación GENERAL de ESG se basa en la combinación de los tres pilares, con ponderaciones que son específicas de la industria de la empresa evaluada. Todas las puntuaciones están entre 0 y 100, siendo 100 la mejor puntuación posible.
Un aspecto importante de la base de datos de Refinitiv es el proceso de recopilación de datos. Para la lista de empresas cubiertas por Refinitiv, los analistas recopilan información sobre medidas ESG individuales utilizando numerosas fuentes disponibles públicamente (incluidos informes anuales, informes de RSE, sitios web de empresas y fuentes de noticias). Esencialmente, los datos recopilados por Refinitiv reflejan la política de divulgación de las empresas, excepto para algunas situaciones particulares, como las controversias, que también reflejan los informes de los medios de comunicación globales.
La base de datos Refinitiv es única y muy adecuada para análisis económicos por dos razones. En primer lugar, proporciona todos los puntos de datos subyacentes utilizados para construir los puntajes, particularmente las 186 medidas comparables utilizadas para calcular los puntajes de 10 categorías. Estos puntos de datos nos permiten identificar lo que genera la distribución particular de las puntuaciones de categoría, tal y como se detalla en el apartado 3. En segundo lugar, la metodología utilizada para construir las puntuaciones es transparente, lo que también nos permite interpretar con precisión las puntuaciones. Un aspecto desafiante, que explicamos en la Sección 3.2, es la elección metodológica de asignar un valor predeterminado a un indicador booleano cuando no se encuentran datos relevantes en la divulgación pública de una empresa. El valor predeterminado es 0 cuando responder «sí» a la pregunta es positivo desde el punto de vista de la sostenibilidad (por ejemplo, «¿La empresa realiza informes de responsabilidad social corporativa?») pero 1 cuando responder «sí» es «negativo» (por ejemplo, «¿Está clasificada la estructura de la junta directiva de la empresa?»).
Cobertura de datos
Utilizamos todos los datos disponibles en la base de datos de Refinitiv, de 2010 a 2019. Nuestro análisis de los datos ESG finaliza en 2019 por dos razones. En primer lugar, hay un desfase sustancial para una actualización completa de la base de datos para un ejercicio financiero determinado. En el momento de nuestra última descarga (marzo de 2021), algunos datos ya estaban disponibles para 2020, pero para un número sustancial de empresas, los datos aún faltaban. En segundo lugar, como describimos en la Sección 4, evaluamos el rendimiento financiero de una cartera construida al final del año N utilizando los rendimientos de las acciones en el año N + 1, de modo que el rendimiento de la cartera construida con datos de 2019 se basa en los rendimientos financieros a finales de 2020. Nuestra muestra se define como el conjunto completo de empresas incluidas en la base de datos de Refinitiv para las que se dispone de capitalización de mercado en un año determinado. En el momento de nuestra última descarga, la base de datos contenía 100142 empresas que han sido evaluadas en algún momento.
En el cuadro 1 se presentan estadísticas resumidas sobre el número de empresas para las que se dispone tanto de capitalización de mercado como de puntuaciones ASG. Todos los números de la tabla son relativos a las empresas cubiertas por Refinitiv ESG en 2020: el número total de empresas en todo el mundo en la base de datos es 100142 a partir de 2020, los últimos datos disponibles en el momento del análisis. La proporción de empresas con datos disponibles sobre capitalización bursátil en 2010 es igual al 74,8%. Entre estas 7 0590 empresas, 3 0911 (51,5%) también tienen una puntuación ESG de Refinitiv en el año respectivo. La proporción de empresas con una puntuación ESG se mantiene bastante estable en nuestra muestra hasta 2014, ligeramente por encima del 50% de las empresas cubiertas en 2020. A partir de 2015, la cobertura mejora de forma constante, con un máximo en 2019 del 82,3% de las firmas de nuestra muestra. En general, otros puntajes (3 pilares y 10 categorías) tienen una cobertura que es esencialmente la misma que el puntaje ESG agregado.
En 2019, la cobertura regional en términos de capitalización de mercado es la siguiente: el 39% de las empresas son de América del Norte, el 20% de Europa, el 14% del Pacífico y el 23% de países emergentes. La tabla también revela que entre las empresas de la base de datos Refinitiv, la proporción de empresas con puntuaciones ESG varía sustancialmente entre las regiones. En promedio, es relativamente bajo en América del Norte al comienzo de la muestra, por debajo del 50% hasta 2014. En los países emergentes, la proporción de empresas con una puntuación ESG disponible ha estado por encima del 50% desde 2011. En Europa y el Pacífico, la cobertura de la puntuación ESG es relativamente completa en la muestra completa.
Divulgación de información ESG
En esta sección, analizamos la divulgación de datos ESG por parte de las empresas en la base de datos de Refinitiv. Como se discutió en la introducción, no existe un régimen generalmente acordado para la regulación de la divulgación: los Estados Unidos no exigen actualmente la divulgación DE ESG por parte de las empresas que cotizan en bolsa, mientras que la Unión Europea ya ha introducido un conjunto de instrumentos para regular la divulgación de ESG. Presentamos las dos cuestiones planteadas por los datos ESG (valores faltantes en los indicadores numéricos y proporción de ceros en los indicadores booleanos) y describimos las implicaciones para las puntuaciones de categoría.
Valores faltantes en los indicadores numéricos
Para los indicadores numéricos, se calcula una puntuación (basada en la clasificación del percentil relativo) solo si la empresa ha informado de esta información, y se asigna un valor faltante cuando Refinitiv no puede encontrar la información en los informes disponibles públicamente. Para calcular la proporción de valores válidos (o no pasajeros) para un indicador numérico dado en un año determinado, comenzamos calculando el número de empresas para las que se dispone de un indicador determinado en ese año; luego, para este indicador dado, identificamos las industrias para las cuales el indicador es material. Finalmente, calculamos el número de empresas con datos válidos y lo dividimos por el número total de empresas para las que el indicador es importante.
En el cuadro 2 se presentan estadísticas resumidas sobre la proporción de valores válidos para los indicadores numéricos de cada pilar y categoría, que interpretamos como un indicador de la política de divulgación de las empresas. En general, la proporción de valores válidos es relativamente baja, cercana al 40% en promedio para todos los indicadores numéricos de la muestra. De hecho, existe una gran brecha entre los pilares E y S (20% y 30%) y el pilar G (80%). Dentro de un pilar dado, esta proporción suele ser homogénea. Los indicadores relacionados con la reducción de emisiones tienen una proporción de valores válidos igual al 22% en todo el mundo en promedio. Estos resultados revelan la falta de divulgación, en particular con respecto a las medidas adoptadas por las empresas para proteger el medio ambiente (aproximadamente el 10% de las empresas proporcionan datos sobre su índice de uso de energía renovable) o para reducir las emisiones de gases de efecto invernadero (el 25% de las empresas informan datos sobre sus emisiones indirectas equivalentes de CO2 alcance 3). La proporción de valores válidos es particularmente baja para la categoría Innovación en el pilar E y la responsabilidad del producto en el pilar S (cerca del 10% de media en todo el mundo).
También consideramos los resultados para las diferentes regiones. La proporción de valores válidos es, por término medio, superior para Europa que para otras regiones. La proporción promedio es del 48% para Europa, pero del 35% para América del Norte y el Pacífico y del 38% para los países emergentes. La diferencia es mayor para los pilares E y S: 32% y 38% para los indicadores en los pilares E y S en Europa frente al 10% y 21% en América del Norte. Los indicadores numéricos del pilar E tienen una proporción de valores válidos cercana al 20% en promedio en los países del Pacífico y emergentes.
Mostramos la proporción de valores válidos en las principales industrias. No reportamos resultados para el sector inmobiliario porque el número de firmas es insuficiente. Los resultados son, en términos generales, similares en todas las industrias, aunque hay algunas diferencias notables. En particular, la divulgación de información relacionada con el pilar E difiere un poco entre las industrias: las empresas financieras tienen un registro bajo de indicadores numéricos (por debajo del 8% en promedio), mientras que las empresas de materiales básicos y servicios públicos tienen los estándares de información más altos (23% y 20%, respectivamente). Es importante destacar que las empresas de los sectores con la mayor intensidad de carbono (energía, servicios públicos y materiales básicos) divulgan relativamente más que las de otros sectores para los indicadores numéricos en la categoría de reducción de emisiones (cerca del 20% en promedio). También observamos el mismo patrón para la categoría de uso de recursos. Una posible explicación de por qué las empresas de los sectores relacionados con la energía divulgan más información sobre cuestiones ambientales es que estas cuestiones son muy importantes para sus inversores. Para el pilar S, las empresas financieras tienen el nivel más bajo de divulgación para el pilar agregado y para las tres categorías (excepto los derechos humanos). La divulgación es particularmente baja para las categorías de Responsabilidad del producto y Fuerza laboral. Por el contrario, las empresas del sector no químico de consumo informan de un alto nivel de divulgación sobre el pilar S. En cuanto al pilar G, casi el 90% de las empresas informan sobre los indicadores relacionados con la gobernanza en promedio al final de la muestra. No observamos ninguna diferencia significativa entre los sectores.
Proporción de ceros a nivel de categoría
Los indicadores booleanos generalmente no tienen valores faltantes en la base de datos de Refinitiv. Cuando la información relativa a una pregunta booleana no está disponible, Refinitiv asigna un valor igual a 0 (correspondiente a un ‘no’) cuando responder a la pregunta con ‘sí’ se consideraría positivo y un valor igual a 1 (correspondiente a un ‘sí’) al responder a la pregunta con ‘sí’ se consideraría negativo. Esta estrategia de penalizar a las empresas es relativamente reciente. Como se indica en el sitio web de Refinitiv, «la metodología de puntuación ESG anterior asignaba una puntuación de 0,5 a las empresas que no informaban sobre métricas, lo que esencialmente les daba el ‘beneficio de la duda’. Sin embargo, como esto puede desincentivar a las empresas a informar sobre su desempeño ESG, la metodología mejorada asigna una puntuación de cero a las empresas que no informan sobre métricas relevantes para la industria. Este nuevo enfoque fomenta la divulgación y la transparencia de la empresa». Observamos que esta elección metodológica incentivará a las empresas a mejorar su divulgación de información no financiera si realmente mejoran su política.
Debido a la elección de asignar un valor de 0 a los indicadores booleanos que faltan, la proporción de valores válidos es igual al 100% para la mayoría de las categorías. Sin embargo, una dificultad para asignar el mismo valor de 0 tanto a las respuestas negativas como a los valores faltantes es que la evolución del indicador a lo largo del tiempo puede ser difícil de interpretar. Por ejemplo, si consideramos la pregunta «¿Tiene la empresa una política para evitar el uso del trabajo forzoso?», encontramos que el número de empresas con un valor de 0 ha disminuido del 95% en 2010 al 52% en 2019. Sin embargo, no podemos identificar si este cambio se debe a una mejor presentación de informes o a una mejora real en la política de las empresas.
Una implicación de este enfoque es que la proporción de empresas con un valor de 0 es muy grande para algunos indicadores booleanos. Por ejemplo, en 2019, la proporción de 0 es igual al 74% para los informes sobre los gastos ambientales de la empresa y al 95% para los informes sobre la remuneración individual total de todos los ejecutivos y miembros de la junta. Cuando pasamos a las puntuaciones de categoría, este enfoque de atribución puede tener un impacto considerable porque algunas categorías (derechos humanos y estrategia de RSE) se basan exclusivamente en indicadores booleanos. En consecuencia, para estas categorías, una proporción sustancial de empresas reporta una puntuación igual a 0.
En el cuadro 4, informamos de la proporción de empresas con una puntuación de categoría igual a 0 para los tres pilares y las diez categorías para las distintas regiones. La distribución de las puntuaciones también se muestra en las Figuras 1 a 3. Como revela la tabla, el problema es particularmente agudo para el pilar E porque la selección de puntajes iguales a 0 también contamina el puntaje del pilar E en sí. En todas las regiones, encontramos que las puntuaciones para las tres categorías E sufren de una alta frecuencia de 0. Incluso si hay indicadores numéricos para estas tres categorías, también tienen una gran proporción de valores faltantes, por lo que la puntuación de las categorías a menudo se basa solo en indicadores booleanos y, por lo tanto, puede obtener una puntuación igual a 0. Este problema es sustancial para la innovación, ya que el 56% de las empresas en todo el mundo tienen una puntuación de innovación igual a 0 (71% en América del Norte) en 2019. Las puntuaciones de emisiones y uso de recursos también se ven afectadas por este problema, pero en menor medida, con una proporción de 0 igual al 28% y el 29% en todo el mundo en 2019.
Con respecto a las categorías S, observamos una fracción sustancial de empresas con una puntuación igual a 0 para las categorías de derechos humanos y responsabilidad del producto. El puntaje de derechos humanos es igual a 0 para el 42% de las empresas en todo el mundo (59% en América del Norte) en 2019. La puntuación de responsabilidad del producto es igual a 0 para el 10% de las empresas (20% en los países emergentes). Finalmente, como la categoría de estrategia de RSE se basa solo en indicadores booleanos, informa aproximadamente el 34% de los puntajes iguales a 0 en todo el mundo (61% en América del Norte) en 2019.
El cuadro 5 indica que la proporción de empresas con una puntuación de categoría igual a 0 también es heterogénea entre las industrias. En primer lugar, existen grandes diferencias con respecto a la proporción de puntuaciones iguales a 0. Para el pilar E, la proporción de puntajes iguales a 0 es tan alta como 53% para la atención médica y tan baja como 17% para los servicios públicos en 2019. La heterogeneidad en las categorías es aún más pronunciada: el 90% de las empresas de atención médica no tienen una respuesta positiva para los indicadores subyacentes a la puntuación de innovación. En contraste, solo el 18% de las empresas de servicios públicos obtienen un puntaje de Innovación igual a 0. También encontramos la misma brecha entre las empresas de atención médica y las empresas de servicios públicos para el puntaje de derechos humanos (pilar S) y el puntaje de estrategia de RSE (pilar G). Las empresas financieras también reportan una proporción sustancial de puntajes iguales a 0 para algunas categorías. La heterogeneidad sectorial no está relacionada con la (falta de) materialidad de algunos indicadores, porque las puntuaciones de categoría ya se basan en indicadores que son importantes a nivel sectorial.
En segundo lugar, la tabla revela que la proporción de empresas con puntuaciones de categoría iguales a 0 tiende a disminuir con el tiempo para la mayoría de los sectores, pero esta evidencia no es universal. La atención médica reporta una mayor proporción de puntajes iguales a 0 en 2019 que en 2010 para todas las categorías E y G. La tecnología también demuestra un aumento en la frecuencia de 0 para las categorías E.
Puntuaciones a nivel de categoría
La alta frecuencia de puntuaciones igual a 0 para algunas categorías puede introducir cierta distorsión en la puntuación media resultante entre categorías y, por lo tanto, entre pilares. Por esta razón, ahora consideramos la evolución temporal de los puntajes en todas las categorías. El cuadro 6 confirma las grandes diferencias en la puntuación media entre las categorías ESG. Las categorías basadas únicamente en indicadores booleanos (Derechos humanos en el pilar S y estrategia de RSE en el pilar G) o en una pequeña proporción de indicadores numéricos con una gran proporción de valores faltantes (Innovación en el pilar E) se asocian con puntuaciones medias bajas. En promedio, los puntajes son más bajos para el pilar E que para los pilares S y G.
La tabla también revela una heterogeneidad sustancial entre las regiones. En general, las empresas europeas tienen puntuaciones más altas, particularmente para las categorías E y S. Las empresas en América del Norte y los países emergentes tienen puntajes E más bajos.
En promedio, los puntajes tienden a mejorar con el tiempo. Los países del Pacífico y los países emergentes se benefician de grandes aumentos en los puntajes ESG, particularmente debido a los pilares E y S. Por el contrario, los puntajes ESG no mejoran en América del Norte, principalmente debido a la disminución en el pilar E.
Como se informa en la Tabla 7, encontramos resultados interesantes y algo contradictorios en todos los sectores. El puntaje de emisiones es mucho más alto para las empresas en energía, servicios públicos y materiales básicos (45%, 47% y 44%, respectivamente, en 2019), aunque estas industrias emiten grandes cantidades de gases de efecto invernadero. En contraste, las empresas en los sectores de atención médica, financiero y tecnológico tienen puntajes de emisiones muy bajos (20%, 30% y 32%, respectivamente), aunque tienen baja intensidad de carbono. Esta diferencia tiene dos fuentes. En primer lugar, una gran fracción de las empresas de energía y servicios públicos informan sobre su política de emisiones, por ejemplo, si tienen asociaciones ambientales, una política para mejorar la reducción de emisiones o metas u objetivos que deben alcanzarse en materia de reducción de emisiones. Por lo tanto, las altas emisiones de carbono pueden compensarse, al menos en parte, en el nivel de puntuación de emisiones, con las medidas de política adoptadas por la empresa.9 Por el contrario, las empresas de atención médica o las empresas financieras a menudo no informan información sobre estos temas, en parte porque se consideran menos preocupadas por estos problemas y, por lo tanto, reciben puntuaciones bajas de emisiones. incluso si generan bajas emisiones de carbono. Como resultado, el puntaje promedio E oscila entre 17.6 para las empresas de atención médica y 44.8 para los servicios públicos en 2019. Este contraste debido a los sesgos de informe es menos pronunciado para los pilares S y G. El puntaje S promedio oscila entre 42.9 y 46.3 en 2019 en todos los sectores. El puntaje promedio de G está entre 40.6 y 53.5.
En el Apéndice en línea, también evaluamos cómo el tamaño de las empresas afecta su política de divulgación. Encontramos que las grandes empresas (empresas en el cuartil más alto de la capitalización de mercado) generalmente tienden a divulgar más información sobre sus actividades; por lo tanto, la proporción de indicadores numéricos con valores válidos es mayor para las grandes empresas. En general, para los indicadores numéricos, esta proporción es del 31% para el cuartil más bajo y del 45% para el cuartil más alto. Además, la proporción de empresas con puntuaciones de categoría iguales a 0 representa aproximadamente el 50% de las pequeñas empresas, mientras que representa aproximadamente el 10% de las grandes empresas. Esta heterogeneidad en la proporción de indicadores numéricos faltantes e indicadores booleanos iguales a 0 se refleja en grandes diferencias en las puntuaciones de pilares y categorías entre empresas de diferentes tamaños. Para las pequeñas empresas, el puntaje ESG promedio es cercano al 30% sobre la muestra. Por el contrario, para las grandes empresas, la puntuación ESG media aumenta del 49% en 2010 al 58% en 2019. Estos resultados son consistentes con la evidencia empírica de que las grandes empresas gastan recursos considerables informando sobre asuntos ESG (Drempetic et al., 2020).
Selección ESG a nivel de categoría
Nuestro análisis identifica dos problemas con la implementación de una estrategia de inversión de selección basada en ESG a nivel de categoría. En primer lugar, la proporción de puntuaciones igual a 0 es sustancial para 6 de 10 categorías. Establecer un valor bajo para el umbral de selección (por ejemplo, excluyendo el 1% o el 5% de las empresas con las puntuaciones más bajas y reinvirtiendo proporcionalmente en las empresas restantes) daría lugar a que para estas categorías se excluyeran algunas empresas con una puntuación igual a 0, mientras que otras empresas con una puntuación igual a 0 se mantendrían en la cartera. Por lo tanto, el cribado a nivel de categoría es muy adecuado para niveles de cribado relativamente altos (por ejemplo, 25% o 33%) como se ilustra a continuación.
En segundo lugar, dada la gran heterogeneidad de las puntuaciones entre regiones o sectores, el proceso de selección implicará sesgos regionales y sectoriales significativos en la cartera ESG en relación con las exposiciones al mercado. Tales sesgos serían un problema para los inversores que buscan mantener una cartera pasiva. Para abordar este problema, procedemos de la siguiente manera. Asumimos una cartera de referencia que reproduce la estructura del mercado objetivo y proporciona ponderaciones representativas para las empresas. Construimos una cartera ESG basada en la exclusión de empresas con las peores puntuaciones asociadas a una determinada categoría ESG. En la primera estrategia, los procedes de las empresas excluidas se reinvierten proporcionalmente en las empresas restantes. Como este enfoque genera grandes sesgos regionales y sectoriales, consideramos una segunda estrategia, en la que el cribado se realiza a nivel región-sector: Los ingresos de la exclusión de empresas de baja puntuación en una región-sector determinada se reinvierten en empresas de alta puntuación en la misma región-sector. Esta estrategia es similar a lo que a menudo se llama un enfoque «mejor en su clase», mediante el cual los administradores de inversiones seleccionan las empresas con los puntajes más altos dentro de su sector y, a menudo, también en su región.
Como un gran índice bursátil mundial, utilizamos el MSCI ACWI, que cubre mercados desarrollados y emergentes. La lista de componentes y las ponderaciones de mercado correspondientes, que utilizamos para definir las ponderaciones de referencia para regiones y sectores, están disponibles para este índice. A continuación, consideramos el subconjunto de empresas en la base de datos Refinitiv que también están en el MSCI ACWI.
Proyección global
El ejercicio de asignación se realiza durante el período de 2010 a 2019. El cribado se basa en las puntuaciones disponibles al final del año N. Para un umbral de selección de, por ejemplo, el 25%, identificamos todas las empresas con las peores puntuaciones hasta que su capitalización de mercado acumulada represente el 25% de la capitalización de mercado de la cartera de referencia. El producto de la exclusión se reinvierte en las empresas restantes en proporción a su peso en el mercado. Los rendimientos bursátiles del año siguiente se utilizan para calcular el rendimiento financiero de la cartera, por lo que una cartera construida al final del año N se evalúa al final del año N + 1. Consideramos a los inversores con preferencia por alguna dimensión particular de los pilares ESG (por ejemplo, para la reducción de emisiones o los derechos humanos). También podemos imaginar inversores interesados en combinar dos o más categorías.
La Tabla 8 presenta estadísticas resumidas para las carteras de selección basadas en la muestra 2010-2019. El MSCI ACWI representa el índice del mercado, incluidas todas las empresas, incluso aquellas sin puntuación ESG. La fila etiquetada «Benchmark» representa la cartera basada en los componentes de MSCI ACWI para los que están disponibles los puntajes ESG de Refinitiv. Como revela la tabla, para el índice mundial, perdemos solo el 2,4% de la capitalización de mercado en promedio debido a la falta de puntajes de Refinitiv entre las empresas dentro del MSCI ACWI.
Las dos primeras columnas representan la proporción de empresas y la proporción del valor de mercado con puntuaciones iguales a cero, mientras que las dos columnas siguientes indican para un umbral dado cuántas empresas están realmente excluidas y qué fracción de la capitalización de mercado está excluida. La comparación de estas columnas nos permite evaluar el impacto de las puntuaciones cero en la composición de la cartera de selección. En primer lugar, observamos que, dado que las empresas de baja puntuación también tienden a tener una capitalización de mercado baja, de hecho, excluimos a una fracción bastante grande de las pequeñas empresas. Para el criterio de selección del 10% (Panel A), excluimos el 9,9% de la capitalización de mercado, pero el 26,2% de las empresas con los puntajes ESG más bajos. Del mismo modo, para el cribado del 25 por ciento (Panel B), excluimos el 24,7 por ciento del valor de mercado, pero el 50,4 por ciento de las empresas. Estas proporciones son iguales al 33% y al 60,2%, respectivamente, para el cribado del 33%.
En segundo lugar, pasamos a categorías con una gran fracción de empresas con una puntuación igual a cero. Para la categoría de Innovación, encontramos que el 40,3% de las empresas en el índice MSCI (26,1% de la capitalización de mercado) tienen una puntuación igual a cero. En consecuencia, el umbral de cribado más bajo que podemos aplicar para construir una cartera de cribado es el cuantil del 26,1% (para evitar la selección arbitraria de empresas con una puntuación igual a cero). Del mismo modo, para la categoría de Derechos Humanos, no podemos excluir menos del 21,9% de la capitalización de mercado (40% de las empresas). En consecuencia, para estas dos categorías, el impacto del proceso de selección es mucho mayor que para otras puntuaciones porque en realidad corresponde a un cribado de aproximadamente el 25%. Para la categoría de estrategia de RSE, el límite inferior para la detección es del 9,5% de la capitalización de mercado. Estos resultados ilustran claramente el impacto de la metodología de puntuación en la estrategia de selección. Para estas categorías, debido a la gran proporción de empresas con puntuaciones iguales a cero, no se puede implementar una estrategia de detección con un umbral de detección bajo.
La ganancia en el puntaje (diferencia entre el puntaje de la cartera y el puntaje de referencia) es sustancial, generalmente entre 4 y 7 puntos para el umbral del 10%. En términos relativos (ganancia dividida por puntuación de referencia), la ganancia está entre el 6% y el 10%. Un factor que limita la ganancia de puntaje es que la cartera está ponderada por capitalización de mercado. Como se mencionó anteriormente, las grandes empresas tienden a tener puntajes más altos que las pequeñas empresas.11 Por lo tanto, la cartera de referencia ya está inclinada a favor de las empresas con puntajes relativamente altos.
La ganancia de puntuación es la más alta para la categoría E. Para la misma proporción del 10% de las empresas excluidas, los puntajes de uso de recursos y emisiones ofrecen las ganancias de puntaje más altas, por encima de 7 pp. Observamos, sin embargo, que la ganancia en la puntuación del pilar E es mucho menor que la ganancia en las categorías E. La razón por la que la ganancia agregada está muy por debajo del promedio de la ganancia en las categorías es que las puntuaciones de categoría se suman primero a nivel de empresa, de modo que la gran proporción de ceros observados para la puntuación de innovación tiene un impacto limitado en la distribución de la puntuación del pilar E. Como los puntajes de las categorías no están perfectamente correlacionados entre las empresas, es más difícil mejorar el puntaje del pilar E que sus componentes por separado. Observamos el mismo resultado para los otros puntajes de los pilares S y G y el puntaje ESG agregado.
Estas cifras demuestran que, para las categorías de Innovación y Derechos Humanos, el aumento de la puntuación en relación con el índice de referencia es muy grande para el umbral de selección del 10%, ya que de hecho se excluye mucho más del 10% de las empresas. Para las otras categorías, las ganancias relativas al punto de referencia son similares en todas las categorías. Las ganancias más altas y más bajas se obtienen para el puntaje de responsabilidad del producto y el puntaje de la fuerza laboral, correspondientes a ganancias iguales a 14.2 y 11.5, respectivamente, para el umbral del 25%. Es importante destacar que, con el umbral de selección del 33%, las cuestiones metodológicas relacionadas con los valores faltantes en los indicadores numéricos y booleanos ya no afectan a la construcción de la cartera. Las ganancias en la puntuación en relación con el punto de referencia son sustanciales para todas las categorías, de 14,1 pp para La fuerza laboral a 21,4 p. p. para los derechos humanos, mientras que la puntuación ESG general solo aumenta en 11,2 pp.
Como se discutió en la revisión de la literatura, el rendimiento de las carteras ESG debe ajustarse por el factor de riesgo ESG (Pástor et al., 2021b). Dada la discrepancia entre las calificaciones ESG actuales producidas por los proveedores de datos, el ajuste adecuado para el factor de riesgo ESG está más allá del alcance de nuestro documento. Por esta razón, utilizamos la ratio de Sharpe como una medida del rendimiento financiero ajustado al riesgo de las carteras de selección. Nos centramos en el umbral del 33%, ya que la estrategia de cribado se puede implementar para todas las categorías.
Las últimas columnas del cuadro 8 proporcionan estadísticas sobre el rendimiento financiero de las carteras de selección. La proporción de Sharpe permanece en el mismo estadio que la del MSCI ACWI. La puntuación de la estrategia de RSC genera la ratio de Sharpe más bajo (0,63 frente a 0,69 para el índice de referencia), mientras que la puntuación de la Comunidad mejora la ratio de Sharpe a 0,73. También informamos del error de seguimiento relativo al ACWI de MSCI. Como revela la tabla, esto se debe principalmente a la fracción de empresas en el índice sin puntajes ESG. En promedio, el error de seguimiento anual del índice de referencia (incluidas todas las empresas en el MSCI ACWI con puntajes ESG) es igual al 0,9% en relación con el MSCI ACWI. Incluso con los umbrales del 25% y el 33%, el error de seguimiento de las carteras de selección solo se incrementa al 1,4% y al 1,5%, respectivamente.
Una de las razones por las que la ratio de Sharpe de las carteras de selección difiere de la ratio de Sharpe de referencia puede ser que el proceso de selección implique algunos cambios en las exposiciones regionales y sectoriales. Los puntajes promedio sugieren que es probable que las empresas en América del Norte estén infra ponderadas a favor de las empresas europeas y que es probable que las empresas de atención médica estén infra ponderadas a favor de las empresas financieras o de servicios públicos para casi todas las categorías. Como ilustración del impacto del cribado en las exposiciones al riesgo, consideramos el cribado basado en la puntuación E con el umbral del 33%. En promedio sobre la muestra, el cribado implicaría una sobre ponderación de 6,4 p. p. (del 23,7% al 28,7%) de las empresas europeas y una infra ponderación de 3,5 p. p. (del 11% al 7,5%) de las empresas de los países emergentes. Del mismo modo, el cribado implicaría una sobre ponderación de 1,9 p. p. (del 11,7% al 13,6%) de las empresas financieras y una infra ponderación de 1,7 p. p. (del 17,8% al 16,1%) de las empresas sanitarias.
Tal impacto en las exposiciones regionales y sectoriales sería un problema para los inversores que buscan mejorar la calidad ESG de su cartera sin alterar sus exposiciones al riesgo. Abordamos este problema en la siguiente sección.12
Selección a nivel regional-sectorial
Ahora consideramos las mismas estrategias de detección, pero manteniendo las mismas exposiciones sectoriales y regionales que en el MSCI ACWI. Por lo tanto, teniendo en cuenta el umbral del 25%, excluimos en cada región-sector a las empresas con las puntuaciones más bajas hasta que su capitalización de mercado acumulada represente el 25% de la capitalización de mercado de la región-sector en la cartera de referencia. Los ingresos se reinvierten en las empresas con los puntajes más altos en la misma región-sector hasta que su capitalización de mercado acumulada representa el 25% de la capitalización de mercado de la región-sector. Por lo tanto, este enfoque es similar a una estrategia de primera clase, en la que los inversores ponderan su cartera con las mejores empresas de su clase en lugar de las peores de su clase. Por esta razón, es más probable que un enfoque región-sector afecte al costo de financiamiento de las empresas ponderadas: el costo de financiamiento de las empresas excluidas tenderá a aumentar, mientras que el costo de financiamiento de las empresas sobre ponderadas tenderá a disminuir.13 En los cuadros 9 y 10, correspondientes a los umbrales del 25% y 33%, respectivamente, consideramos los casos en que la reasignación se realiza a nivel regional, sectorial y regional-sectorial.
A partir del umbral del 25% (Tabla 9), encontramos que la imposición de exposiciones regionales (Panel A) da como resultado puntuaciones ligeramente inferiores a las obtenidas sin restricciones de exposición. La ganancia de reasignación se reduce en 0,8 pp (de 12,8 pp a 12 pp). Con la reasignación sectorial (Panel B), el impacto de la reasignación en los puntajes ESG es marginal. Finalmente, cuando la reasignación se realiza a nivel región-sector, la ganancia en el puntaje ESG general es igual a 10.3 pp, mientras que es igual a 14, 11.3 y 11.7 pp para los puntajes E, S y G, respectivamente. Para las categorías ESG, la ganancia aumenta en promedio a 16.7 pp, de modo que las ganancias son aproximadamente 2.5 pp más altas que con el cribado global. Este resultado sugiere que reinvertir en las mejores empresas de su clase a nivel del sector regional es más eficaz que reinvertir proporcionalmente en todas las empresas restantes.
Para el umbral del 33% (Tabla 10), incluso con exposiciones sectoriales y regionales restringidas, las estrategias de reasignación permiten a los inversores beneficiarse de aumentos sustanciales en las puntuaciones ESG.14 Las ganancias son iguales a 16.3, 13.3 y 14 pp para los pilares E, S y G, respectivamente. Para las categorías ESG, la ganancia aumenta a 19 pp.
Apuntar a alguna categoría específica generalmente resulta en mayores ganancias que apuntar a los pilares ESG, para el mismo umbral de reasignación. Por ejemplo, al apuntar a la puntuación de emisiones, el umbral del 33% permitiría a los inversores mejorar su puntuación de 66,9 a 84,4 en una cartera pasiva. Estos hallazgos podrían ser particularmente relevantes para los inversores que deseen apuntar a ciertos objetivos ESG, como una menor huella de carbono de la cartera en comparación con el índice de referencia. Sin depender de la puntuación ESG general, estos inversores podrían excluir a las empresas con las puntuaciones de emisiones más bajas (centrándose así en la categoría ESG subyacente particular) y lograr resultados similares a los del punto de referencia en términos de rendimiento financiero.
Las ratios de Sharpe de las carteras de reasignación basados en las puntuaciones de categoría están en el mismo estadio que la ratio de Sharpe del índice de referencia (0,68 frente a 0,69). Además, el punto de referencia relativo al error de seguimiento está por debajo del 1,4% anual en promedio, lo que incluye el 0,9% debido a los componentes del MSCI ACWI sin puntuación ESG.
En la Figura 8, mostramos cómo el aumento en la puntuación de la cartera se ve afectado por el umbral de reasignación. Variamos el umbral de reasignación del 5% al 50% y consideramos los diversos pilares y categorías. Las categorías de innovación, derechos humanos, responsabilidad del producto y estrategia de RSE logran aumentos sustanciales en los puntajes de las categorías, incluso con un umbral de reasignación modesto, porque todas las empresas con puntajes cero se excluyen simultáneamente, lo que resulta en una reasignación mayor de lo esperado. Para otras categorías, la ganancia de puntuación aumenta constantemente, hasta 20 pp para el umbral del 50%.
La Figura 9 muestra la relación de Sharpe de las diversas carteras y la relación de Sharpe del MSCI ACWI (línea horizontal). El impacto negativo de la reasignación es marginal para las categorías E y moderado para las categorías S (para umbrales de hasta el 40%). Para el pilar G, solo la proporción de Sharpe de la categoría de estrategia de RSE disminuye significativamente.
Finalmente, la Figura 10 indica que el error de seguimiento anual generalmente aumenta a medida que la reasignación se vuelve más grave. Sin embargo, se mantiene por debajo del 1,8%, incluso para umbrales de reasignación tan altos como el 50%, mientras que el error de seguimiento de la cartera sin reasignación (pero solo con empresas con una puntuación ESG) es igual al 0,9%. En consecuencia, una estrategia de reasignación basada en un umbral bastante alto (como el umbral del 33%) puede implementarse a un costo financiero relativamente bajo.
La restricción de las exposiciones regionales y sectoriales no solo se traduce en menores ganancias en la puntuación ESG, sino que también permite a los inversores mantener una cartera que de otro modo sería pasiva, ya que no está expuesta a riesgos regionales y sectoriales en relación con la cartera de mercado. Este resultado sugiere que invertir en una cartera con una puntuación de categoría ESG más alta, con exposiciones al riesgo regionales y sectoriales mínimas en relación con la cartera de mercado, se puede lograr casi sin costo en términos de rendimiento financiero.
Conclusión
Si bien la inversión ESG ha ganado popularidad en las últimas décadas, muchos inversores institucionales luchan con las limitaciones inherentes de los puntajes ESG. Estas limitaciones incluyen la falta de transparencia en las metodologías, la amplia divergencia entre las calificaciones ESG y los posibles conflictos de intereses en el negocio de calificación ESG (Kotsantonis y Serafeim, 2019, Berg et al., 2019, IOSCO, 2021). Además, diseñar estrategias de inversión basadas en una amalgama de tres temas fundamentalmente diferentes que sustentan la inversión ESG ha sido un obstáculo práctico, especialmente dado el potencial de que los puntajes débiles en un pilar se vean compensados por puntajes fuertes en otro pilar. Utilizamos la base de datos ESG de Refinitiv, que nos permite deconstruir las puntuaciones ESG y analizar los indicadores en profundidad. Sobre esta base, abordamos dos cuestiones importantes relativas a la inversión ESG en los mercados de renta variable. En primer lugar, investigamos las características de las diversas categorías de factores ESG y encontramos que no todos contienen la misma calidad de información subyacente y, por lo tanto, pueden no tener el mismo impacto positivo deseado desde una perspectiva de inversión. Específicamente, varios puntajes de categoría se basan esencialmente en indicadores booleanos. Dada la elección metodológica de Refinitiv de asignar una puntuación negativa cuando las empresas no divulgan información de «sí» o «no», estas categorías sufren una alta proporción de puntuaciones igual a 0, lo que dificulta la diferenciación entre empresas. En consecuencia, una estrategia de inversión basada en la exclusión de empresas con puntuaciones de categoría bajas puede no ser implementable. Para otras categorías, la implementación de una estrategia de exclusión es factible y permite a los inversores mejorar sustancialmente la puntuación de su cartera después de la exclusión.
En segundo lugar, en cuanto a las características financieras de las carteras de selección, encontramos que no sufren un rendimiento ajustado al riesgo más bajo en comparación con un amplio índice de referencia bursátil. Sin embargo, el proceso de selección también da lugar a sesgos regionales y sectoriales significativos en relación con este punto de referencia. Tales sesgos pueden ser indeseables para los inversores que buscan mantener una cartera pasiva. Demostramos que un enfoque de primera clase que impone las mismas exposiciones regionales y sectoriales que el índice de referencia aumenta ligeramente la ganancia en la puntuación objetivo sin un impacto material en el rendimiento ajustado al riesgo y un aumento mínimo en el error de seguimiento de la cartera.
Además, cambiar el enfoque de las puntuaciones y calificaciones agregadas de los pilares ESG a características más granulares (en la medida en que puedan estar disponibles en los diversos proveedores de datos ESG) tiene tres ventajas no financieras clave. En primer lugar, centrarse en categorías específicas permitiría a los inversores superar la «confusión agregada» creada por las puntuaciones o calificaciones ESG consolidadas y centrarse directamente en los factores que son más relevantes para sus mandatos de inversión. Por ejemplo, un inversor que busque proteger el medio ambiente y los valores humanos universales podría centrarse en temas como la reducción de emisiones o los derechos humanos. En segundo lugar, centrarse en temas específicos les ayudaría a realizar un mejor seguimiento de la trayectoria de rendimiento de sostenibilidad de sus inversiones en relación con sus objetivos de inversión sostenible declarados. Esto también ayudaría a iniciar desinversiones o ponderar las inversiones dentro de la cartera cuando haya un desarrollo notable. Por último, con el tiempo, el enfoque en los temas también permitiría a los inversores desarrollar sus propios modelos de evaluación ESG utilizando datos reales y observados de proveedores externos, superando así las preocupaciones específicas del proveedor.