Gauss, la campana disonante en la evaluación del desempeño

Como parte de la evaluación del desempeño se utiliza de manera cotidiana la campana de Gauss en muchas empresas. En el proceso, los jefes directos elaboran un ranking forzado de los miembros de su equipo teniendo en cuenta la distribución normal que representa esta curva. De esta manera, Recursos Humanos trata de recibir una foto nítida de quiénes sobresalen de la media y quiénes quedan por debajo en cada uno de los equipos. Así, tras la aplicación de la campana de Gauss en cada equipo de trabajo tendríamos un 68% de miembros que tienen un desempeño medio, un 18% por debajo de la media de desempeño y un 18% con un desempeño superior.

campanadegauss

Esta técnica no deja de chirriar y traer de cabeza a muchos jefes. Sobre todo a aquellos que tienen una base de conocimientos sobre estadística y están familiarizados con el teorema del límite central. En este teorema se señala que hace falta un número de variables lo suficientemente grande como para que haya “de manera natural” una distribución normal. Es decir, la Campana de Gauss se hace inaplicable cuando contamos con equipos de trabajo pequeños (la inmensa mayoría cuenta con menos de 10 miembros). La curva de distribución en la mayoría de estos casos adoptaría cualquier forma, menos la normalizada.

Por tanto, estadísticamente hablando,  es incorrecto hablar de la aplicación de la Campana de Gauss o del ranking forzado (forced ranking en inglés) en la evaluación del desempeño si lo estamos haciendo en equipos pequeños.

Independientemente ya de si estadísticamente es correcto o no, una investigación, liderada por Steve Scullen de la Drake University señalan que al aplicar esta herramienta por primera vez en una empresa, se incrementa la productividad en un 16% el primer año. Pero se vuelve ineficaz, al cabo de su aplicación durante dos años consecutivos,  puesto que ya se ha mejorado el desempeño global de todos los empleados (vía una mayor orientación a resultados, vía despidos) y resulta costoso y casi imposible, encontrar empleados que queden por debajo de la media y al mismo tiempo obtengan un bajo desempeño en valores absolutos.

A parte de los quebraderos de cabeza que genera en los jefes directos aplicar el ranking forzado, tiene otra serie de efectos negativos en el equipo:

–          Fractura el espíritu de equipo y mina la cultura colaborativa. ¿Cómo voy a facilitar a mis compañeros que obtengan buenos resultados si al final del año nos van a “poner en fila” y ajusticiarnos comparándonos los unos con los otros?

–          Penaliza la innovación y la asunción de riesgos. Mejor seguir haciendo lo que ya sabemos bien, que aventurarnos a fracasar y ser los últimos en la fila del ranking.

–          Desmotiva enormemente y atenta contra el compromiso de quienes habiendo obtenidos buenos e incluso excelentes resultados se ven desplazados en la curva a categorías inferiores simplemente por garantizar la armonía de la curvatura normalizada.

Entiendo y comparto la finalidad de esta herramienta, identificar altos y bajos desempeños en la compañía para poderlo gestionar de manera apropiada y crear un estímulo para mejorar el desempeño individual.  Pero, la validez del método, como vemos, deja algunas y serias lagunas que resolver. ¿Qué alternativas podríamos utilizar para evaluar de manera equitativa el desempeño tanto a nivel individual como de conjunto? ¿Alguna sugerencia?

11 thoughts on “Gauss, la campana disonante en la evaluación del desempeño

  1. Bueno, respecto al problema con la distribución de probabilidad y su convergencia hay una opción: usar una distribución binomial.

    Como todas las distribuciones de probabilidad ésta permite calcular la esperanza, la probabilidad de que un suceso esté más o menos disperso frente a ésa esperanza, etc… O sea, los cálculos que se mencionan respecto a la distribución normal.

    Pero tiene una diferencia fundamental: es una distribución discreta. Que parece más adecuada para evaluar probabilidades que han de ser medidas sobre grupos pequeños e individuos.

    Por otra parte, intuitivamente, la distribución normal es la “distribución normal en versión discreta” Puesto que a la larga converge a una normal, pero eso no evita que los cálculos sean correctos al ser aplicados a grupos pequeños.

    Otra cuestión, quizá más interesante, es determinar si el cálculo de probabilidades es aplicable a éste problema. Porque a fin de cuentas, el desempeño profesional no parece un proceso aleatorio.

    En mi opinión, esa es la conclusión que refleja el informe mencionado en el texto. Ya que, al cabo de un año los resultados se ven fuertemente influenciados por el proceso de medición.

    ¿No sería más adecuado evaluar a los miembros del equipo en la medida en que consigan cumplir objetivos?

    Ese punto de vista tiene su propio problema: los objetivos tienen que estar bien definidos. O sea, toda la responsabilidad recae en quién defina los objetivos: el jefe del equipo.

    ¡Pero es que ser un buen jefe es muy difícil!

  2. He “sufrido” la aplicación de campana de Gauss desde RRHH durante muchos años y comparto absolutamente todas las ideas y datos con que se inicia el debate.
    Mi sugerencia es que la organización haga con una periodicdad un ejercicio, basado en los parámetros que considere oportunos, de situar a los empleados en un marco de referencia, puede ser la campana u otro y puede contemplar más elementos y no solo el desempeño y debe hacerse en grupos numerosos, por razones de rigor de la técnica y por diluir los efectos negativos sobre la autoestima de las personas.
    Una herramienta más ligada a temas como potencial general de la organización, a saber quién es quién en la organización, a cómo sitúo a mi equipo, etc. Se pueden crear diferentes enfoques con la finalidad de hacer con los managers un alto en el camino y con la seguridad de que ese ejercicio les va a ayudar a “resituarse” en relación con las evaluaciones individuales de los próximos periodos, con menos reparos que cuado se aplica la campana directamente sobre el desempeño de cada año.
    Me he responsabilizado del proceso de Evaluación de Desempeño durante años en diferentes organizaciones y he podido ver la enorme frustración, decepción y desencanto que ha supuesto para algunos empleados ser evaluados por debajo de la “media”, hay personas que lo viven de forma demoledora. No se puede reducir a una estadística elementos que subyacen al desempeño de todo un años como el esfuerzo, la motivación, los medios proporcionados, etc.

  3. La verdad es que tengo sentimientos encontrados con respecto a la aplicación de la curva…. por una parte me revienta el tener que limitar a un número concreto el desempeño de las personas…. (aunque tengas un equipo brillante tienes que plantear que alguien es “menos brillante” y penalizarlo…) no me gustan estas limitaciones, pero si es cierto que tampoco me gusta el café para todos y si no se plantea una herramienta que permita diferenciar los desempeños, premiando a los que han superado las expectativas, igual podemos caer en sistemas que no reconocen los méritos…. el caso que como tu bien sabes Rocío ocurre en las Administraciones Públicas.
    Creo que además la herramienta es un tanto injusta por lo subjetiva que puede llegar a ser en las manos de quién la maneja, yo he participado en macro procesos de evaluación y no he sentido más vergüenza en toda mi vida.

  4. En mi opinión, lo que hay que hacer es medir objetivos cumplidos y saber qué conductas llevan a su consecución y cuales no, para mejorarlas, nunca para castigarlas (salvo que haya premeditación y alevosía). Claro, eso conlleva un esfuerzo de formación, planificación y ejecución por parte de jefes y supervisores, pero es que para eso tiene mayor salario y responsabilidad. Los modelos de vigilar y controlar para castigar no solo ya no funcionan, sino que son contraproducentes.

    Saludos!

  5. Muy interesante la entrada y, desde luego, coincido contigo. Respecto a tu pregunta, la herramienta con la que he trabajado para diferentes compañías y que la siguen utilizando por su utilidad es con la evaluación de competencias o assessments, que indican tanto a nivel individual como a nivel colectivo, planes de acción y desarrollo.

  6. Como casi siempre, el problema no es la herramienta, sino cómo se usa. Lo que comentas en el post es cierto, como también lo es que el “café para todos” desmotiva tanto o más. Al final hay un hecho evidente y es que la contribución, generalmente ligada al grado de compromiso, es desigual y, por lógica, el reconocimiento debe tener este hecho en cuenta. El problema, como digo, no es la herramienta, sino la mediocridad de muchos managers que intentan justificar su falta de liderazgo tras esta u otras herramientas. Al final, si realmente se quiere desarrollar una cultura de alto rendimiento, hay que explicar a las personas qué comportamientos se traducen en resultados y qué comportamientos hay que eliminar. Y esto, si se hace con datos, mejor que si se hace de forma subjetiva.

  7. La evaluación, en general, es una cuestion que me interesa, tanto la evaluación de los profesionales como la de los alumnos, la de los opositores,…. entiendo que la herramienta sí es en ocasiones el problema aunque detrás haya interés y buen hacer. Según lo que busques y cómo lo busques encontrarás unas u otras cosas, y a su vez, potenciarás determinadas actitudes (como el individualismo o por contra la cooperación) o determinados procedimientos.

  8. La campana de Gauss y su utilización desmotiva a responsables de equipos humanos, sobre todo quien tienen que evaluar el desempeño de sus colaboradores ( si como dice el artículo sobre todo son pocos a nivel numérico). Hay empresas destacadas que incluso aplican esta tarea metodológicamente año tras año, obligando poner una A B o C a los empleados…
    Desmotiva mucho al responsable del equipo que ha visto crecer sus colaboradores y no ve justa esta clasificación, que además ha de ” cumplir” unos determinados porcentajes…
    Como a menudo, los indicadores esperados importan más que la correcta evaluación.

  9. El problema del todo uso de la campana (mal llamada de Gaus porque no fue ese su descubridor) es que la gente la utiliza sin una mas mínima formación en estadística descriptiva. Por ejemplo, con un grupo pequeño de trabajo se puede calcular como población en un diseño cuasi experimental con una distribución asimétrica – creo que es matemáticamente lo mejor- o como una muestra pequeña suponiendo una distribución BINOMIAL, el cual es un ejercicio de primer año de la universidad. El teorema central del límite es aún mas complicado, El límite de la función que representa la distribución de la probabilidad en una distribución BINOMIAL tiende cuando n tiende a un número finito mayor a 30 a dar una distribución en una matriz de datos tendiente a una distribución normal, es decir una distribución de una variable discreta se hace simétrica y parecida a una contínua. El dilema es que si seguimos con el razonamiento del teorema, el límite cuando n tiende a infinito se asemeja a una distribución de Poisson la cual es asimétrica negativa. Quiere decir esto que el valor que toman todos no es el promedio desde la matemática y que el promedio es mas bajo que el valor que toma la mayoría siendo este valor el mas significativo desde el peso de las probabilidades.
    Si desde lo metodológico vi como se mensura mediante técnicas que carecen de validez estadística y de confiabilidad lo cual es aún mas arbitrario que utilizar un método incorrecto.

  10. Muy interesantes todos los comentarios y enriquecedores. Yo le que he hecho y creo es que el utilizar esta metodología estadística sirve además de que casi exclusivamente para grupos grandes de más de 10 personas (es decir registros), para de alguna forma validar (entre otros) cómo se hizo el proceso de evaluación, pues en relativa lógica debería de resultar en una curva normal, si no es así, habría que platicar con el jefe del área o grupo, para saber que sucede. Probablemente se manipulo por alguna razón, hubo errores de captura, no se tuvo la capacitación adecuada, etc. Es decir la herramienta es básicamente de análisis para validar el proceso, no para gestionar después de la valuación a las personas y su trabajo, pues esto como mencionan puede ser incorrecto e injusto. Además, habría que generar una curva general de la organización, para analizar la tendencia global. Recordemos que finalmente la evaluación del desempeño es un proceso de mejora continua y siendo así, la estadística de los resultados es importante, sin embargo lo más valioso para la mejora es el proceso de retroalimentación al colaborador, que sea efectivo realmente, así como el seguimiento de los planes de trabajo. Saludos.

  11. Creí que este tema de la campana de Gauss estaba ya superado…
    Hay un estudio de hace algún tiempo que tira por tierra esta distribución del desempeño y propone un modelo “de Cola Larga”.

Responder a Elena nNvarro Cancelar respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s