Introducción
Legarra y Reverter (2018) propusieron el método denominado Regresión Lineal (LR) como alternativa a las técnicas clásicas de validación cruzada para evaluar el desempeño de los modelos de evaluación genética. Los modelos de evaluación y el método LR asumen genealogías correctas y completas para garantizar la conexión entre rodeos. Sin embargo, en programas de evaluación genética de ganado de carne la falta de precisión de los registros genealógicos puede causar desconexión entre los rodeos y, en consecuencia, sesgos en las predicciones de mérito genético. No está claro si el método LR puede evidenciar el efecto indeseable de esta falta de conexión entre rodeos. Por lo tanto, el objetivo fue validar el desempeño del método LR en términos del nivel de conexión entre rodeos en una población simulada de la raza Brangus.
Materiales y Métodos
La simulación, que realizamos con AlphaSimR (Gaynor et. al., 2021), constó de dos etapas: A) creación de una población histórica imitando una raza compuesta y B) seis generaciones superpuestas de selección sobre esta raza. En la etapa A, se simularon por coalescencia haplotipos fundadores de las subespecies B. taurus y B. indicus, que a continuación se cruzaron durante cuatro generaciones para generar la raza compuesta. Los haplotipos de la raza compuesta se asignaron a fundadores del pedigree real de la población Brangus argentina para generar un proceso de gene-dropping sobre los descendientes. En la etapa B, distribuimos 4.000 vacas y 300 toros del último año del pedigree real en tres grupos denominados “regiones” (de acuerdo a los terciles del valor de cría simulado; VCV) y los sometimos a seis años de selección basada en el valor de cría estimado (VCE).
Exploramos dos escenarios de conexión entre regiones: alta (AC) y baja (BC). En ambos escenarios reemplazamos el 60% de los machos y el 40% de las hembras cada año. Para AC no existió restricción en la migración de los machos entre regiones mientras que para BC los machos se seleccionaron y utilizaron dentro de región. Los fenotipos simulados representaron un carácter de h2 = 0.4, e incluyeron una media general, el VCV, un efecto constante de región y un residual. Los VCE se obtuvieron mediante un modelo de evaluación que incluía el efecto fijo del grupo de contemporáneos (GC: año × región) y el aleatorio del animal.
Por último, evaluamos las métricas de sesgo y dispersión del método LR comparando los VCE de machos con solo fenotipo propio y aquellos machos en la siguiente evaluación, donde contaban con fenotipo de la progenie. Las comparaciones las realizamos dentro de cada región obteniendo tres estimaciones por cada métrica.
Resultados y Discusión
En general, se observaron diferencias en la magnitud del sesgo verdadero entre regiones (Tabla 1), que se explican tanto por los efectos de la región (“ambiental”) como por los niveles genéticos que fueron inicialmente simulados en cada una de ellas. Las regiones con niveles genéticos y ambientales inicialmente más extremos (R1 y R3) presentaron los sesgos más fuertes en BC (-0,84 y 1,43 desviaciones estándares genéticas, respectivamente). En el escenario AC, el efecto GC pudo capturar mejor las diferencias debido a las regiones. Mientras que para BC, aún con GCs grandes, hubo una fuerte sub- y sobre-estimación del VC de los toros debido a la falta de conexiones.
El método LR no estimó correctamente la magnitud y dirección del sesgo verdadero para BC. En cambio, cuando la conexión fue fuerte (AC), 𝛥̂𝑝 pudo indicar el sesgo en la dirección correcta (r > 0,55), aunque la magnitud fue ligeramente sub-estimada para las R2 y R3. Es importante destacar que en AC la magnitud del sesgo real fue menor que en BC. Por su parte, no se observaron diferencias sustanciales en los estimadores de la dispersión, ni entre las regiones ni entre los niveles de conexión. Además, todas las estimaciones de dispersión para BC y AC estuvieron cercanas a 1 (Tabla 1), lo que indica que no hubo ni sobre- ni sub-dispersión.
Tabla 1: Comparación de la media (DE: desvío estándar) y la correlación (r) entre el sesgo estimado (𝛥̂𝑝) y el verdadero, y entre la dispersión estimada (𝑏̂𝑤,𝑝) y la verdadera para niveles de conexión baja (BC) y alta (AC), en las regiones (R: 1, 2 o 3).
Conclusiones
El método LR no fue capaz de revelar casos de severa desconexión en las evaluaciones genéticas a través del sesgo. En cambio, representa una herramienta útil para estimar y evaluar la dispersión.