Признаки и свойства животных находятся в определенной взаимосвязи. Например, существует связь между устойчивостью и восприимчивостью матерей и их дочерей к маститу, лейкозу и т. д., между фагоцитарной активностью и резистентностыо, уровнем кормления и молочной продуктивностью, длиной туловища и живой массой. Особенность корреляции (связи) между признаками живых организмов состоит в том, что каждому значению одного признака соответствует не одно, а несколько значений другого. Так, животные одинаковой высоты могут быть разными по массе, но в среднем масса низких животных меньше более высоких.
Различают положительную и отрицательную корреляции. При положительной корреляции с увеличением одного признака увеличивается и другой. Например, с увеличением массы коров-первотелок возрастает и удой; чем выше процент жира в молоке, тем выше и процент белка в нем. При отрицательной корреляции с увеличением одного признака второй уменьшается. Например, с увеличением удоя у коров снижается жирность молока; чем больше длина туловища у свиней, тем меньше толщина сала; куры с высокой яйценоскостью имеют более мелкие яйца и т. д.
Для оценки силы и направления взаимосвязи между признаками вычисляют коэффициент корреляции (г). Он колеблется от О до ±1. При положительной корреляции его величина может изменяться от 0 до +1, а при отрицательной — от 0 до — 1. Когда коэффициент корреляции равен нулю, то изменение одного признака происходит независимо от другого. Если коэффициент корреляции ниже 0,5, то связь считается слабой; при величине г, равной 0,5—0,6, — средней; если коэффициент 0,7 и выше, — связь высокая.
Вычисление коэффициента корреляции (г) для большой выборки (л > 30). Вычислим величину корреляции между количеством эритроцитов (млн в 1 мм3) и лейкоцитов (тыс. в 1 мм3) у 79 коров черно-пестрой породы. Для этого определяют классы для вариационного ряда по количеству эритроцитов и отдельно по количеству лейкоцитов. Потом составляют корреляционную решетку (табл. 19) и записывают в ней вверху по горизонтали значения
классов по количеству эритроцитов (х) от минимального к максимальному, а по вертикали располагают классы по количеству лейкоцитов (у) от больших к меньшим. Заносят данные о 79 животных в клетки корреляционной решетки с учетом одновременно значений двух признаков. Так, если в крови коровы содержится 6,6 млн эритроцитов и 7,4 тыс. лейкоцитов, то ее отмечают одной точкой в клетке на пересечении класса 6,5—6,9 по количеству эритроцитов и класса 7,0—7,9 по количеству лейкоцитов. Подсчитывают частоту вариант fx nfy. Выделяют жирными линиями классы условной средней Ах (6,5—6,9) и Ау (7—7,9).
Коэффициент корреляции вычисляют по формуле
Сигмы берутся без классного промежутка:
В решетке образуется четыре квадранта. Определяют ряд условных отклонений ах и ау. Находят ряды произведений fxax> fyOy, fxOx,fyOy и их суммы. Вычисляют произведение fa^ay по каждому из четырех квадрантов [для этого частоту (/) каждой клеткилгмножают на соответствующее значение ах и ау\.
Ошибка коэффициента корреляции. Так как коэффициент корреляции вычислен не по генеральной, а по выборочной совокупности, он имеет ошибку выборочности:
Достоверность коэффициента корреляции. Когда известна ошибка, можно определить степень достоверности г. При этом исходят из нулевой гипотезы, т. е. предполагают, что в генеральной совокупности связь между изучаемыми признаками отсутствует. Только при значении tr, равном табличному значению или больше его (при вероятности 0,95; 0,99 или 0,999), нулевая гипотеза отвергается и значение г будет достоверным. В примере
С учетом числа степеней свободы v = п — 2 = 79 — 2 = 77, находим значения tst (см. табл. 13). Они равны: <Ьо5 = 1,96, /0,99 = 2,58 и /Ь,999 = 3,29. Так как наше значение tr = 0,73 меньше tgt= 1,96, то нулевая гипотеза не отвергнута и мы не можем сказать, что у исследованных коров существует слабая отрицательная корреляция между количеством эритроцитов и лейкоцитов.
Вычисление коэффициента корреляции для малых выборок (л < 30). Существует несколько рабочих формул для вычисления г,
где
Вычислим коэффициент корреляции между относительным числом активных нейтрофилов у коров — матерей и дочерей (табл. 20). С помощью ЭВМ этим методом вычисляют г для любой по размеру совокупности. Нейтрофилы — одна из форм зернистых лейкоцитов, обладающих хорошо выраженной активностью.
20. Определение г для малых выборок
Номер | Нейтрофилы, % | * | у2 | ||
коровы | матери (х) | дочери (у) | ху | X | |
36 40 | |||||
29 22 | |||||
38 32 | |||||
20 32 | |||||
39 34 | |||||
28 33 | |||||
30 24 | |||||
38 40 | |||||
32 35 | |||||
31 36 | |||||
Находим значение fa (см. табл. 13), которое с учетом числа степеней свободы v = n — 2=10 — 2 = 8 равно /о,95 = 2,31. В связи с тем что фактически полученный tr = 1,06 меньше значения fa = 2,31, коэффициент корреляции недостоверен. Для того чтобы коэффициент корреляции г = 0,35 был достоверен (при р = 0,95), нужно было взять не менее 32 пар значений признака. Имеются специальные таблицы (Г. Лакин. Биометрия. М., 1990, с. 344), по которым можно узнать количество пар значений признака, достаточное для достоверности выборочного коэффициента корреляции.
В исследованиях, проведенных на больших выборках, установлена положительная связь между относительным числом активных нейтрофилов у матерей и дочерей. Если удвоить коэффициент корреляции, вычисленный по какому-нибудь признаку между матерями и дочерями, то получим коэффициент наследуемости (й2 = 2гм/д), который указывает на долю генетической изменчивости в общей фенотипической изменчивости признака.
Коэффициент регрессии. Коэффициент корреляции указывает-только на степень связи между признаками. Иногда необходимо знать характер изменения одного признака в зависимости от изменения другого. Для этих целей используется регрессионный анализ. Коэффициент регрессии показывает, насколько изменяется один признак при изменении другого на единицу. Он вычисляется по формуле
Регрессия является двухсторонней, т. е. можно определить изменение х по изменению у и изменение у по изменению х. В формуле среднее квадратическое отклонение берется с учетом классного промежутка. Например, коэффициент корреляции между удоем за первую (х) и вторую (у) лактации равен 0,6, ах = 700 кг, а^ = 900кг. Отсюда Ry/X = 0,6(900:700) = 0,77 кг. ^го значит, что с увеличением удоя по первой лактации на 1 кг удой по второй лактации увеличивается на 0,77 кг. Вычисляем Rx/y = 0,6(700:900) = 0,47 кг. В этом случае с увеличением удоя по второй лактации на 1 кг удой по первой лактации увеличивается на 0,47 кг. В одном хозяйстве удой первотелок равен хх = 4240 кг, а у коров за вторую лактацию ху = 4870 кг. Если мы отберем первотелок с удоем, например, на 100 кг выше среднего — 4340 кг, то у этих коров по второй лактации при Ry/X = 0,77 удой составит 4870 + 0,77-100 = 4947 кг. Поэтому, зная коэффициент регрессии, можно определить величину одного признака при заданной величине другого признака по уравнению прямолинейной регрессии:
где X— искомая величина признака х; У— заданная величина признака у; хх и ху — соответствующие средние арифметические признаков.
По этому уравнению можно, например, предсказать, какой удой будет у коров по второй лактации, если по первой он составлял 5000 кг: У= ху+Ry/x{X—xx) = 4870 + 0,77 (5000 — — 4340) = 4870 + 0,77 • 660 = 5378 кг. Следовательно, если у группы коров удой по первой лактации был 5000 кг, то по второй лактации он составит 5378 кг.
Коэффициент корреляции между альтернативными признаками (/д). Для установления связи между альтернативными признаками строят четырехклеточную корреляционную решетку (табл. 21). Коэффициент корреляции вычисляют по формуле
где а, Ь, с, //—частоты, распределившиеся в четырех клетках корреляционной решетки.
21. Корреляция частоты заболеваемости лейкозом матерей и дочерей
Дочери (у) | Матери | (х) | Всего |
больные | здоровые | ||
Больные Здоровые Всего | а = 46 с= 114 а + с = 160 | 6 = 70 rf = 391 Ь + d=46l | а + Ь= 116 с + </ = 505 п= а+ Ь + с+ d= 621 |
Нужно определить коэффициент корреляции между частотой заболеваемости лейкозом коров — матерей и дочерей.
Ошибка коэффициента корреляции mr + l fel4.7 = 0,039.
i^- V621
Достоверность коэффициента корреляции tr= °^9 = 3,77.
Так как t = 3,77 больше табличного значения у = 3,29 (см. табл. 13), коэффициент корреляции высокодостоверен (р > 0,999).
Таким образом, можно сделать вывод, что между частотой заболеваемости лейкозом матерей-коров и их дочерей существует невысокая положительная связь, т. е. у больных матерей дочери чаще заболевают лейкозом, чем у здоровых.
Коэффициент регрессии вычисляют по формулам