Изучение связи между признаками

Признаки и свойства животных находятся в определенной взаимосвязи. Например, существует связь между устойчивостью и восприимчивостью матерей и их дочерей к маститу, лейкозу и т. д., между фагоцитарной активностью и резистентностыо, уровнем кормления и молочной продуктивностью, длиной туло­вища и живой массой. Особенность корреляции (связи) между признаками живых организмов состоит в том, что каждому зна­чению одного признака соответствует не одно, а несколько зна­чений другого. Так, животные одинаковой высоты могут быть разными по массе, но в среднем масса низких животных меньше более высоких.

Различают положительную и отрицательную корреляции. При положительной корреляции с увеличением одного признака увеличивается и другой. Например, с увеличением массы коров-первотелок возрастает и удой; чем выше процент жира в молоке, тем выше и процент белка в нем. При отрица­тельной корреляции с увеличением одного признака вто­рой уменьшается. Например, с увеличением удоя у коров снижа­ется жирность молока; чем больше длина туловища у свиней, тем меньше толщина сала; куры с высокой яйценоскостью имеют более мелкие яйца и т. д.

Для оценки силы и направления взаимосвязи между призна­ками вычисляют коэффициент корреляции (г). Он колеблется от О до ±1. При положительной корреляции его величина может изменяться от 0 до +1, а при отрицательной — от 0 до — 1. Когда коэффициент корреляции равен нулю, то изменение одного при­знака происходит независимо от другого. Если коэффициент корреляции ниже 0,5, то связь считается слабой; при величине г, равной 0,5—0,6, — средней; если коэффициент 0,7 и выше, — связь высокая.

Вычисление коэффициента корреляции (г) для большой выборки (л > 30). Вычислим величину корреляции между количеством эритроцитов (млн в 1 мм3) и лейкоцитов (тыс. в 1 мм3) у 79 коров черно-пестрой породы. Для этого определяют классы для вариа­ционного ряда по количеству эритроцитов и отдельно по количе­ству лейкоцитов. Потом составляют корреляционную решетку (табл. 19) и записывают в ней вверху по горизонтали значения

классов по количеству эритроцитов (х) от минимального к макси­мальному, а по вертикали располагают классы по количеству лей­коцитов (у) от больших к меньшим. Заносят данные о 79 живот­ных в клетки корреляционной решетки с учетом одновременно значений двух признаков. Так, если в крови коровы содержится 6,6 млн эритроцитов и 7,4 тыс. лейкоцитов, то ее отмечают одной точкой в клетке на пересечении класса 6,5—6,9 по количеству эритроцитов и класса 7,0—7,9 по количеству лейкоцитов. Подсчи­тывают частоту вариант fx nfy. Выделяют жирными линиями клас­сы условной средней Ах (6,5—6,9) и Ау (7—7,9).

Коэффициент корреляции вычисляют по формуле

Сигмы берутся без классного промежутка:

В решетке образуется четыре квадранта. Определяют ряд ус­ловных отклонений ах и ау. Находят ряды произведений fxax> fyOy, fxOx,fyOy и их суммы. Вычисляют произведение fa^ay по каждому из четырех квадрантов [для этого частоту (/) каждой клеткилгмножают на соответствующее значение ах и ау\.

Ошибка коэффициента корреляции. Так как коэффициент корреляции вычислен не по генеральной, а по выборочной совокупности, он имеет ошибку выборочности:

Достоверность коэффициента корреляции. Когда известна ошибка, можно определить степень достоверности г. При этом исходят из нулевой гипотезы, т. е. предполагают, что в генеральной совокупности связь между изучаемыми признаками отсутствует. Только при значении tr, равном таб­личному значению или больше его (при вероятности 0,95; 0,99 или 0,999), нулевая гипотеза отвергается и значение г будет достоверным. В примере

С учетом числа степеней свободы v = п — 2 = 79 — 2 = 77, находим значения tst (см. табл. 13). Они равны: <Ьо5 = 1,96, /0,99 = 2,58 и /Ь,999 = 3,29. Так как наше значение tr = 0,73 мень­ше tgt= 1,96, то нулевая гипотеза не отвергнута и мы не можем сказать, что у исследованных коров существует слабая отрица­тельная корреляция между количеством эритроцитов и лейкоци­тов.

Вычисление коэффициента корреляции для малых выборок (л < 30). Существует несколько рабочих формул для вычис­ления г,

где

Вычислим коэффициент корреляции между относительным числом активных нейтрофилов у коров — матерей и дочерей (табл. 20). С помощью ЭВМ этим методом вычисляют г для любой по размеру совокупности. Нейтрофилы — одна из форм зернистых лейкоцитов, обладающих хорошо выраженной актив­ностью.

20. Определение г для малых выборок

Номер Нейтрофилы, %   * у2
коровы матери (х) дочери (у) ху X
  36 40      
  29 22      
  38 32      
  20 32      
  39 34      
  28 33      
  30 24      
  38 40      
  32 35      
  31 36      
           

Находим значение fa (см. табл. 13), которое с учетом числа степеней свободы v = n — 2=10 — 2 = 8 равно /о,95 = 2,31. В связи с тем что фактически полученный tr = 1,06 меньше значе­ния fa = 2,31, коэффициент корреляции недостоверен. Для того чтобы коэффициент корреляции г = 0,35 был достоверен (при р = 0,95), нужно было взять не менее 32 пар значений признака. Имеются специальные таблицы (Г. Лакин. Биометрия. М., 1990, с. 344), по которым можно узнать количество пар значений при­знака, достаточное для достоверности выборочного коэффициен­та корреляции.

В исследованиях, проведенных на больших выборках, уста­новлена положительная связь между относительным числом ак­тивных нейтрофилов у матерей и дочерей. Если удвоить коэффи­циент корреляции, вычисленный по какому-нибудь признаку между матерями и дочерями, то получим коэффициент наследуемости (й2 = 2гм/д), который указывает на долю генетической изменчивости в общей фенотипической изменчи­вости признака.

Коэффициент регрессии. Коэффициент корреляции указывает-только на степень связи между признаками. Иногда необходимо знать характер изменения одного признака в зависимости от изменения другого. Для этих целей используется регрессионный анализ. Коэффициент регрессии показывает, насколько изменяется один признак при изменении другого на единицу. Он вычисляется по формуле

Регрессия является двухсторонней, т. е. можно определить из­менение х по изменению у и изменение у по изменению х. В формуле среднее квадратическое отклонение берется с учетом классного промежутка. Например, коэффициент корреляции между удоем за первую (х) и вторую (у) лактации равен 0,6, ах = 700 кг, а^ = 900кг. Отсюда Ry/X = 0,6(900:700) = 0,77 кг. ^го значит, что с увеличением удоя по первой лактации на 1 кг удой по второй лактации увеличивается на 0,77 кг. Вычисляем Rx/y = 0,6(700:900) = 0,47 кг. В этом случае с увеличением удоя по второй лактации на 1 кг удой по первой лактации увеличивается на 0,47 кг. В одном хозяйстве удой первотелок равен хх = 4240 кг, а у коров за вторую лактацию ху = 4870 кг. Если мы отберем пер­вотелок с удоем, например, на 100 кг выше среднего — 4340 кг, то у этих коров по второй лактации при Ry/X = 0,77 удой составит 4870 + 0,77-100 = 4947 кг. Поэтому, зная коэффициент регрессии, можно определить величину одного признака при заданной вели­чине другого признака по уравнению прямолинейной регрессии:

где X— искомая величина признака х; У— заданная величина признака у; хх и ху — соответствующие средние арифметические признаков.

По этому уравнению можно, например, предсказать, какой удой будет у коров по второй лактации, если по первой он составлял 5000 кг: У= ху+Ry/x{X—xx) = 4870 + 0,77 (5000 — — 4340) = 4870 + 0,77 • 660 = 5378 кг. Следовательно, если у группы коров удой по первой лактации был 5000 кг, то по вто­рой лактации он составит 5378 кг.

Коэффициент корреляции между альтернативными признаками (/д). Для установления связи между альтернативными признака­ми строят четырехклеточную корреляционную решетку (табл. 21). Коэффициент корреляции вычисляют по формуле

где а, Ь, с, //—частоты, распределившиеся в четырех клетках корреляционной решетки.

21. Корреляция частоты заболеваемости лейкозом матерей и дочерей

Дочери (у) Матери (х) Всего
больные здоровые
Больные Здоровые Всего а = 46 с= 114 а + с = 160 6 = 70 rf = 391 Ь + d=46l а + Ь= 116 с + </ = 505 п= а+ Ь + с+ d= 621

Нужно определить коэффициент корреляции между частотой заболеваемости лейкозом коров — матерей и дочерей.

Ошибка коэффициента корреляции mr + l fel4.7 = 0,039.
i^- V621

Достоверность коэффициента корреляции tr= °^9 = 3,77.

Так как t = 3,77 больше табличного значения у = 3,29 (см. табл. 13), коэффициент корреляции высокодостоверен (р > 0,999).

Таким образом, можно сделать вывод, что между частотой заболеваемости лейкозом матерей-коров и их дочерей существует невысокая положительная связь, т. е. у больных матерей дочери чаще заболевают лейкозом, чем у здоровых.

Коэффициент регрессии вычисляют по формулам


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: