A study of HSTN gene polymorphism in Ayrshire cattle: selection prospects
A study of HSTN gene polymorphism in Ayrshire cattle: selection prospects
Abstract
This research analyses polymorphisms in the Histatherin (HSTN) gene in Ayrshire cattle. This gene encodes a protein with antimicrobial properties that plays a key role in protecting milk from pathogens and maintaining calves’ immunity during the lactation period. The study examined three mutations in the HSTN gene (g.85459517T>C, g.85470344T>G and g.85458545A>T) that have a potential influence on milk composition and properties. To identify genetic variations, the restriction fragment length polymorphism (PCR-RFLP) method was used, which allowed the frequencies of genotypes and alleles to be determined, as well as the sample’s compliance with Hardy-Weinberg equilibrium.
The results of the analysis showed a predominance of heterozygous genotypes (GT, AT and TC), indicating a high level of genetic diversity within the Ayrshire population. Allele frequencies for the three mutations ranged from 0.575 to 0.625, while statistical analysis (chi-square) confirmed the absence of significant deviations from Hardy-Weinberg equilibrium. This indicates the stability of the population in terms of genetic composition. Furthermore, the high expected heterozygosity (47–49%) may indicate potential adaptive advantages associated with this genome, which is of significance for breeding programmes.
The obtained results confirm the importance of the HSTN gene in determining milk yield and resistance to pathogens in the Ayrshire breed, which opens up prospects for further genetic research and the improvement of selection programs.
1. Введение
Генетическое разнообразие сельскохозяйственных животных имеет первостепенное значение для повышения продуктивности и устойчивости к внешним факторам. Айрширская порода крупного рогатого скота, характеризующаяся высокими показателями молочной продуктивности и адаптивностью, заслуживает особого внимания как объект селекционных исследований. Изучение генов, связанных с составом и свойствами молока, открывает новые возможности для оптимизации селекционных программ и повышения качества молочной продукции
, .Одним из таких генов является гистатерин (HSTN), который кодирует белок с антимикробными свойствами. Этот белок играет важную роль в защите молока от патогенов, а также в поддержании здоровья телят в период лактации. Ген HSTN расположен на 6-й хромосоме крупного рогатого скота
, . Уникальность этого гена заключается в его химерной природе, так как он сформировался вследствие объединения последовательностей генов гистатина (HST) и статерина (STN), что подчеркивает его значимую роль в адаптации и эволюции жвачных животных .Антимикробные свойства гена HSTN представляют особый интерес в связи с тем, что белок гистатерин демонстрирует активность против широкого спектра патогенов, включая Staphylococcus aureus, Escherichia coli и Candida, что обеспечивает естественную защиту организма. Предполагается, что механизм действия белка основан на разрушении мембран патогенов и ингибировании их ключевых биохимических процессов. Благодаря этим свойствам гистатерин рассматривается как перспективный фактор для улучшения устойчивости к инфекциям и повышения общего уровня здоровья у крупного рогатого скота
.Белок гистатерин участвует не только в иммунной защите, но и в ряде биохимических процессов, таких как транспорт гидрофобных веществ и регуляция активности ферментов
. Более того, исследования показали, что экспрессия гена HSTN тесно связана с процессами лактации, что делает его перспективным маркером для оценки качества молока , . Полиморфизм этого гена имеет особое значение, поскольку различные его варианты могут быть связаны с различными характеристиками молока, такими как жирность, содержание белка и способность к коагуляции .Методы анализа генетического полиморфизма, такие как полиморфизм длин рестрикционных фрагментов (PCR-RFLP), широко используются для изучения генов молочных белков. Этот подход позволяет выявить изменения в последовательности нуклеотидов ДНК, которые могут служить маркерами для генетической оценки и улучшения продуктивных качеств животных
, .Айрширская порода, несмотря на свои высокие продуктивные показатели, остается менее изученной с точки зрения генетической структуры по сравнению с голштинской породой. Изучение полиморфизма гена HSTN у айрширской породы может дать новое представление о формировании признака молочной продуктивности и устойчивости к патогенам животных этой породы
.В практике молочного скотоводства широко используются генетические маркеры, отражающие вариации в составе и технологических свойствах молока. Наиболее изучены локусы белков молока и отдельных ферментов липидного обмена, что позволило включить их в современные селекционные подходы. На этом фоне HSTN представляет интерес как лакто-специфичный ген, локализованный в пределах казеинового кластера и потенциально связанный как с качеством молока, так и с компонентами врождённого иммунитета. Оценка полиморфизма HSTN в породной группе с высокой племенной ценностью является логичным шагом к уточнению его селекционной значимости и возможного включения в маркерные панели.
Целью данного исследования является анализ полиморфизма гена гистатерина (HSTN) у айрширской породы крупного рогатого скота.
2. Методы и принципы исследования
Исследование проводилось на маточном поголовье айрширской породы крупного рогатого скота, включающем 100 голов, принадлежащих племзаводу СХПК «Племзавод Майский». Породная принадлежность животных подтверждалась на основании зоотехнической документации. Объектом исследования являлись три мутации гена Histatherin (HSTN): g.85459517T>C, g.85470344T>G и g.85458545A>T, согласно последовательности NCBI (NC_037333.1). Лабораторные работы проводились в лаборатории ДНК-технологий ФГБНУ ВНИИплем. Для анализа вариабельности гена HSTN использовался метод полиморфизма длин рестрикционных фрагментов (ПЦР-ПДРФ), который сочетает амплификацию и рестрикцию ДНК.
Амплификация целевых участков генома проводилась с использованием праймеров, специально разработанных в программе SnapGene. Последовательности праймеров были следующими:
Таблица 1 - Последовательность праймеров
g.85459517T>C | g.85470344T>G | g.85458545A>T |
F: 5'-TGATAGAGATGGATTCGAT-3' | F: 5'-ATTTGTGAGTGGTTGGCTAT-3' | 5'-TTAGACCTGAAGAGCGAAGA-3' |
R: 5'-GCCAATATGGAAAAAAAC-3' | R: 5'-GTCTACTCCGTGCTCTGTGA-3' | 5'-GTAGATGTTGATTTGGGTTTTC-3' |
Смесь для ПЦР-амплификации включала следующие компоненты: 10× буфер (pH 8,3) — 2,5 мкл; dNTP (концентрация 2 мМ) — 0,2 мкл; прямой праймер (F) — 0,3 мкл; обратный праймер (R) — 0,2 мкл; Taq-полимераза — 0,5 мкл; матричная ДНК (20–50 нг/мкл) — 0,8 мкл; бидистиллированная вода — до общего объема 25 мкл. ПЦР проводилась по следующей программе: начальная денатурация при 94 °C в течение 5 минут, 34 цикла (денатурация при 94 °C в течение 30 секунд, отжиг при n °C в течение 30 секунд, элонгация при 72 °C в течение 30 секунд), и заключительное удлинение при 72 °C в течение 5 минут. Температура отжига варьировалась в зависимости от мутации: 57 °C для g.85459517T>C, 56 °C для g.85470344T>G, 54 °C для g.85458545A>T.
Для рестрикционного анализа амплифицированных фрагментов использовались следующие эндонуклеазы: MfeI для мутации g.85459517T>C, TaqI для g.85470344T>G и EcoRI для g.85458545A>T. Эффективность рестрикции проверялась с использованием программных инструментов NEBcutter 3.0 и RestrictionMapper 3.0. Амплифицированные продукты подвергались электрофорезу в 3% агарозном геле, окрашенном бромистым этидием. Результаты визуализировались под УФ-светом, а компьютерный анализ подтверждал специфичность рестрикции.
Статистическая обработка данных проводилась с использованием программного обеспечения PopGene32, что позволило определить частоты генотипов и аллелей, ожидаемую гетерозиготность и соответствие равновесию Харди-Вайнберга (через критерий хи-квадрат). Дополнительно применялись методы дескриптивной статистики и графические визуализации для интерпретации результатов.
Дополнительно к проверке соответствия равновесию Харди-Вайнберга рассчитывались: ожидаемая гетерозиготность He (для двухаллельных SNP равна 2pq), наблюдаемая гетерозиготность Ho как доля гетерозиготных особей, эффективное число аллелей Ne = 1 / Σ(pi²), информативность полиморфизма PIC по Botstein (для двухаллельных SNP PIC = 2pq(1 - pq), величина коррелирует с He, но численно ниже), а также коэффициент инбридинга FIS = (He - Ho) / He. Расчёты выполнялись на основе эмпирических частот аллелей и генотипов.
3. Основные результаты
В исследовании полиморфизма гена HSTN (Histatherin) у коров айрширской породы проанализированы три позиции: g.85470344T>G, g.85458545A>T и g.85459517T>C. Для каждого локуса рассчитаны наблюдаемые частоты генотипов, частоты аллелей, ожидаемые по равновесию Харди-Вайнберга распределения, ожидаемая гетерозиготность и значения критерия χ².
По локусу g.85470344T>G частоты генотипов GG, GT и TT составили 39%, 45% и 16% соответственно, что согласуется с преобладанием аллеля G (G = 0,615; T = 0,385). Ожидаемые по HWE частоты (GG — 39%, GT — 47%, TT — 14%) практически совпадают с наблюдаемыми. Значение χ² равно 0,247, статистически значимых отклонений от равновесия не выявлено (p > 0,05). Ожидаемая гетерозиготность составляет 0,47; наибольшая доля приходится на генотип GT.
По локусу g.85458545A>T частоты генотипов AA, AT и TT равны 38%, 49% и 13% соответственно; частоты аллелей составляют A = 0,625 и T = 0,375. Ожидаемые частоты (AA - 38%, AT — 47%, TT — 14%) соответствуют наблюдаемым. Значение χ² равно 0,206, что также не указывает на отклонения от HWE (p > 0,05). Ожидаемая гетерозиготность равна 0,47; максимальная доля - у гетерозигот AT.
По локусу g.85459517T>C наблюдаются частоты генотипов TT, CT и CC 18%, 49% и 33% соответственно; частоты аллелей T = 0,425 и C = 0,575. Ожидаемые по HWE частоты (TT — 18%, CT — 49%, CC — 33%) полностью согласуются с наблюдаемыми. Значение χ² минимально и составляет 0,001 (p > 0,05). Ожидаемая гетерозиготность равна 0,49; наибольшая доля — у генотипа CT.
В совокупности по всем трём локусам отмечается близкое совпадение наблюдаемых и ожидаемых распределений, невысокие значения χ² (0,001-0,247) и сравнительно высокие оценки ожидаемой гетерозиготности (0,47–0,49), что свидетельствует о сохранении генетического разнообразия в исследуемой выборке айрширского поголовья.
Таблица 2 - Частота встречаемости аллелей и генотипов гена гистатерин у коров айрширской породы
Частота Генотипа | ||||||||
g.85470344T>G | g.85458545A>T | g.85459517T>C | ||||||
GG | 39 | 0,39 | AA | 38 | 0,38 | TT | 18 | 0,18 |
TG | 45 | 0,45 | TA | 49 | 0,49 | TC | 49 | 0,49 |
TT | 16 | 0,16 | TT | 13 | 0,13 | CC | 33 | 0,33 |
Частота аллеля | ||||||||
G | 0,615 | A | 0,625 | T | 0,425 | |||
T | 0,385 | T | 0,375 | C | 0,575 | |||
He | 0,47 | He | 0,47 | He | 0,49 | |||
x2 | 0,247 | x2 | 0,206 | x2 | 0,001 | |||
На основании эмпирических частот аллелей и генотипов получены дополнительные характеристики. Для g.85470344T>G (G = 0,615; T = 0,385) рассчитаны: Ne = 1,8995; He = 0,4736; Ho = 0,4500; PIC = 0,3614; FIS = 0,0497. Для g.85458545A>T (A = 0,625; T = 0,375) получено: Ne = 1,8824; He = 0,4688; Ho = 0,4900; PIC = 0,3589; FIS = −0,0453. Для g.85459517T>C (C = 0,575; T = 0,425) значения составили: Ne = 1,9560; He = 0,4888; Ho = 0,4900; PIC = 0,3693; FIS = −0,0026. Таким образом, максимальные аллельное разнообразие и информативность наблюдаются у g.85459517T>C, а коэффициенты FIS во всех случаях малы по модулю и согласуются с близостью выборки к равновесию Харди-Вайнберга.
Таблица 3 - Дополнительные популяционно-генетические показатели по SNP гена HSTN
SNP | p | q | Ne | PIC | He | Ho | FIS |
g.85470344T>G | 0,385 | 0,615 | 1,8995 | 0,3614 | 0,4736 | 0,45 | 0,0497 |
g.85458545A>T | 0,375 | 0,625 | 1,8824 | 0,3589 | 0,4688 | 0,49 | -0,0453 |
g.85459517T>C | 0,425 | 0,575 | 1,9560 | 0,3693 | 0,4888 | 0,49 | -0,0026 |
Примечание: Айрширская, n=100
Сопоставление трёх позиций HSTN показывает согласованную картину умеренного полиморфизма: ожидаемая гетерозиготность находится на устойчиво высоком уровне, а информативность маркера остаётся сопоставимой между локусами. Наиболее сбалансированное соотношение аллелей и максимальные значения эффективного числа аллелей и информативности наблюдаются для g.85459517T>C; две оставшиеся позиции демонстрируют близкие, лишь немного меньшие показатели. Доли гетерозиготных генотипов по всем локусам соответствуют ожиданиям и вносят существенный вклад в поддержание разнообразия.
Отдельного внимания заслуживает стабильность равновесия Харди-Вайнберга: низкие значения критерия χ² и совпадение наблюдаемых и ожидаемых распределений указывают на отсутствие выраженных факторов, способных смещать структуру популяции именно на уровне этих локусов. В практическом плане это означает, что для формирования компактной панели мониторинга структуры популяции и дальнейших ассоциативных исследований можно приоритизировать g.85459517T>C как наиболее информативный локус, при необходимости усиливая дискриминационную способность добавлением g.85470344T>G и g.85458545A>T.
4. Обсуждение
Согласованность наблюдаемых частот с равновесием Харди-Вайнберга по всем трём позициям гена HSTN указывает на отсутствие выраженных систематических факторов, способных заметно нарушать панмиктичность в анализируемой группе, таких как сильный направленный отбор по данным локусам, выраженный инбридинг или существенная стратификация выборки. Низкие значения χ² и близость наблюдаемых и ожидаемых частот согласуются с нейтральной моделью для данной панели маркеров с учётом статистической мощности исследования.
Наблюдаемая структура — с умеренно несбалансированными соотношениями аллелей и заметной долей гетерозигот - типична для локусов, не испытывающих в недавние поколения сильного направленного отбора. Небольшие разнонаправленные отклонения коэффициента инбридинга между позициями укладываются в статистическую погрешность и согласуются с равновесной моделью. Это позволяет интерпретировать выявленную вариабельность как поддерживаемую сочетанием панмиксии и дрейфа без доминирования единичного систематического фактора.
Функциональный контекст HSTN усиливает значение полученной популяционной картины: лакто-специфичная экспрессия и антимикробные свойства белка делают данный локус перспективным при анализе показателей здоровья вымени и технологических характеристик молока. Учитывая расположение HSTN в пределах казеинового кластера, не исключена сопряжённость вариаций HSTN с гаплотипами казеиновых генов; в дальнейшем это целесообразно проверять через оценку сцепления и анализ гаплотипной структуры в расширенных выборках. Селекционно-прикладной вывод заключается в том, что изучаемые позиции HSTN можно рассматривать как кандидаты для включения в панели маркер-ассистированной и геномной селекции — как самостоятельные информативные SNP, так и в составе региональных гаплотипов.
Полученные значения PIC находятся в диапазоне приблизительно 0,359-0,369, что соответствует умеренно информативным маркерам и указывает на выраженный, но не максимальный полиморфизм по всем трём позициям гена HSTN. Наиболее информативным по совокупности показателей является g.85459517T>C (наибольшие PIC и Ne), тогда как два других полиморфизма демонстрируют близкие, лишь немного меньшие значения. Ожидаемая гетерозиготность (He) колеблется в пределах 0,469–0,489; численно она выше PIC (что типично для двухаллельных кодоминантных локусов), однако оба показателя согласованно отражают умеренно высокий уровень генетического разнообразия. Наблюдаемые значения Ho (0,45–0,49) в пределах статистической погрешности соответствуют He; коэффициенты FIS малы и разнонаправленны (для g.85470344T>G — небольшой дефицит гетерозигот, для g.85458545A>T — небольшой избыток, для g.85459517T>C — практически ноль), что совместимо с равновесной моделью и отсутствием выраженных систематических искажений структуры популяции.
Диапазон ожидаемой гетерозиготности 0,47-0,49 типичен для локусов с умеренно несбалансированными аллельными частотами (порядка 0,6/0,4) и отражает вклад гетерозигот в поддержание разнообразия. Преобладание гетерозиготных генотипов (GT, AT и CT) согласуется с таким распределением аллелей и не требует привлечения дополнительных гипотез. Альтернативные объяснения — включая балансирующий отбор, влияние скрытой смеси субпопуляций или недавнее объединение линий — в принципе возможны, но их проверка выходит за рамки представленных данных и потребует дополнительных оценок, таких как расчёт FIS/FST, тесты на стратификацию и расширенный анализ сцепления.
Отмечаемые различия в мажорных аллелях между позициями (G для g.85470344T>G, A для g.85458545A>T и C для g.85459517T>C) полностью согласуются с соответствующими пропорциями генотипов и не сопровождаются систематическими сдвигами, которые указывали бы на селекционное давление в пределах исследуемой выборки. В практическом отношении текущий профиль частот обеспечивает корректную отправную точку для ассоциативного анализа признаков молочной продуктивности, однако для надёжной интерпретации эффектов потребуется расширение выборки, репликация на независимых стадах, моделирование ассоциаций с учётом родства и управленческих ковариат, а также оценка сцепления с соседними маркерами, позволяющая отличить прямые эффекты от маркерных. В целом полученные результаты свидетельствуют о сохраняющемся генетическом разнообразии по локусам HSTN и методологически подтверждают возможность последующего анализа связей с фенотипическими признаками в данной породной группе.
С практической точки зрения полученная популяционная картина оправдывает пробное включение локусов HSTN в прикладные задачи: мониторинг генетической структуры стада, пилотные ассоциативные тесты и апробацию маркера в составе компактных панелей. С учётом сопоставимой информативности трёх позиций приоритетным выглядит использование g.85459517T>C как «якорного» локуса, при необходимости усиливаемого g.85470344T>G и g.85458545A>T. В геномных моделях (GBLUP/ssGBLUP) варианты HSTN могут учитываться как часть регионального набора SNP хромосомы 6, что позволяет оценивать их вклад на фоне близлежащих маркеров кластера казеинов. На уровне хозяйства применимость маркера целесообразно оценивать через прирост точности прогноза целевых фенотипов и стабильность эффектов по сезонам и лактациям; при этом HSTN следует рассматривать как дополняющий компонент к уже используемым маркерам молочных белков и ключевым локусам липидного обмена, а не как самостоятельный «мажорный» эффект.
Ограничения работы связаны с однохозяйственной выборкой и отсутствием сопоставимых фенотипов по здоровью вымени и технологическим свойствам молока, что не позволяет переходить к причинно-следственным выводам. Дальнейшая валидация предполагает расширение набора стадов айрширской породы, сбор стандартизованных показателей (соматические клетки, клинические случаи мастита, состав и коагуляционные пробы), а также построение многоуровневых моделей со смешанными эффектами (учёт стада, отёла/лактации, дней в молоке, возраста и управленческих ковариат) с контролем множественного тестирования. Дополнительно целесообразно оценить сцепление и гаплотипную структуру в регионе HSTN-казеин, чтобы отделить прямые эффекты вариаций HSTN от маркерных и уточнить, при каких условиях включение локуса в селекционные индексы даёт воспроизводимый прирост точности.
5. Заключение
Анализ трех мутаций гена (g.85470344T>G, g.85458545A>T и g.85459517T>C) подтвердил их соответствие равновесию Харди-Вайнберга и указал на преобладание гетерозиготных генотипов, что может быть связано с адаптивными преимуществами и влиянием на продуктивные качества животных.
Все три локуса продемонстрировали умеренную информативность (PIC около 0,359-0,369) и высокую ожидаемую гетерозиготность (He около 0,469-0,489), что подтверждает сохранение генетического разнообразия в изученной выборке айрширского скота. По совокупности показателей наиболее перспективным для включения в минимальные маркерные панели следует считать локус g.85459517T>C, обладающий максимальными значениями PIC (≈0,369) и Ne (≈1,956).
Результаты исследования создают основу для дальнейшего изучения роли гена Histatherin в формировании молочной продуктивности и устойчивости к заболеваниям, что может быть полезно для селекционной работы с айрширской породой.
