Генотипирование растений люцерны на основе использования транспозазы Tn5 при подготовке транскриптомных библиотек
Генотипирование растений люцерны на основе использования транспозазы Tn5 при подготовке транскриптомных библиотек
Аннотация
Люцерна (Medicago sativa L.) — многолетняя бобовая культура, являющаяся одним из наиболее значимых кормовых растений. Люцерна характеризуется преимущественно перекрестным типом опыления, и каждый сорт является популяцией. В связи с этим актуально определение внутрисортового генетического разнообразия, выбор наиболее типичных представителей сорта, а также определение генетической близости сортов люцерны с учетом их гетерогенности.
Нами разработан подход, основанный на секвенировании кДНК-библиотек, подготовленных с использованием транспозазы Tn5, для генотипирования индивидуальных растений люцерны. Данный подход позволяет существенно снизить затраты на создание кДНК-библиотек и в разы сократить время, необходимое для их пробоподготовки, по сравнению с классическими подходами. С использованием разработанного подхода проведен анализ 54 растений сортов M. sativa subsp. sativa Verneuil и Mulfeuil и сорта M. sativa nothosubsp. varia Люся. Исследованные растения разделились на три кластера в соответствии с сортовой принадлежностью. Сорта Verneuil и Mulfeuil, относящиеся к одному подвиду, оказались генетически ближе друг к другу, чем к сорту Люся. Также показано, что для сортов Verneuil и Mulfeuil тип материала, из которого проводили выделение РНК (семядоли или целые проростки), не вносил существенного вклада в оценку генетической близости растений, в то время как для сорта Люся обособился подкластер целых проростков. Растения сорта Люся характеризовались большим генетическим разнообразием по сравнению с сортами Verneuil и Mulfeuil, что может объясняться недавним созданием этого сорта, представляющего собой сложногибридную форму.
Таким образом, подход по подготовке кДНК-библиотек для генотипирования индивидуальных растений люцерны с применением транспозазы Tn5 позволил получить логичные результаты и показал высокую эффективность. Разработанный подход по генотипированию растений может быть использован при оценке родства сортов люцерны, определения внутрисортового разнообразия, отбраковки нетипичных для сорта растений и выбора наиболее перспективных для использования в исследовательской и селекционной работе генотипов.
1. Введение
Люцерна (Medicago sativa L.) — многолетняя бобовая кормовая культура, широко используемая в мире. Ее ценность в кормопроизводстве во многом определяется высоким уровнем питательных веществ и качественным аминокислотным составом
. Современные сорта люцерны содержат от 16,0% до 23,5% сырого белка в фазу бутонизации-цветения . По содержанию лимитирующей аминокислоты — лизина (6,2–11,7 г/кг) — люцерна превосходит зерновые культуры, такие как пшеница, ячмень и кукуруза .На фоне активного прироста населения в развивающихся странах усиливается проблема нехватки белка и повышается антропогенная нагрузка на экосистемы , , . Потенциальным решением этих проблем может стать люцерна. Сочетая в себе высокий урожай зеленой массы с продуктивным долголетием, она обеспечивает стабильный сбор урожая на протяжении нескольких лет . Обладая способностью к азотфиксации и глубоко разветвленной корневой системой, люцерна помогает восстановлению пахотных земель, повышая плодородие и снижая эрозию , , . Она также отличается широкими адаптивными возможностями, позволяющими выращивать ее в разнообразных климатических и почвенных условиях , .
Люцерна характеризуется преимущественно перекрестным типом опыления, что обусловливает ее высокую генетическую гетерогенность , . Поскольку каждый сорт является популяцией, а не чистой линией, среди растений поддерживается высокая гетерозиготность . В связи с этим определение внутрисортового генетического разнообразия и близости различных сортов с учетом их гетерогенности и выбор наиболее типичных представителей сорта играет важную роль в фундаментальных и прикладных исследованиях люцерны, а также ее селекции.
Эффективным подходом для генотипирования растений является секвенирование полных геномов, однако недостатком данного метода являются высокие затраты на анализ одного образца. Секвенирование не полных геномов, а определенных их участков, например, генов рибосомной РНК или регионов хлоропластных геномов существенно сокращает стоимость исследования одного образца и достаточно широко используется при оценке генетической близости растений, однако ограничением для применения данного метода является недостаточный уровень полиморфизма этих последовательностей у близкородственных образцов. Еще одним распространенным подходом для генотипирования растений является секвенирование библиотек с уменьшенной сложностью генома, позволяющее получить данные только для случайного набора участков генома и существенно снизить затраты на один образец по сравнению с полногеномным секвенированием, однако часто требуется выбор оптимальных рестриктаз и оптимизация методики для определенного вида/рода растений. Весьма эффективным подходом является секвенирование значительного числа определенных предварительно выбранных генов, полиморфизм которых позволяет достаточно полно охарактеризовать разнообразие изучаемых образцов растений, однако для разработки таких наборов генов требуется масштабный биоинформатический анализ и оптимизация методик «вытаскивания» нужных генов из генома .
Существуют также подходы для генотипирования растений, основанные на секвенировании транскриптомов, позволяющие определить последовательности всех экспрессирующихся в определенной ткани или органе генов, и этот метод эффективен для изучения полиморфизмов в белок-кодирующих генах. Затраты на такие исследования при использовании коммерческих наборов реактивов остаются весьма высокими, однако разработаны методики для пробоподготовки кДНК-библиотек для секвенирования, основанные на использовании транспозазы Tn5, позволяющие существенно снизить затраты на один образец , , .
Целью нашей работы являлась разработка подхода, основанного на секвенировании кДНК-библиотек, подготовленных с использованием транспозазы Tn5, для генотипирования индивидуальных растений люцерны с целью оценки внутрисортового полиморфизма.
2. Методы и принципы исследования
Выращивание растений люцерны и выделение РНК
Для генотипирования использовали растения сортов Medicago sativa L. subsp. sativa Verneuil и Mulfeuil, а также перспективного сорта Medicago sativa L. nothosubsp. varia (Martyn) Arcang. Люся. Современная популяция сорта Люся представляет собой сложногибридную форму, созданную скрещиванием сортов Агния, Palava и образца 506/13. Она характеризуется высокой адаптивностью и выраженной симбиотической активностью. В то же время, сорта Verneuil и Mulfeuil представляют ранние формы M. sativa subsp. sativa. Семенной материал получен из коллекции ФГБНУ «Федеральный исследовательский центр Всероссийский институт генетических ресурсов растений имени Н.И. Вавилова» (Санкт-Петербург).
Семена люцерны сортов Verneuil, Mulfeuil и Люся подвергли скарификации и разделили на две части. Одну сразу высевали в горшки с грунтом и искусственным освещением (16 часов день/8 часов ночь), а вторую помещали в чашки Петри с 0,05% раствором фунгицида Maxim (Syngenta, Франция). На седьмой день из чашек Петри отбирали проростки для 9 индивидуальных растений каждого сорта, а из горшков — пары раскрытых семядолей также для 9 индивидуальных растений каждого сорта. Собранный растительный материал измельчали в 1,5 мл пробирках в жидком азоте одноразовым пестиком, который закрепляли в дрели-шуруповерте DF332D (Makita, Япония). Выделение РНК проводили набором HiPure Plant RNA Mini Kit (Magen, Китай). Качество выделенной РНК оценивали методом электрофореза в 1,5% агарозном геле, а концентрацию — на флуориметре Qubit 4.0 (Thermo Fisher Scientific, США).
Подготовка и секвенирование кДНК-библиотек
В качестве основы при разработке методики подготовки кДНК-библиотек с использованием транспозазы Tn5 для высокопроизводительного секвенирования растений люцерны использованы подходы из нескольких ранее опубликованных статей
, , , . В результате разработан описанный ниже протокол.Для выделения фракции мРНК использовали 250 нг тотальной РНК в 5 мкл воды. К РНК добавляли 2 мкл праймера dT30VN (10 мкМ) (5’-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTVN-3’) (ДНК-Синтез, Россия). Смесь инкубировали 2 мин при 70 °C и немедленно охлаждали на льду. Реакцию обратной транскрипции проводили в 15,5 мкл реакционной смеси следующего состава: 3 мкл 5× First Strand Buffer (Евроген, Россия), 1,5 мкл смеси dNTP (10 мМ каждого) (Евроген), 1,5 мкл DTT (20 мМ) (Евроген) и 1,5 мкл ингибитора РНКаз (5 ед/мкл) (Синтол, Россия). Смесь перемешивали на вортексе и добавляли по 7 мкл к образцу РНК. Затем вносили 1 мкл обратной транскриптазы Mint (200 ед/мкл) (Евроген). Инкубацию проводили 1 ч 30 мин при 42 °C, затем 15 мин при 70 °C, после чего пробы охлаждали на льду.
Подготовка кДНК-библиотек основывалась на использовании фермента Smart Транспозазы Tn5 (diaGene, Россия), позволяющего одновременно фрагментировать гетеродуплекс РНК-ДНК и присоединять к получившимся фрагментам двуцепочечные адаптеры, необходимые для дальнейшей пробоподготовки:
5′-[phos]CTGTCTCTTATACACATCT-3′ + 5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3′,
5′-[phos]CTGTCTCTTATACACATCT-3′ + 5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3′.
Реакцию тагментации проводили в объеме 10 мкл, содержащем 2 мкл 5× TAPS-буфера (50 мМ TAPS-NaOH (Acros Organics, США), 25 мM MgCl2 (Sigma-Aldrich, США), 50% v/v DMF (Sigma-Aldrich) (pH 8,5), 0,25 мкл Tn5 (diaGene) и 7,8 мкл продукта обратной транскрипции. Смесь готовили на льду, инкубировали 7 мин при 55 °C, затем охлаждали на льду. После этого добавляли 5 мкл 0,2 % SDS (Sigma-Aldrich), инкубировали 7 мин при 55 °C и вновь охлаждали.
Продукты реакции разводили в два раза. Восстановление разрывов в РНК после тагментации проводили в 11,5 мкл реакционной смеси, включающей 2 мкл 5× First Strand Buffer (Евроген), 1 мкл dNTP (10 мМ каждого) (Евроген), 0,5 мкл обратной транскриптазы Mint (200 ед/мкл) (Евроген) и 8 мкл продукта реакции тагментации. Инкубацию проводили 15 мин при 42 °C и 15 мин при 70 °C, после чего пробы охлаждали.
Для добавления адаптерных последовательностей и двойных индексов проводили ПЦР с использованием универсальных праймеров Nextera XT v2:
5′-AATGATACGGCGACCACCGAGATCTACAC[i5]TCGTCGGCAGCGTC-3′,
5′-CAAGCAGAAGACGGCATACGAGAT[i7]GTCTCGTGGGCTCGG-3′ (Illumina, США), где i5 и i7 – 8-нуклеотидные баркоды.
Реакцию амплификации проводили в 20 мкл смеси, содержащей 0,4 ед/мкл полимеразы KAPA (Roche, Швейцария), 1× буфер KAPA, 0,4 мкМ каждого праймера (i5, i7) (Евроген), 0,3 мМ каждого dNTP (Roche) и 5 мкл кДНК. Программа амплификации: 72 °C — 5 мин; 98 °C — 2 мин 45 с; 20 циклов (98 °C — 15 с, 62 °C — 30 с, 72 °C — 1 мин 30 с). Амплификацию выполняли на амплификаторе MiniAmp Thermal Cycler (Thermo Fisher Scientific).
Качество кДНК-библиотек оценивали электрофорезом в 2%-агарозном геле, а концентрацию — на флуориметре Qubit 4.0 (Thermo Fisher Scientific).
кДНК-библиотеки смешивали эквимолярно и очищали на магнитных шариках MagicPure Size Selection DNA Beads (TransGen Biotech, Китай) в соотношении 1:1,5 (образец:шарики). Затем проводили селекцию по размеру фрагментов согласно инструкции производителя для получения кДНК-библиотек с размером вставки 400–500 п.н.
Концентрацию и качество подготовленных библиотек оценивали на флуориметре Qubit 4.0 (Thermo Fisher Scientific) и капиллярном электрофорезе Qsep1-Plus (BiOptic, Тайвань). Секвенирование проводили на платформе NextSeq 2000 (Illumina) с длиной прочтений 100+100 н.
Анализ данных секвенирования
Анализ данных секвенирования проводили с использованием PPline . Прочтения обрезали по качеству, а также удаляли остаточные фрагменты адаптеров при помощи Trimmomatic 0.39 с параметрами TRAILING:24, SLIDINGWINDOW:4:14, MINLEN:40. Далее прочтения картировали на геном M. sativa (National Genomics Data Center (NGDC), проект PRJCA033031, сборка генома GWHFIBZ00000000.2) при помощи STAR 2.7.9a с подключенной GTF-аннотацией, с удалением новых (не аннотированных в GTF) неканонических сплайс-границ. После процессинга и сортировки BAM-файлов проводили процедуру разделения прочтений, пересекающих границы экзонов, при помощи GATK SplitNCigarReads 4.2.4.0. Маркировка дуплицированных прочтений не проводилась. Далее выполняли поиск ДНК-полиморфизмов при помощи freeBayes 1.3.2 (с пороговым покрытием 5, пороговой частотой альтернативного аллеля (VAF) = 0.2). Замены фильтровали по Phred Quality > 50. Далее на основе профилей встречаемости ДНК-полиморфизмов (а именно частот альтернативных аллелей, VAF) рассчитывали попарные Евклидовы расстояния между образцами, и затем проводили иерархическую кластеризацию образцов с использованием метода Варда (D2). Визуализацию дендрограмм проводили в iTOL.
3. Результаты и обсуждение
С использованием описанного выше подхода для сортов люцерны Verneuil, Mulfeuil и Люся подготовлено 54 кДНК-библиотеки. Для каждого сорта половина кДНК-библиотек получена для семядолей, а половина — для целых проростков. кДНК-библиотеки секвенировали на платформе Illumina и в среднем для каждой кДНК-библиотеки получили по 5 млн парноконцевых прочтений. Данные депонированы в NCBI Sequence Read Archive, проект PRJNA1356923. Выполнили картирование полученных транскриптомных данных на геном M. sativa (NGDC, GWHFIBZ00000000.2) , и в среднем доля картированных прочтений составила 78%.
Далее провели поиск ДНК-полиморфизмов в полученных для каждого образца люцерны транскриптомных данных и на их основе выполнили кластеризацию образцов (рис. 1). Как видно из представленной на рисунке дендрограммы, все образцы разделились на три кластера в соответствии с сортовой принадлежностью (образцы сорта Mulfeuil содержат в своем названии сокращение Mul, сорта Verneuil — Ver, а сорта Люся — Luc). При этом сорта Verneuil и Mulfeuil оказались генетически ближе друг к другу, а не к сорту Люся, что вполне логично, так как Verneuil и Mulfeuil относятся к подвиду M. sativa subsp. sativa, а Люся — к M. sativa nothosubsp. varia. Что касается разделения образцов в соответствии с растительным материалом, из которого выделяли РНК для подготовки кДНК-библиотек (семядоли или целые проростки), то его не произошло для сортов Verneuil и Mulfeuil, относящихся к ранним селекционным формам M. sativa subsp. sativa, а для сорта Люся, относящегося к M. sativa nothosubsp. varia, обособился подкластер образцов целых проростков (на дендрограмме целые проростки обозначены буквой Pв начале названия образца), в то время как образцы семядолей (обозначены буквой Cв начале названия образца) не образовали четко обособившегося подкластера. Люся, в отличие от Verneuil и Mulfeuil, относится к другому подвиду люцерны, и с этим могут быть связаны более выраженные отличия ее целых проростков от семядолей на уровне экспрессии. Это, в свою очередь, могло внести вклад в то, данные о ДНК-полиморфизмах каких генов были получены, что и привело к некоторому обособлению образцов целых проростков. Также стоит отметить, что образцы сорта Люся характеризовались большим генетическим разнообразием по сравнению с образцами сортов Verneuil и Mulfeuil, что может объясняться недавним созданием этого сорта, представляющего собой сложногибридную форму.

Рисунок 1 - Кластеризация образцов люцерны сортов Verneuil (Ver), Mulfeuil (Mul) и Люся (Luc) на основе ДНК-полиморфизмов в данных секвенирования транскриптомов семядолей (обозначены буквой C в начале названия образца) и целых проростков (обозначены буквой P в начале названия образца)
Примечание: для каждого сорта в анализ вошло по 18 растений
4. Заключение
Нами разработан эффективный подход по генотипированию растений люцерны, основанный на использовании транспозазы Tn5 при подготовке кДНК-библиотек для высокопроизводительного секвенирования и дальнейшего анализа ДНК-полиморфизмов в экспрессирующихся в исследуемых образцах генах. Данный подход может быть использован при оценке родства сортов люцерны, определения внутрисортового разнообразия, отбраковки нетипичных для сорта растений и выбора наиболее перспективных для использования в исследовательской и селекционной работе генотипов. Кроме того, предложенный подход, помимо данных о ДНК-полиморфизмах в генах, также позволяет получить информацию об уровнях экспрессии генов в исследуемых образцах, что может быть использовано в молекулярно-генетических исследованиях.
