Informacja

14.6: Role transpozycji w ewolucji i różnorodności - biologia

14.6: Role transpozycji w ewolucji i różnorodności - biologia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

A. Transpozony i tasowanie egzonów

Rola nierównej rekombinacji w przenoszeniu eksonów do iz różnych eukariotycznych genów rozszczepionych została opisana wcześniej. Ten rodzaj tasowanie egzonów może się zdarzyć, gdy krótkie sekwencje DNA w dwóch różnych intronach przemieszczą się podczas synapsy mejotycznej, co pozwoli na nierówne przejście. Ekspresja genu z „nowym” eksonem wytwarza białko z nową domeną i nową aktywnością. Jeśli wydarzenie nie jest szkodliwe, zwiększa się różnorodność!

Znalezione w intronach transpozony są długimi regionami podobieństwa DNA, które mogą stabilizować synapsę, zwiększając szanse na nierówną rekombinację i tasowanie eksonów. Na przykład, Alu Pierwiastki (SINE) często znajdują się w intronach, gdzie mogą integrować się bez złego efektu. Podobieństwo elementów Alu w intronach niepowiązanych genów wydaje się tłumaczyć tasowanie egzonów przez nierówne krzyżowanie się między różnymi genami, które w rezultacie dzielą domeny i określone funkcje. Inny sposób, w jaki transpozony ułatwiają tasowanie egzonów komórek linii zarodkowej, jest bardziej bezpośredni. Wyobraź sobie parę transpozonów w intronach genu po obu stronach egzonu. Jeśli takie transpozony zachowują się jak dwa zewnętrzne elementy IS w bakteryjnym elemencie Tn (omówione powyżej), mogą zostać wycięte jako pojedynczy, duży transpozon zawierający egzon. Sparowane transpozony flankujące egzon mogą następnie wstawić się do intronu zupełnie innego genu! Ta możliwość została zilustrowana na następnej stronie.

Tasowanie egzonów za pośrednictwem transpozonów może wyjaśniać wstawianie zakodowanych egzonów domen naskórkowy czynnik wzrostu (EGF) na kilka niepowiązanych genów. Odkryto mitogen EGF, ponieważ stymulował komórki skóry do rozpoczęcia podziału. Gen dla TPA (tkankowy aktywator plazminogenu, rozpuszczający się skrzep krwi proteaza) współdzieli domeny genów EGF. TPA jest lekiem dla ofiar ataku serca, który podawany szybko po ataku może rozpuścić skrzep i umożliwić wznowienie przepływu krwi z tętnicy wieńcowej do mięśnia sercowego. Inne geny zawierające domeny EGF obejmują te dla białek Neu i Notch, oba zaangażowane w różnicowanie i rozwój komórek.

Niektóre zdarzenia tasowania egzonów mogły być zapośredniczone przez transpozycję LINE i przez specjalną grupę niedawno odkrytych transpozonów zwanych helitrony. Helitrony replikują się przez a toczące się koło mechanizm. Jeśli interesują Cię helitrony, wyszukaj w Google więcej informacji o nich oraz o roli, jaką mogły odegrać w przebudowie i rekonstrukcji genomów w ewolucji. Ogólny szlak tasowania egzonów obejmujący sparowane proksymalne transpozony DNA jest zilustrowany poniżej.

W przedstawionym powyżej ogólnym przykładzie ekson 2 genu A został wstawiony wraz z transpozonami flankującymi do innego genu (gen B).

B. Geny transpozonowe i układ odpornościowy, a geny mają historię

Kilka ważnych genów eukariotycznych mogło pochodzić z transpozonów. Być może najbardziej intrygującym tego przykładem jest złożony układ odpornościowy kręgowców. Nasz układ odpornościowy obejmuje immunoglobuliny (przeciwciała). Odziedziczyłeś geny białek immunoglobulinowych od swoich rodziców.

Te geny zawierają wiele wariantów V, D, oraz J regiony powiązane z a C region. V, D, J i C są zdefiniowane jako Vzmienna, Jnamaszczanie, Diversity i Cstałe regiony DNA. Będą rekombinować, tworząc wiele różnych cząsteczek przeciwciał V-D-J-C immunoglobuliny (region D nie zawsze jest zawarty w końcowym rekombinowanym genie). Te rearanżacje genów zachodzą podczas dojrzewania pewnych komórek macierzystych w szpiku kostnym, które stają się komórkami układu odpornościowego (limfocyty B lub T). W odpowiedzi na wyzwanie przez obce substancje zwane antygeny, zostaną wybrane komórki zawierające przegrupowane geny immunoglobulin kodowanie immunoglobulin, które potrafią rozpoznawać, wiązać i eliminować inwazyjne antygeny.

Omówienie biologii molekularnej układu odpornościowego wykracza poza nasz zakres. Dość powiedzieć, że szlak rekombinacji rearanżacji genów immunoglobulin obejmuje aktywności enzymatyczne bardzo podobne do transpozycji. W rzeczywistości tak zwany enzym RAG1 aktywny w rearanżacji genów immunoglobulin jest blisko spokrewniony z genami w rodzinie transpozonów (transib) występują w bezkręgowcach i grzybach. Wygląda więc na to, że geny układu odpornościowego mogą mieć swój początek w transpozonie!


14.6: Role transpozycji w ewolucji i różnorodności - biologia

ABSTRAKCYJNY

Elementy transpozycyjne (TE) to pasożyty, które znajdują się w DNA prawie wszystkich organizmów. Uważa się je za samolubne elementy genetyczne, ponieważ używają maszynerii gospodarza do tworzenia kopii siebie, a następnie wklejają te kopie wokół genomu gospodarza. Ponieważ TE są przenoszone z rodzica na potomstwo, odgrywają ważną rolę w ewolucji genomu. Dramatycznie powiększają rozmiar genomów, przestawiają DNA w obrębie chromosomów i między nimi oraz modyfikują aktywność poszczególnych genów. Jednak infekcja TE szkodzi również gospodarzowi poprzez mutację, uszkadzanie i dezorganizację DNA. W konsekwencji ruch TE może powodować bezpłodność gospodarza i jest związany z pojawieniem się i progresją wielu nowotworów. Rozerwanie mechanizmów regulacji TE ma zatem fundamentalne znaczenie dla zdrowia człowieka. Ponadto koszty płodności infekcji TE stanowią potencjalną strategię biologicznego zwalczania wektorów chorób, szkodników rolniczych i gatunków inwazyjnych. Jednak praktycznie nic nie wiemy o tym, jak TE przystosowują się lub ewoluują w gospodarzu, ani jak gospodarz ewoluuje w odpowiedzi na inwazję TE. Ten projekt badawczy wykorzystuje nową inwazję TE na eksperymentalną linię muszek owocowych i pozwala na bezprecedensową eksplorację interakcji ewolucyjnych między elementem transpozycyjnym a żywicielem.

Pomimo wielorakiego wpływu TE na ich gospodarzy, nasza wiedza na temat reakcji genomu gospodarza na infekcję pozostaje niezwykle ograniczona. W badaniach wykorzystana zostanie dobrze scharakteryzowana historyczna inwazja genomu Drosophila melanogaster przez transpozon DNA elementu P jako model do zbadania ewolucji represji gospodarza. Niedawne wystąpienie tej inwazji, jak również zachowanie zmienności genetycznej przodków w szczepach laboratoryjnych, daje niezrównaną okazję do zbadania represji gospodarza w trzech najbardziej krytycznych punktach czasowych: tuż przed inwazją, podczas inwazji i tuż po inwazji. Daje również możliwość zdekonstruowania tego procesu ewolucyjnego w laboratorium i interpretacji wyników w naturalnych populacjach. W szczególności projekt ten: 1) Scharakteryzuje stałą zmienność genetyczną w permisywności transpozycji pierwiastków P w modelu genetycznym populacji przodków D. melanogaster (tuż przed inwazją) 2) Zdefiniuje procesy mutacyjne i selektywne, które prowadzą do ewolucji represji podczas inwazji na populacje eksperymentalne przez transpozycyjnie aktywne elementy P 3) Odkrycie wkładu stałej zmienności genetycznej, mutacji de novo i selekcji w ewolucję represji gospodarza w istniejących populacjach naturalnych (tuż po inwazji).

PUBLIKACJE WYPRODUKOWANE W WYNIKU BADAŃ

Notatka: Po kliknięciu numeru identyfikatora obiektu cyfrowego (DOI) zostaniesz przeniesiony na stronę zewnętrzną utrzymywaną przez wydawcę. Niektóre artykuły pełnotekstowe mogą nie być jeszcze dostępne bez opłat w okresie obowiązywania embarga (przerwa administracyjna).

Niektóre łącza na tej stronie mogą prowadzić do witryn niefederacyjnych. Ich zasady mogą różnić się od tej witryny.


Transpozony: definicja i typy (z diagramem)

Obecność elementów transpozycyjnych po raz pierwszy przewidziała Barbara McClintock w kukurydzy (kukurydza) pod koniec lat 40. XX wieku. Po kilku wnikliwych badaniach odkryła, że ​​pewne elementy genetyczne przemieszczały się z jednego miejsca do zupełnie innego miejsca w chromosomie. To zjawisko zmiany miejsc elementów genetycznych nazwała transpozycją, a te elementy genetyczne nazwała elementami kontrolującymi.

Te elementy sterujące zostały później nazwane przez Alexandra Brinka elementami transpozycyjnymi. Pod koniec lat 60. zjawisko to odkryto również u bakterii.

W związku z tym biolodzy molekularni nazwali je transpozonami. Transpozon można zdefiniować jako: „sekwencja DNA, która może się przenieść lub wstawić w nowe miejsce w genomie”. Zjawisko przemieszczania się transpozonu do nowego miejsca w genomie określa się mianem transpozycji.

Stwierdzono, że transpozony kodują specjalne białko zwane transpozazą, które katalizuje proces transpozycji. Transpozony są specyficzne dla różnych grup organizmów. Stanowią dość istotną część genomu organizmów takich jak grzyby, bakterie, rośliny, zwierzęta i ludzie. Transpozony mają duży wpływ na zmianę lub zmianę składu genetycznego organizmów.

Transpozony lub transponowalne elementy genetyczne są często określane również jako „ruchome elementy genetyczne”. Można je podzielić na różne kategorie, takie jak sposób transpozycji lub na podstawie organizmów, w których są obecne.

Rodzaje transpozonów:

Różne transpozony mogą zmieniać swoje strony, stosując różne mechanizmy transpozycji.

Na podstawie mechanizmu transpozycji transpozony można podzielić na następujące typy:

(i) Transpozony typu „wytnij i wklej”:

Transponują poprzez wycięcie (wycięcie) sekwencji zdolnej do transpozycji z jednej pozycji w genomie i jej wstawienie (wklejenie) do innej pozycji w genomie (ryc. 1).

Transpozycja „wytnij i wklej” obejmuje dwie podjednostki transpozazy. Każda transpozaza wiąże się z określonymi sekwencjami na dwóch końcach transpozonu. Te podjednostki białka transpozazy następnie łączą się i prowadzą do wycięcia transpozonu.

Ten wycięty ‘transposon-Transposase Complex’ zostaje następnie zintegrowany z docelową stroną odbiorczą. W ten sposób transpozon jest wycinany z jednego miejsca, a następnie wklejany w innym miejscu za pomocą mechanizmu, w którym pośredniczy białko transpozazy (ryc. 2).

Przykładami transpozonów typu „wytnij i wklej” są elementy IS, elementy P w kukurydzy, elementy hobo w Drosophila itp.

(ii) Transpozony replikacyjne:

Transpozycja odbywa się w mechanizmie, który polega na replikacji sekwencji zdolnej do transpozycji, a tak utworzona kopia DNA jest wstawiana w miejsce docelowe, podczas gdy miejsce dawcy pozostaje niezmienione (ryc. 3). Tak więc, w tego typu transpozycji, następuje zysk jednej kopii transpozonu i zarówno cząsteczka DNA dawcy, jak i biorcy mają po jednej sekwencji transpozycyjnej po transpozycji.

Dobrym przykładem tego typu transpozonów są elementy Tn3 występujące w bakteriach.

(iii) Elementy retro:

Ich transpozycja odbywa się poprzez proces, który obejmuje syntezę DNA przez odwrotną transkrypcję (tj. DNA RNA) z użyciem elementów RNA jako matrycy (ryc. 4). Ten rodzaj transpozycji obejmuje pośredniczący RNA, transponowany DNA jest transkrybowany w celu wytworzenia cząsteczki RNA.

Ten RNA jest następnie używany jako matryca do wytwarzania komplementarnego DNA poprzez aktywność enzymatycznej odwrotnej transkryptazy. Tak utworzona jednoniciowa kopia DNA jest następnie tworzona jako dwuniciowa, a następnie wstawiana w docelowe miejsce DNA. Elementy transpozycyjne, które wymagają odwrotnej transkryptazy do swojego ruchu, nazywane są transpozonami retro.

Elementy Retro mogą być wirusowe lub niewirusowe. Spośród tych dwóch, niewirusowe elementy retro są ważne i mogą być dalej klasyfikowane jako:

(A) Elementy podobne do retrowirusów:

Przenoszą długie powtórzenia końcowe (LTR). Przykładami są copia, elementy cygańskie w Drosophila.

LTR są nieobecne. Przykładami są LINE i SINE u ludzi.

Elementy ruchome u prokariontów:

Wprawdzie obecność transpozonów była przewidziana u eukariontów, ale pierwsze obserwacje na poziomie molekularnym przeprowadzono na bakteriach, które są prokariotami.

Bakteryjne elementy transpozycyjne są następujących typów:

(a) Sekwencje wstawiania lub elementy IS:

Są to sekwencje transpozycyjne, które mogą wstawiać się w różne miejsca w chromosomach bakteryjnych.

Elementy IS zawierają ITR (odwrócone powtórzenia końcowe), które po raz pierwszy zaobserwowano u E. coli. Elementy IS są stosunkowo krótkie, zwykle nie przekraczają 2500 pz. ITR obecne na końcach elementów IS są ważną cechą, która umożliwia ich mobilność. ITR obecne w elementach IS E.coli zwykle wahają się między 18-40 pz.

Termin ‘Powtórzenie odwróconego terminala’ (ITR) oznacza, że ​​sekwencja na końcu 5 jednej nici jest identyczna z sekwencją na końcu 5′ drugiej nici, ale biegną one w przeciwnym kierunku (Fig. 5). W chromosomie Exoli występuje wiele kopii kilku elementów IS, takich jak IS1, IS2, IS3, IS4 i IS5.

(b) Element transpozonu prokariotycznego:

Są one również nazywane transpozonami złożonymi i są oznaczone symbolem Tn. Składa się z dwóch elementów IS, po jednym na każdym końcu sekwencji DNA zawierającej geny, których funkcje nie są związane z procesem transpozycji. Stwierdzono, że te transpozony mają odwrócone powtórzenia na końcach. Długość tych odwróconych powtórzeń waha się od kilku nukleotydów do około 1500 pz.

Można powiedzieć, że są to duże transpozony, które powstają w wyniku wychwycenia nieruchomej sekwencji DNA w obrębie dwóch sekwencji insercyjnych, co umożliwia jej poruszanie się. Przykłady takich transpozonów obejmują elementy serii Tn, takie jak Tn1, Tn5, Tn9, Tn10 itp.

Elementy transpozycyjne u eukariontów:

(a) Transpozony w kukurydzy:

Poniżej opisano różne rodzaje transpozonów obecnych w kukurydzy:

Ten system elementów transpozycyjnych w kukurydzy został przeanalizowany i podany przez Barbarę Mc. Klintock. Tutaj Ac oznacza Aktywator, a Ds od dysocjacji. Barbara odkryła, że ​​geny Ds i Ac są czasami ruchome i przenoszone do różnych lokalizacji chromosomowych, co skutkuje różnymi fenotypami jądra.

Element Ds jest aktywowany przez Ac i po aktywacji służy jako dostawca miejsca pęknięcia w chromosomie. Ac może poruszać się autonomicznie, podczas gdy Ds może poruszać się tylko w obecności Ac (rys. 6). Transpozycja obejmująca ten system Ac-Ds wytwarza zmienione fenotypy jądra.

Inne ruchome elementy kukurydzy to:

i. układ SPM (supresor mutator),

iii. System Mu (Mutator) itp.

(b) Transpozony u Drosophila:

W Drosophila znajduje się wiele transpozycyjnych elementów, które są różnych typów i stanowią dość dużą frakcję genomu Drosophila.

Niektóre z tych transpozonów podano poniżej:

Zostały one odkryte podczas badania ‘dysgeneza hybrydowa’ co jest stanem powodującym bezpłodność. Mają one długość 2,9 kb i zawierają odwrócone końcowe powtórzenia o długości 31 pz. Wysoka szybkość transpozycji elementów P powoduje dysgenezę hybrydową. Elementy P kodują enzym transpozazę, który pomaga w ich transpozycji. Są one również przydatne jako wektory do wprowadzania obcych genów do Drosophila.

Ich transpozycja powoduje mutacje koloru oczu u Drosophila. Mają one wielkość około 5-8 kb z bezpośrednimi powtórzeniami końcowymi (DTR) około 276 bp na każdym końcu. W każdym z tych bezpośrednich powtórzeń obecne są krótkie odwrócone powtórzenia (IR) o długości około 17 pz. W genomie komórkowym obecnych jest około 10–80 duplikatów (ryc. 7).

Są to złożone elementy obecne w genomie Drosophila. Mają one zdolność zaginania się z powrotem w celu utworzenia struktury rdzenia i pętli dzięki obecności długich odwróconych powtórzeń końcowych. Ich transpozycja skutkuje zmienioną ekspresją poprzez spowodowanie mutacji przez insercję lub poprzez wpływ na normalną ekspresję genów.

Inne ważne rodzaje transpozycyjnych elementów znalezionych w Drosophila to:

(c) Transpozony u ludzi:

Transpozony u ludzi mają postać powtarzającego się DNA, składającego się z sekwencji przeplatanych w całym ludzkim genomie. Te sekwencje są transponowane i mogą przemieszczać się w różne miejsca w genomie.

Są to dwa następujące typy:

(1) SINE (krótkie elementy przeplatane):

300 pz długości i może występować około 5 lakh razy w ludzkim genomie. Sekwencje Alu są najlepiej scharakteryzowanymi SINE u ludzi.

Są one określane jako ‘Alu’ elementy, ponieważ zawierają specyficzne sekwencje nukleotydowe, które są cięte przez enzym restrykcyjny o nazwie Alul. Elementy Alu zawierają Direct Terminal Repeats (DTR) o długości 7-20 pz. Te DTR pomagają im w procesie wstawiania podczas transpozycji.

(2) LINIE (Długie przeplatane elementy):

6400 pz i są obecne w ludzkim genomie około 1 lakh razy. Najbardziej widocznym przykładem jest sekwencja LI. Te transpozycyjne elementy są jednymi z najliczniejszych i najbardziej powszechnych rodzin umiarkowanie powtarzających się sekwencji w ludzkim DNA.

Znaczenie elementów transpozycyjnych:

1. Transpozony mogą zmieniać strukturalne i funkcjonalne cechy genomu poprzez zmianę ich pozycji w genomie.

2. Elementy transpozycyjne powodują mutację przez insercję, delecję itp.

3. Transpozony wnoszą pozytywny wkład w ewolucję, ponieważ mają ogromny wpływ na zmianę organizacji genetycznej organizmów.

4. Są również przydatne jako wektory do klonowania w klonowaniu genów. Na przykład, elementy P są często stosowane jako wektory do wprowadzania transgenów do Drosophila.

5. Transpozony mogą być również wykorzystywane jako markery genetyczne podczas mapowania genomów.

6. Tagowanie genów za pośrednictwem transpozonu służy do wyszukiwania i izolacji określonego genu.

Techniki mapowania genów:

Mapa genów to szczegółowa schematyczna reprezentacja pozycji genów lub sekwencji będących przedmiotem zainteresowania w chromosomie. Może również dostarczać szczegółowych informacji o względnych odległościach między tymi genami. Mapa genów może być również określana jako mapa genomu lub mapa molekularna. Próbuje opisać strukturalną i funkcjonalną organizację genomu organizmu.

Mapowanie genów zyskało w ciągu ostatnich dwóch dekad wiele uwagi nie tylko w przypadku roślin, ale także zwierząt. Mapy te zapewniają ogromne korzyści w ulepszaniu ważnych z handlowego punktu widzenia roślin lub zwierząt. Mapowanie genów ludzkiego genomu jest głównym celem Human Genome Project (HGP). Z pewnością pomoże rozwiązać problemy genetyczne u ludzi.

Mapy genów pomagają również w ocenie różnorodności genetycznej i klasyfikacji taksonomicznej organizmów przez porównanie. Najpopularniejszą techniką opracowania mapy genów jest użycie markerów molekularnych. Podstawą działania markerów molekularnych jest polimorfizm.

Wielopostaciowość:

Genom organizmu zawiera szereg polimorfizmów (dosłowne znaczenie to wiele form). Te polimorfizmy są w rzeczywistości pozycjami w genomie, w których sekwencja nukleotydów nie jest taka sama u każdego członka populacji.Te zmienne miejsca można stosować jako markery DNA (lub marker molekularny) do mapowania genomu.

Wykrycie polimorfizmu można przeprowadzić na jeden z następujących sposobów:

Wykrywanie to można przeprowadzić ze względu na różnice w strukturze i składzie białek kodowanych przez polimorficzne miejsca genomów.

Można to zrobić przez badanie wizualne, bez angażowania żadnej specjalistycznej techniki biochemicznej lub molekularnej.

(iii) Wykrywanie molekularne:

Odbywa się to na poziomie DNA, tj. można wykryć sekwencje DNA wykazujące różnice. Polimorfizm występujący na poziomie molekularnym, tj. w sekwencji DNA, może być skutecznie wykorzystany jako marker molekularny/DNA, a zatem jest ważny do przygotowania map genów.

Markery molekularne:

Można je również nazwać markerami DNA. Reprezentują podstawową metodę tworzenia map genów. Markery molekularne faktycznie wykazują zmienność na poziomie DNA. Markery molekularne można opisać jako sekwencje DNA, które ujawniają zmiany na poziomie DNA, które można łatwo wykryć i monitorować w kolejnych pokoleniach.

Na podstawie zasad i metod stosowanych przy opracowywaniu i stosowaniu markerów molekularnych można je sklasyfikować jako markery oparte na hybrydyzacji i markery oparte na PCR.

Dobry marker molekularny musi być polimorficzny i powinien być równomiernie rozmieszczony w genomie. Wykrycie markera molekularnego powinno być łatwe i szybkie. Jak wspomniano wcześniej, głównym zastosowaniem markerów molekularnych jest opracowywanie map genów.

Poniżej podano różne ważne markery DNA, które są wykorzystywane do mapowania genów:

(i) RFLP (polimorfizm długości fragmentów restrykcyjnych):

Jest to marker molekularny oparty na hybrydyzacji. Zasada działania markera RFLP polega na trawieniu restrykcyjnym czystej próbki DNA przez enzymy restrykcyjne endonukleazy. Reprezentuje polimorfizm jako pojedyncze zmiany zasad.

(ii) RAPD (losowo amplifikowany polimorficzny DNA):

Jest to technika oparta na PCR (Polymerase Chain Reaction). Podstawową zasadą działania RAPD jest amplifikacja DNA za pomocą PCR. RAPD to szybsza technika.

(iii) AFLP (polimorfizm długości amplifikowanych fragmentów):

Jest to połączenie cech RAPD i RFLP. Podstawową zasadą działania AFLP jest amplifikacja PCR fragmentów genomu wytworzonych przez zastosowanie enzymów restrykcyjnych. AFLP to szybsza i mniej pracochłonna technika.

(iv) VNTR (zmienna liczba powtórzeń tandemowych):

Są one również nazywane minisatelitami. Polimorfizm w VNTR jest związany z liczbą powtarzających się jednostek w danej pozycji w chromosomie u różnych osobników,

(v) STR (krótkie powtórzenia tandemowe):

Są one również określane jako mikrosatelity. Wykazują polimorfizm ze względu na zmienność liczby powtórzeń. Są to idealne markery do opracowania mapy molekularnej o wysokiej rozdzielczości. Markery molekularne są wykorzystywane do budowy map genomowych roślin, a także zwierząt i mikroorganizmów. Jednak do mapowania wykorzystuje się również wiele innych technik, takich jak hybrydyzacja in situ itp.

Rodzaje map genów:

Na podstawie strategii stosowanych do przygotowania map genów, wyróżnia się następujące typy map genów:

Mapa genetyczna:

Uzyskuje się ją poprzez badania genetyczne przy użyciu zasad mendlowskich, takich jak krzyżowanie, łączenie itp. Takie mapy nie są uważane za bardzo dokładne. Dostarczają one tylko informacji o pozycji danych genów (tj. na którym chromosomie są obecne), a także dają wyobrażenie o względnej odległości między danymi genami.

Mapa powiązań to termin nadawany w szczególności dla tych map genetycznych, w których względne odległości między markerami genetycznymi lub danymi genami są mierzone pod względem częstotliwości rekombinacji między nimi. Jednostką odległości na mapie połączeń jest centiMorgan (cM) lub jednostka mapy. Jeden cM jest zdefiniowany jako odległość, która pozwala na 1% rekombinację między genami.

Podczas przygotowywania map powiązań badane są częstotliwości rekombinacji między genami. Dane oparte na takiej częstotliwości rekombinacji są przetwarzane w celu pomiaru odległości między genami.

W ostatnich latach wprowadzono szereg zaawansowanych programów komputerowych, które pomagają w szybkim i dokładnym przetwarzaniu danych o częstości rekombinacji, a tym samym konstruowaniu map sprzężeń genomów. Niektóre z takich programów komputerowych to: LINKAGE, MAPMAKER, CRI-MAP itp.

Jedną z głównych wad mapy genetycznej jest to, że czasami odległości między genami na mapie genetycznej nie odpowiadają rzeczywistej odległości między nimi na chromosomie. Wiele razy na mapach genetycznych mogą pozostać luki.

Dzieje się tak głównie dlatego, że na częstości rekombinacji (które są używane jako miara odległości między genami) w oczywisty sposób wpływają warunki środowiskowe oraz natura i pozycja mutantów użytych do badań.

Ostatnio opracowano różne techniki mapowania genetycznego. Obejmują one użycie sekwencji DNA, które nie są genami, ale wykazują zmienność w populacji. Takie sekwencje nazywane są markerami molekularnymi.

Najważniejsze markery molekularne wykorzystywane do mapowania genetycznego to:

(a) RFLP: Te polimorficzne markery zostały wykorzystane do mapowania genetycznego w wielu roślinach uprawnych, a także myszach, ludziach, Drosophila itp. Mapy genetyczne RFLP zostały dotychczas z powodzeniem opracowane dla pszenicy, ryżu, żyta, jęczmienia, pomidora, ziemniaka itp.

(b) RAPD: Mapy genetyczne są z powodzeniem przygotowywane przy użyciu techniki opartej na PCR o nazwie RAPD. Markery te zapewniają wygodniejszą i szybszą metodę mapowania genetycznego niż RFLP. Jednak mniej informacji dostarcza mapa genetyczna RAPD.

(c) Mapy genetyczne zostały pomyślnie skonstruowane przy użyciu minisatelitów (zwanych również zmienną liczbą powtórzeń tandemowych, VNTR) oraz mikrosatelitów (tj. krótkich powtórzeń tandomowych, STR).

(d) Do tworzenia map genetycznych można również stosować AFLP. Technika AFLP ma cechy zarówno RFLP, jak i RAPD i jest korzystniejszą i szybszą techniką konstruowania map genetycznych.

Mapa cytogenetyczna:

Można je również nazwać mapami cytologicznymi lub mapami chromosomów. Gdy geny są przypisane do określonych ramion chromosomów i pokazane są również ich odległości od centromeru, wówczas mapa jest znana jako mapa cytogenetyczna, a technika nazywa się mapowaniem cytogenetycznym.

Mapa cytogenetyczna umożliwia zlokalizowanie danych genów nie tylko na określonym chromosomie, ale również na określonych obszarach tego chromosomu. Mapowanie cytogenetyczne jest generalnie lepiej stosowane w przypadku tych organizmów, które mają większe chromosomy obserwowalne mikroskopowo.

Istnieją różne techniki, które można wykorzystać do budowy map cytogenetycznych. Niektóre z nich podano poniżej:

(a) FISH (Hybrydyzacja fluorescencyjna in-situ):

Technika hybrydyzacji in situ polega na wykrywaniu i lokalizacji pożądanej sekwencji DNA bezpośrednio w komórce. Gdy hybrydyzacja in situ obejmuje znakowanie cząsteczkami fluorescencyjnymi, nazywa się to hybrydyzacją fluorescencyjną in situ (FISH). Stosując FISH, geny mogą być zlokalizowane na chromosomie w komórce we właściwej kolejności, a tym samym zapewniają mapę cytogenetyczną.

Mapy cytogenetyczne można również przygotować przy użyciu markerów molekularnych, takich jak RFLP. W tym podejściu locus RFLP znajduje się w określonych regionach danego chromosomu.

(c) Stosowanie hybryd komórek somatycznych:

Hybrydy komórek somatycznych mające chromosomy o znanej identyczności zostały z powodzeniem zastosowane do przygotowania map cytogenetycznych, korzystnie u ludzi. Na przykład hybrydy komórek somatycznych człowieka i myszy doprowadziły do ​​zmapowania genów na ludzkim chromosomie do bardziej specyficznych regionów.

Mapa fizyczna:

Mapy te reprezentują prawidłową kolejność genów na chromosomie i są oparte na fizycznych odległościach między genami lub między genem a centromerem.

Na mapie fizycznej odległość nigdy nie jest podawana w centiMorganach, zamiast tego jest podawana jako liczba par zasad między genami. Mapy fizyczne są uważane za dokładniejsze niż mapy genetyczne. Ostatecznie prowadzą do uzyskania pełnego sekwencjonowania całego genomu, a także przy znajomości fizycznych odległości między genami.

Jest to rodzaj odwzorowania fizycznego, ponieważ w nim odległości podawane są w parach zasad. Jest to skuteczna technika mapowania genomu prokariotycznego. Przygotowanie map restrykcyjnych obejmuje zastosowanie enzymów restrykcyjnych endonukleaz, które rozszczepiają DNA w określonych miejscach. Aby przygotować mapę restrykcyjną, jeden lub więcej enzymów restrykcyjnych endonukleaz stosuje się do cięcia DNA w różnych miejscach (fig. 9).

W rezultacie otrzymuje się fragmenty DNA o różnej długości. Próbka zawierająca takie fragmenty DNA o różnej wielkości jest następnie poddawana technice zwanej elektroforezą żelową w celu rozdzielenia. W konsekwencji na żelu uzyskuje się szereg prążków, których położenie zależy od jego wielkości.

Ten żel z różnymi pasmami jest następnie kalibrowany za pomocą fragmentów DNA o znanej długości, aby uzyskać miejsca cięcia. Te miejsca cięcia są następnie identyfikowane i mapowane razem w celu wytworzenia pełnej mapy restrykcyjnej.

Różne techniki przygotowywania map fizycznych to:

(a) ISH (hybrydyzacja in situ) Technika:

Może być używany do mapowania fizycznego, co zostało z powodzeniem wykorzystane do uzyskania map fizycznych żyta, pszenicy i jęczmienia. Do mapowania fizycznego można również zastosować zaawansowaną technikę FISH (hybrydyzacja fluorescencyjna in-situ).

(b) Mapowanie fizyczne można również przeprowadzić za pomocą aberracji chromosomowych, takich jak duplikacja, delecja i translokacja.

(C) Mapy fizyczne można również opracować za pomocą odczynnika mapującego. Odczynnik mapujący jest w rzeczywistości zbiorem fragmentów DNA obejmujących cały chromosom lub cały genom.

(D) Technika chodzenia po chromosomach jest również pomocna w opracowywaniu map fizycznych. Jednak ta technika nie ma większego zastosowania w przypadku wyższych eukariontów ze względu na obecność bardzo powtarzających się sekwencji.

(mi) Używanie YAC (sztucznego chromosomu drożdży) okazało się również bardzo przydatne do fizycznego mapowania Drosophila i ludzi.

Znaczenie map genowych:

1. Mapy genów odgrywają ważną rolę w badaniach związanych z biotechnologią roślin i zwierząt.

2. Mapy genetyczne i fizyczne są ważne dla Human Genome Project (HGP).

3. Mapy genów pomagają genetykom w badaniu związków filogenetycznych i wzorców ewolucyjnych organizmów.

4. Są pomocne w charakterystyce zasobów genowych i szacowaniu różnorodności genetycznej.

5. Mapy genów mają ogromne zastosowanie w programach ulepszania upraw.

6. Mogą stanowić dodatkową pomoc w rozwiązywaniu problemów związanych z szeregiem szkodliwych zaburzeń genetycznych u człowieka.

Chodzenie na chromosomach:

Chodzenie chromosomowe jest ważnym aspektem cytogenetyki:

Jest to metoda analizy długich odcinków DNA. Stosując tę ​​technikę, można łatwo scharakteryzować duże regiony chromosomu o długości około 1000 kb. W przeciwieństwie do tego, konwencjonalne metody klonowania lub PFGE (elektroforeza żelowa w polu pulsacyjnym) itp. mogą scharakteryzować tylko segmenty chromosomu o długości około 100 kb.

Spacer po chromosomach odbywa się na fragmencie DNA zawierającym interesujący gen:

Proces rozpoczyna się od znanego genu obecnego w pobliżu interesującego genu na fragmencie DNA. W przypadku chodzenia po chromosomach klony będące przedmiotem zainteresowania pochodzą z biblioteki genomowej.

Podczas chodzenia po chromosomie, końcowy fragment sklonowanego fragmentu DNA jest subklonowany i jest używany jako sonda do odzyskania innego nakładającego się klonu z biblioteki genomowej. Mapowanie restrykcyjne takich nakładających się sekwencji można zastosować do skonstruowania oryginalnej sekwencji badanego odcinka DNA.

Są to znakowane cząsteczki DNA lub RNA, które służą do identyfikacji docelowych genów lub cząsteczek.

Klonowanie klonu nazywa się subklonowaniem.

Kroki w chodzeniu po chromosomach:

i. Pierwszy klon będący przedmiotem zainteresowania jest wybierany z biblioteki genomowej po zidentyfikowaniu przez sondę.

ii. Mały fragment z jednego końca tego klonu jest subklonowany.

iii. Ten subklonowany fragment jest teraz używany jako sonda i jest hybrydyzowany z innym klonem z biblioteki genomowej.

iv. Teraz drugi klon zhybrydyzowany z subklonem pierwszego klonu jest identyfikowany ze względu na obecność nakładającego się regionu.

v. Końcowy fragment drugiego klonu jest następnie subklonowany i używany do hybrydyzacji z innym klonem z biblioteki.

vi. Ponownie, trzeci klon zhybrydyzowany z subklonem drugiego klonu jest również identyfikowany ze względu na obecność nakładającego się regionu.

vii. Ten proces subklonowania i sondowania biblioteki genomowej jest powtarzany w celu odzyskania nakładających się klonów, aż do uzyskania interesującego genu.

viii. Mapy restrykcyjne nakładających się klonów można skonstruować tak, aby uzyskać całą sekwencję oryginalnego odcinka DNA (fig. 10).

Zastosowania chodzenia po chromosomach:

1. Ta technika jest z powodzeniem stosowana do charakteryzowania dużych regionów chromosomów.

2. Chodzenie po chromosomach jest stosowane do identyfikacji określonych genów.

3. Może być również używany do izolacji określonych genów.

4. Chodzenie po chromosomach jest techniką często wykorzystywaną do przygotowania map genomowych, zwłaszcza map fizycznych.

5. Ma to ogromne znaczenie w identyfikacji zaburzeń genetycznych u ludzi, takich jak mukowiscydoza, dystrofia mięśniowa itp.

Ograniczenia chodzenia po chromosomach:

1. Ta technika jest czasochłonna.

2. Jest to technika pracochłonna.

3. Wymaga budowy biblioteki genomowej.

4. Zwykle trudno jest przeprowadzić spacer po chromosomie w złożonych genomach eukariotycznych, takich jak ludzkie, ponieważ niosą one wysoce powtarzalne sekwencje.


Wyniki

Pokrycie znacznika i brakujące dane

Zbiór plazmy zarodkowej zbadany w tym eksperymencie składał się z 2711 dostępnych wsobnych przynależności kukurydzy zachowanych w kolekcji USDA-ARS NCRPIS (niektóre z nich miały więcej niż jedno źródło), kolejnych 417 kandydatów do włączenia do kolekcji USDA jako nowych źródeł różnorodności oraz 281 linii wsobnych kukurydzy z panelu asocjacyjnego kukurydzy Goodman [8]. Większość przyłączeń sekwencjonowano raz, z jedną reprezentatywną rośliną wybraną do ekstrakcji DNA, co dało pojedynczą próbkę GBS. Jednak dla 558 pozycji sekwencjonowano więcej niż jedną roślinę, aby można było porównać różne źródła, a zatem dostępna była więcej niż jedna próbka GBS. Co więcej, 326 próbek DNA zsekwencjonowano wielokrotnie jako replikacje techniczne. Zatem całkowita liczba próbek GBS przeanalizowanych w tym badaniu wyniosła 4351 (zob. plik dodatkowy 1). Z kompletnego zestawu 681.257 markerów SNP we wszystkich liniach kukurydzy przeanalizowanych do tej pory, wybraliśmy 620 279 polimorficznych SNP spośród naszych próbek. Te SNP są rozmieszczone wzdłuż 10 chromosomów kukurydzy i są bardziej skoncentrowane w regionach subtelomerowych niż pericentromerowych (Rysunek 1).

dystrybucja polimorfizmów pojedynczego nukleotydu (SNP) w całym genomie. Rozkład liczby SNP znalezionych w oknach 1 Mb w 10 chromosomach kukurydzy. Pozycje centromerów są pokazane na czarno.

Średnia stopa błędu wywołania podstawowego na podstawie powtórzonych próbek wyniosła 0,18%. Dodatkowy poziom kontroli jakości zapewniło około 7000 SNP, które pokrywały się z tymi uzyskanymi za pomocą dużej macierzy genotypowania [19] dla 281 inbredów kukurydzy z panelu stowarzyszeniowego Goodmana. Średni wskaźnik rozbieżności między genotypami GBS i SNP macierzy dla wszystkich połączeń wyniósł 1,8%. Po wykluczeniu z porównania połączeń heterozygotycznych współczynnik rozbieżności zmniejszył się do 0,58%.

Średni zasięg (wskaźnik połączeń SNP) w próbce wyniósł 35%, przy wartościach od 2 do 75%. Jednak gdy próbki były sekwencjonowane więcej niż raz, pokrycie znacznie się poprawiło. Na przykład panel asocjacyjny Goodmana został oceniony dwukrotnie i zmniejszył średnią brakujących danych z 63% w oparciu o pojedynczy przebieg do 35% dla połączonych danych. Stwierdzono, że rodzice zagnieżdżonego mapowania asocjacyjnego (NAM) [18], objęci siedmioma powtórzonymi przebiegami sekwencjonowania, mają tylko 23% brakujących danych. Linia wsobna SA24, wykorzystany jako kontrola, został przeanalizowany ponad 25 razy i miał tylko 16% brakujących danych. Ponadto zasięg w dużym stopniu zależał od genotypu. Znacznej liczby całkowitych odczytów nie można było dopasować do genomu referencyjnego, niektóre z powodu ograniczonej czułości oprogramowania Burrows-Wheeler Alignment (BWA), ale większość z powodu zmienności obecności/nieobecności (PAV). Korzystanie z B73 genom referencyjny zaowocował inbredami ściślej spokrewnionymi z B73 osiągając wartości poniżej 20% brakujących danych przy tylko dwóch próbkach, podczas gdy bardziej odległe inbredy utrzymywały wartości około 30% brakujących danych nawet po kilku powtórzeniach sekwencjonowania.

Imputacja brakujących danych została przeprowadzona za pomocą algorytmu, który szukał najbliższego sąsiada w małych oknach SNP w całej naszej bazie kukurydzy (około 22 000 Zea próbki), dopuszczając 5% niedopasowanie. Jeśli wymagania nie zostały spełnione, SNP nie został imputowany, pozostawiając tylko około 10% danych nieprzypisanych. Porównując imputowane dane GBS z wynikami z tablicy genotypowania [19] dla 281 inbredów kukurydzy z panelu asocjacyjnego Goodmana, mediana rozbieżności dla wszystkich wezwań wyniosła 4%. Z wyłączeniem połączeń heterozygotycznych, mediana współczynnika błędu wynosiła 1,83%. Dane imputowane zostały wykorzystane tylko do wykonania analizy GWAS.

Integralność i związki rodowodowe kolekcji plazmy zarodkowej

Kuratorskie zarządzanie tak ogromną kolekcją rośliny jednorocznej jest wyzwaniem, a różne etapy procesu mogą powodować problemy, takie jak błędy lub powielanie materiałów. Jednak gdy obliczyliśmy proporcję markerów identycznych według stanu (IBS) dla wszystkich par linii (ryc. 2A), dane GBS wykazały, że ponad 98% z około 2200 próbek, które miały wspólną nazwę dostępu, miało więcej niż 0,99 IBS, nawet gdy pochodzą z różnych próbek inwentaryzacyjnych (Rysunek 2B). Większość niezgodności wywodziła się z problemów na etapie manipulacji DNA. To pokazało, że problemy z błędną klasyfikacją lub zanieczyszczeniem nie są powszechne w banku. Gdy dostępna była więcej niż jedna próbka na przystąpienie, wykryto zmienność wewnątrzakcesyjną (Rysunek 2B). Dla tych przystąpień wartość IBS była niższa niż oczekiwano, ze względu na resztkową heterozygotyczność. Jednak w przypadku większości przyłączeń w tym badaniu przeanalizowano tylko jedną roślinę, a zatem nie można było ocenić zmienności wewnątrzakcesyjnej. W oparciu o nasze średnie stopy błędów wybraliśmy 0,99 jako wartość konserwatywną, aby założyć, że dwie różne próbki o tej samej nazwie, ale o różnym pochodzeniu, są w rzeczywistości tym samym przystąpieniem. Gdy dostępne były więcej niż dwie próbki na przystąpienie, jeśli wartości IBS były zgodne między wszystkimi porównaniami, uznaliśmy, że różnice są wynikiem resztkowej heterozygotyczności. Połączyliśmy informacje z replikowanych próbek, które spełniły te kryteria, aby uzyskać ostateczną listę 2815 unikalnych linii wsobnych kukurydzy.

Identyczny rozkład według stanu (IBS) w próbkach GBS. Rozkład wartości IBS na (A) 2815 przystąpień i (B) dla przystąpień z wieloma próbkami.

Rozwój wsobny kukurydzy na świecie został osiągnięty na wiele różnych sposobów, ale niektóre z najczęstszych procedur polegają na mieszaniu istniejących elitarnych materiałów lub włączaniu pożądanej cechy dawcy do elitarnej linii wsobnej poprzez krzyżowanie wsteczne [20]. Spodziewaliśmy się więc, że duża liczba linii wsobnych w naszej kolekcji będzie blisko spokrewniona. Używając IBS, zbadaliśmy rozkład relacji IBS (Rysunek 2A) i 10 najbliższych sąsiadów dla każdej unikalnej linii wsobnej (patrz Dodatkowy plik 2). Dane odzwierciedlają ciągłą wymianę i udoskonalanie plazmy zarodkowej, które miały miejsce w historii hodowli kukurydzy oraz wysiłki hodowców, aby wprowadzić nową różnorodność do swoich programów. Obliczyliśmy identyczność przez pochodzenie (IBD) dla wszystkich możliwych kombinacji par wsobnych i stwierdziliśmy, że 603 linie (21% kolekcji) miały co najmniej jedno inne przystąpienie, które było w 97% identyczne (równe oczekiwanemu związkowi między rodzicami wsobnymi i potomstwo pochodzące z czterech krzyżówek wstecznych z tym rodzicem). W przypadku niektórych ważniejszych historycznie linii wsobnych liczba związków przekroczyła 10. Na przykład B73 dzieli ponad 97% swojego genomu z ponad 50 inbredami (ryc. 3), co jest zgodne z jego wkładem w rodowody wielu ważnych linii handlowych [21].

B73 schemat sieci. Relacje sieciowe linii wsobnych kukurydzy o wartościach IBS większych niż 0,97 dla B73.

Sieć powiązań uzyskana przy użyciu danych GBS (zob. plik dodatkowy 3), w połączeniu z informacjami o rodowodach, stanowi narzędzie do identyfikacji anomalii i potencjalnych błędów w tożsamości przystąpień. Dane te, w rękach ekspertów ds. plazmy zarodkowej kukurydzy (na przykład kuratora kukurydzy USDA), mogą zostać wykorzystane do identyfikacji akcesorii, które mogły zostać błędnie sklasyfikowane, wyboru najlepszych źródeł namnażania/dystrybucji, eliminacji duplikacji, wyboru podstawowych kolekcji, dodawania lub polecania nowe pozycje eksperymentalne i teoretycznie ocena zmian profilu genetycznego w kolejnych regeneracjach, kolejny środek zapewniający jakość.

Struktura populacji

Linie kukurydzy z programów hodowlanych o różnych celach i środowiskach zostały uwzględnione w naszym ostatecznym zestawie linii (patrz Dodatkowy plik 1). Oczekuje się, że różne grupy plazmy zarodkowej spowodują stratyfikację populacji [7, 8]. Analiza macierzy podobieństwa przy użyciu analizy głównych współrzędnych (PCoA) z wykresem skalowania wielowymiarowego (MDS) wykazała, że ​​dane GBS mogą opisywać zmienność genetyczną wśród naszych linii hodowlanych zgodnie z ich znaną historią przodków (ryc. 4A). Na przykład, inbredy zgrupowane w różnych subpopulacjach wzdłuż osi PCo1, z materiałami tropikalnymi po jednej stronie i słodką kukurydzą, pochodzącą z materiałów z krzemienia północnego, po drugiej.

Wielowymiarowe skanowanie dla 2815 linii wsobnych kukurydzy. Powiązania genetyczne między liniami wsobnymi kukurydzy zachowanymi w banku plazmy zarodka NCRPIS zwizualizowane za pomocą analizy głównych współrzędnych macierzy odległości. Osie × i Y reprezentują odpowiednio PCo1 i PCo2. Kolory są przydzielane na podstawie (A) struktura populacji lub (B) program hodowlany. Linie wsobne uzyskane bezpośrednio od ras lokalnych bez selekcji są podświetlone na czerwono, aby służyć jako odniesienie.

Kiedy inbredy zostały sklasyfikowane zgodnie z programem hodowlanym pochodzenia (ryc. 4B), różne programy hodowlane również miały tendencję do grupowania się razem, przy czym większość programów amerykańskich w dwóch głównych grupach plazmy zarodkowej rozpoznawanych przez hodowców kukurydzy o umiarkowanym klimacie (określanych jako sztywne łodygi i niesztywna łodyga [21]). Jednak niektóre linie wsobne w USA (na przykład przystosowane do klimatu umiarkowane linie all-tropikalne opracowane na Uniwersytecie Stanowym Karoliny Północnej) okazały się przeplatać z liniami tropikalnymi z CIMMYT (Międzynarodowe Centrum Ulepszania Kukurydzy i Pszenicy), podczas gdy inne (na przykład , półegzotyczne inbredy z programu Germplasm Enhancement of Maize (GEM), pochodzące ze skrzyżowania linii USA i linii tropikalnych) znajdowały się pomiędzy sztywną łodygą/niesztywną łodygą a kępami tropikalnymi. Wreszcie, inne materiały z programów międzynarodowych (na przykład Hiszpania, Francja, Chiny, Argentyna lub Australia) wydają się przedstawiać zasoby plazmy zarodkowej inne niż te powszechnie używane w programach północnoamerykańskich. Zgodnie z oczekiwaniami zwykle nie tworzyły one klastrów z żadną z pozostałych grup.

Rozkład alleli i częstotliwości alleli

Widmo częstotliwości miejsca (SFS) dla całej kolekcji wykazało, że większość SNP w panelu wsobnym Amesa (68%) miała częstość mniejszych alleli (MAF) poniżej 0,1, przy czym ponad połowa wszystkich SNP była rzadka (MAF < 0,05) (Rysunek 5). Wynik ten sugeruje, że niektóre allele mogą być unikalne dla różnych podgrup plazmy zarodkowej. Aby porównać poziomy zróżnicowania między różnymi grupami plazmy zarodkowej, przeanalizowaliśmy procent alleli obecnych w tych grupach. Stwierdzono, że inbredy pochodzenia tropikalnego zawierają 77% całkowitej różnorodności allelicznej kolekcji, podczas gdy grupy niesztywnych łodyg i sztywne łodygi stanowią znaczne wąskie gardło, z zaledwie 48% i 42% całkowitej różnorodności allelicznej. , odpowiednio, będąc obecnym. Z całkowitej liczby polimorficznych SNP tylko około 35% było wspólnych dla wszystkich trzech grup (Rysunek 5). Inną różnicą między sztywną szypułką/niesztywną szypułką a resztą zbioru była zmiana rozkładu MAF, przy czym ponad połowa ich SNP (odpowiednio 68% i 59%) miała MAF większy niż 0,1. Natomiast panel asocjacyjny Goodmana uchwycił 75% całkowitej różnorodności alleli i był wysoce reprezentatywny dla całej kolekcji, z SFS podobnym do uzyskanego przy użyciu wszystkich próbek. Zróżnicowany panel utworzony przez 27 założycieli NAM i IBM z inbredu kukurydzy zawierał 57% ogólnej różnorodności alleli, co pokazuje, że nawet przy bardzo małej liczbie próbek NAM uchwycił ponad połowę całkowitej różnorodności alleli obecnej w kolekcji linii wsobnej .

Rozkład częstotliwości występowania mniejszych alleli (MAF) i odsetek polimorfizmów pojedynczego nukleotydu (SNP) wspólnych dla subpopulacji kukurydzy. Histogram dystrybucji MAF we wszystkich grupach i skumulowany procent SNP dzielonych między różnymi grupami plazmy zarodkowej dla każdej klasy MAF. Kolumny reprezentują procent SNP w każdej linii kategorii MAF reprezentują procent alleli dzielonych między grupami plazmy zarodkowej o równej lub mniejszej wartości MAF.

Zarówno kanadyjskie, jak i amerykańskie publiczne wysiłki hodowlane z powodzeniem włączyły różnorodność genetyczną. Łącznie te linie wsobne zawierały 83% całkowitej różnorodności allelicznej kolekcji. Jednak tylko niewielka ilość tej różnorodności została wykorzystana komercyjnie, a zastrzeżona plazma zarodkowa z Expired Plant Variety Protection (ExPVP) zawiera tylko 45% całkowitej liczby polimorficznych SNP. Co więcej, prywatne wysiłki hodowlane sprzyjały rozbieżności między trzema głównymi basenami heterotycznymi (sztywna łodyga, niesztywna łodyga i jodent). Analizując relacje sieciowe dla inbredów ExPVP, stwierdzono, że tylko 2% par relacji IBS z ponad 90% IBS znajduje się między inbredami z różnych pul heterotycznych (ryc. 6A), a tylko 30% całkowitych SNP segreguje w Materiały ExPVP były wspólne dla wszystkich trzech grup plazmy zarodkowej (Figura 6B).

Schemat sieci ochrony przeterminowanych odmian roślin (ExPVP) i rozkład segregującego polimorfizmu pojedynczego nukleotydu (SNP). (A) Sieć powiązań dla inbredów ExPVP skonstruowanych przy użyciu identycznych wartości według stanu (IBS) większych niż 0,9. Każda kropka (linia wsobna) ma przypisany inny kolor w zależności od firmy, w której została wyhodowana. (B) Rozkład segregujących SNP między trzema grupami heterotycznymi, które tworzą trzy główne klastry na wykresie sieci.

Przeanalizowaliśmy również indeksy fiksacji parami (Fst) między różnymi grupami akcesji. Małe szacunki Fst, średnio tylko 0,06, wskazują, że istnieje umiarkowane zróżnicowanie [22] między populacjami kukurydzy tropikalnej, o sztywnych szypułkach i niesztywnej szypułce. Analiza parami Fst i średniej dywergencji nukleotydów między różnymi programami hodowlanymi USA (tabela 1) potwierdziła obraz uzyskany poprzez analizę odległości genetycznych. Większość z tych programów wykorzystywała podobne źródła różnorodności, ze średnim Fst dla par równym 0,04. Chociaż maksymalne wartości rozbieżności nukleotydów między programami różniły się, średnie wartości dla wszystkich porównań wynosiły około 0,14 (Tabela 1). Główne firmy komercyjne, odpowiedzialne za większość kukurydzy uprawianej w USA, miały bardzo podobne strategie przy podejmowaniu decyzji, które źródła plazmy zarodkowej przyniosą korzyści ich programom hodowlanym i na podstawie danych uzyskanych z ich ExPVP ich populacje różnią się genetycznie tylko o 3 %. Mieli również najmniejszą wartość dla średniej dywergencji nukleotydów (0,13).

W obrębie chromosomów wszystkie grupy konsekwentnie wykazywały mniejsze wartości Fst i niższy MAF w regionach pericentromerowych w porównaniu z pozostałą częścią genomu.

Różnorodność genetyczna

Aby ocenić poziomy różnorodności i dywergencji w całej kolekcji i w różnych grupach plazmy zarodkowej, obliczyliśmy LD, długość haplotypu i zróżnicowanie populacji (Fst) w całym genomie kukurydzy. Obliczyliśmy również korelację między tymi pomiarami a wcześniejszymi szybkościami rekombinacji w całym genomie oszacowanymi za pomocą NAM [23] (ryc. 7).

Relacje parami w całym genomie między różnymi pomiarami różnorodności genetycznej. Relacje między szybkością rekombinacji zagnieżdżonego mapowania asocjacji (NAM) (log10 cM/Mb), średnia długość haplotypu (pz), średnia LD (r 2) oraz indeksy fiksacji (Fst) między szypułką sztywną, szypułką niesztywną i liniami tropikalnymi w skali NAM mapy genetycznej. Liczby wskazują współczynnik determinacji (r 2) obliczone przy użyciu korelacji rang Spearmana. LD, nierównowaga sprzężenia.

LD rozpadło się bardzo szybko w całej kolekcji i osiągnęło średnią r 2 z 0,2 w obrębie około 1 Kb (ryc. 8), ale wariancja jest duża, ponieważ poziom LD jest zależny od konkretnej grupy plazmy zarodkowej i regionu genomu, co można zobaczyć z różnicami dla wartości mediany dla r 2 w obrębie różnych grup plazmy zarodkowej (zob. plik dodatkowy 4). Zanik LD był wolniejszy w grupach ze sztywną szypułką, niesztywną szypułką i ExPVP, dla których średnia r 2 0,2 ​​nie osiągnięto aż do odległości około 10 Kb. Materiały tropikalne wykazywały najszybszy zanik LD o wartościach zbliżonych do całej próbki.

Spadek nierównowagi sprzężeń całego genomu (LD) we wszystkich inbredach kukurydzy. Średni zanik LD mierzony parami r 2 między wszystkimi polimorfizmami pojedynczego nukleotydu w kolekcji. Czerwona linia reprezentuje średnią wartość, podczas gdy ciemniejszy szary obszar reprezentuje 50% zakres wartości, a jasnoszary 90%.

Średnia długość haplotypu markera GBS, oszacowana wokół każdego SNP jako liczba sąsiadujących SNP, które dwie losowe linie z grupy, rozciągające się od punktu ogniskowego do przodu w obu kierunkach, wynosiła 52 SNP (około 1,4 Mb) dla całej kolekcji, z mniejsza długość w materiałach tropikalnych (44 SNP) i znacznie większa długość w grupach niesztywnych łodyg (152 SNP) i sztywnych (495 SNP). Grupa ExPVP wykazała również dużą średnią długość haplotypu wynoszącą 200 SNP (około 5,1 Mb), ze średnią długością haplotypu większą dla linii opracowanych przez programy hodowlane obecnie należące do Monsanto niż dla linii Pioneer. Podstawowe kolekcje, takie jak panel asocjacyjny Goodmana lub rodzice NAM, które zostały wybrane w celu maksymalizacji różnorodności, miały najmniejsze długości haplotypów (odpowiednio 81 i 48 SNP) (Tabela 2). Długości haplotypów dla całej próby wykazały wysoką korelację z szacunkami szybkości rekombinacji w NAM (korelacja Spearmana r 2 =0,74) (patrz Dodatkowy plik 5, Rysunek 7).

Żadna z pozostałych testowanych korelacji nie była silna, prawdopodobnie z powodu dużego zróżnicowania próby i dużego fizycznego rozmiaru bin mapy genetycznej NAM (średnia 2,4 Mb). Jednak wskaźniki fiksacji między obiema grupami umiarkowanymi i materiałami tropikalnymi wykazały r 2 z 0,26, co wskazuje na wspólne różnice w częstości alleli między grupami, prawdopodobnie związane z wąskim gardłem adaptacji.

Ponadto, analizując cały chromosom ze wszystkimi próbkami, stwierdzono, że chromosom 4 ma większą długość haplotypu (miejsca) w porównaniu z resztą chromosomów (Tabela 2). Patrząc na odległość fizyczną (w Mb), wzrost ten był stały we wszystkich grupach. Jeden region na chromosomie 4, który wydawał się zwiększać średnią długość haplotypu, znajduje się między 40 a 65 Mb, region z ważnymi genami związanymi z procesami udomowienia i doskonalenia [24, 25]. Region ten wykazywał również mniejszą różnorodność i MAF. Sztywna łodyga, niesztywna łodyga i grupy ExPVP wykazują również dłuższą niż przeciętna długość haplotypu dla chromosomu 10, gdzie zlokalizowany jest jeden z głównych genów odpowiedzi na fotoperiod [26].

Badania asocjacyjne całego genomu

Zestaw plazmy zarodkowej zachowany w kolekcji USDA jest obszerny i publicznie dostępny i zawiera dużą ilość różnorodności alleli oraz szybki rozkład LD. Z tych powodów chcieliśmy zbadać jego możliwe zastosowanie jako panelu do badania cech ilościowych w połączeniu ze strategią danych o niskim pokryciu w wielu próbach. Wykorzystaliśmy prostą cechę mendlowską, a mianowicie kolor jądra, z przybliżoną częstotliwością 20% dla białych ziaren w naszej populacji, aby wykonać GWAS przy użyciu markerów GBS. SNP z najsilniejszym powiązaniem (P = 10 -86 ) z kolorem jądra znaleziono w obrębie Y1 gen, który zmniejsza obecność barwników karotenoidowych w bielmie [27] (zob. plik dodatkowy 6, ryc. 9).

Badanie asocjacyjne całego genomu (GWAS) dla ziarniaków żółtych i białych. GWAS dla koloru jądra na 1595 liniach wsobnych kukurydzy z żółtymi lub białymi jądrami.

Ponieważ oczekuje się, że zdolność wykrywania alleli przy niższych częstotliwościach będzie mniejsza, postanowiliśmy przetestować inną cechę Mendla, słodką kukurydzę w porównaniu z kukurydzą skrobiową, gdzie słodki fenotyp występuje ze znacznie mniejszą częstotliwością (5%) niż typ białego ziarna. Na tę cechę wpłynęła silna presja selekcyjna, zarówno podczas udomowienia, jak i procesu hodowlanego [28], skutkująca rozległym blokiem podwyższonego LD wokół docelowego obszaru, zwłaszcza gdy linia wsobna jest linią zębową, która została przekształcona w linię słodką . Dwa SNP o najsilniejszym związku (P wartości od 10 -61 do 10 -52 ) zdefiniowano przedział 14 Mb zawierający Su1, gen, który uczestniczy w biosyntezie skrobi z jądra [29] (patrz plik dodatkowy 7, rysunek 10).

Badanie asocjacyjne całego genomu (GWAS) dla kukurydzy słodkiej i skrobiowej. GWAS dla koloru jądra na 2145 liniach wsobnych kukurydzy ze słodkimi lub skrobiowymi jądrami. SNP, polimorfizm pojedynczego nukleotydu.

Na koniec przetestowaliśmy moc tego panelu asocjacyjnego ze złożoną cechą, liczbą stopniodni wzrostu od posadzenia do dnia, w którym 50% roślin wykazuje jedwab (patrz plik dodatkowy 8, rysunek 11). Najlepsze skojarzenie, z P = 10 -23 , leży około 2 Kb od ZmCCT, ważny gen związany z odpowiedzią fotoperiodową i czasem kwitnienia kukurydzy [26]. Drugie najsilniejsze skojarzenia (P wartości między 10 -18 a 10 -14 ) znajdują się na chromosomie 8, otaczając region, w którym Vgt1, znajduje się jeden z głównych okresów kwitnienia QTL dla kukurydzy [30]. Następne najlepsze trafienie na chromosomie 3 (P = 10 -14 ) nie ma żadnego zidentyfikowanego powiązania genów kandydujących, ale pokrywa się z jednym z QTL czasu kwitnienia wykrytym przy użyciu NAM [31]. Trafienie chromosomu 7 (P = 10 -12 ) również pokrywa się z jednym z czasów kwitnienia NAM QTL [31] i jest zbliżony do genu czasu kwitnienia kukurydzy DLF1 – opóźniony kwitnienie1 [32] oraz gen GRMZM2G017016, przypuszczalny ortolog Arabidopsis PT-Frigida gen [33]. Piąte najlepsze trafienie, na chromosomie 1, znajduje się w pobliżu bardzo interesującego zestawu genów rozmieszczonych w przedziale 3 Mb, gdzie teosinte-rozgałęziony1 oraz karzeł8 flankować z jednej strony, podczas gdy Fitochrom A1 flankuje drugą stronę [34]. Gen, GRMZM2G144346, zawierający CCT domena również znajduje się w regionie, zaledwie 0,2 Mb od naszego hitu. Ostatnie prace sugerują, że karzeł8 był celem selekcji we wczesnych liniach kwitnienia [35, 36], ale jest mało prawdopodobne, aby bezpośrednio wpływał na czas kwitnienia [37]. Regiony te z pewnością wymagają dalszych badań.

Badanie asocjacyjne całego genomu (GWAS) dotyczące wzrostu stopni-dni do jedwabiu. GWAS do uprawy stopniodni do 50% jedwabiu na 2279 liniach wsobnych kukurydzy. NAM, zagnieżdżone mapowanie asocjacji QTL, loci cech ilościowych.


Dyskusja

Elementy transpozycyjne są ważnymi ewolucyjnymi składnikami genomu. Chociaż opublikowano różne badania dotyczące funkcji i różnorodności TE24,25, rozmieszczenie i rola TE u niektórych gatunków, zwłaszcza ryb, pozostają w dużej mierze nieznane ze względu na ich skomplikowane genomy24. W tym badaniu wykorzystaliśmy biblioteki TE specyficzne dla gatunku w FishTEDB, wraz z bibliotekami dodatkowych dziewięciu gatunków, aby przeanalizować różne klasyfikacje TE. Zbadano obfitość, różnorodność, aktywność i ewolucję TE i powiązano je z rozmiarem genomu i historią ewolucyjną ryb.

Z ponad 33 900 znanymi gatunkami (FishBase, http://www.fishbase.org/, wersja 02/2018), ryby stanowią większość kręgowców. Nic więc dziwnego, że wśród gatunków ryb zaobserwowano niezwykłe różnice w morfologii, strukturze populacji i wielkości genomu. W szczególności różnice w wielkości genomu mogą wynosić do 379,5 razy (0,35–133 Gb) 16 . W tym badaniu zaobserwowaliśmy znaczne zróżnicowanie zawartości TE (5-56%) wśród analizowanych gatunków ryb. Taka zmienność była nie tylko ograniczona do ogólnych poziomów zgodnie z naszą analizą statystyczną różnych klasyfikacji, różnorodność może być również bardziej zmienna i złożona. Genomy ryb zawierały głównie transpozony DNA i LINE, podczas gdy SINE były najmniej liczne. Koncentrując się na superrodzinach TE, Tc/mariner, kapelusz, L1, L2, oraz cygański okazały się najbardziej rozpowszechnione wśród analizowanych genomów ryb. Większość TE wykazuje nierównomierny rozkład, co wskazuje na wielokrotne zdarzenia utraty i zysku. Były jednak pewne wyjątki od tego trendu różnorodności TE. Na przykład u żarłacza słoniowego (Chondrichthyes) najbardziej rozpowszechnionymi TE były nadrodziny LINE L2 oraz CR1, a nie Tc/mariner oraz kapelusz. SINE były również dobrze reprezentowane, podczas gdy wykryto tylko kilka transpozonów DNA.Dlatego też nasze wyniki wskazywały również, że krajobrazy TE u ryb chrzęstnych mogą być bardziej podobne do tych u ryb bezszczękowych niż u ryb kostnych 26 . W genomie afrykańskiego celakanta (Sarcopterygii) CR1, L1, oraz L2 (LINIE) były dominujące. Jednak u tego gatunku transpozony DNA uległy niedawno transpozycji, a SINE nie były dobrze reprezentowane. Cechy te występowały również u niektórych czworonogów, na przykład Squamata, Testudines, Crocodilia i Aves 24 . Dane wskazują zatem, że krajobraz TE w afrykańskim celakancie może być podobny do tego u czworonogów. Jest to zgodne z wcześniejszymi badaniami powiązań filogenetycznych tych gatunków 27 . Podsumowując, TE ryb były regularnie rozmieszczone, a związek między gatunkami o podobnej regularności dystrybucji był zgodny z zależnością filogenetyczną. Wskazuje to, że TE odgrywają kluczową rolę w ewolucji ryb.

Nasza analiza nadrodzin TE sugeruje krytyczną rolę CR1 nadrodzina w ewolucji kręgowców. W rzeczywistości wśród najwcześniej rozbieżnych ryb (C. mili, L. chalumnae, L. oculatus, oraz P. marinus), B. belcherioraz czworonogi (zwierzęta lądowe), CR1 pierwiastki wydawały się mieć silny wkład w genom i często były szeroko rozpowszechnione 22,24 . Jednak doskonałokostny zawiera mniej tych pierwiastków, co sugeruje, że CR1 nadrodzina istniała u kręgowców przodków, a podczas ewolucji ryb nastąpiła znaczna strata. Niemniej jednak te elementy zostały zachowane i rozmnożyły się od przejścia wodnego do lądowego u czworonogów. Chociaż poprzednie badania wskazywały, że TE są ważne dla ewolucji genomu i mogą wpływać na adaptację ryb do różnych siedlisk 28 , konieczne byłyby dodatkowe badania, aby odkryć pełną funkcję i ewolucyjną rolę CR1 nadrodzina u ryb i innych gatunków.

Z wyjątkiem rekinów słoniowych i afrykańskich celakantów obecność i poziom niektórych nadrodzin wydawały się być wysoce specyficzne gatunkowo. Na przykład zaobserwowaliśmy cygański w B. pectinirostris, L2 oraz RTE w N. furzeri, Tc/mariner w A. mexicanus, oraz kapelusz w D. rerio. W rzeczywistości straty i zyski określonych TE podczas ewolucji wydawały się przede wszystkim decydować o zawartości i rozmieszczeniu różnych nadrodzin w każdym gatunku. Ponieważ maszyneria obronna genomu (np. metylacja DNA, małe RNA oddziałujące z Piwi) reguluje TE, proces strat i zysków musi być powiązany z genomami gospodarza29. Wcześniejsze badania wskazywały, że TE mogą mieć znaczenie biologiczne ze względu na ich interakcję z genomem gospodarza, podobnie jak interakcje gatunków z ekosystemami. Podobieństwo między genomami a ekosystemami zostało po raz pierwszy nakreślone w 1989 r. przez Holmquista 30 , który zasugerował, że składniki genomu mogą być różnymi niszami. Nisze te obejmują ciemno zabarwione, heterochromatyczne pasma chromosomów i TE. Podobnie jak organizmy w ich siedliskach, TE rozmnażają się i wykorzystują zasoby w środowisku genomu, jednocześnie oddziałując ze sobą 31 . Podobnie czerwona Królowa paradygmat odnosi się do interakcji między genomami gospodarza a TE, opisując antagonistyczny związek, który nieustannie ewoluuje. Naukowcy zaproponowali, że te analogie będą przydatne w zrozumieniu obfitości i różnorodności TE32. W połączeniu z teorią doboru naturalnego istnieje większe prawdopodobieństwo eliminacji TE, które konkurują z genomem gospodarza (szkodliwe TE), podczas gdy TE korzystne dla genomu gospodarza są bardziej prawdopodobne. Dlatego nadrodziny, które są wysoce specyficzne dla niektórych gatunków ryb, powinny być uważane za ważnych graczy w ewolucji genomu i mogą być powiązane z biologicznymi cechami samego gatunku.

Podobnie jak liczba genów i liczba intronów, zawartość TE jest również kluczowym parametrem genomowym. W wielu badaniach opisano pozytywny związek między poziomami TE a wielkością genomu 23,33,34,35, a TE zostały powszechnie uznane za czynnik stymulujący wielkość genomu. Nasza analiza potwierdza ten wniosek w przypadku ryb. Poprzez dalszą analizę korelacji potwierdziliśmy również, że wpływ retrotranspozonów (Klasa I) na wielkość genomu był wyższy niż wpływ transpozonów DNA (Klasa II). Spośród różnych typów retrotranspozonów LTR wydawały się być istotnie skorelowane z wielkością genomu. Jednak pomimo różnych transpozonów DNA (Helitron, Politycznie niezależny, Kolobok, CMC, oraz P), LTR (DIRS), Linie (L1, L2, oraz i) i SINE (5S) są pozytywnie skorelowane z rozmiarem genomu, to czy te TE wpływają na rozmiar genomu pozostaje niejasne, ponieważ większość z nich była obecna tylko na niskim poziomie w genomach ryb. Tak więc, chociaż zrozumienie pełnej funkcji TE wymagałoby dalszych badań, w przypadku ryb rzeczywiście występowała ogólna tendencja, zgodnie z którą zawartość TE wzrastała wraz ze wzrostem wielkości genomu.

Oprócz analizy związku między zawartością TE a rozmiarem genomu, oceniliśmy również ewolucję TE i aktywność związaną z wybuchami transpozycji. Wybuchy transpozycji występują co najmniej raz lub dwa, jeśli nie więcej, w historii ewolucji ryby. W rzeczywistości istnieją aktywne i nieaktywne okresy TE w całym „cyklu życia” TE, który rozpoczyna się inwazją TE do nowego genomu (poprzez transfer poziomy) lub ewolucją nowej, odrębnej linii TE z wcześniej istniejącej jeden (poprzez mutację genetyczną). Chociaż nowy pierwiastek może zadomowić się w genomie, gospodarz może również zabezpieczyć się przed tą zmianą, a proliferacja może zostać ograniczona. Jednakże, jeśli insercja jest w jakiś sposób korzystna dla gospodarza, wtedy TE zostanie zachowany i nastąpi koewolucja elementu i gospodarza36,37,38,39. Zatem impulsy transpozycji prawdopodobnie są związane z istotnymi zdarzeniami ewolucyjnymi, co potwierdzają wcześniejsze badania, które łączyły specjację z wysoką aktywnością TE5,40,41. W niniejszym opracowaniu treść M. zebra impuls transpozycji był najwyższy wśród wszystkich badanych gatunków. Zaobserwowaliśmy również niezwykle wysoki odsetek niedawnych wybuchów w M. zebra pielęgnic afrykańskich. Pielęgnice afrykańskie słyną z dużego, zróżnicowanego i replikowanego promieniowania adaptacyjnego w Wielkich Jeziorach Afryki Wschodniej 42 . Aktywność TE jest ściśle związana z powstawaniem gatunków i promieniowaniem adaptacyjnym 41,43,44 . Dlatego na podstawie naszych danych uważamy, że TE mogą mieć potencjał do dalszego różnicowania. Jednak zjawisko impulsu TE nie jest wyjątkowe Późny kalcarifer wydaje się, że przeszedł podobny proces. Nie mogliśmy jednak spekulować, czy zjawisko to ma związek z promieniowaniem adaptacyjnym, skoro istnienie promieniowania adaptacyjnego w procesie ewolucyjnym L. calcarifer nie został jeszcze zgłoszony. Dodatkowo nie mogliśmy wykluczyć innych czynników, takich jak adaptacja środowiskowa 45,46,47 . W przypadku węgorzy japońskich i europejskich istnieją oczywiste różnice w R2 oraz Helitron wybuchy transpozonów, pomimo podobnych krajobrazów TE. Mogło to mieć miejsce podczas lub po zróżnicowaniu ich wspólnych przodków i odtąd się zachowało.


Wzorce TE w głównych rodowodach kręgowców

Ryby

Ryby są tu zdefiniowane jako grupa parafiletyczna składająca się z ryb bezszczękowych, chrzęstno-płetwych, płetwiastych i płetwiastych (w tym coelacanth i lungfish), obejmująca w ten sposób pięć najgłębszych linii kręgowców (Amemiya et al. 2013). Istnieje dramatyczne zróżnicowanie liczby i składu kopii TE w różnych taksonach ryb, wahające się od 55% u danio pręgowanego (Danio rerio) do zaledwie 6% u rozdymka zielonoplamistego (Tetraodon nigroviridis), jeden z najmniejszych znanych genomów kręgowców (Crollius i wsp. 2000 Volff i wsp. 2003 Howe i wsp. 2013). Obecne są wszystkie główne typy TE eukariotycznych, a ryby wykazują ogólnie większą różnorodność TE niż inne grupy kręgowców (Chalopin et al. 2014). Większość dotychczasowych działań związanych z adnotacjami TE dotyczyła ryb promieniopłetwych, ale scharakteryzowano krajobrazy TE dla co najmniej jednego gatunku w obrębie każdej głównej linii ryb, jak opisano poniżej.

Agnatha

Informacje dotyczące TE pochodzące z danych sekwencjonowania całego genomu są dostępne dla pojedynczego gatunku ryby bezszczękowej: minoga morskiego (Petromyzon marinus). Kuracja zespołu genomu minoga sugeruje, że co najmniej 34,7% pochodzi z TE (Smith et al. 2013). Genom zawiera TE specyficzne dla linii, a także pradawne powtórzenia wspólne z innymi kręgowcami, a nawet bezkręgowcami. Wiele TE nie zostało jeszcze sklasyfikowanych i stanowią one około 19,2% genomu. Szacuje się, że większość znanych TE pochodzi z LINE i SINE, ale obecne są również elementy klasy II, a w mniejszym stopniu retrotranspozony LTR (Smith et al. 2013 Chalopin et al. 2015). Genom minoga zawiera również tysiące kopii transpozonów Tc1 o wysokim podobieństwie sekwencji (osiągającym 92–98% identyczności) do tych znalezionych w różnych liniach ryb doskonałokostnych, co sugeruje zarówno niedawną amplifikację tych elementów, jak i wysokie wskaźniki HT (Kuraku et al. 2012 ). Podobny scenariusz opisano również dla transpozonów Czapajewa (Zhang et al. 2014). Interakcje żywiciel-pasożyt między doskonałokostnymi a minogami mogą zatem odgrywać rolę w pośredniczeniu w horyzontalnych transferach TE. Co ciekawe, minogi eliminują około 20% swojego somatycznego genomu podczas embriogenezy, z czego większość jest bogata w TE (Smith et al. 2009, 2013). Nie wiadomo, w jaki sposób ta cecha może przyczynić się do charakterystycznej dynamiki TE. Na przykład można argumentować, że eliminacja śmieci w postaci TE w komórkach somatycznych jest strategią tolerowania TE w całej populacji, przy jednoczesnym zachowaniu zmienności linii zarodkowej pochodzącej z TE. Zmniejszenie złożoności genomu i usprawnienie reprodukcji komórek lub innych procesów biologicznych w „życiu codziennym” komórek somatycznych może zwiększyć sprawność gospodarza. W każdym razie jest całkiem możliwe, że zaprogramowana eliminacja DNA występuje u wszystkich ryb bezszczękowych i może być jeszcze bardziej rozpowszechniona wśród kręgowców (Wang i Davis 2014).

Chondrichthyes

Tylko jednosekwencyjny genom jest dostępny dla ryb chrzęstnych (Chondrichthyes) (enkatesh, et al. 2014). Rekin słonia (Callorhinchus milii) zawiera około 42% TE z jego genomu od około 770 MB do 1 GB. Dominującymi TE są nie-LTR elementy nadrodzin L2 i CR1 oraz SINE (Venkatesh i wsp. 2005, 2007, 2014 Chalopin i wsp. 2015). Poprzednie odkrycia wskazują, że SINE są dobrze reprezentowane w genomach rekinów i płaszczek, co sugeruje, że krajobrazy TE u ryb chrzęstnych mogą być bardziej podobne do bezszczękowych niż do ryb kostnych (Ogiwara et al. 1999, 2002). Z kolei niski względny udział TE innych niż retrotranspozony inne niż LTR sprawia, że ​​genom rekina słoniowego stanowi wyjątek wśród ryb pod względem różnorodności TE. Ponadto genom rekina słoniowego jest jednym z najwolniej ewoluujących wśród kręgowców (Venkatesh et al. 2014), co znajduje odzwierciedlenie w obecności wielu starych, zdegenerowanych TE.

Actinopterygii

Liczby i proporcje TE są niezwykle zmienne wśród genomów ryb promieniopłetwych, zwłaszcza doskonałokostnych, które wykazują największą liczbę nadrodzin TE wśród kręgowców (Duvernell et al. 2004 Volff 2005). Często znajduje to odzwierciedlenie w rozmiarach genomów w obrębie kladu. Na przykład Teleostei obejmują najmniejsze zgłoszone genomy kręgowców u ryb rozdymkowatych i fugu (Rubripy Takifugu), odpowiednio ~342 i 393 Mb, które składają się tylko z ~6% DNA pochodzącego z TE (Crollius i wsp. 2000 Aparicio i wsp. 2002 Volff i wsp. 2003). Ale genom innego doskonałokostnego, danio pręgowanego, jest bogaty w TE, z około 55% zawartością TE w genomie około 1,4 Gb (Howe i wsp. 2013). W rzeczywistości liczebność TE wydaje się być głównym wyznacznikiem wielkości genomu w tej grupie (Chalopin i wsp. 2015 Gao i wsp. 2016). Chalopin i in. (2015) wykazali, że rozmiar genomu promieniowca może być silniej uzależniony od TE niż większe genomy sarkopteryka (w tym Tetrapoda). Te ostatnie wykazują większy udział sekwencji o małej liczbie kopii i nie powtarzających się.

Średnio 24 nadrodziny TE na zsekwencjonowany genom stanowi przykład wyróżniającej się różnorodności TE u promieniowców. Ryby Teleoste wykazują największą różnorodność, osiągając 27 nadrodzin TE w genomie danio pręgowanego ( Howe et al. 2013). Co ciekawe, ekstremalne zmniejszenie rozmiaru genomu u niektórych doskonałokostnych nie spowodowało zmniejszenia różnorodności TE, co kontrastuje z poważną utratą całych nadrodzin TE u innych kręgowców, które również wykazują małe genomy. Na przykład, pomimo bardzo niskiej ogólnej liczebności TE w ich małych genomach, wszystkie główne typy TE zostały zidentyfikowane u rozdymkowatych. Nawet liczba nadrodzin retrotranspozonów u fugu i rozdymki zielonoplemtej przewyższa liczbę linii sarkopterygów i jest znacznie wyższa niż obserwowana u ludzi i myszy (Crollius i in. 2000 Waterston i in. 2002 Kasahara i in. 2007 Church i in. 2007 Church i in. 2009 Chalopin i wsp. 2015). Tak więc, jak sugerują Furano i in. (2004) mogą istnieć dwie podstawowe strategie gospodarza radzenia sobie z akumulacją TE – tolerancja zwiększonej różnorodności połączona z niższą liczbą kopii na rodzinę lub zmniejszona różnorodność połączona z tolerancją zwiększonej liczby kopii.

Dominujące typy TE różnią się drastycznie w genomach promieniowców. Transpozony DNA są głównym składnikiem niektórych genomów doskonałokostnych. Na przykład elementy klasy II stanowią około 60% TE u pielęgnic i 39% genomu danio pręgowanego, podczas gdy retrotranspozony stanowią mniej niż 12% każdego z nich (Howe et al. 2013 Brawand et al. 2014). Z drugiej strony fugu i nieteleost cętkowany gar (Lepisosteus oculatus) genomy charakteryzują się przewagą retrotranspozonów innych niż LTR (Volff i wsp. 2003 Braasch i wsp. 2016). Ponadto częstość występowania i różnorodność głównych typów TE może się znacznie różnić nawet między blisko spokrewnionymi grupami. Genom rozdymka zielonoplamitego różni się nieco od genomu fugu, jego bliskiego krewnego, wykazując mniejszą różnorodność retrotranspozonów innych niż LTR. Podczas gdy występowanie LINE i SINE charakteryzuje genom fugu, względne proporcje transpozonów DNA, elementów LTR i nie-LTR są w przybliżeniu równe w genomie rozdymki z zielonymi plamkami ( Volff et al. 2003 Chalopin et al. 2015). Jak dotąd żaden genom promieniowca nie wydaje się być szczególnie wzbogacony o retrotranspozony LTR, chociaż wiele z nich, w tym obecnie aktywne elementy, odnotowano u kilku gatunków (Poulet i wsp. 1994 Herniou i wsp. 1998 Poulter i Butler 1998 Volff i wsp.). 2001 Shen i Steiner 2004 Kambol i Abtholuddin 2008 Gao i wsp. 2016). Wreszcie, istnieje wiele przypadków specyficznych dla linii ubytków nadrodzin TE. Na przykład retrotranspozon Rex3 inny niż LTR jest szeroko rozpowszechniony wśród większości doskonałokostnych, ale nie występuje u ryb łososiowatych (Volff et al. 2001).

Tempo akumulacji TE jest również niejednorodne u ryb promieniopłetwych. Niedawna akumulacja została wykazana dla wielu rodzin TE (Böhne et al. 2012 Gao et al. 2016). Na przykład w medace (Oryzias latipes, teleost) rodziny transpozonów DNA Tol1 i Tol2 mają ciągłe impulsy transpozycji i są uważane za główne źródła zmienności genetycznej w naturalnych populacjach (Koga et al. 2006 Tsutsumi et al. 2006 Koga et al. 2009 Watanabe et al. 2014). Wśród retrotranspozonów innych niż LTR, wielokrotne impulsy amplifikacji zaobserwowano w różnych liniach ryb (Volff et al. 2000, 2001). Takie zróżnicowane szybkości amplifikacji TE mogą skutkować dużą rotacją rodzin TE w genomach doskonałokostnych. Wybuchy amplifikacji kilku rodzin TE i eliminacja starszych insercji poprzez duże delecje, rekombinację ektopową lub wysokie wskaźniki podstawienia nukleotydów mogą skutkować występowaniem ostatnio aktywnych elementów i bardzo wyraźnym krajobrazem TE wśród genomów niektórych blisko spokrewnionych gatunków ( Duvernell i wsp. 2004 Blass i wsp. 2012 Chalopin i wsp. 2015). Co ciekawe, podobne wzorce obserwuje się również u niektórych gadów (patrz niżej).

Sarkopterygii

Wśród sarkopteryków (z wyjątkiem Tetrapoda) jedynymi genomami analizowanymi w znaczący sposób są afrykańskie coelacanth (Latimeria menandoensisAmemiya i in. 2013 Nikaido i in. 2013) i australijskiej ryby dwudysznej (Neoceratodus forsteri, Metcalfe i in. 2012). W zależności od badania TE stanowią 25% lub 50% całkowitej wielkości genomu koelakantu. Na przykład Nikaido i in. (2013) stwierdzili, że zarówno TE klasy I, jak i II przyczyniają się do różnorodności w mniej więcej równych proporcjach (23% transpozonów DNA, 26% retrotranspozonów), ale inne badania identyfikują mniej transpozonów DNA ( Amemiya i wsp. 2013 Chalopin i wsp. 2015). Liczne insercje specyficzne dla linii wystąpiły w dwóch istniejących gatunkach celakantu (Forconi et al. 2014 Naville et al. 2014). Większość z nich to retrotranspozony inne niż LTR (CR1 LINE i LF-SINE), ale niektóre transpozony DNA przeszły niedawno transpozycję (Naville i wsp. 2014 Chalopin i wsp. 2015 Naville i wsp. 2015). Co zaskakujące, elementy Harbinger DNA, które uważano za wymarły klad TE, wykazują dowody na trwającą akumulację (Smith et al. 2012). Niedawna amplifikacja retrotranspozonów innych niż LTR jest jednym z wielu przykładów, w których wolno ewoluujący genom koelakantu zachował aktywność TE, które zostały wyeksponowane jako sekwencje regulatorowe i kodujące w innych liniach kręgowców (Bejerano i wsp. 2006 Nishihara i wsp. 2006).

Ryby dwudyszne mają największe zidentyfikowane dotychczas genomy kręgowców (~49-127 Gb) (Gregory 2002) i posiadają odpowiednio dużą liczbę TE. Ich duży rozmiar i wysoka powtarzalność utrudniały sekwencjonowanie całego genomu i wysiłki związane z montażem. Na podstawie sekwencjonowania badań zawartość TE u australijskich ryb dwudysznych (Neoceratodus forsteri) szacuje się na ∼ 40%. Linie CR1 i L2 stanowią ponad połowę tych TE i odpowiadają około 22% genomu (Metcalfe et al. 2012). Analizy transkryptomu zachodnioafrykańskich ryb dwudysznych (Protopterus annectens) wykazują dużą różnorodność transkrybowanych TE (Biscotti et al. 2016). Najbardziej rozpowszechnione są LINE, a następnie transpozony DNA i SINE. Ten profil transkrypcyjny jest bardzo podobny do koelakantu (Forconi i wsp. 2014 Biscotti i wsp. 2016).

Gady

Niewiele wiadomo o różnorodności i rozmieszczeniu TE u płazów. Częściowo jest to spowodowane brakiem zasobów genomowych dla tej grupy, które ograniczają się do szkiców genomu zachodniej żaby szponiastej (Xenopus tropicalis) i żaba tybetańska (Nanorana parkeri) ( Hellsten i in. 2010 Sun, i in. 2015).Około jedna trzecia genomu żaby szponiastej pochodzi z TE, z czego około trzy czwarte pochodzi z transpozonów DNA ( Hellsten i wsp. 2010 Chalopin i wsp. 2015). W rzeczywistości, pod względem procentowym, żaba szponiasta zawiera wyższy stosunek zawartości klasy II do klasy I niż jakikolwiek inny kręgowiec zbadany do tej pory (Chalopin et al. 2015). Dla kontrastu, retrotranspozony LTR wydają się dominować w genomie żaby tybetańskiej, gdzie te TE uległy gwałtownej ekspansji w ciągu ostatnich 30 lat (Sun et al. 2015). Ta ekspansja przyczyniła się bezpośrednio do większego rozmiaru genomu żaby tybetańskiej w porównaniu z żabą szponiastą.

Ze względu na ich masywne genomy (14-50 Gb) dla salamandr nie jest dostępny zespół genomu, ale sekwencjonowanie ankiety pokazuje, że od 25% do > 47% genomów pochodzi z TE i że nadrodzina LTR Ty3/cygan dominuje w krajobrazie TE ( Gregory 2002 Sun, Shepard i in. 2012 Metcalfe i Casane 2013). Niedawny montaż dwóch najmniejszych chromosomów meksykańskiego aksolotla (Ambystoma mexicanum) odzyskały podobne gęstości, ale większość z tych TE nie została jeszcze sklasyfikowana (Keinath et al. 2015). W przeciwieństwie do żaby szponiastej, salamandry mają wyższy stosunek retrotranspozonów LTR do zawartości TE niż jakikolwiek inny kręgowiec zbadany do tej pory (Sun, Shepard, et al. 2012). Nie wiadomo, czy za to odpowiedzialne są zwiększone wskaźniki akumulacji TE (Sun, Shepard i wsp. 2012 Metcalfe i Casane 2013), zmniejszone wskaźniki utraty DNA (Sun, Arriaza i wsp. 2012), jakaś kombinacja obu lub inne mechanizmy za genomiczny gigantyzm obserwowany u salamandrów. Podobne zjawiska zaobserwowano w drzewach iglastych, które mają podobnie ogromne rozmiary genomu (Nystedt et al. 2013). Niezależnie od tego, brak informacji na temat dynamiki TE w Anura, Caudata i Gymnophiona stanowi poważną lukę w naszej wiedzy i sugeruje obszar dojrzałości do eksploracji.

Squamata

Gady łuskonośne prawdopodobnie są siedliskiem zróżnicowanego wachlarza i rozmieszczenia TE podobnych do ryb. Jednak ten klad jest podobny do płazów, ponieważ jest słabo reprezentowany pod względem wysokiej jakości zespołów genomowych. Pierwszy zespół genomu łuskonośnego pochodził od jaszczurki, zielonego anolisa (Anolis carolinensis) o zawartości TE około 30%. Podobnie jak w genomach płazów i ryb, w anolisie obecne są wszystkie główne grupy pierwiastków, ale większość z nich to transpozony DNA i LINE (Alföldi et al. 2011). Biorąc pod uwagę odległości genetyczne, większość rodzin pierwiastków wydaje się być lub jest od niedawna aktywna. Na przykład, elementy ze wszystkich pięciu głównych nadrodzin retrotranspozonów innych niż LTR są aktywne, ale rodziny te są obecne w stosunkowo niskiej liczbie kopii, co sprawia, że ​​profil powtórzeń jest bardziej „rybopodobny” (tj. wysoka różnorodność, niska liczba kopii) niż inne owodniowce ( Novick i wsp. 2009). Oprócz obecnych i ostatnio aktywnych elementów wydaje się, że starsze, silniej zmutowane elementy zostały usunięte w wyniku wysokiego tempa utraty DNA w wyniku rekombinacji ektopowej lub są niewykrywalne z powodu wysokiego współczynnika substytucji (Novick i wsp. 2009 Tollis i Boissinot 2013).

Do tej pory opublikowano tylko dwa zespoły genomu węża. Jednym z nich jest kobra (Ophiophagus hannah) nie był przesłuchiwany pod kątem zawartości TE (Vonk et al. 2013). Pyton dostarczał jednak informacji, zwłaszcza gdy dane zostały połączone z sekwencjonowaniem badań innych węży. Analizy sugerują, że pomimo podobnych rozmiarów genomu gatunki węży mają drastycznie różną zawartość TE, ale niską różnorodność obecnych typów TE. Na przykład Copperhead (Agkistrodon contortrix)) i pyton birmański (Python molurus bivattatus), każdy ma genom o wielkości ~1,4 Gb, ale TE (większość z nich to CR1 LINE) zajmują dwa razy więcej miejsca w genomie miedziogłowca (45%) w porównaniu z pytonem (21%) (Castoe et al. 2011, 2013 ).

Inne genomy łuskonośne są dostępne i otrzymały jedynie minimalne nakłady na adnotacje w odniesieniu do powtarzających się części ich genomu. Według tych ograniczonych informacji, elementy LINE są dominującym typem TE u azjatyckiej jaszczurki szklanej (Ophisaurus gracilis) ( Song et al. 2015), gekon japoński (Gekko japonicus) ( Liu et al. 2015) oraz brodatego smoka (Pogona Vitticeps) (Georges i wsp. 2015) genomy. Zawartość powtórzeń waha się od ~40% u brodatego smoka do ~48% u japońskiego gekona. Wyciągnięcie dalszych wniosków z tych trzech genomów jest jednak trudne, ponieważ około połowa zidentyfikowanych powtórzeń była niesklasyfikowana i brakuje dopracowanych klasyfikacji.

Podobnie jak w przypadku niektórych ryb, dane z łuskonośnych sugerują możliwość częstych transferów poziomych. Na przykład bardzo podobne, a zatem prawdopodobnie przenoszone poziomo, elementy SPIN znajdują się w co najmniej 17 liniach łuskonośnych, z których niektóre rozeszły się ponad sto milionów lat temu (Gilbert et al. 2011). Co więcej, BovB, członek nadrodziny RTE LINE, występuje w całej Squamata, ale jego dystrybucja poza łuskonośnymi jest niespójna i rzadka, w tym stawonogi, stekowce, przeżuwacze i jeżowce. Opierając się na filogenezie gatunków i rozmieszczeniu BovB, prawdopodobne jest, że BovB jest dziedziczony pionowo u gadów, ale został przeniesiony poziomo z gadów żywicieli do innych taksonów przy co najmniej dziewięciu różnych okazjach (Walsh et al. 2013).

Świadectwa

Żółwie służyły jako model do badania ewolucji TE przez 30 lat (Endoh i Okada 1986). Pierwsze partnerstwo LINE/SINE odkryto u żółwi (Kajikawa i in. 1997 Terai i in. 1998). Jednak pomimo tej historii niewiele wiadomo o rozmieszczeniu i różnorodności TE w Testudines. Zachodni żółw malowany (Chrysemys picta belli), zielony żółw morski (Chelonia mydas) i chińskiego żółwia o miękkiej skorupie (Pelodiscus sinensis) wydają się być pośrednie dla łuskonośnych i ptaków pod względem zawartości TE. Około 10% każdego genomu pochodzi z TE (Shaffer et al. 2013 Wang et al. 2013). LINIE CR1 są dominującą rodziną w dotychczas zbadanych genomach, stanowiąc większość zidentyfikowanych TE w każdym z nich (Shaffer et al. 2013) i odzwierciedlając znaczną część różnorodności owodniowców od przodków CR1 (Suh 2015 Suh et al. 2015). Podobnie jak płazy, ten klad stanowi potencjalne źródło informacji pozwalających lepiej zrozumieć dynamikę i oddziaływanie TE.

Krokodyle

Podobnie jak żółwie, krokodyle wykazują niskie wskaźniki neutralnych mutacji, a ich genomy zawierają mnóstwo rozpoznawalnych starożytnych TE i endogennych wirusów (Green i wsp. 2014 Suh i wsp. 2014). Kompleksowe adnotacje TE genomów przedstawicieli wszystkich trzech zachowanych rodzin Crocodilia, a mianowicie krokodyla słonowodnego (Crocodylus porosus), gawiał (Gavialis gangeticus) i aligatora amerykańskiego (Mississippiensis aligatora) ujawniły, że około 37% każdego genomu pochodzi z TE. Około 95% tych elementów należy do rodzin, które były aktywne u wspólnego przodka trzech rodzin (Green et al. 2014). LINIE CR1, najliczniejsza grupa TE u krokodyli, i inne TE wykazują ogólny trend zmniejszonej aktywności i różnorodności TE od czasu przodka krokodyla. Dokładniej, genomy krokodyli wykazują podobną różnorodność rodowych linii owodniowych CR1 jak żółwie (Suh 2015 Suh et al. 2015). Jednak analiza obecności/nieobecności insercji CR1 sugeruje, że członkowie tylko jednej z tych linii byli aktywni od czasu wspólnego przodka Crocodilia (Suh i wsp. 2015). Chociaż wydaje się, że u gawiala występuje pewna bardzo niedawna lub trwająca aktywność CR1 (Suh i wsp. 2015), większość aktywności TE wewnątrz krokodyla pochodzi z różnych retrotranspozonów LTR (nadrodziny ERV1, ERV2, ERV4) ( Chong i wsp. 2014) oraz, w znacznie mniejszym stopniu, dwie rodziny SINE zmobilizowanych przez Tx1 z głowicami pochodzącymi z snRNA (Kojima 2015).

Wśród kręgowców ptaki są niezwykłe, ponieważ wykazują stosunkowo niską liczbę kopii i zmniejszoną ogólną różnorodność TE (Hillier i wsp. 2004 Dalloul i wsp. 2010 Warren i wsp. 2010). Typowy genom ptaka 1,0–1,3 Gb zawiera od 130 000 do 350 000 kopii TE, co stanowi zaledwie 4,1–9,8% jego wielkości (Hillier i wsp. 2004 Warren i wsp. 2010 Poelstra i wsp. 2014 Zhang i wsp. 2014). Jedyny wyraźny obcy, dzięcioł puszysty (Picoides pubescens), zawiera około 700 000 kopii TE stanowiących 22,2% jego zespołu genomu 1,2 Gb (Zhang i wsp. 2014). Większość ptasich TE należy do nadrodziny CR1 (Hillier et al. 2004 Warren et al. 2010 Zhang et al. 2014). Warto zauważyć, że różnorodność CR1 u ptaków obejmuje 14 uznanych rodzin, które wyłoniły się z pojedynczej linii CR1 po podziale ptak/krokodylia, podczas gdy pozostała część różnorodności owodniowca CR1 została utracona (Suh 2015 Suh et al. 2015). Analizy krajobrazów CR1 i markerów obecności/nieobecności CR1 sugerują, że wiele z tych rodzin CR1 było aktywnych jednocześnie i na dużych obszarach zróżnicowania ptaków (Kaiser et al. 2007 Kriegs et al. 2007 St John i Quinn 2008 Suh et al. 2011 Matzke et al. al. 2012 Suh et al. 2012) jednak dowody na bardzo niedawną lub trwającą aktywność CR1 są ograniczone do: Tachybaptus ruficollisperkoz (Suh et al. 2012).

Retrotranspozony LTR stanowią drugą co do wielkości frakcję TE u neognatów (kurczak + kaczka i Neoaves) (Zhang i wsp. 2014), gdzie były aktywne przez cały okres swojej wczesnej ewolucji (Suh i wsp. 2011a, 2011b, 2015). Chociaż ptasie LTR zostały początkowo opisane w linii kurcząt (Hillier et al. 2004 Wicker et al. 2005), wydaje się, że u Neoaves występowała większa akumulacja LTR, zwłaszcza podczas ich wczesnego naświetlania (Suh et al. 2011, 2015). Wśród Neoaves ptaki śpiewające oscyny (np. zeberka, muchołówka białoszyja, wrona amerykańska i wrona kapturowa) wykazują zwiększoną liczbę młodych retrotranspozonów LTR z nadrodzin ERV1, ERV2 i ERV3 (Warren i in. 2010 Cui i in. 2014 Smeds i in. 2015 Vijay i wsp. w rewizji). W muchołówce obrożnej (Ficedula albicollis), niedawna lub trwająca aktywność LTR zbiega się ze stopniowym zmniejszaniem aktywności CR1 i potencjalnym brakiem trwającej aktywności CR1 (Smeds i wsp. 2015). Co ciekawe, podobne trendy widoczne są u zeberki (Taeniopygia guttata) i wrona kapturowa (Corvus cornix) (Kapusta i Suh 2016). Każde z tych potencjalnych wymierań CR1 miało miejsce bardzo niedawno, a zatem każde z nich pochodzi od najnowszego przodka ptaków śpiewających. Sugeruje to, że wymieranie CR1 i dominacja LTR pojawiły się niezależnie w każdej z tych linii ptaków śpiewających (Kapusta i Suh 2016).

Pomimo względnego niedoboru kopii TE i różnorodności u ptaków, identyfikuje się więcej osobliwości, ponieważ coraz więcej genomów staje się przedmiotem zainteresowania sekwencjonowania i badań nad TE. Większość ptaków jest podobna do kurczaków pod tym względem, że brakuje im jakiejkolwiek niedawnej akumulacji SINE (Hillier et al. 2004 Zhang et al. 2014). Jednak SINE zmobilizowane przez CR1 zostały nagromadzone w linii zeberek zeberek i pokrewnych ptaków śpiewających (Warren i in. 2010 Zhang i in. 2014). Z drugiej strony, kurczak doświadczył niedawnej aktywności transpozonowej DNA mariner i hAT (Hillier et al. 2004 Wicker et al. 2005), co jest niezwykłe wśród ptaków (Zhang et al. 2014). Wreszcie, niektóre linie ptasie (niektóre ptaki śpiewające, niektóre papugi, dzioborożce, trogony, kolibry, mezyty, tinami) były wielokrotnie infiltrowane przez AviRTE, nowo odkrytą rodzinę LINII RTE (Suh et al. 2016). Ta rodzina RTE jest daleko spokrewniona z wcześniej wspomnianym BovB, a obecność AviRTE u nicieni filarialnych silnie sugeruje przenoszenie poziome między ptakami i nicieniami oraz między nimi. Warto zauważyć, że SINE zmobilizowane przez AviRTE ewoluowały niezależnie u niektórych ptaków śpiewających, niektórych papug i dzioborożców (Suh et al. 2016).

Mammalia

Pod względem różnorodności, rozmieszczenia i ewolucji TE ssaki są najlepiej zbadanymi kręgowcami. Wynika to w dużej mierze z większej liczby zsekwencjonowanych genomów obejmujących główne linie w grupie (Koepfli et al. 2015). Ponadto istnieją istotne informacje na temat wpływu TE na ewolucję architektury genomu, nawet dla grup, którym wciąż brakuje szkiców całego genomu (Wichman i wsp. 1992 Acosta i wsp. 2008 Cantrell i wsp. 2008 Khalil i Driscoll 2010). TE stanowią ponad połowę wielkości wielu genomów ssaków. Jednak zazwyczaj wykazują one niską różnorodność podrodzin w porównaniu z rybami, płazami i gadami, dużą liczbę kopii retrotranspozonów i minimalną zawartość transpozonów DNA (Furano i wsp. 2004). Odchylenia od tego wzorca są opisane poniżej.

Monotrema

Większość informacji o TE u stekowców pochodzi z dziobaka (Ornithorhynchus anatinus) złożenie genomu (Warren i wsp. 2008). Podobnie jak morfologia stekowców, krajobraz TE wykazuje cechy pośrednie między gadami a ssakami. Przeplatane powtórzenia pochodzące z TE stanowią około 45% genomu dziobaka. Najbardziej rozpowszechnionymi TE, z których każdy ma ponad 1,5 miliona kopii, są L2 i wspólnie zmobilizowany MIR/Mon-1 SINE, które wymarły u therianów (Metatheria i Eutheria) około 60-100 milionów lat temu. Stekowce mają nowy, podobny do SINE, mały retrotranspozon pochodzący z jąderkowego RNA, który jest mobilizowany przez RTE (sno-RTE) zamiast przez L1, wspólne LINIE terian (Schmitz i wsp. 2008 Warren i wsp. 2008). Co ciekawe, wzorce dystrybucji genomowej i przeszła akumulacja transpozonów DNA i retrotranspozonów LTR różnią się między stekowcami i terianami. W genomie dziobaka transpozony DNA i retrotranspozony LTR są szczególnie niedostatecznie reprezentowane w regionach genowych, o których wiadomo, że ulegają imprintingowi u therian. Sugeruje to, że ekspansja i akumulacja tych TE swoista dla therian mogła sprzyjać ewolucji imprintingu, która jest cechą obecną w genomach metatherian i eutherian, ale nie stekowców (Pask et al. 2009).

Metaterie

Genomy Metatherii (torbaków) bardziej przypominają genomy ssaków lęgowych niż stekowce. Analizy oposa krótkoogoniastego (Monodelphis domestica), tammar wallaby (Macropus eugenii) i diabła tasmańskiego (Sarkofil harrisii) szkice genomów sugerują, że ponad połowa typowego genomu torbacza pochodzi z TE (Mikkelsen i wsp. 2007 Renfree i wsp. 2011 Nilsson i wsp. 2012 Nilsson 2016). Podobnie jak w przypadku innych therian, duże frakcje TE odpowiadają elementom innym niż LTR, takim jak LINE i SINE, w tym wysoki odsetek RTE, które są szeroko rozpowszechnione we wszystkich rzędach torbaczy (Gentles i wsp. 2007). W przeciwieństwie do tego, RTE, w szczególności BovB, są ograniczone tylko do kilku linii eutherian i te przypadki są prawdopodobnie spowodowane zdarzeniami transferu poziomego (Walsh i wsp. 2013). Uważa się, że aktywność SINE ustała przed promieniowaniem Dasyuridae (myszy torbacze, quolle i diabły tasmańskie) ~30 milionów lat temu, po czym nastąpiło wyginięcie L1 w linii diabła tasmańskiego (ale zobacz Nilsson, 2016, po dalsze komentarze). Opos jednak zawiera aktywne transkrypcyjnie L1 i SINE (Gu i wsp. 2007).

Eutheria

Większość współczesnych organizmów morskich (ssaki łożyskowe) posiada podstawowy zestaw cech charakterystycznych TE, który obejmuje stosunkowo wysoką zawartość TE, ale mniejszą różnorodność TE w porównaniu z kręgowcami nie będącymi ssakami i ptakami. Dodatkowe cechy charakteryzujące większość genomów eutherian to znacząca degeneracja elementów pradawnych kręgowców oraz niedostateczna reprezentacja i nieaktywność transpozonów DNA (Chalopin et al. 2015). Jednak wiele starożytnych TE jest nadal widocznych, ponieważ zostały one zinterpretowane jako zachowane elementy niekodujące, z których duża część została wstawiona do wspólnego przodka owadów (Mikkelsen i in. 2007 Jurka i in. 2012).

Z kilkoma wyjątkami (np. patrz Adelson i wsp. 2009 Walsh i wsp. 2013), najczęstszym TE w wielu genomach eutherian jest L1, który, w przeciwieństwie do wielu rodzin retrotranspozonów innych niż ssaki, zazwyczaj wykazuje pojedynczą linię kolejnych podrodzin (Boissinot i Furano 2001 Furano i wsp. 2004). SINE zależne od L1 nawracały się de novo i często tworzą znaczące frakcje genomów terian. Te SINE są zazwyczaj zależne od zamówienia. Około 67 rodzin SINE zostało opisanych u ssaków, z których 29 jest specyficznych dla eutherian ( Shimamura et al. 1999 Gogolevsky et al. 2009 Churakov et al. 2010 Kramerov i Vassetzky 2011 Vassetzky i Kramerov 2013). Jednak ta cecha jest zróżnicowana. Niektóre linie rodzą wiele aktywnych SINE (Kass et al. 2000 Kass i Jamison 2007), podczas gdy inne nie wykazują żadnych dowodów na akumulację SINE (Rinehart et al. 2005 Platt i Ray 2012) lub tylko minimalną akumulację w niedawnej przeszłości, jak genom orangutana, w którym SINE Alu naczelnych wytworzył w ciągu ostatnich 12 milionów lat tylko około 250 insercji (Locke et al. 2011).

Podczas gdy większość aktywności TE w genomach eutherian jest reprezentowana przez retrotranspozycję L1 i SINE (Akagi i wsp. 2008 Chalopin i wsp. 2015), wymieranie L1 (i związane z nimi wyłączenia SINE) odnotowano w niektórych liniach (Casavant i wsp. 2000 Grahn i wsp. wsp. 2005 Cantrell i wsp. 2008 Platt i Ray 2012). Co ciekawe, u gryzoni muroidowych zdarzenia ekstynkcji L1 są skorelowane z przesunięciem lub inwazją genomową przez inne typy elementów, ERV (Cantrell i wsp. 2005 Erickson i wsp. 2011). Rzeczywiście, myszy są nietypowymi ssakami, ponieważ oprócz typowych ssaczych LINE i SINE doświadczyły znacznej akumulacji retrotranspozonów LTR (Nellaker et al. 2012). W przeciwieństwie do tego, większość gatunków zwierząt morskich wykazuje jedynie niewielki wkład elementów ERV i podobnych do ERV w porównaniu z innymi TE (Bénit et al. 1999 Mager i Stoye 2015).

Znacząca aktywność transpozonów DNA ustała u ssaków około 40 milionów lat temu (Pace i Feschotte 2007), z kilkoma mniejszymi (Zhao i wsp. 2009 Pagan i wsp. 2010) i jednym głównym wyjątkiem. Znaczącą akumulację transpozonów DNA stwierdzono u jednej rodziny nietoperzy, Vespertilionidae (Pritham i Feschotte 2007 Ray i wsp. 2007, 2008 Pagán i wsp. 2012 Mitra i wsp. 2013 Platt i wsp. 2014 Thomas i wsp. 2014) . Analizy potwierdzają, że wiele nadrodzin klasy II akumulowało się w genomach nietoperzy nieszpornych w niedalekiej przeszłości, ale nie w innych blisko spokrewnionych taksonach (Platt et al. 2016). Obejmuje to transpozony toczące się koło (helitrony), które zawierają ponad 100 000 kopii w genomie Myotis lucifugus ( Pritham i Feschotte 2007 Thomas i in. 2014). Obserwacje te wywołały szczególne zainteresowanie tym, że ogromna ilość akumulacji przez te elementy może być związana z wysokimi wskaźnikami dywersyfikacji w tym kladzie poprzez zaburzenia sieci regulacyjnych i generowanie nowości genomicznych (Platt i in. 2014 Thomas i in.2014), wspierając rosnącą liczbę hipotez dotyczących akumulacji TE i różnorodności gatunkowej (Zeh et al. 2009 Oliver i Greene 2011 Stapley et al. 2015).


Zróżnicowanie strukturalne i sekwencyjne transpozonu Galileo w genomie Drosophila willistoni

Tło: Galileo jest jednym z trzech członków nadrodziny P transpozonów DNA. Pierwotnie odkryto go u Drosophila buzzatii, w którym wykazano, że trzy segregujące inwersje chromosomowe zostały wygenerowane przez rekombinację ektopową między kopiami Galileo. Następnie Galileo zidentyfikowano w sześciu z 12 zsekwencjonowanych genomów Drosophila, co wskazuje na jego powszechną dystrybucję w obrębie tego rodzaju. Galileo jest uderzająco obfity w Drosophila willistoni, gatunek neotropikalny, który jest wysoce polimorficzny pod względem inwersji chromosomowych, co sugeruje rolę tego transpozonu w ewolucji jego genomu.

Wyniki: Przeprowadziliśmy szczegółową charakterystykę wszystkich kopii Galileo obecnych w genomie D. willistoni. Łącznie 191 kopii, w tym 133 z dwoma końcowymi odwróconymi powtórzeniami (TIR), sklasyfikowano według struktury w sześciu grupach. TIRy wykazywały niezwykłą zmienność pod względem długości i struktury w porównaniu z najbardziej kompletną kopią. Trzy kopie wykazały wydłużone TIR z powodu wewnętrznych powtórzeń tandemowych, insercji innych elementów transpozycyjnych (TE) lub włączenia sekwencji innych niż TIR do TIR. Analizy filogenetyczne segmentów transpozazy (TPazy) i TIR dały dwa rozbieżne klady, które nazwaliśmy podrodzinami Galileo V i W. Duplikacje miejsca docelowego (TSD) w kopiach D. willistoni Galileo miały długość 7 lub 8 pz. z sekwencją konsensusową GTATTAC. Analiza regionu wokół TSD ujawniła motyw miejsca docelowego (TSM) z palindromem o wielkości 15 pz, który może prowadzić do powstania drugorzędowej struktury pnia-pętli.

Wnioski: W genomie D. willistoni istnieje niezwykła obfitość i różnorodność kopii Galileo, chociaż nie znaleziono żadnych kopii funkcjonalnych. W szczególności TIRy mają dynamiczną strukturę i rozciągają się na różne sposoby, ale ich końce (wymagane do transpozycji) są bardziej konserwowane niż reszta elementu. Genom D. willistoni zawiera dwie podrodziny Galileo (V i W), które się rozeszły

9 milionów lat temu i mógł pochodzić od przodka elementu genomu. Galileo wykazuje znaczną preferencję insercyjną dla palindromicznego TSM o wielkości 15 pz.


Wstęp

Elementy powtarzalne, w tym elementy transpozycyjne (TE), są głównym składnikiem sekwencji genomów eukariontów. Na przykład w genomach kręgowców zawartość TE waha się od 6% w rozdymkach Tetraodon nigroviridis do ponad 55% u danio pręgowanego Danio rerio [1]. Ponad 45% ludzkiego genomu [2] składa się z TE. W roślinach TE są jeszcze bardziej rozpowszechnione: do 90% kukurydzy (Zea mays) genom jest objęty TE [3]. U owadów część genomowa TE waha się od zaledwie 1% w pryszczarkach antarktycznych [4] do nawet 65% w migrującej szarańczy [5].

TE są znane jako „skaczące geny” i tradycyjnie postrzegane jako samolubne pasożytnicze elementy sekwencji nukleotydowej propagujące się w genomach z głównie szkodliwym lub przynajmniej neutralnym wpływem na sprawność gospodarza [6, 7] (przegląd w [8]). Uważa się, że ze względu na ich propagację w genomie TE mają znaczny wpływ na ewolucję architektury genomu gospodarza. Transponując na przykład do genów gospodarza lub sekwencji regulatorowych, TE mogą zakłócać sekwencje kodujące lub regulację genów i/lub zapewniać gorące punkty dla ektopowej (niehomologicznej) rekombinacji, która może indukować rearanżacje chromosomowe w genomie gospodarza, takie jak delecje, duplikacje , inwersje i translokacje [9]. Na przykład skurcz chromosomu Y u muszki owocowej muszka owocowaUważa się, że takie wewnątrzchromosomalne rearanżacje wywołane rekombinacją ektopową są spowodowane głównie przez TE [10, 11]. Jako takie silne czynniki mutacji, TE są również odpowiedzialne za nowotwory i choroby genetyczne u ludzi i innych organizmów [12–14].

Pomimo potencjalnie szkodliwego wpływu ich aktywności na regulację genów, istnieje coraz więcej dowodów na to, że TE mogą być również motorem innowacji genomicznej, która zapewnia selektywne korzyści gospodarzowi [15, 16]. Na przykład dobrze udokumentowano, że częste cięcie i przegrupowanie nici DNA indukowane przez insercje TE stanowi źródło zmienności sekwencji w genomie gospodarza lub że w procesie zwanym molekularnym udomowieniem TE genomy gospodarza uzyskują nowe funkcjonalne geny i sieci [17–19]. Ponadto wiele eksonów zostało zrekrutowanych de novo z insercji TE w sekwencjach kodujących genomu ludzkiego [20]. U owadów insercje TE odegrały kluczową rolę w nabywaniu oporności na insektycydy [21–23], a także w przebudowie sieci regulacyjnej zapewniającej kompensację dawki [24] lub ewolucji adaptacji do klimatu [25, 26 ].

TE są klasyfikowane w zależności od sposobu ich transpozycji. TE klasy I, znane również jako retrotranspozony, transponują za pomocą mechanizmu za pośrednictwem RNA, który można określić jako „kopiuj i wklej”. Są one dalej podzielone na retrotranspozony z długimi powtórzeniami terminalnymi (LTR) i retrotranspozony inne niż LTR. Retrotranspozony inne niż LTR obejmują długie i krótkie rozproszone elementy jądrowe (LINE i SINE) [27, 28]. Podczas gdy retrotranspozony LTR i LINE kodują odwrotną transkryptazę, nieautonomiczne SINE polegają na maszynerii transkrypcyjnej elementów autonomicznych, takich jak LINE, w celu mobilności. Często spotykane rodziny retrotranspozonów LTR w genomach eukariota obejmują Ty3/Gypsy, który został pierwotnie opisany w Arabidopsis thaliana [29], Ty1/Copia [30], a także BEL/Pao [31].

W TE klasy II, zwanych również transpozonami DNA, transpozycja jest oparta na DNA i nie wymaga pośrednika RNA. Autonomiczne transpozony DNA kodują enzym transpozazę i poruszają się za pomocą mechanizmu „wytnij i wklej”. Podczas replikacji transpozony terminalnych odwróconych powtórzeń (TIR) ​​i elementy typu Crypton przecinają obie nici DNA [32]. Helitrony, zwane również transpozonami typu „rolling-circle” (RC) ze względu na charakterystyczny sposób transpozycji [33], oraz samosyntetyzujące się elementy Maverick/Polinton [34] rozszczepiają pojedynczą nić DNA w procesie replikacji. Zarówno elementy Helitron, jak i Maverick/Polinton występują w wersjach autonomicznych i nieautonomicznych [35, 36], z których te ostatnie nie kodują wszystkich białek niezbędnych do transpozycji. Helitrony są jedynymi transpozonami klasy II, które podczas transpozycji nie powodują duplikacji flankujących miejsc docelowych. Klasa II obejmuje również inne nieautonomiczne transpozony DNA, takie jak miniaturowe odwrócone TE (MITE) [37], które wykorzystują i opierają się na mechanizmach transpozazy autonomicznych transpozonów DNA do replikacji.

Wcześniejsze doniesienia na temat genomów owadów opisują skład rodzin TE w genomach owadów jako mieszaninę TE specyficznych dla owadów i TE wspólnych dla metazoa [38–40]. Ogólnie rzecz biorąc, zaskakująco mało wysiłku włożono w scharakteryzowanie rodzin sekwencji TE i składów TE w genomach owadów w analizach porównawczych na dużą skalę, obejmujących wiele porządków taksonomicznych, aby nakreślić obraz repertuaru owadzich TE. Dedykowane analizy porównawcze składu TE przeprowadzono na gatunkach komarów [41], muszek drozofilnych [42] oraz Macrosiphini (mszyce) [43]. Pomimo tych wysiłków zmierzających do scharakteryzowania TE w genomach owadów, wciąż niewiele wiadomo na temat różnorodności TE w genomach owadów, częściowo ze względu na ogromną różnorodność gatunków owadów i brak standaryzowanej analizy, która umożliwiałaby porównania w różnych rzędach taksonomicznych. Chociaż ten brak wiedzy jest spowodowany niską dostępnością zsekwencjonowanych genomów owadów w przeszłości, wysiłki takie jak inicjatywa i5k [44] pomogły zwiększyć liczbę sekwencji genomu z wcześniej niepróbkowanych taksonów owadów. Dzięki dostępnemu gęstszemu próbkowaniu różnorodności genomowej owadów wydaje się obecnie możliwe kompleksowe zbadanie różnorodności TE wśród głównych linii owadów.

W tym miejscu przedstawiamy pierwszą wyczerpującą analizę rozkładu klas TE w próbie reprezentującej połowę obecnie klasyfikowanego owada (sześcionogów sensu Misof i in. [45]) porządkuje i wykorzystuje wystandaryzowane metody porównawcze zaimplementowane w nowo opracowanych pakietach oprogramowania. Nasze wyniki pokazują podobieństwa w różnorodności i obfitości rodziny TE wśród badanych genomów owadów, ale także głębokie różnice w aktywności TE nawet wśród blisko spokrewnionych gatunków.


Abstrakcyjny

Od dziesięcioleci wiadomo, że elementy transpozycyjne powodują wiele różnych zmian w ekspresji i funkcji genów roślin. Doprowadziło to do wniosku, że aktywność elementów transpozycyjnych odgrywa kluczową rolę w adaptacyjnej ewolucji roślin. W niniejszym przeglądzie opisano rodzaje zmian, które mogą powodować elementy transpozycyjne, omówiono dowody na to, że zmiany te przyczyniły się do ewolucji roślin i przedstawiono przyszłe strategie określania stopnia, w jakim zmiany te faktycznie przyczyniły się do adaptacji i ewolucji roślin. Niedawne postępy w genomice i fenomice szeregu gatunków roślin, zwłaszcza upraw, umożliwiły systematyczną ocenę tych pytań.


Abrusan G, Krambeck HJ (2006) Konkurs może określić różnorodność elementów transpozycyjnych. Teor Popul Biol 70: 364–375.

Agrawal A, Eastman QM, Schatz DG (1998) Transpozycja za pośrednictwem RAG1 i RAG2 i jej implikacje dla ewolucji układu odpornościowego. Natura 394: 744–751.

Antony JM, van Marle G, Opii W i in. (2004) Indukcja reagentów redoks, w której pośredniczy glikoproteina ludzkiego endogennego retrowirusa, powoduje śmierć oligodendrocytów i demielinizację. Nat Neurosci 7: 1088–1095.

Aparicio S, Chapman J, Stupka E i in. (2002) Montaż strzelby całego genomu i analiza genomu Rubripy Fugu. Nauki ścisłe 297: 1301–1310.

Ayala FJ, Coluzzi M (2005) Specjacja chromosomów: ludzie, Drosophilai komary. Proc Natl Acad Sci USA 102 (Suplement 1): 6535–6542.

Bejerano G, Lowe CB, Ahituv N i in. (2006) Wzmacniacz dystalny i ultrakonserwatywny ekson pochodzą z nowego retropozonu. Natura 441: 87–90.

Belshaw R, Katzourakis A, Paces J, Burt A, Tristem M (2005) Wysoka liczba kopii w ludzkich rodzinach retrowirusów endogennych jest związana z mechanizmami kopiowania oprócz reinfekcji. Mol Biol Evol 22: 814–817.

Best S, Le Tissier P, Towers G, Stoye JP (1996) Pozycyjne klonowanie mysiego genu restrykcyjnego retrowirusa Fv1. Natura 382: 826–829.

Biémont C, Vieira C (2006) Genetyka: śmieciowe DNA jako siła ewolucyjna. Natura 443: 521–524.

Blaise S, de Parseval N, Benit L, Heidmann T (2003) Przeszukiwanie całego genomu pod kątem fuzogennych ludzkich endogennych otoczek retrowirusowych identyfikuje syncytynę 2, gen konserwowany w ewolucji naczelnych. Proc Natl Acad Sci USA 100: 13013–13018.

Boissinot S, Furano AV (2001) Ewolucja adaptacyjna w retrotranspozonach LINE-1. Mol Biol Evol 18: 2186–2194.

Bouneau L, Fischer C, Ozouf-Costaz C i in. (2003) Aktywny retrotranspozon inny niż LTR o strukturze tandemowej w zwartym genomie rozdymki Tetraodon nigroviridis. Odzysk genomu 13: 1686–1695.

Brandt J, Schrauth S, Veith AM i in. (2005) Elementy transpozycyjne jako źródło innowacji genetycznych: ekspresja i ewolucja rodziny neogenów pochodzących z retrotranspozonu u ssaków. Gen 345: 101–111.

Bucheton A (1990) I elementy transpozycyjne i dysgenezja hybrydowa I-R w Drosophila. Trendy Genet 6: 16–21.

Campillos M, Doerks T, Shah PK, Bork P (2006) Charakterystyka obliczeniowa wielu białek ludzkich podobnych do Gag. Trendy Genet 22: 585–589.

Casavant NC, Scott L, Cantrell MA, Wiggins LE, Baker RJ, Wichman HA (2000) Koniec LINII?: brak ostatniej aktywności L1 w grupie gryzoni południowoamerykańskich. Genetyka 154: 1809–1817.

Casola C, Hucks D, Feschotte C (2007) Konwergentne udomowienie transpozaz podobnych do pogo w białka wiążące centromer u drożdży rozszczepialnych i ssaków. Mol Biol Evol (16 października) [Epub przed drukiem].

Chen JM, Stenson PD, Cooper DN, Ferec C (2005) Systematyczna analiza zdarzeń retrotranspozycyjnych zależnych od endonukleazy LINE-1 powodujących ludzką chorobę genetyczną. Hum Genet 117: 411–427.

Chimpanzee Sequencing and Analysis Consortium (2005) Wstępna sekwencja genomu szympansa i porównanie z genomem człowieka. Natura 437: 69–87.

Cordaux R, Udit S, Batzer MA, Feschotte C (2006) Narodziny chimerycznego genu naczelnych przez wychwytywanie genu transpozazy z elementu ruchomego. Proc Natl Acad Sci USA 103: 8101–8106.

Curcio MJ, Derbyshire KM (2003) Wady i wady transpozycji: od mu do kangura. Nat Rev Mol Cell Biol 4: 865–877.

Dasilva C, Hadji H, Ozouf-Costaz C i in. (2002) Niezwykła kompartmentalizacja transpozycyjnych elementów i pseudogenów w heterochromatynie Tetraodon nigroviridis genom. Proc Natl Acad Sci USA 99: 13636–13641.

Dehal P, Satou Y, Campbell RK i in. (2002) Projekt genomu Ciona jelitowa: wgląd w pochodzenie strunowców i kręgowców. Nauki ścisłe 298: 2157–2167.

Deininger PL, Moran JV, Batzer MA, Kazazian HH Jr (2003) Elementy ruchome i ewolucja genomu ssaków. Bieżąca opinia Genet Dev 13: 651–658.

Dewannieux M, Esnault C, Heidmann T (2003) Alu sekwencje. Nat Genet 35: 41–48.

Doolittle WF, Sapienza C (1980) Samolubne geny, paradygmat fenotypu i ewolucja genomu. Natura 284: 601–603.

Dunlap KA, Palmarini M, Varela M i in. (2006). Retrowirusy endogenne regulują wzrost i różnicowanie łożyska wokół implantu. Proc Natl Acad Sci USA 103: 14390–14395.

Dupressoir A, Marceau G, Vernochet C i in. (2005) Syncytyna-A i syncytyna-B, dwa fuzogenne geny otoczki mysiej specyficzne dla łożyska, pochodzenia retrowirusowego, zachowane u Muridae. Proc Natl Acad Sci USA 102: 725–730.

Eickbush TH, Malik HS (2002) Geneza i ewolucja retrotranspozonów. W: Craig NL, Craigie R, Gellert M, Lambowitz AM, red., Mobilne DNA II, ASM Press, Waszyngton, s. 1111–1144.

Evgen’ev MB, Arkhipova IR (2005) Pierwiastki typu Penelope – nowa klasa retroelementów: rozmieszczenie, funkcja i możliwe znaczenie ewolucyjne. Cytogenet Genom Res 110: 510–521.

Feschotte C, Pritham EJ (2007) Transpozony DNA i ewolucja genomów eukariotycznych. Annu Rev Genet 41: 331–368.

Fontdevila A (2005) Ewolucja genomu hybrydowego przez transpozycję. Cytogenet Genom Res 110: 49–55.

Furano AV, Duvernell DD, Boissinot S (2004) L1 (LINE-1) Różnorodność retrotranspozonów różni się znacznie między ssakami i rybami. Trendy Genet 20: 9–14.

Gentles AJ, Wakefield MJ, Kohany O i in. (2007) Dynamika ewolucyjna elementów transpozycyjnych w oposach krótkoogoniastych Monodelphis domestica. Odzysk genomu 17: 992–1004.

Gibbs RA, Weinstock GM, Metzker ML i in. (2004) Sekwencja genomu szczura Brown Norway daje wgląd w ewolucję ssaków. Natura 428: 493–521.

Goodier JL, Ostertag EM, Du K, Kazazian HH Jr (2001) Nowa aktywna podrodzina retrotranspozonów L1 u myszy. Odzysk genomu 11: 1677–1685.

Han JS, Boeke JD (2005) Retrotranspozony LINE-1: modulatory ilości i jakości ekspresji genów ssaków? Bioeseje 27: 775–784.

Han K, Lee J, Meyer TJ i in. (2007) Strukturalne delecje za pośrednictwem rekombinacji Alu w genomie szympansa. PLoS Genet 3: e184.

Horie K, Saito ES, Keng VW, Ikeda R, Ishihara H, Takeda J (2007) Retrotranspozony wpływają na transkryptom myszy: implikacja dla rozbieżności cech genetycznych. Genetyka 176: 815–827.

Ichiyanagi K, Nishihara H, Duvernell DD, Okada N (2007) Nabycie specyficzności endonukleazy podczas ewolucji retrotranspozonu L1. Mol Biol Evol 24: 2009–2015.

Międzynarodowe Konsorcjum Sekwencjonowania Genomu Kurczaka (2004) Analiza sekwencyjna i porównawcza genomu kurczęcia dostarcza unikalnych perspektyw na ewolucję kręgowców. Natura 432: 695–716.

Jaillon O, Aury JM, Brunet F i in. (2004) Powielanie genomu u doskonałokostnych ryb Tetraodon nigroviridis ujawnia wczesny protokariotyp kręgowców. Natura 431: 946–957.

Kapitonov VV, Jurka J (2005) Sekwencje sygnałowe rdzenia RAG1 i rekombinacji V(D)J uzyskano z transpozonów Transib. PLoS Biol 3: e181.

Kapitonov VV, Jurka J (2006) Samosyntetyzujące się transpozony DNA u eukariontów. Proc Natl Acad Sci USA 103: 4540–4545.

Kapitonov VV, Jurka J (2007) Helitrony na rolce: eukariotyczne transpozony toczące się po okręgu. Trendy Genet 23: 521–529.

Kasahara M, Naruse K, Sasaki S i in. (2007) Projekt genomu Medaka i wgląd w ewolucję genomu kręgowców. Natura 447: 714–719.

Kazazian HH Jr (2004) Elementy mobilne: czynniki napędzające ewolucję genomu. Nauki ścisłe 303: 1626–1632.

Kehrer-Sawatzki H, Cooper DN (2007) Rozbieżność strukturalna między genomem człowieka i szympansa. Hum Genet 120: 759–778.

Kordis D, Gubensek F (1998) Niezwykłe horyzontalne przeniesienie długiego rozproszonego elementu jądrowego między odległymi klasami kręgowców. Proc Natl Acad Sci USA 95: 10704–10709.

Krull M, Petrusma M, Makalowski W, Brosius J, Schmitz J (2007) Funkcjonalne utrzymywanie eksonizowanych elementów powtarzających się w całym ssaku (MIR). Odzysk genomu 17: 1139–1145.

Krylov DM, Koonin EV (2001) Nowa rodzina przewidywanych retrowirusowych proteaz aspartylowych o możliwej kluczowej roli w kontroli cyklu komórkowego eukariota. Curr Biol 11: R584–R587.

Kuryshev VY, Skryabin BV, Kremerskothen J, Jurka J, Brosius J (2001) Narodziny genu: locus neuronalnego BC200 snmRNA u trzech małpiatek i ludzkich pseudogenów BC200 jako archiwa zmian w linii Anthropoidea. J Mol Biol 309: 1049–1066.

Lander ES, Linton LM, Birren B i in. (2001) Wstępne sekwencjonowanie i analiza ludzkiego genomu. Natura 409: 860–921.

Lindblad-Toh K, Wade CM, Mikkelsen TS i in. (2005) Sekwencja genomu, analiza porównawcza i struktura haplotypów psa domowego. Natura 438: 803–819.

Lowe CB, Bejerano G, Haussler D (2007) Tysiące fragmentów ludzkich elementów mobilnych przechodzą silną selekcję oczyszczającą w pobliżu genów rozwojowych. Proc Natl Acad Sci USA 104: 8005–8010.

Luan DD, Korman MH, Jakubczak JL, Eickbush TH (1993) Odwrotna transkrypcja RNA R2Bm jest pobudzana przez nacięcie w miejscu docelowym chromosomu: mechanizm retrotranspozycji bez LTR. Komórka 72: 595–605.

Lyon MF (2000) Elementy LINE-1 i inaktywacja chromosomu X: funkcja dla „śmieciowego” DNA? Proc Natl Acad Sci USA 97: 6248–6249.

Mallet F, Bouton O, Prudhomme S i in. (2004) Endogenny locus retrowirusowy ERVWE1 jest bona fide genem zaangażowanym w fizjologię łożyska człekokształtnego. Proc Natl Acad Sci USA 101: 1731–1736.

Masly JP, Jones CD, Noor MA, Locke J, Orr HA (2006) Transpozycja genów jako przyczyna hybrydowej bezpłodności w Drosophila. Nauki ścisłe 313: 1448–1450.

Mi S, Lee X, Li XP i in. (2000). Syncytyna to uwięzione białko otoczki retrowirusowej zaangażowane w morfogenezę ludzkiego łożyska. Natura 403: 785–789.

Mikkelsen TS, Wakefield MJ, Aken B i in. (2007) Genom torbacza Monodelphis domestica ujawnia innowacyjność w sekwencjach niekodujących. Natura 447: 167–177.

Mills RE, Bennett EA, Iskow RC i in. (2006) Ostatnio zmobilizowane transpozony w genomach ludzi i szympansów. Am J Hum Genet 78: 671–679.

Mills RE, Bennett EA, Iskow RC, Devine SE (2007) Które elementy transpozycyjne są aktywne w ludzkim genomie? Trendy Genet 23: 183–191.

Mouse Genome Sequencing Consortium (2002) Wstępne sekwencjonowanie i analiza porównawcza genomu myszy. Natura 420: 520–562.

Nakamura TM, Cech TR (1998) Czas cofania: pochodzenie telomerazy. Komórka 92: 587–590.

Navarro A, Barton NH (2003) Specjacja chromosomowa i dywergencja molekularna - przyspieszona ewolucja w przegrupowanych chromosomach. Nauki ścisłe 300: 321–324.

Neafsey DE, Blumenstiel JP, Hartl DL (2004) Różne mechanizmy regulacyjne leżą u podstaw podobnych profili transpozycyjnych pierwiastków u rozdymkowatych i muszek owocowych. Mol Biol Evol 21: 2310–2318.

Nekrutenko A, Li WH (2001) Elementy transpozycyjne znajdują się w dużej liczbie genów kodujących ludzkie białka. Trendy Genet 17: 619–621.

Nishihara H, Smit AF, Okada N (2006) Funkcjonalne sekwencje niekodujące pochodzące z SINE w genomie ssaków. Odzysk genomu 16: 864–874.

Noor MA, Chang AS (2006) Genetyka ewolucyjna: skok do nowego gatunku. Curr Biol 16: R890–R892.

O’Neill RJ, O’Neill MJ, Graves JA (1998) Undermetylacja związana z aktywacją retroelementów i przebudową chromosomów u międzygatunkowej hybrydy ssaków. Natura 393: 68–72.

Ono R, Nakamura K, Inoue K i in. (2006) Usunięcie Kołek10, imprintowany gen nabyty z retrotranspozonu powoduje wczesną śmiertelność embrionów. Nat Genet 38: 101–106.

Orgel LE, Crick FH (1980) Samolubne DNA: ostateczny pasożyt. Natura 284: 604–607.

Pace JK II, Feschotte C (2007) Historia ewolucyjna transpozonów ludzkiego DNA: dowody na intensywną aktywność w linii naczelnych. Odzysk genomu 17: 422–432.

Peaston AE, Evsikov AV, Graber JH i in. (2004). Retrotranspozony regulują geny gospodarza w mysich oocytach i zarodkach przedimplantacyjnych. Komórka deweloperska 7: 597–606.

Pickeral OK, Makalowski W, Boguski MS, Boeke JD (2000) Częsta transdukcja ludzkiego genomowego DNA napędzana retrotranspozycją LINE-1. Odzysk genomu 10: 411–415.

Piriyapongsa J, Marino-Ramirez L, Jordan IK (2007) Pochodzenie i ewolucja ludzkich mikroRNA z elementów transpozycyjnych. Genetyka 176: 1323–1337.

Piskurek O, Okada N (2007) Pokswirusy jako możliwe wektory do poziomego przenoszenia retropozonów z gadów na ssaki. Proc Natl Acad Sci USA 104: 12046–12051.

Poulter RT, Goodwin TJ (2005) DIRS-1 i inne retrotranspozony rekombinazy tyrozynowej. Cytogenet Genom Res 110: 575–588.

Pritham EJ, Feschotte C (2007) Masowe wzmocnienie transpozonów toczących się w rodowodzie nietoperza Myotis lucifugus. Proc Natl Acad Sci USA 104: 1895–1900.

Pritham EJ, Putliwala T, Feschotte C (2007) Mavericks, nowa klasa gigantycznych elementów transpozycyjnych rozpowszechnionych u eukariontów i związanych z wirusami DNA. Gen 390: 3–17.

Pyatkov KI, Arkhipova IR, Malkova NV, Finnegan DJ, Evgen'ev MB (2004) Aktywność odwrotnej transkryptazy i endonukleazy kodowana przez retroelementy podobne do Penelope. Proc Natl Acad Sci USA 101: 14719–14724.

Ray DA, Xing J, Salem AH, Batzer MA (2006) SINES o prawie idealnym charakterze. System Biol 55: 928–935.

Rhesus Macaque Genome Sequencing and Analysis Consortium (2007) Ewolucyjne i biomedyczne spostrzeżenia dotyczące genomu makaków rezus. Nauki ścisłe 316: 222–234.

Ribet D, Dewannieux M, Heidmann T (2004) Aktywna para rodzin mysich transpozonów: retrotranspozycja kopii „master” MusD i trans-mobilizacja ETn. Odzysk genomu 14: 2261–2267.

Santangelo AM, de Souza FS, Francchini LF, Bumaschny VF, LowMJ, Rubinstein M (2007) Starożytna egzaptacja retropozonu CORE-SINE w wysoce konserwatywny wzmacniacz neuronalny genu proopiomelanokortyny u ssaków. PLoS Genet 3: e166.

Schuller M, Jenne D, Voltz R (2005) Ludzka rodzina PNMA: nowe białka neuronalne związane z paranowotworową chorobą neurologiczną. J Neuroimmunol 169: 172–176.

Seleme MC, Vetter MR, Cordaux R, Bastone L, Batzer MA, Kazazian HH Jr. (2006) Rozległa indywidualna zmienność zdolności retrotranspozycji L1 przyczynia się do ludzkiej różnorodności genetycznej. Proc Natl Acad Sci USA 103: 6611–6616.

Sen SK, Han K, Wang J i in. (2006) Ludzkie delecje genomowe za pośrednictwem rekombinacji między Alu elementy. Am J Hum Genet 79: 41–53.

Shen CH, Steiner LA (2004) Struktura genomu i ekspresja grasicy endogennego retrowirusa u danio pręgowanego. J Virol 78: 899–911.

Slotkin RK, Martienssen R (2007) Elementy transpozycyjne i regulacja epigenetyczna genomu. Nat Rev Genet 8: 272–285.

Tarlinton RE, Meers J, Young PR (2006) Retrowirusowa inwazja genomu koali. Natura 442: 79–81.

Thornburg BG, Gotea V, Makalowski W (2006) Elementy transpozycyjne jako istotne źródło sygnałów regulujących transkrypcję. Gen 365: 104–110.

Toth M, Grimsby J, Buzsaki G, Donovan GP (1995) Napady padaczkowe spowodowane inaktywacją nowego genu, szarpany, związane z białkiem B wiążącym centromer u myszy transgenicznych. Nat Genet 11: 71–75.

van de Lagemaat LN, Landry JR, Mager DL, Medstrand P (2003) Elementy transpozycyjne u ssaków promują zmienność regulacyjną i dywersyfikację genów o wyspecjalizowanych funkcjach. Trendy Genet 19: 530–536.

Venkatesh B, Kirkness EF, Loh YH i in. (2007) Sekwencjonowanie badań i analiza porównawcza rekina słoniowego (Callorhinchus milii) genom. PLoS Biol 5: e101.

Vinckenbosch N, Dupanloup I, Kaessmann H (2006) Ewolucyjny los retroponowanych kopii genów w ludzkim genomie. Proc Natl Acad Sci USA 103: 3220–3225.

Volff JN (2006) Zamienianie śmieci w złoto: udomowienie elementów transpozycyjnych i tworzenie nowych genów u eukariontów. Bioeseje 28: 913–922.

Volff JN, Brosius J (2007) Nowoczesne genomy w stylu retro: elementy retrotransponowane, retropozycja i pochodzenie nowych genów. Dynamika genomu 3: 175–190.

Volff JN, Korting C, Schartl M (2000) Wiele linii retrotranspozonu Rex1 innego niż LTR z różnym powodzeniem w inwazji genomów ryb. Mol Biol Evol 17: 1673–1684.

Volff JN, Hornung U, Schartl M (2001a) Retropozony ryb związane z elementem Penelope Drosophila virilis zdefiniować nową grupę elementów podlegających retrotranspozycji. Genomika Mol Genet 265: 711–720.

Volff JN, Korting C, Froschauer A, Sweeney K, Schartl M (2001b) Retrotranspozony inne niż LTR kodujące endonukleazę podobną do enzymu restrykcyjnego u kręgowców. J Mol Evol 52: 351–360.

Volff JN, Korting C, Meyer A, Schartl M (2001c) Ewolucja i nieciągła dystrybucja retrotranspozonów Rex3 u ryb. Mol Biol Evol 18: 427–431.

Volff JN, Bouneau L, Ozouf-Costaz C, Fischer C (2003) Różnorodność elementów retrotransponowanych w zwartych genomach rozdymka. Trendy Genet 19: 674–678.

Wang H, Xing J, Grover D i in. (2005) Elementy SVA: rodzina retropozonów specyficznych dla hominidów. J Mol Biol 354: 994–1007.

Wicker T, Robertson JS, Schulze SR i in. (2005) Powtarzalny krajobraz genomu kurczaka. Odzysk genomu 15: 126–136.

Xing J, Wang H, Belancio VP, Cordaux R, Deininger PL, Batzer MA (2006) Pojawienie się genów naczelnych przez transdukcję sekwencji za pośrednictwem retrotranspozonów. Proc Natl Acad Sci USA 103: 17608–17613.

Zdobnov EM, Campillos M, Harrington ED, Torrents D, Bork P (2005) Potencjał kodowania białek retrowirusów i innych elementów transpozycyjnych w genomach kręgowców. Kwasy nukleinowe Res 33: 946–954

Zhou Q, Froschauer A, Schultheis C i in. (2006) Transpozony Helitron na chromosomach płci platynki Xiphophorus maculatus i ich ewolucja w genomach zwierzęcych. Danio pręgowany 3: 39–52.


Obejrzyj wideo: Wpływ człowieka na bioróżnorodność (Październik 2022).