Informacije

Može li vrijednost nasljedstva biti veća od 1?

Može li vrijednost nasljedstva biti veća od 1?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Čini se da je nasljednost definirana kao genetska varijansa podijeljena ukupnom varijacijom ograničena između 0 i 1. Međutim, vidim način izračunavanja nasljednosti na ovoj stranici (http://www.radford.edu/~rsheehy/Gen_flash/Tutorials/Linear_Regression/ reg-tut.htm) sa: 2*Covxy / Varx. Međutim, rezultat izračunat na ovaj način može biti veći od 1. Šta mi nedostaje?


Može li vrijednost heritabilnosti biti veća od 1? - Biologija

Poligensko svojstvo obično pokazuje veliku fenotipsku varijabilnost u populaciji. Neke od ovih varijacija su genetske, VG, zbog različitih genotipskih klasa u populaciji te dominacije i epistatičkih učinaka. Neke od varijacija su utjecaji okoline na gene, VE. (Može postojati i varijansa interakcije gena i okoliša za koju ćemo, za sada, pretpostaviti da je 0). Dakle, postoje dvije glavne komponente ukupne fenotipske varijabilnosti uočene u uzorku, a one su aditivne:

VP (ukupna fenotipska varijansa) = VG (genetska varijansa) + VE (varijansa okoline)

Naučnike i druge odavno zanimaju metode mjerenja ovih veličina. VP je ukupna statistička varijacija za obilježje u populaciji i može se statistički izračunati iz podataka o populaciji. Međutim, nije lako odrediti VG i VE čak ni kada se dobiju procijenjene vrijednosti, njihova tačnost je sumnjiva i odnose se samo na populaciju u to vrijeme, u tom okruženju. Vrijednosti bi se vjerojatno promijenile ako bi se promijenila okolina ili ako bi se za tu osobinu trebao mjeriti drugačiji uzorak (iz druge populacije). Budući da se pojedinac ne može podijeliti na genetske komponente u odnosu na okolišne osobine, koriste se mjere varijabilnosti u uzorcima populacija, iako se s tim mjerama treba postupati s velikim oprezom.

Nasljednost osobine, H, definira se kao dio ukupne varijanse za tu osobinu koja je genetska.

Primijetite da je H dio varijabilnosti koja je genetska, a ne dio svojstva koji je genetski određen. (To se ne može mjeriti). Uočite da ako nema genetskih varijacija (sve jedinke imaju isti genotip), tada je VG = 0 i H = 0. Nasuprot tome, ako ne postoji varijabilnost okoline (svaki pojedinac podložan je istim utjecajima okoline), tada je VE = 0 i H = 1. Ovo su teorijske granice za H vrijednost. Naravno, uvijek postoji nešto VG i nešto VE za bilo koju poligensku osobinu, tako da bi H bio negdje između 0 i 1.

Izuzetno je važno pravilno protumačiti H vrijednost. Vrijednost H od 0,5 ili veća smatra se svojstvom s visokom nasljednošću - većina varijance za to svojstvo je genetska. Ovo nije isto što i reći da je osobina uglavnom genetski određena, a osobina možda uopće nije pod velikim utjecajem gena, ali ipak ima raznolikost genotipova u populaciji i nema mnogo varijacija u okolini. Shodno tome, VG izlazi više od VE, dajući visoku vrijednost H. Nasuprot tome, vrijednost H manja od 0,2 smatra se niskom vrijednošću nasljeđivanja, što znači da je većina varijance za osobinu ekološka. Opet, ocjenjuje se varijabilnost, a ne nužno sama osobina. Moguće je da okolina ne utječe toliko na osobinu, ali ako gotovo da nema genetske varijacije u populaciji za ovu osobinu, onda ono malo VE što postoji još uvijek čini većinu varijacija, dajući nisku H vrijednost.

Budući da su uticaji okoline toliko različiti od jedne populacije do druge, H vrijednosti se odnose samo na populaciju na kojoj su mjerene u vrijeme mjerenja. Nikada ih ne bi trebalo proširiti na poređenje populacija, osim ako je okruženje populacija identično. Kod ljudi, na primjer, to je nemoguće tvrditi. Kada neko kaže da je H = 0,8 za ljudski IQ i samim tim je IQ uglavnom genetski determinisan, pa su stoga sve razlike među populacijama (rasama) u IQ-u genetski zasnovane, ova osoba pravi najmanje tri greške iznošenjem ove tvrdnje:

1) H = 0,8 je vrijednost dobivena za uzorke populacije bijele rase i odnosi se samo na određenu populaciju (e) uzorkovanu u testu. Afroamerikanci nisu bili tako opsežno testirani kao bijelci. Ako bismo ih usporedili, morali bismo pretpostaviti identične utjecaje okoliša na IQ za Afroamerikance kao i za bijelce. Očigledno, Afroamerikanci i američki bijelci imaju različite kulturne i socio-ekonomske realnosti u SAD-u. Pitanje je, dakle, jesu li kulturne i socio-ekonomske razlike između Afroamerikanaca i bijelaca beznačajne utoliko što utječu na IQ rezultate - vjerovatno ne.

2) H = 0,8 je zaista visoka vrijednost, ali to samo znači da postoji ekstenzivna genetska varijabilnost (u poređenju sa varijabilnošću životne sredine). Ovo se nikada ne smije tumačiti kao nužno što znači da postoji velika genetska komponenta samog određivanja IQ -a.

3) Zaista postoje razlike u prosječnom IQ -u između Afroamerikanaca i bijelaca. Naučno je pogrešno reći da su te razlike genetske. Ne može se koristiti vrijednost H jednog uzorka populacije i uporediti ga s drugim uzorkom populacije, osim ako ta druga populacija nije pod istim utjecajem okoliša.

Naučno gledano, nema dovoljno podataka i znanja o tome šta određuje koeficijent inteligencije za donošenje bilo kakvih konačnih zaključaka. Verovatno postoji značajan VGE termin -- interakcija između gena i okoline -- tako da je u stvarnosti VP = VG + VE + VGE. VGE može biti veći od samog VG -a ili VE -a - ko zna?

Genetski pogled na određivanje IQ-a bio bi sljedeći: geni svakog pojedinca postavljaju raspon mogućih vrijednosti IQ-a, ali gdje se unutar tog raspona (gornja i donja granica) IQ ostvaruje zavisi od faktora okoline. Dakle, genetski stav je da (1) ljudi se razlikuju u svojoj genetskoj osnovi za IQ - nisu svi stvoreni jednaki - jer nema dva genetski identična, (2) okruženje postavlja IQ unutar potencijala svake osobe, i ( 3) različiti genotipovi (pojedinci) vjerovatno reagiraju na različita okruženja -ne postoji jedno najbolje okruženje za sve genotipove (VGE).

Može se dobiti gruba predodžba o opsegu genetske uključenosti u osobinu usporedbom vrijednosti usklađenosti za tu osobinu između blizanaca MZ i DZ. Uzmimo, na primjer, dijabetes melitus. Konkordancija blizanaca MZ je 47% naspram 9,7% za blizance DZ. Poređenje blizanaca MZ s DZ pokazuje genetsku osnovu, ali također pokazuje i ulogu u zaštiti okoliša, jer je 47% manje od 100%. Nasuprot tome, MZ i DZ blizanci imaju istu vrijednost podudarnosti za smrt od akutne infekcije ako je MZ = DZ podudarnost, tada postoji malo ili imalo genetske osnove za osobinu.

Da bismo dobili H vrijednost, potrebne su nam vrijednosti V (varijanse) koje treba uključiti u H = VG/VE. Uzmite u obzir osobinu "visina". Izmjerite V u visinu za blizance MZ. Pošto su oni genetski identični, VMZ = VE = sva varijansa okoline. Ako koristimo DZ blizance istog spola, tada možemo (možda) pretpostaviti da imaju isti VE kao blizanci MZ, pa imamo vrijednost za VE.

Vrijednost varijabilnosti za DZ blizance podcjenjuje ukupnu populaciju VG, jer DZ blizanci imaju polovicu zajedničkih gena i stoga nisu genetski varijabilni kao ostali članovi populacije. Dakle, udvostručite varijabilnost DZ blizanaca kako biste je proširili na populaciju u cjelini. Također primijetite da je VDZ = 1/2VG + VE, dakle VDZ - VE = 1/2 VG, ili VG = 2(VDZ - VE).

Sada dolazi u obzir naša pretpostavka da možemo koristiti VMZ kao VE, i dobijamo VG = 2(VDZ - VMZ). Tako se vrijednost H izračunava iz izmjerenih vrijednosti VDZ i VMZ kao H = 2 (VDZ - VMZ)/VP.

Tako izračunate H vrijednosti su podložne mnogim greškama, posebno zbog pretpostavke VMZ = VE: VE za DZ može, u stvari, biti veća od VE za MZ.

Vraćajući se na IQ, istraživači su na ovaj način izračunali da je H negdje oko 0,6 - 0,8. Druge studije koje koriste koeficijente korelacije također sugeriraju velike vrijednosti H. MZ blizanci odgajani zajedno pokazuju koeficijent korelacije od 0,85 (očekujte 1,00 ako je potpuno genetski određeno). Odvojeni blizanci MZ daju vrijednost 0,65 (manje od 0,85), prikazujući komponentu okoliša. Sipaci odgajani daju vrijednost 0,25, pokazujući genetsku komponentu. Podaci, dakle, pokazuju genetske i komponente okoliša uključene u određivanje IQ -a.


Heritabilnost 101: Šta je „nasljeđivanje“?

Kad god dođe novorođenče, često se razgovara o tome na koga u porodici beba liči. "Kako je divan, ima očev nos!" "Gle, ima crvenu kosu bake Sue!" "Izgleda kao ujak Robert kad je bio beba!" Ovi komentari se često nastavljaju kako dijete odrasta. "Dobila je majčinu pamet." “Dobar je izgled svog djeda.” “Sav njen muzički talenat dolazi sa tatine strane porodice.”

Djeca imaju tendenciju da liče na svoje roditelje, svoju braću i sestre i u manjoj mjeri na svoju širu porodicu. Možete naslutiti koliko će dijete odrasti prosjekom visine svojih roditelja. Ove sličnosti među članovima porodice protežu se iznad visine do velikog broja osobina [1].

Zašto se ove osobine pojavljuju u porodicama? Jedna je mogućnost da dijele okruženje. Možda roditelji namjerno odgajaju svoju djecu da budu poput njih. Možda postoji "nešto u vodi", kako kaže stari izraz. Osim toga, neki od njih mogu biti genetski, krajnji rezultat DNK koji je biološkim roditeljima pri začeću prenio svako dijete. To bi pomoglo objašnjenju zašto će usvojeno dijete po nekim osobinama snažnije nalikovati njegovim ili njenim biološkim roditeljima nego usvojiteljima ili zašto će blizanci jače ličiti jedan na drugog nego braća i sestre.

Kada se neka osobina može prenijeti putem genetike, nazivamo je “nasljednom”, jer je naslijeđena od vaših bioloških roditelja. Neka nasljedna svojstva, poput vaše krvne grupe ili srpaste ćelije, na ovaj način u potpunosti određuju genetika. Većina svojstava je, međutim, samo djelomično nasljedna. Vjerovatno ste čuli mnogo anegdota o prijateljima ili članovima porodice koji se neobično razlikuju od svojih porodica. Stric koji je 6 inča viši od svih ostalih u porodici. Ekstrovertan u porodici punoj introverta. Ove osobine su nasljedne, ali na njih može utjecati i kupovina gomile okolišnih faktora.

“Heritabilnost” je, dakle, način za opisivanje koliko osobina je povezana sa genetikom. Pitanje kako procjenjujemo nasljednost (i mnoge druge tehničke detalje) ostavit ćemo kasnijem postu. Umjesto toga, hajde da se prvo usredsredimo na to šta je naslednost, a šta nije (tj. uobičajene zablude) i zašto je to nešto što nas zanima da proučavamo.

Šta je naslednost:

Prvo poluformalna definicija: nasljednost je proporcija varijacije osobine objašnjena nasljednim genetskim varijantama [2]. Drugim riječima, to je način da se izmjeri koliko razlike u DNK ljudi mogu objasniti razlike u njihovim osobinama. Nasljednost može biti između 0 (genetika ne objašnjava ništa o svojstvu) i 1 (genetika objašnjava sve). Na primjer, heritabilnost visine je oko 0,80, a heritabilnost sati sna po noći je 0,15-0,20 [3].

Nasljednost procjenjuje koliko dobro bismo mogli predvidjeti osobinu iz genetike (ako u potpunosti razumijemo sve relevantne genetske efekte). Slično, također nam govori koliko bismo mogli predvidjeti osobinu u vama na osnovu te osobine u vašim roditeljima. Za pravljenje ovog predviđanja iz vaše DNK potrebno je precizno poznavanje efekata svake genetske varijante, koja je jako, jako daleko od stvarnosti. Ali nasljeđivanje postavlja gornju granicu koliko bi to predviđanje moglo biti dobro kada saznamo više o genetici osobine.

Nasljednost mjeri koliko je genetika važna za osobinu. Visoka nasljednost, blizu 1, ukazuje na to da genetika objašnjava mnoge razlike u osobinama među različitim ljudima, a niska nasljednost, blizu nule, ukazuje da većina varijacija nije genetska. Samo zato što osobina ima visoku nasljednost ne mora nužno značiti da postoji neki specifičan gen koji je izravno uzrokuje na neki očigledan biološki način, ali to znači da ukupan doprinos izravnih i neizravnih uzročnih učinaka i drugih korelacija između specifičnih varijanti DNK i osobina je dovoljna da bude informativna [4].

Heritabilnost je vlasništvo populacije, a ne pojedinca. Kada se opisuje nasljednost osobine, ona odražava koliko je varijabilnost u populaciji posljedica genetskih faktora. Ne „objašnjava“ zašto pojedinac ima bolest.

Heritabilnost je specifična za način mjerenja osobine. Osobine koje je teže izmjeriti, pa stoga imaju više slučajnih mjernih grešaka, bit će manje nasljedne (budući da slučajna greška mjerenja nije genetska). To također može uzrokovati razlike u nasljednosti koje zavise od toga ko mjeri osobinu (npr. Izvještavanje o sebi o dijagnozi od liječnika u odnosu na fizička mjerenja), ili između pojednostavljene mjere i planirane osobine (npr. Nasljednost uzimanja Prozaca u odnosu na nasljednost) depresije).

Heritabilnost je specifična u kome je osobina mjerena. Budući da nasljeđivanje uključuje ukupnu varijaciju svojstva u populaciji, važno je u kojoj populaciji poredite genetske efekte. Nasljednost osobine kod pojedinaca iz određene zemlje, etnička pripadnost, raspon dobi/godina rođenja i/ili socioekonomski status (između ostalih karakteristika) može, ali i ne mora biti isto kao i nasljeđivanje te osobine u drugoj populaciji koja ima različitu pripadnost genetske pozadine i izložena je drugom okruženju.

Šta nije naslednost:

Nasljednost nije sudbina. To što je osobina nasljedna i postoji kod vaših roditelja ne znači da vam je suđeno da tu osobinu imate. Možda je vjerovatnije, ali nije neizbježno.

Nasljednost nije nepromjenjiva. Budući da nasljednost odražava ravnotežu između učinaka genetskih i okolišnih faktora, ako promijenite okruženje, možete promijeniti nasljednost osobine.

Nasljeđivanje ne mjeri našu sposobnost da utičemo na osobinu. Boja kose je vrlo nasljedna, ali možete bojati kosu koju god boju želite (uključujući boje koje ne možete naslijediti). BMI (indeks tjelesne mase) je nasljedan, ali to ne znači da prehrana i vježbe ne mogu imati utjecaja. Drugim riječima, heritabilnost nije neka konačna izjava o moći “prirode protiv odgoja”.

Visoka nasljednost ne znači da su grupne razlike genetske. Postoji zabrinjavajuća istorija pripisivanja uočenih grupnih razlika, kao što su prijavljeni rasni dispariteti u IQ rezultatima, genetici. Kao što je gore navedeno, heritabilnost je specifična za izbor mjerenja, populacije i okoline, a nasljednost osobine nije nepromjenjiva. Kao rezultat toga, nije valjano koristiti procijenjenu nasljednost neke osobine kao dokaz za "inherentne" razlike među populacijama.

Zašto je nasljeđivanje važno?

Procjena nasljednosti neke osobine (u datoj populaciji) je polazište radi razumijevanja te osobine, a ne krajnjeg cilja. To još više vrijedi za verziju nasljednosti koju smo procijenili u UK Biobank, koja predstavlja samo dio ukupne potencijalne genetske varijacije koja utječe na osobinu.

Za genetičare i biologe, nasljeđivanje je neki pokazatelj koje će osobine biti plodonosne za proučavanje. Pružajući metriku koliko je osobina povezana s genetikom za razliku od drugih faktora, ona nam govori koliko treba uzeti u obzir genetiku ako želimo saznati više o uzrocima te osobine.

U zdravstvenoj zaštiti, nasljednost fizičkih mjera (BMI, krvni pritisak, itd.) i poremećaja pruža uvid u to koliko porodična anamneza može predvidjeti ishode pacijenata i koliko genetsko testiranje može postati korisno za predviđanje rizika od bolesti i ishoda liječenja.

Procjena nasljednosti također je od interesa za društvene nauke, gdje postojeća istraživanja sugeriraju da su mnogi aspekti života - od ličnosti preko obrazovanja do rasporeda spavanja do toga koliko djece imate - barem malo nasljedni. Prepoznavanje nasljednosti u ovim osobinama može predložiti područja u kojima je naša DNK, često na složene i indirektne načine, povezana sa društvenim ishodima.

A za sve nas, poznavanje nasljeđivanja naših osobina pruža malo više razumijevanja uloge našeg DNK u oblikovanju onoga što jesmo. Genetika gotovo nikada nije tako jednostavna kao "priroda naspram njegovanja", ali proučavanje nasljedstva ljudskih osobina barem daje uvid u to kako te sile međusobno djeluju i ukazuje na put ka onome što bismo u budućnosti mogli naučiti iz svojih gena.


Savremena morfometrija medicinski važnih insekata

16.3.3 Nasljeđivanje

Heritabilnost ovisi o genetskoj varijabilnosti koja se odnosi na ispitivano svojstvo, a zatim ovisi o populaciji koja se proučava. Njegovo mjerenje nije neophodno za tumačenje prirodnih metričkih varijacija, ali može pružiti vrijedne informacije o prilagodljivosti metričkih osobina. Kod insekata, morfološke osobine obično imaju najveće vrijednosti nasljednosti u usporedbi s drugim kategorijama svojstava, kao što je životna historija, vjerovatno zato što se prve manje bave sposobnošću.

Geometrijske tehnike dopuštaju zasebnu procjenu nasljednosti veličine i oblika. Veličina insekata može pokazivati ​​konzistentne vrijednosti nasljednosti (Daly, 1992 Lehmann et al., 2006), tako da se mogu eksperimentalno odabrati tako da čine subpopulacije genetski različite po veličini (Anderson, 1973 Partridge et al., 1994). Različite studije koje su ispitivale nasljednost oblika krila u različitim okruženjima u Dipteri dale su visoku i stabilnu nasljednost, dostigavši ​​60% ili više (Roff i Mousseau, 1987. Bitner-Mathé i Klaczko, 1999. Gilchrist i Partridge, 2001. Hoffman i Shirriffs, 2002.). Dosljedne vrijednosti nasljednosti oblika ukazuju na to da veliki dio morfometrijske divergencije uočen između prirodnih populacija insekata (Camara et al., 2006. Henry et al., 2010 Morales et al., 2010) može biti posljedica aditivnih učinaka gena.

U Ae. aegypti, čini se da je oblik više nasljedan nego veličina. Kada se uspoređuju veličina i oblik nasljednosti među okolišima na istim populacijama u Ae. aegypti, pronađene su mnogo veće vrijednosti za oblik (slika 16.2) nego za veličinu, pružajući indirektne dokaze za različite genetske izvore varijacija (Morales et al., neobjavljeni podaci).

Slika 16.2. Ae. aegypti: regresija prvih relativnih deformacija (RW1) laboratorijskih kćeri na RW1 odgovarajućih majki sakupljenih na terenu u istraživanju heritabilnosti oblika krila na 18 orijentira (Morales et al., neobjavljeni podaci). Laboratorija F1, ženski primjerci dobiveni nakon ukrštanja uzoraka prikupljenih na terenu.


Šta uzrokuje seksualnu orijentaciju: priroda i njegovanje

Seksualna orijentacija je trajni obrazac emocionalne, romantične i/ili seksualne privlačnosti muškaraca, žena ili oba spola. ” 1 Objašnjavajući šta uzrokuje seksualnu orijentaciju, mora se naglasiti da niko ne može izabrati biti homoseksualac , biseksualne ili heteroseksualne. Seksualnu orijentaciju određuju dva glavna faktora: priroda i odgoj. Priroda se odnosi na gene i biologiju, dok njegovanje uključuje okolišne i društvene utjecaje. ” 2

Jedan prirodni faktor seksualne orijentacije su geni.To je potvrđeno u naučnim studijama koje mjere nasljednost: “količina fenotipskih (uočljivih) varijacija u populaciji koja se može pripisati individualnim genetskim razlikama. ” 3 Na primjer, ako grupa pojedinaca dobije dobru ishranu (udio slično okruženje), razlike u visini bit će posljedica genetskih razlika. 4 Visina je vrlo nasljedna osobina.

Heritabilnost se mjeri kao statistika. Izražava se kao proporcija (kao što je .60) ”, a maksimalna vrijednost koju može imati je 1.00. ” 5 Ako je nasljednost 1.00, onda su sve varijacije u populaciji posljedice razlike ili varijacije među genotipovima. ” 6 Ako je nasljednost 0,00, onda “ sve varijacije u populaciji proizlaze iz razlika u okruženju koje pojedinci doživljavaju. ” 7 Nasljednost se ne može mjeriti za pojedinačnu osobu, već “samo određenoj grupi koja živi u određenom okruženju ” i “samo varijacijama unutar grupe. ” 8

Heritabilnost se procjenjuje dvostrukim studijama. Švedska studija iz 2010. godine, koristeći podatke iz Švedskog registra blizanaca, “ poduzela je najveću studiju blizanaca zasnovanu na populaciji kako bi procijenila utjecaj genetskih i okolišnih učinaka na istospolno seksualno ponašanje. ” 9 Za blizance muškarce koji su imali #8220bilo koji doživotni istopolni partner”, procjene nasljednosti bile su 39%. 10 Za ženske blizance, samo 󈬂-19% istopolnog seksualnog ponašanja je objašnjeno genetskim faktorima.” 11 Studija je pokazala da geni igraju mnogo veću ulogu u istospolnoj seksualnoj orijentaciji za muškarce nego za žene.

Drugi faktor seksualne orijentacije je njegovanje. Švedska studija je otkrila da za muške blizance, jedinstveni faktori okoline čine 61% seksualnog ponašanja istog pola. 12 Za blizanke, jedinstveni faktori okoliša čine 64-66% istospolnog seksualnog ponašanja, a 16-17% posljedica su zajedničkih učinaka na okoliš. 13 I za muške i za ženske blizance odgoj je imao mnogo veću ulogu od prirode u određivanju seksualne orijentacije osobe.

Psihijatri i psiholozi su također saglasni da je njegovanje važan faktor seksualne orijentacije. Prema Kraljevskom koledžu psihijatara, seksualna orijentacija određena je kombinacijom bioloških i postnatalnih faktora okoline. Slično, kaže Američko psihološko udruženje, nema konsenzusa među znanstvenicima o tačnim razlozima pojedinac razvija heteroseksualnu, biseksualnu, homoseksualnu ili lezbejsku orijentaciju … Nisu se pojavili nalazi koji bi omogućili naučnicima da zaključe da je seksualna orijentacija određena bilo kojim posebnim faktorom ili faktorima. Mnogi misle da priroda i odgoj igraju složene uloge.” 15


Genetska vs. nasledna osobina

Kad vam neko kaže da je visina 80% nasljedna, znači li to: a) 80% razloga zbog koje ste visoki je zbog gena b) 80% varijacija unutar populacije na svojstvu visine posljedica je varijacija gena Odgovor je naravno b . Nažalost, u ovih 5 godina koliko pišem na blogu, koncept heritabilnosti je bilo prilično teško prenijeti, i redovno moram da nadmašim čitaoce koji spajaju pojam sa . Odnosno, pretpostavljaju da ako kažem da je osobina uglavnom nasljedna, mislim da je njen razvoj uglavnom funkcija gena. U stvarnosti ne samo da je to lažno, već je i nesuvislo. Nasljednost se bavi korelacijom na nivou populacije između fenotipske varijacije i genotipske varijacije. Drugim riječima, koliko dobro genetska varijacija može djelovati kao zamjena za fenotipske varijacije? Koji se udio fenotipske varijacije može objasniti genotipskom varijacijom? Ključni pojmovi ovdje su nivo populacije i varijacija (ili tehnički, varijansa). Obično ne govorimo o pojedincima i ograničavamo našu diskusiju na osobine koje variraju unutar populacije.


Rezultati

U ovom odjeljku koristimo empirijske podatke i simulacije modela igračke da pokažemo da je većina procjenitelja heritabilnosti posuđenih iz klasične kvantitativne genetike sklona značajnoj pristranosti, jer zanemaruju ili neprecizno modeliraju promjenu sličnosti između transmisionih partnera uzrokovanu unutar -evolucija patogena u domaćinu. Na osnovu simulacija modela igračaka, određujemo intraklasenu korelaciju u najbližim filogenetskim parovima (CPP) i filogenetsku nasljednost, H OU 2 (t ¯) ⁠, mjerenu filogenetskim Ornstein-Uhlenbeckovim mješovitim modelom (POUMM) (Mitov i Stadler 2016 Blanquart i dr. 2017) kao najpouzdaniji procjenitelji nasljednosti svojstava patogena. Na osnovu primjene ovih procjenjivača na veliku kohortu HIV-a, uspostavljamo donju granicu za lg (spVL) -nasljednost.

U nastavku članka koristimo simbol dij za označavanje filogenetske udaljenosti između dva vrha, i i j, na stablu prenosa (slika 1). dij sumira ukupnu evolucijsku udaljenost između dva zaražena domaćina u trenutku mjerenja vrijednosti osobine i mjeri se u zamjenama po lokaciji za stvarna stabla i proizvoljnim vremenskim jedinicama za simulirana stabla. Započinjemo naš izvještaj s rezultatom podataka o HIV-u koji pokazuju važnost evolucije unutar domaćina za procjenu heritabilnosti.

Lg(spVL) korelacija u HIV filogenetskim parovima opada sa dij

Koristili smo jednosmjernu analizu varijanse (ANOVA, rA) i Spearmanova korelacija (rSp) za procjenu korelacije u filogenetskim parovima (PP) ekstrahiranih iz nedavno objavljenog stabla prijenosa od 8.483 HIV pacijenata (Hodcroft et al. 2014). Kako je definirano u Shirreff et al. (2013), filogenetski parovi predstavljaju parove vrhova u stablu prijenosa koji su međusobno najbliži filogenetskoj udaljenosti (dij) (sl. 1). Naručili smo PP po dij i podijeli ih na deset slojeva jednake veličine (decila), procjenjujući korelaciju između vrijednosti para (rA i rSp) u svakom sloju. Procjene tačaka i intervali pouzdanosti od 95% (CI) prikazani su crnom i magenta tačkom i trakom greške na slici 3. Isprekidane vodoravne trake označavaju 95% CI za rA evaluirano na svim filogenetskim parovima. Unatoč nekim nepravilnostima, u korelaciji postoji dobro izražen obrazac propadanja - slojevi lijevo (mali dij) imaju tendenciju da imaju veće rA vrijednosti nego slojevi na desnoj strani (veliki dij). Vrijednosti rA blisko usklađene vrijednosti iz drugih procjenitelja korelacije, poput DR (b) i srednja korelacija Pearsonovog proizvoda (r) (rezultati nisu prikazani). Izvršili smo obične regresije najmanjih kvadrata (OLS) vrijednosti r A , D k i r Sp , D k na srednjoj filogenetskoj udaljenosti, d i j , k ¯ ⁠ , u svakom stratumu, k = 1 , … , 10 ⁠ . Nagibi obje regresije bili su značajno negativni (P<0.05) i prikazani su kao crne i magenta linije na slici 3. Slični nagibi su dobijeni korištenjem drugih stratifikacija podataka (dodatna slika S1, Dodatni materijal na mreži).

Korelacija između lg (spVL)-vrijednosti u filogenetskim parovima HIV-a. Uzorak 1917 PP-a sa mjerenjima lg (spVL) kod pacijenata sa HIV-om pokazuje smanjenje korelacije (ICC) između vrijednosti svojstava para u funkciji filogenetske udaljenosti para dij. Procjene tačaka i 95% CI u deset slojeva jednake veličine (decila) prikazani su kao tačke i trake greške postavljene na srednju vrijednost dij za svaki stratum, d i j ¯ ⁠ . Crne i magenta tačke sa trakama greške označavaju procenjenu vrednost rA i rSp u stvarnim podacima. Isprekidane vodoravne šipke označavaju 95% CI za rA evaluirano na svim filogenetskim parovima. Crna i magenta nagnuta linija označavaju linearne regresije najmanjih kvadrata rA i rSp na d i j ¯ ⁠ . Smeđa i zelena tačka sa trakama grešaka označavaju procenjene vrednosti rA dobiveno nakon zamjene stvarnih vrijednosti svojstava na drvetu vrijednostima simuliranim prema maksimalnoj vjerovatnoći prilagođenosti metoda PMM i POUMM (prosječno i 95% CI procijenjeno iz 100 ponavljanja). Smeđa i zelena linija pokazuju očekivanu korelaciju između parova vrhova na udaljenosti dij, kao što je modelirano prema ML-uklapanju PMM i POUMM (jednačine 2 i 3). Svijetlosmeđa i svijetlozelena regija prikazuju intervale od 95% visoke stražnje gustine (HPD) zaključene iz Bayesovog uklapanja dva modela (materijali i metode).

Korelacija između lg(spVL)-vrijednosti u HIV filogenetskim parovima. Uzorak 1917 PP-a sa mjerenjima lg (spVL) kod pacijenata sa HIV-om pokazuje smanjenje korelacije (ICC) između vrijednosti svojstava para u funkciji filogenetske udaljenosti para dij. Procjene tačaka i 95% CI u deset slojeva jednake veličine (decila) prikazani su kao tačke i trake greške postavljene na srednju vrijednost dij za svaki stratum, d i j ¯ ⁠ . Crna i magenta tačka sa trakama grešaka označavaju procjenu rA i rSp u stvarnim podacima. Isprekidane vodoravne šipke označavaju 95% CI za rA evaluirano na svim filogenetskim parovima. Crna i magenta nagnuta linija označavaju najmanji kvadrat linearne regresije rA i rSp na d i j ¯ ⁠ . Smeđa i zelena tačka sa trakama grešaka označavaju procenjene vrednosti rA dobiveno nakon zamjene stvarnih vrijednosti svojstava na drvetu vrijednostima simuliranim prema maksimalnoj vjerovatnoći prilagođenosti metoda PMM i POUMM (prosječno i 95% CI procijenjeno iz 100 ponavljanja). Smeđa i zelena linija pokazuju očekivanu korelaciju između parova vrhova na udaljenosti dij, kako je modelirano u skladu s ML-om PMM-a i POUMM-a (jednadžbe 2 i 3). Svijetlosmeđa i svijetlozelena regija prikazuju intervale od 95% visoke stražnje gustine (HPD) zaključene iz Bayesovog uklapanja dva modela (materijali i metode).

Gornji rezultat pokazuje da vrijednost estimatora heritabilnosti zasnovanog na korelaciji unutar filogenetskih parova (uključujući DR parove) jako ovisi o dij. Još jedno pitanje svih procjenitelja H 2 Koristeći korelaciju u filogenetskim ili DR parovima, osnovne statističke metode zahtijevaju neovisnost među parovima - vrijednosti svojstava u jednom paru ne bi trebale utjecati ili biti u korelaciji s vrijednostima svojstava u bilo kojem drugom paru. Ova pretpostavka općenito nije valjana zbog filogenetskog odnosa između svih pacijenata. Jedan od načina za ublažavanje učinaka filogenetskog odnosa među parovima je ograničiti analizu na najbliže parove (tj. Parove, za koje dij ne prelazi neki prag koji je odredio korisnik). Ovaj pristup ima nedostatak izostavljanja velikog broja podataka iz analize. Kao alternativa iskorištavanju prednosti cijelog stabla, moguće je ispraviti filogenetski odnos pomoću filogenetske uporedne metode (PCM). PCM -i pokušavaju riješiti oba gore navedena problema, jer 1) ugrađuju dužine grana u stablo prijenosa za modeliranje varijance -kovarijantne strukture podataka i 2) ispravne za filogenetsku korelaciju pri procjeni evolucijskih parametara ili filogenetske nasljednosti osobina (Felsenstein 1985 Housworth et al. 2004 Alizon et al. 2010). Ove prednosti PCM -a dolaze po cijenu pretpostavljanja specifičnog stohastičkog procesa kao modela evolucije osobina duž stabla. U sljedećem pododjeljku pokazujemo da pretpostavka neodgovarajućeg procesa za evoluciju osobina može uzrokovati značajnu pristrasnost u procjeni filogenetske heritabilnosti.

Brownov proces kretanja ne može reproducirati raspad korelacije u britanskim podacima

Implementirali smo maksimalnu vjerovatnoću i Bayesovsko uklapanje PMM-a (Lynch 1991 Housworth et al. 2004) i njegovo proširenje na Ornstein-Uhlenbeck model evolucije (POUMM) (Hansen 1997 Mitov i Stadler 2016 Blanquart et al. 2017). PMM i POUMM pretpostavljaju aditivni model vrijednosti osobina, z (t) = g(t) + e⁠, u kojem z(t) predstavlja vrijednost svojstva u trenutku t za datu lozu drveta, g(t) predstavlja nasljednu (genotipsku) vrijednost u to vrijeme t za ovu lozu i e predstavlja nenasljedni doprinos koji sumira efekte domaćina i njegovog/njenog okruženja na osobinu i grešku mjerenja. Jedina razlika između ova dva modela je njihova pretpostavka o evoluciji g(t) duž grana stabla - PMM pretpostavlja Brownov proces kretanja, POUMM pretpostavlja Ornstein -Uhlenbeckov proces (Uhlenbeck i Ornstein 1930. Lande 1976 Hansen 1997).

Koristeći procjene maksimalne vjerovatnoće parametara modela (dodatna tabela S1, Dodatni materijal na mreži), simulirali smo nasumične putanje osobina na stablu UK, izvodeći 100 ponavljanja za svaki model. Za svaku replikaciju procijenili smo korelaciju, rA, u PP -ovima koristeći simulirane vrijednosti umjesto stvarnih vrijednosti. Rezultirajuće procjene korelacije prikazane su na slici 3 kao smeđe i zelene tačke i trake grešaka za PMM i POUMM simulacije, respektivno. Uočavamo da postoji značajna razlika između procjena korelacije dva modela. Konkretno, u krajnjem lijevom decilu POUMM procjena je značajno viša od procjene PMM (POUMM 95% CI isključuje procjenu PMM).

Posljednja aproksimacija u jednadžbi (5) slijedi iz činjenice da je pojam exp ( − 8,35 + 36,47 dij ) skoro 0 za raspon filogenetskih udaljenosti ( ⁠ dij ∈ [ 0 , 0,14 ] ⁠ ) u UK stablu (vidi dodatak informacije , Dodatni materijal na mreži, za više detalja o gornjim aproksimacijama).

Jednačine (4) i (5) predstavljaju linearni i eksponencijalni model korelacije u funkciji dij. Vrijednosti ovih jednadžbi pri dij=0 jednaki su filogenetskoj heritabilnosti procijenjenoj na srednjoj udaljenosti vrha korijena t ¯ pod PMM i POUMM (detalji o tome kasnije). Nagib linearnog modela (jednačina 4) je jednak -0,36 (95% HPD [-0,58, -0,21]). Brzina eksponencijalnog opadanja (jednačina 5) jednaka je parametru POUMM α= 28,78 (95% HPD [16,64, 46,93]), a poluvrijeme raspada jednako je ln ⁡ (2) / α = 0,02 zamjene po mjestu (95% HPD [0,01, 0,04]).

Iscrtavanje vrednosti jednačina (4) i (5) i njihovih 95% HPD intervala na slici 3 vizuelno otkriva da se POUMM bolje uklapa u podatke nego PMM. Statistički, ovo je potvrđeno nižim Akaike Informacijskim kriterijem (AICc) za POUMM uklapanje i striktno pozitivnim HPD intervalom za OU parametar α (dodatna tabela S1 i slika S8, Dodatni materijal online). Nagib linearnog modela izvedenog iz uklapanja PMM (jednadžba 4, smeđa linija na slici 3) je gotovo ravan u usporedbi s nagibima dva OLS uklapanja (crna i magenta linija na slici 3). Da bismo to objasnili, primjećujemo da se u PMM-u kovarijansa u filogenetskim parovima i varijansa na populacijskom nivou modeliraju kao linearne funkcije udaljenosti korijen-mrca (tij) i udaljenost vrha korijena (t) (brojnik i nazivnik u jednadžbi 2). Važno je da su obje ove linearne funkcije vezane za isti parametar nagiba, σ 2. Kako se ispostavilo, u britanskim podacima kovarijansa i varijansa rastu različitim stopama u odnosu na tij i t (pogledajte dodatnu sliku S2 i dodatne informacije, Dodatni materijal na mreži). Zaključujemo da PMM nije odgovarajući model za korelaciju u filogenetskim parovima, budući da nije u stanju modelirati gornju razliku u stopama.

U granici d i j → 0⁠, filogenetski par bi trebao biti ekvivalentan DR paru u trenutku prijenosa, odnosno prije nego što se genotipovi u dva domaćina raziđu zbog evolucije unutar domaćina. Stoga se čini razumnim koristiti procjenu korelacije na dij=0 kao proxy za heritabilnost u širem smislu, H 2 , u cjelokupnoj populaciji. Ova ideja je primijenjena u prethodnim studijama HIV-a (Hecht et al. 2010 Hollingsworth et al. 2010 Bachmann et al. 2017 Blanquart et al. 2017) kao i malarije (Anderson et al. 2010). Jedna potencijalna prepreka ovom pristupu je mogućnost uvođenja pristranosti uzorkovanja filtriranjem podataka. Na primjer, ako je studija na osobini, koja se razvija prema većim vrijednostima tijekom infekcije, pacijenti s nižim vrijednostima svojstava bili bi skloniji češćim CPP -ima nego u čitavoj populaciji. Dakle, ne postoji garancija da je distribucija osobina, a time i heritabilnost mjerena u CPP, jednaka heritabilnosti u cijeloj populaciji. Ovaj problem pristranosti uzorkovanja utječe na obje, zasnovane na sličnosti, kao i na trenutno korištene filogenetske uporedne metode. To sugerira da je pristup nametanju praga na dij ili procjenu korelacije (rA, rSp ili drugu mjeru korelacije) pri dij=0 treba dalju validaciju. U sljedećem pododjeljku koristimo simulacije modela igračaka kako bismo pokazali da je pristranost uzorka, iako prisutna, relativno mala u odnosu na negativnu pristranost zbog kašnjenja mjerenja.

ANOVA-CPP i POUMM najslabije su procjenjivači nasljednosti u simulacijama modela igračaka

Grupiranje vrijednosti osobina prema identičnom genotipu patogena. Procijenili smo koeficijent determinacije prilagođen za konačnu veličinu uzorka, R adj 2 ⁠, i korelaciju unutar klase (ICC) procijenjenu korištenjem jednosmjerne ANOVA, r A [ id ] ⁠ . Glavna razlika između ova dva procjenjivača je pretpostavka ANOVA-e da se grupna sredstva (genotipske vrijednosti) uzorkuju iz distribucije potencijalno mnogo više genotipova od onih pronađenih u podacima. Nasuprot tome, R adj 2 pretpostavlja da su svi uzorci u populaciji prisutni u uzorku. Budući da je posljednja pretpostavka točna za simulirane epidemije, R adj 2 predstavlja referentnu (istinitu) vrijednost H 2 sa kojim se upoređuju sve ostale procjene.

Poznati DR parovi. Procjenjivali smo regresijski nagib primatelja prema vrijednostima donatora na tri načina: 1) b—na osnovu vrijednosti osobina u trenutku dijagnosticiranja infekcije 2) b0—Na osnovu vrijednosti osobina odmah nakon događaja prenošenja i 3) b d i j ′ - na osnovu poduzorka dijagnosticiranih parova koji imaju dij ne prelazi prag d i j ′ ⁠. Na osnovu kompromisa između preciznosti i pristrasnosti odredili smo d i j ′ = D 1 ⁠, D1 označavajući prvi decil u empirijskoj distribuciji dij (pogledajte dodatne informacije, Dopunski materijal na mreži).

Filogenetski parovi (PP) u T 10 k ⁠. ICC smo ocijenili pomoću ANOVA -e na tri načina: 1) rA—Na osnovu svih PP 2) r A, D 1 - na osnovu CPP definisanih kao PP u T 10 k koji imaju dij ne prelazi prvi decil, D1 i 3) r A, 0, lin - procijenjeni presjek iz linearne regresije vrijednosti r A, D k na srednje vrijednosti dij, k u svakom decilu, k = 1,…, 10 ⁠ Za posljednja dva procjenjivača, koji pokušavaju procijeniti rA at dij= 0, koristimo akronim ANOVA-CPP. Kao alternativu ANOVA -i, koja je robusnija prema vanjskim vrijednostima (npr. Ekstremne vrijednosti na repu distribucije osobina), procijenili smo Spearmanovu korelaciju u prvom decilu, ovdje označenom kao r Sp, D 1 ⁠.

Stablo prenosa T 10 k ⁠. Procijenili smo filogenetsku heritabilnost na osnovu ML fita PMM i POUMM modela. Konkretno, usporedili smo klasičnu formulu procijenjenu na srednjoj udaljenosti vrha korijena t ¯ u drvetu (jednadžbe 10 i 12) (Housworth et al. 2004 Leventhal i Bonhoeffer 2016) i empirijsku formulu zasnovanu na varijansi svojstava uzorka, s 2 (z) (jednadžbe 11 i 13) (opisane u Materijali i metode). Za PMM, ove estimatore označavamo sa H BM 2 (t ¯) i H BM e 2⁠ za POUMM, koristimo simbole H OU 2 (t ¯) i H OU e 2 ⁠:

Tabela 1 rezimira matematičku definiciju i pretpostavke gornjih procjenitelja. Detaljniji opis PMM i POUMM metoda dat je u Materijali i metode. Referentni udžbenici o kvantitativnoj genetici (Lynch i Walsh 1998) su odlične reference za druge metode.

Testirani procjenitelji heritabilnosti osobina patogena u širokom smislu.

Ulazni podaci . Metoda (skraćenica). Pretpostavke. Estimator .
Grupisanje po identičnom infektivnom soju Prilagođeni koeficijent determinacije Uzorak podataka sadrži sve genotipove prisutne u populaciji R adj 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
Jednosmjerna analiza varijanse (ANOVA) Nezavisno uzorkovani genotipovi r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. vrijednosti-osobine unutar svake grupe
Jednake varijanse unutar grupe (homoskedastičnost)
Poznati parovi donor-primalac Regresija donor-primalac (DR) Nezavisno uzorkovani parovi donor-primalac
Jednaka preostala varijansa u rasponu vrijednosti donatora (homoscedastičnost) b = s ( z don , z rcp ) s 2 ( z don ) , (8)
Jednake varijacije donatora i populacije varijante: b ⁠, b 0 ⁠, b d i j ′
Filogenetski parovi (PP) ANOVA na svim/najbližim PP-ovima (ANOVA-PP, ANOVA-CPP) ANOVA pretpostavke (vidi gore) Definirano kao u jednačini (7), ali izračunato na PP
varijante: r A ⁠, r A, d i j ′
Spearmanova korelacija na svim/najbližim PP -ovima PP su nezavisni jedan od drugog Pearsonova (srednja vrijednost proizvoda) korelacija, izračunata na osnovu rangova vrijednosti svojstava.
varijante: r Sp ⁠, r Sp, d i j ′
Linearna regresija od rA on dij na raslojavanju rAzavisi linearno od dijPresjek, r A , 0 , l i n ⁠ , iz OLS uklapanja modela
Jednaka preostala varijansa u rasponu od dij r A (d i j) = r A, 0, l i n + ω 1 d i j. (9)
Stablo prenosa Filogenetski mješoviti model (PMM) Razvoj BM evolucije H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. distribuirano odstupanje okoline, e ∼ N ( 0 , σ e 2 ) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
Filogenetski Ornstein-Uhlenbeck mješoviti model (POUMM) Razvoj OU evolucije H OU 2 ( t ¯ ) = σ 2 ( 1 − exp ( − 2 α t ¯ ) ) σ 2 ( 1 − exp ( − 2 α t ¯ ) ) + 2 α σ e 2 (12)
i.i.n.d. odstupanje okoline, e ∼ N (0, σ e 2) H OU e 2 = 1 − σ e 2 / s 2 ( z ) (13)
Ulazni podaci. Metoda (skraćenica). Pretpostavke . Estimator .
Grupisanje po identičnom infektivnom soju Prilagođeni koeficijent determinacije Uzorak podataka sadrži sve genotipove prisutne u populaciji R adj 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
Jednosmjerna analiza varijanse (ANOVA) Nezavisno uzorkovani genotipovi r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. osobine-vrednosti unutar svake grupe
Jednake varijacije unutar grupe (homoscedastičnost)
Poznati parovi donatori -primatelji Regresija donor-primalac (DR) Nezavisno uzorkovani parovi donor-primalac
Jednaka rezidualna varijansa u rasponu vrijednosti donora (homoskedastičnost) b = s (z don, z rcp) s 2 (z don), (8)
Jednake varijacije donatora i populacije varijante: b ⁠ , b 0 ⁠ , b d i j ′
Filogenetski parovi (PP) ANOVA na svim/najbližim PP (ANOVA-PP, ANOVA-CPP) Pretpostavke ANOVA -e (vidi gore) Definirano kao u jednačini (7), ali izračunato na PP
varijante: r A ⁠, r A, d i j ′
Spearmanova korelacija na svim/najbližim PP -ovima PP su nezavisni jedan od drugog Pearsonova (srednja vrijednost proizvoda) korelacija, izračunata na osnovu rangova vrijednosti svojstava.
varijante: r Sp ⁠, r Sp, d i j ′
Linearna regresija od rA on dij na raslojavanju rAlinearno zavisi od dijPresjek, r A, 0, l i n ⁠, iz OLS uklapanja modela
Jednaka rezidualna varijansa u rasponu od dij r A ( d i j ) = r A , 0 , l i n + ω 1 d i j . (9)
Stablo prenosa Filogenetski mješoviti model (PMM) Razvoj BM evolucije H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. raspodijeljeno odstupanje okoliša, e ∼ N (0, σ e 2) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
Filogenetski Ornstein-Uhlenbeck mješoviti model (POUMM) Evolucija grananja OU H OU 2 (t ¯) = σ 2 (1 - exp ( - 2 α t ¯)) σ 2 (1 - exp ( - 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. odstupanje okoline, e ∼ N ( 0 , σ e 2 ) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)

Napomena. - Oznaka: s 2 (·) ⁠, varijansa uzorka s (·, ·) ⁠, kovarijansa uzorka N, broj pacijenata K, broj različitih grupa pacijenata, odnosno genotipova ili filogenetskih parova z, izmjerene vrijednosti G ^ ⁠, procijenjene genotipske vrijednosti: srednje vrijednosti pacijenata sa datim genotipom z don ⁠, vrijednosti davaoca z rcp ⁠, vrijednosti primatelja MS e ⁠, srednji kvadrat unutar grupe: MS e = ∑ (zi-z ¯ i) 2 N - K ⁠, gdje zi je vrijednost pojedinca, a z ¯ i je srednja vrijednost grupe kojoj pojedinac pripada MS b ⁠, srednji kvadrat među grupama: MS b = ∑ (z ¯ i-z ¯) 2 K-1 ⁠, gdje je z ¯ i je definisan kao gore, a z ¯ je srednja vrijednost populacije n, prosječni ponderirani broj pacijenata u grupi, tj. n= 2 za filogenetske parove i n = (N - ∑ n i 2 N) / (K - 1) za grupe promjenjive veličine α, σ, σe: PMM/POUMM parametri (opisani u Materijali i metode).

i.i.n.d., nezavisni i identično normalno raspoređeni dij, filogenetska udaljenost između parova donator -primatelj ili filogenetskih parova d i j ′ ⁠, prag na dij (vidi tekst).

Testirani procjenitelji široko-osjetljive nasljednosti svojstava patogena.

Ulazni podaci. Metoda (skraćenica). Pretpostavke . Estimator.
Grupisanje po identičnom infektivnom soju Prilagođeni koeficijent determinacije Uzorak podataka sadrži sve genotipove prisutne u populaciji R adj 2 = 1 − N − 1 N − K s 2 ( z − G ^ ) s 2 ( z ) (6)
Jednosmjerna analiza varijance (ANOVA) Nezavisno uzorkovani genotipovi r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. vrijednosti-osobine unutar svake grupe
Jednake varijacije unutar grupe (homoscedastičnost)
Poznati parovi donatori -primatelji Regresija donatora i primatelja (DR) Nezavisno uzorkovani parovi donor-primalac
Jednaka preostala varijansa u rasponu vrijednosti donatora (homoscedastičnost) b = s (z don, z rcp) s 2 (z don), (8)
Jednake varijacije donatora i populacije varijante: b ⁠, b 0 ⁠, b d i j ′
Filogenetski parovi (PP) ANOVA na svim/najbližim PP-ovima (ANOVA-PP, ANOVA-CPP) Pretpostavke ANOVA -e (vidi gore) Definirano kao u jednadžbi (7), ali izračunato na PP -ovima
varijante: r A ⁠ , r A , d i j ′
Spearmanova korelacija na svim/najbližim PP -ovima PP su nezavisni jedan od drugog Pirsonova (srednja vrednost proizvoda) korelacija, izračunata na osnovu ranga osobina-vrednosti.
varijante: r Sp ⁠ , r Sp , d i j ′
Linearna regresija od rA on dij nakon stratifikacije rAzavisi linearno od dijPresjek, r A , 0 , l i n ⁠ , iz OLS uklapanja modela
Jednaka rezidualna varijansa u rasponu od dij r A ( d i j ) = r A , 0 , l i n + ω 1 d i j . (9)
Stablo prenosa Filogenetski mješoviti model (PMM) Grananje BM evolucije H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. raspodijeljeno odstupanje okoliša, e ∼ N (0, σ e 2) H BM e 2 = 1 − σ e 2 / s 2 ( z ) (11)
Filogenetski Ornstein-Uhlenbeck mješoviti model (POUMM) Evolucija grananja OU H OU 2 (t ¯) = σ 2 (1 - exp ( - 2 α t ¯)) σ 2 (1 - exp ( - 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. odstupanje okoline, e ∼ N (0, σ e 2) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)
Ulazni podaci . Metoda (Skraćenica) . Pretpostavke. Estimator.
Grupisanje po identičnom infektivnom soju Prilagođeni koeficijent determinacije Uzorak podataka sadrži sve genotipove prisutne u populaciji R adj 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
Jednosmjerna analiza varijanse (ANOVA) Nezavisno uzorkovani genotipovi r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. osobine-vrednosti unutar svake grupe
Jednake varijacije unutar grupe (homoscedastičnost)
Poznati parovi donatori -primatelji Regresija donatora i primatelja (DR) Nezavisno uzorkovani parovi donatori -primatelji
Jednaka preostala varijansa u rasponu vrijednosti donatora (homoscedastičnost) b = s (z don, z rcp) s 2 (z don), (8)
Jednake varijacije donatora i populacije varijante: b ⁠, b 0 ⁠, b d i j ′
Filogenetski parovi (PP) ANOVA na svim/najbližim PP-ovima (ANOVA-PP, ANOVA-CPP) Pretpostavke ANOVA -e (vidi gore) Definirano kao u jednadžbi (7), ali izračunato na PP -ovima
varijante: r A ⁠ , r A , d i j ′
Spearmanova korelacija na svim/najbližim PP -ovima PP su nezavisni jedan od drugog Pirsonova (srednja vrednost proizvoda) korelacija, izračunata na osnovu ranga osobina-vrednosti.
varijante: r Sp ⁠, r Sp, d i j ′
Linearna regresija od rA on dij nakon stratifikacije rAzavisi linearno od dijPresjek, r A , 0 , l i n ⁠ , iz OLS uklapanja modela
Jednaka preostala varijansa u rasponu od dij r A (d i j) = r A, 0, l i n + ω 1 d i j. (9)
Stablo prijenosa Filogenetski mješoviti model (PMM) Grananje BM evolucije H BM 2 ( t ¯ ) = t ¯ σ 2 / ( t ¯ σ 2 + σ e 2 ) (10)
i.i.n.d. distribuirano odstupanje okoline, e ∼ N ( 0 , σ e 2 ) H BM e 2 = 1 − σ e 2 / s 2 ( z ) (11)
Filogenetski mješoviti model Ornstein -Uhlenbeck (POUMM) Razvoj OU evolucije H OU 2 ( t ¯ ) = σ 2 ( 1 − exp ( − 2 α t ¯ ) ) σ 2 ( 1 − exp ( − 2 α t ¯ ) ) + 2 α σ e 2 (12)
i.i.n.d. odstupanje okoline, e ∼ N ( 0 , σ e 2 ) H OU e 2 = 1 − σ e 2 / s 2 ( z ) (13)

Napomena .—Oznaka: s 2 ( · ) ⁠ , varijansa uzorka s ( · , · ) ⁠ , kovarijansa uzorka N, broj pacijenata K, broj različitih grupa pacijenata, odnosno genotipova ili filogenetskih parova z, izmjerene vrijednosti G ^ ⁠, procijenjene genotipske vrijednosti: srednje vrijednosti pacijenata sa datim genotipom z don ⁠, vrijednosti davaoca z rcp ⁠, vrijednosti primatelja MS e ⁠, srednji kvadrat unutar grupe: MS e = ∑ (zi-z ¯ i) 2 N - K ⁠, gdje zi je vrijednost pojedinca, a z ¯ i je srednja vrijednost grupe kojoj pojedinac pripada MS b ⁠, srednji kvadrat među grupama: MS b = ∑ (z ¯ i-z ¯) 2 K-1 ⁠, gdje je z ¯ i je definirano kao gore, a z ¯ je srednja vrijednost populacije n, ponderisani srednji broj pacijenata u grupi, tj. n=2 za filogenetske parove i n = ( N − ∑ n i 2 N ) / ( K − 1 ) za grupe promjenjive veličine α, σ, σe: PMM/POUMM parametri (opisani u Materijali i metode).

i.i.n.d., nezavisni i identično normalno distribuirani dij, filogenetska udaljenost između parova donator -primatelj ili filogenetskih parova d i j ′ ⁠, prag na dij (vidi tekst).

Unutar: neutralno/Između: neutralno

Unutar: odaberite/Između: neutralno

Unutar: neutralno/Između: odaberite

Unutar: select/Between: select

Za svaki od ovih scenarija i srednji kontaktni interval 1 / κ ∈ < 2 , 4 , 6 , 8 , 10 , 12 >(proizvoljne vremenske jedinice), izveli smo deset simulacija što je rezultiralo ukupno 4 × 6 × 10 = 240 simulacija. Od 240 simulacija, 175 je rezultiralo izbijanjem epidemije kod najmanje 10.000 dijagnosticiranih domaćina. Za svaku epidemiju analizirali smo populacije prvih do 10.000 dijagnosticiranih domaćina.

Rijetki događaji prijenosa (veći 1 / κ ⁠) rezultiraju dužim stablima prijenosa i, prema tome, većom prosječnom filogenetskom udaljenošću između vrhova, dij (dodatna slika S3, Dodatni materijal na mreži). Ovo je omogućilo demonstriranje efekta akumulacije unutar domaćina na različite procjenitelje nasljednosti (slika 4).

Procjene nasljednosti u simulacijama modela igračaka. (A – D) H 2-procjene u simulacijama "neutralnog" i "odabranog" unutar dinamike između/između domaćina. Svaka grupa kutija-brkova sumira simulacije za fiksni scenario i kontaktni interval, 1 / κ ⁠ bijele kutije (pozadina) označavaju istinsku nasljednost, obojene kutije označavaju procjene (prednji plan). Statistička značajnost se procjenjuje kroz t-testovi sažeti u tabeli 2.

Procjene nasljednosti u simulacijama modela igračaka. (A–D) H 2-procjene u simulacijama "neutralnog" i "odabranog" unutar dinamike između/između domaćina. Svaka grupa brkova u kutiji sažima simulacije za fiksni scenarij i kontaktni interval, 1 / κ ⁠ bijele kutije (pozadina) označavaju istinsku nasljednost, obojene kutije označavaju procjene (prednji plan). Statistička značajnost se vrednuje kroz t-testovi sažeti u tabeli 2.

Slika 4 pokazuje da su procjenjivači b D 1 ⁠, b ⁠, r A, D 1 ⁠ i r A negativno pristrani općenito za sve scenarije modela igračaka. Ova pristranost ima tendenciju povećanja sa srednjim kontaktnim intervalom, 1 / κ (respektivno, dij), jer nasumična mutacija unutar domaćina ima tendenciju da smanji genetsko preklapanje između DR i filogenetskih parova (dodatna slika S4, Dodatni materijal na mreži). Negativna pristranost bila je daleko manje izražena pri postavljanju praga dij ali to je došlo po cijenu preciznosti (manje pristrane, ali duže dijagrame kutijastih brkova za b D 1 i r A , D 1 u poređenju sa b i rA) (sl. 4). Nekoliko dodatnih izvora pristranosti otkriveno je uzimajući u obzir praktički nedostupne procjenitelje b0 i r A [ i d ] . Procjenitelj r A [ id ] je bio pozitivno pristrasan zbog malog broja simuliranih genotipova (samo šest) – to je potvrđeno dodatnim simulacijama koje pokazuju da r A [ id ] konvergira pravoj vrijednosti za nešto veći broj genotipova (npr. , K≥24 genotipa, pogledajte dodatne informacije, dopunski materijal na mreži). Procenjivač b0 se ponašao precizno u neutralnom/neutralnom scenariju (isključujući vrlo kratke kontaktne intervale), ali je imao tendenciju da ima pristrasnost u oba smjera u svim scenarijima koji uključuju odabir. Glavni razlog za ove pristrasnosti bio je fenomen „pristranosti uzorka“ koji se sastoji u razlici između raspodjele izmjerenih vrijednosti u parovima DR i populacije od interesa. Iako je njegova veličina bila relativno mala u simulacijama, pretpostavljamo da bi pristranost uzorkovanja mogla igrati važnu ulogu u stvarnim biološkim primjenama.Već smo dali primjer ove pristranosti u prethodnom pododjeljku. Još jedna manifestacija pristranosti uzorkovanja je činjenica da b0 ne uklanja u potpunosti učinak evolucije (i selekcije) domaćina kod donatora. Zbog toga, u slučajevima selekcije, fenotipska varijansa kod donatora ima tendenciju da bude manja od varijanse kod primatelja, kao i varijanse u populaciji (dodatna slika S5, Dodatni materijal na mreži). Dodatni detalji o ovim potencijalnim izvorima pristranosti su dati u dodatnim informacijama, Dodatni materijal na mreži.

Nadalje, simulacije su pokazale da pogoršanje uklapanja BM modela na duža stabla prijenosa uzrokuje naduvanu procjenu odstupanja okoline, σ e ⁠, u uklapanjima PMM i, prema tome, negativnu pristranost u H BM 2 (t ¯) i H BM e 2 (uporedite procjene za male i velike vrijednosti 1 / κ na slici 4 i dodatnoj slici S6 C, Dopunski materijal na mreži). Za razliku od PMM-a, POUMM procjene, H OU 2 (t ¯) i H OU e 2 bile su daleko tačnije, a vrijednost σ e u POUMM ML uklapanju se skoro poklapala sa pravom nenasljednom devijacijom u većini simulacija (sl. 4 i dodatna slika S6 C, Dopunski materijal na mreži). Bolje uklapanje ML-a POUMM-a potvrđeno je jačom statističkom podrškom, naime nižim vrijednostima AICc u svim simulacijama modela igračaka (dodatna slika S6 D, Dodatni materijal na mreži).

Činjenica da je POUMM nadmašio PMM u svim scenarijima bila je u suprotnosti s početnim uvjerenjem da bi PMM trebao biti prikladniji model za neutralno evoluirajuću osobinu predstavljenu neutralnim/neutralnim scenarijem, dok bi POUMM trebao bolje odgovarati scenarijima koji uključuju selekciju. Također je bilo kontraintuitivno da je izvedeni parametar α iz POUMM modela bio je značajno pozitivan u svim simulacijama, uključujući neutralni/neutralni scenarij (dodatna slika S6 B, Dopunski materijal na mreži). Da bismo bolje razumjeli ovaj fenomen, izvršili smo analizu stratifikacije PP-a na podacima modela igračaka (dodatna slika S7, Dopunski materijal na mreži). Ovo je otkrilo obrazac korelacije koji eksponencijalno opada sa dij. Oblik eksponencijalnog raspada bio je uglavnom izražen za duže kontaktne intervale, 1 / κ ⁠, posebno u neutralnom / neutralnom scenariju (prva kolona na dodatnoj slici S7, Dopunski materijal na mreži). U dodatnim informacijama, Supplementary Material online, pokazujemo da je eksponencijalno raspadajuća fenotipska korelacija konzistentna s neutralno mutirajućim genotipom prema modelu supstitucije Jukes -Cantor (Yang 2006). Pad korelacije i dalje je bio prisutan u scenarijima koji uključuju odabir unutar i/ili između domaćina, ali je uočeni obrazac prilično nepravilan i odstupao je od eksponencijalne funkcije dij (dodatna slika S7, Dodatni materijal na mreži). U većini slučajeva, ML uklapanje PMM metode loše se uklapalo u opadanje korelacije (smeđe tačke i trake grešaka na dodatnoj slici S7, Dopunski materijal na mreži) za duže intervale kontakta, postojala je tendencija ka konstantnim vrijednostima korelacija prema PMM -u daleko ispod prave vrijednosti (smeđe tačke i trake grešaka na dodatnoj slici S7, Dopunski materijal na mreži). Ovo objašnjava općenito bolju točnost POUMM -a u odnosu na PMM metodu.

Tablica 2 prikazuje prosječnu pristranost svakog testiranog procjenitelja za svaki od četiri scenarija. Zaključujemo da su, osim praktički nedostupnih procjenitelja zasnovanih na grupiranju po identičnom genotipu (⁠ R adj 2 i r A [ id ] ⁠ ), najprecizniji procjenitelji H 2 u simulacijama modela igračke su H OU 2 (t ¯) i H OU e 2 praćene procjeniteljima korelacije u PP minimizirajući filogenetičku udaljenost dij, to jest (⁠ r A, D 1 ⁠, r A, 0, l i n ⁠, r Sp, D 1 ⁠). U sljedećem pododjeljku izvještavamo o rezultatima ovih procjenjivača u britanskim podacima o HIV -u.

Srednja razlika H 2 ̂-R adj 2 iz simulacija modela igračaka grupiranih prema scenariju.

Unutar: . Neutralno. Neutralno. Odaberite. Odaberite.
Između:. Neutralno. Odaberite. Neutralno. Odaberite .
N50 41 47 37
b 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
b D 1 −0.07 ** −0.04 ** 0 −0.01
b−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [ i d ] 0.05 ** 0.05 ** 0.08 ** 0.06 **
r A, 0, l i n ^ −0.05 ** −0.06 ** 0.01 −0.04 **
r A, D 1 −0.05 ** −0.06 ** 0 −0.03 *
r A −0.18 ** −0.15 ** −0.06 ** −0.08 **
r Sp, D 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (t ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **
Unutar:. Neutralno. Neutralno. Odaberite. Odaberite.
Između: . Neutralno. Odaberite . Neutralno. Odaberite.
N50 41 47 37
b 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
b D 1 −0.07 ** −0.04 ** 0 −0.01
b−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [ i d ] 0.05 ** 0.05 ** 0.08 ** 0.06 **
r A , 0 , l i n ^ −0.05 ** −0.06 ** 0.01 −0.04 **
r A, D 1 −0.05 ** −0.06 ** 0 −0.03 *
r A −0.18 ** −0.15 ** −0.06 ** −0.08 **
r Sp, D 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (t ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **

Napomena .—Statističku značajnost procjenjuje Student's t-testovi, P vrijednosti označene zvjezdicom kako slijedi: * P& lt0.01 **P& lt0.001. Siva pozadina ukazuje na procjene koje su nedostupne u praksi.

Srednja razlika H 2 ̂ − R adj 2 iz simulacija modela igračke grupisanih po scenariju.

Unutar:. Neutralno. Neutralno. Odaberite. Odaberite .
Između: . Neutralno. Odaberite . Neutralno. Odaberite .
N50 41 47 37
b 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
b D 1 −0.07 ** −0.04 ** 0 −0.01
b−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [i d] 0.05 ** 0.05 ** 0.08 ** 0.06 **
r A , 0 , l i n ^ −0.05 ** −0.06 ** 0.01 −0.04 **
r A , D 1 −0.05 ** −0.06 ** 0 −0.03 *
r A −0.18 ** −0.15 ** −0.06 ** −0.08 **
r Sp , D 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (t ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 ( t ¯ ) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **
Unutar:. Neutralno. Neutralno. Odaberite. Odaberite.
Između: . Neutralno. Odaberite . Neutralno. Odaberite.
N50 41 47 37
b 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
b D 1 −0.07 ** −0.04 ** 0 −0.01
b−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [ i d ] 0.05 ** 0.05 ** 0.08 ** 0.06 **
r A , 0 , l i n ^ −0.05 ** −0.06 ** 0.01 −0.04 **
r A , D 1 −0.05 ** −0.06 ** 0 −0.03 *
r A −0.18 ** −0.15 ** −0.06 ** −0.08 **
r Sp, D 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (t ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **

Napomena. - Statistička značajnost se procjenjuje prema Studentovoj t-testovi, P vrijednosti označene zvjezdicom na sljedeći način: * P<0.01 **P& lt0.001. Siva pozadina označava procjene koje su nedostupne u praksi.

Heratibalizam lg (spVL) u britanskoj HIV kohorti

Procijenili smo korelaciju u CPPs (ANOVA i Spearmanova korelacija) u podacima iz UK HIV kohorte koja se sastoji od mjerenja lg(spVL) i stabla virusnih (pol) sekvence od 8.483 pacijenta za koje je prethodno zaključeno (Hodcroft et al. 2014). Osim toga, izvršili smo Bayesovo uklapanje POUMM i PMM metoda na iste podatke. Cilj je bio testirati naše zaključke na stvarnom skupu podataka i uporediti ih H 2 -procjene od CPPs i POUMM do prethodnih PMM/ReML procjena na potpuno istim podacima (Hodcroft et al. 2014).

U primjeni ANOVA-CPP, prvi korak je bio definiranje granične filogenetske udaljenosti za definiranje CPP-a. U tu svrhu istražili smo različite stratifikacije PP kao što je prikazano na dodatnoj slici S1 B, Dodatni materijal na mreži i dijagram raspršenosti filogenetskih udaljenosti u odnosu na apsolutne fenotipske razlike, | Δ lg ⁡ ( spVL ) | (slika 5A). Ovo je otkrilo mali skup od 116 PP-a koji imaju d i j ≤ 10-4 i usko se podudaraju s prvim vigintilom (koji se naziva i 20-kvantil ili ventil) dij. Filogenetska udaljenost u svim preostalim parovima vrhova bila je veća od reda veličine, odnosno d i j > 10 − 3 ⁠ . S obzirom da se filogenetska udaljenost na stablu prijenosa mjeri zamjenama po mjestu i dužinom pol-regija je redoslijeda 10 3 web mjesta, pretpostavljamo da gornji skup od 116 PP -a odgovara skupu od 116 parova identičnih pol konsenzus sekvenci (nisu bili dostupni podaci o sekvenci da se ovo provjeri). Na temelju ovog zapažanja definirali smo gornje parove kao CPP -ove i prag je formalno postavljen na d i j ′ = 10 - 4 ⁠. Potvrdili smo da su CPP -i nasumično raspoređeni duž stabla (slika 5B). Slučajna raspodjela CPP -a duž stabla prijenosa sugerira da ti filogenetski parovi odgovaraju nasumično ranim otkrivanjima infekcije (vrijednosti svojstava svakog para prikazane su kao magenta segmenti na slici 5B). Kako bismo provjerili nije li filtriranje podataka donijelo značajnu pristranost uzorkovanja zbog odabira (vidi prethodni pododjeljak), također smo potvrdili da nema značajne razlike u distribuciji svojstava svih pacijenata, PP -a i CPP -a (sl. 5C).

Filogenetski parovi u lg (spVL) podacima iz Ujedinjenog Kraljevstva. (A) Grafikon raspršenosti filogenetskih udaljenosti između parova vrhova u odnosu na njihove apsolutne fenotipske razlike: siva, PP (⁠ d i j> 10 - 4 ⁠) magenta, CPP (⁠ d i j & lt 10 - 4 ⁠). Crna linija prikazuje linearnu regresiju | Δ lg ⁡ (spVL) | on dij (nagib regresije bio je statistički pozitivan na nivou 0,01). (B) Box-plot koji prikazuje distribuciju osobina duž stabla prenosa. Svaki brčić predstavlja lg (spVL) -razdiobu pacijenata grupiranih prema udaljenosti od korijena stabla mjereno zamjenama po mjestu. Šire kutije označavaju grupe veće veličine. Segmenti u magenta označavaju lg(spVL)-vrijednosti u CPP. (C) Okvirni dijagram lg(spVL)-distribucije kod svih pacijenata (crni), PP (siva) i CPP (magenta).

Filogenetski parovi u lg (spVL) podacima iz Ujedinjenog Kraljevstva. (A) Grafikon raspršenosti filogenetskih udaljenosti između parova vrhova u odnosu na njihove apsolutne fenotipske razlike: siva, PP (⁠ d i j> 10 - 4 ⁠) magenta, CPP (⁠ d i j & lt 10 - 4 ⁠). Crna linija prikazuje linearnu regresiju | Δ lg ⁡ ( spVL ) | on dij (nagib regresije bio je statistički pozitivan na nivou 0,01). (B) Box-ploča koja predstavlja distribuciju osobina duž stabla prijenosa. Svaki brčić predstavlja lg (spVL) -razdiobu pacijenata grupiranih prema udaljenosti od korijena stabla mjereno zamjenama po mjestu. Šire kutije označavaju grupe veće veličine. Magenta segmenti označavaju lg (spVL) vrijednosti u CPP-ovima. (C) Okvirni dijagram lg(spVL)-distribucije kod svih pacijenata (crni), PP (siva) i CPP (magenta).

ANOVA-CPP (⁠ r A, D 1 ⁠, r A, 10-4 ⁠, r A, V 1 ⁠) i originalna PP-metoda rA

Presjek iz linearne regresije rA on dij nakon stratifikacije PP u decile (⁠ r A , 0 , l i n ⁠ , jednad. 9)

Spearmanov korelatoin u CPP -ovima (⁠ r Sp, D 1 ⁠, r Sp, 10 - 4 ⁠, r Sp, V 1 ⁠) i u svim PP -ovima (⁠ r Sp ⁠).

Odsječak iz linearne regresije r Sp on dij nakon stratifikacije PP u decile (⁠ r Sp, 0, l i n ⁠)

POUMM (⁠ H OU 2 (t ¯) ⁠, H OU e 2 ⁠), u odnosu na PMM (⁠ H BM 2 (t ¯) ⁠, H BM e 2 ⁠) na cijelom stablu

Rezultati ovih analiza prikazani su u tablici 3. ANOVA- i Spearmanova korelacijska procjena, koja je smanjila filogenetsku udaljenost pomoću regresije ili filtriranja filogenetskih parova, imala je procjene tačaka r A, 10-4 = 0,17 i r Sp , 10 − 4 = 0,22 ⁠ . Nešto viša procjena za Spearmanovu korelaciju mogla bi se objasniti prisutnošću izdvajanja u podacima. Primjenom POUMM -a na cijelo drvo prijavljena je procjena tačke H OU 2 (t ¯) = 0,21 (8,483 pacijenata, 95% CI [0,14, 0,29]).

Procjene lg (spVL) -nasljednosti u HIV podacima iz Ujedinjenog Kraljevstva.

Metoda. N . H ^ 2. 95% CI. 95% HPD .
Linearna regresija od rA na d i j ¯ u decilima (jednadžba 9) (⁠ r A, 0, l i n ⁠) 10 bodova 0.17 [0.09, 0.24]
Linearna regresija od rSp na d i j ¯ u decilima (⁠ r Sp, 0, l i n ⁠) 10 bodova 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A, V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP ( r A , 10 − 4 ) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A, D 1 ⁠) 384 0.16 [0.06, 0.25]
ANOVA-PP (rA) a 3,834 0.11 [0.08, 0.14]
Spearman-CPP (⁠ r Sp, V 1 ⁠) 224 0.23 [0.05, 0.42]
Spearman-CPP (⁠ r Sp, 10-4 ⁠) 232 0.22 [0.03, 0.4]
Spearman-CPP ( r Sp , D 1 ) 384 0.2 [0.06, 0.34]
Spearman-PP (rSp) a 3,834 0.11 [0.06, 0.15]
POUMM (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
POUMM (⁠ H OU e 2 ⁠) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) b 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) b 8,483 0.06 [0.02, 0.1]
PMM, ReML (Hodcroft i dr. 2014.) b 8,483 0.06 [0.03, 0.09]
Metoda. N . H ^ 2. 95% CI . 95% HPD .
Linearna regresija od rA na d i j ¯ u decilima (jednadžba 9) (⁠ r A, 0, l i n ⁠) 10 bodova 0.17 [0.09, 0.24]
Linearna regresija od rSp na d i j ¯ u decilima (⁠ r Sp, 0, l i n ⁠) 10 bodova 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A, V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP ( r A , 10 − 4 ) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A, D 1 ⁠) 384 0.16 [0.06, 0.25]
ANOVA-PP (rA) a 3,834 0.11 [0.08, 0.14]
Spearman-CPP ( r Sp , V 1 ) 224 0.23 [0.05, 0.42]
Spearman-CPP (⁠ r Sp, 10-4 ⁠) 232 0.22 [0.03, 0.4]
Spearman-CPP ( r Sp , D 1 ) 384 0.2 [0.06, 0.34]
Spearman-PP (rSp) a 3,834 0.11 [0.06, 0.15]
POUMM (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
POUMM ( ⁠ H OU e 2 ⁠ ) 8,483 0.2 [0.13, 0.29]
PMM ( ⁠ H BM 2 ( t ¯ ) ⁠ ) b 8,483 0.08 [0.05, 0.12]
PMM ( ⁠ H BM e 2 ⁠ ) b 8,483 0.06 [0.02, 0.1]
PMM, ReML (Hodcroft i dr. 2014.) b 8,483 0.06 [0.03, 0.09]

Napomena .—Takođe su napisani rezultati prethodne analize na istom skupu podataka (Hodcroft et al. 2014). “–”: analiza nije rađena u navedenoj studiji. Siva pozadina: procjene se smatraju nepouzdanima zbog: negativne pristranosti uzrokovane kašnjenjima mjerenja i b negativne pristranosti uzrokovane kršenjem BM -a. Nesigurnost u procjenama izražena je u 95% intervalima povjerenja (CI), ili, u slučaju Bayesovog zaključivanja, 95% intervalima visoke posteriorne gustine (HPD).

Procjene lg (spVL) -nasljednosti u HIV podacima iz Ujedinjenog Kraljevstva.

Metoda . N . H ^ 2 . 95% CI. 95% HPD.
Linearna regresija od rA na d i j ¯ u decilima (jednačina 9) (⁠ r A , 0 , l i n ⁠ ) 10 bodova 0.17 [0.09, 0.24]
Linearna regresija od rSp na d i j ¯ u decilima (⁠ r Sp, 0, l i n ⁠) 10 bodova 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A, V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP (⁠ r A, 10-4 ⁠) 232 0.16 [0.01, 0.30]
ANOVA-CPP ( r A , D 1 ) 384 0.16 [0.06, 0.25]
ANOVA-PP (rA) a 3,834 0.11 [0.08, 0.14]
Spearman-CPP ( r Sp , V 1 ) 224 0.23 [0.05, 0.42]
Spearman-CPP (⁠ r Sp, 10-4 ⁠) 232 0.22 [0.03, 0.4]
Spearman-CPP (⁠ r Sp, D 1 ⁠) 384 0.2 [0.06, 0.34]
Spearman-PP (rSp) a 3,834 0.11 [0.06, 0.15]
POUMM ( ⁠ H OU 2 ( t ¯ ) ⁠ ) 8,483 0.21 [0.14, 0.29]
POUMM ( ⁠ H OU e 2 ⁠ ) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) b 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) b 8,483 0.06 [0.02, 0.1]
PMM, ReML (Hodcroft i dr. 2014.) b 8,483 0.06 [0.03, 0.09]
Metoda . N . H ^ 2. 95% CI. 95% HPD.
Linearna regresija od rA na d i j ¯ u decilima (jednadžba 9) (⁠ r A, 0, l i n ⁠) 10 bodova 0.17 [0.09, 0.24]
Linearna regresija od rSp na d i j ¯ u decilima ( ⁠ r Sp , 0 , l i n ⁠ ) 10 bodova 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A, V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP ( r A , 10 − 4 ) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A, D 1 ⁠) 384 0.16 [0.06, 0.25]
ANOVA-PP (rAa) 3,834 0.11 [0.08, 0.14]
Spearman-CPP ( r Sp , V 1 ) 224 0.23 [0.05, 0.42]
Spearman-CPP (⁠ r Sp, 10 − 4 ⁠) 232 0.22 [0.03, 0.4]
Spearman-CPP ( r Sp , D 1 ) 384 0.2 [0.06, 0.34]
Spearman-PP (rSpa) 3,834 0.11 [0.06, 0.15]
POUMM ( ⁠ H OU 2 ( t ¯ ) ⁠ ) 8,483 0.21 [0.14, 0.29]
POUMM ( ⁠ H OU e 2 ⁠ ) 8,483 0.2 [0.13, 0.29]
PMM ( ⁠ H BM 2 ( t ¯ ) ⁠ ) b 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) b 8,483 0.06 [0.02, 0.1]
PMM, ReML (Hodcroft i dr. 2014.) b 8,483 0.06 [0.03, 0.09]

Napomena .—Takođe su napisani rezultati prethodne analize na istom skupu podataka (Hodcroft et al. 2014). “ -”: analiza nije urađena u pomenutoj studiji. Siva pozadina: procjene se smatraju nepouzdanima zbog: negativne pristranosti uzrokovane kašnjenjima mjerenja i b negativne pristranosti uzrokovane kršenjem BM -a. Neizvjesnost u procjenama izražava se u smislu 95% intervala pouzdanosti (CI), ili, u slučaju Bayesova zaključivanja, 95% intervala visoke stražnje gustoće (HPD).

Suprotno tome, procjene heritabilnosti iz originalne PP metode (ANOVA ili Spearman korelatoin na svim PP) i PMM bile su značajno niže i padale su ispod 95% CI iz POUMM (tabela 3). Ovo potvrđuje zapažanje iz simulacija modela igračke da su ovi procjenitelji negativno pristrani, budući da zanemaruju ili neprecizno modeliraju promjenjivu korelaciju unutar parova vrhova. Potvrdili smo jaču statističku podršku za POUMM u odnosu na PMM, njegovom nižom AICc vrijednošću (dopunska tablica S1, Dodatni materijal na mreži) i stražnjom gustoćom za parametar POUMM α (dodatna slika S8, Dodatni materijal na mreži).

Konačno, uporedili smo naše procjene lg (spVL) -nasljednosti sa prethodnim primjenama istih metoda na različitim skupovima podataka (slika 6). U skladu sa simulacijama modela igračaka, procjene H 2 koristeći PMM ili druge filogenetske metode zasnovane na BM (npr. Blombergove K i Pagelove λ) su znatno niže od svih ostalih procjena, što ukazuje na to da ove filogenetske komparativne metode potcjenjuju H 2 procjene zasnovane na sličnosti umanjuju se zbog kašnjenja mjerenja (npr. Uporedite rano sa kasnim u Holandiji na slici 6).

Poređenje između H 2 H 2 -procjene iz kohorte HIV -a u Velikoj Britaniji i prethodne procjene podataka iz Afrike, Švicarske i Holandije. (A) Procjene sa minimiziranim kašnjenjem mjerenja (tamno kadetsko-plavo) i POUMM procjene (zeleno) (B) Procjene prema dolje zbog većih kašnjenja mjerenja (svijetlo-plava) ili prekršene BM-pretpostavke (smeđa). Povjerenje se prikazuje ili kao segmenti koji ukazuju na procijenjenih 95% CI ili P vrijednosti u slučajevima nedostajućih 95% CI. Reference na odgovarajuće publikacije su napisane brojevima u superskriptu kako slijedi: 1: Tang et al. (2004) 2: Hecht et al. (2010) 3: Hollingsworth i sur. (2010) 4: van der Kuyl i sur. (2010) 5: Lingappa et al. (2013) 6: Yue i sur. (2013) 7: Alizon et al. (2010) 8: Shirreff et al. (2013) 9: Hodcroft i sur. (2014) 10: Blanquart i sur. (2017) 11: Bertels et al. (2018) 12: ovo djelo.Radi jasnoće, procjene iz prethodnih studija koje se ne mogu direktno uporediti (npr. Prethodni rezultati iz švicarskog MSM -a/strogi skupovi podataka Alizon et al. 2010).

Poređenje između H 2 H 2 -procjene iz kohorte HIV -a u Velikoj Britaniji i prethodne procjene podataka iz Afrike, Švicarske i Holandije. (A) Procjene sa minimiziranim kašnjenjem mjerenja (tamno kadetsko-plavo) i POUMM procjene (zeleno) (B) Procjene prema dolje zbog većih kašnjenja mjerenja (svijetlo-plava) ili prekršene BM-pretpostavke (smeđa). Povjerenje se prikazuje ili kao segmenti koji ukazuju na procijenjenih 95% CI ili P vrijednosti u slučajevima nedostajućih 95% CI. Reference na odgovarajuće publikacije su napisane brojevima u superskriptu kako slijedi: 1: Tang et al. (2004) 2: Hecht et al. (2010) 3: Hollingsworth i sur. (2010) 4: van der Kuyl i sur. (2010) 5: Lingappa et al. (2013) 6: Yue i sur. (2013) 7: Alizon et al. (2010) 8: Shirreff et al. (2013) 9: Hodcroft i sur. (2014) 10: Blanquart i sur. (2017) 11: Bertels et al. (2018) 12: ovo djelo. Radi jasnoće, procjene iz prethodnih studija, koje nisu direktno uporedive (npr. prethodni rezultati iz švicarskog MSM/striktnih skupova podataka Alizon et al. 2010).

Ukratko, procjene prinosa POUMM-a i ANOVA-CPP-a za H 2 u britanskim podacima i ove procjene se slažu sa procjenama zasnovanim na sličnostima u skupovima podataka sa kratkim kašnjenjem mjerenja (različite afričke zemlje i Holandija). Slično simulacijama modela igračke, primjećujemo dobro izražen obrazac negativne pristranosti za druge procjenitelje, PMM i ANOVA-PP, kao i za prethodne studije zasnovane na sličnosti na podacima sa velikim kašnjenjem mjerenja.


Veličina mozga i inteligencija

Neki istraživači ispitivali su vezu između veličine mozga i inteligencije. 26 Za ljude, statistički odnos je skroman, ali značajan. Očigledno, nalaz je samo korelacijski: veća veličina mozga može uzrokovati veću inteligenciju, veća inteligencija može uzrokovati veću veličinu mozga, ili oboje mogu ovisiti o nekom trećem faktoru. Štaviše, efikasnost korištenja mozga vjerovatno je važnija od njegove veličine. Na primjer, muškarci u prosjeku imaju veći mozak od žena, ali žene imaju bolje veze, preko corpus callosum, između dvije hemisfere. Dakle, nije jasno koji bi spol u prosjeku imao prednost, a vjerovatno ni#x02014. 27

Odnos između veličine mozga i inteligencije ne postoji među vrstama. 28 Umjesto toga, čini se da postoji veza između inteligencije i veličine mozga u odnosu na grubu opću veličinu organizma (nivo encefalizacije).


Rezultati

Karakterizira pejzaž metilacije neuronske DNA u 8 regija mozga

Prethodni izvještaji od nas i drugih pokazali su različite epigenetske pejzaže među funkcionalno različitim regijama mozga [11, 12]. Naše prethodno istraživanje bilo je ograničeno na mali broj pojedinaca i regija mozga. Međutim, pokazali smo da je metilacija DNA specifična za regiju mozga primarno prisutna u neuronskim, a ne u neuronskim jezgrama. Nadalje, omjer neurona i ne-neurona čak i između susjednih dijelova iz istog područja mozga uvelike se razlikovao, što je ozbiljno zbunilo analizu diferencijalne metilacije u nepročišćenim jezgrama. Stoga smo primijenili strategiju pročišćavanja neuronskih jezgara prije sekvenciranja bisulfita cijelog genoma. Analiza mnogo većeg broja individua i regija mozga omogućila nam je da se pozabavimo potencijalnim postojanjem VMR-a (regija interindividualne varijacije u metilaciji unutar tkiva), njihovim međusobnim odnosom i odnosom prema SNP-ovima identificiranim u ovim GTEx donatorima. Neuronska jezgra su izolovana iz moždanog tkiva na osnovu pozitivnog NeuN (RBFOX3) bojenje putem sortiranja jezgri aktiviranih fluorescencijom i jezgra NeuN+ nazivaju se neuronskim, uz napomenu da je ova frakcija sastavljena od više subpopulacija (dodatna datoteka 1: slika S1a). Ispitali smo 8 regija mozga prikupljenih od GTEx donatora: amigdala (n = 12), prednji cingularni korteks (BA24) (n = 15), repni (n = 22), frontalni korteks (BA9) (n = 24), hipokampus (n = 20), hipotalamus (n = 13), nucleus accumbens (n = 23), i putamen (n = 16). Pored toga, analizirali smo metilaciju DNK izolovane iz dva nemoždana tkiva od GTEx donora: pluća (n = 18) i štitnjače (n = 19) za ukupno 182 uzorka (dodatna datoteka 2: Tabela S1). Generirali smo> 30 milijardi jedinstveno mapiranih čitanja sa uparenim krajem od 150 bp sa prosječnom dubinom & gt 10X naknadne obrade (Dodatna datoteka 3: Tablica S2). Nekoliko uzoraka je isključeno zbog nesklada u genotipu, jer se genotip isporučenog uzorka nije podudarao sa evidencijom biobanke (Dodatna datoteka 4: Tabela S3). Pet dodatnih uzoraka je isključeno nakon što je analiza glavnih komponenti otkrila pogrešno označavanje uzorka prije nego što su ga primili u našu laboratoriju. To smo potvrdili utvrđivanjem koja tkiva najviše odgovaraju metilaciji ovih uzoraka (Dodatna datoteka 1: Slika S1b).

Analiza glavnih komponenti globalnih nivoa metilacije neuronskih DNK otkrila je jasnu segregaciju ovih regija mozga u prve dvije glavne komponente (slika 1a). Izvršili smo diferencijalnu analizu CpG metilacije identificirajući CG-DMR, tj. Regije diferencijalne CpG metilacije među neuronskim jezgrama izoliranim iz svake regije mozga. S obzirom na to da jedan CG-DMR može predstavljati razliku između više regija mozga, umjesto da izvrši 28 usporedbi u paru, koristili smo F-test za identifikaciju 174.482 statistički značajna autozomna neuronska CG-DMR-a koji su definisani kao regioni genoma gde najmanje 2 od 8 regiona mozga imaju različite nivoe CpG metilacije (Dodatna datoteka 5: Tabela S4). Kontroliramo porodičnu stopu grešaka na 5% permutacijom, a koristimo BSmooth da iskoristimo informacije iz obližnjih CpG-ova glatkom. U pilot studiji, profilirali smo NeuN+ ćelije iz 4 regije mozga koristeći sekvenciju bisulfita cijelog genoma na uzorcima 6 različitih pojedinaca koji nisu dio GTEx -a [12]. Otkrili smo da se 99,5% naših prethodno identifikovanih neuronskih CG-DMR (13,019/13,074) preklapa sa CG-DMR iz naše nove analize GTEx uzoraka (nakon ispravljanja za višestruko testiranje). Da bismo napravili preciznije poređenje, ispitali smo korelaciju između razlika u metilaciji između dva tkiva, mjereno odvojeno u Rizzardi i sur. [12] i ovu studiju (tkiva su bila nucleus accumbens i prefrontalni korteks, odabrani zato što je većina CG-DMR-ova iz Rizzardija et al. [12] bila između ta dva tkiva). Nalazimo upečatljivu korelaciju od 0,97 kako je prikazano na slici S1c koja naglašava ponovljivost naših eksperimentalnih i analitičkih pristupa u biobankama. Ovaj visoki nivo reproducibilnosti je prisutan čak i kada se ispituju razlike u metilaciji između svih 13.074 neuronskih DMR-a identifikovanih u [12] između dva vrlo slična kortikalna regiona (Dodatni fajl 1: Slika S1d), što sugeriše da je naš pristup konzervativan, verovatno zato što kontrolišemo porodicu -ujednačena stopa grešaka.

Identifikacija CG-DMR među neuronima funkcionalno različitih regija mozga. Metilacija DNK je procijenjena u neuronskim jezgrama izolovanim iz 8 regija mozga, kako je naznačeno, od 12 do 24 osobe. a Analiza glavnih komponenti udaljenosti izvedenih iz prosječne autosomne ​​CpG metilacije u kantama od 1 kb. b Hijerarhijsko grupisanje uzoraka na osnovu prosječne metilacije po uzorku u najdiskriminatornijim CG-DMR-ovima (pogledajte odjeljak “Metode”). c Toplotna karta koja predstavlja log2 obogaćivanje CpG-ova unutar CG-DMR-a i blokova identifikovanih u svakoj CG-DMR analizi u poređenju sa ostatkom genoma za genomske karakteristike. Modeli gena iz GENCODEv26 (promotori, intronički, egzonički, 5′UTR, 3′UTR, intergeni), CpG ostrva (CGI) i srodne karakteristike iz UCSC (obala, police, OpenSea), navodni regioni pojačivača (pojačivači i pojačivači visoke pouzdanosti iz PsychENCODE [18] i H3K27ac [19]). 5 grupa = CG-DMR ili blokovi između svih 5 grupa tkiva. d Kao u c, koji pokazuje obogaćivanje u regijama otvorenog kromatina u jezgrama NeuN− i NeuN+ i jezgrama NeuN+ izoliranim iz naznačenih regija mozga (PV korteks, primarni vidni korteks Med. talamus, mediodorzalni talamus) iz [10]. e Primjeri CG-DMR-ova koji pokrivaju NPTXR gen koji pokazuje prosječne vrijednosti metilacije za jezgre NeuN+ iz svake boje grupe tkiva kodirane kao u b. Područja diferencijalne metilacije zasjenjena su ružičastom bojom. f Izražavanje NPTXR iz uzorka podudarnih masivnih moždanih tkiva iz GTEx v8 izdanja podataka

Da bismo olakšali tumačenje naših podataka, izvršili smo jednostavniju analizu. Konkretno, kolabirali smo uzorke frontalnog korteksa i prednjeg cingularnog korteksa u "kortikalnu" grupu, a kaudat, putamen i nucleus accumbens u grupu "bazalnih ganglija". Dobivenih 5 grupa tkiva u skladu je s razvojnim podrijetlom regija mozga koje telencefalon dovodi do moždane kore (koja se grana u frontalni korteks, prednji cingularni korteks i formaciju hipokampusa) i jezgre mozga (koje se granaju u amigdalu) i bazalne ganglije) dok diencefalon proizvodi hipotalamus [23]. Identificirali smo 181.146 autosomno-neuronskih CG-DMR-ova (196 Mb) među ovih 5 skupina koje pokrivaju 11% svih CpG-ova. Nadalje, 5-grupna analiza obuhvatila je 94% CG-DMR-ova identifikovanih u 8-grupnoj analizi (Dodatni fajl 6: Tabela S5). Prosječni nivoi metilacije DNK najdiskriminatornijih CG-DMR mogu, osim nekoliko uzoraka hipokampusa, odvojiti uzorke u svoje grupe tkiva (slika 1b). Također smo identificirali 7671 velika područja diferencijalne CpG metilacije (koje smo prethodno nazvali "blokovima" diferencijalne CpG metilacije, koji su identificirani pomoću veće širine pojasa za zaglađivanje) među 5 grupa tkiva (Dodatna datoteka 7: Tablica S6). Ovi CG-blokovi pokrivali su 260 Mb i bili su u prosjeku veličine 33,9 kb. CG-DMR su obogaćeni regionima pojačivača identificiranim pomoću PsychENCODE [13], vrhovima H3K27ac pronađenim u mozgu odrasle osobe [24], te u regulatornim stanjima hromHMM iz 4 regije mozga [25] (Slika 1c, Dodatni fajl 1: Slika S1e ). Također smo primijetili obogaćivanje naših CG-DMR-a u regijama otvorenog kromatina identificiranim u jezgrama NeuN+ iz 14 regija mozga [11] (slika 1d). Primjer CG-DMR-a unutar gena neuronskog pentraksina 1 (NP1) (NPTXR) prikazane su (slika 1e) s hipometilacijom u neuronima hipokampusa povezane s povećanom ekspresijom u masi hipokampusa (slika 1f). NP1 je uključen u internalizaciju glutamatnih receptora i bio je uključen u Alzheimerovu bolest jer njegova regulacija kao odgovor na povećanje amiloid-beta potiče neuronsku toksičnost [26].

Iako smo ih grupirali zajedno u našoj početnoj CG-DMR analizi, postoji jasna razlika među tkivima bazalnih ganglija. Ove regije su od posebnog interesa zbog svoje važnosti u putevima ovisnosti i nagrađivanja [27], ali do danas nije izvršena sveobuhvatna analiza razlika u metilaciji u ljudskom mozgu. Izvršili smo dodatnu DMR analizu kako bismo procijenili razlike u metilaciji među neuronima iz ovih tkiva i identificirali 16.866 CG-DMR autozomnih neuronskih bazalnih ganglija (24 Mb) koji obuhvaćaju 1,7% svih CpG (dodatna datoteka 8: Tabela S7). U skladu sa svojim regionalnim identitetom, ovi CG-DMR bazalnih ganglija bili su posebno obogaćeni otvorenim regijama kromatina identificiranim u neuronskim jezgrama iz strijatalnog tkiva [11] (slika 1d). Preko 13% (2295/16.866) ovih bazalnih ganglija, CG-DMR nisu identificirani u našoj CG-DMR analizi sa 5 grupa. Koristili smo Alat za obogaćivanje oznaka genomskih regija (rGREAT v4.0.0) [28] za identifikaciju obogaćenih genetskih ontoloških termina povezanih s ovim jedinstvenim CG-DMR bazalnih ganglija. Deset od prvih 20 značajno obogaćenih pojmova odnosilo se na transport jona ili neuronsku signalizaciju (Dodatni fajl 9: Tabela S8). Ovaj rezultat sugerira da bi diferencijalna metilacija u blizini ovih gena (uključujući Ca + 2 i K + gene podjedinica kanala sa naponom) mogla biti uključena u fino podešavanje njihove ekspresije u određenim neuronskim populacijama unutar bazalnih ganglija.

Analiza diferencijalne metilacije identificira različite neuronske subpopulacije u hipokampusu

Zanimljivo je da je analiza glavnih komponenti otkrila dvije različite skupine koje potječu iz hipokampusa koje nisu otkrivene u našoj prethodnoj analizi tkiva hipokampusa [12] (slike 1a i 2a). Hipokampus se sastoji od nekoliko podregija koje se sastoje od četiri regije “cornu ammonis” i zupčastog vijuga. Pretpostavili smo da naši uzorci predstavljaju specifične piramidalne i granularne neurone unutar ovih podregija. Testirali smo ovu hipotezu identificirajući autosomne ​​CG-DMR hipokampusa (n = 11.702) između ova dva klastera (slika 2b, dodatna datoteka 10: Tabela S9). SJAJNA analiza 2000 najboljih CG-DMR hipokampusa pokazala je obogaćivanje neurogeneze i stvaranja neurona (Dodatni fajl 9: Tabela S8). Kako se neurogeneza odraslih događa u zupčastom girusu, ovi podaci sugeriraju da neki od ovih uzoraka potječu iz te određene podregije. Podaci o ekspresiji gena iz [29,30,31] korišteni su za sastavljanje liste od 75 gena specifično eksprimiranih u neuronima zupčastog granula (dodatna datoteka 11: Tablica S10) i presjekli smo hipokampalne CG-DMR-ove s tim genima i njihovim promotorima (TSS ± 4 kb). Identificirali smo 117 hipokampalnih CG-DMR koji se preklapaju s ovim genima i otkrili da su u 12 od 18 uzoraka hipokampusa ti markerski geni hipometilirani u usporedbi s ostalih 6 uzoraka hipokampusa i drugim tkivima mozga (slika 2c). Specifično ispitivanje PROX1 gen, marker neurona zrnaste zrnaste granule, otkriva hipometilaciju u promotoru i cijelom tijelu gena u ovih 12 uzoraka pružajući snažne dokaze da su ti uzorci obogaćeni za neurone zupčastog girusa (slika 2d). Ova grupa uzoraka se u ostatku studije naziva uzorak zupčastog girusa čime se ukupan broj analiziranih regija mozga povećava na devet.

Diferencijalna metilacija otkriva podskup uzoraka hipokampusa koji potječe iz zupčastog vijuga. a Analiza glavnih komponenti udaljenosti izvedenih iz prosječne autozomne CpG metilacije u binama od 1 kb. Prikazani podaci su iz ove studije i iz [11] kako je naznačeno. b Hijerarhijsko grupisanje uzoraka hipokampusa na osnovu prosječne metilacije po uzorku u CG-DMR identifikovano između dvije grupe hipokampusa. c Hijerarhijsko grupiranje uzoraka hipokampusa na osnovu prosječne metilacije po uzorku hipokampalnih CG-DMR-a koji se preklapaju sa genima markerima zupčastog girusa. Primarni marker zupčastog girusa, PROX1, je u kutiji. d Primjer hipokampalnih CG-DMR-a u PROX1 gen s prosječnim vrijednostima metilacije izračunate iz NeuN+ jezgara izolovanih iz naznačenih grupa tkiva i regija diferencijalne metilacije obojene ružičastom bojom

MCH DMRs

Ne-CpG metilacija (mCH) je široko rasprostranjena u ljudskim neuronima, a mCH preko genskih tijela i regulatornih elemenata općenito je povezan s potiskivanjem [1, 12, 32]. Zanimljivo je da je smanjen mCH specifično kod neuronskih pojačivača nedavno povezan s patologijom Alchajmerove bolesti [33]. Paradoksalno, mCH je takođe povezan sa nisko transkribovanim genima uključenim u razvoj neurona [34], kao i genima koji izbegavaju X inaktivaciju [35]. S obzirom na važnost mCH u razvoju neurona i bolesti, izvršili smo diferencijalnu analizu mCH u naših 5 grupa tkiva. Identifikovali smo ukupno 264.868 CH-DMR u svim kontekstima (CA, CT, CC) i nizovima (+, −) koji pokrivaju trećinu genoma (1,0 Gb) (Dodatni fajl 12: Tabela S11). Ovaj rezultat predstavlja > 10 puta povećanje broja CH-DMR identifikovanih u mozgu u poređenju sa našim prethodnim radom [12]. U toj studiji, pokazali smo visoke korelacije između nizova i konteksta za mCH, stoga koristimo mCA(+) za predstavljanje mCH u ovoj studiji. Globalna analiza mCA (+) analizom glavnih komponenti otkrila je segregaciju uzoraka na osnovu grupe tkiva, mada ne u istom stepenu kao CpG metilacija (slika 3a). CH-DMR su bili 3,5 puta širi od CG-DMR (3839 naspram 1086 bp, respektivno) i obogaćeni su CG-DMR sa 67 979 (25%) CH-DMR koji se preklapaju sa 118 621 CG-DMR (65%). Međutim, CH-DMR su pokazali malo obogaćivanje za genetske ili regulatorne karakteristike i bili su iscrpljeni na CpG ostrvima (slika 3b). CH-DMR u CA (+) kontekstu imali su srednju razliku u metilaciji od 5,8%, a 3195 je imalo razliku u metilaciji & gt 10%. Ovi visoko divergentni CH-DMR (slika 3b “> 10%)” bili su posebno obogaćeni genskim/introničkim i pojačivačkim regionima. Rezultati naše CH-DMR analize među tkivima bazalnih ganglija (152.056 CH-DMR) i između dva hipokampalna klastera (100.757 CH-DMR) bili su slični analizi CH-DMR sa 5 grupa (Dodatna datoteka 13: Tabela S12). CH-DMR-i su također pokazali blago obogaćivanje otvorenog kromatina u svim regijama mozga analiziranim u [11] (slika 3c). Zanimljivo je da CH-DMR hipokampalnih i bazalnih ganglija nisu pokazali slična obogaćenja, ali su zapravo bili iscrpljeni u područjima otvorenog hromatina u nekim tkivima. U skladu s CG-DMR-ovima, visoko divergentni CH-DMR-i općenito su bili hipermetilirani u tkivima bazalnih ganglija u usporedbi s ostalima (slika 3d). CH-DMR pokazuju visok stepen preklapanja između analiza obavljenih korišćenjem 5 grupa tkiva, uzoraka bazalnih ganglija i uzoraka hipokampusa, što važi i za CG-DMR (slika 3e, vrh). Osim toga, CH-DMR pokazuju značajno preklapanje s CG-DMR-ovima kao što smo prethodno izvijestili [12] (slika 3e, dolje). Možemo otkriti mnoge dodatne CH- i CG-DMR-e gledajući samo među tkivima bazalnih ganglija ili između grupa hipokampusa. Primjer CH-DMR prikazan je unutar genskog tijela NRGN, koji kodira neurogranin specifičan za mozak, nedavno identificiran kao biomarker cerebralne kičmene tekućine za Alchajmerovu bolest [36] (slika 3f).

Diferencijalna ne-CpG metilacija u funkcionalno različitim regijama mozga. a Analiza glavnih komponenti udaljenosti izvedenih iz prosječne autosomne, plus CA (mCA+) metilacije u kantama od 1 kb. b Toplotna karta koja predstavlja log2 obogaćivanje CA, CT i CC unutar CH-DMR u poređenju sa ostatkom genoma za naznačene karakteristike uključujući CG-DMR identifikovane u ovoj studiji. Modeli gena iz GENCODEv26 (promotori, intronički, egzonični, 5′UTR, 3′UTR, intergenični), CpG otoci (CGI) i srodne značajke iz UCSC (obale, police, OpenSea), navodno pojačivači regija (pojačivači i pojačivači visokog povjerenja iz PsychENCODE [18] i H3K27ac [19]). 5-grupa = CH-DMR između svih 5 grupa 5-grupa>> 10% = 3195 CH-DMR-a iz usporedbe 5-grupa sa srednjom razlikom metilacije CA-DMR & gt 10%. c Kao u b, koji pokazuje obogaćivanje u regijama otvorenog kromatina u jezgrama NeuN− i NeuN+ i jezgrama NeuN+ izoliranim iz naznačenih regija mozga (PV korteks, primarni vidni korteks Med. talamus, mediodorzalni talamus) iz [10]. d Hijerarhijsko grupisanje uzoraka zasnovano na prosječnoj CA(+) metilaciji po uzorku u CA-DMR-ovima sa > 10% razlike u metilaciji između 5 grupa tkiva. e Vennov dijagram koji prikazuje presjeke između CH- i CG-DMR identificiranih između različitih analiza. f Primjer CA-DMR završen NRGN sa oba niza i CG-DMR-ovima (mCG(S) dobijenim iz malog prozora za izravnavanje) i blokovima (mCG(L) dobijenim iz velikog prozora za izravnavanje). Prosječne vrijednosti metilacije izračunate iz jezgara NeuN+ izoliranih iz navedenih grupa tkiva. Regije diferencijalne metilacije zasjenjene su ružičastom bojom

Identifikacija VMR-a u neuronima izoliranim iz tkiva ljudskog mozga

Interindividualne varijacije u metilaciji DNA zanimale su mnoge grupe, a prikupljanje uzoraka GTEx-a omogućilo nam je da istražimo varijabilnost metilacije specifične za tkivo na razini genoma koja ranije nije bila moguća. VMR su lokusi koji su vrlo varijabilni među pojedincima unutar određene vrste tkiva [21, 22]. Radi pojašnjenja, riječ "varijabilnost" je korištena u drugim radovima za označavanje promjena u metilaciji DNA između tkiva [37], što nije značenje VMR -a koji se ovdje koristi. Prethodne studije varijabilnosti metilacije u moždanim tkivima bile su ograničene na ciljane genomske regije (Illumina 450k niz) [38] ili nekoliko pojedinaca [39] koje koriste jednu regiju mozga. Sistemska varijabilnost metilacije može biti uzrokovana genetskim efektima (QTL metilacije u cis i/ili trans), javljaju se nezavisno kao metastabilne epialele [40], uzrokovane su izloženošću okolini ili su pomešane heterogenošću tipa ćelije. Kao što smo prethodno pokazali [12], veliki dio varijabilnosti zbog heterogenosti staničnog tipa uklanja se izolacijom jezgri NeuN+ iz moždanih tkiva. Međutim, proporcije neuronskih subpopulacija između regija mozga i među pojedincima i dalje mogu doprinijeti mjerenju varijabilnosti. Koristeći EpiDISH [41], procijenili smo proporcije NeuN+ u našim uzorcima. Za referentne podatke koristili smo mjesta diferencijalne metilacije između jezgara NeuN+ i NeuN− izoliranih iz orbitofrontalnog korteksa identificiranih u Kozlenkovu i sur. [42]. Filtrirali smo 51.412 CpG lokacija koje su identificirali kao “neuronske nedovoljno metilirane” i “glijalno nedovoljno metilirane” za |Δβ| & gt 0,7 što rezultira sa 426 web lokacija. Zatim smo eliminirali CpG-ove koji su se preklapali s DMR-ovima identificiranim u našim 8-grupnim i hipokampalnim analizama što je rezultiralo 201 referentnim CpG-om. Ovaj korak je bio ključan za eliminaciju varijacija zbog poznatih razlika u metilaciji neurona specifičnih za regiju. Utvrdili smo da samo četiri uzorka hipokampusa imaju bilo kakve dokaze o glijalnoj (NeuN−) kontaminaciji, čime se osigurava neovisno potvrđivanje naše efikasnosti sortiranja (dodatna datoteka 1: slika S2a). Samo jedan od njih bio je manji od 97% neurona s procjenom od 87%.

Identificirali smo VMR određivanjem 99. percentila standardne devijacije vrijednosti metilacije u svakom tkivu i primjenom najniže vrijednosti standardne devijacije (SD = 0,095) kao jedinstvene granice za sva tkiva (Dodatna datoteka 1: Slika S2b). Korišćenje istog isecanja SD -a omogućava različitim tkivima da imaju različit broj VMR -ova, umesto da zauzmu najviše varijabilne regije. Ova strategija dozvoljava mogućnost da su neka tkiva varijabilnija od drugih. Identificirali smo ukupno 81.130 jedinstvenih VMR -ova koji sadrže> 10 CpG -ova i pokrivaju 159 Mb u svih devet regija mozga, pluća i štitnjače (slika 4a, tablica 1, dodatna datoteka 1: slika S2, dodatna datoteka 14: tablica S13). Većina VMR-ova se dijeli između dva ili više tkiva (slika 4b, “Zajednički VMR”) sa 333 podijeljena među svim regijama mozga. Od toga su 202 „sveprisutna“ VMR -a, regije varijabilnosti podijeljene između svih tkiva, uključujući pluća i štitnjaču (slika 4c). Izvanredno, u prosjeku 24% VMR-a identificiranih u svakom tkivu jedinstveno je za to tkivo, a mi nudimo primjere specifičnih VMR-a za tkivo (slika 4b). Da bismo kvantificirali veličinu učinka varijabilnosti, koristili smo raspon prosječne metilacije po uzorku po uzorku. Srednja veličina efekta je 35%, pri čemu gotovo svi VMR -i imaju veličinu učinka veću od 20%, a neki dosežu i 50% ili više (dodatna datoteka 1: slika S2c).

Varijabilnost metilacije u moždanim i nemozganim tkivima. a VMR-i se dijele između dva ne-moždana tkiva i neuronskih jezgara iz različitih regija mozga. Broj VMR -ova na svakom raskrižju naveden je pri dnu grafikona. b Primjeri zajedničkih i tkivno specifičnih VMR-a u amigdali (ružičasta), kaudatu (siva) i hipotalamusu (zelena). VMR -i su zatamnjeni ružičasto u tkivu u kojem su identificirani, a sivi u tkivima gdje se nisu smatrali VMR -om. SNP -ovi su označeni ako su prisutni. c Primjer sveprisutnog VMR-a podijeljenog u tkivima mozga i ne-mozga kako je naznačeno. d Toplinska karta koja predstavlja log2 obogaćivanje unije svih identificiranih VMR-a, sveprisutnih VMR-a, tkivno specifičnih VMR-a i svih VMR-a identificiranih u svakom tkivu kako je naznačeno u usporedbi s ostatkom genoma za genomske karakteristike. Modeli gena iz GENCODEv26 (promotori, intronički, egzonični, 5′UTR, 3′UTR, intergenični), CpG otoci (CGI) i srodne značajke iz UCSC (obale, police, OpenSea), navodno pojačivači regija (pojačivači i pojačivači visokog povjerenja iz PsychENCODE [18] i H3K27ac [19]). CG-DMR sa 5 grupa = CG-DMR identifikovani među svih 5 grupa tkiva

Gotovo svi (97%) VMR preklapali su se sa CG-DMR sa 35–50% VMR koji su u potpunosti sadržani u CG-DMR (Tabela 1). Ovaj postotak pada na 18–20% za VMR-ove identificirane u plućima i štitnjači, što se očekuje budući da ta dva tkiva nisu uključena u CG-DMR analize. Ovo preklapanje se ogleda u obogaćivanju VMR-a za CG-DMR, što je manje za pluća i štitnu žlezdu iz gore navedenog razloga (slika 4d). To se može vizualizirati na slici 4b (krajnje desni paneli) gdje je VMR prisutan u hipotalamusu (dolje, zeleno), a srednja metilacija se značajno razlikuje od one u amigdali (gore, ružičasta) ili kaudata (srednja, siva) čineći tako CG-DMR. Ove tkivno specifične regije varijabilnosti metilacije obogaćene su u pretpostavljenim regulatornim regijama, uključujući stanje chromHMM-a povezano s pojačivačem i transkripcijom (slika 4d, dodatna datoteka 1: slika S3a). VMR su pronađeni u svim autosomima (dodatna datoteka 1: slika S3b), uključujući MHC regiju hromozoma 6 za koju se zna da je vrlo varijabilna. MHC regija, kao i pericentromerijska regija kromosoma 20, sadržavale su više sveprisutnih VMR -a nego bilo koja druga genomska regija slična prethodnim rezultatima [39] (Dodatna datoteka 1: Sl. S4). Za razliku od većine VMR, sveprisutni VMR su posebno obogaćeni na CpG ostrvima i obalama (slika 4d).

Kada smo razmatrali VMR specifične za tkivo, prvo smo se fokusirali na amigdalu jer je 32% VMR identifikovanih u ovom tkivu bilo jedinstveno za amigdalu. Amigdala je pokazala najveću međuindividualnu varijabilnost među svim izmjerenim tkivima, a to je bilo evidentno i analizom glavnih komponenti (slika 1a) i povećanim brojem identificiranih ukupnih VMR -a (tablica 1). Pretpostavili smo da su, slično kao u hipokampusu, različite podregije amigdale izolirane od ovih pojedinaca što je rezultiralo povećanom heterogenošću neurona. Za tkivno specifične VMR-ove ne možemo razlikovati pravu varijaciju od one zbog stanične heterogenosti, što nas je navelo da istražimo koliki doprinos heterogenosti doprinosi. Analize neuro -slika anatomske i funkcionalne povezanosti podijelile su amigdalu u čak 9 različitih subnukleusa [43,44,45]. Ove subnukleus se razlikuju po snazi ​​povezanosti s drugim regijama mozga, uključujući hipotalamus, hipokampus i kortikalna područja. Na primjer, nedavno istraživanje neuro -slikanja otkrilo je da je bazolateralno jezgro pokazalo jače veze s hipotalamusom i vizualnom korom od centrokortikalnog jezgra koje je pokazalo jače veze s primarnom motornom korom [46]. Kako se ove kategorizacije temelje prvenstveno na podacima neuroslika, molekularne značajke ovih podregija tek trebaju biti razjašnjene u ljudskoj amigdali. Međutim, jednoćelijski RNA-sek medijalne amigdale kod miša doveo je do identifikacije 16 različitih neuronskih podtipova [47]. Ispitali smo metilaciju unutar 1 kb humanih homologa od 262 gena koji su korišteni za grupiranje neurona i pronašli 649 VMR -a, od kojih je 116 specifično za amigdalu. U blizini ovih gena nisu otkriveni tkivno specifični VMR iz bilo koje druge regije mozga. Hijerarhijsko grupiranje uzoraka neurona amigdale na temelju ovih 649 VMR otkriva tri grupe koje sugeriraju da su ti uzorci mogli potjecati od različitih subnukleusa unutar amigdale (dodatna datoteka 1: slika S5a, b). VMR -ovi unutar SLC17A7 gen, marker glutamatergičnih neurona, prikazan je kao primjer varijabilne metilacije među ove tri grupe uzoraka (dodatna datoteka 1: slika S5c). Ovi podaci snažno sugeriraju da je varijabilnost među uzorcima amigdale vođena razlikama neuronskih podtipova među uzorkovanim podregijama. Nismo bili u mogućnosti da identifikujemo VMR unutar ove tri različite grupe jer su samo 3-4 osobe bile u svakoj podgrupi.

Kada uzmemo u obzir one VMR-ove koji nisu specifični za tkivo, ali dijele barem još jednu regiju mozga (kao što je prikazano na slici 4a), malo je vjerovatno da su ti VMR-ovi uzrokovani heterogenošću neurona, jer se dijele između regija mozga sa različite neuronske populacije. Stoga, varijabilnost ovih regija mora biti zajednička među različitim tipovima ćelija što sugerira da imaju neku zajedničku biološku funkciju. Daljnja analiza 949 VMR -a podijeljenih samo između amigdale i hipotalamusa otkrila je obogaćivanje gena za transport neurotransmitera, posebno u SLC porodici (dodatni fajl 15: Tabela S14). Postoji VMR

3 kb uzvodno od TSS -a SLC32A1 (Slika 4b, “zajednička VMR”), koja je izražena u GABAergijskim neuronima i posreduje u preuzimanju GABA i glicina u sinaptičke vezikule [48]. Ovi zajednički VMR -ovi se takođe nalaze u blizini SLC6A1 ( - 15 kb) i SLC6A11 (+ 1,4 kb), dva druga GABA transportera za neurone i gliju, respektivno, kao i uzvodno od SLC6A3 ( - 52 kb), transporter dopamina važan u patogenezi psihijatrijskih poremećaja [49]. Među VMR -ovima identificiranim u drugim regijama mozga, 77–95% podijeljeno je na dvije ili više. Ovi zajednički VMR -ovi mogli bi biti važna područja za integraciju signalnih ulaza iz neuronskih preslušavanja.

DMR i VMR su obogaćeni za nasljeđivanje osobina povezanih s mozgom

Mi i drugi pokazali smo snažnu vezu između diferencijalnih epigenetskih karakteristika i neuroloških, neuropsihijatrijskih i bihevioralno-kognitivnih fenotipova [4, 11, 12]. Koristeći regresiju neravnoteže stratificiranog povezivanja [50], pitali smo jesu li VMR-ovi koje smo identificirali u svakoj regiji mozga također povezani sa osobinama vezanim za mozak (Dodatna datoteka 16: Tablica S15). Prvo smo ponovili naše prethodne nalaze da su regije diferencijalne metilacije CpG obogaćene za nasljeđivanje osobina povezanih s mozgom, uključujući shizofreniju, neurotizam i depresivne simptome (slika 5a Dodatna datoteka 1: Slika S6, Dodatna datoteka 17: Tabela S16). Osim toga, CG-DMR i oni identificirani među regijama bazalnih ganglija pokazali su značajno obogaćivanje nasljednosti poremećaja hiperaktivnosti sa deficitom pažnje (ADHD). VMR -i identificirani u hipotalamusu također su obogaćeni nasljednošću ADHD -a, dok su VMR -i identificirani u amigdali, prednjem cingularnom korteksu i hipokampusu značajno obogaćeni za nasljednost shizofrenije (slika 5b). VMR amigdale su pokazali veće obogaćenje od CG-DMR (6,5 prema 4,6) iako pokrivaju

75% manje genoma nego CG-DMR (Dodatni fajl 17: Tabela S16).

Neuronski CG-DMR i VMR su visoko obogaćeni za objašnjenu heritabilnost više psihijatrijskih, neuroloških i bihevioralno-kognitivnih osobina. Rezultati pokretanja regresije neravnoteže rezultata stratifikovane veze pomoću 30 GWAS osobina sa 97 osnovnih karakteristika i bilo DMR -a (a) ili VMR (b) identifikovane u ovoj studiji. Samo kombinacije karakteristika i osobina sa koeficijentom z-rezultat znatno veći od 0 (jednostrano z-test sa alfa = 0,05, P- prikazane su vrijednosti korigirane unutar svake osobine pomoću Holmove metode). Rezultat obogaćivanja (y-osa) i koeficijent z-score (x-os) od izvođenja ove analize za svaku od naznačenih karakteristika metilacije u kombinaciji sa osnovnim karakteristikama su ucrtani

Genetski doprinosi varijabilnosti metilacije DNK

Najvjerojatnije objašnjenje genetskog doprinosa varijabilnosti metilacije DNA je genetski polimorfizam unutar regije VMR. Otprilike 25% VMR -a ne preklapa se sa bilo kojim SNP -om s manjom frekvencijom alela (MAF)> 0,1 u našim uzorcima (Dodatna datoteka 18: Tablica S17).

Podaci o genotipu za sve osim dvije osobe bili su dostupni iz GTEx v8 [16] ostavljajući 6–20 jedinki po tkivu, što je premalo za provođenje rigorozne QTL analize metilacije. Međutim, identificirali smo nekoliko primjera VMR -a koji se preklapaju s jednim ili više SNP -ova koji su povezani s promijenjenom metilacijom (slika 6a). Jedan primjer je prikazan unutar MYO3A gen koji se nalazi uzvodno od GAD2, primarni regulator sinteze GABA koji je povezan sa shizofrenijom [53], bipolarnim poremećajem [54] i velikom depresijom [55]. Postoji barem jedan GAD2 pojačivač koji se nalazi unutar MYO3A gen, iako jeste

150 kb udaljeno od ovog VMR -a [56]. Da bismo ispitali mogući genetski doprinos našoj uočenoj varijabilnosti metilacije, pitali smo da li su mQTL-ovi prethodno identifikovani iz moždanog tkiva obogaćeni našim VMR-ovima (slika 6b). MQTL podaci koje smo odabrali generirani su pomoću 450k nizova na uzorcima iz masovnog hipokampusa (n = 110) [51], mozak fetusa (n = 166) [6], i rasuti temporalni korteks (n = 44) koji je takođe sortiran u NeuN+ (n = 18) i NeuN− (n = 22) jezgra [52]. Pronašli smo najveće obogaćenje u svim skupovima podataka unutar naših sveprisutnih VMR-ova u skladu s našom tvrdnjom da je varijabilnost metilacije u ovoj klasi VMR-a genetski uvjetovana. Takođe smo uporedili naše VMR sa dva postojeća skupa podataka [38, 39] koji ispituju genetski i ekološki doprinos varijaciji metilacije. Garg et al. [38] profilirao je 58 NeuN-sortiranih uzoraka frontalnog korteksa koristeći Illumina 450k niz i identificirao 1136 neuronskih VMR-a, od kojih je 996 također otkriveno u našoj analizi. Osim toga, identificirali su 149 VMR -a zajedničkih među uzorcima krvi, mozga i fibroblasta, a dok je 142 njih također identificirano u našoj analizi, samo 18 je bilo prisutno u našem setu sveprisutnih VMR -a. Gunasekara i dr. [39] profilisana metilacija DNK u tri tkiva od 10 donatora GTEx-a za identifikaciju regija u kojima međuindividualna varijacija metilacije nije specifična za tkivo. Identificirali su 9926 povezanih regija sistemske međuindividualne varijacije (CoRSIV). Otkrili smo da su naši VMR-ovi obogaćeni VMR-ovima koje su identificirali Garg et al. [38] kao i za CoRSIV [39] (slika 6c). U našoj analizi otkrili smo 16% (1588/9926) CoRSIV. Kako su CoRSIV, po definiciji, konzistentni u tri uzorkovana tkiva (srce, štitnjača i mali mozak), nismo bili iznenađeni otkrivši da je obogaćivanje u ovim regijama bilo niže za VMR specifične za tkivo.

Genetski doprinosi varijabilnosti metilacije. a Primjer SNP -a povezanog s promijenjenom metilacijom unutar MYO3A prikazuje prosječne vrijednosti metilacije za svaki genotip (naveden) za sva tkiva. VMR -ovi povezani sa ovim SNP -om su zasjenjeni ružičastom bojom i SNP je označen. b Toplinska karta koja predstavlja log2 obogaćivanje CpG unutar VMR i tkivno specifičnih VMR u usporedbi s ostatkom genoma za prethodno objavljene skupove podataka mQTL [6, 51, 52], neuronske VMR [35] i korelirane regije sistemskih interindividualnih varijacija (CoRSIV) [ 36]. Prikazana su samo značajna obogaćenja/iscrpljivanja, neznatne kombinacije su zasjenjene sivom bojom


Može li vrijednost heritabilnosti biti veća od 1? - Biologija

"Nasljeđe" je termin koji se koristi u mnogim člancima i kroz veći dio naučne literature i uvijek promoviše ideju da se odnosi posebno na naslijeđene osobine. Kao rezultat toga, često se pretpostavlja da se nasljednost određene osobine odnosi na to koliko genetika ima utjecaj na osobinu koja se manifestira kod pojedinca.

Međutim, to nije ono što to znači.

Heritabilitet pokušava riješiti odnos između prirode (genetika) i njegovanja (okolina), tako da se pri svakoj promjeni varijacija među pojedincima unutar populacije može procijeniti na osnovu ovih utjecaja. U ovom kontekstu, "okruženje" jednostavno predstavlja sve što je izvan genoma što bi moglo uticati na ekspresiju.

Stoga je prvi značajan aspekt nasljednosti koji se mora razumjeti je da nam ne govori ništa o pojedincima. To je strogo procjena varijacija koje se javljaju unutar populacija. Ako se nasljeđivanje primjenjuje na pojedinca, to je besmislen koncept [jer se za pojedinca ne može reći da se mijenja s bilo čim].

Također nam ne govori ništa o specifičnom utjecaju gena na bilo koju osobinu, jer bi to bilo rezultat nasljeđivanja. Takođe treba da shvatimo da je osobina nešto što se može "odabrati". Drugim riječima, postoji mogućnost da ishodi mogu varirati u izražavanju određene osobine. Ovo slijedi iz Mendelovog pogleda na nasljeđivanje gdje su geni predstavljeni kao dva alela [dominantni i recesivni], tako da bi određene kombinacije proizvele određene ishode. Stoga, ako nema varijacija u alelima, svi imaju iste gene i nasljednost bi bila nula. Adaptacije poput srca ili želuca se ne mogu birati (previše gena i interakcija) i stoga nam ništa ne govore o nasljeđivanju. Primarna razlika je u tome što prilagodbe predstavljaju kumulativni učinak promjena tokom vremena koje su se fiksirale u populaciji. Kao rezultat toga, ne postoji "selekcija" koja bi odredila "srce ili bez srca". Stoga možemo smatrati da je srce adaptacija, dok je rizik od srčanih bolesti osobina.

Ako pretpostavimo da i genetika i okolina utječu na osobine prisutne u organizmu, tada moramo uzeti u obzir koji je veći utjecaj na razlike među organizmima (1).

Zato hajde da sprovedemo misaoni eksperiment kako bismo ilustrovali šta se vrednuje.

Pretpostavimo da možemo stvoriti okruženje koje je identično u svakom aspektu za određenu populaciju organizama. Oni se razvijaju i rastu, a s odrastanjem primjećujemo razlike u osobinama koje ispoljavaju. Budući da okolina ima identičan utjecaj na organizme, tada možemo isključiti da je okoliš faktor (drugim riječima, na sve će jednako utjecati). Iz ovoga možemo zaključiti da sve razlike između organizama [varijansa] moraju biti rezultat samo gena.

U ovom slučaju, nasljednost bi bila 1,0 ili 100%, što ukazuje da su samo geni odgovorni za varijacije koje vidimo među pojedincima.

Slično bismo mogli provesti još jedan misaoni eksperiment u kojem uzimamo pojedince koji su genetski identični [klonovi] i podvrgavamo ih različitim okruženjima. Kad ispitujemo osobine, bilo koja varijacija koja postoji ne može biti posljedica gena [jer su identični], stoga na varijaciju utječe samo okolina. U ovom slučaju nasljednost bi bila 0,0 ili 0% (2).

Međutim, ono što ovaj koncept čini pomalo teškim je kada uzmemo u obzir stvarne brojeve u ovom kontekstu. Na primjer, uzmimo u obzir da visina može imati nasljednost od 0,90. Ono što to znači je da iako postoji uticaj koji vrše faktori okoline (kao što su hranljivi sastojci) na visinu pojedinca, najveći deo uticaja vrše geni. Što je još važnije, to nam zaista govori da se glavni utjecaj u objašnjavanju RAZLIKA među pojedincima obračunava na ovaj način.

Imajte na umu da nam ne govori ništa o tome što je uzrokovalo određenu visinu za bilo koju pojedinu osobu, već ono što objašnjava razlike među pojedincima unutar određene populacije.

Gledajući biljke na dijagramu, imamo lijevo jednoliko okruženje s hranjivim tvarima i osvjetljenjem, pa su stoga varijacije u visini posljedica isključivo gena (nasljednost = 100%). Koristeći isto sjeme, mijenjamo okruženje na loš nivo hranjivih tvari, a ovaj put imamo zaostale biljke na čije varijacije 100% utječu geni, budući da je okoliš još uvijek stalan.
Ovo dovodi do uvjeta da "možemo imati potpunu nasljednost unutar grupa, značajne varijacije između grupa, ali nema genetske razlike između grupa". U oba slučaja, okolina se u osnovi održava konstantnom, pa su varijacije u visini isključivo posljedica gena, dakle 100% nasljednosti. Međutim, ako sada kombinujemo oba scenarija tako da postoje i ekološke razlike između grupa, tada će heritabilnost biti prethodno naznačena vrijednost od 0,90, jer se varijacije između grupa ne objašnjavaju samo genima, već i utjecajima na okoliš. koji izazivaju zaostajanje u razvoju.

Ono što ova posebna oznaka pruža je način na koji možemo početi procjenjivati ​​ili procjenjivati ​​utjecaje koji mogu biti prisutni u određenim osobinama. Dakle, dok su geni odgovorni za izražavanje osobine, nasljeđivanje se koristi za određivanje koliko je specifičan takav izraz samo za gene.

Kao rezultat toga, heritabilnost se često koristi u vještačkoj selekciji kako bi se utvrdilo za koje osobine je najveća vjerovatnoća da će biti uspješno odabrana. Što je veća heritabilnost osobine, to je veći uticaj na dobijanje te osobine odabirom najboljeg para za razmnožavanje.

Jedna poteškoća koja nastaje s nasljeđivanjem je ta da svaka razmatrana osobina mora biti evidentno povezana s genetskim prijenosom. To može postati problematično kada se nasljedstvo koristi za procjenu osobina ponašanja gdje genetska veza može biti slaba. U nastojanju da se izmjeri nasljednost, često se oslanja na studije blizanaca pod pretpostavkom da razlike među njima moraju biti odgovorne okolini, budući da su efektivno genetski identične. Međutim, kao što je ranije spomenuto, to može rezultirati teškim tumačenjima kada su u pitanju osobine čisto ponašanja. Sve dok se osobine ponašanja ne mogu eksplicitno povezati s genima, svaka izjava o nasljednosti mora se smatrati sumnjivom.

============================================
(1) Nasljednost je u konačnici proporcija koja se izražava kao vrijednost između 0 i 1. Kao rezultat, možemo pronaći brojeve heritabilnosti koji ukazuju na 0,30 ili 0,60 ili neku takvu proporciju koja ukazuje na utjecaj gena na varijabilnost određenog osobina. Ukratko, heritabilnost se može definirati kao omjer varijanse uzrokovane genima prema ukupnoj varijansi u populaciji.

Smatra se da su geni odgovorni za samu osobinu. Nasljeđivanjem se pokušava utvrditi utjecaj prirode (geni) naspram njegovanja (okoline) na varijabilnost u populaciji. Stoga se može reći da na varijaciju svojstva koja ima nasljednost 0,30 utiču genetika na oko 30% i okolina na 70%. Osim toga, takve osobine se zapravo moraju birati.

(2) Heritabilnost je nula ako nema varijacija u genima [pa ne može biti varijacija u njihovoj ekspresiji zbog gena], bilo da je rezultat zbog gena koji se fiksiraju ili zbog genetskih sličnosti kao kod blizanaca ili klonova .


Pogledajte video: DOŽIVETI STOTU: Dijabetes i predijabetes (Februar 2023).