Informacije

Da li se početno mjesto transkripcije nalazi prije ili poslije promotera?

Da li se početno mjesto transkripcije nalazi prije ili poslije promotera?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Možda je to glupo pitanje, ali zaista želim da znam odgovor.

Definicija promotera (sa Wikipedije):

U genetici, promotor je regija DNK koja inicira transkripciju određenog gena. Promoteri su locirani blizu početna mjesta transkripcije gena

I definicija početne stranice transkripcije (Sa Wikiversityja):

Mjesto početka transkripcije "je mjesto gdje transkripcija počinje na 5'-kraju genske sekvence.

Pronašao sam i ovu sliku (izvor):

Postavljam ovo pitanje jer, koliko ja znam, RNA polimeraza se vezuje za TSS, a moj prijatelj mi je rekao da se ona vezuje za promotor.

PS: Zanimaju me bakterije.


Odgovor na ovo pitanje naći ćete u bilo kojem standardnom udžbeniku biohemije, molekularne biologije ili molekularne genetike. Postoji nekoliko online na NCBI polici za knjige, a ove su općenito daleko bolje od Wikipedije. Citiram iz odeljka 28.1 Berga et. al., koji se bavi transkripcijom:

Transkripcija počinje u promoteri na DNK šablonu. Promotori su sekvence DNK koje usmjeravaju RNA polimerazu na odgovarajuće mjesto inicijacije za transkripciju.

Nakon toga slijedi opis prokariotskih promotorskih sekvenci i konsenzus TATA okvir.

Upečatljiv obrazac je očigledan kada se uporede sekvence mnogih prokariotskih promotora. Dva uobičajena motiva su prisutan na 5' (uzvodno) strani startnog mjesta. Oni su poznati kao sekvenca -10 i sekvenca -35 jer su centrirana na oko 10 i 35 nukleotida uzvodno od početnog mjesta.

Opisana je metodologija kojom je to ustanovljeno, iz koje postaje evidentno da je drugi način posmatranja promotora mjesto na DNK za koje se veže RNA polimeraza.

Iz utisnutog dijela gore navedenog citata (moj naglasak), promotor je jasno ispred (5') početne lokacije. Ovo je sažeto u još jednoj maloj grafiki:


Samo pored Davidovog odgovora, postoje primjeri internih promotera (oni koji imaju elemente 3' početnog mjesta transkripcije). Kao primjer, unutrašnji promotorski elementi gena tRNA direktno vezanje i transkripciju eukariotskim RNAP III:

Bijeli RJ. 2011. Transkripcija RNA polimerazom III: složenije nego što smo mislili. Nature Rev Genet 12:459-463.

Mnogi retrotranspozoni klase I takođe sadrže unutrašnje promotere što im omogućava da se transponuju zajedno sa drugim elementima:

  • LINE - unutrašnji RNAP II promotor
  • SINE - unutrašnji RNAP III promotor

Vincent Laudet, Hinrich Gronemeyer, u knjizi The Nuclear Receptor FactsBook, 2002.

Struktura gena, promotor i izoforme

Genomska organizacija, struktura promotora i ekspresija izoforme tri RAR gena su detaljno okarakterizirani kod brojnih vrsta od miša do vodozemaca (pregledano u referenci 113).

Utvrđena je genomska organizacija ljudskog RARα gena 285 . cDNK koja stvara dobro poznatu RARβ2 izoformu je podijeljena na osam egzona među kojima ekson 3 kodira za N-terminalnu regiju A i egzon 4-10 kodira zajednički dio receptora. Što se tiče TR, DBD je kodiran sa dva egzona sa intronom koji leži na istoj poziciji kao u TR. Struktura ljudskog RARα i mišjeg RARγ gena je identična 9, 132 .

Promotor koji kontroliše izoformu RARα1 okarakterisan je kao promotor bogat GC koji ne sadrži TATA ili CCAAT kutije, niti RARE. Ovaj promotor sadrži mjesto za faktor transkripcije Krox20, koji igra važnu ulogu u ranom razvoju centralnog nervnog sistema miša. 284 . Ukupno sedam izoforma (α1–α7), koje se razlikuju po svom 5′UTR kao iu A regionu, generisano je iz gena RARα i okarakterisano je 121 . Ove izoforme nastaju alternativnim spajanjem i upotrebom promotora najmanje osam različitih egzona koji se nalaze uzvodno od egzona koji kodira domenu B, tj. C-terminalnog dijela A/B domene. Dvije glavne izoforme koje stvaraju N-terminalno različite proteine ​​pokazuju različite obrasce ekspresije, kao i različitu regulaciju. Za razliku od α1 izoforme, α2 se transkribuje iz promotora koji sadrži RARE i koji se inducira retinojskom kiselinom 122 . Razlike u domeni A mogu generirati različite funkcije AF-1 koje su u stanju da različito regulišu ciljne gene.

RARβ gen također kodira za nekoliko izoforma, među kojima tri sadrže različite A regije povezane s identičnim B regijama 136 . Ove izoforme kontrolišu različiti promotori i pokazuju različite obrasce ekspresije i regulacije. RARβ2 izoforma je inducibilna RA i kontrolirana je specifičnim promotorom koji sadrži dobro poznati βRARE element 20, 22, 26, 286 . Druga izoforma, nazvana RARβ4, generira se iz β2 promotora i razlikuje se od β2 proteina po svom N-terminalnom dijelu koji započinje u ne-AUG kodonu, CUG 289 . RARβ2 promotor je također reguliran TLX orphan receptorom koji modulira njegovu inducibilnost retinoinske kiseline u retini. 287 . Element cAMP odgovora također je uključen u aktivaciju RARβ2 od strane RA u ćelijama embrionalnog karcinoma P19 288 . Inducibilnost RARβ2 je također regulirana drugim RAR-ovima, kao što je RARγ1, koji neutraliziraju efekte RA na indukciju RARβ2 129 . Ovi nalazi sugeriraju da nekoliko faktora igra važnu ulogu u autolognoj regulaciji gena RARβ u različitim organima. Osim toga, ekspresija ove izoforme je post-transkripcijski regulirana strukturom njenog 5′UTR koji sadrži kratke otvorene okvire za čitanje koji kontroliraju njenu translaciju. 126 .

Što se tiče druga dva, mišji gen RARγ generiše nekoliko (najmanje sedam) N-terminalnih izoforma koje sadrže specifične obrasce ekspresije 141, 290 . Na primjer, skin sadrži gotovo isključivo RARγ1 transkripte. Izoforma RARγ2 je regulirana kroz RARE element koji je ugrađen u Sp1 mjesta, sugerirajući, kao u slučaju RARβ, složenu regulaciju inducibilnosti RA 133 .


Promoter Regions

Postoje tri glavna dijela koji čine promotor: promotor jezgre, proksimalni promotor i distalni promotor. U nastavku su opisane specifičnosti ovih regija u eukariotskim ćelijama.

Core promoter

Region promotora jezgra nalazi se najproksimalnije od startnog kodona i sadrži mesto vezivanja RNA polimeraze, TATA kutiju i početno mesto transkripcije (TSS). RNA polimeraza će se stabilno vezati za ovu promotorsku regiju jezgre i može započeti transkripcija lanca šablona. TATA kutija je DNK sekvenca (5'-TATAAA-3') unutar regiona promotora jezgra gde se proteini generalnog transkripcionog faktora i histoni mogu vezati. Histoni su proteini koji se nalaze u eukariotskim stanicama koji pakuju DNK u nukleozome. Vezivanje histona sprečava iniciranje transkripcije, dok transkripcijski faktori promovišu inicijaciju transkripcije. Najveći 3' dio (najbliži start kodonu gena) promotora jezgre je TSS, gdje transkripcija zapravo počinje. Međutim, samo eukarioti i arheje sadrže ovu TATA kutiju. Većina prokariota sadrži sekvencu za koju se smatra da je funkcionalno ekvivalentna nazvanu Pribnow kutija koja se obično sastoji od šest nukleotida, TATAAT.

Proksimalni promotor

Dalje uzvodno od promotora jezgra naći ćete proksimalni promotor koji sadrži mnoge primarne regulatorne elemente. Proksimalni promotor se nalazi otprilike 250 parova baza uzvodno od TSS-a i to je mjesto gdje se vezuju opći transkripcijski faktori.

Distalni promoter

Konačni dio promotorske regije naziva se distalni promotor koji je uzvodno od proksimalnog promotora. Distalni promotor također sadrži mjesta vezivanja faktora transkripcije, ali uglavnom sadrži regulatorne elemente.


Rezultati

Karakteristični profili promotorske DNK

Eukariotski Pol II promotori su kontrolirani kombinacijom elemenata promotora jezgra, dodatnih proksimalnih uzvodnih promotorskih elemenata i pojačivača. Promotor jezgra prostire se od -50 do +50 oko TSS-a i neophodan je za pokretanje bazalne transkripcije. Postoji samo nekoliko poznatih ključnih promotorskih elemenata. TATA kutija i Inr su dvije ključne komponente, od kojih svaka može usmjeriti preciznu inicijaciju transkripcije Pol II. Nizvodni promotorski element, TFIIB element prepoznavanja, element deset motiva i nizvodni element jezgre neki su nedavno otkriveni elementi promotora jezgre [15, 16]. Međutim, ne pojavljuje se svaki gore spomenuti element u promotoru jezgra, što je indikacija da postoji više karakteristika promotora koje su sposobne posredovati u transkripciji. Proksimalni promotorski region i distalni pojačivači sadrže višestruke TFBS koji su odgovorni za regulaciju transkripcije [17]. Sadržaj i raspored ovih mjesta vezivanja, zajedno s lokalnom koncentracijom TF, određuju kada i gdje se promotor aktivira. Čini se da je regija od TSS do otprilike 250 bp uzvodno od TSS-a više obogaćena TFBS [18]. Ova regija može sadržavati mjesta koja su vezana aktivatorima ili medijatorima, usmjeravajući formiranje preinicijacionog kompleksa na regiju promotora jezgra. Uzeli smo region [-250, +50] kao pozitivne podatke o obuci, a njegove neposredne uzvodno i nizvodno kao negativne podatke o obuci i skenirali za TFBS. Ona vezivna mjesta sa većim afinitetom vezivanja u promotorskim sekvencama nego u ne-promotorskim sekvencama su potencijalno korisna za diskriminaciju. (Koristimo matricu težine da predstavimo TF kao i njegov motiv vezivanja, a koristimo rezultate omjera vjerovatnoće log za mjerenje afiniteta vezivanja mjesta [19].)

Složenost i heterogenost promotora otežavaju predviđanje promotora in silico. Pol II promotori ne dijele dosljedno sve ključne elemente promotora, tako da sami ne mogu dobro razlikovati promotere. Na osnovu statističke analize baze podataka Eukariotskih promotora (EPD), samo 22% promotora ima TATA signal, a samo 49% ima Inr mjesto [20]. Međutim, nedavne studije pokazuju da TATA-less ili Inr-less promoteri imaju karakteristična mehanička svojstva koja su slična TATA box-u ili promotorima koji sadrže Inr, koji mogu funkcionirati kao markeri za prepoznavanje promotora [21]. Slika 1 prikazuje profile negativne minimalne energije za promotore povezane s CpG (lijevo) i promotore koji nisu povezani sa CpG (desno). Ovi profili su zasnovani na tetranukleotidnim parametrima, koji su izračunati iz baze podataka tetranukleotidnih rendgenskih kristalnih struktura i koriste se za opisivanje potencijalne energije tetranukleotidnih sekvenci [22]. Vidimo da i za promotere vezane za CpG i za one koji nisu povezani sa CpG, regioni oko TSS-a imaju mnogo niže rezultate. Takođe postoji oštar vrh oko pozicija -25 i +1, gde se obično nalaze TATA box i Inr. Slični dijagrami (nisu prikazani) su takođe uočeni za profile zasnovane na parametrima fleksibilnosti tetranukleotida. Fleksibilnost DNK može igrati ulogu u interakciji između proteina i DNK. Regioni koji okružuju TSS imaju tendenciju da budu fleksibilniji, a mali segmenti oko -25 i +1 rigidniji. Ovi karakteristični rezultati energije i fleksibilnosti su takođe uključeni u naš skup funkcija za predviđanje promotera.

Energetski profili promotora vezanih za CpG i promotora koji nisu povezani sa CpG. Mjesto početka transkripcije nalazi se na poziciji 1000 na gornjim slikama i poziciji 250 na donjim slikama. Sve plohe su zaglađene sa prosječnim prozorom širine 5. TSS, mjesto početka transkripcije.

Tabela 1 daje sve tipove funkcija koje se koriste za obuku CoreBoosta. Tabela 2 navodi glavne karakteristike za četiri binarna klasifikatora (promotor protiv upstream i promoter protiv downstream za CpG povezane i ne-CpG promotore). (LogitBoost sa panjevima iterativno bira jednu po jednu karakteristiku kako bi minimizirao trenutnu funkciju ponderiranog gubitka. Najveće karakteristike navedene ovdje su zasnovane na njihovom odabiru algoritma.) Naš skup funkcija sadrži afinitete vezivanja elemenata promotora jezgre i TFBS, tetranukleotidne fleksibilnosti i energetski rezultati, Markovianski rezultati i k-mer frekvencije. Signali specifični za poziciju kao što su TATA box ili Inr sami po sebi nemaju veliku moć predviđanja. Kombinacija ovih sa signalima iz bočnih sekvenci kao što su fleksibilnost/Markovljevi rezultati daje najbolju indikaciju prisustva TSS-a. Detaljne informacije o tome kako se ove karakteristike izračunavaju opisane su pod Materijali i metode (ispod).

Poređenje sa drugim metodama predviđanja promotora

U ovom odeljku demonstriramo efikasnost CoreBoosta upoređujući njegove performanse sa performansama McPromotera [23] i Eponine [24], dva od najboljih prediktora promotora koji su takođe besplatno i javno dostupni [9]. McPromoter koristi neuronske mreže za predviđanje promotera kombinovanjem informacija iz različitih segmenata (uzvodno, jezgro promotera [TATA, spacer i Inr] i nizvodno) i nekih strukturnih karakteristika. Eponine primjenjuje vektorsku mašinu relevantnosti sa optimalnim skupom pozicioniranih matrica težine odabranih korištenjem Monte Carlo procesa.

Sa CoreBoostom klizanjem prozora duž niza, izlazi vektor vjerovatnoća klasa. Mogućim kandidatima se smatraju pozicije za koje je vjerovatnoća da prelaze neki prag. Kandidati na određenoj udaljenosti se zatim grupišu i onaj sa najboljim rezultatom u grupi se ispisuje kao pretpostavljeni TSS. Ako je predviđanje unutar 50 bp od označenog TSS-a, onda to nazivamo pravim pozitivnim pogodakom. Odabire se prag za postizanje željene osjetljivosti i pozitivne prediktivne vrijednosti (PPV). Osetljivost i PPV su definisani pod Materijali i metode (ispod).

Poređenje korištenjem podataka Chip-čipa

Podaci sa ChIP čipa pružaju priliku za proučavanje mape aktivnih promotora u specifičnim ćelijama u cijelom genomu. Koristeći ovu tehnologiju, mjesta vezivanja kompleksa preinicijacije eksperimentalno su locirana u cijelom genomu u ljudskim fibroblastnim stanicama [4]. Iako se TSS-ovi ne mogu precizno locirati iz ovog eksperimenta, program za predviđanje jezgra promotera može se kasnije koristiti za njegovo traženje. Da bismo procijenili performanse CoreBoosta, primijenili smo različite programe na test sekvence od 2,4 kb svaka usredsređene na predviđanja iz podataka mapiranja promotora u cijelom genomu. Svaka od ovih sekvenci testa sadrži jedan i samo jedan TSS označen u bazi podataka početnih lokacija transkripcije (DBTSS), koji se koristi za brojanje istinitih pozitivnih rezultata.

Za predviđanja vezana za CpG, obučili smo CoreBoost na osnovu 1,445 promotera iz EPD-a. Slika 2 prikazuje dijagram gustine relativne udaljenosti od pozicija koje odgovaraju maksimalnim rezultatima prema TSS-u označenom sa DBTSS-om za svih 1765 CpG promotora testa. Ako je bilo više pozicija koje odgovaraju maksimalnom rezultatu, onda je odabrana slučajna. CoreBoost ima 39% maksimalnih rezultata postignutih unutar 50 bp od označenog TSS-a, što je značajno veće od McPromoterovih 30% i Eponine-ovih 23%. (S obzirom na prag, Eponine predviđa regiju s pridruženim maksimalnim rezultatom. Da bismo locirali poziciju s maksimalnim rezultatom za test sekvencu, pokrećemo Eponine s pragom jednakim tom rezultatu i uzimamo srednju poziciju predviđene regije kao maksimalnu položaj.) Odgovarajući P vrijednosti zasnovane na jednostranim t-test su 8 × 10 -9 i 0 respektivno. Imajte na umu da je P vrijednosti se izračunavaju koristeći sljedeće t-statistika:

Grafikon gustine relativne udaljenosti od pozicija sa maksimalnim rezultatima do označenog TSS-a. Tačkasta kriva je zasnovana na predviđanju iz eksperimenta sa čipom. Puna kriva je za CoreBoost. Isprekidana i isprekidana krivulja odgovaraju McPromoteru i Eponineu, respektivno. Desna figura je uvećana verzija lijeve. ChIP, hromatinska imunoprecipitacija TSS, početno mjesto transkripcije.

T 1 = ( 0,39 − 0,3 ) / 0,39 × ( 1 − 0,39 ) 1765 + 0,3 × ( 1 − 0,3 ) 1765 T 2 = ( 0,39 − 0,23 ) / 0,39 × ( 1 − 0,39 × 0,39 × ( 1 − 0,39 × 0,39) ) 1765 . MathType @ SOR @ 5 @ 5 @ + = feaafiart1ev1aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8 = vI8tuQ8FMI8Gi = hEeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciGacaGaaeqabaqadeqadaaakeaafaqabeGabaaabaGaamivamaaBaaaleaacaaIXaaabeaakiabg2da9iaacIcacaaIWaGaaiOlaiaaiodacaaI5aGaeyOeI0IaaGimaiaac6cacaaIZaGaaiykaiaac + cadaGcaaqaamaalaaabaGaaGimaiaac6cacaaIZaGaaGyoaiabgEna0kaacIcacaaIXaGaeyOeI0IaaGimaiaac6cacaaIZaGaaGyoaiaacMcaaeaacaaIXaGaaG4naiaaiAdacaaI1aaaaiabgUcaRmaalaaabaGaaGimaiaac6cacaaIZaGaey41aqRaaiikaiaaigdacqGHsislcaaIWaGaaiOlaiaaiodacaGGPaaabaGaaGymaiaaiEdacaaI2aGaaGynaaaaaSqabaaakeaacaWGubWaaSbaaSqaaiaaikdaaeqaaOGaeyypa0JaaiikaiaaicdacaGGUaGaaG4maiaaiMdacqGHsislcaaIWaGaaiOlaiaaikdacaaIZaGaaiykaiaac + cadaGcaaqaamaalaaabaGaaGimaiaac6cacaaIZaGaaGyoaiabgEna0kaacIcacaaIXaGaeyOeI0IaaGimaiaac6cacaaIZaGaaGyoaiaacMcaaeaacaaIXaGaaG4naiaaiAdacaaI1aaaaiabgUcaRmaalaaabaGaaGimaiaac6cacaaIYaGaaG4maiabgEna0kaacIcacaaIXaGaeyOeI0IaaGimaiaa c6cacaaIYaGaaG4[email protected][email protected]

Postoji sistematska pristranost u podacima ChIP čipa, koja može biti uzrokovana pauziranjem polimeraze na nizvodnom nukleosomu. CoreBoost se može koristiti u kombinaciji sa podacima iz ChIP čipa za ispravljanje takve pristranosti.

Slika 3 prikazuje dijagram PPV u odnosu na osjetljivost za CpG-srodne promotere. Vidimo da CoreBoost dosljedno predviđa bolje TSS-ove na različitim pragovima. Prag dostizanja osetljivosti od oko 0,37 i 0,37 PPV korišćenjem 500 bp za predviđanje klastera izabran je kao naš podrazumevani prag u programu CoreBoost za promotere povezane sa CpG. (Odabrali smo 500 bp za klastersko predviđanje u CoreBoost-u kako bismo pronašli alternativne promotore za jedan gen. Ista udaljenost grupisanja se koristi u DBTSS-u.) Postoji samo 85 promotora testova koji nisu vezani za CpG iz podataka ChIP-čipa. Da bismo postigli nepristrasnu evaluaciju različitih programa na promoterima koji nisu povezani sa CpG, sproveli smo studiju na većem skupu podataka.

Pozitivna prediktivna vrijednost u odnosu na osjetljivost za promotore povezane s CpG. Puna i duga isprekidana krivulja su za CoreBoost, sa punom za slučajeve koji predviđaju klasteriranje u krugu od 2000 bp i dugom isprekidanom unutar 500 bp. Isprekidana kriva je za McPromoter koji grupiše predviđanja unutar 2.000 bp kao zadanu vrijednost. Tačka i kratka isprekidana krivulja su za Eponine, sa tačkastim za slučajeve grupisanja predviđanja unutar 2.000 bp i kratkom isprekidanom iz zadanog izlaza Eponine. bp, bazni parovi.

Unakrsna validacija za promotere koji nisu povezani sa CpG

U ovom odjeljku izvještavamo o rezultatu petostruke unakrsne validacije na kombinovanom skupu promotora koji nisu povezani sa CpG iz EPD i DBTSS. Skup od 299 promotora koji nisu vezani za CpG iz EPD-a i četiri petine od 1,271 iz DBTSS-a korišten je za obuku modela, koji je zatim primijenjen na preostalu petinu sekvenci od 2,4 kb svaka, sa središtem na DBTSS- označeni TSS-ovi. Slika 4 daje dijagram PPV u odnosu na osjetljivost upoređujući CoreBoost, McPromoter i Eponine. Očigledno je da CoreBoost konstantno nadmašuje McPromoter i Eponine. Prag dostizanja osetljivosti od oko 0,26 i 0,24 PPV korišćenjem 500 bp za predviđanje klastera izabran je kao podrazumevani prag u programu CoreBoost za promotere koji nisu povezani sa CpG.

Pozitivna prediktivna vrijednost u odnosu na osjetljivost za promotere koji nisu povezani sa CpG. Puna i duga isprekidana krivulja su za CoreBoost, pri čemu je puna za slučajeve koji predviđaju klasteriranje unutar 2.000 bp, a duga isprekidana unutar 500 bp. Tačkasta isprekidana kriva je za McPromoter, koji podrazumevano grupiše predviđanja unutar 2.000 bp. Tačka i kratka isprekidana krivulja su za Eponine, sa tačkastim za slučajeve grupisanja predviđanja unutar 2.000 bp, a kratkom isprekidanom iz zadanog izlaza Eponine. bp, bazni parovi.

Promotori specifični za mišiće koji nisu vezani za CpG

Iako smo vidjeli poboljšanje u TSS predviđanju korištenjem CoreBoosta, performanse računskog predviđanja TSS-a za promotere koji nisu povezani sa CpG ostaje nezadovoljavajuće. U ovom odeljku pokazujemo da informacije o tkivu mogu pomoći da se dodatno poboljša tačnost predviđanja. Obrazloženje je da tkivno-specifična vezivna mjesta mogu djelovati kao vodič i, zajedno sa informacijama o ključnim promotorima, mogu pomoći u lociranju pravih TSS-ova.

Trenirali smo specifičniji klasifikator baziran na 84 promotora koji nisu specifična za mišiće koji nisu vezani za CpG, od kojih se svaki sastoji od 250 bp uzvodno i 50 bp nizvodno od TSS-a. Koristili smo dva negativna skupa, koja odgovaraju dva neposredna uzvodna i dva neposredno nizvodna segmenta dužine 300 bp, respektivno. Unakrsna validacija bez jednog izostavljanja izvršena je za dvije klasifikacije: jednu za razlikovanje promotora iz uzvodnih sekvenci i drugu iz nizvodnih sekvenci. Zatim smo izračunali osjetljivost, PPV i koeficijent korelacije (CC). Prvi klasifikator (promotor prema uzvodno) daje osjetljivost od 0,70, PPV od 0,83 i CC od 0,66, a drugi klasifikator (promotor protiv nizvodnog) daje osjetljivost od 0,76, PPV od 0,82 i CC od 0,69 . (Za test segment, ako je vjerovatnoća klase iz LogitBoost-a veća od 0,5, tada se klasificira u klasu Promoter.) Odgovarajući P vrijednosti za ove CC su 0,008 i 0,007, respektivno, izračunate iz 1000 setova od 84 nasumično odabrana promotora koji nisu vezani za CpG. Čak i ako je veličina skupa podataka o treningu za promotore specifične za mišiće mnogo manja, CC-ovi su više od 10% veći od onih iz petostruke unakrsnog provjere 1.570 promotora koji nisu povezani s CpG, čija su odgovarajuća osjetljivost, PPC i CC 0,64, 0,80 i 0,59 za prvi klasifikator i 0,66, 0,80 i 0,61 za drugi klasifikator. Ovo ukazuje da region [-250,+50] među promotorima specifičnim za mišiće sadrži dodatne korisne informacije. Zaista, TF-ovi specifični za mišiće kao što su MEF2 i SRF pojavljuju se među vrhunskim karakteristikama.


Gdje počinje i gdje se završava transkripcija? Kako RNK polimeraza zna gdje se vezati za DNK i započeti transkripciju?

RNA polimeraze prepoznaju mjesta transkripcije neznatno drugačije između bakterija i eukariota. Za prokariote, RNA polimeraza pretražuje lanac DNK šablona za promotore. Promotori su mjesta na DNK koja govore polimerazi gdje da se veže i započne transkripciju. Za eukariote, RNA polimeraze trebaju pomoć faktora transkripcije da se vežu za promotor. Transkripcijski faktori se prvo vežu, a zatim se pokreće RNA polimeraza da se veže i za točku. Ovo formira kompleks preinicijacije transkripcije (PIC).


Promoter region

Promoter Regions
The region promoteras za RNA polimeraze I i II nalaze se uzvodno od početnog mjesta, ali promotor za polimerazu III je neobično lociran nizvodno.

The region promotera je sekvenca na koju se tipično odnosi i koja se nalazi uzvodno ili odmah pored mjesta gdje će gen biti prepisan. To je regija u kojoj će se vezati određeni regulatorni elementi, a to su proteini koji će se vezati kako bi pomogli da se RNK transkribira.

fim B "okreće". region promotera oba smjera, iz položaja "uključeno" u "isključeno" i obrnuto, dok fim E može samo olakšati rekombinaciju iz "uključeno" u "isključeno".

Lodygin (2008) je otkrio da je hipermetiliran. Uzvodni region koji se takođe sastoji od mesta vezivanja za p53 pokazuje više nivoe metilacije kod mnogih različitih tipova raka (Lodygin 2008).

Dok je lacl gen eksprimiran cijelo vrijeme, on proizvodi protein koji blokira

lac operona. Ovaj protein će se vezati za operatersko područje lac operona sve dok se molekuli laktoze ne vežu za njega.

[96][97][98] Genetska oštećenja (aberantne strukturne promjene DNK), mutacije (promjene u DNK sekvenci) i epimutacije (metilacija gena

ili promjene DNK skele koje reguliraju ekspresiju gena), mogu uzrokovati abnormalnu ekspresiju gena.

Nuklearni receptori koji su aktivirani hormonima vezuju se za DNK na receptor-specifične hormone odgovorne elemente (HREs), DNK sekvence koje se nalaze u

gena koji su aktivirani kompleksom hormon-receptor.

Kod prokariota, RNA polimeraza može prepoznati i vezati se direktno za

.
Kod eukariota, proteini koji se nazivaju faktori transkripcije posreduju u vezivanju RNA polimeraze i inicijaciji transkripcije.
Tek nakon što su određeni faktori transkripcije vezani za promotor, RNA polimeraza II se vezuje za njega.

RNA polimeraza Tokom transkripcije, enzim koji se vezuje za

DNK šablona, ​​spaja nukleotide kako bi formirao sintetizirani lanac RNK i odvaja se od šablona kada dosegne terminatorsko područje. PICTURE
RNA transkript Termin koji se primjenjuje na RNK transkribovanu u jezgru. SLIKA .

uzvodno od gena, ili regije pojačivača gore ili nizvodno od gena, sa određenim specifičnim motivima koje prepoznaju različiti tipovi TF.

TATA kutija. Bazna sekvenca 5'-TATA-3' u DNK a

. TATA box vezujući proteini se vezuju u ovoj regiji.
Telocentric. Kromosomski uzorak u kojem je centromera na jednom kraju, a telomera na drugom. Svi autozomni hromozomi i X hromozom miša su telocentrični.

Konsenzusna sekvenca eukariotske DNK koja je dio

, i definira početno mjesto transkripcije nizvodno od njega poznato i kao Hogness box ili Pribnow box.
Povratak na stranicu za pretragu.

U E. coli, pomoćnom proteinu koji stimulira ekspresiju gena vezivanjem unutar

operona i povećava sposobnost promotora da se poveže sa RNA polimerazom.
katalizator
[Gk. kataliza, otapanje] .

RNA polimeraza se vezuje za

Ovo pokreće transkripciju
RNA polimeraza odmotava DNK.

Postoje i drugi signali pored startnog i stop kodona koji organizmu mogu reći da je to gen koji treba pretvoriti u protein, pa tražimo one u

s gena. Mi [takođe] tražimo druge signale, opet koristeći skup kompjuterskih programa.

Uzvodna sekvenca aktivatora: Vezivno mjesto za faktore transkripcije, općenito dio a

. UAS se može naći uzvodno od TATA sekvence (ako postoji), a njena funkcija je (kao pojačivač) da poveća transkripciju.

Proces post-replikacije. Citozinski ostaci u CpG sekvencama su metilirani, formirajući gene-specifične obrasce metilacije. Metilacija

s korelira sa obrascima ekspresije gena.
Povezano
Chromatin Epigenetics .

Osnovni faktori transkripcije obavljaju brojne funkcije, uključujući vezivanje za gen

s i privlačenje odgovarajuće RNK polimeraze na mjesto inicijacije, kao i odmotavanje dvostruke spirale DNK kako bi se omogućio pristup ulaznim ribonukleotidima rastućeg RNA lanca.

kompleks transkripcije. Skup brojnih proteina (obično veliki broj njih) koji se moraju vezati za gen


TRANSKRIPCIJA

Sinteza glasničke RNK iz DNK naziva se transkripcija. Genetske informacije u DNK se ne prevode direktno u proteine. Ove informacije se prvo transkribuju u mRNA. Mnogi enzimi su uključeni u proces transkripcije. Ovi enzimi obavljaju sljedeće funkcije:

  • Oni odmotaju dio molekula DNK
  • Oni pokreću i završavaju sintezu mRNA.
  • Oni također modificiraju mRNA nakon završetka transkripcije.

Samo jedan ili nekoliko gena je izloženo tokom transkripcije. Samo jedan od dva lanca DNK je transkribovan. Eukarioti imaju tri enzima uključena u transkripciju različitih RNK. Ovo su:

(a) RNA polimeraza I nalazi se u nukleolu i transkribuje ribosomalnu RNK (rRNA).

(b) RNA polimeraza II je lokalizovan na jezgru. On transkribira glasničku RNK (mRNA) i većinu malih nuklearnih RNK

(c) RNK polimeraza III je lokalizovan na jezgru. On transkribuje transfer RNK (tRNA) i druge male RNK (uključujući malu 5S rRNA).

Postoje sljedeći koraci transkripcije: I. Inicijacija

Sljedeći koraci su uključeni u pokretanje transkripcije:

(a) Mjesto DNK na koje se veže DNK polimeraza naziva se

promoter. Promotor se obično sastoji od 50 nukleotida. Prisutan je na početku gena. Promotor za polimerazu II sadrži TATA kutiju. TATA box binding protein (TBP) prepoznaje TATA kutije i vezuje RNA polimerazu na promotor.

(b) U ovoj fazi, DNK je dvolančana (“zatvorena”). Ova struktura RNA polimeraze/rana-DNK se zove zatvoreni kompleks.

(c) DNK se odmotava i postaje jednolančana (“otvorena”) blizu mjesta inicijacije. Ova struktura RNA •polimeraze/nenamotane DNK naziva se otvoreni kompleks.

(d) RNA polimeraza transkribuje DNK, ali proizvodi oko 10 abortivnih nukleotida (transkripata). Oni ne mogu napustiti RNA polimerazu jer je izlazni kanal blokiran

(e) A-faktor RNA polimeraze se odvaja od holoenzima i počinje elongacija.

RNA polimeraza počinje spajati komplementarne nukleotide riboze na 3′ kraj lanca DNK. Iste komplementarne baze uparene u DNK. Ali u RNK, baza uracil zamjenjuje bazu i timin. Tako se uracil dopunjava adeninu.

Novi RNA transkripti koriste adenozin-5’rifosfat (ATP), guanozin-51-trifosfat (CUP) (purin nukleozid trifosfat). Uridin-5′-trifosfat (UTP) i citidin-5. -trifosfat (CTP) (pirimidin nukleozid trifosfat).

2. Raskid

Transkripcija se nastavlja. Konačno, RNA polimeraza dostiže terminacijske sekvence. Tako prestaje transkripcija. Dva mehanizma prekida su dobro poznata:

(a) Rho nezavisan završetak: Uključuje terminatorske sekvence unutar RNK koje signaliziraju RNA polimerazi

stani. Terminatorska sekvenca je obično a palindromski niz. Formira strukturu ukosnice u obliku petlje. Odvaja RNK polimere od DNK šablona. Jedna takva uobičajena palindromska sekvenca terminacije ‘GCCGCCAG’. RNK polimeraza ne uspeva da nastavi dalje od ove tačke. Stoga se nastali DNK-RNA hibrid disocira.

(b) Rho-ovisni završetak: U ovom slučaju faktor terminacije nazvan p faktor (rho faktor) zaustavlja sintezu RNK na određenim mjestima. Ovaj protein se veže i kreće duž mRNA prema RNA polimerazi. Kada p-faktor dosegne RNA polimerazu, on odvaja RNK polimerazu od DNK, završavajući transkripciju.

Novotranskribovana mRNA naziva se primarni transkript. Modificira se prije napuštanja nukleusa. Neke bazne sekvence u novotranskribovanoj mRNA ne kodiraju proteine. RNA spajanje izrežite ove nekodirajuće regije. Dakle, region koji kodira mRNA može kontinuirano čitati na ribosomu.

(a)Kod Prokariota: Novosintetizovana mRNA je direktno

otpuštaju u citoplazmu u bakterijama. U citoplazmi se pretvara u polipeptidni lanac.

(b) Kod eukariota: mRNA kod eukariota mora putovati iz unutrašnjosti jezgra do ribozoma izvan citoplazme. Stoga je eukariotska mRNA modificirana na nekoliko načina. Ove modifikacije mu pomažu na njegovom putu. Dodaju se kapa i rep. Tako molekul ostaje stabilan tokom dugog putovanja do ribozoma. Kapice i repovi spašavaju mRNA od djelovanja raznih enzima nukleaza i fosfataza.


Vrste RNA transkripta

Tradicionalno su bila poznata tri tipa RNK transkripta – glasnička RNA (mRNA), tRNA i rRNA – i sva tri su blisko povezana sa sintezom proteina. Dok mRNA određuje sekvencu aminokiselina, tRNA i rRNA su ključne za mehanizam translacije mRNA koda.

mRNA polymerization from DNA containing protein coding genes is catalyzed by RNA polymerase II. Occasionally, proteins that are used together are coded as a single unit, in one long mRNA molecule and this is particularly common among prokaryotes. DNA sequences upstream of the coding sequence contain docking sites for the transcription machinery as well as regulatory factors that modulate the timing and quantity of transcriptional activity. mRNA is then modified and processed to give rise to the final transcript used for translation.

rRNA constitutes nearly fifty percent of the RNA of a cell and is transcribed by RNA polymerase I in specialized regions of the nucleus called the nucleolus. Nucleoli appear as dense spherical structures around the loci that code for rRNA. Prokaryotic rRNA is of three types and eukaryotic ribosomes are made of four types of rRNA with the largest one containing over 5000 nucleotides. These RNA molecules determine the three-dimensional structure of ribosomes.

RNA polymerase III catalyzes the transcription of tRNA precursors in the nucleus. Promoter sequences controlling the expression of tRNA genes can be intragenic, located inside the coding sequence of the gene. tRNA precursors undergo extensive modifications including splicing. Prokaryotic tRNAs retain their catalytic activity and can self-splice, whereas eukaryotic post-transcriptional modification is carried out by special endonuclease enzymes. These endonucleases recognize specific structural motifs within the tRNA that target the sequence for splicing.

In addition to these three types of RNA, the cell contains a number of smaller RNA involved in various cellular activities. These include gene regulation (mediated by micro RNA and sequences in the 5′ untranslated regions of mRNA transcripts), post-transcriptional modification (small nuclear RNA, small nucleolar RNA), genome defense (Piwi-interacting RNA and CRISPR) and the maintenance of genomic structure (telomeres and RNA transcripts that silence X-chromosomes).


Reference

Varshney D, Spiegel J, Zyner K, Tannahill D, Balasubramanian S. The regulation and functions of DNA and RNA G-quadruplexes. Nat Rev Mol Cell Biol. 202021(8):459–74. Available from: http://www.nature.com/articles/s41580-020-0236-x. https://doi.org/10.1038/s41580-020-0236-x.

Huppert JL, Balasubramanian S. G-quadruplexes in promoters throughout the human genome. Nukleinske kiseline Res. 200735(2):406–13. https://doi.org/10.1093/nar/gkl1057.

Maizels N, Gray LT. The G4 genome. PLoS Genet. 20139(4):e1003468. https://doi.org/10.1371/journal.pgen.1003468.

Balasubramanian S, Hurley LH, Neidle S. Targeting G-quadruplexes in gene promoters: a novel anticancer strategy? Nat Rev Drug Discov. 201110(4):261–75. https://doi.org/10.1038/nrd3428.

Hänsel-Hertsch R, Beraldi D, Stefanie L, Giovanni M, Zyner K, Parry A, et al. G-quadruplex structures mark human regulatory chromatin. Nat Genet. 201648(10):1267–72. https://doi.org/10.1038/ng.3662.

Hänsel-Hertsch R, Simeone A, Shea A, Hui WWI, Zyner KG, Marsico G, Rueda OM, Bruna A, Martin A, Zhang X, Adhikari S, Tannahill D, Caldas C, Balasubramanian S. Landscape of G-quadruplex DNA structural regions in breast cancer. Nat Genet. 202052(9):878–83. https://doi.org/10.1038/s41588-020-0672-8.

Hou Y, Li F, Zhang R, Li S, Liu H, Qin ZS, Sun X. Integrative characterization of G-Quadruplexes in the three-dimensional chromatin structure. Epigenetics. 201914(9):894–911. https://doi.org/10.1080/15592294.2019.1621140.

Raiber EA, Kranaster R, Lam E, Nikan M, Balasubramanian S. A non-canonical DNA structure is a binding motif for the transcription factor SP1 in vitro. Nukleinske kiseline Res. 201240(4):1499–508. https://doi.org/10.1093/nar/gkr882.

Sengupta P, Bhattacharya A, Sa G, Das T, Chatterjee S. Truncated G-quadruplex isomers cross-talk with the transcription factors to maintain homeostatic equilibria in c-MYC transcription. Biochemistry. 201958(15):1975–91. https://doi.org/10.1021/acs.biochem.9b00030.

Niu K, Xiang L, Jin Y, Peng Y, Wu F, Tang W, Zhang X, Deng H, Xiang H, Li S, Wang J, Song Q, Feng Q. Identification of LARK as a novel and conserved G-quadruplex binding protein in invertebrates and vertebrates. Nukleinske kiseline Res. 201947(14):7306–20. https://doi.org/10.1093/nar/gkz484.

David AP, Pipier A, Pascutti F, Binolfi A, Weiner AMJ, Challier E, Heckel S, Calsou P, Gomez D, Calcaterra NB, Armas P. CNBP controls transcription by unfolding DNA G-quadruplex structures. Nukleinske kiseline Res. 201947(15):7901–13. https://doi.org/10.1093/nar/gkz527.

Kouzine F, Liu J, Sanford S, Chung HJ, Levens D. The dynamic response of upstream DNA to transcription-generated torsional stress. Nat Struct Mol Biol. 200411(11):1092–100. https://doi.org/10.1038/nsmb848.

Gerstein MB, Kundaje A, Hariharan M, Landt SG, Yan KK, Cheng C, Mu XJ, Khurana E, Rozowsky J, Alexander R, Min R, Alves P, Abyzov A, Addleman N, Bhardwaj N, Boyle AP, Cayting P, Charos A, Chen DZ, Cheng Y, Clarke D, Eastman C, Euskirchen G, Frietze S, Fu Y, Gertz J, Grubert F, Harmanci A, Jain P, Kasowski M, Lacroute P, Leng J, Lian J, Monahan H, O’Geen H, Ouyang Z, Partridge EC, Patacsil D, Pauli F, Raha D, Ramirez L, Reddy TE, Reed B, Shi M, Slifer T, Wang J, Wu L, Yang X, Yip KY, Zilberman-Schapira G, Batzoglou S, Sidow A, Farnham PJ, Myers RM, Weissman SM, Snyder M. Architecture of the human regulatory network derived from ENCODE data. Priroda. 2012489(7414):91–100. https://doi.org/10.1038/nature11245.

Hänsel-Hertsch R, Spiegel J, Marsico G, Tannahill D, Balasubramanian S. Genome-wide mapping of endogenous G-quadruplex DNA structures by chromatin immunoprecipitation and high-throughput sequencing. Nat Protoc. 201813(3):551–64. https://doi.org/10.1038/nprot.2017.150.

Chambers VS, Marsico G, Boutell JM, Di Antonio M, Smith GP, Balasubramanian S. High-throughput sequencing of DNA G-quadruplex structures in the human genome. Nat Biotechnol. 201533(8):877–81. https://doi.org/10.1038/nbt.3295.

Duquette ML, Handa P, Vincent JA, Taylor AF, Maizels N. Intracellular transcription of G-rich DNAs induces formation of G-loops, novel structures containing G4 DNA. Genes Dev. 200418(13):1618–29. https://doi.org/10.1101/gad.1200804.

Baumli S, Endicott JA, Johnson LN. Halogen bonds form the basis for selective P-TEFb inhibition by DRB. Chem Biol. 201017(9):931–6. https://doi.org/10.1016/j.chembiol.2010.07.012.

Laitem C, Zaborowska J, Isa NF, Kufs J, Dienstbier M, Murphy S. CDK9 inhibitors define elongation checkpoints at both ends of RNA polymerase II-transcribed genes. Nat Struct Mol Biol. 201522(5):396–403. https://doi.org/10.1038/nsmb.3000.

Titov DV, Gilman B, He QL, Bhat S, Low WK, Dang Y, Smeaton M, Demain AL, Miller PS, Kugel JF, Goodrich JA, Liu JO. XPB, a subunit of TFIIH, is a target of the natural product triptolide. Nat Chem Biol. 20117(3):182–8. Available from: https://doi.org/10.1038/nchembio.522.

Roychoudhury S, Pramanik S, Harris HL, Tarpley M, Sarkar A, Spagnol G, Sorgen PL, Chowdhury D, Band V, Klinkebiel D, Bhakat KK. Endogenous oxidized DNA bases and APE1 regulate the formation of G-quadruplex structures in the genome. Proc Natl Acad Sci. 2020117(21):11409–20. https://doi.org/10.1073/pnas.1912355117.

Gray LT, Vallur AC, Eddy J, Maizels N. G quadruplexes are genomewide targets of transcriptional helicases XPB and XPD. Nat Chem Biol. 201410(4):313–8. https://doi.org/10.1038/nchembio.1475.

Batie M, Frost J, Frost M, Wilson JW, Schofield P, Rocha S. Hypoxia induces rapid changes to histone methylation and reprograms chromatin. Science (80-). 2019363:1222–6. https://doi.org/10.1126/science.aau5870.

Kirmes I, Szczurek A, Prakash K, Charapitsa I, Heiser C, Musheev M, Schock F, Fornalczyk K, Ma D, Birk U, Cremer C, Reid G. A transient ischemic environment induces reversible compaction of chromatin. Genome Biol. 201516(1):246. https://doi.org/10.1186/s13059-015-0802-2.

Dutta B, Yan R, Lim SK, Tam JP, Sze SK. Quantitative profiling of chromatome dynamics reveals a novel role for HP1BP3 in hypoxia-induced oncogenesis. Mol Cell Proteomics. 201413(12):3236–49. https://doi.org/10.1074/mcp.M114.038232.

Chen H, Yan Y, Davidson TL, Shinkai Y, Costa M. Hypoxic stress induces dimethylated histone H3 lysine 9 through histone methyltransferase G9a in mammalian cells. Cancer Res. 200666(18):9009–16. https://doi.org/10.1158/0008-5472.CAN-06-0101.

Gao X, Lin SH, Ren F, Li JT, Chen JJ, Yao CB, Yang HB, Jiang SX, Yan GQ, Wang D, Wang Y, Liu Y, Cai Z, Xu YY, Chen J, Yu W, Yang PY, Lei QY. Acetate functions as an epigenetic metabolite to promote lipid synthesis under hypoxia. Nat Commun. 20167(1):11960. https://doi.org/10.1038/ncomms11960.

Semenza GL. Hypoxia-inducible factors in physiology and medicine. Cell. 2012148(3):399–408. https://doi.org/10.1016/j.cell.2012.01.021.

Zaret K. Micrococcal nuclease analysis of chromatin structure. Curr Protoc Mol Biol. 200545:1–17. https://doi.org/10.1002/0471142727.mb2101s45.

Lorenzini PA, Chew RSE, Tan CW, Yong JY, Zhang F, Zheng J, Roca X. Human PRPF40B regulates hundreds of alternative splicing targets and represses a hypoxia expression signature. RNK. 201925(8):905–20. https://doi.org/10.1261/rna.069534.118.

Biffi G, Tannahill D, McCafferty J, Balasubramanian S. Quantitative visualization of DNA G-quadruplex structures in human cells. Nat Chem. 20135(3):182–6. https://doi.org/10.1038/nchem.1548.

Müller S, Kumari S, Rodriguez R, Balasubramanian S. Small-molecule-mediated G-quadruplex isolation from human cells. Nat Chem. 20102(12):1095–8. https://doi.org/10.1038/nchem.842.

Di Antonio M, Ponjavic A, Radzevičius A, Ranasinghe RT, Catalano M, Zhang X, et al. Single-molecule visualization of DNA G-quadruplex formation in live cells. Nat Chem. 202012:832–7. https://doi.org/10.1038/s41557-020-0506-4.

Bristow RG, Hill RP. Hypoxia, DNA repair and genetic instability. Nat Rev Cancer. 20088(3):180–92. https://doi.org/10.1038/nrc2344.

Hanna R, Flamier A, Barabino A, Bernier G. G-quadruplexes originating from evolutionary conserved L1 elements interfere with neuronal gene expression in Alzheimer’s disease. Nat Commun. 202112(1828). https://doi.org/10.1038/s41467-021-22129-9.

Makowski MM, Gräwe C, Foster BM, Nguyen NV, Bartke T, Vermeulen M. Global profiling of protein-DNA and protein-nucleosome binding affinities using quantitative mass spectrometry. Nat Commun. 20189(1):1653. https://doi.org/10.1038/s41467-018-04084-0.

Varshney D, Vavrova-Anderson J, Oler AJ, Cowling VH, Cairns BR, White RJ. SINE transcription by RNA polymerase III is suppressed by histone methylation but not by DNA methylation. Nat Commun. 20156(1):6569. https://doi.org/10.1038/ncomms7569.

Calviello AK, Hirsekorn A, Wurmus R, Yusuf D, Ohler U. Reproducible inference of transcription factor footprints in ATAC-seq and DNase- seq datasets using protocol-specific bias modeling. Genome Biol. 201920(1):42. https://doi.org/10.1186/s13059-019-1654-y.

De Chaumont F, Dallongeville S, Chenouard N, Hervé N, Pop S, Provoost T, et al. Icy: an open bioimage informatics platform for extended reproducible research. Nat metode. 20129(7):690–6. https://doi.org/10.1038/nmeth.2075.

Martin M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 201117(1):10–2. https://doi.org/10.14806/ej.17.1.200.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R, 1000 Genome Project Data Processing Subgroup. The sequence alignment/map format and SAMtools. Bioinformatika. 200925(16):2078–9. https://doi.org/10.1093/bioinformatics/btp352.

Quinlan AR, Hall IM. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatika. 201026(6):841–2. https://doi.org/10.1093/bioinformatics/btq033.

Ramírez F, Dündar F, Diehl S, Grüning BA, Manke T. DeepTools: a flexible platform for exploring deep-sequencing data. Nukleinske kiseline Res. 201442(W1):W187–91. https://doi.org/10.1093/nar/gku365.

Marsico G, Chambers VS, Sahakyan AB, McCauley P, Boutell JM, Di Antonio M, et al. Whole genome experimental maps of DNA G-quadruplexes in multiple species. Nukleinske kiseline Res. 201947(8):3862–74. https://doi.org/10.1093/nar/gkz179.

Shen J, Varshney D, Simeone A, Zhang X, Adhikari S, Tannahill D, et al. Promoter G-quadruplex folding precedes transcription and is controlled by chromatin. Datasets. Gene Expression Omnibus. 2021 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE162299. Accessed 31 Mar 2021.

Dunham I, Kundaje A, Aldred SF, Collins PJ, Davis CA, Doyle F, et al. An integrated encyclopedia of DNA elements in the human genome. Priroda. 2012489:57–74. https://doi.org/10.1038/nature11247.

Shen J, Varshney D, Simeone A, Zhang X, Adhikari S, Tannahill D, et al. Promoter G-quadruplex folding precedes transcription and is controlled by chromatin. Github. 2021 https://github.com/sblab-bioinformatics/G4_and_trancription. Accessed 28 Mar 2021.

Simeone A. promoterG4s_precedes_transcription. figshare. Softver. 2021 https://doi.org/10.6084/m9.figshare.14393699.v1. Accessed 9 Apr 2021.


Is the transcription starting site located before or after the promoter? - Biologija

Poput transkripcije, translaciju kontroliraju proteini koji se vezuju i započinju proces. U prijevodu, prije nego što sinteza proteina može početi, sastavljanje ribosoma mora biti završeno. Ovo je proces u više koraka.

U sklopu ribosoma velike i male ribosomske podjedinice i inicijator tRNA (tRNA)i) koji sadrže prvu aminokiselinu konačnog polipeptidnog lanca svi se okupljaju na kodonu početka translacije na mRNA kako bi omogućili početak translacije. Prvo, mala ribosomalna podjedinica se vezuje za tRNAi koji prenosi metionin u eukariotima i arhejama i prenosi N-formil-metionin u bakterijama. (Zbog tRNAi nosi aminokiselinu, kaže se da je nabijena.) Zatim, mala ribosomska podjedinica sa nabijenom tRNAi još uvijek vezani skenovi duž lanca mRNA sve dok ne dosegnu početni kodon AUG, što pokazuje gdje će započeti translacija. Početni kodon takođe uspostavlja okvir čitanja za lanac mRNA, koji je ključan za sintezu ispravne sekvence aminokiselina. Promena okvira čitanja dovodi do pogrešnog prevođenja mRNA. Antikodon na tRNAi zatim se veže za početni kodon putem uparivanja baze. Kompleks koji se sastoji od mRNA, nabijene tRNAi, a mala ribosomska podjedinica se veže za veliku ribosomsku podjedinicu, čime se završava sklapanje ribosoma. Ove se komponente spajaju uz pomoć proteina koji se nazivaju inicijacijski faktori i koji se tijekom inicijacije vežu za malu ribosomsku podjedinicu i nalaze se u sva tri područja života. Osim toga, ćelija troši GTP energiju kako bi pomogla u formiranju inicijacionog kompleksa. Kada se završi sastavljanje ribosoma, nabijena tRNAi se nalazi na P mjestu ribosoma, a prazno A mjesto je spremno za sljedeću aminoacil-tRNA. Sinteza polipeptida započinje i uvijek nastavlja od N-kraja do C-kraja, koji se naziva smjer N-prema-C.

Kod eukariota, nekoliko proteina eukariotskog faktora inicijacije (eIF) pomaže u sastavljanju ribosoma. Inicijacijski faktor eukariota-2 (eIF-2) aktivan je kada se veže na gvanozin trifosfat (GTP). Sa GTP vezan za njega, eIF-2 protein se vezuje za malu 40S ribosomalnu podjedinicu. Zatim, inicijacija tRNA nabijena metioninom (Met-tRNAi) povezuje s kompleksom ribosoma GTP-eIF-2/40S, a nakon što su sve ove komponente međusobno vezane, zajedno se nazivaju 43S kompleks.

Eukaryotic initiation factors eIF1, eIF3, eIF4, and eIF5 help bring the 43S complex to the 5′-m 7 G cap of an mRNA be translated. Once bound to the mRNA’s 5′ m 7 G cap, the 43S complex starts travelling down the mRNA until it reaches the initiation AUG codon at the start of the mRNA’s reading frame. Sekvence oko AUG -a mogu pomoći da se osigura da se ispravan AUG koristi kao inicijacijski kodon u mRNA.

Jednom kada je 43S kompleks na inicijacijskom AUG-u, tRNAi-Met se postavlja iznad AUG-a. Antikodon na tRNAi-Upoznajte osnovne parove sa kodonom AUG. U ovom trenutku, GTP vezan za eIF2 u 43S kompleksu se hidrolizira u GDP + fosfat, a energija se oslobađa. Ova energija se koristi za oslobađanje eIF2 (sa BDP-om vezan za njega) iz 43S kompleksa, ostavljajući ribosomsku podjedinicu 40S i tRNAi-Upoznali smo se na početnom mestu translacije mRNA.

Zatim, eIF5 s GTP vezanim veže se na 40S ribosomsku podjedinicu s kompleksom na mRNA i tRNAi-Met. EIF5-GTP omogućava vezivanje velike ribosomske podjedinice 60S. Kada stigne ribosomalna podjedinica 60S, eIF5 hidrolizira svoj vezani GTP za BDP + fosfat i oslobađa se energija. Ova energija snažno povezuje dvije ribosomske podjedinice u netaknuti 80S ribosom, sa tRNAi-Met na svom P mjestu, a istovremeno je uparen sa inicijacijskim kodonom AUG na mRNA. Prevod je spreman za početak.

Vezanje eIF-2 za 40S ribosomsku podjedinicu kontroliše se fosforilacijom. Ako je eIF-2 fosforiliran, prolazi kroz konformacijsku promjenu i ne može se vezati za GTP. Stoga se kompleks 43S ne može pravilno formirati i translacija je otežana. Kad eIF-2 ostane nefosforiliran, veže 40S ribosomsku podjedinicu i aktivno prevodi protein.

Translation Initiation Complex: Gene expression can be controlled by factors that bind the translation initiation complex.

Sposobnost potpunog sastavljanja ribosoma izravno utječe na brzinu translacije. Ali sinteza proteina je regulirana i na raznim drugim nivoima, uključujući sintezu mRNA, sintezu tRNA, sintezu rRNA i sintezu faktora inicijacije eukariota. Promjena u bilo kojoj od ovih komponenti utječe na brzinu kojom može doći do prijevoda.


Pogledajte video: Асеев В. В. - Молекулярная биология - Транскрипция (Februar 2023).