Informacije

Kako mogu odvojiti obilje rezultata incidencije?

Kako mogu odvojiti obilje rezultata incidencije?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Moram izračunati vrijednosti incidencije virusa mozaika lubenice u različitim godišnjim dobima u okviru faktora staništa.

Ovi podaci o incidenciji dolaze od otkrivanja infekcije neke biljke uzorkovane na različitim staništima (hrastovina, pustoš, rubovi, usjevi). Biljka uzorkovana na ovim staništima uzorkovana je u različita godišnja doba (ljeto, proljeće, jesen) Stanište usjeva uzorkovano je samo u ljeto, a domaćin uzorkovan u usjevima bio je u većini vrsta Cucumis melo.

Ovaj virus ima prednost u odnosu na stanište useva, domaćina Cucumis melo. Izračunao sam učestalost, a zatim sam izračunao značajnu razliku između njih. Fisher test, pokazao je da je incidencija veća ljeti i kod Cucumis melo hosta.

Da li je moguće odvojiti efekte obilja usjeva i Cucumisa (neuravnoteženo uzorkovanje godišnjih doba po staništima) mog zaključka o značajnim sezonskim varijacijama?

Znam da moji zaključci nisu sezonski učinak. Zato što sam ljeti kratko vrijeme uzorkovao 10.000 biljaka dinje, a to je preferirani domaćin.

Kako mogu odvojiti obilje rezultata incidencije? Koju statističku analizu mogu izvršiti?

Hvala unaprijed


Studenti t&ndashtest za dva uzorka

Koristite Student's t&ndashtestirajte za dva uzorka kada imate jednu mjernu varijablu i jednu nominalnu varijablu, a nominalna varijabla ima samo dvije vrijednosti. Testira da li su sredstva mjerne varijable različite u dvije grupe.

Uvod

Postoji nekoliko statističkih testova koji koriste t-distribuciju i mogu se nazvati a t&ndashtest. Jedna od najčešćih je Studentska t& ndashtest za dva uzorka. Ostalo t&ndashtestovi uključuju jedan uzorak t&ndashtest, koji uspoređuje srednju vrijednost uzorka sa teoretskom sredinom i uparene t&ndashtest.

Studenti t&ndashtest za dva uzorka je matematički identičan jednosmjernoj anovi sa dvije kategorije jer je poređenje srednjih vrijednosti dva uzorka tako uobičajen eksperimentalni dizajn, i zato što t& ndashtest je poznat mnogo više ljudi nego anova, ja tretiram dva uzorka t& ndashtest odvojeno.

Kada ga koristiti

Koristite dva uzorka t& ndashtest kada imate jednu nominalnu varijablu i jednu mjernu varijablu, a želite uporediti srednje vrijednosti mjerne varijable. Nominalna varijabla mora imati samo dvije vrijednosti, kao što su "muško" i "žensko" ili "tretirano" i "neobrađeno".

Nulta hipoteza

Statistička nulta hipoteza je da su srednje vrijednosti mjerne varijable jednake za dvije kategorije.

Kako test funkcionira

Statistika testa, ts, izračunava se pomoću formule koja ima razliku između srednjih vrijednosti u brojniku što čini ts postaju sve veći kako se sredstva sve više razdvajaju. Nazivnik je standardna greška razlike u srednjim vrednostima, koja postaje manja kako se varijanse uzorka smanjuju ili povećavaju veličine uzorka. Tako ts postaje sve veći kako se srednje vrijednosti udaljavaju, varijanse postaju manje ili se veličina uzorka povećava.

Izračunavate vjerovatnoću dobijanja promatranog ts vrijednost pod nultom hipotezom koristeći t-distribuciju. Oblik t-distribucije, a time i vjerovatnoća dobivanja određenog ts vrijednost, zavisi od broja stupnjeva slobode. Stepeni slobode za a t& ndashtest je ukupan broj opservacija u grupama minus 2 ili n1+n2& minus2.

Pretpostavke

The t& ndashtest pretpostavlja da su zapažanja unutar svake grupe normalno raspoređena. Srećom, uopće nije osjetljivo na odstupanja od ove pretpostavke, ako su distribucije dviju grupa iste (ako su obje distribucije nagnute udesno, na primjer). Radio sam simulacije sa raznim ne-normalnim distribucijama, uključujući ravne, bimodalne i visoko iskrivljene, i dva uzorka t&ndashtest uvijek daje oko 5% lažnih pozitivnih rezultata, čak i sa vrlo malim veličinama uzorka. Ako su vaši podaci izrazito nenormalni, ipak biste trebali pokušati pronaći transformaciju podataka koja ih čini normalnijima, ali ne brinite ako ne možete pronaći dobru transformaciju ili nemate dovoljno podataka da provjerite normalnost.

Ako su vaši podaci ozbiljno nenormalni, i imate različite distribucije u dvije grupe (jedan skup podataka je nagnut udesno, a drugi u lijevo, na primjer), i imate male uzorke (manje od 50-ak), zatim dva uzorka t& ndashtest može dati netočne rezultate, sa znatno više od 5% lažno pozitivnih rezultata. Ovdje vam neće pomoći transformacija podataka, kao ni Mann-Whitneyjev U-test. Bilo bi prilično neobično u biologiji imati dvije grupe s različitim distribucijama, ali jednakim srednjim vrijednostima, ali ako mislite da je to mogućnost, trebali biste zahtijevati P vrijednost mnogo manja od 0,05 za odbacivanje nulte hipoteze.

Dva uzorka t& ndashtest također pretpostavlja homoscedastičnost (jednake varijance u dvije grupe). Ako imate uravnotežen dizajn (jednake veličine uzorka u dvije grupe), test nije jako osjetljiv na heteroskedastičnost, osim ako je uzorak vrlo mali (manje od 10 -tak) standardna odstupanja u jednoj grupi mogu biti nekoliko puta veća kao u drugoj grupi, i dobićete P& lt0.05 oko 5% vremena ako je nulta hipoteza tačna. Sa neuravnoteženim dizajnom, heteroskedastičnost je veći problem ako grupa sa manjom veličinom uzorka ima veću standardnu ​​devijaciju, dvouzorak t&ndashtest vam prečesto može dati lažne pozitivne rezultate. Ako vaše dvije grupe imaju standardna odstupanja koja se bitno razlikuju (kao što je jedna standardna devijacija dva puta veća od druge), a veličine uzorka su male (manje od 10) ili nejednake, trebali biste koristiti Welchovu t&ndashtest umjesto toga.

Primjer

U jesen 2004. studenti su u 14 sati. odjeljak moje klase analize bioloških podataka imao je prosječnu visinu od 66,6 inča, dok je prosječna visina bila u 17:00. presek je bio 64,6 inča. Da li se prosječne visine dviju dionica značajno razlikuju? Evo podataka:

14:0017:00
6968
7062
6667
6368
6869
7067
6961
6759
6262
6361
7669
5966
6262
6262
7561
6270
72
63

Postoji jedna mjerna varijabla, visina i jedna nominalna varijabla, odjeljak klase. Nulta hipoteza je da su srednje visine u dva odjeljka iste. Rezultati t& ndashtest (t = 1,29, 32 d.f., P=0,21) ne odbacuju nultu hipotezu.

Grafikovanje rezultata

Budući da se radi samo o usporedbi dva broja, rijetko ćete staviti rezultate a t&ndashtest u grafikonu za objavljivanje. Za prezentaciju možete nacrtati stupčasti grafikon poput onog za jednosmjernu anovu.

Slični testovi

Studenti t&ndashtest je matematički identičan jednosmjernoj anovi koja se radi na podacima s dvije kategorije, dobićete potpuno isto P vrijednost iz dva uzorka t&ndashtest i iz jednosmjerne anove, iako izračunavate statistiku testa drugačije. The t& ndashtest je lakše napraviti i poznat je većem broju ljudi, ali je ograničen na samo dvije kategorije podataka. Možete napraviti jednosmjernu anova na dvije ili više kategorija. Preporučujem da ako vaše istraživanje uvijek uključuje usporedbu samo dva prosjeka, nazovite test dva uzorka t& ndashtest, jer je više ljudi poznato. Ako pišete rad koji uključuje neka poređenja dva srednja i neka poređenja više od dva srednja, možda ćete htjeti nazvati sve testove jednosmjernim anovama, umjesto da se prebacujete između dva različita imena (t& ndashtest i jednosmjerna anova) za istu stvar.

Mann-Whitneyjev U-test je neparametarska alternativa dvo uzorku t&ndashtest koji neki ljudi preporučuju za nenormalne podatke. Međutim, ako dva uzorka imaju istu distribuciju, dva uzorka t&ndashtest nije osjetljiv na odstupanja od normalnosti, tako da možete koristiti moćniji i poznatiji t& ndashtest umjesto Mann-Whitney U-testa. Ako dva uzorka imaju različite distribucije, Mann-Whitneyjev U-test nije ništa bolji od t&ndashtest. Dakle, zaista nema razloga za korištenje Mann-Whitneyjevog U-testa osim ako umjesto mjerne varijable nemate istinito rangiranu varijablu.

Ako su varijanse daleko od jednakih (jedna standardna devijacija je dva ili više puta veća od druge) i vaše veličine uzorka su ili male (manje od 10) ili nejednake, trebali biste koristiti Welchovu t& ndashtest (poznat i kao Aspin-Welch, Welch-Satterthwaite, Aspin-Welch-Satterthwaite ili Satterthwaite t&ndashtest). Slična je studentskoj t& ndashtest osim što ne pretpostavlja da su standardne devijacije jednake. Nešto je manje moćan od Studentovog t& ndashtest kada su standardne devijacije jednake, ali može biti mnogo preciznije ako su standardne devijacije vrlo nejednake. Moj dva uzorka t&ndashtest tabela će izračunati Welchove t&ndashtest. Možete i Welch's t&ndashtest koristeći ovu web stranicu, klikom na dugme označeno sa "Welch je neuparen t& ndashtest ".

Koristite upareno t& ndashtest kada mjerenja dolaze u parovima, kao što je usporedba snage desne ruke sa snagom lijeve ruke na skupu ljudi.

Koristite jedan uzorak t& ndashtest kada imate samo jednu grupu, a ne dvije, i uspoređujete srednju vrijednost mjerne varijable za tu grupu s teorijskim očekivanjima.

Kako uraditi test

Tabele

Postavio sam proračunsku tablicu za dva uzorka t& ndashtests. Izvest će bilo studentsku t&ndashtest ili Welch's t& ndashtest za do 2000 zapažanja u svakoj grupi.

Web stranice

Postoje web stranice za to t& ndashtest ovdje i ovdje. Obojica će raditi i jedno i drugo t&ndashtest i Welch's t&ndashtest.

Možete koristiti PROC TTEST za učenike t& ndashtest CLASS parametar je nominalna varijabla, a VAR parametar je mjerna varijabla. Evo primjera programa za gornje podatke o visini.

Izlaz uključuje mnogo informacija P vrijednost za studente t& ndashtest se nalazi pod "Pr & gt | t | na liniji označenoj" Pooled ", a P vrijednost za Welchovu t& ndashtest je na liniji s oznakom "Satterthwaite." Za ove podatke, P vrijednost je 0,2067 za Student's t&ndashtest i 0,1995 za Welch's.

Analiza snage

Za procjenu veličina uzoraka potrebnih za otkrivanje značajne razlike između dva sredstva, potrebno vam je sljedeće:

  • veličinu efekta ili razliku u sredstvima koja se nadate da ćete otkriti
  • standardna devijacija. Obično ćete koristiti istu vrijednost za svaku grupu, ali ako unaprijed znate da će jedna grupa imati veću standardnu ​​devijaciju od druge, možete koristiti različite brojeve
  • alfa ili nivo značaja (obično 0,05)
  • beta, vjerovatnoća prihvatanja nulte hipoteze kada je netačna (0,50, 0,80 i 0,90 su uobičajene vrijednosti)
  • odnos jedne veličine uzorka prema drugoj. Najmoćniji dizajn je imati jednak broj u svakoj grupi (N1/N2= 1,0), ali ponekad je lakše dobiti veliki broj jedne od grupa. Na primjer, ako upoređujete snagu kostiju kod miševa koji su odgajani u nultoj gravitaciji na Međunarodnoj svemirskoj stanici u odnosu na kontrolnih miševa uzgojenih na Zemlji, mogli biste unaprijed odlučiti da koristite tri kontrolna miša za svakog skupog svemirskog miša (N1/N2=3.0)

Program G*Power će izračunati veličinu uzorka potrebnu za dva uzorka t&ndashtest. Odaberite "t testovi" iz izbornika "Porodica testova" i "Sredstva: razlika između dva nezavisna srednja sredstva (dvije grupe" iz izbornika "Statistički test". Kliknite na dugme "Odredi" i unesite očekivana sredstva i standardna odstupanja za svaku grupu. Samo razlika između grupe znači da je važna veličina vašeg efekta. Kliknite na "Izračunaj i prenesi na glavni prozor". Promijenite "repove" na dva, postavite svoj alfa (ovo će skoro uvijek biti 0,05) i vašu snagu (Obično se koriste 0,5, 0,8 ili 0,9). Ako planirate imati više zapažanja u jednoj grupi nego u drugoj, možete učiniti da se "omjer raspodjele" razlikuje od 1.

Na primjer, recimo da želite znati da li ljudi koji redovno trče imaju veća stopala od ljudi koji ne trče. Tražite prethodno objavljene podatke o širini stopala i nalazite skup podataka ANSUR koji prikazuje srednju širinu stopala za američke muškarce od 100,6 mm i standardnu ​​devijaciju od 5,26 mm. Odlučili ste da želite otkriti razliku od 3 mm u srednjoj širini stopala između trkača i netrkača. Koristeći G*Power, unosite 100 mm za srednju vrijednost grupe 1, 103 za srednju vrijednost grupe 2 i 5,26 za standardnu ​​devijaciju svake grupe. Odlučili ste da želite otkriti razliku od 3 mm, na nivou P & lt0.05, s vjerovatnoćom da otkrijete tako veliku razliku, ako postoji, od 90% (1 & minusbeta = 0.90). Unošenjem svih ovih brojeva u G*Power dobiva se uzorak za svaku grupu od 66 ljudi.

& lArr Prethodna tema | Sljedeća tema & rArr Sadržaj

Ova stranica je zadnji put revidirana 20. jula 2015. Adresa je http://www.biostathandbook.com/twosamplettest.html. Može se citirati kao:
McDonald, J.H. 2014. Priručnik za biološku statistiku (3. izdanje). Izdavaštvo Sparky House, Baltimore, Maryland. Ova web stranica sadrži sadržaj stranica 126-130 u štampanoj verziji.

& copy2014 John H. McDonald. Vjerovatno možete raditi što želite s ovim sadržajem, pogledajte stranicu dozvola za detalje.


Transformacije podataka

Ako mjerna varijabla ne odgovara normalnoj distribuciji ili ima jako različite standardne devijacije u različitim grupama, trebali biste pokušati s transformacijom podataka.

Uvod

Mnoge biološke varijable ne zadovoljavaju pretpostavke parametarskih statističkih testova: nisu normalno raspoređene, standardne devijacije nisu homogene ili oboje. Upotreba parametarskog statističkog testa (kao što je anova ili linearna regresija) na takvim podacima može dati pogrešan rezultat. U nekim slučajevima, transformacija podataka će učiniti da se bolje uklapaju u pretpostavke.

Histogrami broja istočnih muda po dionici toka od 75 m (uzorci s isključenim 0 mudminnows). Netransformirani podaci s lijeve strane, log-transformirani podaci s desne strane. Histogrami broja istočnih muda po dionici toka od 75 m (uzorci s isključenim 0 mudminnows). Netransformirani podaci s lijeve strane, log-transformirani podaci s desne strane.

Da biste transformirali podatke, izvršite matematičku operaciju na svakom opažanju, a zatim koristite ove transformirane brojeve u svom statističkom testu. Na primjer, kao što je prikazano na prvom grafikonu gore, brojnost ribljih vrsta Umbra pygmaea (Istočni muljevit) u potocima Marylanda nije normalno raspoređen, ima mnogo potoka s malom gustoćom muljevitih gnojiva, te nekoliko potoka s mnogo njih. Primjena log transformacije čini podatke normalnijima, kao što je prikazano na drugom grafikonu.

istočni mudminnow (Umbra pygmaea).

Evo 12 brojeva iz skupa podataka mudminnow: prva kolona je netransformirani podatak, druga kolona je kvadratni korijen broja u prvoj koloni, a treća kolona je logaritam sa osnovicom 10 broja u prvom stupcu.

Vi radite statistiku o transformiranim brojevima. Na primjer, prosjek netransformiranih podataka je 18,9, prosjek kvadratnih korijena transformiranih podataka je 3,89, prosjek log transformiranih podataka je 1,044. Kad biste uspoređivali brojnost ribe na različitim slivovima i odlučili da je transformacija trupaca najbolja, napravili biste jednosmjernu anovu na zapisima o broju riba i testirali biste nultu hipotezu da su sredstva zapisnika transformisano obilje bilo je jednako.

Povratna transformacija

Iako ste izvršili statističko ispitivanje transformirane varijable, poput zapisnika o broju ribe, nije dobra ideja prijaviti svoja sredstva, standardne greške itd. U transformiranim jedinicama. Grafikon koji je pokazao da je srednja vrijednost log ribe na 75 metara potoka 1,044 ne bi bio baš informativan za nekoga ko ne može u svojoj glavi napraviti razlomke. Umjesto toga, trebali biste unatrag transformirati svoje rezultate. To uključuje suprotno od matematičke funkcije koju ste koristili u transformaciji podataka. Za transformaciju dnevnika, izvršili biste povratnu transformaciju podizanjem 10 na stepen vašeg broja. Na primjer, gornji podaci transformirani u log imaju prosjek od 1,044 i interval pouzdanosti od 95% za & plusmn0,344 log transformiranu ribu. Povratno transformisana srednja vrijednost bila bi 10 1,044 =11,1 riba. Gornja granica pouzdanosti bila bi 10 (1.044+0.344) =24.4 ribe, a donja granica povjerenja bi bila 10 (1.044-0.344) =5.0 riba. Imajte na umu da interval pouzdanosti nije simetričan, gornja granica je 13,3 ribe iznad srednje vrijednosti, dok je donja granica 6,1 riba ispod srednje vrijednosti. Također imajte na umu da ne možete samo povratno transformirati interval povjerenja i dodati ili oduzeti to od povratno transformiranog značenja ne možete uzeti 10 0,344 i to dodati ili oduzeti.

Odabir prave transformacije

Transformacije podataka su važno oruđe za pravilnu statističku analizu bioloških podataka. Međutim, onima sa ograničenim znanjem statistike to može izgledati pomalo sumnjivo, oblik igranja s vašim podacima kako bi dobili željeni odgovor. Stoga je bitno da možete braniti svoju upotrebu transformacije podataka.

Postoji beskonačan broj transformacija koje možete koristiti, ali je bolje koristiti transformaciju koju drugi istraživači obično koriste u vašem području, poput transformacije kvadratnog korijena za podatke o brojanju ili transformacije dnevnika za podatke o veličini. Čak i ako vam nejasna transformacija za koju malo ljudi čulo daje malo normalnije ili više homoskedastične podatke, vjerojatno će biti bolje koristiti uobičajeniju transformaciju kako ljudi ne bi postali sumnjičavi. Upamtite da vaši podaci ne moraju biti savršeno normalni i da homoscedastički parametarski testovi nisu izuzetno osjetljivi na odstupanja od njihovih pretpostavki.

Također je važno da odlučite koju ćete transformaciju koristiti prije nego što izvršite statistički test. Pokušavanje različitih transformacija sve dok ne pronađete onu koja vam daje značajan rezultat je varanje. Ako imate veliki broj zapažanja, uporedite efekte različitih transformacija na normalnost i homoskedastičnost varijable. Ako imate mali broj zapažanja, možda nećete moći vidjeti veliki utjecaj transformacija na normalnost i homoscedastičnost u tom slučaju, trebali biste koristiti bilo koju transformaciju koju ljudi iz vašeg područja rutinski koriste za vašu varijablu.Na primjer, ako proučavate udaljenost disperzije polena i drugi ljudi je rutinski logiraju, trebali biste logički transformirati i udaljenost polena, čak i ako imate samo 10 opservacija i stoga ne možete stvarno gledati na normalnost pomoću histograma.

Uobičajene transformacije

Postoje mnoge transformacije koje se povremeno koriste u biologiji, a ovdje su tri najčešće:

Transformacija dnevnika. Ovo se sastoji od uzimanja dnevnika svakog zapažanja. Možete koristiti evidenciju base-10 (LOG u proračunskoj tabeli, LOG10 u SAS-u) ili base-e dnevniki, poznati i kao prirodni dnevnici (LN u proračunskoj tabeli, LOG u SAS). Za statistički test nema razlike da li koristite dnevnike baze-10 ili prirodne dnevnike, jer se razlikuju po konstantnom faktoru baza-10 log broja je samo 2,303&hellip&put prirodnog dnevnika broja. Prilikom pisanja rezultata trebali biste navesti koji dnevnik koristite jer će to utjecati na stvari poput nagiba i presretanja u regresiji. Više volim zapise baze-10, jer ih je moguće pogledati i vidjeti veličinu izvornog broja: log (1) = 0, log (10) = 1, log (100) = 2 itd.

Zadnja transformacija je podizanje 10 ili e do stepena broja ako je sredina vaših baza-10 log-transformiranih podataka 1,43, povratno transformirana sredina je 10 1,43 = 26,9 (u proračunskoj tablici, "= 10^1,43"). Ako je srednja vrijednost vaših baza-e log transformiranih podataka 3,65, povratno transformirana sredina je e 3.65 =38.5 (u proračunskoj tabeli, "=EXP(3.65)". Ako imate nule ili negativne brojeve, ne možete uzeti dnevnik, trebali biste dodati konstantu svakom broju da bi bili pozitivni i različiti od nule. Ako imate imaju podatke o brojanju, a neki od brojanja su nula, konvencija je da se svakom broju doda 0,5.

Mnoge varijable u biologiji imaju log-normalne distribucije, što znači da su nakon log-transformacije vrijednosti normalno raspoređene. To je zato što ako uzmete gomilu nezavisnih faktora i pomnožite ih, rezultirajući proizvod je log-normalan. Na primjer, recimo da ste posadili gomilu sjemena javora, a zatim 10 godina kasnije vidite koliko su stabla visoka. Na visinu pojedinačnog stabla uticali bi azot u tlu, količina vode, količina sunčeve svjetlosti, količina štete od insekata, itd. Ako ima više dušika, drvo bi moglo biti 10% veće od drveta s manje dušika odgovarajućom količinom vode bi ga moglo učiniti 30% većim od onog sa previše ili premalo vode više sunčeve svjetlosti bi ga moglo učiniti 20% većim, manje štete od insekata bi ga mogle učiniti 15% veće, itd. Tako bi konačna veličina drveta bila funkcija dušika×water×sunelight×inks , i matematički, ova vrsta funkcije se ispostavlja kao log-normalna.

Transformacija kvadratnog korijena. Ovo se sastoji od uzimanja kvadratnog korijena svake opservacije. Zadnja transformacija je kvadriranje broja. Ako imate negativne brojeve, ne možete uzeti kvadratni korijen, svakom broju dodajte konstantu kako bi svi bili pozitivni.

Ljudi često koriste transformaciju kvadratnog korijena kada je varijabla broj nečega, kao što su kolonije bakterija po petrijevoj zdjelici, krvna zrnca koja prolaze kroz kapilar u minuti, mutacije po generaciji itd.

Arksinusna transformacija. To se sastoji od uzimanja arkusina kvadratnog korijena broja. (Rezultat je dat u radijanima, a ne u stepenima i može biti u rasponu od & minus & pi/2 do & pi/2.) Brojevi koje treba transformirati arksinus moraju biti u rasponu od 0 do 1. To se obično koristi za proporcije, koje se kreću od 0 do 1, kao što je udio ženki istočnjačkog blata koje su zaražene parazitom. Imajte na umu da je ova vrsta proporcije zaista nominalna varijabla, pa je pogrešno tretirati je kao mjernu varijablu, bez obzira na to jeste li je arksinus pretvorili ili ne. Na primjer, bilo bi neispravno brojati broj blatnih zrnaca koji su ili nisu parazitizirani u svakom od nekoliko potoka u Marylandu, tretirati arcsin-transformirani udio parazitisanih ženki u svakom potoku kao mjernu varijablu, a zatim izvršiti linearnu regresiju na njima podaci u odnosu na dubinu toka. To je zato što će proporcije iz potoka s manjom veličinom uzorka ribe imati veće standardno odstupanje od proporcija iz potoka s većim uzorcima ribe, što se zanemaruje pri tretiranju lučno transformiranih proporcija kao mjernih varijabli. Umjesto toga, trebali biste koristiti test dizajniran za nominalne varijable u ovom primjeru, trebali biste raditi logističku regresiju umjesto linearne regresije. Ako insistirate na upotrebi arksinusne transformacije, uprkos onome što sam vam upravo rekao, povratna transformacija je kvadrat kvadratnog sinusa broja.

Kako transformirati podatke

Tabela

U praznu kolonu unesite odgovarajuću funkciju za transformaciju koju ste odabrali. Na primjer, ako želite transformirati brojeve koji počinju u ćeliji A2, idite na ćeliju B2 i unesite =LOG(A2) ili =LN(A2) za transformaciju dnevnika, =SQRT(A2) u transformaciju kvadratnog korijena, ili =ASIN(SQRT(A2)) u arcsinusnu transformaciju. Zatim kopirajte ćeliju B2 i zalijepite u sve ćelije u koloni B koje se nalaze pored ćelija u koloni A koje sadrže podatke. Da biste kopirali i zalijepili transformirane vrijednosti u drugu proračunsku tablicu, ne zaboravite upotrijebiti naredbu "Posebno zalijepi.", A zatim odaberite zalijepiti "Vrijednosti". Korišćenje naredbe "Specijalno zalijepi. Vrijednosti" čini da Excel kopira numerički rezultat jednačine, a ne samu jednačinu. (Ako je vaša proračunska tabela Calc, odaberite "Specijalno lijepljenje" iz izbornika Uredi, poništite potvrdne okvire s natpisima "Zalijepi sve" i "Formule" i potvrdite okvir s oznakom "Brojevi.")

Za povratnu transformaciju podataka, samo unesite obrnutu funkciju koju ste koristili za transformaciju podataka. Za povratnu transformaciju transformiranih podataka dnevnika u ćeliju B2, unesite =10^B2 za bazu-10 dnevnika ili =EXP(B2) za prirodne dnevnike za transformirane podatke kvadratnog korijena, unesite =B2^2 za arcsinusne transformirane podatke, unesite =( SIN(B2))^2

Web stranice

Nije mi poznato nijedna web stranica koja bi vršila transformaciju podataka.

Za pretvaranje podataka u SAS pročitajte izvorne podatke, a zatim stvorite novu varijablu s odgovarajućom funkcijom. Ovaj primjer pokazuje kako kreirati dvije nove varijable, transformiranu kvadratnim korijenom i transformiranu dnevnik, podataka mudminnow.

Skup podataka "mudminnow" sadrži sve originalne varijable ("location", "banktype" i "count") plus nove varijable ("countlog" i "countsqrt"). Zatim pokrećete koji god PROC želite i analizirate ove varijable kao i sve druge. Naravno, ovaj primjer radi dvije različite transformacije samo kao ilustraciju u stvarnosti, trebali biste se odlučiti za jednu transformaciju prije nego što analizirate svoje podatke.

SAS funkcija za arksinusni transformator X je ARSIN (SQRT (X)).

Vjerojatno ćete se najlakše vratiti unatrag pomoću proračunske tablice ili kalkulatora, ali ako zaista želite raditi sve u SAS -u, funkcija za uzimanje 10 na X stepen je 10 ** X funkcija za uzimanje e za stepen je EXP (X) funkcija za kvadratovanje X je X ** 2, a funkcija za povratno pretvaranje lučno transformisanog broja je SIN (X) ** 2.

Reference

& lArr Prethodna tema | Sljedeća tema & rArr Sadržaj

Ova stranica je posljednji put revidirana 18. decembra 2015. Njena adresa je http://www.biostathandbook.com/transformation.html. Može se citirati kao:
McDonald, J.H. 2014. Priručnik za biološku statistiku (3. izdanje). Izdavaštvo Sparky House, Baltimore, Maryland. Ova web stranica sadrži sadržaj stranica 140-144 u štampanoj verziji.

& copy2014 John H. McDonald. Vjerovatno možete raditi što želite s ovim sadržajem, pogledajte stranicu dozvola za detalje.


The Study of Population Dynamics

Demografija, ili proučavanje dinamike stanovništva, proučava se pomoću alata kao što su tablice života i krive preživljavanja.

Ciljevi učenja

Razlikovati tablice života i krivulje preživljavanja koje se koriste u demografiji

Key Takeaways

Ključne točke

  • Ključni statistički podaci koji se koriste u demografiji su natalitet, stope smrtnosti i očekivani životni vijek na koje mogu utjecati karakteristike stanovništva i biološki faktori.
  • Stope nataliteta, stope smrtnosti i očekivani životni vijek osnovne su determinante kako se stanovništvo mijenja tokom vremena.
  • Tabele života su demografski alati koji pokazuju očekivani životni vijek i smrtnost stanovništva unutar starosnih grupa.
  • Kriva preživljavanja je graf broja pojedinaca koji su preživjeli u svakom dobnom intervalu iscrtanom u odnosu na vrijeme.
  • Karakteristike i ponašanje vrste, poput broja proizvedenog potomstva, postotka preživjelog potomstva i stepena roditeljske brige, određuju oblik njene krivulje preživljavanja.

Ključni uslovi

  • životni sto: demografski alat koji pokazuje očekivani životni vijek i smrtnost stanovništva unutar starosnih grupa
  • kriva preživljavanja: grafikon broja preživjelih pojedinaca u svakom starosnom intervalu u odnosu na vrijeme
  • stopa smrtnosti: broj umrlih po datoj jedinici stanovništva u datom vremenskom periodu

Demografija

Veličina populacije, gustina i obrasci distribucije opisuju populaciju u određenom trenutku. Da bi proučili kako se populacija mijenja s vremenom, naučnici moraju koristiti alate demografije: statistička studija o promjenama stanovništva s vremenom. Ključni statistički podaci koje demografi koriste su natalitet, stope smrtnosti i očekivani životni vijek, iako u praksi naučnici također proučavaju stope imigracije i emigracije, što također utječe na stanovništvo.

Ove mjere, posebno stope nataliteta, mogu biti povezane sa karakteristikama stanovništva opisanim u prethodnim odjeljcima. Na primjer, velika populacija imala bi relativno visok natalitet ako ima više reproduktivnih jedinki. Alternativno, velika populacija također može imati visoku stopu smrtnosti zbog konkurencije, bolesti ili nakupljanja otpada. Velika gustina populacije može dovesti do reproduktivnijih susreta između jedinki, kao što bi bio i zgrudani obrazac distribucije. Takvi uslovi povećali bi natalitet.

Biološke karakteristike populacije takođe utiču na promene stanovništva tokom vremena. Natalitet će biti veći u populaciji s omjerom muškaraca i žena prema ženama, ili u populaciji koju čini relativno više pojedinaca u reproduktivnoj dobi.

Demografske karakteristike stanovništva osnovne su odrednice kako se stanovništvo mijenja s vremenom. Ako su stope nataliteta i smrtnosti jednake, populacija ostaje stabilna. Stanovništvo će se povećati ako natalitet bude veći od stope smrtnosti, ali će se smanjiti ako je stopa nataliteta niža od stope smrtnosti. Očekivano trajanje života, još jedan važan faktor, je dužina vremena koje pojedinci ostaju u populaciji. Na to utječu lokalni resursi, reprodukcija i opće zdravlje stanovništva. Ove demografske karakteristike često se prikazuju u obliku tablice života.

Životne tablice

Tablice života, koje pružaju važne informacije o životnoj istoriji organizma, dijele populaciju na starosne grupe i često po spolovima pokazuju koliko će vjerovatno član te grupe živjeti. Tabele su oblikovane prema aktuarskim tablicama koje industrija osiguranja koristi za procjenu očekivanog ljudskog života. Tablice životnog vijeka mogu uključivati:

  • vjerovatnoća da će pojedinci umrijeti prije svog sljedećeg rođendana (tj. stopa smrtnosti)
  • postotak preživjelih pojedinaca u određenom dobnom intervalu
  • očekivano trajanje života u svakom intervalu

Prikazana tabela života je iz studije o Dall planinskoj ovci, vrsti porijeklom iz sjeverozapadne Sjeverne Amerike. Stanovništvo je podijeljeno na starosne intervale, kao što se vidi u krajnjoj lijevoj koloni. Stopa mortaliteta na 1.000 jedinki izračunava se dijeljenjem broja jedinki koje umiru tokom starosnog intervala sa brojem osoba koje su preživjele na početku intervala, pomnoženim sa 1.000.

Tabela života planinskih ovaca Dall: Ova životna tablica Ovis dalli prikazuje broj uginuća, broj preživjelih, stopu smrtnosti i očekivani životni vijek u svakom starosnom intervalu za planinske ovce Dall.

Na primjer, u dobi između tri i četiri godine, 12 jedinki ugine od 776 preostalih od izvornih 1.000 ovaca. Taj se broj zatim pomnoži s 1.000 kako bi se dobila smrtnost na hiljadu.

Kao što se vidi iz podataka o mortalitetu (kolona D), visoka stopa uginuća je bila kada su ovce bile stare između 6 i 12 mjeseci, a zatim se još više povećala sa 8 na 12 godina, nakon čega je malo preživjelih. Podaci pokazuju da ako bi ovca u ovoj populaciji preživjela godinu dana, moglo bi se očekivati ​​da će u prosjeku živjeti još 7,7 godina, što pokazuju brojevi očekivanog životnog vijeka u koloni E.

Krivulje preživljavanja

Još jedan alat koji koriste populacijski ekolozi je kriva preživljavanja, koja je grafikon broja preživjelih jedinki u svakom starosnom intervalu u odnosu na vrijeme (obično sa podacima sakupljenim iz tabele života). Ove krivulje omogućuju usporedbu povijesti života različitih populacija.

Krive preživljavanja pokazuju distribuciju pojedinaca u populaciji prema starosti: Ljudi i većina sisara imaju krivulju preživljavanja tipa I jer se smrt prvenstveno javlja u starijim godinama. Ptice imaju krivulju preživljavanja tipa II, jer je smrt u bilo kojoj dobi jednako vjerojatna. Drveće ima krivulju preživljavanja tipa III jer vrlo mali broj njih preživi mlađe godine, ali nakon određene dobi vjerojatnije je da će pojedinci preživjeti.

Ljudi i većina primata pokazuju krivulju preživljavanja tipa I jer visok postotak potomaka preživi rane i srednje godine, smrt se javlja pretežno kod starijih osoba. Ove vrste imaju malo potomaka jer ulažu u roditeljsku skrb kako bi povećale preživljavanje.

Ptice pokazuju krivulju preživljavanja tipa II jer jednak broj ptica umire u svakom dobnom intervalu. Ove vrste takođe mogu imati relativno malo potomaka i pružiti značajnu roditeljsku brigu.

Drveće, morski beskičmenjaci i većina riba pokazuju krivulju preživljavanja tipa III. Vrlo mali broj pojedinaca preživi mlađe godine, međutim, oni koji dožive duboku starost vjerovatno će preživjeti relativno dugo. Organizmi u ovoj kategoriji obično imaju veliki broj potomaka i pružaju malo roditeljske brige. Takvi potomci su “samostalni” i trpe visoku smrtnost zbog grabežljivaca ili gladovanja, međutim, njihovo obilje osigurava da dovoljno jedinki preživi do sljedeće generacije, održavajući populaciju.


Duplikacije i brisanja

Osim gubitka ili dobitka cijelog kromosoma, hromozomski segment može biti dupliciran ili izgubljen. Duplikacije i brisanja često proizvode potomke koji prežive, ali pokazuju fizičke i mentalne abnormalnosti. Duplirani hromozomski segmenti mogu se stopiti sa postojećim hromozomima ili mogu biti slobodni u jezgri. Cri-du-chat (od francuskog za “plač mačke ”) je sindrom povezan s abnormalnostima živčanog sistema i prepoznatljivim fizičkim karakteristikama koje su rezultat brisanja većine 5p (mali krak hromozoma 5) (slika 5). Novorođenčad s ovim genotipom ispuštaju karakterističan visoki glas na kojem se zasniva ime poremećaja.

Slika 5. Ova osoba sa cri-du-chat sindromom prikazana je u dobi od dvije, četiri, devet i 12 godina. (kredit: Paola Cerruti Mainardi)


Sex Chromosomes

Šta, ako išta, može poći po zlu sa polnim hromozomima? Umjesto povećanja ili gubitka autosoma, varijacije u broju polnih hromozoma povezane su s relativno blagim efektima. To se događa zbog molekularnog procesa zvanog X inaktivacija. U ranom razvoju, kada se embrioni ženskih sisavaca sastoje od samo nekoliko hiljada ćelija, po jedan X kromosom u svakoj ćeliji inaktivira se čvrsto kondenzirajući u uspavanu strukturu zvanu Barrovo tijelo. Šansa da se X kromosom, bilo kojeg od roditelja, inaktivira u svakoj ćeliji je slučajna, ali jednom kad dođe do inaktivacije, sve ćelije izvedene iz te će imati isti neaktivni X kromosom ili Barrovo tijelo. Ovim procesom ženke nadoknađuju svoju dvostruku genetsku dozu X kromosoma.

Slika 5. Kod mačaka, gen za boju dlake nalazi se na X hromozomu. U embrionalnom razvoju ženskih mačaka, jedan od dva X hromozoma se nasumično inaktivira u svakoj ćeliji, što rezultira uzorkom kornjačevine ako mačka ima dva različita alela za boju dlake. Muške mačke, koje imaju samo jedan X kromosom, nikada ne pokazuju boju dlake kornjačevine. (kredit: Michael Bodega)

Ovo se može vidjeti kod takozvanih "kornjačevih" mačaka kod kojih se embrionalna inaktivacija X opaža kao šarenilo boja (Slika 5). Heterozigotne ženke za gen za boju dlake povezane s X će izraziti jednu od dvije različite boje dlake na različitim dijelovima svog tijela, što odgovara bilo kojem X hromozomu koji je inaktiviran u embrionalnoj ćeliji te regije.

Osoba sa abnormalnim brojem X hromozoma će inaktivirati sve osim jednog X hromozoma u svakoj od svojih ćelija. Međutim, čak i inaktivirani X kromosomi nastavljaju izražavati nekoliko gena. Kao rezultat toga, X-hromozomske abnormalnosti su povezane sa blagim mentalnim i fizičkim nedostacima i sterilitetom. Potpuno odsustvo X hromozoma sprečava individuu da se razvije in utero.

Uočeno je nekoliko grešaka u broju polnih hromozoma.

(1) Triplo-X ženka – XXX ženka ekspresno zaostaje za smanjenjem plodnosti

(2) Klinefelterov sindrom – XXY muški mali testisi povećani grudi smanjuju dlačice na tijelu

(3) Turnerov sindrom – X0 ženska (samo jedan polni kromosom) koža niskog rasta u predelu vrata, oštećenja sluha i srca i sterilitet


Metode

Naš pristup procjeni globalne zastupljenosti za 9.700 vrsta može se raščlaniti na pet ključnih koraka, koji su redom navedeni u nastavku (slika 1):

• Korak 1 (Podaci o obuci): Modelirajte odnos između poznatih (tj. Eksterno provjerenih najboljih dostupnih podataka) procjena gustoće i relativne brojnosti iz eBird-a da biste izveli model obuke specifičan za vrstu, uz uključivanje poznate greške u procjene relativne brojnosti.

• Korak 2 (Podaci imputacije): Izračunajte mjeru relativnog obilja za sve vrste u ćelijama mreže od 5° širom svijeta. Za vrste za treniranje, izračunajte gustinu koristeći rezultate iz koraka 1 u svakoj jedinstvenoj mreži koju vrsta zauzima.

• Korak 3 (osobine životne istorije): Uporedite osobine istorije života (boja ptica, veličina jata, veličina tela i status Međunarodne unije za očuvanje prirode [IUCN]) koje će verovatno uticati na odnos između prave populacije vrste i relativna brojnost vrste izračunata putem eBird-a.

• Korak 4 (Višestruka imputacija): Izvršite višestruko imputiranje lančanim jednadžbama kako biste predvidjeli gustoću vrste i njenu nesigurnost po ćeliji mreže, na osnovu poznate veze između procijenjene gustoće i opažene relativne brojnosti za naše vrste za obuku i svojstava prikupljenih u koraku 3.

• Korak 5 (Izračunajte brojnost): Koristite predviđene gustoće i nesigurnosti za izvođenje prosječne procjene globalne gustoće za svaku vrstu i pomnožite ovu procjenu gustoće s promatranom površinom vrste - s ekstrapolacijom gdje je potrebno i moguće - za izračunavanje simulirane globalne brojnosti distribucija.

U sljedećim metodama proširujemo svaki od ovih ključnih koraka.

Podaci o obuci.

Procjene obilja.

Naš glavni cilj bio je kvantificirati gustoću vrsta ptica u cijelom svijetu. Osnovno za gustoću je mjera apsolutnog obilja - poznata ili procijenjena količina pojedinaca u populaciji. Procjena ukupne veličine populacije određene populacije životinja temeljno je istraživačko pitanje u ekologiji i očuvanju (58). Mnoga su istraživanja istraživala kako najbolje procijeniti apsolutnu brojnost, pri čemu su primijenjene mnoge tehnike za procjenu brojnosti (59, 60). Kad je za područje poznato obilje, tada je gustoća jednostavno: D e n s i t y = A b u n d a n c e A r e a.

Stoga je za našu analizu bilo kritično pronaći vanjske procjene stanovništva koje su imale procijenjenu brojnost stanovništva za dato geografsko područje. Budući da većina shema izvještavanja proizlazi iz vladine inicijative za razumijevanje koje su vrste najugroženije (61), većina procjena populacije temelji se na geopolitičkim granicama, a ukupne populacije specifične za vrste zatim se povećavaju na temelju ekstrapolacija veličine područja. Naša analiza se stoga u određenoj mjeri oslanjala na populacije unutar geopolitičkih granica. Koristili smo objavljene procjene brojnosti iz tri izvora: 1) Partners in Flight baze podataka procjena populacije (62) 2) procjene populacije iz Britanskog fonda za ornitologiju (63) i 3) iz BirdLife International Data Zone datazone.birdlife.org/home. Prikupili smo ukupno 724 vrste za koje smo procijenili brojnost populacije. Brojnost svake vrste za obuku izračunato je ili u geopolitičkim granicama (tj. Za vrste izvađene iz baze podataka Partners in Flight i Britanskog fonda za ornitologiju) ili u cijelom njihovom geografskom rasponu (tj. Za vrste izvađene iz BirdLife Zone podataka). Na primjer, procjene iz baze podataka Partners in Flight bile su dostupne stratificirane za svaku državu i regiju očuvanja ptica širom Sjedinjenih Država gdje je ta vrsta pronađena. Svaki od ovih izvora podataka detaljnije je obrađen u SI Dodatak, SI metode.

Procjene relativne brojnosti.

Procjene relativne brojnosti izvukli smo iz eBird (36, 64) podataka o građanima. Ovdje smo definirali relativnu brojnost kao broj posmatranih ptica po jedinici napora (npr. Vrijeme i/ili udaljenost). eBird je lansirao 2002. Cornell Lab of Ornithology i trenutno ima više od 800 miliona globalnih posmatranja ptica. Dobrovoljni posmatrači ptica podnose „kontrolne liste“ ptica koje se vide i/ili čuju tokom posmatranja ptica. Vrste ili brojevi vrsta, koji su neočekivani na osnovu prostorno -vremenskih koordinata posmatranja, označeni su i pregledani od strane široke mreže stručnjaka dobrovoljaca prije nego što budu prihvaćeni u skup podataka (65). Svaka kontrolna lista je označena kao “kompletna” ili “nepotpuna” od strane volontera posmatrača ptica koji dostavljaju podatke. Ova razlika ukazuje na to da li dostavljaju potpuni popis svih ptica koje su viđene i/ili čule tokom svog perioda posmatranja. U našoj analizi koristili smo samo potpune kontrolne liste jer to omogućava zaključivanje o odsustvima (tj. Neotkrivanju). Za našu analizu koristili smo osnovni skup podataka eBird (verzija ebd_relMay2019). Agregirali smo podatke o eBirdima od siječnja 2010. do svibnja 2019. Priznajemo da bi neke vrste mogle doživjeti promjene u veličini svoje populacije za to vrijeme, ali napominjemo da je 10 godina trajanje koje preporučuje IUCN za izračunavanje promjene populacije kada vrijeme generacije nije poznato ( 66). Kako bismo dodatno osigurali da ti podaci predstavljaju podatke „najbolje kvalitete“, upotrijebili smo dodatni skup filtriranja, s ciljem uklanjanja potencijalnih „odstupanja“ koje bi mogle utjecati na naš skup podataka (67 ⇓ ⇓ –70). Uključili smo samo potpune kontrolne liste, kontrolne liste & gt5 min i & lt240 min u trajanju i kontrolne liste koje su prešle

Do danas su se podaci eBird-a koristili za razne mjere vezane za obilje. Opći pristup je mjerenje “relativne brojnosti”: broj ptica koji se prebrojava kada se računa vrijeme provedeno u posmatranju ptica i pređena udaljenost tokom posmatranja ptica. Na primjer, Cornell Lab of Ornithology trenutno modelira relativno obilje u prostoru i vremenu za >800 najčešćih vrsta u Sjevernoj Americi i drugdje: https://ebird.org/science/status-and-trends/. Budući da je naš opći pristup bio zasnovan na geopolitičkim granicama, a postojao bi znatno različiti broj dostupnih podataka među različitim geopolitičkim granicama (uporedi SAD i udaljeno indonezijsko ostrvo), težili smo jednostavnom i lakom pristupu modeliranju koji bi se generalizirao na bilo koje mjesto Prikupljaju se eBird podaci. Kao takav, nakon početnog istraživanja (SI Dodatak, Sl. S7 i SI metode), koristili smo prosječnu brojnost na svim kontrolnim listama (uključujući kontrolne liste kada vrsta nije identificirala nule) kao našu mjeru relativne brojnosti.

Modeliranje odnosa između gustoće i relativne brojnosti.

Koristeći gore poznate procjene brojnosti iz vanjskih izvora, izračunali smo gustoću po svakoj geopolitičkoj regiji ili rasponu vrsta (SI Dodatak, sl. S8), što odgovara mjeri relativnog obilja iz eBird-a. Relativna brojnost i gustoća transformirani su u log10, a sve vrijednosti koje su u početku bile nule (tj. Nisu otkrivene u eBird -u, ali su prisutne u vanjskim izvorima podataka) postavljene su na -4,5 (ljestvica log10) s obzirom na to da je minimalna vrijednost bila -4,499787 u skupu podataka (SI Dodatak, Sl. S9). Kvantitativno smo provjerili osjetljivost uključivanja ovih nula na ukupni učinak našeg modela i otkrili da su nasumični presjeci i nagibi za vrste koje su zadržane bili robusni kada su neka opažanja uklonjena, pa smo odlučili uključiti nule u naš model proces ugradnje, kao što je gore opisano. Ostalo nam je ukupno 8.735 tačaka podataka za 724 vrste u kojima je većina vrsta imala samo jedno zapažanje u modelu, ali su neke vrste imale relativno mnogo zapažanja korištenih u modelu (SI Dodatak, Fig. S10 i S11). Zatim smo uklopili Bayesian model slučajnog nagiba s miješanim efektima koristeći R paket brms (71, 72), koji je omotač koji odgovara Bayesovim modelima u stan (73) preko rstan (74). Ovaj model je ekvivalentan regresijskom modelu tipa II, u kojem smo eksplicitno modelirali grešku u našim mjerilima relativne brojnosti eBird. Pogreška mjera relativne brojnosti eBird -a izračunata je kao SD svih srednjih procjena (tj. SE) za vrijeme (tj. Mjesec) puta date mjere vrste (tj. Geopolitičke regije) mjere srednje brojnosti, s malim uzorkom korekcija veličine, nakon čega slijedi delta metoda za pretvaranje ove u log10 ljestvicu. Iako su procjene grešaka dostupne za većinu naših podataka o obuci (tj. Procjenu gustoće vidi gore), to nije dostupno za sve točke podataka. Stoga smo odlučili da ovu grešku mjerenja ne uključimo u našu varijablu odgovora. Ovaj pristup je 1) inkluzivan tako što omogućava da se više vrsta uključi u proceduru modeliranja ne izostavljajući vrste bez greške za podatke o obuci i 2) konzervativan propagiranjem veće količine SE oko presjeka i nagiba (tj. nesigurnosti) naprijed u našem modelskom okviru. Koristili smo log10 gustoću kao varijablu odziva i log10 relativnu brojnost kao fiksni efekt, s vrstama kao slučajnim presretnutim dijelovima i relativnom izobilnošću log10 kao odgovarajućim slučajnim nagibima. Koristili smo 10.000 ponavljanja i četiri lanca, sa zagrijavanjem od 2.000. Koristili smo zadane prioritete brmova koji su slabo informativni, imaju samo minimalan utjecaj na procjene, uz poboljšanje konvergencije i efikasnosti uzorkovanja. U slučaju Gaussove distribucije, sigma ima pola učenika t prethodno se skalira na isti način kao i SD-ovi na nivou grupe (71, 72). Iz ovog brms modela izvukli smo slučajni nagib i presreli za svaku vrstu (SI Dodatak, sl. S12), koji daje dvoparametarsku jednačinu (y = mx + b) koji je označavao odnos između uočene gustoće vrste i relativne brojnosti iz eBird -a (SI Dodatak, Sl. S9 – S12). Osim toga, izdvojili smo SE (tj. SD zadnje distribucije) presjeka i nagib za svaku vrstu u skupu podataka za obuku (SI Dodatak, Sl. S12). Od suštinske je važnosti prenijeti ove greške za slučajne presjeke i nagibe jer bi svaka vrsta imala različitu količinu greške povezane sa svojim presjekom i nagibom (75).

Validacija Brms modela.

Koristili smo aproksimaciju izostavljanja (76, 77) iz paketa brms kako bismo provjerili dijagnostiku našeg modela brms i otkrili da 95% opažanja ima Pareto k & lt 0,7-u rasponu "ok" (71, 76) , 77), što sugerira da se vrlo malo tačaka podataka može smatrati „utjecajnim“ u našem procesu prilagođavanja modela. Bajesov aproksimativni R 2 - izračunat kao varijansa predviđenih vrijednosti podijeljena s varijansom predviđenih vrijednosti plus očekivana varijacija grešaka (78) - za ovaj model bila je 0,78. Da bismo dodatno potvrdili model brms koji se koristi za izdvajanje presjeka i padina specifičnih za vrste, koristili smo izdvojeni presjek i nagib za svaku vrstu s izvornim opaženim podacima (vidi Metode, iznad) da se testira da li brms model može tačno predvideti eksterne procene ukupnog broja stanovnika. Otkrili smo da presjeci i nagibi izvađeni iz brmova snažno predviđaju procjene brojnosti za naše vrste dresura (SI Dodatak, Sl. S13 i S14) sa R ​​2 od 0,88. Na kraju smo otkrili da je naš brms model robustan za izdvajanje procjena presjeka, nagiba i SE presjeka i nagiba specifičnih za vrste-pogledajte dolje za cjelokupnu provjeru tijeka rada koja dalje pokazuje robusnost ovog modela.

Imputacijski podaci.

Nakon što smo modelirali odnos između promatrane gustoće i relativne brojnosti, ostao nam je model s dva parametra (y = mx + b) opisivanje ovog statističkog odnosa koji pomaže u objašnjavanju buke u mjerama relativne brojnosti. Zatim smo izveli prostornu mrežu 5 × 5 ° koja pokriva svijet (SI Dodatak, sl. S15). Koristili smo samo mreže s najmanje 50 eBird kontrolnih lista u roku od najmanje mjesec dana (SI Dodatak, sl. S16). Unutar svake mreže (N = 579) izračunali smo relativnu brojnost svake vrste kako je gore definirano: prosječno obilje na svim kontrolnim listama, uključujući nule za kontrolne liste na kojima vrsta nije pronađena. Ovo je stratificirano po mjesecima. Ako neka vrsta nije uočena u mreži (tj. Relativna brojnost 0), tada smo pretpostavili da vrsta ne postoji u toj mreži. Koristeći naš model s dva parametra, koji je uključivao SE i za presretanje i za nagib, pretpostavili smo da bi korelacija između nagiba i presretanja bila −1 (SI Dodatak, Sl. S13) to je zato što će precijenjeni presjek (veći presjeci) gotovo uvijek rezultirati plićim nagibima, stvarajući korelaciju presretanja i nagiba −1. Pod ovom pretpostavkom, izračunali smo gustinu – i njen SE – za 684 naše vrste za obuku (tj. one koje su pronađene nakon što su korišteni kriteriji za filtriranje rešetki i ograničili ukupan broj vrsta koje će biti uključene u daljnje analize) unutar svake mreža da je uočena vrsta treninga (SI Dodatak, Sl. S17). Nakon što smo umanjili varijabilnost po mjesecima unutar svake mreže na jednu vrijednost prosjekom relativnih brojnosti, ostalo nam je ukupno 192.702 kombinacije vrsta × mreža. Ukupno 41.652 od njih imalo je procjene gustoće za ukupno 684 vrste.

Iako projekt eBird ima jake i stroge protokole pregleda (36, 64) i široku mrežu regionalnih volontera (65), neke greške i greške se ipak mogu napraviti. Ako je vrsta bila dostupna u verziji skupa podataka eBird koju smo koristili, nismo izvršili nikakvo „čišćenje“ poznatih (ili pretpostavljenih) grešaka. Na primjer, predvidjeli smo pozitivnu brojnost uglavnom priznatog kao izumrlog djetlića iz bjelokosti jer su postojala pozitivna zapažanja o ovoj vrsti u eBird verziji koju smo koristili (vidi gore). Stoga naše rezultate predstavljene u skupu podataka S1 treba pažljivo tumačiti na osnovu poznate biologije vrste i prethodnih očekivanja (glavni tekst). Međutim, eBird—i drugi skupovi podataka iz nauke o građanima—u stalnom je porastu i u količini i u kvaliteti, a ove greške ili greške se kontinuirano ispravljaju u ažuriranim verzijama skupa podataka.

Osobine životne istorije.

Naš glavni cilj kroz višestruko imputiranje bio je imputirati nedostajuće procjene gustoće modeliranjem odnosa između procijenjene gustoće izvedene iz podataka o obuci i relativne brojnosti za netrenirane vrste. Međutim, odnos između uočene gustoće i relativne brojnosti s kontrolnih lista eBird (npr. Slika 1A) vjerovatno će biti pod utjecajem niza životnih svojstava vrste. Prethodni radovi pokazali su da svojstva vrsta (npr. Veličina tijela, boja i veličina grupe) mogu utjecati na otkrivanje vrste (79 ⇓ ⇓ ⇓ ⇓ –84), pa se stoga vjerojatnost da se vrsta zabilježi kod građanina skup naučnih podataka (85). Sólymos i dr. (81) i Johnston et al. (82) otkrili su da je veličina tijela značajan prediktor za otkrivanje vrsta ptica. Također postoji potpora da veličina grupe može utjecati na detektabilnost životinja (83). Iako je teško kvantificirati, smatra se da obojenost organizma utječe na njegovu detektibilnost (84). Konačno, ukupna klasa brojnosti (npr. uobičajena naspram rijetkih) vrste također će vjerovatno utjecati na otkrivanje vrste i vjerovatnoću da će biti zabilježena u skupu podataka o eBird citizen Science (85). Na temelju gornjeg biološkog razumijevanja otkrivanja, u našu smo imputaciju uključili pomoćne podatke o sljedećem: boji vrste, veličini jata, veličini tijela i statusu IUCN -a. Za boje smo koristili skup podataka od> 5000 vrsta (86) i izračunali dvije odvojene metrike: svjetlinu i udaljenost od smeđe boje. Za veličinu jata koristili smo eBird za izračun ukupne prosječne veličine jata među svim prisutnostima u skupu podataka za svaku vrstu. Za veličinu tijela koristili smo tjelesnu masu odrasle osobe (u gramima) izvađenu iz ref. 87. Na kraju, koristili smo IUCN status za vrste u imputaciji (88) kao rednu varijablu, izvučenu iz BirdLife International radne liste ptica verzije 3, dostupne ovdje: datazone.birdlife.org/species/taxonomy.

Prije imputiranja, zaista smo otkrili da se ove osobine prilično dobro podudaraju s različitim komponentama (tj. Presretanjem ili nagibom ili SE presretnutog dijela ili nagiba) detektibilnosti vrsta između promatrane gustoće i relativne brojnosti eBird -a (SI Dodatak, Sl. S18 i S19). Presretanje vrste pokazalo je jaku korelaciju s tjelesnom masom (r = −0,467) i umjerena korelacija s bojom (r = 0,101 i r = 0,145 za udaljenost od smeđe i svjetline, respektivno). Dok je veličina jata bila u slaboj korelaciji sa presretnutim (r = −0,086) i umjereno u korelaciji sa nagibom (r = 0,146), bila je u snažnoj korelaciji sa SE presretanja (r = −0,626) i nagib (r = −0,524). Sličan obrazac kao veličina jata prikazan je za status IUCN -a kao ordinalna varijabla. Sve parne korelacije između presjeka, nagiba, SE presjeka, SE nagiba i osobina vrste mogu se vidjeti u SI Dodatak, Sl. S18. Nakon što smo izračunali gustinu za vrste koje treniraju, koristeći presjeke i nagibe, ostala je umjerena do jaka veza između relativne brojnosti, procijenjene gustine i različitih osobina istorije života (SI Dodatak, Sl. S19), što ukazuje na to da će osobine životne povijesti vjerovatno umanjiti odnos između relativne brojnosti i gustoće.

Višestruka imputacija.

Naš skup podataka „imputacije“ uključivao je 192.702 reda (mreža × vrsta) sa 11 varijabli: 1) ID vrste (0% nedostaje), 2) log transformirani broj eBird kontrolnih lista (0% nedostaje), 3) broj mjeseci a vrsta je uočena u toj mreži (0% nedostaje), 4) relativna brojnost kako je detaljno opisano gore (0% nedostaje), 5) veličina jata (0% nedostaje), 6) IUCN status (nedostaje 8%), 7) tijelo veličina (16% nedostaje), 8) udaljenost boje od smeđe (40% nedostaje), 9) svjetlina boje (40% nedostaje), 10) procijenjena gustoća (79% nedostaje) i 11) SE za gustinu (79% nedostaje). Ovih 11 varijabli pokazalo je umjerenu do jaku korelaciju (SI Dodatak, Sl. S18 i S19). Naši ciljevi za imputiranje bili su gustoća (na specifičnom nivou mreže) i njen SE (10 i 11), uglavnom dobiveni iz relativne brojnosti (0% nedostajućih vrijednosti), ali i uz pomoć pet pomoćnih varijabli (5 do 9). Ove pomoćne varijable imale su dobru pokrivenost, na primjer, 79% redova (153.095) ima barem jednu od ovih pomoćnih varijabli. Među varijablama kojima nedostaju vrijednosti, prvih pet (5 do 9) bile su varijable na nivou vrste, dok su posljednje (10 i 11) bile na nivou posmatranja (red). Koristili smo R pakete mice (89) i miceadds (90) za provođenje višestruke imputacije na dva nivoa u kojoj su korišteni mješoviti modeli s jednim faktorom grupiranja (tj. slučajnim) za imputaciju podataka koji nedostaju korištenjem prediktivnog algoritma srednjeg podudaranja (2lonly.pmm). za varijable na nivou vrste i 2l.pmm za varijable na nivou posmatranja). U našem slučaju, faktor grupiranja (tj. Nasumični) faktor bila je vrsta. Kreirali smo 100 imputiranih skupova podataka.

Validacija modela više imputacija.

Da bismo potvrdili naš pristup modeliranju višestrukih imputacija, proveli smo tri različite provjere, preporučene za procjenu pouzdanosti i vjerojatnosti višestruke imputacije (91, 92). Prvo smo izvršili kvalitativnu procjenu vanjske provjere i nismo našli biološki nerazumne pripisane procjene (92). Drugo, usporedili smo gustoću opažanja za podatke o obuci i gustoću opažanja za pripisane podatke. Koristeći 10 nasumično odabranih imputacija—od 100 ukupnih imputacija koje smo izvršili u našoj analizi—vizuelno smo pregledali imputirane procjene gustine i gustine SE u poređenju sa uočenim procjenama gustine i gustine SE (SI Dodatak, Sl. S20). Utvrdili smo da se svih 10 naših nasumično odabranih imputacija blisko podudaralo s promatranom gustoćom korištenom tijekom imputacije, što ukazuje na to da su imputirane vrijednosti statistički vjerojatne.Treće, proveli smo analizu unakrsne provjere izostanka, u kojoj smo, budući da je naša imputacija ugniježđena na razini vrste (tj. Vrsta se tretirala kao slučajan učinak), izostavili svaku našu vrstu za obuku, jednu na vrijeme (npr. SI Dodatak, sl. S21). Za ovu analizu, svaki proces modeliranja imputacije je ponovljen kao što je gore opisano, ali sa samo 10 imputacija, za razliku od 100 imputacija koje smo koristili u našem punom modelu, iz računskih razloga. Utvrdili smo da je na razini promatranja raspon od 10 imputacija obuhvatio procjenu promatrane gustoće za 95% imputiranih opservacija bez napuštanja (npr. SI Dodatak, sl. S21). Slično, raspon između 0,05 i 0,95 kvantila naših 10 imputacija obuhvatao je uočenu gustoću za 92% opservacija. Prilikom procjene podataka na razini promatranja, moć predviđanja naše imputacijske metode za imputiranje gustoće bila je vrlo jaka: linearni model mješovitih efekata s varijablom odgovora kao imputiranom gustoćom i varijablom prediktora kao promatranom gustoćom sa slučajnim učinkom za vrste marginalni R 2 od 0,84. Kada smo uzimali procjene srednje gustine među mrežama za svaku vrstu, na sličan način smo imali jaku prediktivnu moć, a linearni model je imao R 2 od 0,48 (SI Dodatak, Sl. S22). Sve u svemu, naša višestruka imputacija dala je pouzdane procjene gustoće, a također napominjemo da smo u daljnjim analizama uzimali u obzir proceduru imputacije (vidi dolje).

Izračunajte obilje.

Budući da se neke vrste mogu vrlo rijetko pojaviti u mreži (tj. jednom), što predstavlja promatranje izvan dometa, na primjer, ponderirali smo gustine mreže brojem kontrolnih lista na kojima se vrsta pojavljuje u mreži podijeljenim brojem ukupnih kontrolnih lista u toj mreži. Ovo osigurava jedinstvenu gustoću za svaku vrstu koja predstavlja gustoću ponderiranu s rešetki na kojima se ta vrsta najčešće promatra, pa će stoga gustoća vjerojatno biti najpouzdanija (SI Dodatak, sl. S23). Općenito, urušavanje gustoće vrsta među rešetkama na srednju gustoću pomaže u objašnjavanju poznatih razlika u gustoći u cijelom rasponu vrsta (93) uzimajući u obzir procjenu prosječne gustoće, uključujući regije niske i velike gustoće vrste 'raspon. Na naših 9.700 vrsta, prosječan broj mreža koje je vrsta zauzimala bio je 19, sa SD od 36 (SI Dodatak, Sl. S17). Napominjemo da se mnoge vrste nalaze samo u jednoj rešetkastoj ćeliji, pa iako se njihove gustoće mogu razlikovati u cijelom rasponu, nismo uspjeli objasniti ovu potencijalnu pristranost, ali razlike u gustoći vjerojatno će biti najveće za vrste s većim rasprostranjenjem (93 ). Također smo izračunali imputirane SE za gustinu kao kvadratni korijen zbira: 1) imputirane varijanse gustine i 2) kvadrata prosjeka imputiranih SE, ponderiranih brojem kontrolnih lista. Budući da su u početku primijećeni neki veliki i biološki nerazumni SE, postavili smo greben ispred SE gustoće 1 za predviđenu gustoću, što je jednako 91 puta većoj gustoći od tačkaste procjene gustoće u smislu gornje pouzdanosti limit. Prethodno smatramo da je ovo konzervativno i vjerovatno pristrasno naše procjene, što u nekim slučajevima dovodi do prevelikih intervala povjerenja. Prema tome, svaka vrsta je dobila prosječnu procjenu gustoće (SI Dodatak, Sl. S24) i SE te gustoće (SI Dodatak, slika S25) u datoj ćeliji mreže.

Za svaku vrstu u našem skupu podataka izračunali smo srednju procjenu gustoće (na log10 skali) svih ćelija mreže u kojima je vrsta pronađena, kao što je gore opisano. Zatim smo izračunali ukupnu površinu koju zauzima svaka vrsta u našoj analizi zbrajanjem površine broja ćelija mreže u kojoj je svaka vrsta pronađena. Međutim, prilagodili smo ove površine u dva smjera, ovisno o veličini raspona vrste. Prvo, za vrste s relativno malim rasponima koji mogu biti manji od prosječne veličine mrežastih ćelija (24.000 četvornih milja), izrezali smo područje te vrste na poznatu veličinu raspona (SI Dodatak, Slika S26 prikazuje takav primjer). Drugo, zato što podaci eBird-a nisu homogeni u cijelom svijetu (npr. slika 1B), u našim uzorkovanim ćelijama mreže ima mnogo praznina (npr. Sibir i Afrika -SI Dodatak, sl. S15). Stoga smo za vrstu čiji procijenjeni raspon nije u potpunosti uzorkovan našom analizom eBird -a (tj. Korištene ćelije mreže nisu u potpunosti pokrile raspon te vrste), koristili smo područje ukupne veličine područja - za razliku od ukupne površine rešetke u kojima je pronađena neka vrsta - s promatranom prosječnom procjenom gustoće iz naše analize. Procijenjene raspone vrsta pružio je BirdLife International. Međutim, napominjemo da nismo imali podatke za raspon svake vrste u našoj analizi s obzirom na taksonomske razlike između taksonomije Clements i BirdLife International i opći nedostatak podataka za neke vrste. Stoga, naše prilagođavanje područja nije izvršeno za 2.731 vrstu, u tom slučaju smo pretpostavili da je ukupna površina njihovih uzorkovanih ćelija rešetke približna veličini raspona vrsta. Da li je procjena brojnosti vrste prilagođena na osnovu raspona zabilježeno je u skupu podataka S1.

Koristeći procjenu srednje gustoće (na log10 skali) i veličinu područja vrste, tada smo dobili procjene obilja, izvukavši 10.000 slučajnih izvlačenja iz normalne distribucije s procjenom srednje gustoće i odgovarajućim SE. Definirali smo medijanu ove distribucije (slika 1E) kao globalno bogatstvo specifično za vrstu. Također izvještavamo o donjem i gornjem 95% CI -a u skupu podataka S1.

Ova metoda je ponovljena za svaku vrstu u našoj analizi (N = 9.700). Da bismo odredili ukupan broj pojedinačnih ptica u svijetu, sabrali smo distribucije specifične za vrstu kao što je gore opisano, osiguravajući da su distribucije poredane prije zbrajanja (tj., najmanje vrijednosti ili najveće vrijednosti se zbrajaju dok kombinujemo distribucije). Naručivanjem distribucija prije zbrajanja osigurali smo da vjerovatnoća vrijednosti određenih za svaku vrstu jedna drugoj odgovara, pa smo tako osigurali da srednje vrijednosti odgovaraju onima s najvećom vjerovatnoćom. Iako je ovaj pristup učinjen za svaku vrstu, možemo također sažeti raspodjele specifične za vrstu na osnovu bilo koje klasifikacije vrste (na primjer, roda, porodice, reda, biogeografskog područja i saveza za ishranu), kao što smo to učinili u našoj analizi.

Cjelokupna provjera tijeka rada.

Kako bismo potvrdili naš cjelokupni tijek rada za izračunavanje procjena brojnosti specifičnih za pojedine vrste, izvršili smo pristup unakrsne validacije koji ostavlja jedno mjesto za 684 vrste dresure koje su uključene u brms model i korak višestruke imputacije naše analize. Za svaku vrstu uklonili smo tu vrstu iz našeg bazena za obuku i ponovili analizu - uključujući brms model, model višestruke imputacije i simuliranu distribuciju procjena brojnosti. Za ovaj proces, kako bi se izbjegla računska uska grla, brms model je određen isti, ali opremljen sa samo dva lanca, 3.000 iteracija i zagrijavanjem od 1.000, dok je višestruka imputacija svaki put ugrađena preko 10 imputacija (kvalitativne provjere za nekoliko vrste su pokazale minimalne razlike kada je korišteno više ponavljanja i/ili imputacija). Tada smo mogli procijeniti raspodjelu brojnosti specifične za svaku vrstu za svaku vrstu kada je 1) uključena kao vrsta za obuku u cijeli tijek rada i 2) kada je u potpunosti zadržana kao vrsta za obuku (npr. SI Dodatak, Sl. S27). U većini slučajeva, distribucija mogućih procjena brojnosti bila je šira (tj. Širi intervali povjerenja) kada vrsta nije bila uključena u proces, u usporedbi s onom kada je uključena u potpuni model, a u nekim slučajevima distribucije su bile vrlo slične (SI Dodatak, sl. S27). Važno je da smo otkrili vrlo jaku korelaciju između medijane populacijske brojnosti za svaku vrstu kada se ne uključi u analizu i srednjeg broja populacije iz punog modela kada su uključene sve vrste (SI Dodatak, Sl. S28) - s R 2 od 0,94.

Procjena filogenetskog signala procjena brojnosti na nivou vrste.

Koristeći funkciju phylosig iz R paketa, phytools (94), izračunali smo Blombergov K kao našu mjeru filogenetskog signala. Da bismo uključili filogenetsku nesigurnost, koristili smo 250 filogenetskih stabala na osnovu ref. 95 i agregirane rezultirajuće statistike, koristeći Rubinovo pravilo opisano u ref. 96 uz pretpostavku P vrijednosti iz randomizacijskih testova usporedive su s onima iz t distribucije (97).

Procjena iskrivljenosti distribucije obilja.

Osim zbrajanja distribucija obilja za pojedine vrste i izračunavanja ukupne medijanske procjene (na izvornoj ljestvici) za svaku porodicu, red, biogeografsko područje i ceh ishrane, izračunali smo i distribuciju obilja za svaku od ovih kategorija-s dodatkom roda – zbrajanjem srednjih procjena specifičnih za vrstu za svaku kategoriju. Oba ova pristupa pokazala su snažnu sličnost (SI Dodatak, Sl. S2 i S3). Koristili smo funkciju skewness iz paketa e1071 (98) za izračunavanje nagiba date raspodjele obilja. Da bismo procijenili robusnost našeg nalaza da su distribucije obilja vrsta, roda, porodice i reda bile logički iskrivljene, koristili smo pristup ponovnog uzorkovanja. Prvo smo nasumično uzorkovali kvantil (od 0,1 do 0,99) i uzeli procjenu obilja u tom kvantilu za svaku vrstu (za razliku od srednje procjene koja je predstavljena u glavnom tekstu), a zatim izračunali iskrivljenost JCD -a, kao i kao distribucija obilja roda, porodice i reda (izračunata zbrajanjem srednjih procjena obilja specifičnih za vrstu) za svaki slučajni uzorak. Izveli smo ovo 1.000 puta kako bismo izveli raspodjelu mjera iskrivljenosti, pokazujući čvrstinu našeg nalaza da su raspodjele obilja - na taksonomskim razinama - log iskrivljene (SI Dodatak, Sl. S2). Osim toga, izveli smo pristup pokretanja pokretanja CI-ja mjera skewnessa, potvrđujući naš pristup ponovnog uzorkovanja (SI Dodatak, Sl. S3).


Diskusija

Pojava bolesti koje prenose krpelji mogu biti posljedica varijacija u brojnim faktorima, kao što su brojnost krpelja, prevalencija patogena, nivo patogenosti, kao i nivo izloženosti krpeljima korištenjem zemljišta za stoku ili za život povezanim sa šumom ili rekreativne aktivnosti kod ljudi. Usporedili smo dvije regije prema sjevernom rasponu distribucije I. ricinus u Europi se uvelike razlikuju po broju slučajeva lajmske borelioze kod ljudi, anaplazmoze kod ovaca i anaplazmoze i babesioze kod goveda. Potvrdili smo da je incidencija svih bolesti, a ne samo broj slučajeva, niža u istočnom regionu u odnosu na zapadni region Norveške. Najznačajniji nalaz je veoma niska prevalencija A. phagocytophilum u potrazi za nimfama u istočnoj regiji, što je vjerojatno barem dio objašnjenja za nisku učestalost anaplazmoze u regiji.

Uloga obrazaca distribucije patogena

Vektorske bolesti dijele zajedničku osobinu oslanjanja na prisutnost vektora. Međutim, različiti se patogeni uvelike razlikuju u svojoj biologiji i mjeri u kojoj se oslanjaju na jednog ili više prijenosnih domaćina sa ili bez široke geografske rasprostranjenosti. Distribucija bolesti koje prenose krpelji stoga može biti ograničenija od distribucije vektora. Na primjer, prostorna distribucija virusa krpeljnog encefalitisa (TBEV) u Europi je vrlo ograničena, što vjerovatno odražava potrebu za posebnim uvjetima za ciklus prijenosa uz hranjenje. Za prijenos TBEV-a potrebno je zajedničko hranjenje najmanje 10 larvi i jedne zaražene nimfe na istom domaćinu kako bi se nastavio epidemiološki ciklus [35], a to je povezano s prilično specifičnim temperaturnim uvjetima [36]. Nasuprot tome, prisustvo lajmske borelioze može se prilično dobro predvidjeti na osnovu prisustva vektora. Nema sumnje da zagrijavanje klime izravno utječe na životnu povijest zemlje I. ricinus je glavni faktor koji utječe na opću pojavu lajmske borelioze u Europi [37,38,39]. Sada se bilježi sve veća učestalost lajmske borelioze u sjevernim dijelovima Evrope, kako u Norveškoj [20] tako i u Finskoj [19]. Ako ima I. ricinus na određenom području, patogen B. burgdorferi (s.l.) koji uzrokuju lajmsku boreliozu obično će biti prisutni, jer su domaćini prijenosa široko rasprostranjeni [40]. U skladu s tim, rasprostranjenost B. burgdorferi (s.l.) u potrazi za nimfama bilo je slično u dva područja (11,3% u zapadnoj i 11,4% u istočnoj Norveškoj).

Uzorak obilja potraga za krpeljima

Opasnost od bolesti zavisi i od brojnosti krpelja u potrazi i od nivoa njihove prevalencije patogena, često mjerenih kao broj zaraženih nimfi [13]. Određivanje brojnosti krpelja metodom označavanja teško je jer takvi podaci također odražavaju obrasce aktivnosti krpelja, na što utječe kombinacija fotoperioda i prevladavajućeg vremena [41, 42]. Dakle, aktivnost krpelja varira po godišnjim dobima, godinama i regijama. Uočili smo sveukupno veću brojnost tragajućih nimfi na zapadu (5,78/20 m 2 ), u poređenju sa istokom (1,36/20 m 2 ), što će za sličnu prevalenciju, kao i kod B. burgdorferi (s.l.), dovode do veće opasnosti od bolesti na zapadu Norveške. Ova veća brojnost krpelja u potrazi na zapadu može doprinijeti više od 8,3 puta većoj incidenci Lajmske borelioze na zapadu (12,4 na 100 000) u poređenju sa istokom (1,49 na 100 000) Norveške. Naši vremenski nizovi terenskih podataka bili su prekratki da povežu opasnost od bolesti sa incidencijom godinama, pa smo se za zaključivanje oslanjali na prostorne kontraste. Postojala je izrazita godišnja varijacija u obilju u potrazi za krpeljima u oba regiona, tako da to svakako može doprinijeti objašnjavanju godišnjih varijacija u učestalosti bolesti.

Pronašli smo skoro dvostruko više odraslih jedinki u odnosu na nimfe na istoku u odnosu na zapad (tabela 2). Iako ne možemo objasniti ovaj obrazac sa svojim trenutnim znanjem, on može ukazivati ​​na to da se životni ciklusi i mortalitet razlikuju među regijama. Zapadna obala Norveške je toplija i vlažnija od istočne oblasti, koja ima unutrašnju klimu. Temperatura, a ne vlažnost zraka ograničavali su aktivnosti traženja krpelja duž zapadne obale [42], dok za cijelu sezonu na našem istočnom području istraživanja nije bilo dostupnih studija. Ograničenje našeg istraživanja bio je nedostatak podataka o punoj sezonskoj varijaciji aktivnosti potrage, a periodi uzorkovanja su se također razlikovali, bili su maj na zapadu i uglavnom jun na istoku. Nadalje, također je moguće da je distribucija specifičnih genovrsta B. burgdorferi (s.l.) igraju ulogu, jer mogu uzrokovati različite kliničke simptome [43]. Na kraju, ne možemo zanemariti ulogu razlika u izloženosti ljudi krpeljima između regija [44]. Učestalost krpeljnog encefalitisa u istočnoj Europi bila je povezana s aktivnošću u šumama, što je opet bilo potaknuto društveno-ekonomskim faktorima [45]. U našoj studiji smanjena je učestalost lajmske borelioze s većim brojem naseljenih mjesta unutar jedne općine. Jasno je da bi detaljnije studije o tome kako se ljudi i stoka izlažu krpeljima u istočnoj u odnosu na zapadnu Norvešku bile plodne.

Prostorno promjenjiva prevalencija A. phagocytophilum

Anaplazmoza je veliki problem u mnogim područjima Europe A. phagocytophilum se također smatra široko rasprostranjenim patogenom [6]. Uz zapadnu obalu Norveške, anaplazmoza kod ovaca veliki je problem [46]. Infekcija od A. phagocytophilum uzrokuje smrtnost i smanjuje tjelesni rast janjadi [47]. Izloženost krpeljima često je povezana s ispašom u rano proljeće [48], prije nego što se ovce pošalju na ljetnu ispašu na većoj nadmorskoj visini s manjim brojem krpelja [42]. Često postoje nejasni klinički simptomi s anaplazmozom i bolest se može prijaviti premalo. Ipak, incidencija anaplazmoze kod ovaca bila je visoka u zapadnom regionu, sa oko 10 slučajeva na 10.000 ovaca, dok u istočnom regionu nije bilo zabilježenih slučajeva tokom perioda istraživanja (2006–2015, Tabela 1, Slika 1). Za razliku od ravnomjerne distribucije patogena B. burgdorferi (s.l.) izaziva lajmsku boreliozu, učestalost A. phagocytophilum bio je znatno veći na zapadu, u poređenju sa istokom, Norveške.

Dok su domaćini prijenosa B. burgdorferi (s.l.) je dobro poznat [40, 49], o tome se još raspravlja A. phagocytophilum [17, 50]. Obični jelen se često smatra glavnim prijenosnikom A. phagocytophilum u Norveškoj [51], a rasprostranjenost jelena je uglavnom povezana sa zapadnom obalom Norveške [52] (Dodatni fajl 1: Slika S2). Prevalencija od A. phagocytophilum duž zapadne obale bilo je čak 75% srna [53], a prevalencija A. phagocytophilum kod krpelja je veći u područjima s velikom brojnošću jelena u Norveškoj [54, 55]. Međutim, visoki nivoi prevalencije (76%) pronađeni su i kod srndaća u Francuskoj [56], a srndać i los obilni su domaćini u istočnim dijelovima Norveške (dodatna datoteka 1: slika S2). U skladu s tim, većina anketiranih srndaća je imala A. phagocytophilum infekcija u istočnom regionu (A. Mysterud et al., neobjavljeni podaci). Stoga je iznenađujuće da vidimo tako nisku prevalenciju kod nimfi. Pretpostavljamo da odabir ličinki domaćina može imati ulogu u razini prevalencije patogena u nimfama. Ličinke krpelja dosta su prisutne na jelenima na zapadnoj obali [57], dok nismo pronašli ličinke na srndaću u istočnom području (A. Mysterud i sur., Neobjavljeni podaci). Uzorci srndaća bili su iz ranog proljeća, pa je neizvjesno odražava li to samo kasni početak traženja larvi ili razlike u odabiru domaćina. Stoga su potrebne daljnje studije kako bi se razumjelo može li ovo pružiti, barem dio, moguće objašnjenje za manji udio A. phagocytophilum kod nimfa i rezultirajućom manjom incidencom anaplazmoze u istočnoj u poređenju sa zapadnom Norveškom. Ako se larve hrane uglavnom drugim kralježnjacima sa nižim/br A. phagocytophilum infekcije, bit će malo zaraženih nimfa, pod pretpostavkom da hranjenje nije glavni put prijenosa [36]. Međutim, ako se nimfe hrane srndaćima, onda odrasli krpelji mogu imati veću prevalenciju A. phagocytophilum, i donekle je to bio obrazac koji smo pronašli (Tabela 1).

Stoka često dobiva mnogo više uboda krpelja nego čovjek, pa čak i niska prevalencija može predstavljati visok rizik od infekcije. Za A. phagocytophilum, sojevi se razlikuju po svojoj patogenosti za goveda [58]. Predložena su četiri glavna cirkulirajuća soja A. phagocytophilum u Europi sa rezervoarima: (i) srna i stoke (ii) srndaća (iii) glodavaca i (iv) ptica [17, 50].Budući da srna dijeli isti soj kao i stoka, te da jelena u velikoj mjeri nema na istočnom području istraživanja (dodatna datoteka 1: slika S2), to može dodatno objasniti odsustvo anaplazmoze u ovom području. Međutim, i broj A. phagocytophilum sojevi, kao i patogenost sojeva za stoku u Norveškoj se i dalje smatraju neizvjesnim [51].


Pretpostavke i ograničenja

Korištenje korelacije i regresije ovisi o nekim temeljnim pretpostavkama. Pretpostavlja se da su opažanja neovisna. Za korelaciju obje varijable bi trebale biti slučajne, ali za regresiju samo varijabla odgovora y mora biti slučajna. Prilikom provođenja testova hipoteza ili izračunavanja intervala pouzdanosti za parametre regresije, varijabla odgovora treba da ima normalnu distribuciju i varijabilnost y treba da bude ista za svaku vrijednost prediktorske varijable. Iste pretpostavke su potrebne pri testiranju nulte hipoteze da je korelacija 0, ali da bi se interpretirali intervali povjerenja za koeficijent korelacije, obje varijable moraju biti normalno distribuirane. I korelacija i regresija pretpostavljaju da je odnos između dvije varijable linearan.

Raspršeni dijagram podataka pruža početnu provjeru pretpostavki za regresiju. Pretpostavke se mogu detaljnije procijeniti gledanjem dijagrama reziduala [4,7]. Uobičajeno, zaostaci se iscrtavaju prema postavljenim vrijednostima. Ako je odnos linearan i varijabilnost konstantna, tada bi ostatci trebali biti ravnomjerno raspoređeni oko 0 duž raspona prilagođenih vrijednosti (Sl. ​ (Sl. 11 11).

(a) Dijagram raspršenja y prema x sugerira da je odnos nelinearan. (b) Grafikon reziduala u odnosu na ugrađene vrijednosti u panelu a zakrivljenost odnosa je jasnije prikazana. (c) Raspršeni dijagram y u odnosu na x ukazuje na to da se varijabilnost u y povećava sa x. (d) Grafikon zaostataka prema postavljenim vrijednostima za ploču c sve veća varijabilnost y sa x prikazana je jasnije.

Osim toga, može se stvoriti normalna ploha ostataka. Ovo je dijagram reziduala u odnosu na vrijednosti za koje bi se očekivalo da bi došle da dolaze iz standardne normalne distribucije (normalne ocjene). Ako su zaostaci normalno raspoređeni, tada će ova ploha prikazati ravnu liniju. (Standardna normalna distribucija je normalna distribucija sa srednjom vrijednosti = 0 i standardnom devijacijom = 1.) Normalni grafikoni su obično dostupni u statističkim paketima.

Slike ​ Slike 12 12 i ​ i 13 13 prikazuju rezidualne dijagrame za podatke Aɮ. Dijagram prilagođenih vrijednosti naspram reziduala sugerira da su pretpostavke linearnosti i konstantne varijanse zadovoljene. Normalna shema sugerira da je distribucija ostataka normalna.

Nacrt ostataka prema postavljenim vrijednostima za podatke jedinice za slučaj nesreće i hitne slučajeve.

Normalni prikaz ostataka za podatke o nesreći i hitnoj jedinici.

Kada koristite jednadžbu regresije za predviđanje, greške u predviđanju ne moraju biti samo slučajne, već mogu biti posljedica i neadekvatnosti u modelu. Posebno je ekstrapolacija izvan opsega podataka vrlo rizična.

Fenomen kojeg treba biti svjestan koji se može pojaviti kod ponovljenih mjerenja na pojedincima je regresija na srednju vrijednost. Na primjer, ako se ponavljaju mjerenja krvnog tlaka, tada će pacijenti s vrijednostima većim od prosjeka pri prvom čitanju imati niža očitanja pri drugom mjerenju. Stoga će razlika između njihovog drugog i prvog mjerenja biti negativna. Obrnuto vrijedi za pacijente s očitanjima nižim od prosjeka pri prvom mjerenju, što rezultira očiglednim porastom krvnog tlaka. To bi moglo dovesti do pogrešnih tumačenja, na primjer da može postojati očigledna negativna korelacija između promjene krvnog tlaka i početnog krvnog tlaka.