Det er et stort problem med kjernen til det menneskelige genomprosjektet

The Human Genome - Genetics Shambles (Robin Ince, Adam Rutherford, Sarah Teichmann & Gil McVean)

The Human Genome - Genetics Shambles (Robin Ince, Adam Rutherford, Sarah Teichmann & Gil McVean)

Innholdsfortegnelse:

Anonim

Human Genome Project, som begynte på 1990-tallet, var Homo sapiens 'Vellykket forsøk på å kartlegge hele DNA-spesifikasjonen vår. Den produserte det menneskelige referansegenomet, en finpolert samling av humant DNA som er avgjørende for genetikkforskning og genetisk testingstjenester rundt om i verden. Integrert som det har vært for vitenskapssamfunnet, har to forskere ved Johns Hopkins University oppdaget at referansegenomet mangler et stykke eller to - vel, 296.485.284 basepar DNA, for å være eksakt.

Referansegenomet er et viktig kart over menneskelig genetisk materiale som brukes som grunnlag for sammenligning. Når vi sekvenserer vårt eget DNA for innsikt i helse, familiehistorie og fremtidig sykdomsrisiko, hugger vi opp sekvensen i mange små biter og sammenligner strekker av den til referansegruppen, ser etter områder der vi er forskjellige. Det grunnleggende problemet med dette skriver forskerne i et nylig papir i Naturgenetikk, er at referansegenometet i stor grad er basert på en enkelt person. Tatt i betraktning de myriade genetiske forskjellene blant de 7,7 milliarder menneskene i live i dag, er det åpenbart ikke ideelt.

Professor i informatikk og biostatistikk Steven Salzberg, Ph.D., og Rachel Sherman, Ph.D. kandidat, gjør saken at dette enkle referansegenomet ikke fanger mangfoldet av human genetikk. Noen befolkninger, legger de til, varierer for mye fra dette referansegenomet. For å gjøre sitt tilfelle refererer de til genomene av 910 individer fra tyve forskjellige land, alle panafrikanske avstamninger.

I DNA fra disse individer fant teamet 300 millioner biter av DNA-felles som ikke eksisterer i vårt "referanse" -genom. Hvis vi ser bort fra dette mye materialet, sier Salzberg, savner vi uunngåelig nøkkelinnblikk i helse og historie for bestemte populasjoner. De også er menneskelige, så burde de ikke bli representert i det "menneskelige" referansegenomet?

"Disse områdene er i hovedsak usynlige for genetikksamfunnet til vi har et referansegenom som inneholder disse regionene," sier Salzberg. Omvendt.

Problemet med referansegenomenet.

Gjennom årene har vi kontinuerlig arbeidet med referansegenomet. Men nyere analyse indikerer det nesten sytti prosent av materialet ble hentet fra en enkelt afrikansk-amerikansk person, som bare er referert til som RPCI-11, forklarer Salzburg.

Det betyr at når forskere utfører genetisk analyse for å identifisere forskjeller mellom ulike befolkninger fra hele verden, sammenligner de mesteparten av de genene til det genetiske materialet, for det meste, en person. Dette fører oss til å ofte ignorere materiale som kan være for forskjellig fra denne referansen, sier Sherman. Hun kaller dem "manglende stykker."

"Når du retter opp ting, kommer det til å være stykker som ikke stemmer helt, fordi de er for forskjellige for å matche alt fra referansegenomet." Sherman sier. "Så ignorerer du alle de tingene som ikke stemmer opp som ikke veldig relevante eller egentlig ikke verdt å se på, når det kanskje er disse, er de brikkene som er mest interessante fordi de er mest forskjellig fra referansegenomet."

I studien tok Sherman og Salzberg store biter av dette "forskjellige" materialet (ca. 1000 basepar lange) og forsøkte å avgjøre om de bare representerte tilfeldige strenger av sekvenseringsfeil - eller holdt egentlig nyttig informasjon om uutforsket human DNA.

Teamet kom til den konklusjonen at dette "nye" DNA er av høy nok kvalitet for å garantere et andre pass, selv om de ikke vet hva dens betydning for menneskekroppen kan være nettopp ennå.

Hva er konsekvensene?

Så langt, sier Sherman, vi vet egentlig ikke hva vi mangler ved å ignorere DNA som ikke er representert i referansegenomet. Men hvem vet hva vi kan finne der hvis vi tar en titt?

Salzberg antyder at vi forestiller oss en fiktiv befolkning som har et ekstra kromosom - 24 i stedet for de vanlige 23 i hver celle. Ingenting i det ekstra kromosomet fra denne populasjonen vil følge opp med referansegenomet. Kanskje sier hun, et sted på det skjulte kromosomet, er grunnen til at den fiktive befolkningen har en tendens til å utvikle en viss sykdom - og hvorfor resten av verden ikke gjør det. Men fordi vi ikke har riktig referanse til å sammenligne det, ville vi aldri vite at det er der.

Originalannonsering som brakte inn donorene for Human Genome Project (Buffalo News, 3/23/1997), h / t Pieter de Jong, som la annonsen pic.twitter.com/gNB7mMv3Yu

- Jay Shendure (@JShendure) 28. oktober 2017

"Hvis en gang imellom var det mutasjoner i det kromosomet som forårsaket problemer, ville du aldri kunne studere dem," sier Salzberg. "Du ville aldri kunne observere dem hvis du bare stolte på dette referansegruppen."

La oss være klare: Denne undersøkelsen gir ikke bevis for noen uoppdagede kromosomer. Men det tyder på at vi sannsynligvis mangler mye når vi bruker et enkelt referansegenom fra noen som heter RPCI-11 som grunnlag for alle våre analyser på DNA av hele vår art.

Hvordan kan vi fikse det?

I stedet for å streve etter et enkelt universelt referansegenom, argumenterer laget, vi burde ha en gjeng av referanse genomene - kanskje en for hver populasjon av interesse.

"Det som vi her forholder oss til med dette funn, er at vi virkelig trenger å bygge referansegenomene for hver befolkning," sier Sherman. "Hvis det mangler så mye DNA fra referansen i denne befolkningen, må modellen endres."

Noen land har tatt det på seg selv for i det minste å forsøke å lage sine egne referansegener. Danmark samler for eksempel genetisk materiale fra 150 danskere i et forsøk på å lage et sant "dansk" referansegenom. En 2016 papir i Natur beskriver et forsøk på å kompilere en referanse for koreanske individer, selv om det også bare beskriver forskning utført på en enkelt person. Men andre prosjekter, som 1000 Genomes Project, prøver også å få denne prosessen påbegynt, men det er mye arbeid å lage et referansemateriale som polert som den nåværende versjonen, kjent som GRCh38.

"Du må gjøre mer enn bare gå og sekvensere en annen person fra en annen befolkning for å lage et referansegenom," tilføyer han. "Du må gjøre litt mer."

Det er ikke at forskere ikke er klar over at vi trenger flere referansegener. Salzberg håper bare at det ville være flere av dem nå, og at de i det minste ville bli utbredt som standard referansegener. Papiret beklager at ingen av disse forsøkene har oppnådd samme status og klage som GRCh38 - men det er målet for det danske prosjektet.

Fremover tar Sherman og Salzberg på seg selv for å få dette prosjektet påbegynt, ved å bygge flere flere referansegenomene, som de håper å frigjøre om ett til to år. De ønsker å begynne å lage et bibliotek med referansegener for å hjelpe folk å få så mye innblikk i deres genetiske materiale, uansett hvor "annerledes" det er.

"Det vi virkelig trenger å ha er hundrevis av referansegener," legger han til. "Det kommer til å skje en dag."