15. feb. 2011

Človekov genom 10 let kasneje

Danes mineva točno 10 let od objave zaporedja človekovega genoma v reviji Nature, jutri pa od objave v reviji Science. Čas za kritičen pogled na takratna pričakovanja, povezana s tem dosežkom, in na današnjo realnost, ko se je navdušenje v veliki meri poleglo.

Verjetno vsi soglašamo, da je šlo za velik tehnični dosežek. Mednarodni konzorcij raziskovalcev se je projekta lotil v času, ko tehnologija tako zahtevnega dela v razumnem času sploh še ni omogočala, konkurenčna skupina, zbrana okrog Craiga Venterja pa je zbrala takrat najnaprednejše aparature in iz več kot 27 milijonov koščkov sestavila skoraj 3 miljarde nukleotidov v za takrat neverjetno kratkem času (po njihovi trditvi v 9 mesecih). Leto 2000 je bilo gotovo leto velikega tekmovanja v znanosti, kakršnih je bilo v zgodovini ved o življenju sicer še nekaj (na primer določitev genetskega koda), a ne veliko.

Nobena od znanstvenih revij seveda ni mogla objaviti celotnega zaporedja nukleotidov, saj bi za to potrebovali celo skladovnico knjig. Zaporedja, ki jih je določal konzorcij 20 raziskovalnih skupin z vsega sveta, so sproti objavljali v javno dostopnih bazah podatkov, tako da so bila na voljo tudi skupini iz podjetja Celera in nobenega dvoma ni, da so si s temi podatki lahko precej pomagali pri svojem delu. Objavili pa so lahko nekaj osnovnih podatkov o velikosti genoma (to je bilo večinoma jasno že par let prej) in njegovih značilnostih. Jasno so pokazali, da samo dober odstotek genoma zapisuje za proteine in da je genov za proteine precej manj kot so najprej predvidevali.

Do leta 2001 so bili znani genomi samo treh večceličarjev: dveh živali in ene rastline - črva Caenorhabditis elegans, vinske mušice in navadnega repnjakovca. Vsi trije genomi so podobne velikosti in so 20-30 -krat manjši od genoma človeka. V tej luči je verjetno dosežek, kakršnega je predstavljala določitev zaporedja človekovega genoma, lažje razumljiv. S tem, ko so razvili postopke, orodja in aparature, ki so bili primerni za analizo tako zahtevnih genomov, je bil začetek prejšnjega desetletja čas določitve številnih zanimivih genomov, ki so omogočili primerjavo med bolj ali manj sorodnimi genomi in s tem molekularni vpogled v evolucijo na najbolj osnovni ravni. Medtem, ko so prej poskušali določiti filogentska drevesa na osnovi zaporedij posameznih proteinov ali genov, je zdaj bilo mogoče primerjati celotne genome. Primerjalni genomiki še dolgo ne bo zmanjkalo dela.

Danes poznamo nukleotidna zaporedja več kot 2500 virusov (nihče ne ve, koliko jih v naravi v resnici obstaja, zelo verjetno pa bistveno več kot smo mislili pred 10 leti), skoraj 1500 bakterij in arhej ter 41 evkariontov (ob tem pa jih je še več kot 1000 v različnih fazah določanja zaporedja). Med večceličarji je težko reči, kateri so najpomembnejši ali najbolj zanimivi. Gotovo so zanimivi genomi človeku podobnih opic, pa tudi drugih primatov, saj na njihovi osnovi lahko poskušamo razumeti, kaj nas 'dela ljudi'. Za razumevanje evolucije so zanimivi tudi organizmi iz drugih skupin vretenčarjev: ptice (kokoš), plazilci (legvan), ribe (zebrica), pa tudi nekateri maločlenarji kot predhodniki vretenčarjev (morski ježki). Za tiste, ki jih zanimajo predvsem rastline, so tu genomi riža, topola, vinske trte, paradižnika, koruze...

Da bi lahko rekli, da je neko genomsko zaporedje v celoti določeno, je potrebnega veliko natančnega iskanja tistih zadnjih kosov genoma, ki so najbolj zapleteni za določanje, saj gre za 'izgubljene klone' ali za tako podobna ponavljajoča se zaporedja, da je težko zagotovo reči, ali gre za nek nov košček, ki še ni bil uvrščen v genom, ali za kos, ki so ga že upoštevali. Med živalmi so v resnici kot dokončno določenih zapisanih samo šest genomov: mišji, prašičji, šimpanzov, dveh vrst vinskih mušic in črva cenorabditisa. Veliko genomov, ki so oglaševani kot 'znani', je v kategoriji genomov, ki jih še sestavljajo, vseeno pa je na voljo dovolj podatkov, da je mogoče izvesti primerjalne analize.

Na približno pol poti od objave zaporedja človekovega genoma do danes so začeli intenzivno razvijati alternativne metode za določanje nukleotidnih zaporedij, ki so dosti bolj zmogljive od tiste, ki so jo uporabili pred desetletjem. Njihova uporabnost pa je v sedanji obliki predvsem pri določanju zapredij, ki so precej podobna že znanim zaporedjem, saj lahko v posamezni reakciji določijo le majhno število nukleotidov, zato je zelo težko pravilno uvrstiti to kratko zaporedje v celoten genom. Verjetno bodo metode še izboljšali, hkrati pa še pocenili, saj je cilj razvijalcev opreme omogočiti določanje genomskih zaporedij ljudi za ceno nižjo od 1000 dolarjev (projekt Človekov genom je pred desetletjem stal okrog 800 milijonov dolarjev). Lani poleti naj bi bila cena še okrog 20.000 dolarjev, a tehnologijo neprestano posodabljajo in morda je samo vprašanje nekaj let, kdaj se bodo spustili pod magično mejo 1000 USD za celoten genom.

Po prvih objavah zaporedja človekovega genoma, pri katerih so izhajali iz različnih izhodiščnih vzorcev, so določili tudi zaporedji 'čistih vzorcev', torej znanih posameznikov. Vsi ti podatki kažejo, da so razlike med posamezniki okrog desetinke odstotka genoma. Kmalu je postalo jasno, da je mogoče analizirati le mesta, ki so različna, saj se pogosto pojavljajo na istih točkah v genomu. Govorimo o polimorfizmu posameznih nukleotidov (SNP). Z biočipi je ta mesta mogoče analizirati precej hitreje in ceneje. Tovrstne analize omogočajo raziskave razlik med rasami, med zdravimi in bolniki z določenimi boleznimi itd.

Kljub temu, da so razlike med posamezniki na ravni nukleotidnih zaporedij sorazmerno majhne, so nekatere raziskave pokazale, da pa se lahko znotraj genoma (ob ohranjenih lokalnih zaporedjih) posamezni segmenti kromosoma lahko premaknejo ali pa se pojavljajo v različnem številu kopij in te razlike so lahko tudi precej obsežne. Tudi ta polimorfizem je povezan z nekaterimi boleznimi, pravega pomena pa verjetno še ne razumemo.

Na osnovi zaporedja človekovega genoma številnih razlik med ljudmi ni mogoče razložiti. Vse bolj jasno postaja, da je razen zaporedja samega pomemben tudi vzorec metiliranih baz v genomu, saj je (tudi) od tega odvisno, kateri geni bodo aktivni in kateri ne. S tem se ukvarja posebno področje, imenovano epigenetika.

Vrnimo se k pričakovanjem, ki so jih strokovnjaki in še bolj nestrokovnjaki povezovali z določitvijo zaporedja človekovega genoma. Ta so bila nedvomno visoka. Nenazadnje na to kaže gibanje vrednosti delnic podjetja Celera - ta je izrazito narasla v času tekme in objave zaporedja, nato pa je sorazmerno hitro upadla. Marsikdo je razočaran, da nova zaporedja, ki so obetala razkritje novih tarč za zdravila, niso prinesla toliko novih zdravil kot bi si želeli. Samo poznavanje zaporedja brez znane funkcije in interakcij v organizmu ne zadošča za racionalno načrtovanje novih učinkovin.

Reviji Nature in Science sta ob 10. obletnici objavili vrsto esejev na temo določitve zaporedja človekovega genoma, še nekateri pa bodo sledili ta teden. Gotovo zanimivo branje, če imate čas (in dostop do obeh revij).

TVS1: Večerni gost 20.2.

To nedeljo (20.2.) ob 21.45 bo na TV Slovenija 1 na sporedu oddaja Večerni gost. V 50-minutnem pogovoru, ki ga bo vodil Sandi Čolnik, se bo predstavil biokemik prof. dr. Roman Jerala, vodja Laboratorija za biotehnologijo na Kemijskem inštitutu in profesor za bioinformatiko na Fakulteti za kemijo in kemijsko tehnologijo ljubljanske univerze. Gotovo bo povedal tudi marsikaj zanimivega o mentorskem delu s študenti, ki se tako uspešno udeležujejo tekmovanj iz sintezne biologije.

3. feb. 2011

Reprogramirane izvorne celice: ne čisto reprogramirane

Ko se je že zdelo, da bodo etične zadrege in razprave zaradi uporabe embrionalnih izvornih celic končno mimo, se je stvar ponovno nekoliko zapletla. Teoretično je sicer mogoče celice, ki so bile diferencirane, ponovno vrniti v stanje, podobno kot je v zgodnjem zarodku: da so se namreč celice ponovno sposobne razviti v širok spekter različnih celic (pluripotentnost). Ključne izsledke, ki so omogočili razvoj tehnike reprogramiranja, so objavili v letih 2007-2009 (prim. zapis Od iPSa do piPSa), lani pa je bilo na tem področju nekaj zatišja. Na nov način dobljene celice je bilo treba natančneje preučiti - in rezultati so zdaj tu.

V reviji Nature so včeraj objavili, da so odkrili mesta v genomu induciranih pluripotentnih celic (iPS), ki kljub postopku reprogramiranja ohranijo metilacijski vzorec celice, ki so jo reprogramirali. Celica torej ne 'pozabi' povsem, kaj je bila, preden so jo z biokemijskimi postopki vrnili v nediferencirano stanje. Sicer ne gre za prvo resno analizo iPS, je pa prva na človeških celicah, pri kateri so zelo sistematično primerjali vzorec metiliranih baz v DNA somatskih, embrionalnih izvornih (ES) in induciranih pluripotentnih celic ter enakih celic, ki so jih ponovno diferencirali. Metilacijski vzorec na celotnem genomu imenujejo kar metilom, preverili pa so ga pri petih celičnih linijah iPS celic. Ugotovili so, da je pri iPS celicah raven reprogramiranja dokaj različna in da imajo take celice 'somatski spomin' - to pomeni, da se 'spomnijo', kako so bile metilirane, ko so bile še diferencirane. Območja, ki obdržijo nekdanjo metilacijo, so lahko dolga okrog milijona baznih parov, skoncentrirana pa so na mestih v bližini centromerov in telomerov. Čeprav je bil v splošnem metilacijski vzorec embrionalnih in iPS celic precej podoben, so našli skoraj 1200 področij z razlikami, najobsežnejše pa so bile na 22 področjih, ki so jih imenovali žarišča (hotspots) in kjer je za ES značilna metilacija sploh manjkala.

Zakaj je metilacijski vzorec tako pomemben? Metilacija lahko vpliva na raven izražanja genov, torej kako pogosto se bo nek gen prepisoval v RNA. Bolj metilirana DNA se bolj redko prepiše, manj RNA pa pomeni manj proteina. na DNA se metilirajo praktično samo baze C, ki jim sledijo baze G, samo pri embrionalnih izvornih celicah pa so našli metilirane tudi baze C, ki jim sledi katerakoli druga baza. Analize metilacijskih vzorcev DNA predstavljajo večino raziskav na področju epigenetike, na ravni genoma pa govorimo o epigenomiki.

Čeprav morda večina bere nova spoznanja o razlikah med iPS in ES celicami kot napoved slabih časov za raziskave, usmerjene k regenerativni medicini, pa mislim, da ni tako črno, kot se zdi. Čeprav so epigenetske razlike med celicami zdaj razkrite, to ne pomeni, da iPS celice niso uporabne, ali pa vsaj da zaradi delno ohranjene metilacije niso bistveno manj uporabne kot ES celice. Razen tega bo mogoče zdaj, ko vemo, kaj je treba preverjati, morda možno razviti postopke, ki bodo metilacijski vzorec bolj, če že ne v celoti, približali tistemu, ki je značilen za embrionalne izvorne celice.

O rezultatih zadnje raziskave pišejo tudi na spletni strani revije The Scientist, odkoder sem povzel nekatere podatke.