Înainte
de finalizarea Proiectului Genomul Uman (PGU) se cunoşteau puţine repere
privind arhitectura genomului uman.
• Se
ştia că cele 3,2 miliarde de perechi de nucleotide din structura ADN nuclear
sunt „fragmentate“ în 24 de tipuri de
molecule de ADN care, prin asociere cu proteine histonice, formează cromozomii: 22 de tipuri distincte de autozomi, identici la ambele sexe, şi
doi cromozomi sexuali, X şi Y.
• Genomul
uman era considerat a fi heterogen, alcătuit din mai multe clase de ADN, diferite prin repetiţia secvenţelor nucleotidice: ADN
nerepetitiv, format din secvenţe unice per genom sau într-un număr
foarte mic de exemplare, şi ADN repetitiv, reprezentat de secvenţe
scurte, repetate în tandem, de sute sau mii de ori. Aceste secvenţe alcătuiesc
fie „blocuri mari“ de heterocromatină constitutivă, localizate în anumite
regiuni cromozomiale (centromer, telomere ş.a.), fie „miniblocuri“ (minisateliţi şi microsateliţi) dispersate în toţi cromozomii şi având o localizare
variabilă de la o persoană la alta. Prin determinarea modelului individual al
dispoziţiei „secvenţelor repetitive
variabile“ se realizează un profil
personal specific, ce constituie amprenta
genetică a unui individ, folosită în medicina legală pentru identificarea
persoanelor.
• ADN
nuclear se dovedise a fi divizat în ADN genic şi ADN extra(inter)genic. ADN genic alcătuieşte, în marea sa
majoritate, genele (circa 80.000) ce codifică proteine; un număr mic de gene
codifică însă molecule de ARN. Genele sunt dispersate pe cromozomi şi au de
regulă o structură discontinuă, modulară, fiind alcătuite dintr-o
regiune centrală (formată dintr-o alternanţă de secvenţe codante sau exoni1 şi secvenţe necodante sau introni), flancată
de două regiuni reglatoare.
• Genele
sunt separate prin lungi segmente de ADN
extra(inter)genic, format în cea mai mare parte din ADN repetitiv. Rolul
secvenţelor de ADN extragenic era neclar şi mulţi cercetători le-au catalogat
ca fiind „elemente fosile“, martori ai evoluţiei, fără nicio funcţie, numindu-l
„ADN deşeu sau inutil“.
Secvenţierea
genomului uman a adus numeroase informaţii noi privind structura şi arhitectura
sa, unele fiind absolut surprinzătoare prin ineditul lor. Am selectat aceste
date şi le-am grupat în patru mari probleme, pe care le voi prezenta succint în
acest articol, urmând a le discuta ulterior cu mai multe detalii, subliniind
implicaţiile lor pentru medicina actuală.
1.
Prima mare surpriză a fost reprezentată de faptul că secvenţa genomului uman este identică la 99,6% din oameni. Gradul înalt
de similitudine între genomul a două persoane diferite „ne uneşte ca specie“ şi
spulberă definitiv ideea raselor umane. În aceste condiţii, ne putem întreba: ce deosebeşte un om de altul, făcându-ne pe
fiecare dintre noi un unicat biologic? Răspunsul pare simplu: diferenţa de
0,4% din genom, combinată cu efectele mediului în care ne-am născut şi trăim.
Variaţiile individuale („personalizate“) ale genomului diploid din celulele
somatice – alcătuit din circa şase miliarde de perechi de baze (pb) – reprezintă
aproximativ 26 de milioane de pb şi sunt diferenţe calitative (de exemplu,
polimorfismele unui singur nucleotid) sau cantitative (de exemplu, inserţii/adiţii
şi deleţii/absenţe de nucleotide sau rearanjări/variaţii ale unor segmente
mari). Aceste variaţii au o contribuţie semnificativă la determinarea riscului
diferit la agresiunile mediului şi la susceptibilitatea individuală diferită
pentru bolile comune ale adultului, dar şi la eficienţa unor tratamente,
deschizând calea farmacogenomicii şi
a medicinii personalizate.
2. Numărul de gene ce codifică proteine este surprinzător de mic (circa 21.000 de gene
după Ensembl, versiunea 65, decembrie
2011) comparativ cu mărimea genomului şi complexitatea organismului uman. Multe
organisme inferioare au un număr apropiat de gene, iar altele (unele plante)
chiar mai mare. Se pune firesc întrebarea: ce
determină atunci diferenţa dintre om şi alte specii? Răspunsurile posibile
ar fi: poziţia genelor în genom şi structura lor modulară; modul în care
„lucrează“ genele (mai intens, mai complex), capabile să producă mai multe
proteine (circa 100.000). „Istoria omului
este de fapt o arhitectură nouă realizată cu piese vechi“ (David Baltimore,
2001). La aceasta se adaugă mecanismele subtile de reglare a sintezei proteinelor
şi interacţiunile complexe dintre
gene şi proteine, precum şi faptul că multe din genele umane sunt implicate în
dezvoltarea şi funcţia creierului. Cert este că înţelegerea complexităţii
enorme a fiinţelor umane se confruntă cu enigme a căror dezlegare va fi posibilă
în viitor.
Acţiunile
de identificare şi analiză a genelor în PGU au evidenţiat şi alte surprize.
• Distribuţia
genelor în cromozomi este neuniformă, atât între cromozomi diferiţi, cât şi
în interiorul acelaşi cromozom, între regiuni diferite. Unii cromozomi sunt mai
„săraci“ în gene (de exemplu: 13, 18, X şi Y), iar alţii mai „bogaţi“ (de
exemplu, 16, 19, 22, 17); unele regiuni intracromozomiale (numite „urbane“) au o densitate genică mare (de
exemplu, regiunile subtelomerice2), spre deosebire de regiunile „deşertice“, aproape fără gene, numai cu
ADN necodant (astfel de regiuni alcătuiesc circa 20% din genom). Semnificaţia acestei densităţi genice
„inegale“ nu este încă elucidată.
• Mărimea
şi organizarea genelor pentru proteine prezintă variaţii considerabile.
Unele gene sunt foarte mici, sub 10 kilobaze (genele pentru a-interferon,
insulină, b-globină), iar altele sunt foarte mari (genele pentru
imunoglobuline, distrofină – cea mai mare genă cunoscută, 2.400 de kilobaze). Secvenţele de reglare a expresiei
genelor sunt mult mai variate şi mai complexe la om decât la organismele
inferioare şi uneori se pot găsi la distanţă de secvenţa genică transcrisă.
• S-a
descoperit o remarcabilă „plasticitate“
a genomului uman, demonstrată prin studiul „naşterii
şi morţii“ genelor umane. Naşterea
genelor se face prin duplicaţia unor gene preexistente. Cele mai recente
duplicaţii (produse în ultimele trei-patru milioane de ani) interesează circa
1.200 de gene, majoritatea în genele receptorilor olfactivi, genele implicate în
imunitate sau reproducere. Moartea
genelor se produce prin mutaţii inactivatoare, care transformă genele în pseudogene nefuncţionale.
3. Creşterea extraordinară a numărului de gene
ARN – secvenţe de ADN transcrise în diferite molecule funcţionale de ARN necodant (ARNnc) care nu sunt
translate în proteine. Paradoxal, ARNnc reprezintă 4/5 din transcriptom
(totalitatea secvenţelor ARN transcrise din ADN), fiind reprezentat de ARN cu
„funcţii clasice“ în sinteza de proteine (ARNr, ARNt ş.a.), la care se adaugă
alte „specii noi“, descoperite recent – unele „scurte“ (microARN – ARNmi, ARN
interferent mic – ARNsi etc. – sub
100 de nucleotide), altele „lungi“ (de exemplu, ARN lung intergenic necodant – ARNlinc, cu peste 200 de nucleotide)
– care au funcţii reglatoare importante (stabilind când şi unde se exprimă
genele ce codifică proteine).
Genele
ARN sunt foarte probabil la fel de numeroase ca genele pentru proteine (în
prezent se cunosc deja peste 12.500). Rolul biologic şi „consecinţele medicale“
ale acestui veritabil ARNom rămân a
fi elucidate. Cercetări foarte recente au evidenţiat variaţii importante între
ARNnc la persoane diferite; deşi avem
acelaşi set de gene ce codifică proteine, reglarea lor prin ARNnc se poate face
diferit la persoane diferite. Există deja argumente că mutaţiile sau polimorfismele ARNnc cu funcţii de reglare sunt amplu
implicate în etiopatogenia unor anomalii congenitale şi a diferitelor boli
comune (cardiovasculare, neurodegenerative, cancer).
Viziunea genomului în care informaţia genetică
şi programul genetic sunt centrate pe proteine pare greşită; majoritatea
informaţiei genetice este încorporată în ARN necodant şi dogma centrală a
geneticii (ADN›ARN›proteine) „pare imperfectă“. A sosit, probabil, timpul să
vedem genomul uman mai mult ca o „maşină
de ARN“ decât ca o „maşină de
proteine“.
4. ADN extragenic are probabil funcţii
importante dar necunoscute. Circa 98% din genomul uman este reprezentat de
secvenţele ADN care nu codifică proteine, fiind în majoritatea sa ADN extragenic sau intergenic, constituit în special de diferitele clase de ADN
repetitiv (ce reprezintă peste 55% din genom) şi de duplicaţiile unor segmente
mici de ADN (5,5% din genom). Unei mari părţi din acest ADN necodant nu i se atribuiau funcţii biologice şi, de aceea, a
fost numit metaforic, cândva, ADN „deşeu“
sau „inutil“. Cercetări recente au arătat
– surprinzător – că majoritatea acestor
secvenţe de ADN sunt transcrise în anumite perioade sau circumstanţe din
cursul vieţii; unele au o funcţie identificată, inclusiv în reglarea sintezei
proteinelor, altele au o funcţie încă nedeterminată (fiind puternic conservate în
evoluţia speciilor) şi altele au avut funcţii în trecut sau, pur şi simplu, nu
au funcţii. Este important de subliniat că unele elemente din structura ADN
intergenic sunt implicate în producerea unor remanieri genice sau cromozomiale,
cauze ale unei categorii noi de afecţiuni numite boli genomice, dar şi a vulnerabilităţii sau rezistenţei la bolile
comune, complexe, ale adultului. Despre toate aceste vom discuta într-un
articol viitor.