jeudi 20 février 2014

Le génome : le livre de recettes d'un organisme, 3ième partie : les gènes

Troisième partie des explications sur le génome consacrée aux gènes, donc. Billet peu plaisant car là où il y a des gènes, il n'y a pas de plaisir.

*Tousse*

Bref.

Donc les gènes. On a vu précédemment de quoi était constitué un génome, ce grand livre de recette d'un organisme : les lettres fondamentales et le papier. Tout ça, c'est bien joli mais cela ne nous dit pas comment la faire cette blanquette de veau. En d'autres termes : comment est codifiée dans un génome l'information servant à la fabrication et la maintenance d'un organisme ?

Tout comme un livre de recette se décompose en plusieurs recettes individuelles, un génome se décompose en plusieurs gènes individuels qui se trouvent à différents endroits du génome.

Des gènes dans un génome...

Toujours tout comme le livre de recette (je vais user et user de cette métaphore à vous en faire devenir obèse), une recette va contenir l'information pour un plat en particulier, coder pour un plat pourrait-on dire, un gène va coder pour quelque chose, à savoir une protéine (ça peut être autre chose, mais je ne vais pas en parler aujourd'hui).

... qui codent pour des protéines.

Avant de voir comment cette information est encodée, voyons comment cela fonctionne.

Vous vous souvenez de la cellule et du fait que le génome se trouvait dans le noyau ?

une cellule

Et bien les protéines et toute la machinerie qui sert à faire fonctionner une cellule se trouvent dans le cytoplasme. Donc il faut faire transiter l'information génétique du noyau au cytoplasme.
De la même manière, le livre de recette de votre grand-mère, vieux, fragile et précieux, vous n'allez pas le sortir du placard et l'utiliser dans votre cuisine à la merci de toutes les tâches d’œuf, de sauce et d'huile possible. Non, vous allez le laisser dans le placard mais faire des photocopies des recettes qui vous intéressent (différentes selon les envies, les saisons et les invités) et travailler sur ces photocopies.
Ici le principe est rigoureusement identique. Le génome est fragile et important, donc la cellule va photocopier la séquence du gène dont elle a besoin, transférer la copie du noyau au cytoplasme, cette copie va être décodée pour fabriquer une protéine.

La photocopie est faite non pas d'ADN mais d'ARN (Acide RiboNucléique). Vu qu'il existe plusieurs types d'ARN, celui-là on va l'appeler ARNm pour ARN messager.
Schématiquement, ça donne ça pour le livre de recettes.

Comment cuisiner sans ruiner son livre de recette préféré...

1) photocopier la recette d’intérêt, 2) transférer la photocopie dans la cuisine, 3) utiliser les infirmations de la recette pour cuisiner le plat et 4) se régaler.
Ça va donner ça pour les gènes :

Comment produire une protéine...

1) copier la séquence du gène dans l'ARN messager, 2) transférer cet ARN dans le cytoplasme, 3) utiliser l'information de cet ARN pour fabriquer une protéine et 4), faire fonctionner toute la machine !

Maintenant un petit retour sur cet ARN messager, et plus particulièrement sur l'ARN en lui-même. Il est un peut différent de l'ADN, déjà pour la structure. Vous vous rappelez que la colonne vertébrale d'un brin d'ADN est le sucre (le désoxy-ribose dans ce cas) et bien c'est le même principe pour l'ARN sauf que le sucre est différent, c'est du ribose "normal" (d'où le nom d'ARN). Ensuite les bases sont différentes : les thymines ("T") sont remplacées par des uraciles ("U") (sans rentrer dans des détails qui vont être un peu ennuyeux, la structure chimique est là aussi un poil différente entre une thymine et une uracile). À la séquence d'ADN ATGCATGC correspondra la séquence d'ARN AUGCAUGC. Enfin, alors que l'ADN est double brin (deux brins en sens opposé), l'ARN est simple brin, lui (pourquoi faire compliqué). Sinon tout reste identique, y compris l'orientation du brin dans le sens 5' 3'.

Un autre truc. L'image de la photocopie que je manie à l’excès n'est pas superflue, elle est même fidèle à la réalité. Vous vous souvenez je vous avais dit que dans une hélice d'ADN, un "A" et un "T" se mettaient toujours ensemble, et un "G" et un "C" toujours ensemble. Ce principe marche aussi si vous couplez un brin d'ADN avec un brin d'ARN, avec la petite particularité qu'un "A" de l'ADN se mettra avec non pas un "T" (il n'y en a pas dans l'ARN si vous suivez) mais avec un "U" (alors qu'un "T" de l'ADN se mettra lui avec un "A" de l'ARN sans aucun soucis.

Donc alors comment on va copier la séquence d'un gène dans un ARNm. Ça va fonctionner en plusieurs temps. Je vous avais dit que deux brins d'ADN qui se mettaient ensemble formaient une belle double hélice. On va commencer par dérouler cette hélice mais pas toute l'hélice (sinon ça ferait beaucoup de boulot) mais seulement la région qui nous intéresse (le gène donc). Ensuite on va séparer les deux brins. Comme ça la machine à photocopier aura accès au gène (c'est un peu comme ouvrir le livre de recette à la bonne page et tenir le livre ouvert dans la machine.
En gros, ça donne un truc comme ça :

Comment photocopier un gène...

Vous remarquerez que le brin bleu sert de négatif pour copier la séquence du gène qui est sur le brin orange dans l'ARNm. Si on détaille la région du gène, ça va donner ça (avec toujours les deux brins d'ADN en orange et bleu et l'ARNm en rouge) :

La copie d'un gène dans l'ARNm

Vous voyez bien comment la séquence du brin principal (en orange) est copié fidèlement dans l'ARNm (en rouge) en se servant de la séquence de l'autre brin comme négatif.

Maintenant qu'on a vu le support physique de l'information génétique, voyons maintenant comment l'information est transmise de l'ARNm à la protéine.

Déjà un petit mot sur la protéine. Tout comme un brin d'ARN ou d'ADN ce sont des bases azotés qui se suivent, une protéine ce sont des acides aminés qui se suivent. Ce sont donc les briques fondamentales de constructions Lego plus complexes. Il y en a 20, de ces acides aminés (certains sont connus comme la lysine dans Jurassic Park il y a 21 ans, je viens de me donner un sacré coup de vieux).

Le principe ensuite est simple : c'est la suite des bases sur l'ARNm dans un gène qui va déterminer la suite des acides aminés. Alors là, si vous avez suivi, vous allez voir qu'il y a un organe reproducteur mâle (une couille, si vous préférez). Il y a 20 acides aminés mais seulement 4 bases. Comment qu'on fait alors ? Et bien c'est simple encore une fois, un acide aminé sera déterminé par non pas une seule (4 bases = 4 possibilités), ni même deux (4 bases * 4 bases = 16 combinaisons possibles) mais 3 bases d'ADN (4 bases * 4 bases * 4 bases = 64 combinaisons possibles).

Du coup, on parlera de triplet ou de codon pour parler des trois bases qui vont coder pour un acide aminé donné.
On peut illustrer ça comme suit. La séquence suivante pourra être vue comme composée de plusieurs codons, chacun identifié par une couleur différente.


La correspondance entre codons et acides aminés se trouve dans un tableau appelé code génétique.

Code génétique

Alors avant de continuer, un point ultra méga important qui me hérisse le poil. Il y a une grande différence Grande Muraille de Chine entre le code génétique et la séquence génétique. Le code génétique correspond au tableau de correspondance ci-dessus. La séquence génétique correspond à une suite de bases d'ADN. Donc quand dans un grand média vous entendez Pujadas (ou un/une autre) parler du code génétique, il est fort probable qu'il veut en fait parler de la séquence génétique mais se trompe comme une grosses buse.

Dans ce tableau, certains codons sont indiqués en vert comme initiation et en rouge comme terminaison. Ce sont en fait les codons qui vont indiquer respectivement le début et la fin du gène (précisément de la partie du gène qui code pour la protéine). Vous remarquerez aussi qu'il y a donc 64 codons possible pour 20 acides aminés. Du coup, certains acides aminés seront codés par plusieurs codons. On parlera alors de redondance du code génétique (avec quelques conséquences sur l'évolution dont je vous toucherai mot plus tard).

Pour simplifier, dans la fin de ce message, on ne parlera que de la séquence d'ADN pour un gène, pas de la séquence de son ARNm.

Bref, si on reprend la petite séquence plus haut et qu'on y applique le code génétique, on aura la protéine suivante :

de l"ADN à la protéine...

En vrai, la machinerie cellulaire va lire l'ARNm codon par codon et à chaque codon, va ajouter à la protéine l'acide aminé correspondant.

Pour finir, deux définitions. Quand on copie la séquence d'un gène de l'ADN vers l'ARNm, on appelle ça la transcription, tout simplement car on retranscrit un texte d'un support à un autre, sans changer quoi que ce soit. Par contre, le fait de fabriquer une protéine à partir de l'enchainement des codons s'appelle la traduction, tout simplement parce qu'on va traduire une information, un texte, d'une langue (l'ADN) à une autre (la protéine).

Voilà, c'est fini pour ajourd'hui. La prochaine fois, je vous parlerai de la structure des gènes et de leur régulation (comment on allume ou éteint un gène...)
Bonne fin de semaine.

jeudi 30 janvier 2014

Les seins d'Angelina

Petit article expliquant la récente affaire d'Angelina Jolie et de son traitement préventif anti-cancer assez radical doublé d'une tentative crasse d'attirer des lecteurs par un titre accrocheur, voire racoleur (je ne suis pas le premier à user de cette ficelle).

- C'était quoi, ce bazar autour de la poitrine d'Angelina Jolie il y a quelques temps ?
Et bien tout simplement La femme préféré de Brad Pitt a choisi un traitement préventif anti-cancer assez direct puisqu'elle s'est fait retirer les deux seins (oui, de manière préventive).

- Et pourquoi ce traitement ?
Tout simplement parce qu'à la suite d'un test génétique, elle a découvert qu'elle était porteuse d'une forme mutée du gène BRCA1, forme mutée qui lui conférait un risque important (87%) de développer une tumeur mammaire.
Je m'explique.

Une cellule du corps humain peut être vue comme... une voiture (Fiat Punto, Peugeot 405, Porsche 911, enfin prenez ce qui vous arrange), avec les différents composants de la voiture (éléments du moteur, roues, volant, joint de culasse, etc...) étant les protéines issues des gènes qui sont dans le génome (j'en parlerai un autre jour des gènes).
Quand tout va bien, tout va bien (quelle phrase !) Je veux dire pas d'accident (enfin sauf ceux causés par, au hasard, un météorite qui vous tombe dessus alors que vous roulez pépère sur la départementale 387, mais ça, ce serait vraiment pas de bol alors on oublie).
Dans notre métaphore bagnolistique, quand un élément de la voiture ne va plus fonctionner et la voiture va aller se planter dans un platane. Dans le corps humain, si dans une cellule un gène est muté, la cellule ne va plus fonctionner normalement et elle peut devenir cancéreuse, c'est à dire qu'elle commence à se multiplier sans vergogne et sans aucun contrôle, ce qui ne va pas être très glop pour le monsieur ou la madame.
Ces gènes qui peuvent causer des cancers quand ils sont mutés sont appelés gènes de prédisposition.

- Mais alors pourquoi elle a fait cette mastectomie ? Prédisposition veut dire qu'elle allait avoir un cancer à coup sûr ?
Oulà non ! Prédisposition veut dire ce que ça veut dire, à savoir risque accru mais pas sûr à 100 %. 
Maintenant, il faut comprendre que selon le gène en question, le "risque d'accident" est plus ou moins fort selon le rôle dudit gène dans la cellule. Imaginez une voiture dont le phare arrière gauche est un peu faible, ça devrait pouvoir passer. Mais si le volant ne marche plus, et bien il y a de grandes chances que la route se termine avec le platane. Non pas celui-là. Oui, celui-là, plutôt.
Dans les cellules c'est pareil. Si un gène produit une protéine centrale du processus cellulaire, les risques deviennent important. Dans le cas d'Angelina Jolie, comme indiqué plus haut, ce risque était de 87 %.

- Comment on mesure ce risque ?
De deux façons. Il faut commencer par connaitre le rôle des différents gènes et de leurs versions "saines" ou "mutées" dans le cancer. Pour cela on va prendre non pas des humain mais des souris et des rats et on va y faire muter le gène correspondant pour regarder ce qui se passe au niveau de la bestiole mais aussi au niveau cellulaire et moléculaire (rôle précis dans la cellule, interactions, etc...).
Ensuite on compte. On prend les patientes qui développent le type de cancer en question et on compte combien ont la version mutée du gène. On regarde chez ces patientes si les cancers sont agressifs ou non, quelle proportion de patientes survivent ou meurent. Et avec tout ça on arrive à un pourcentage qui correspond au risque de développer le cancer en question sachant que le gène est muté.
On ne va pas faire le test génétique au hasard. On le fait s'il y a une histoire familiale suggérant la présence d'un gène muté. Dans le cas d'Angelina Jolie, plusieurs femmes dans sa famille sont morte de ce cancer.

- Pourquoi tout ce bazar en fait ?
Déjà parce qu'il ne s'agissait pas de Germaine Brouchu, caissière au Monoprix de Glaviotte-Lès-Vallons (qui malgré la vie trépidante qu'elle a eu, n'a jamais intéressé les magazines pipoles) mais d'Angelina Jolie, l'une des moitié les plus célèbres de ce monde médiatique.
Ensuite parce qu'à la faveur d'une tribune publié dans le New York Times (le 20 Minutes local) expliquant son choix et révélant le prix exorbitant du test génétique du au brevet sur le gène BRCA1 détenu par la compagnie Myriad Genetics. Ledit brevet entraine un prix élevé au test génétique et limite fortement les recherches sur le gène et les mutations. Par exemple, impossible de développer et de vendre un test génétique alternatif, plus efficace et moins cher.

- Comment ça un brevet sur un gène ? Je croyais qu'il était interdit de breveter le vivant ?
Oui c'est vrai que c'est interdit. Une séquence complète ou partielle du génome d'une bestiole vivante et naturelle (c'est à dire non-artificielle) ne peut pas être breveté. Myriad Genetics contourne simplement (et ingénieusement d'ailleurs) cette règle de la façon suivante.
Pour étudier un gène (ou une séquence d'ADN naturelle en général), vu qu'on ne peut pas le faire directement, il faut l'isoler, de même que pour étudier le joint de culasse, il faut l'isoler du bloc moteur. Et bien on le fait à l'aide de technique moléculaires assez simples mais qui passent par une construction artificielle et non-naturelle. C'est cette construction que Myriad Genetics a breveté il y a 20 ans. Pour information, la court suprême des U.S.A. a considéré il y a peu que ce brevet était abusif et que le seul fait d'isoler une séquence d'ADN ne justifiait pas la brevetabilité d'une séquence d'ADN naturelle.

- Donc Myriad, c'est un peu des salauds quand même...
Dans un sens oui. On peut dire que ce sont des business men, qui ont une vision très marchande du vivant. Pas une vision qui ira loin...

mardi 7 janvier 2014

Le génome : le livre de recettes d'un organisme, 2ième partie : les chromosomes

Après la première partie sur qu'est-ce que c'est qu'un génome, voici logiquement la deuxième (je ne veux aucun commentaire su ma fréquence de publication).

On a vu précédemment de quoi était faite une molécule d'ADN, les éléments qui la composent. On va voir maintenant comment tout ça se présente dans une cellule humaine, de chien, de poulet, d'arbre, etc...

Une cellule, typiquement, c'est pas très gros. Il y en a des plus ou moins grosses, mais une cellule de peau va faire typiquement dans les 30 micromètres (µm, il en faut un million pour faire un mètre). Le noyau, lui, va faire dans les 6 micromètres.

Cellule très schématisée
Une cellule eucaryote (en gros, tout ce qui va des levures type levures de bière à nous en passant par les mouches, les vers de terre, etc) se compose d'un noyau et d'un cytoplasme, le tout entouré d'une membrane (qui n'est pas schizophrène mais double, mais ça on le verra une autre fois). C'est dans le noyau que le génome va être stocké et nul par ailleurs. En

Un génome, d'ailleurs, ça fait quelle taille ? Encore une fois, prenons le génome humain comme référence. La longueur d'une paire de bases est estimée à environ 0,34 nanomètres (nm, c'est pire que les micromètres puisqu'il en faut un milliard pour faire un mètre), ce qui ne pèse pas très lourd, vous allez me dire, par rapport à la taille de la cellule, on a un peu de Homer de marge.

Mais dans le génome humain, il y en a deux fois trois milliard de ces paires de bases (six au total, le compte est bon) ! Ça fait beaucoup, surtout quand on regarde la longueur totale de toutes ces paires de bases : 0,34 * 6 milliards ≈ 2 milliards de nanomètres = 2 mètres.

Essayer de visualiser ça : dans chaque cellule de votre corps, il y en a pour 2 mètres d'ADN...

Bon, maintenant, le plus important : comment faire rentrer tout ça dans la cellule. Comment diable faire rentrer 2 mètres d'ADN dans un noyau à peu près 300 000 fois plus petit. C'est un peu une variante du problème rencontré à chaque départ en vacances par beaucoup de vacanciers ("comment faire rentrer trois tonnes de valises dans cette petite Mini Cooper").

Déjà, tout ce matériel génétique n'est pas "concentré" en une seule molécule, mais en plusieurs. Ce sont les fameux chromosomes. Ensuite, dans chaque chromosome, l'ADN va être compacté, compressé sur lui-même assez simplement en fin de compte.

En fait, une hélice d'ADN peut être vue un peu comme un brin de ficelle.
une ficelle bleu
Ça veut dire que l'ADN n'est pas rigide mais peut se tordre, s'enrouler. Ce qui va nous simplifier la tâche. On va voir comment est compacté l'ADN dans une cellule lambda.

La première étape consiste à enrouler l'ADN autour de structures protéiques (plusieurs protéines mises ensemble) nommées histones.
de l'ADN enroulé autour d'un histone
Autour de chaque histone, le brin d'ADN va faire 1,65 tours représentant 147 paires de bases. Chaque histone est constitué de 4 sous-unités (H3, H4, H2A et H2B de leurs petits noms).
les 4 sous-unités d'un histone
 En répétant ceci beaucoup de fois pour l'ADN, on va obtenir une structure qu ressemble à un collier de perle.
un cadeau original pour votre chère et tendre...
Efficace.
La suite va dépendre de la région du génome dans laquelle on se trouve et si celle-ci est active ou non, plus précisément si les gènes situés dans ladite région sont actifs ou pas. Un gène actif doit pouvoir être accessible à la machinerie cellulaire. Pensez aux bagages de ma grand-mère. Si le casse-croute est planqué au fond de la valise, ça va être difficile d'y accéder à l'heure de la pause midi. C'est pareil pour différentes régions du génome. Ce qui sert va rester dans cette configuration collier de perles, ce qui ne sert pas va être encore condensé.

Cela est fait de manière assez simple. Comme pour la ficelle, si on tourne les deux bouts dans des sens opposés, elle va s'enrouler sur elle-même. Idem pour l'ADN, celui-ci s'enroule autour de lui-même. Prenez un câble ou une corde (vous en avez surement à porté de main) pour essayer, c'est aussi simple.

Et voilà comment on réussi à faire rentrer le vélo, les raquettes de tennis et les valises dans la voiture plusieurs mètres d'ADN dans un tout petit noyau d'une toute petite cellule.