En este artículo voy a hablar sobre la importancia que está adquiriendo la secuenciación de genomas como herramienta para identificar genes y prever su función apoyándose en el conocimiento generado en estudios con organismos modelo.

Secuenciación del genoma del cannabis: herramienta para extrapolar el conocimiento adquirido en Arabidopsis thaliana.

Escrito por el . Publicado en Artículo

4.4117647058824 1 1 1 1 1 1 1 1 1 1 Valoración 4.41 (17 Votos)

 

Saludos. En este artículo voy a hablar sobre la importancia que está adquiriendo la secuenciación de genomas como herramienta para identificar genes y prever su función apoyándose en el conocimiento generado en estudios con organismos modelo.

Para no hacerlo largo y tedioso voy a dividir el artículo en dos entregas: esta primera que será más conceptual y tratará sobre organismos modelos y sobre la publicación anexa a la  secuenciación del genoma de cannabis, y una futura segunda entrega en la que explicaré con algún ejemplo práctico cómo, utilizando la aplicación informática (browser), se identifican y localizan genes de cannabis cuya función ha sido estudiada en A. thaliana. Dicho esto vamos al lío.

¿Por qué se utilizan organismos modelos?

Los trabajos de Mendel reflejan muy bien el concepto de este tipo de organismo. Mediante cruces entre guisantes verdes y amarillos, Mendel determinó como se transmite a la descendencia el factor genético “color del guisante”. Posteriormente repitió este experimento añadiendo un segundo factor “rugosidad de la piel”. En este caso cruzó guisantes amarillos lisos con guisantes verdes rugosos y demostró la segregación independiente de ambos factores.

guisantes

Mendel utilizó el guisante porque tenía ciertas ventajas como modelo experimental. Era un cultivo que dominaba, tenía variantes y podía obtener descendencia en tiempos relativamente cortos. Si a Mendel se le hubiese ocurrido realizar estos estudios en cítricos por ejemplo (desde que un cítrico se siembra hasta que se obtiene una semilla pueden pasar fácilmente 20 años), hubiese tenido que vivir varias veces para llegar a las mismas conclusiones. Tras verificar cómo segrega un único carácter, Mendel se apoyó en el mismo modelo experimental para estudiar la segregación conjunta de varios caracteres, de forma que amplió su estudio sobre un conocimiento ya adquirido. A pesar de que sus experimentos se hicieron únicamente con guisantes se ha comprobado que sus resultados son extrapolables a cualquier organismo diploide de reproducción sexual.

Básicamente, el guisante de Mendel cumple los tres requisitos esenciales por los que se utilizan organismos modelo:

1- Todos los seres vivos provenimos de un ancestro común y por tanto compartimos las mismas características biológicas fundamentales. A pesar de que los organismos modelo representan sólo una ínfima fracción de la biodiversidad que existe en el planeta, se asume que el conocimiento de estos organismos puede extrapolarse a otras especies.

2- Los organismos modelo han sido seleccionados por ser fáciles de mantener y reproducir en un entorno de laboratorio y/o por tener ventajas experimentales particulares.

3- La gran cantidad de datos acumulados a lo largo de los años sobre organismos modelos los hace más atractivos para estudiar y esto es una consecuencia de que la investigación se apoya en el método científico, resolviendo preguntas muy concretas que amplían conocimientos previamente adquiridos.

Con lo dicho anteriormente podría entenderse que todos los organismos comparten las mismas características biológicas y por tanto la elección del organismo a estudiar es simplemente una cuestión de facilidad de manejo y de las veces que ha sido objeto de estudio. Sin embargo, a medida que se estrecha la distancia filogenética entre dos especies, mayor es la similitud de sus procesos bioquímicos, genéticos y fisiológicos.

Los humanos por ejemplo, compartimos muchos mecanismos moleculares con las bacterias, pero estas semejanzas se incrementan respectivamente con una mosca, un ratón y un chimpancé. Es por ello que existe un gran número de organismos modelos, cada uno utilizado para representar a un grupo de la escala biológica que arbitrariamente puede ser más o menos extenso. De esta forma, Escherichia coli se utiliza como modelo bacteriano, Saccharomyces cerevisiae como modelo unicelular eucariota, Drosophilla melanogaster como modelo pluricelular animal, Caenorhabditis elegans como modelo para el estudio de la genética del desarrollo, Mus musculus como modelo mamifero, etc…

En el caso de las plantas el modelo más utilizado y estudiado sin duda es A. thaliana. Esta planta pertenece a la familia de las crucíferas, relacionada a plantas comestibles como las coles, los rábanos y los nabos. Crece naturalmente en regiones de Asia, Europa y el norte de África, y se ha introducido en otras áreas como Norteamérica y Australia.

a thaliana

A. thaliana tiene unas características que la hacen idónea como modelo experimental. Su tamaño es pequeño (30 cm), por lo que es posible cultivar un gran número en un espacio reducido. Su ciclo de vida es relativamente corto (seis a ocho semanas). Tiene una abundante producción de semillas (más de 10.000 semillas por planta). Es diploide y se autofertiliza, lo cual facilita mantener líneas y realizar cruces controlados. Existen diferentes “ecotipos”, cuyas variaciones genéticas naturales son muy valiosas en el estudio de diversas características. Su genoma se ha secuenciado, está organizado en 5 cromosomas, y es uno de los más pequeños detectados en plantas (125 Mb, poco más de 20 veces el de E. coli, 10 veces el de S. cerevisiae y similar al tamaño del genoma de D. melanogaster). Es fácilmente transformable empleando a la bacteria Agrobacterium tumefaciens.

Este último punto es muy importante para dilucidar la función de los genes. A. tumefaciens es una bacteria capaz de introducir secuencias de DNA propias en el genoma de las plantas a las que infecta. Mediante ingeniería genética se puede sustituir estas secuencias por cualquier otra y utilizar a la bacteria para introducir genes foráneos (transgenes) en la planta. La secuencia que se transfiere (tDNA) se inserta en el genoma de forma aleatoria. Frecuentemente el tDNA se inserta dentro de una región génica creando un mutante para este gen debido a que la proteína que codifica ya no se traduce correctamente. Utilizando el tDNA como mutágeno se obtienen colecciones de mutantes que pueden sembrarse en diferentes condiciones experimentales y detectar aquellos que responden de una manera diferente a las plantas control (screening).

Por ejemplo, si queremos identificar genes involucrados en tolerancia a la salinidad podemos sembrar una colección de mutantes y unas plantas control en un medio con salinidad elevada e identificar las plantas mutantes que mejor responden a dichas condiciones. Una vez seleccionados los mutantes, se puede secuenciar las regiones genómicas adyacentes al tDNA insertado e identificar el gen involucrado. A partir de aquí comienza una caracterización funcional del gen mediante su sobrexpresión, su represión, cruces con mutantes de genes de misma función, etc…

tDNA

Con el avance de las técnicas de secuenciación y la creación de bases de datos genéticos se han desarrollado nuevas técnicas que no se amparan en el screening de mutantes o en la comparación de ecotipos para identificar la función de los genes.

En la actualidad, la estructura y función de todos los genes de un genoma se puede analizar de forma global. Se han creado nuevas disciplinas como la genómica estructural que tiene como objetivo la determinación de la secuencia de un genoma y la definición de sus genes, y la genómica funcional que tiene como objetivo el estudio de su función. Esta última se apoya en la transcriptómica (análisis global del genoma a nivel de transcrito), la proteómica (análisis global a nivel de proteínas) y la metabolómica (análisis global a nivel metabolitos). Estas disciplinas crean gigantescas bases de datos que son analizadas informáticamente para identificar y clasificar por familias a los genes y a las proteínas que codifican. A nivel funcional los análisis transcriptómicos muestran de una forma global qué genes se expresan o reprimen en determinadas condiciones ambientales. En A. thaliana se han realizado numerosos estudios de este tipo. Se han identificado todos sus genes y se conoce la función de muchos de ellos. Este tipo de estudios se ha extendido a muchas plantas de interés comercial como el tomate, el maíz, la patata, ornamentales…

En 2011 se publicó el artículo científico “The draft genome and transcriptome of Cannabis sativa” que describe la secuenciación del genoma y del transcriptoma de varios tejidos de la variedad “Purple Kush” como ejemplo de cannabis medicinal y de la variedad “Finola” como ejemplo de cáñamo de uso industrial. Para ello utilizan la secuenciación masiva “illumina” en el caso del genoma y la secuenciación “454” en el caso del transcriptoma.

Sin entrar en mucho detalle, la secuenciación masiva se realiza rompiendo el genoma en fragmentos de entre 50 y 300 pb a los que se les acopla un adaptador de secuencia conocida. Utilizando cebadores cuya secuencia coincide con la de los adaptadores, se amplifican los fragmentos por ambos sentidos y estos amplicones se incluyen en una matriz que posee hebras complementarias a los adaptadores para que se unan a ellos y así posicionarlos independientemente. Esta matriz se introduce en el secuenciador que, por medio de fluorescencia, va leyendo cada nucleótido de los fragmentos situados en cada uno de los puntos de la matriz. De esta forma se obtienen millones de pequeñas secuencias en un solo análisis. Los datos generados se procesan informáticamente para eliminar aquellas secuencias que contienen errores y, solapando los pequeños fragmentos por homología de sus extremos (contigs), se obtiene la secuencia completa del cromosoma.

En el caso del transcriptoma el proceso es muy similar pero se parte de cDNAs transcritos a partir del extremo polyA de los RNAs mensajeros extraídos en distintos órganos de la planta (tallo, raíz, ápice, preflores y flores). En este caso, se utiliza la tecnología 454 que puede secuenciar fragmentos de hasta 600pb. El transcriptoma es muy importante porque nos indica qué genes se expresan en cada tejido de la planta y, a diferencia DNA genómico, su secuencia no contiene intrones y sigue sin interrupciones la pauta de lectura para la traducción a proteínas (profundizaremos en esto en la próxima entrega).

secuenciación masiva

Siguiendo esta metodología el artículo indica que se han secuenciado 534 Mb del genoma (casi cinco veces más que el genoma de A. thaliana) y 30.000 genes del transcriptoma. Todas estas secuencias están disponibles en las bases de datos del NCBI.

La información generada se procesa bio-informáticamente con algoritmos matemáticos muy potentes que comparan cada secuencia con todas las existentes en bases de datos de organismos estudiados anteriormente. Estos algoritmos buscan homologías de secuencia con el fin de detectar motivos característicos y dominios de proteínas para identificar y clasificar los distintos genes.

En el artículo comparan la proporción de clases funcionales de genes de A. thaliana y la obtenida mediante los algoritmos informáticos a partir del transcriptoma de la variedad Purple Kush. Se evidencia claramente la similitud funcional de los genes de estas dos especies y es una buena demostración de la validez del uso de organismos modelo.

comparación genes cannabis

Bueno, vamos a dejarlo aquí por ahora para no volvernos locos. En la próxima entrega haremos algún ejemplo práctico para identificar genes de cannabis cuya función ha sido estudiada en A. thaliana. Para ello utilizaremos el interfaz online que han creado los autores del artículo y las bases de datos del NCBI.

Saludos.