Aunque la aproximación
experimental al estudio de la variabilidad del proteoma facilita una
información de gran calidad, de momento se ha ceñido al estudio de sistemas
específicos. Frente a esta situación, la bioinformática puede proporcionar una
aproximación original a este problema, al permitir realizar un análisis
sistemático del amplio volumen de datos disponible. Así la bioinformática
permitirá racionalizar y sintetizar los resultados de los estudios
experimentales, la información sobre el genoma humano y de otros genomas, la
enorme colección de datos sobre SNPs, la información estructural sobre
proteínas, los datos sobre patrones de splicing alternativo, y las bases de
datos de patologías asociadas a mutaciones.
Considerando esta gran
complejidad, está claro que el científico, hoy en día, necesita tener a
disposición un amplio abanico de instrumentación para separar e identificar
cada proteína del proteoma de cualquier organismo.
Entre los
más antiguos y populares, también en nuestros días, está la clásica
electroforesis bidimensional que consta de un isoelectroenfoque como primera
dimensión, que discrimina en base a la carga superficial, y un SDS-PAGE
(electroforesis en geles de poliacrilamida saturados de docecilsulfato
sódico) como segunda dimensión, que separa en base a la masa. A esta
metodología se le han sumado, en los últimos años, métodos cromatográficos
bidimensionales, que en general combinan cromatografía de intercambio iónico
y de interacción hidrofóbica (con diversas variantes, dado que se pueden
utilizar múltiples procesos cromatográficos, como quelación de metales,
exclusión molecular, chromatofocusing, resinas de fosfato cálcico, etc., sin
considerar las resinas basadas en la bioafinidad).
Estas
últimas metodologías pueden incluso hibridarse, p.ej. el eluído de una
columna de RP-HPLC acoplada con la electroforesis capilar. Por último, no
podemos olvidar los chips de proteínas que pueden constituir interesantes
superficies de captura de marcadores en líquidos biológicos para un rápido
diagnóstico en bioquímica clínica. Estos chips de proteínas no llegan a
alcanzar los sistemas variados y complejos de los chips de ADN, donde es
posible mostrar simultáneamente miles y miles de genes diferentes, cosa que
es impensable para los chips de proteínas de hoy en día.
Sin embargo, el análisis
proteómico actual, no avanzaría mucho si sólo dependiera de los instrumentos
anteriormente mencionados. De hecho, ya en 1975 O’Farrel perfeccionó bastante
los geles 2-D, pero se avanzó muy poco debido a la falta de medios tanto para
el análisis cuantitativo como cualitativo. La identificación de la proteína o
proteínas contenidas en un punto electroforético o en un pico cromatográfico
necesita de ulteriores técnicas que son independientes de la separación. La
proteómica moderna es en realidad un conjunto de al menos tres disciplinas
diferentes, que contribuyen por igual a la solución de problemas complejos,
siendo estas:
u Las metodologías de separación, tanto
las enumeradas anteriormente como las futuras, dado que el sector está en
rápida expansión.
u La
espectrometría de masas, técnica indispensable para el reconocimiento de las
cadenas polipeptídicas eluídas de los geles 2-D, cromatografía bidimensional,
chips de proteínas, etc.
u La
bioinformática, instrumento en continua evolución, con creación de buscadores,
bancos de datos y métodos de screening cada vez más avanzados en la
identificación de proteínas de cualquier origen. La bioinformática, en su más
vasta acepción, es un instrumento fundamental para conectar las bases de datos
de proteínas y genes.
Estas tres disciplinas
contribuyen por igual al análisis proteómico y por tanto, tienen que estar a
disposición en los laboratorios ligados al proteoma.
Dos mecanismos presentan
una particular problemática y antecedentes sobresalientes, brevemente:
Splicing alternativo
El splicing alternativo es
un mecanismo mediante el cual la expresión de un gen puede dar lugar a
diferentes proteínas, a través de mecanismos de substitución o inserción/deleción
de determinados fragmentos de la secuencia de la proteína[3]
Estudios recientes
muestran que es una importante fuente de variabilidad en el proteoma de los
eucariotas, ya que afectaría a más de un 40 % de las proteínas del organismo.
Su contribución varía de un tejido a otro, destacando su importancia en el
sistema nervioso[4]
El efecto del splicing
alternativo sobre la variabilidad de las proteínas puede llegar a ser enorme,
como por ejemplo en el caso de la proteína DSCAM en D.melanogaster, para la
cual se ha postulado la existencia de más de 38000 isoformas posibles, un
número superior al total de genes predicho para Drosophila.
Aunque estas cifras son
extremas, nos dan una idea de la capacidad del splicing alternativo para
generar variabilidad. Sin embargo, y a pesar de su importancia, todavía no se
sabe prácticamente nada de la manera en la que el splicing alternativo modula
la función de las proteínas[5]
Como era de esperar,
también se ha observado una clara relación entre patrones de splicing anómalos
y patologías. Por ejemplo, se ha observado que el splicing alternativo puede
estar asociado a diversas patologías del sistema nervioso, a procesos
cancerígenos, etc.
También en este caso, la
falta de conocimiento básico sobre los aspectos funcionales del splicing
alternativo ha impedido, en la gran mayoría de los casos, esclarecer el
mecanismo molecular de la enfermedad.
En el campo de la
bioinformática, los estudios sobre splicing alternativo a nivel de proteína
son contados. Entre ellos cabría destacar los estudios del grupo de P.Bork,
centrados esencialmente en cuantificar la contribución del splicing
alternativo a la variabilidad total del proteoma, siendo suya la primera
estimación de un 30 % de proteínas afectadas por el splicing alternativo. Más
en la dirección del presente proyecto, los precedentes que existen son
mínimos; cabría mencionar el trabajo de Modreck et al., 2001, en el que se
estudia la distribución del splicing alternativo entre las diferentes familias
funcionales de proteínas. En lo que respecta a nuestro grupo, cabría destacar
la aplicación de técnicas bioinformáticas a la caracterización estructural de
dos isoformas de hSos.
Por todo ello, la
caracterización bioinformática de la variabilidad asociada al splicing
alternativo es un área de investigación prácticamente virgen todavía, en la
que los estudios bioinformáticos pueden realizar contribuciones novedosas, y
de utilidad para el posterior análisis experimental del proteoma, tanto en el
contexto de las aplicaciones biomédicas, como en el de la ciencia básica.
Polimorfismos no sinónimos
Los polimorfismos no
sinónimos son la mayor fuente de variabilidad poblacional del proteoma, de
origen genético. En la actualidad se conocen unos 60000 polimorfismos en zona
codificante, cifra que podría aumentar en un futuro próximo hasta unos 200000[6]. Todo ello, unido al hecho de que hay varios miles de patologías en
las que se ha establecido el vínculo entre enfermedad y polimorfismo[7], ha impulsado los estudios bioinformáticos sobre la variabilidad
poblacional del proteoma. Desde un punto de vista de caracterización, en
dichos estudios se han analizado los polimorfismos en términos de propiedades
estructurales y de secuencia, incidiendo particularmente en las diferencias
entre la variabilidad neutra y la asociada a patologías. Sin embargo, a pesar
de su valor, estos estudios sólo proporcionan todavía una comprensión parcial
del efecto de los polimorfismos, al no haberse evaluado su impacto en la
estructura tridimensional de las diferentes variantes alélicas de la proteína.

La relación entre
polimorfismos y patologías ha hecho que uno de los objetivos principales del
estudio de los polimorfismos sea profundizar en los mecanismos moleculares de
las patologías, con la finalidad de desarrollar algoritmos predictivos del
carácter patológico de las mutaciones. Aunque los primeros resultados han sido
alentadores[8], dos factores limitan dichos
estudios:
(i) sólo se conoce la estructura de
aproximadamente un tercio de las proteínas humanas;
(ii) incluso cuando esta se conoce,
no siempre es posible comprender las causas de las patologías.
El primer punto aumenta la
dificultad de predecir el carácter patológico de los polimorfismos, ya que son
ciertas propiedades estructurales las que proporcionan un mayor grado de
discriminación entre polimorfismos neutrales y patológicos. El segundo punto
surge porque, a nivel de proteína, las patologías pueden tener diferentes
orígenes[9]: desestabilización de la
estructura tridimensional, lesiones en el centro activo de la proteína,
desestabilización de la estructura cuaternaria, interacciones anómalas con el
entorno celular y agregación.
De todas estas causas,
sólo en la primera es posible relacionar directamente estructura y patología.
Los datos presentados
indican que la caracterización bioinformática de la variabilidad del proteoma
generada por los polimorfismos es un campo de investigación muy activo y
prometedor.
NOTAS:

Fischer, 1997; Williams & Hochstrasser,
1997
Williams & Hochstrasser, 1997; Collins et al., 1998.
Debido a su importancia, la caracterización de los tres tipos de
variabilidad ha sido objeto de numerosos trabajos: así, una sencilla
búsqueda bibliográfica en la base de datos MEDLINE, utilizando como
palabras clave "disease" y "alternative splicing", o "post-translational
modification", o "point mutation", proporciona 748, 1187 y 4512 citas,
respectivamente. A un nivel más general, se empieza a hablar de un
Proyecto Proteoma, cuya realización
permitiría la caracterización de los principios básicos que rigen la
variabilidad del proteoma. Sin embargo, las dificultades técnicas y de
diseño son tales, que de momento el Proyecto Proteoma sigue en la fase de
planificación (Abbott, 2001).