Resumen The Triangle Inequality and Character Analysis(Wheeler,1993)

Una matriz de caracteres es una matriz matemática formada por valores, cada uno de los cuales describe un costo único para la posible transformación del carácter [en las matrices morfológicas pasar del estado 0, sin plumas, al estado 1, con plumas: en este caso el costo de esta transformación es uno si no se específica o si los caracteres no son ordenados (tipo Fitch)].

Algunos programas permiten hacer matrices elaboradas en las cuales se puede especificar el número de pasos requeridos para una transformación específica. El caso más simple que podremos observar es el de las matrices binarias (ceros y unos) y los más complejos en matrices multiestado con caracteres aditivos (Wagner) en las cuales se les ha asignado una puntuación específica a cada transformación.

En las matrices moleculares hay cuatro bases nucleotidicas y 12 transformaciones que se pueden especificar (en realidad son 16 pero las transformaciones idénticas no juegan un papel fundamental en los análisis de parsimonia (Wheeler, 1990). Más comúnmente la matriz solo especifica solo dos tipos de transformaciones las transiciones (purina-purina) A<>G, y pirimidina a pirimidina C<>T/U y las transversiones (purina a pirimidina y lo contrario como A<>T) (Brown et al. 1982; Liu Beclembach 1992). Las transiciones transversiones siempre se especifican en los análisis internamente aunque no siempre sean consistentes.

Las transformaciones que sufren las bases a lo largo de la secuencia es esencialmente una distancia entre una secuencia.

Desigualdad de triángulo


La desigualdad de triángulo se define como dij≤dik+ dkj para todos los tripletes de estado de carácter (i, j, k). Esta relación especifica que la distancia entre dos estados de carácter (dij) no puede ser más larga (más costosa) que una ruta menos directa entre esos dos caracteres (de i a k y de k a j). Es decir que si AC=3, AG=1 y GC=1, entonces sería más parsimonioso (de menor costo) ir de AG y luego de G a C costaría 2, por lo que si solo se observan los caracteres A y C se debería suponer aunque no se observe que hay un estado intermedio G. Lo que nos lleva a sumir estados no observados en ancestros hipotéticos, lo que tiene como consecuencia la perdida de consistencia tanto en los datos como en el análisis.

El problema

En el análisis de secuencias moleculares hay tres ocasiones en las que podría ser violado la inegualdad de triángulo
  1. La especificación de tasas transición:transversión extremas
  2. El tratar a los gaps como datos perdidos
  3. El uso de modelos de transformación de carácter asimétricos

No hay comentarios:

Publicar un comentario