1 2 3 4 5 6

Bases de datos públicas del genoma pueden filtrar identidad

The Register 25-Ene-2013

El anonimato tiene un límite.

Los datos públicos del genoma son un riesgo significativo para los individuos, de acuerdo a la investigación llevada a cabo por Yaniv Elrich, genetista en el Whitehead Institute for Biomedical Research.

El equipo que dirige Elrich fue capaz de des-anonimizar datos del genoma empleando sólo información pública y cuidadosas búsquedas en Internet. Algo escalofriante es que, los individuos pueden ser asociados con sus características genéticas de línea paterna, incluso si no están en las bases de datos. La presencia de un miembro de la familia en la base de datos puede ser suficiente, si están relacionados en línea masculina y cuentan con el mismo apellido.

Al trabajar con datos publicados en dos bases de datos genéticas, Ysearch y SMGF, Elrich demostró el riesgo de privacidad al emparejar datos de cromosomas con 50 individuos, en un artículo publicado en Science (resumen aquí, el artículo completo está disponible gratis al registrarse).

Entre los datos de genoma guardados en las bases de datos hay un marcador genético llamado “tándem de repetición corta” (para el cual la ciencia aún no identifica un propósito en específico), el cual se pasa a través de la línea masculina.

Como dice el artículo, se asumió que la lista de apellidos en la base de datos no implica un riesgo individual de identidad, ya que los apellidos “pueden corresponder con miles de personas”. De cualquier forma, los datos de genoma también se convirtieron en una herramienta genealógica, en bases de datos como YBase.

El pionero de la secuencia de ADN, el Dr. Craig Venter, se ofreció como voluntario en la investigación. Con sólo la secuencia relevante de ADN, su edad y el estado de los EUA donde vive. Elrich fue capaz de encontrar sólo dos posibles registros (uno de los cuales era del Dr. Venter).

Con un apellido conocido, las búsquedas se vuelven más precisas: “Combinar el apellido recuperado con datos demográficos adicionales puede reducir la identidad del origen de la muestra a unos pocos individuos”, estableció Elrich en el artículo.

 “La inferencia de apellidos en genomas personales pone la privacidad de los datos públicos no identificados en riesgo”, continuó.

 “En cinco casos de apellidos recuperados, identificamos plenamente con muy altas probabilidades a los CEU* individuales y a su familia completa. Los datos, incluso con pocos marcadores, de una persona pueden propagarse a través de profundos lazos genealógicos y llevar a la identificación de otra persona que no tiene conocimiento de la persona que dio a conocer sus datos genéticos”.

*CEU se refiere a un conjunto de datos genéticos particulares: “familias multigeneracionales de Utah de ascendencia del norte y oeste de Europa que originalmente tuvieron su recolección de muestras por parte del CEPH (Centre d’Etude du Polymorphisme Humain).

Fuente: The Register AA

Universidad Nacional Autonoma de México Aviso legal |  Créditos |  Staff |  Administración
Copyright © Todos los derechos reservados
UNAM - CERT