Informática de la Biodiversidad[editar]
El campo de acción de la informática de la biodiversidad (biodiversity informatics) son las ciencias biológicas que utilizan como unidad de trabajo los organismos, lo que la diferencia de la ecoinformática (ecoinformatics, la informática al nivel de organización de los ecosistemas) y la bioinformática (bioinformatics, al nivel de organización molecular y fisiológica).239
El material tomado como digital o a digitalizar en taxonomía consta de los "datos crudos" y sus metadatos, y de la "literatura taxonómica primaria" y sus respectivos metadatos. La digitalización requiere un id "único" para cada uno de ellos, idealmente "global", es decir único en internet. Por ejemplo la forma más directa de crear un id global es concatenar el id del dato con el de su tabla en la base de datos con el identificador de esa base de datos en internet.339 Hay varias propuestas de formación de id globales y alguna de ellas puede volverse estandarizada en el futuro, cuando la aceptación por parte de la comunidad de usuarios lo decida. En internet además se busca que este GUI (identificador global único, global unique identifier) pueda "resolverse", enlazarse a través de internet a un archivo con sus metadatos y quizás una lista de enlaces a copias del dato taxonómico, los dos alojados en su base de datos online, en lo que cuando son adecuadamente citados se llamó el mundo emergente de los Linked Open Data de la Big New Biology, la "Nueva Biología Gigante" más "data-céntrica".236 Las discusiones en la comunidad de la informática de la biodiversidad se enfocan en 3 tipos de GUIs "autorresolubles", es decir que sean una dirección de internet que al tipearla en la barra de direcciones devuelva la página con los datos o los metadatos: los HTTP URIs (es decir URLs), los GUI recomendados como estándar por el TDWG que son los LSID (que hacen uso de los DNS de internet, y resuelven a una página de metadatos), y los DOI, que hacen uso de una autoridad central para resolverse y son por ejemplo los asignados por CrossRef para publicaciones científicas que los resuelve al dato160. Los GUIs no ocupan espacio en las publicaciones taxonómicas porque los metadatos y el material al que hacen referencia pueden agregarse en bases de datos externas, las bases de datos deberían ser "copiables" para amortiguar la posibilidad de que metadatos y datos se pierdan, y para independizarse de las autoridades que mantienen las bases de datos mediante buscadores —search engines— específicos o inespecíficos que indexen los GUI, sus metadatos, sus locaciones, sus GUI sinónimos y usos posteriores de los mismos.35 Como la unidad de trabajo en la clasificación es el organismo, los datos crudos y la literatura primaria deberían enlazarse a los id de los organismos o cepas referenciados en ellos, por lo que implican la necesidad de un GUI por organismo/cepa.34 Los id de los organismos son el taxón terminal de las clasificaciones según cada autor. Cada nombre de taxón sensu cada fuente también necesita un id, para poder separar sinónimos nomenclaturales del nombre y sincronizar conceptos sinónimos con diferente nombre.3435
No hay comentarios:
Publicar un comentario