Acerca de la Taxonomía, y las bases de datos de biodiversidad
embebidas en sólidos platónicos, tetraedros y no polígonos de dos dimensiones.
El manejo de datos de biodviversidad que con ardua depuración se convierte en información, tiene desde hace algunos años estructura relacional, es decir han pasado de los cuadernos y libros manuscritos a hojas electrónicas y finalmente a bases de datos (siempre hay contraejemplos). En la actualidad se continua el manejo de datos de biodiversidad de manera estrictamente alfanumérica, y con el advenimiento de la información espacial (coordenadas, sistemas de georeferenciación) erróneamente a la tabla núcleo de campos alfanuméricos simplemente le añaden uno adicional donde colocan la coordenada. Esto imposibilita el uso y aprovechamiento de las capacidades de las bases de datos espaciales para ejecutar análisis de información a nivel de capas, lo cual es no solo la tendencia actual tecnológica y desde hace ya diez años, sino la correcta forma de hacer análisis de un gúgolplex de datos.
Las actuales estructuras de bases de datos modelo para el manejo de información de biodiversidad, básicamente Especies, Género, Familia, Orden, Clase… hasta llegar al Reino, de todas las clasificaciones de la vida, Animales, Plantas, Hongos, Chromista, Archeae, Etc. tienen como núcleo de la estructura de entidad relación a la Taxonomía, específicamente a Especie y Género a estos campos fundamentales asocian otro tipo de datos como sexo, ubicación política, tipso de muestra, peso, medidas, coordenada de avistamiento o colecta, Etc. Evidentemente con el tratamiento de una base de datos alfanumérica. Adicionalmente la taxonomía, siempre cambiante, está continuamente dentro de discusiones eternas en base a grupos y/o científicos que defienden clasificaciones y reclasificaciones, que solo acabará cuando se complete el análisis genético y molecular, es decir cuando esta Taxonomía se revise en base a las cadenas de ADN de cada especie.
Las especies en el planeta tierra existen bajo un sistema de cuatro dimensiones, latitud, longitud, altura o profundidad y tiempo. Los transectos que diseñan los biólogos en sus estudios son de cuatro dimensiones, sean estos superficiales, submarinos, subterráneos, áereos. Las especies habitan el planeta en bloques tetradimensionales, como un paralelepípedo gelatinoso, claro esto por ser Platónico, porque realmente podrían ser de topología fractal . El correcto análisis de datos e información de biodiversidad y/o el buscar patroes con otros modelos de datos como por ejemplo tornados, huracanes, saturación de moléculas de gases contaminantes, Etc. evidentemente como conclusión a lo antes citado es mediante geodatabases.
El modelo correcto de una base de datos de biodiversidad es una geodatabase, en donde la pate central de la estructura de base de datos sea un polígono y no datos alfanuméricos como es la taxonomía. Los algorítmos matemáticos de búqueda de patrones (que la mente humana mediante lenguaje estructurado SQL no puede hallar) haciendo uso de los grandes volúmenes de datos( big data) no estructurados (NoSQL) mediante redes de simulación neuronal y análisis cognoscitivo (Watson de IBM, Machine Learning, Etc.)
Enormes capacidades de procesamiento para enormes volúmenes de datos y/o relacionamiento y búsqueda de patrones con otras capas tetradimensionales de información se encuentran disponibles para todos como SaaS (Software as a Service), en empresas como IBM, Google, Amazon, Microsoft, es decir que no es necesario hacer inversiones particulares, por cada universidad, instituto, gobierno, Etc. Existen verdaderos súper-ordenadores de gran capacidad de procesamieto gráfico, numérico y general (gpu, fpu, cpu, ver Nvidia e Intel Phi). Mi recomendación sería ya iniciar estudios de uso de estos úper-ordenadores y sobre todo del computador cuántico de IBM que tiene 16 qubits IBM-Q el tema de hacer uso de la superpocisión y entrelazamiento, principios de la mecánica cuántica, son… elementos para dejar de pensar en la «sobernanía»
Lamentablemente el celo de la ignorancia, y el mal entendido concepto de soberanía, o quizá solo el interés de obtener alguna prevenda en este tipo de adquiciones han hecho que se adquieran, algunas «súper-computadoras», atrevidamente así llamadas. Soberanía sería que las universidades hagan uso y aprovechamiento inteligente e innovador sobre lo ya diseñado y desarrollado y puesto en producción por países que nos llevan décadas en investigación científica plasmada en la tecnología que actualmente consumimos.
El análisis presentado es el resultado de la ejecución de prototipos en base a software libre como: Symbiota de la NSF y la Universidad de Wisconsin, y Specify de la Universidad de Kansas) . Quiero pensar que a mediano plazo, el modelo del país no termine siendo una copia de Colombia, Brasil o Perú, Estados Americanos, Alemania, ni de ningún otro, y que lo proyectos como el Mapa de la Vida(MOL), los Bancos Biológicos de ADN también realicen algo diferente.
Finalmente, una decepción, no existe un modelo de geodatabase para la biodiversidad, hay que construirla y no es lo complicado, sino que si dicho modelo existiese tal como los modelos para gasoductos, oleoductos, acueductos, Etc. ( ESRI y su ArcGis) habría un estándar lo cual es realmente importante.
PostData
Dont be a square… get a cube, or somthing better: get a bitcoin
Bacteria eats poison, poops out gold
Mi próximo posr será sobre Delftia acidovorans la bacteria que ingiere veneno y excreta oro Versus Santoshi Nakamoto y El Bitcoin,
Lea en bípedos Depredadores