Biblioteca Universidad de La Rioja
C/ Piscinas nº 1
26006 Logroño (La Rioja-España)
Tfno.: 941299189
Hay que organizar los datos en ficheros y carpetas y documentarlos. No solo hay que recolectar y coleccionar datos, sino organizarlos.
Importa tanto la información descriptiva de los datos como los procedimientos.
Todos los materiales relevantes deben ser organizados en carpetas:
Hay que organizar las carpetas de manera lógica y sistemática, con unos criterios:
Infografía del Grup de Treball de Suport a la Recerca del Consorci de Serveis Universitaris de Catalunya:
Un formato de archivo es una forma de codificar información dentro de un archivo informático. Un programa o aplicación debe poder reconocer el formato de archivo para poder acceder a los datos que contiene. Es importante contar con formatos estándar y a poder ser abiertos, que aseguren el acceso a largo plazo a los datos. Es importante contar con formatos estándar y a poder ser abiertos, que aseguren el acceso a largo plazo a los datos. (Milanés y Delgado "La gestión de datos de investigación en el contexto de la Ciencia Abierta")
Formatos más comunes:
Elección de formato
Hay aspectos importantes a tener en cuenta al elegir un formato de archivo para datos digitales y la elección debe planificarse al comienzo del ciclo de investigación para garantizar que el formato se adapte a todos los propósitos que puedan ser necesarios.
Los puntos a considerar son:
El formato y el software en que se crean los datos de investigación suelen depender de cómo los investigadores eligen recopilar y analizar los datos, del hardware utilizado o de la disponibilidad del software. También puede estar determinado por las normas y costumbres específicas de cada disciplina. Por ejemplo:
Formatos para accesibilidad a largo plazo
Al considerar la accesibilidad y usabilidad a largo plazo de los datos de investigación, se necesitan formatos de archivos digitales y software sostenibles. Muchos formatos corren el riesgo de quedar obsoletos en el futuro, lo que imposibilitaría la lectura e interpretación de los datos.
A pesar de la compatibilidad con versiones anteriores de muchos paquetes de software para importar datos creados en versiones de software anteriores y la interoperabilidad entre programas de software populares que compiten entre sí, la opción más segura para garantizar el acceso a los datos a largo plazo es convertir los datos a formatos estándar o abiertos.
La mayoría de los paquetes de software no sólo pueden interpretarlos, sino que también son adecuados para el intercambio y la transformación de datos y es probable que tengan más posibilidades de ser reutilizados en el futuro.
Formatos propietarios o abiertos
Si bien los investigadores utilizarán los formatos de datos y el software más adecuados según los análisis planificados durante su investigación, una vez finalizado el análisis y preparados para su almacenamiento a largo plazo, se debe considerar su conversión. El uso de formatos abiertos, estándar, intercambiables y de mayor duración evita la imposibilidad de utilizar los datos en el futuro. Esto también se recomienda para las copias de seguridad. Para la preservación digital a largo plazo, los centros de datos y archivos conservan los datos en formatos abiertos y estándar.
Formatos de archivo recomendados por el UK Data Service
Enlazamos una tabla elaborada por el Servicio de Datos de Reino Unido que orienta sobre los formatos de archivos recomendados y aceptados para compartir, reutilizar y preservar datos.
Es posible que se necesite la conversión de los archivos de datos a un formato de archivo de preservación.
Fuente : UK Data Service
La numeración de versiones en los nombres de archivos puede ser mediante numeración discreta o continua dependiendo de las revisiones menores o mayores.
Nombre del archivo | Cambios en el archivo |
Entrevista programada_1.0 | Documento original |
Entrevista programada_1.1 | Se realizaron revisiones menores |
Entrevista programada_1.2 | Otras revisiones menores |
Entrevista programada_2.0 | Cambios sustanciales |
Algunas recomendaciones
Fuente : UK Data Service
Software para control de versiones. El control puede ser manual o automático.
Hay que asegurarse de que todo el equipo conoce y comprende los estándares establecidos para la organización de carpetas y el nombramiento de ficheros.
Para ello hay que crear un documento quick guide y asegurarse de que todos los miembros tienen acceso y están formados.
Ejemplo de buena práctica:
Altmetrics_ 01_ Modelos_V3_20201121_YMG.
✓Altmetrics – (nombre del proyecto)
✓01 – (paquete de trabajo)
✓Modelosdata2021 – (datos del experimento, actividad, etc.)
✓V3 – (versión)
✓20201121 – (fecha)
✓YMG – (autor/a)
Nomenclatura de variables
Al crear nuestra base de datos o el dataset de trabajo se debe tener presente el nombrar correctamente las variables. Hacerlo de manera correcta ayudará a su identificación, agrupación, interpretación y reproducibilidad. Se puede elegir entre:
¿Qué hacer cuando son muchos los ficheros a re-nombrar?
- Ex: Imágenes generadas automáticamente por cámaras.
- Batch renaming (también conocido como “mass file renaming”, “bulk renaming”) mediante:
Ant Renamer
RenameIT
Bulk Rename Utility
File explorer de Windows
Más información