top of page

Servicio de digitalización de microformas: Microfilmes y Microfichas

El microfilm es un tipo de película microfotográfica que se utiliza en la industria del archivo y la retención de datos. Este tipo de soporte almacena documentos que se reducen 24 o 36 veces (o incluso más) para generar copias a microescala de los documentos originales. Forma parte de la familia de las microformas, junto con las microfichas. La principal ventaja del microfilm es su vida útil, que se estima en más de 500 años. Fue en 1936 que la Biblioteca Americana comenzó a aprobar microfilmes y fue allí donde la tecnología comenzó a desarrollarse. Una bobina (la altura es de 16 mm, 35 mm o 105 mm, la longitud del microfilme es variable pero generalmente es de 30,5 mo 66 m) puede contener hasta 2500 documentos. Esto facilita el almacenamiento de decenas de millones de páginas de archivo en espacios pequeños. Pero el microfilm sigue siendo un desafío para el uso diario (investigación, consulta, duplicación, intercambio, etc.).

La microficha utiliza la misma tecnología que el microfilm. Generalmente está disponible en hojas de 148 x 105 mm.

Digitalización de Microfichas 

Pour les données : 

Alto XML : Un fichier Alto XML est un format de fichier utilisé principalement dans le domaine de la numérisation et de la transcription de documents textuels, en particulier dans le domaine de la bibliothéconomie et de la gestion des archives. Alto (Analyzed Layout and Text Object) est un format XML normalisé par la Library of Congress (LoC) et la Bibliothèque nationale d'Allemagne pour représenter les données extraites à partir de documents numérisés. Il est conçu pour représenter de manière structurée les informations sur la mise en page et le contenu textuel des documents, ce qui facilite la recherche, la manipulation et l'analyse automatisée de ces documents. Un fichier Alto XML contient des balises qui décrivent la disposition spatiale du texte sur une page, y compris des informations sur les blocs de texte, les lignes, les mots et les caractères. Il peut également inclure des métadonnées sur le document, telles que le titre, l'auteur, la date de publication, etc. Ce format est largement utilisé dans les projets de numérisation de bibliothèques et d'archives pour stocker et échanger des données textuelles numérisées de manière normalisée et interopérable.

Format CSV & XLSX :  Les formats CSV (Comma-Separated Values) et XLSX (Excel Open XML Spreadsheet) sont deux formats de fichiers couramment utilisés pour stocker des données tabulaires, mais ils présentent des différences significatives :

Structure du fichier :

CSV : Un fichier CSV est un fichier texte brut où les données sont organisées sous forme de tableau, avec les valeurs séparées par des virgules (ou d'autres délimiteurs, comme des points-virgules ou des tabulations). Il ne prend pas en charge la mise en forme, les formules ou les feuilles de calcul multiples.
XLSX : Un fichier XLSX est un fichier binaire basé sur XML utilisé par Microsoft Excel. Il peut contenir plusieurs feuilles de calcul, des formules, des graphiques, des mises en forme de cellules avancées, des images, etc. Il conserve la structure des données, ainsi que des métadonnées supplémentaires telles que les formats de cellules et les macros.


Compatibilité logicielle :

CSV : Étant un format de texte brut universel, les fichiers CSV peuvent être ouverts et lus par une grande variété de logiciels, y compris les éditeurs de texte simples et les applications de feuilles de calcul.
XLSX : Les fichiers XLSX sont spécifiquement conçus pour être utilisés avec Microsoft Excel et nécessitent généralement un logiciel compatible, tel que Microsoft Excel, LibreOffice Calc, Google Sheets, etc.


Taille du fichier :

CSV : Les fichiers CSV tendent à être plus compacts que les fichiers XLSX, car ils sont stockés sous forme de texte brut et ne contiennent généralement pas d'informations de mise en forme supplémentaires.
XLSX : Les fichiers XLSX peuvent être plus volumineux que les fichiers CSV en raison de leur structure binaire et de la possibilité d'inclure des fonctionnalités avancées telles que des formules, des graphiques et des images.


Traitement des données :

CSV : Les fichiers CSV sont plus simples à traiter et à manipuler programmation car ils sont basés sur du texte brut et ne nécessitent aucun logiciel spécialisé pour les lire.
XLSX : Les fichiers XLSX peuvent être plus complexes à manipuler en programmation en raison de leur structure binaire et de la nécessité d'utiliser des bibliothèques ou des API spécifiques pour lire et écrire des données.

Format XML : XML, ou eXtensible Markup Language, est un langage de balisage utilisé pour stocker et échanger des données de manière lisible par les humains et les machines. Il a été conçu pour être extensible et adaptable à une grande variété de besoins de représentation de données. Voici quelques caractéristiques clés du format XML :

Structuration des données : XML permet de structurer les données en utilisant des balises définies par l'utilisateur. Les balises sont utilisées pour marquer les éléments et les attributs des données, ce qui permet de les organiser de manière hiérarchique.

Lisibilité humaine : Les documents XML sont généralement écrits dans un format lisible par les humains, ce qui facilite la compréhension et la modification manuelle des données sans avoir besoin d'outils spécialisés.

Extensibilité : XML est extensible, ce qui signifie que les utilisateurs peuvent définir leurs propres balises et structures de données pour répondre à leurs besoins spécifiques. Cela le rend adapté à une grande variété d'applications et de domaines d'utilisation.

Interopérabilité : XML est largement utilisé dans les systèmes informatiques pour échanger des données entre différentes applications et plateformes. Sa structure simple et son format texte le rendent facilement lisible et interprétable par les systèmes informatiques, ce qui favorise l'interopérabilité des données.

Support pour les métadonnées : XML est souvent utilisé pour stocker des métadonnées associées à des documents ou des éléments de données. Les balises peuvent être utilisées pour décrire des informations telles que le titre, l'auteur, la date, etc.

Traitement avec des langages spécifiques : XML est souvent utilisé en conjonction avec d'autres langages de programmation, tels que XPath, XSLT, et XML Schema, qui fournissent des fonctionnalités pour rechercher, transformer et valider des documents XML.

bottom of page