top of page

Microform digitization service: Microfilms & Microfiches

Microfilm is a type of microphotographic film, used in the archiving and data retention industry. This type of media stores documents that are reduced by 24 or 36 times (or even more) to generate micro-scale copies of the original documents. It is part of the microform family, alongside microfiche. The main advantage of microfilm is its lifespan, which is estimated at more than 500 years. It was in 1936 that the American Library began approving microfilm and it was there that the technology began to develop. A reel (height is 16 mm, 35 mm or 105 mm, the length of the microfilm is variable but it is generally 30.5 m or 66 m) can contain up to 2500 documents. This makes it easy to store tens of millions of archive pages in small spaces. But microfilm remains a challenge for daily use (research, consultation, duplication, sharing, etc.).

Microfiche uses the same technology as microfilm. It is generally available in sheets of 148 x 105 mm.

Digitization of Microfiches 

Pour les données : 

Alto XML : Un fichier Alto XML est un format de fichier utilisé principalement dans le domaine de la numérisation et de la transcription de documents textuels, en particulier dans le domaine de la bibliothéconomie et de la gestion des archives. Alto (Analyzed Layout and Text Object) est un format XML normalisé par la Library of Congress (LoC) et la Bibliothèque nationale d'Allemagne pour représenter les données extraites à partir de documents numérisés. Il est conçu pour représenter de manière structurée les informations sur la mise en page et le contenu textuel des documents, ce qui facilite la recherche, la manipulation et l'analyse automatisée de ces documents. Un fichier Alto XML contient des balises qui décrivent la disposition spatiale du texte sur une page, y compris des informations sur les blocs de texte, les lignes, les mots et les caractères. Il peut également inclure des métadonnées sur le document, telles que le titre, l'auteur, la date de publication, etc. Ce format est largement utilisé dans les projets de numérisation de bibliothèques et d'archives pour stocker et échanger des données textuelles numérisées de manière normalisée et interopérable.

Format CSV & XLSX :  Les formats CSV (Comma-Separated Values) et XLSX (Excel Open XML Spreadsheet) sont deux formats de fichiers couramment utilisés pour stocker des données tabulaires, mais ils présentent des différences significatives :

Structure du fichier :

CSV : Un fichier CSV est un fichier texte brut où les données sont organisées sous forme de tableau, avec les valeurs séparées par des virgules (ou d'autres délimiteurs, comme des points-virgules ou des tabulations). Il ne prend pas en charge la mise en forme, les formules ou les feuilles de calcul multiples.
XLSX : Un fichier XLSX est un fichier binaire basé sur XML utilisé par Microsoft Excel. Il peut contenir plusieurs feuilles de calcul, des formules, des graphiques, des mises en forme de cellules avancées, des images, etc. Il conserve la structure des données, ainsi que des métadonnées supplémentaires telles que les formats de cellules et les macros.


Compatibilité logicielle :

CSV : Étant un format de texte brut universel, les fichiers CSV peuvent être ouverts et lus par une grande variété de logiciels, y compris les éditeurs de texte simples et les applications de feuilles de calcul.
XLSX : Les fichiers XLSX sont spécifiquement conçus pour être utilisés avec Microsoft Excel et nécessitent généralement un logiciel compatible, tel que Microsoft Excel, LibreOffice Calc, Google Sheets, etc.


Taille du fichier :

CSV : Les fichiers CSV tendent à être plus compacts que les fichiers XLSX, car ils sont stockés sous forme de texte brut et ne contiennent généralement pas d'informations de mise en forme supplémentaires.
XLSX : Les fichiers XLSX peuvent être plus volumineux que les fichiers CSV en raison de leur structure binaire et de la possibilité d'inclure des fonctionnalités avancées telles que des formules, des graphiques et des images.


Traitement des données :

CSV : Les fichiers CSV sont plus simples à traiter et à manipuler programmation car ils sont basés sur du texte brut et ne nécessitent aucun logiciel spécialisé pour les lire.
XLSX : Les fichiers XLSX peuvent être plus complexes à manipuler en programmation en raison de leur structure binaire et de la nécessité d'utiliser des bibliothèques ou des API spécifiques pour lire et écrire des données.

Format XML : XML, ou eXtensible Markup Language, est un langage de balisage utilisé pour stocker et échanger des données de manière lisible par les humains et les machines. Il a été conçu pour être extensible et adaptable à une grande variété de besoins de représentation de données. Voici quelques caractéristiques clés du format XML :

Structuration des données : XML permet de structurer les données en utilisant des balises définies par l'utilisateur. Les balises sont utilisées pour marquer les éléments et les attributs des données, ce qui permet de les organiser de manière hiérarchique.

Lisibilité humaine : Les documents XML sont généralement écrits dans un format lisible par les humains, ce qui facilite la compréhension et la modification manuelle des données sans avoir besoin d'outils spécialisés.

Extensibilité : XML est extensible, ce qui signifie que les utilisateurs peuvent définir leurs propres balises et structures de données pour répondre à leurs besoins spécifiques. Cela le rend adapté à une grande variété d'applications et de domaines d'utilisation.

Interopérabilité : XML est largement utilisé dans les systèmes informatiques pour échanger des données entre différentes applications et plateformes. Sa structure simple et son format texte le rendent facilement lisible et interprétable par les systèmes informatiques, ce qui favorise l'interopérabilité des données.

Support pour les métadonnées : XML est souvent utilisé pour stocker des métadonnées associées à des documents ou des éléments de données. Les balises peuvent être utilisées pour décrire des informations telles que le titre, l'auteur, la date, etc.

Traitement avec des langages spécifiques : XML est souvent utilisé en conjonction avec d'autres langages de programmation, tels que XPath, XSLT, et XML Schema, qui fournissent des fonctionnalités pour rechercher, transformer et valider des documents XML.

bottom of page