Au Danemark et en Norvège, des chercheurs ont mis à disposition un corpus monumental baptisé Enevaeldens Nyheder Online. Cette base regroupe 474 millions de mots, tirés de journaux publiés entre 1660 et 1849, à l’époque de l’absolutisme.
Grâce aux technologies de reconnaissance optique de caractères (OCR) améliorées par intelligence artificielle, les textes sont désormais lisibles et exploitables. Ce corpus ouvre de nouvelles pistes pour les historiens, linguistes et spécialistes des médias, en offrant une vision sans précédent de la vie politique, sociale et culturelle dans la Scandinavie d’Ancien Régime.