Sobre l’Hemeroteca
L’hemeroteca digital de la Biblioteca Ramon Berenguer IV s’ha construït per conservar, continuar i tenir cura del recull de premsa recopilat el 2017 per l’Aleix Núñez i que s’organitza en anuaris que van de l’any 1981 a l’any 2017. Aquests van ser publicats en PDF i ordenats en el web “Recull de premsa” que, fins fa poc, s’allotjava dins la plataforma de blogging Worpress.com. L’any 2023 es decideix integrar aquests mateixos continguts en l’actual web de la Biblioteca, afegint-li algunes noves funcionalitats com la cerca de contingut textual.
Aspectes tècnics
S’han reescanejat els arxius originals amb OCR (sigles en anglès de “reconeixement ocular de caracters”) i se’ls hi ha tractat la metadata per ser aptes per als cercadors, tant interns (dins la mateixa web) com externs (Google, Bind, DuckDuckGo, etc. ). Els arxius resultants d’aquesta operació segueixen l’estàndard PDF/A-2b, segona part de l’estàndard ISO PDF/A [ISO 19005-2:2010], que és una forma restringida de la versió 1.7 d’Adobe PDF. Aquesta, utilitzada habitualment en arxius, biblioteques o administracions de justícia, és adequada per a la conservació a llarg termini de documents. Així mateix, serveix per assegurar que l’aparença visual renderitzada conservi les propietats estructurals i semàntiques dels documents amb el requisit addicional que tot el text del document té equivalents Unicode.