ARHIVIRANJE SPLETNIH STRANI V NARODNI IN UNIVERZITETNI KNJIŽNICI

Alenka Kavčič-Čolić, Janko Klasinc

Povzetek

IZVLEČEK

Narodna in univerzitetna knjižnica (NUK) raziskuje metode zajemanja spleta že od leta 2001, vendar je šele po letu 2006, s sprejetjem novega Zakona o obveznem izvodu publikacij, ki je vključeval tudi gradivo na spletu, lahko prevzela odgovornost za zbiranje in ohranjanje elektronskih publikacij na spletu v Sloveniji. K tej dejavnosti, ki se je začela izvajati leta 2008, je prispevalo tudi članstvo NUK-a v mednarodnem konzorciju International Internet Preservation Consortium (IIPC), ki ima zelo pomembno vlogo pri razvoju orodij za zajem spleta ter gradnji različnih aplikacij za arhiviranje in dostopu do spletnega arhiva. V prispevku je na kratko predstavljena kompleksnost postopka zajemanja spleta, pregled dosedanje mednarodne prakse in sodelovanje NUK-a v konzorciju IIPC. Posebno pozornost avtorja posvečata analizi zajema skupine spletišč s področja javne uprave od leta 2008. Najpomembnejše načrte za prihodnji razvoj spletnega arhiva predstavljajo povečanje pokritosti slovenskega spleta, razvoj uporabniškega vmesnika za javni dostop do arhiva in izboljšanje metod zajemanja tehnično problematičnih vsebin.

Ključne besede

spletni arhivi; Narodna in univerzietna knjižnica; analize zajema spletišč; javna uprava

Celotno besedilo:

PDF

Literatura

Abiteboul, S., Cobéna, G., Masanès, J. in Sedrati, G. (2002). A first experience in archiving the French web. V M. Agosti in C. Thanos (Ur.), Research and advanced technology for digital libraries. (str. 185–195). Berlin: Springer.

Arms, W. Y., Adkins, R., Ammen, C. in Hayes, A. (2001). Collecting and preserving the web: the Minerva prototype. RLG DigiNews, 5 (2). Pridobljeno 20. 8. 2010 s spletne strani: http://www.rlg.org/preserv/diginews/diginews5-2.html

Arvidson, A. (2002). The collection of Swedish web pages at the Royal library - The web heritage of Sweden. V 68th IFLA council and general conference, Libraries for life: democracy, diversity, delivery, August 18th - 24th 2002, Glasgow, Scotland. Pridobljeno 19. 8. 2010 s spletne strani: http://archive.ifla.org/IV/ifla68/papers/111-163e.pdf

Baeza-Yates, R. in Castillo, C. (2004). Crawling the infinite web. Journal of Web Engineering, 6 (1), 49–72.

Bergman, M. K. (2001). White paper: the deep web: surfacing hidden value. The Journal of Electronic Publishing, 7 (1). Pridobljeno 19. 8. 2010 s spletne strani: http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno=3336451.0007.104

Day, M. (2003). Collecting and preserving the World Wide Web. Bath: University of Bath. Pridobljeno 19. 8. 2010 s spletne strani: http://www.jisc.ac.uk/uploaded_documents/archiving_feasibility.pdf

Hakala, J. (2001). Collecting and preserving the web: developing and testing the NEDLIB harvester. RLG DigiNews, 5 (2). Pridobljeno 20. 8. 2010 s spletne strani: ttp://www.rlg.org/preserv/diginews/diginews5-2.html#feature2

Islovar. (2010). Ljubljana: Slovensko društvo Informatika. Dostopno na spletni strani: http://www.islovar.org/

Kahle, B. (1997). Preserving the Internet: an archive of the Internet may prove to be a vital record for historians, businesses and governments. Scientific American, 276 (3), 72–74. Pridobljeno 20. 8. 2010 s http://web.archive.org/web/19980627072808/http://www.sciam.com/0397issue/0397kahle.html

Kanič, I., Leder, Z., Ujčič, M., Vilar, P. in Vodeb, G. (2009). Bibliotekarski terminološki slovar. Knjižnica, 53 (3–4), 1–374.

Kavčič - Čolić, A. (2007). Arhiviranje slovenike na internetu: metodološki pristup. Doktorska disertacija. Zagreb: Filozofski fakultet. Pridobljeno 1. 9. 2010 s spletne strani: http://www.dlib.si/?urn=URN:NBN:SI:doc-W8KYSY1I.

Kavčič - Čolić, A. in Grobelnik, M. (2004). Archiving the Slovenian web: recent experiences. V 4th International Web Archiving Workshop (IWAW04), September 16 2004, Bath, UK. Bath: University. Pridobljeno 20. 8. 2010 s spletne strani: http://www.iwaw.net/04/index.html.

Klasinc, J. in Sešek, I. (2010). Zbiranje obveznega izvoda spletnih publikacij v narodni in univerzitetni knjižnici: zakonska podlaga in praktični vidiki. Knjižnica, 54 (1–2), 121–135.

Kurahashi, T. (2005). Collection development of the National Diet Library. CDNLAO Newsletter, 53. Pridobljeno 19. 8. 2010 s spletne strani: http://www.ndl.go.jp/en/publication/cdnlao/053/534.html

Masanès, J. (2005). Web archiving methods and approaches: a comparative study. Library Trends, 54 (1), 72–90.

Mladenić, D., Grobelnik, M. in Kavčič - Čolić, A. (2005). Initiatives to preserve Slovenian digital heritage. V P. Cunningham in M. Cunningham (Ur.), Innovation and knowledge economy: issues, applications, case studies (str. 993–998). Amsterdam [etc.]: IOS Press.

Mohr, G., Stack, M., Ranitovic, I., Avery, D. in Kimpton, M. (2004). An introduction to Heritrix: an open source archival quality web crawler. V 4th International Web Archiving Workshop (IWAW 2004). Pridobljeno 20. 8. 2010 s spletne strani: http://www.iwaw.net/04/Mohr.pdf

Musek, T. in Kragelj, M. (2007). Instalation of Web Curator Tool 1.1GA on Windows 2003 platform. Pridobljeno 19. 8. 2010 s spletne strani: http://webcurator.sourceforge.net/documentation.shtml

Pedley, P. (2001). The invisible web: searching the hidden parts of the internet. London: ASLIB-IMI.

Pravilnik o vrstah in izboru elektronskih publikacij za obvezni izvod (2007). Uradni list RS, št. 90.

Rauber, A., Aschenbrenner, A. in Witvoet, O. (2002). Austrian online archive processing: analyzing archives of the world wide web. V M. Agosti in C. Thanos (Ur.), Research and advanced technology for digital libraries. (str. 16–31). Berlin: Springer.

Sigurďsson, K. (2005). Incremantal crawling with Heritrix. V 5th International web archiving workshop (IWAW05), 22–23 September 2005, Vienna, Austria. Pridobljeno 20. 8. 2010 s spletne strani: http://www.iwaw.net/05/papers/iwaw05-sigurdsson.pdf

Zakon o obveznem izvodu publikacij. (2006). Uradni list RS, št. 69.

Zakon o obveznem pošiljanju tiskov. (1972). Uradni list RS, št. 55.