OpenAlt - 5. až 7. listopadu 2016

Otevřeným přístupem k otevřené společnosti

Mezi snem a realitou: Otevřená data českého webového archivu.

Rudolf Kreibich (Webový archiv Národní Knihovny ČR)
Knihovní a autorský zákon omezuje volné zpřístupnění celého českého webového archivu. Jednou ze strategií jak v takovém legislativním rámci poskytovat služby veřejnosti, je zpřístupňovat metadata k jednotlivým archivním exemplářům. Český webový archiv zatím žádnou Open Data službu neposkytuje, ale postupně se konceptuálně připravuje na její spuštění. Touto přednáškou chceme navázat kontakt s komunitou mimo paměťové instituce a nejlépe získat zpětnou vazbu o tom, jak by taková služba měla vypadat. Přednáška nejdříve stručně představí proč jsou webové archivy důležité a čemu zajímavému se nyní věnuje mezinárodní komunita webových archivů. Představíme např. Common Crawl, kontejner WARC a popíšeme zavedené metadatové formáty a jaká data obsahují. Řekneme si, které data můžeme někdy zpřístupnit a které do změny legislativní rámce určitě ne. Nakonec se zasníme, jaké algoritmy bychom rádi pustili vůči našemu archivu a jaká data bychom o našem archivu získali.