Metodika řešení

Robert Kalivoda

Řešení projektu je v souladu se zadávací dokumentací rozděleno do pěti etap dle jednotlivých let řešení. Tyto etapy lze dle hlavních cílů rozdělit do dvou fází:

  1. analytické;
  2. implementační a interpretační.

1) ANALYTICKÁ FÁZE
2023–2024

  • Hlavní cíl první etapy (2023): zahájení tvorby tří souborů korespondence intelektuálních elit (A: 1580–1670, B: 1870–1939, C: 1939–1989) pro databázi NETLET Czech Correspondence Online a příprava zadání pro vývoj softwarových nástrojů.
  • Hlavní cíl druhé etapy (2024): pokračování v tvorbě tří souborů korespondence intelektuálních elit (A, B, C) pro databázi NETLET Czech Correspondence Online a dokončení vývoje a testování nástroje NETLET Converter; jeho využití pro extrakci metadat z tištěných edic.

Řešení bude vycházet z potřeb databáze, která bude zahrnovat strukturovaná metadata obsahující především údaje o osobách (odesílatel, adresát, osoby zmiňované), čase (datace dopisu, údaje o obdržení), místech (místo odeslání, místo určení, místa zmiňovaná), jazyce dokumentu, klíčových slovech, údaje o uložení. Výběrově budou k dispozici i plné texty dopisů.

Aktivity, které povedou k naplnění hlavních cílů první a druhé etapy, a zapojení členů řešitelského týmu

  1. Vytvoření subdatabází jednotlivých korespondenčních souborů reprezentujících tři základní časová období (A: 1580–1670, B: 1870–1939, C: 1939–1989). Pro období A budou revidována, doplněna a nově zpracována metadata korespondence Amanda Polana z Polansdorfu (cca 320 korespondenčních jednotek), Jana Amose Komenského (cca 560 korespondenčních jednotek), Philippa Jakoba Sachse z Löwenheimu (cca 140 korespondenčních jednotek), Jana Marka Marciho z Kronlandu (cca 55 korespondenčních jednotek) a jezuitských učenců (cca 200 korespondenčních jednotek). Na této aktivitě budou pracovat Iva Lelková, Marcela Slavíková a Vladimír Urbánek. Pro období B budou zadána metadata korespondence T. G. Masaryka (2000 korespondenčních jednotek), metadata korespondence Aloise Musila (1500 korespondenčních jednotek), metadata korespondence Otokara Březiny (2000 korespondenčních jednotek) a metadata korespondence Jakuba Demla (1500 korespondenčních jednotek), zčásti též její plné texty (500 korespondenčních jednotek). Na této aktivitě se budou podílet Jitka Jindřišková, Soňa Martinovská, Adéla Jůnová Macková, Pavel Žďárský, Daniela Iwashita, Šárka Kořínková, Eliška Müllerová a další zadavatelé (formou DPP). Pro období C budou zadána metadata a plné texty části korespondence Jakuba Demla (500 korespondenčních jednotek) a revidována a doplněna metadata korespondence Milady Blekastad-Topičové (2500 korespondenčních jednotek). Nově bude zpracována a do databáze zadána korespondence Jaromíra Neumanna (600 korespondenčních jednotek) a část korespondence Jana Patočky (340 korespondenčních jednotek). Dále budou doplněna a revidována metadata korespondence Roberta Kalivody (1000 korespondenčních jednotek). Na této aktivitě budou pracovat Daniela Iwashita, Šárka Kořínková, Eliška Müllerová a další dva zadavatelé za FLÚ (formou DPP). Odpovědnou osobou za tuto aktivitu bude Vladimír Urbánek v součinnosti s koordinátory jednotlivých podtýmů.
  2. Zároveň budou optimalizovány nástroje prohledávání všech subdatabází najednou v českém i anglickém jazyce, synchronizována klíčová slova a bude umožněna společná aplikace analytických nástrojů vyvinutých v rámci projektu. Na této aktivitě se budou podílet všichni členové podtýmů uvedení v bodu a), osobou odpovědnou za tuto aktivitu bude Martin Lhoták.
  3. Vytvoření informační webové stránky, která vznikne v prvním roce řešení projektu (2023). Za tuto aktivitu je odpovědný podtým KNAV.

Hlavním aplikovaným výsledkem prvních dvou etap (tj. první fáze projektu) bude vývoj a zprovoznění nástroje na poloautomatizované vytváření metadat z vybraných knižních edic korespondence, který bude v rámci projektu aplikován zejména na korespondenci Otokara Březiny, Jakuba Demla, T. G. Masaryka a Jana Patočky. Za tímto účelem bude vyvinut softwarový nástroj NETLET Edition Converter. Tuto aktivitu bude realizovat KNAV, přičemž na přípravě podkladů, definici zadání a testování se budou podílet spoluřešitelé z MÚA, ÚČL, FLÚ a PNP.

2) IMPLEMENTAČNÍ A INTERPRETAČNÍ FÁZE
2025–2027

  • Hlavní cíl třetí etapy (2025): vývoj a testování softwarových nástrojů NETLET Visualisation and Analysis a NETLET HIKO, pokračování v tvorbě tří souborů korespondence (A, B, C) a další využívání nástroje NETLET Converter.
  • Hlavní cíl čtvrté etapy (2026): dokončení a zveřejnění softwarových nástrojů NETLET Visualisation and Analysis a NETLET HIKO, kontrola formátu a kompatibility dat tří souborů korespondence (A, B, C) a příprava a odevzdání dvou publikačních výstupů Jsc.
  • Hlavní cíl páté etapy (2027): dokončení vývoje a zveřejnění specializované databáze NETLET Czech Correspondence Online, dokončení kontroly kompatibility tří souborů korespondence intelektuálních elit (A, B, C), příprava a odevzdání dvou publikačních výstupů Jsc a jednoho Jost, realizace konference prezentující výsledky projektu.

Aktivity, které povedou k naplnění hlavních cílů třetí, čtvrté a páté etapy, a zapojení členů řešitelského týmu:

  1. Vývoj, testování a finalizace nástroje síťové analýzy a digitálních vizualizací NETLET Analysis and Visualisation aplikovaného na shromážděná metadata korespondenčních souborů; vývoj a dokončení softwarového nástroje NETLET HIKO; testování funkčnosti, integrace softwaru a dokončení specializované databáze NETLET Czech Correspondence Online.
  2. Aplikace nástroje síťové analýzy a digitálních vizualizací NETLET Analysis and Visualisation na metadata obsažená v databázi s cílem zkoumat 1) centralitu aktérů korespondence v dané korespondenční síti; 2) míru jejich zprostředkovatelské pozice mezi dvěma a více sítěmi; 3) kocitační sítě mapující v dopisech zmiňované osoby ve vztahu ke specifickým tématům či debatám; a vytvořit digitální vizualizace zaměřené 4) na geografický horizont jednotlivých osobních korespondenčních souborů; 5) na komparativně pojatá mapová zobrazení v rámci tří hlavních období; 6) na statisticky pojaté grafy a časové osy porovnávající dynamiku vývoje jednotlivých korespondenčních celků v časové dimenzi; 7) na schémata zobrazující vztahy mezi jednotlivými pisateli a příjemci dopisů; 8) na schémata zobrazující korespondenční vztahy mezi různými profesními skupinami; 9) na schémata zobrazující tematická propojení dopisů a korespondenčních celků.
  3. Příprava odborných studií k publikaci.
  4. Uspořádání konference, na níž budou širší odborné veřejnosti představeny výsledky projektu.

Za aktivitu a) bude odpovídat Martin Lhoták a tým KNAV, na definici funkčnosti, testování a finálním dolaďování se budou podílet členové všech podtýmů (FLÚ, MÚA, ÚČL, PNP). 

Za aktivitu b) ponese odpovědnost Vladimír Urbánek a tým FLÚ. 

Za aktivitu c) ponesou odpovědnost Vladimír Urbánek, Martin Lhoták, Daniela Iwashita a Lucie Merhautová, na studiích se budou rovněž podílet členové podtýmů.

Za aktivitu d) ponesou odpovědnost koordinátoři jednotlivých podtýmů (Vladimír Urbánek, Martin Lhoták, Jitka Jindřišková, Daniela Iwashita a Tomáš Pavlíček). 

Hlavními aplikovanými výsledky třetí, čtvrté a páté etapy (druhá fáze projektu) budou:

  • 2026: softwarový nástroj NETLET Analysis and Visualisation, který umožní síťovou analýzu a digitální vizualizace využívající shromážděná metadata korespondenčních souborů různých osobností a zdokonalí funkcionalitu dosud dostupných digitálních nástrojů, jako jsou Palladio, Raw, Gephi, Sigma.js a Polymaps. 
  • 2026: softwarový nástroj NETLET HIKO, který umožní hromadné importy dat získané z tištěných edic a propojení na nadstavbové vizualizační a analytické rozhraní NETLET Visualisation and Analysis.
  • 2027: specializovaná databáze NETLET Czech Correspondence Online naplněná daty vytvořenými v průběhu projektu, která bude ke svému provozu využívat software NETLET HIKO a do jejíhož veřejného rozhraní bude implementován analytický nástroj NETLET Analysis and Visualisation. 

Publikačními a konferenčními výsledky třetí, čtvrté a páté etapy (druhá fáze projektu) budou:

  • 2026: 2 studie v odborných časopisech typu Jsc
  • 2027: 2 studie v odborných časopisech typu Jsc; 1 studie v odborném časopisu typu Jost; odborná konference shrnující výsledky projektu

Soubor interpretačních studií využije digitální vizualizace vytvořené pomocí softwarového nástroje NETLET Analysis and Visualisation.

Vývoj bude veřejně dostupný na Githubu a veškeré softwarové nástroje budou k dispozici pod open source licencí (GNU GPL, LGPL nebo MIT). V rámci vývoje nástrojů budou mimo jiné využity metody strojového učení, které umožní vyšší efektivitu a automatizaci.