Polska literatura od 1989 roku zostanie poddana nowoczesnej analizie tekstu w amerykańskim Stanford Literary Lab
Nowe technologie dostarczają humanistom interesujących i nieoczywistych narzędzi pracy. Dr Maciej Maryl z Centrum Humanistyki Cyfrowej, działającego przy Instytucie Badań Literackich PAN, zamierza przy pomocy narzędzi stosowanych przez amerykańskich badaczy ze Stanford Literary Lab przeanalizować narracje dominujące w polskiej literaturze od 'przełomu’ w 1989 roku. O zastosowaniu dużych baz danych w analizie tekstów literackich oraz swoim projekcie naukowiec opowiadał w rozmowie z PAP.
Mimo powtarzających się pogłosek o kryzysie rynku książki, urósł on w dzisiejszych czasach do gigantycznych rozmiarów. W USA – jednym z największych rynków księgarskich na świecie – w jednym tylko roku wydano ponad 300 tysięcy nowych książek. Liczba wydawanych tytułów zwiększa się również w Polsce. Według danych Biblioteki Narodowej w 1991 roku w naszym kraju wydano prawie 10,7 tysiąca książek; w 2016 roku było to już ponad 34 tysiące pozycji. Choć są to pozytywne wieści, to istnieje pewna grupa zawodowa, dla której wciąż rosnąca liczba tytułów może stanowić problem. Są nią literaturoznawcy.
„Biorąc pod uwagę aktualny przyrost liczby książek, niemożliwe jest, aby ktoś przeczytał je wszystkie” – mówi PAP dr Maciej Maryl z Centrum Humanistyki Cyfrowej działającego przy Instytucie Badań Literackich PAN. Tradycyjną metodą radzenia sobie z tego typu problemami jest zajmowanie się tylko wybranymi książkami – w tym jednak wypadku badacz świadomie musi rezygnować z ogromnego zasobu potencjalnego materiału.
Do problemu można jednak podejść też z innej strony; umożliwiają to różnego rodzaju nowe technologie. Jak się okazuje, tzw. „humanistyka cyfrowa” może być bardzo cennym narzędziem w rękach literaturoznawcy. Dr Maryl przypomina jednak, że metody stosowane przez „cyfrowych humanistów” mają swoje korzenie w czasach „przedcyfrowych”.
„To, co nazywamy dzisiaj humanistyką cyfrową, nie jest w zasadzie rzeczą nową” – podkreśla. „Metody wykorzystywane w humanistyce cyfrowej istniały już wcześniej, jednak postęp technologiczny, a zwłaszcza postępująca cyfryzacja tekstów kultury, umożliwił w ostatnich latach ich gwałtowny rozwój”.
„’Cyfrowość’ humanistyki ma tutaj kilka wymiarów” – kontynuuje badacz. „Owszem, można ją rozumieć w dosłowny sposób, jako korzystanie z mediów i narzędzi cyfrowych – i w tym ujęciu większość współczesnych badaczy humanistycznych jest już humanistami cyfrowymi”. Część z nich idzie jednak o krok dalej, wykorzystując metody cyfrowe do analizy kultury i jej wytworów.
Przykładem takiego podejścia jest stylometria, najszybciej się dziś rozwijająca gałąź filologii cyfrowej, w której rozwój znaczący wkład mają polscy badacze: dr hab. Maciej Eder i dr Jan Rybicki. „Chodzi tutaj o badanie stylu autora tekstu – ale nie w znaczeniu pięknego języka” – opowiada dr Maryl. „Chodzi tu o ilościowe badanie tekstów, które pozwala dowieść np. ich autorstwa” – wyjaśnia. Dokonuje się tego za pomocą porównywania najczęściej używanych w tekście słów. Jak się okazuje, na tej właśnie podstawie można z dużym prawdopodobieństwem dowieść, kto dany tekst stworzył.
Zastosowania stylometrii dawno już wyszły zresztą poza teorię. Dzisiaj najlepsi specjaliści w tej dziedzinie stosują swoją wiedzę w walce z terroryzmem, analizując np. korespondencję osób podejrzanych.
Jako inny przykład wykorzystania możliwości tworzonych przez nowoczesne technologie dr Maryl podaje książkę „The Bestseller Code” Matthew Jockersa i Jodie Archer. „Za pomocą metod makroanalitycznych analizują oni bestsellery rynku wydawniczego” – tłumaczy dr Maryl. „Tym sposobem próbują określić cechy współczesnego bestsellera na ogromnej próbie 5 tysięcy powieści i sprawdzić czego ludzie mogą w nich poszukiwać. Takie badania mogą być bardzo cenną informacją dla poszukujących nowych tytułów wydawnictw” – dodaje.
Tego typu podejście określane jest przez badaczy literatury jako „distant reading”, co można przetłumaczyć jako „czytanie z daleka”. „To spojrzenie 'z góry’ na dużą ilość tekstu. Zaletą tego podejścia jest to, że możemy pracować ze wszystkimi dostępnymi tekstami i analizować ich język, tematykę czy styl” – tłumaczy rozmówca PAP.
Aby jednak umożliwić zainteresowanym badaczom „czytanie z daleka”, niezbędne jest opracowanie w formie cyfrowej ogromnych baz danych. Między innymi temu służy projekt „Polska Bibliografia Literacka – laboratorium wiedzy o współczesnej kulturze polskiej”, realizowany w Centrum Humanistyki Cyfrowej ze środków Narodowego Programu Rozwoju Humanistyki. W jego ramach tworzona jest kompletna baza bibliograficzna, która docelowo ma objąć literaturę i sztuki pokrewne z lat 1939?2002.
„Te informacje i ich powiązania same w sobie nic nam nie powiedzą – ale mogą posłużyć za podstawę przy badaniu i interpretacji funkcjonowania tekstów w naszej kulturze” – stwierdza dr Maryl. „Metody humanistyki cyfrowej znacznie rozszerzają nasz badawczy punkt widzenia” – mówi.
W nadchodzącym roku akademickim dr Maryl będzie kontynuować swoje badania w Stanford Literary Lab – jednym z najważniejszych ośrodków cyfrowych badań filologicznych – przy Stanford University (USA). W ramach prestiżowego stypendium Polsko-Amerykańskiej Komisji Fulbrighta będzie tam realizował projekt zatytułowany „Przełom literacki widziany z góry. Ilościowa historia literatury polskiej (1989-2000)”.
„Za pomocą narzędzi, którymi posługują się badacze ze Stanford Literary Lab, chcę spróbować zobaczyć, czy opinie badaczy dotyczące procesów zachodzących w tym okresie w polskim życiu literackim znajdują swoje odzwierciedlenie w danych” – tłumaczy rozmówca PAP. „Z wypowiedzi krytyków i badaczy literatury 'przełomu’, już na pierwszy rzut oka wyłania się pewna narracja” – zaznacza. Jak wyjaśnia, w przełom roku 1989 Polska wchodzi jako bardzo scentralizowana, zarządzana państwowo kultura. Następnie kultura ta ulega rozproszeniu: w całym kraju otwierają się różne pisemka literackie, wychodzi masa nowych publikacji. Dominująca staje się tematyka polityczna – zagadnienia takie jak państwo i demokracja ? czy tematy lokalne.
„Ale i ten stan nie trwa długo – w okolicach 1995 roku punktem odniesienia staje się grupa 'klasyków’ – mam tutaj na myśli Szymborską, Miłosza, Herberta, Różewicza. Pod koniec dekady zaczynamy z kolei zmierzać do kolejnej centralizacji, ale tym razem komercyjnej: duże wydawnictwa wypierają te mniejsze, z braku środków zaczynają też upadać pisma literackie” – przypomina.
Czy tę narrację badaczy literatury da się zrekonstruować za pomocą danych o literaturze? Tego właśnie chce się dowiedzieć dr Maryl. „Obraz, który rekonstruuję, to tak naprawdę tylko pewne tezy interpretacyjne literaturoznawców” – stwierdza. „Dopiero analiza ilościowa – przeprowadzona na podstawie artykułów z czasopism literaturoznawczych oraz zawartości Polskiej Bibliografii Literackiej – pokaże nam, czy te wrażenia da się potwierdzić danymi” – mówi.
[am, kflo, ekr]
źródło: naukawpolsce.pap.pl, Katarzyna Florencka
Kategoria: newsy