Polscy naukowcy przeanalizowali dzieła światowej literatury. Odkryli te same wzorce interpunkcji w różnych językach

20 kwietnia 2023

W kilkuset dziełach literackich powstałych w siedmiu językach, głównie zachodnich, zaobserwowano te same cechy statystyczne schematów używania znaków przestankowych – informują naukowcy z Instytutu Fizyki Jądrowej Polskiej Akademii Nauk.

„Chwila zawahania… Tak, tu kropka – ale czy przecinek na pewno należy postawić tam? A może lepszy byłby myślnik? Interpunkcja potrafi przysparzać kłopotów; często się ją wręcz lekceważy. Błąd! Z najnowszych analiz statystycznych wyłania się inny jej obraz: interpunkcja zdaje się 'wyrastać’ z fundamentów współdzielonych przez wszystkie (poddane badaniu) języki, a jej cechy są dalekie od trywialnych” – czytamy w komunikacie Instytutu Fizyki Jądrowej PAN w Krakowie. Fragment ten swoją drogą kompiluje użycie 10 znaków przestankowych (a są to: wielokropek, przecinek, myślnik, znak zapytania, średnik, kropka, znak wykrzyknienia, dwukropek, cudzysłów i nawiasy).

Naukowcy z IFJ PAN wzięli na warsztat kilkaset dzieł powstałych w siedmiu językach, głównie zachodnich. Zaobserwowali tam te same cechy statystyczne schematów używania znaków przestankowych. Wyniki ich badań ukazały się w czasopiśmie „Chaos, Solitons & Fractals”.

„Interpunkcja (…) okazuje się być uniwersalnym i niezbędnym dopełnieniem matematycznej perfekcji każdego badanego języka” – podsumowano wnioski z badań.

„Obecne analizy są rozwinięciem naszych wcześniejszych wyników nad multifraktalnymi cechami zmienności długości zdań dzieł literatury światowej” – mówi prof. Stanisław Drożdż. I zwraca uwagę: „Czym bowiem jest długość zdania? To nic innego jak odległość do kolejnego, konkretnego znaku interpunkcyjnego: kropki. Teraz wzięliśmy więc pod statystyczną lupę wszystkie znaki interpunkcyjne, przyjrzeliśmy się także, co się dzieje z interpunkcją podczas tłumaczeń”.

Dzieła poddane analizie

Badaniom poddano dwa zbiory tekstów. Główne analizy dotyczące interpunkcji wewnątrz każdego z języków przeprowadzono na 240 cieszących się dużą popularnością dziełach literackich, napisanych w siedmiu językach, głównie zachodnich: angielskim (44), niemieckim (34), francuskim (32), włoskim (32), hiszpańskim (32), polskim (34) i rosyjskim (32).

Osobny zbiór przygotowano pod kątem obserwacji stabilności interpunkcji w tłumaczeniach. Zawierał on 14 dzieł, z których każde było dostępne w każdym z badanych języków.

Łącznie w obu zbiorach wśród autorów znaleźli się tacy twórcy jak: Joseph Conrad, Charles Dickens, Arthur Conan Doyle, Ernest Hemingway, Rudyard Kipling, George Orwell, J.D. Salinger, Virginia Woolf, Günter Grass, Franz Kafka, Thomas Mann, Friedrich Nietzsche, Johann Wolfgang von Goethe, Madame de La Fayette, Alexandre Dumas, Victor Hugo, Marcel Proust, Jules Verne, Umberto Eco, Miguel de Cervantes, Henryk Sienkiewicz czy Władysław Reymont.

Odległości między kolejnymi znakami interpunkcyjnymi

Uwagę krakowskich badaczy przykuł przede wszystkim rozkład statystyczny odległości między kolejnymi znakami interpunkcyjnymi. Szybko się okazało, że we wszystkich badanych językach najlepiej opisuje go jeden z precyzyjnie określonych wariantów rozkładu Weibulla.

Krzywa tego typu ma charakterystyczny kształt: początkowo rośnie gwałtownie, by po osiągnięciu wartości maksymalnej nieco wolniej opaść do pewnej wartości krytycznej, poniżej której zdąża do zera już z małą i ciągle malejącą dynamiką.

Rozkładem Weibulla zwykle opisuje się zjawiska związane z przetrwaniem (np. liczbę ludności w funkcji wieku), ale także różne procesy fizyczne, jak choćby rosnące zmęczenie materiałów.

„Zgodność rozkładu długości sekwencji wyrazów między znakami interpunkcyjnymi z funkcjonalną postacią rozkładu Weibulla była tym lepsza, im więcej rodzajów znaków interpunkcyjnych uwzględnialiśmy w analizach; dla wszystkich znaków zgodność ta okazywała się niemal pełna. Jednocześnie między poszczególnymi językami są widoczne pewne różnice w rozkładach, ale sprowadzają się one tylko do doboru nieco innych wartości parametrów rozkładu, charakterystycznych dla danego języka. Interpunkcja wydaje się więc być integralną częścią wszystkich badanych języków” – zauważa prof. Drożdż.

Prawdopodobieństwo wystąpienia kolejnego znaku interpunkcyjnego

Kolejny etap analiz polegał na wyznaczaniu funkcji hazardu. W przypadku interpunkcji opisuje ona, jak zmienia się warunkowe prawdopodobieństwo sukcesu – czyli prawdopodobieństwo wystąpienia kolejnego znaku interpunkcyjnego – jeśli w analizowanej sekwencji żaden taki znak jeszcze się nie pojawił.

Widoczne na ilustracji funkcje hazardu pokazują prawdopodobieństwo wystąpienia kolejnego znaku interpunkcyjnego w zależności od długości pozbawionej interpunkcji sekwencji wyrazów (fot. IFJ PAN)

Wyniki – czytamy w komunikacie – są tu jednoznaczne: językiem charakteryzującym się najmniejszą skłonnością do używania interpunkcji jest angielski, z niewiele mu ustępującym hiszpańskim; najbardziej uzależnione od interpunkcji okazały się języki słowiańskie.

Warto jednak podkreślić, że krzywe funkcji hazardu dla znaków interpunkcyjnych w sześciu badanych językach okazały się mieć podobny przebieg, różniły się bowiem głównie przesunięciem w pionie.

Wyjątkiem okazał się język niemiecki. Jego funkcja hazardu jako jedyna przecina większość krzywych skonstruowanych dla pozostałych języków. „Niemiecka interpunkcja zdaje się więc łączyć cechy interpunkcyjne wielu języków, co czyni z niej swoiste interpunkcyjne esperanto” – oceniają naukowcy.

Widoczność cech interpunkcyjnych oryginału w tłumaczeniu

Powyższa obserwacja współgra z kolejną analizą, która polegała na sprawdzeniu, czy cechy interpunkcyjne oryginalnych dzieł literackich widać w ich tłumaczeniach.

Zgodnie z oczekiwaniami, językiem najwierniej odwzorowującym interpunkcję od języka oryginału do języka docelowego okazał się niemiecki.

W przekazie mówionym przerwy można uzasadniać ludzką fizjologią, między innymi koniecznością zaczerpnięcia oddechu lub wygospodarowaniem chwili na ustrukturyzowanie w myślach dalszej wypowiedzi. A w przekazie pisanym?

„Tworzenie zdania poprzez dokładanie do niego kolejnych wyrazów przy jednoczesnym dbaniu, by przekaz był zrozumiały i jednoznaczny, nieco przypomina napinanie cięciwy łuku: na początku jest to łatwe, ale z każdą chwilą staje się coraz bardziej wymagające. Jeśli w tekście nie ma żadnych elementów porządkujących (a przecież taką rolę pełni interpunkcja), trudność interpretacji rośnie wraz z wydłużaniem się ciągu wyrazów. Zbyt mocno napięta cięciwa może pęknąć, a zbyt długie zdanie może stać się niezrozumiałe. Dlatego autor staje przed koniecznością 'uwolnienia strzały’, czyli zamknięcia fragmentu tekstu jakimś znakiem interpunkcyjnym. Obserwacja ta dotyczy wszystkich analizowanych języków, mamy więc do czynienia z czymś, co można byłoby nazwać prawem lingwistycznym” – stwierdza cytowany w komunikacie dr Tomasz Stanisz, pierwszy autor omawianego artykułu.

Skąd wzorce interpunkcji we współczesnych językach?

Badacze stwierdzają, że wynalazek interpunkcji jest stosunkowo niedawny, a pojawienie się optymalnych wzorców interpunkcji we współczesnych językach pisanych może być interpretowane jako efekt ich „zaawansowania ewolucyjnego”.

„Jednak nadmierna potrzeba użycia interpunkcji niekoniecznie musi być oznaką takiego zaawansowania. Języki angielski i hiszpański, współcześnie najbardziej uniwersalne, w świetle powyższych badań okazują się być mniej rygorystyczne w kwestii częstości stosowania interpunkcji. Prawdopodobnie języki te są tak sformalizowane pod względem konstrukcji zdania, że jest w nich mniej miejsca na niejednoznaczności, które musiałyby być rozwiązywane za pomocą znaków interpunkcyjnych” – czytamy w komunikacie.

[am]
źródło: naukawpolsce.pap.pl

Tematy: , , , ,

Kategoria: newsy