Japończycy opracowali algorytm, który rozpoznaje gatunek książki po okładce

10 listopada 2016

rozpoznanie-okladek-komputer
Brian Kenji Iwana i Seiichi Uchida z Uniwersytetu Kiusiu w Japonii opracowali algorytm, dzięki któremu komputery rozpoznają gatunek książki po okładce. Zdaniem badaczy to krok torujący drogę do stworzenia systemów sztucznej inteligencji, które same będą projektowały okładki.

Metoda, jaką zastosowano, jest bardzo prosta i polega na wykorzystaniu głębokich sieci neuronowych do wykrywania cech z ogromnych ilości danych uczących. Naukowcy pobrali 137 788 okładek książek z Amazona wraz z przypisanymi do nich gatunkami (jeśli książka posiadała więcej niż jeden gatunek, wybierano ten pierwszy). Następnie 80% z nich wprowadzili do sieci neuronowej składającej się z czterech warstw, a każda zbudowana była z 512 neuronów, które uczą się wspólnie rozpoznawać korelację pomiędzy wyglądem okładki a gatunkiem. Kolejne 10% okładek wykorzystano do walidacji modelu, a ostatnie 10% posłużyło do przetestowania systemu. Gdy algorytm mógł podać trzy propozycje, udało mu się wymienić prawidłowy gatunek w przypadku ponad 40% okładek. Gdy miał wskazać tylko jedną propozycję, ilość trafień spadła do ponad 20% okładek. Komputerom jeszcze daleko do doskonałości, ale też wynik wypadł nieporównanie lepiej od próby losowej. „To pokazuje, że klasyfikacja wzorów okładek książek jest możliwa, choć to bardzo trudne zadanie” ? mówią Iwana i Uchida.

Dla sieci neuronowej stworzonej przez japońskich naukowców najłatwiejsze do rozpoznania były książki podróżnicze oraz technologiczne, w tym te dotyczące komputerów. Całkiem dobrze radziła też sobie z książkami kucharskimi, jeśli okładki przedstawiały zdjęcia żywności. W przypadku gdy widniały na nich fotografie kucharzy, sieć była bezsilna. Nie radziła też sobie z biografiami i wspomnieniami, zazwyczaj przypisując im kategorię „historia” (co ciekawe, w Amazonie ta kategoria często znajdowała się na drugiej pozycji pośród książek biograficznych i wspomnieniowych, co znaczy, że system rozpoznawania podążał właściwym tropem). Sieć często myliła komiksy i powieści graficzne z książkami dla dzieci a także publikacje medyczne z naukowymi.

Jak się okazuje, znane powiedzenie „nie oceniaj książki po okładce” nie do końca ma rację bytu, bo tak naprawdę często oceniamy książkę po okładce, a już na pewno rozpoznajemy jej gatunek. Zresztą tak właśnie robione są okładki, by ułatwić odbiorcom wstępną selekcję. Według naukowców algorytm będzie mógł służyć pomocą grafikom w projektowaniu, a w dalszej przyszłości komputery same zajmą się tworzeniem okładek.

[aw]
fot. MIT Technology Review

Tematy: , , , ,

Kategoria: newsy