Generyczny system do pobierania danych z portali internetowych
Rozmiar pliku: 1.37 MB
Praca magisterska obroniona w PJWSTK.
Tytuł: Generyczny system do pobierania danych z portali internetowych
Autor: Mateusz Jaszewski
Promotor: dr inż. Mariusz Trzaska
Streszczenie:
Niniejsza praca dotyczy implementacji systemu do sczytywania treści ze stron internetowych. Omówiona została w niej technika web scrapingu wraz z przykładami jej zastosowania oraz dostępnymi narzędziami. W dalszej części autor przedstawia koncepcję nowego systemu, poprzez zdefiniowanie wymagań, wykonanie projektu i implementację prototypu. Opracowane rozwiązanie stanowi system przygotowany z wykorzystaniem, po stronie serwera, takich technologii jak Java, Spring, MongoDB, PhanotmJS oraz w aplikacji klienckiej język TypeScript wraz z frameworkiem Angular. Ostatnia część pracy zawiera przegląd interfejsu zaimplementowanego prototypu, testy z wykorzystaniem przykładowej strony oraz podsumowanie stanowiące ocenę i zawierające rozważania na temat możliwego dalszego rozwoju systemu.