Mariusz Trzaska PJATK (public)
Publiczna strona poświęcona mojej działalności w PJATK

Generyczny system do pobierania danych z portali internetowych

Mariusz MGR

Pobierz

Rozmiar pliku: 1.37 MB

Praca magisterska obroniona w PJWSTK.

Tytuł: Generyczny system do pobierania danych z portali internetowych

Autor: Mateusz Jaszewski

Promotor: dr inż. Mariusz Trzaska

Streszczenie:

Niniejsza praca dotyczy implementacji systemu do sczytywania treści ze stron internetowych. Omówiona została w niej technika web scrapingu wraz z przykładami jej zastosowania oraz dostępnymi narzędziami. W dalszej części autor przedstawia koncepcję nowego systemu, poprzez zdefiniowanie wymagań, wykonanie projektu i implementację prototypu. Opracowane rozwiązanie stanowi system przygotowany z wykorzystaniem, po stronie serwera, takich technologii jak Java, Spring, MongoDB, PhanotmJS oraz w aplikacji klienckiej język TypeScript wraz z frameworkiem Angular. Ostatnia część pracy zawiera przegląd interfejsu zaimplementowanego prototypu, testy z wykorzystaniem przykładowej strony oraz podsumowanie stanowiące ocenę i zawierające rozważania na temat możliwego dalszego rozwoju systemu.