กรุณาใช้ตัวระบุนี้เพื่ออ้างอิงหรือเชื่อมต่อรายการนี้:
http://elartu.tntu.edu.ua/handle/lib/49063
Pealkiri: | Розробка інформаційної системи надання наукових сервісів за домомогою Scrapy та ORM для взаємодії з базою даних |
Teised pealkirjad: | Development of an information system for providing scientific services using Scrapy library and ORM for database interaction |
Autor: | Юрчишин, Дмитро Ігорович Yurchyshyn, Dmytro |
Affiliation: | ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра програмної інженерії, м. Тернопіль, Україна |
Bibliographic description (Ukraine): | Юрчишин Д. І. Розробка інформаційної системи надання наукових сервісів з використанням бібліотеки Scrapy та ORM для взаємодії з базою даних : спец. 121 - інженерія програмного забезпечення / наук. кер. М. Р. Петрик. Тернопіль: – Тернопільський національний технічний університет імені Івана Пулюя, 2025. 59 с |
Ilmumisaasta: | juu-2025 |
Submitted date: | 9-juu-2025 |
Date of entry: | 26-juu-2025 |
Kirjastaja: | Тернопільський національний технічний університет імені Івана Пулюя |
Country (code): | UA |
Place of the edition/event: | ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна |
Supervisor: | Петрик, Михайло Романович |
Committee members: | Лечаченко, Тарас Анатолійович |
UDC: | 004.9 |
Märksõnad: | Scrapy Django ORM Semantic Scholar API Rest API Celery RabbitMQ Scholar наукові публікації автоматизований збір даних веб-орієнтована система |
Number of pages: | 59 |
Kokkuvõte: | Тема: Розробка інформаційної системи надання наукових сервісів з використанням бібліотеки Scrapy та ORM для взаємодії з базою даних.
Об’єкт дослідження – процеси автоматизованого збору, структурування та надання доступу до наукової інформації через веб-інтерфейс
Предмет дослідження –методи та технології створення веб-орієнтованих інформаційних систем з використанням фреймворку Scrapy для збору даних та Django ORM для управління базою даних.
Мета роботи – створити повнофункціональну інформаційну систему для автоматизованого збору наукових публікацій з Semantic Scholar API, їх зберігання та надання зручного веб-інтерфейсу для пошуку й аналізу.
Методи дослідження: системний аналіз предметної області, об’єктно-орієнтоване проєктування, методи веб-скрейпінгу, реляційне моделювання даних, REST API архітектура, функціональне тестування.
Наукова новизна роботи полягає в комплексному підході до створення системи збору наукових сервісів, що інтегрує сучасні технології вебзбирання, асинхронної обробки та ефективного управління даними в єдиній архітектурі.
Практичне значення – розроблена система може використовуватися науковими установами та дослідниками для ефективного пошуку та аналізу наукових публікацій. Topic: Development of an information system for providing scientific services using Scrapy library and ORM for database interaction. Research object – processes of automated collection, structuring and providing access to scientific information through web interface. Research subject – methods and technologies for creating web-oriented information systems using Scrapy framework for data collection and Django ORM for database management. Purpose of work – to create a fully functional information system for automated collection of scientific publications from Semantic Scholar API, their structured storage and providing convenient web interface for search and analysis. Research methods: systematic analysis of the subject area, object-oriented design, web scraping methods, relational data modeling, REST API architecture, functional testing. Scientific novelty of the work lies in the comprehensive approach to creating a scientific services collection system that integrates modern web scraping technologies, asynchronous processing and efficient data in a unified architecture. Practical value – the developed system can be used by scientific institutions and researchers for efficient search and analysis of scientific publications. |
Content: | АНОТАЦІЯ 4 ABSTRACT 5 ВСТУП 7 1 ОГЛЯД ПРЕДМЕТНОЇ ОБЛАСТІ ТА АНАЛІЗ ІСНУЮЧИХ РІШЕНЬ 9 1.1 Аналіз сучасних наукових інформаційних систем 9 1.2 Огляд технологій веб-скрейпінгу та їх застосування 10 1.3 Дослідження Semantic Scholar API та подібних сервісів 11 1.4 Порівняльний аналіз існуючих рішень 13 2 ПРОЄКТУВАННЯ ТА РОЗРОБКА СИСТЕМИ 15 2.1 Архітектура та вибір технологій 15 2.2 Проєктування бази даних 20 2.3 Основи REST архітектури 21 2.4 Модуль автентифікації та управління користувачами 22 2.5 Система збору наукових публікацій 25 2.6 Експорт та аналітика результатів 27 2.7 Контейнеризація та Docker Compose 29 3 ТЕСТУВАННЯ ТА ВАЛІДАЦІЯ СИСТЕМИ 32 3.1 Методологія тестування 32 3.2 Інструменти тестування 32 3.3 Функціональне тестування системи 35 3.4 Валідація збережених даних 37 3.5 Тестування через користувацький інтерфейс 39 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ ТА ОСНОВИ ОХОРОНИ ПРАЦІ 41 4.1 Природні загрози та характер їх проявів і дій на людей, тварин, рослин 41 4.2 Навчання працюючих та інструктажі з охорони праці 43 ВИСНОВКИ 46 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 48 ДОДАТКИ 51 ДОДАТОК А – Лістинг коду інформаціїної системи 52 ДОДАТОК Б – Диск із кваліфікаційною роботою бакалавра 59 |
URI: | http://elartu.tntu.edu.ua/handle/lib/49063 |
Copyright owner: | © Юрчишин Дмитро Ігорович, 2025 |
References (Ukraine): | 3. Scrapy Documentation [Електронний ресурс]. – Режим доступу до ресурсу: https://docs.scrapy.org/en/latest/ (дата звернення: 07.04.2025). 5. Fielding R. T. Architectural Styles and the Design of Network-based Software Architectures [Електронний ресурс] : dissertation / Roy Thomas Fielding. – University of California, Irvine, 2000. – Режим доступу до ресурсу: https://www.ics.uci.edu/~fielding/pubs/dissertation/top.htm (дата звернення: 16.04.2025). 6. Celery Documentation [Електронний ресурс]. – Режим доступу до ресурсу: https://docs.celeryproject.org/en/stable/ (дата звернення: 10.05.2025). 7. Insomnia REST Client Documentation [Електронний ресурс]. – Режим доступу до ресурсу: https://docs.insomnia.rest/ (дата звернення: 11.05.2025). 8. Google Scholar Metrics [Електронний ресурс]. – Режим доступу до ресурсу: https://scholar.google.com/intl/en/scholar/metrics.html (дата звернення: 10.05.2025). 9. Clarivate. Web of Science Platform [Електронний ресурс]. – Режим доступу до ресурсу: https://www.webofscience.com/ (дата звернення: 15.05.2025). 10. Elsevier. Scopus: Access and Use Support Center [Електронний ресурс]. – Режим доступу до ресурсу: https://www.scopus.com/ (дата звернення: 17.05.2025). 11. Semantic Scholar. About & FAQ [Електронний ресурс]. – Режим доступу до ресурсу: https://www.semanticscholar.org/about (дата звернення: 21.05.2025). 12. Crossref REST API [Електронний ресурс]. – Режим доступу до ресурсу: https://api.crossref.org/ (дата звернення: 01.06.2025). 13. ORCID Public API [Електронний ресурс]. – Режим доступу до ресурсу: https://info.orcid.org/documentation/api-tutorials/ (дата звернення: 01.06.2025). 14. arXiv API documentation [Електронний ресурс]. – Режим доступу до ресурсу: https://info.arxiv.org/help/api/ (дата звернення: 04.06.2025). 15. Europe PMC API [Електронний ресурс]. – Режим доступу до ресурсу: https://europepmc.org/RestfulWebService (дата звернення: 06.06.2025). 16. DBeaver Documentation [Електронний ресурс]. – Режим доступу до ресурсу: https://dbeaver.io/docs/ (дата звернення: 07.06.2025). 17. Mozilla Developer Network. Using the Application tab – DevTools [Електронний ресурс]. – Режим доступу до ресурсу: https://developer.mozilla.org/en-US/docs/Tools/Application (дата звернення: 09.06.2025). |
Content type: | Bachelor Thesis |
Asub kollektsiooni(de)s: | 121 — Інженерія програмного забезпечення (бакалаври) |
Failid selles objektis:
Fail | Kirjeldus | Suurus | Formaat | |
---|---|---|---|---|
dyplom_Yurchyshyn_2025.pdf | 1,05 MB | Adobe PDF | Vaata/Ava |
Kõik teosed on Dspaces autoriõiguste kaitse all.
เครื่องมือสำหรับผู้ดูแลระบบ