Bu öğeden alıntı yapmak, öğeye bağlanmak için bu tanımlayıcıyı kullanınız:
http://elartu.tntu.edu.ua/handle/lib/46936
Başlık: | Впровадження векторного пошуку у системі документообігу |
Diğer Başlıklar: | Implementation of vector search in the document management system |
Yazarlar: | Ямко, Владислав Олексійович Yamko, Vladyslav |
Affiliation: | Тернопільський національний технічний університет ім. Івана Пулюя |
Bibliographic description (Ukraine): | Ямко В. О. Впровадження векторного пошуку у системі документообігу : робота на здобуття кваліфікаційного ступеня магістр : спец. 121 - інженерія програмного забезпечення / наук. кер. М. Р. Петрик. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2024. 85 с. |
Yayın Tarihi: | Ara-2024 |
Date of entry: | 28-Ara-2024 |
Yayıncı: | Тернопільський національний технічний університет імені Івана Пулюя |
Country (code): | UA |
Place of the edition/event: | Тернопіль |
Supervisor: | Петрик, Михайло Романович |
Committee members: | Стадник, Марія Андріївна |
UDC: | 004.9 |
Anahtar kelimeler: | 121 інженерія програмного забезпечення Векторний пошук Штучний інтелект Ембеддінг Документообіг Контекстне чанкування |
Number of pages: | 85 |
Özet: | Метою наукової роботи є створення програмного комплексу для
автоматизованого управління документами з використанням векторного пошуку,
чанкування та ембедінгу. Рішення дозволяє оптимізувати процеси обробки та
зберігання великих обсягів даних, автоматизуючи керування документами, зокрема
їх класифікацію, пошук та фільтрацію.
Програма використовує інноваційні підходи до обробки текстових даних,
такі як векторизація, що забезпечує ефективний пошук за змістом. Чанкування, в
свою чергу, дає змогу розділяти великі документи на менші частини, що полегшує
обробку та покращує швидкість пошукових запитів. Водночас ембедінг допомагає
відображати зміст документів у вигляді векторів, що дозволяє забезпечити точні
результати пошуку за допомогою математичних моделей.
Апаратно-програмний комплекс працює з такими даними, як інформація про
клієнтів, документи та мітки. Використовуються сучасні технології, такі як NestJS
для серверної логіки, TypeORM для роботи з базою даних та MongoDB для
зберігання даних.
Цей комплекс дозволяє не лише ефективно зберігати та управляти даними,
але й здійснювати швидкий та точний пошук по документах, що містять важливу
інформацію для користувачів. Рішення також дозволяє автоматично оновлювати та
організовувати дані, забезпечуючи зручний доступ до необхідної інформації в
будь-який час The aim of this scientific work is to create a software complex for automated document management using vector search, chunking, and embedding. The solution optimizes data processing and storage processes by automating document management, including classification, search, and filtering. The program utilizes innovative approaches to text data processing, such as vectorization, which enables efficient content-based search. Chunking, in turn, allows for splitting large documents into smaller parts, facilitating processing and improving the speed of search queries. Embedding, at the same time, helps to represent the content of documents as vectors, ensuring accurate search results through mathematical models. The hardware-software complex works with data such as client information, documents, and labels. Modern technologies are used, such as NestJS for server-side logic, TypeORM for database operations, and MongoDB for data storage. This complex not only allows for efficient data storage and management but also provides fast and precise search across documents containing important information for users. The solution also enables automatic updating and organization of data, ensuring convenient access to necessary information at any time |
Content: | ЗМІСТ 8 ВСТУП 9 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ ДОСЛІДЖЕННЯ ТА ТЕХНІЧНЕ ЗАВДАННЯ 11 1.1. Аналіз предметної області 11 2. ПРОЕКТУВАННЯ АРХІТЕКТУРИ ТА СТРУКТУРИ ПРОГРАМНОГО ПРОДУКТУ 16 2.1. Розробка архітектури програмного продукту 16 2.2. Аналіз інструментальних засобів розробки 22 2.3 Пошук акторів та варіантів використання 26 2.4 Опис варіантів використання 29 2.5 Шаблон розробки застосунку 33 2.6 Абстрактний рівень системи 35 2.7 Архітектура на рівні класів і підсистем 38 2.8 Проектування бази даних 40 2.9 Діаграма розгортання застосунку 42 3. РОЗРОБКА ТА ТЕСТУВАННЯ ПРОГРАМНОГО ПРОДУКТУ 44 3.1 Вибір мови програмування та технологій розробки 44 3.2. Розробка функцій об’єктів проектованого програмного забезпечення 46 3.3 Ілюстрація роботи створеного програмного забезпечення 48 3.4 Тестування програмного забезпечення та оцінка якості 52 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ ТА ОСНОВИ ОХОРОНИ ПРАЦІ 55 4.1 Охорона праці 55 4.2 Безпека життєдіяльності 57 ВИСНОВКИ 60 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 61 ДОДАТКИ 63 ДОДАТОК А – Тези 64 ДОДАТОК Б – Лістинг коду інформаційної системи 67 ДОДАТОК Б – Диск із кваліфікаційною роботою бакалавра 85 |
URI: | http://elartu.tntu.edu.ua/handle/lib/46936 |
Copyright owner: | © Ямко Владислав Олексійович, 2024 |
References (Ukraine): | Stefanyshyn, I. , Pastukh, O., Stefanyshyn, V. , Baran, I. , Boyko, I. Robustness of AI algorithms for neurocomputer interfaces based on software and hardware technologies CEUR Workshop Proceedings, 2024, 3742 M. Fowler, Patterns of enterprise application architecture. Boston, Mass. ; Munich: Addison-Wesley, 2015. R. S. Pressman, Software Engineering: A Practitioner’s Approach. McGraw Hill Science, Engineering & Mathematics, 2010. E. Gamma, R. Helm, R. Johnson, and J. Vlissides, Design Patterns. Pearson Education, 1994 IEEE Std 1471-2000, IEEE Recommended Practice for Architectural Description of Software-Intensive Systems, IEEE, 2000 Larman, C. Applying UML and Patterns: An Introduction to Object-Oriented Analysis and Design and Iterative Development. Prentice Hall, 2004 NestJS Official Documentation: https://docs.nestjs.com Node.js Documentation: https://nodejs.org/en/docs/ MongoDB Documentation: https://www.mongodb.com/docs/ OpenAI API Documentation: https://platform.openai.com/docs/introduction |
Content type: | Master Thesis |
Koleksiyonlarda Görünür: | 121 — інженерія програмного забезпечення |
Bu öğenin dosyaları:
Dosya | Açıklama | Boyut | Biçim | |
---|---|---|---|---|
dyplom_Yamko_2024.pdf | 3,44 MB | Adobe PDF | Göster/Aç |
DSpace'deki bütün öğeler, aksi belirtilmedikçe, tüm hakları saklı tutulmak şartıyla telif hakkı ile korunmaktadır.
Yönetim Araçları