Använd denna länk för att citera eller länka till detta dokument: http://elartu.tntu.edu.ua/handle/lib/45357
Titel: Розробка та оптимізація RAG-моделі для покращення автоматизованої генерації текстів для SEO
Övriga titlar: Development and optimization of the RAG model to improve automated text generation for SEO
Författare: Кокайло, Вікторія Василівна
Affiliation: Тернопільський національний технічний університет імені Івана Пулюя
Bibliographic description (Ukraine): Кокайло В. В. Розробка та оптимізація RAG-моделі для покращення автоматизованої генерації текстів для SEO: робота на здобуття кваліфікаційного ступеня бакалавра : спец. 121 - інженерія програмного забезпечення / наук. кер. М. Р. Петрик. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2024. 76 с.
Utgivningsdatum: jun-2024
Date of entry: 24-jun-2024
Utgivare: Тернопільський національний технічний університет імені Івана Пулюя
Country (code): UA
Place of the edition/event: Тернопіль
Supervisor: Петрик, Михайло Романович
Committee members: Стадник, Марія Андріївна
UDC: 004.9
Nyckelord: RAG-модель
SEO
автоматизація
контент
NLP
машинне навчання
Number of pages: 76
Sammanfattning: Кваліфікаційна робота бакалавра, виконала Кокайло Вікторія Василівна, студентка групи СП-41 Тернопільського національного технічного університету імені Івана Пулюя , присвячена розробці та оптимізації RAG-моделі для покращення автоматизованої генерації текстів для SEO. Робота має обсяг 76 сторінок, включає 10 рисунків, 3 додатків, та бібліографію з 25 джерел, 2 лістингів коду. Метою роботи є створення інноваційного прототипу, здатного автоматизувати процес створення SEO-оптимізованого контенту. Використання моделі RAG дозволяє забезпечити високу якість та релевантність текстів, що сприяє поліпшенню позиціонування веб-сайтів у пошукових системах. У роботі застосовані сучасні технології машинного навчання та обробки природної мови, зокрема, NLP, для аналізу та генерації текстового контенту. Розроблений прототип включає інтеграцію з аналітичними інструментами для моніторингу ефективності контенту, а також користувацький інтерфейс для зручного управління процесом створення контенту. Результати тестування прототипу демонструють його високу ефективність і потенціал для подальшого розвитку та застосування в індустрії цифрового маркетингу. Робота підкреслює значення інноваційних технологій в області машинного навчання і SEO, вносячи вклад у розвиток методів автоматизованої обробки текстів та оптимізації веб-контенту для пошукових систем. Ключові слова роботи: RAG-модель, SEO, автоматизація контенту, NLP, машинне навчання, оптимізація текстів.
Bachelor's qualification work , carried out by Viktoriya Kokaylo, a student of group SP-41 at the Ternopil National Technical University named after Ivan Puluj focuses on the development and optimization of the Retrieval-Augmented Generation (RAG) model to enhance the automated generation of SEO-optimized texts. The work consists of 76 pages, includes 10 figures, 3 appendices, and a bibliography with 25 sources. The primary objective of this work is to design a prototype capable of automating the process of generating SEO-optimized content. The use of the RAG model ensures the production of high-quality and relevant texts, which contributes to improving the search engine rankings of websites. This thesis employs advanced machine learning and natural language processing (NLP) technologies to analyze and generate textual content. The developed prototype features integration with analytical tools for monitoring content effectiveness and a user interface that facilitates the easy management of the content creation process. Testing results of the prototype demonstrate its high efficiency and potential for further development and application in the digital marketing industry. This work underscores the importance of innovative technologies in the fields of machine learning and SEO, contributing to the advancement of automated text processing and optimization methods for search engines. Key Words: RAG model, SEO, content automation, NLP, machine learning, text optimization.
Content: РЕФЕРАТ 4 ABSTRACT 5 ПЕРЕЛІК СКОРОЧЕНЬ 8 ВСТУП 9 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ ТА ТЕОРЕТИЧНІ ОСНОВИ RAG-МОДЕЛІ 11 1.1 Загальні поняття та архітектура моделей RAG 12 1.1.1 Ключові елементи RAG 13 1.1.2 Порівняння архітектур RAG з Transformer та BERT 15 1.2 Співставлення RAG з іншими моделями генерації тексту 18 1.2.1 Співставлення RAG з іншими моделями генерації тексту 19 1.2.2 Порівняння з GPT-3 та BERT на прикладах 21 1.2.3 Аналіз продуктивності RAG порівняно з іншими моделями на задачах 22 1.3 Переваги та недоліки використання RAG для SEO 24 1.3.1 Детальний аналіз переваг 26 1.3.2 Детальний аналіз недоліків 29 2 МЕТОДИКА ОПТИМІЗАЦІЇ RAG-МОДЕЛІ ТА РЕАЛІЗАЦІЯ МОДЕЛІ НА ПРАКТИЦІ 33 2.1 Параметри оптимізації 34 2.1.1 Аналіз чутливості параметрів 36 2.1.2 Адаптація параметрів під SEO задачі 38 2.2 Стратегії тренування та налагодження моделі 40 2.2.1 Розробка стратегій тренування для великих даних 41 2.2.2 Застосування трансферного навчання у оптимізації RAG 44 2.3 Валідація та тестування моделі 47 2.3.1 Підходи до крос-валідації 48 2.3.2 Використання реальних SEO-даних для тестування 49 2.4 Розробка прототипу для SEO-оптимізованого контенту 51 3 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 54 3.1 Аварії з викидом радіоактивних речовин 54 3.2 Менеджмент охорони праці та промислової безпеки 55 ВИСНОВКИ 60 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 63 ДОДАТКИ 66 Додаток А – Публікація у науковому виданні 67 Додаток Б – Лістинг коду моделі 69 Додаток В – Диск із кваліфікаційною роботою бакалавра 76
URI: http://elartu.tntu.edu.ua/handle/lib/45357
Copyright owner: Кокайло Вікторія Василівна, 2024
References (Ukraine): 1. Lewis, P., Yazdani, M., Burges, C., Wu, Y., Bart, R., & Smith, M. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. [Електронний ресурс] – Режим доступу до ресурсу: https://papers.neurips.cc/paper/2020/hash/ a0d2ae2a45e6e2cccbc23f064d31a1ab-Abstract.html.
2. Devlin, J., Chang, M., Lee, K., & Toutanova, K. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. [Електронний ресурс] – Режим доступу до ресурсу: https://www.aclweb.org/anthology/N19-1423.pdf.
3. Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., ... & Amodei, D. Language Models are Few-Shot Learners. [Електронний ресурс] – Режим доступу до ресурсу: https://arxiv.org/abs/2005.14165.
4. Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. Language Models are Unsupervised Multitask Learners. [Електронний ресурс] – Режим доступу до ресурсу: https://openai.com/research/language-models-are-unsupervised-multitask-learners.
5. Kingma, D. P., & Ba, J. Adam: A Method for Stochastic Optimization. [Електронний ресурс] – Режим доступу до ресурсу: https://arxiv.org/abs/1412.6980.
6. Paszke, A., Gross, S., Massa, F., Lerer, A., Bradbury, J., Chanan, G., ... & Chintala, S. PyTorch: An Imperative Style, High-Performance Deep Learning Library. [Електронний ресурс] – Режим доступу до ресурсу: https://papers.neurips.cc/paper/2019/hash/9015-acb92cc7efb80b1e6a59ae18b26e7d14-Abstract.html.
7. Chollet, F. Deep Learning with Python. [Електронний ресурс] – Режим доступу до ресурсу: https://www.manning.com/books/deep-learning-with-python-second-edition.
8. Sutton, R. S., & Barto, A. G. Reinforcement Learning: An Introduction. [Електронний ресурс] – Режим доступу до ресурсу: https://mitpress.mit.edu/ books/reinforcement-learning-second-edition.
9. Goodfellow, I., Bengio, Y., & Courville, A. Deep Learning. [Електронний ресурс] – Режим доступу до ресурсу: https://www.deeplearningbook.org/.
10. Moz. The Beginner's Guide to SEO. [Електронний ресурс] – Режим доступу до ресурсу: https://moz.com/beginners-guide-to-seo.
Content type: Bachelor Thesis
Samling:121 — Інженерія програмного забезпечення (бакалаври)

Fulltext och övriga filer i denna post:
Fil Beskrivning StorlekFormat 
dyplom_Kokailo_2024.pdf1,58 MBAdobe PDFVisa/Öppna


Materialet i DSpace är upphovsrättsligt skyddat och får ej användas i kommersiellt syfte!

Administrativa verktyg