Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/45357
Назва: Розробка та оптимізація RAG-моделі для покращення автоматизованої генерації текстів для SEO
Інші назви: Development and optimization of the RAG model to improve automated text generation for SEO
Автори: Кокайло, Вікторія Василівна
Приналежність: Тернопільський національний технічний університет імені Івана Пулюя
Бібліографічний опис: Кокайло В. В. Розробка та оптимізація RAG-моделі для покращення автоматизованої генерації текстів для SEO: робота на здобуття кваліфікаційного ступеня бакалавра : спец. 121 - інженерія програмного забезпечення / наук. кер. М. Р. Петрик. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2024. 76 с.
Дата публікації: чер-2024
Дата внесення: 24-чер-2024
Видавництво: Тернопільський національний технічний університет імені Івана Пулюя
Країна (код): UA
Місце видання, проведення: Тернопіль
Науковий керівник: Петрик, Михайло Романович
Члени комітету: Стадник, Марія Андріївна
УДК: 004.9
Теми: RAG-модель
SEO
автоматизація
контент
NLP
машинне навчання
Кількість сторінок: 76
Короткий огляд (реферат): Кваліфікаційна робота бакалавра, виконала Кокайло Вікторія Василівна, студентка групи СП-41 Тернопільського національного технічного університету імені Івана Пулюя , присвячена розробці та оптимізації RAG-моделі для покращення автоматизованої генерації текстів для SEO. Робота має обсяг 76 сторінок, включає 10 рисунків, 3 додатків, та бібліографію з 25 джерел, 2 лістингів коду. Метою роботи є створення інноваційного прототипу, здатного автоматизувати процес створення SEO-оптимізованого контенту. Використання моделі RAG дозволяє забезпечити високу якість та релевантність текстів, що сприяє поліпшенню позиціонування веб-сайтів у пошукових системах. У роботі застосовані сучасні технології машинного навчання та обробки природної мови, зокрема, NLP, для аналізу та генерації текстового контенту. Розроблений прототип включає інтеграцію з аналітичними інструментами для моніторингу ефективності контенту, а також користувацький інтерфейс для зручного управління процесом створення контенту. Результати тестування прототипу демонструють його високу ефективність і потенціал для подальшого розвитку та застосування в індустрії цифрового маркетингу. Робота підкреслює значення інноваційних технологій в області машинного навчання і SEO, вносячи вклад у розвиток методів автоматизованої обробки текстів та оптимізації веб-контенту для пошукових систем. Ключові слова роботи: RAG-модель, SEO, автоматизація контенту, NLP, машинне навчання, оптимізація текстів.
Bachelor's qualification work , carried out by Viktoriya Kokaylo, a student of group SP-41 at the Ternopil National Technical University named after Ivan Puluj focuses on the development and optimization of the Retrieval-Augmented Generation (RAG) model to enhance the automated generation of SEO-optimized texts. The work consists of 76 pages, includes 10 figures, 3 appendices, and a bibliography with 25 sources. The primary objective of this work is to design a prototype capable of automating the process of generating SEO-optimized content. The use of the RAG model ensures the production of high-quality and relevant texts, which contributes to improving the search engine rankings of websites. This thesis employs advanced machine learning and natural language processing (NLP) technologies to analyze and generate textual content. The developed prototype features integration with analytical tools for monitoring content effectiveness and a user interface that facilitates the easy management of the content creation process. Testing results of the prototype demonstrate its high efficiency and potential for further development and application in the digital marketing industry. This work underscores the importance of innovative technologies in the fields of machine learning and SEO, contributing to the advancement of automated text processing and optimization methods for search engines. Key Words: RAG model, SEO, content automation, NLP, machine learning, text optimization.
Зміст: РЕФЕРАТ 4 ABSTRACT 5 ПЕРЕЛІК СКОРОЧЕНЬ 8 ВСТУП 9 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ ТА ТЕОРЕТИЧНІ ОСНОВИ RAG-МОДЕЛІ 11 1.1 Загальні поняття та архітектура моделей RAG 12 1.1.1 Ключові елементи RAG 13 1.1.2 Порівняння архітектур RAG з Transformer та BERT 15 1.2 Співставлення RAG з іншими моделями генерації тексту 18 1.2.1 Співставлення RAG з іншими моделями генерації тексту 19 1.2.2 Порівняння з GPT-3 та BERT на прикладах 21 1.2.3 Аналіз продуктивності RAG порівняно з іншими моделями на задачах 22 1.3 Переваги та недоліки використання RAG для SEO 24 1.3.1 Детальний аналіз переваг 26 1.3.2 Детальний аналіз недоліків 29 2 МЕТОДИКА ОПТИМІЗАЦІЇ RAG-МОДЕЛІ ТА РЕАЛІЗАЦІЯ МОДЕЛІ НА ПРАКТИЦІ 33 2.1 Параметри оптимізації 34 2.1.1 Аналіз чутливості параметрів 36 2.1.2 Адаптація параметрів під SEO задачі 38 2.2 Стратегії тренування та налагодження моделі 40 2.2.1 Розробка стратегій тренування для великих даних 41 2.2.2 Застосування трансферного навчання у оптимізації RAG 44 2.3 Валідація та тестування моделі 47 2.3.1 Підходи до крос-валідації 48 2.3.2 Використання реальних SEO-даних для тестування 49 2.4 Розробка прототипу для SEO-оптимізованого контенту 51 3 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 54 3.1 Аварії з викидом радіоактивних речовин 54 3.2 Менеджмент охорони праці та промислової безпеки 55 ВИСНОВКИ 60 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 63 ДОДАТКИ 66 Додаток А – Публікація у науковому виданні 67 Додаток Б – Лістинг коду моделі 69 Додаток В – Диск із кваліфікаційною роботою бакалавра 76
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/45357
Власник авторського права: Кокайло Вікторія Василівна, 2024
Перелік літератури: 1. Lewis, P., Yazdani, M., Burges, C., Wu, Y., Bart, R., & Smith, M. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. [Електронний ресурс] – Режим доступу до ресурсу: https://papers.neurips.cc/paper/2020/hash/ a0d2ae2a45e6e2cccbc23f064d31a1ab-Abstract.html.
2. Devlin, J., Chang, M., Lee, K., & Toutanova, K. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. [Електронний ресурс] – Режим доступу до ресурсу: https://www.aclweb.org/anthology/N19-1423.pdf.
3. Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., ... & Amodei, D. Language Models are Few-Shot Learners. [Електронний ресурс] – Режим доступу до ресурсу: https://arxiv.org/abs/2005.14165.
4. Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. Language Models are Unsupervised Multitask Learners. [Електронний ресурс] – Режим доступу до ресурсу: https://openai.com/research/language-models-are-unsupervised-multitask-learners.
5. Kingma, D. P., & Ba, J. Adam: A Method for Stochastic Optimization. [Електронний ресурс] – Режим доступу до ресурсу: https://arxiv.org/abs/1412.6980.
6. Paszke, A., Gross, S., Massa, F., Lerer, A., Bradbury, J., Chanan, G., ... & Chintala, S. PyTorch: An Imperative Style, High-Performance Deep Learning Library. [Електронний ресурс] – Режим доступу до ресурсу: https://papers.neurips.cc/paper/2019/hash/9015-acb92cc7efb80b1e6a59ae18b26e7d14-Abstract.html.
7. Chollet, F. Deep Learning with Python. [Електронний ресурс] – Режим доступу до ресурсу: https://www.manning.com/books/deep-learning-with-python-second-edition.
8. Sutton, R. S., & Barto, A. G. Reinforcement Learning: An Introduction. [Електронний ресурс] – Режим доступу до ресурсу: https://mitpress.mit.edu/ books/reinforcement-learning-second-edition.
9. Goodfellow, I., Bengio, Y., & Courville, A. Deep Learning. [Електронний ресурс] – Режим доступу до ресурсу: https://www.deeplearningbook.org/.
10. Moz. The Beginner's Guide to SEO. [Електронний ресурс] – Режим доступу до ресурсу: https://moz.com/beginners-guide-to-seo.
Тип вмісту: Bachelor Thesis
Розташовується у зібраннях:121 — Інженерія програмного забезпечення (бакалаври)

Файли цього матеріалу:
Файл Опис РозмірФормат 
dyplom_Kokailo_2024.pdf1,58 MBAdobe PDFПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора