Słowa kluczowe: синтез вокалу
vocal synthesis
синтез співочого голосу
singing voice synthesis
нейронні мережі
neural networks
машинне навчання
machine learning
глибинне навчання
deep learning
залишкова мережа
residual network
Abstract: Кваліфікаційна робота присвячена розробці методу синтезу вокалу та розробці на основі нього застосунку. У першому розділі кваліфікаційної роботи описано існуючі застосунки синтезу вокалу. Розглянуто існуючі методи синтезу вокалу на основі глибинного навчання. Визначено вимоги до застосунку, який розроблено в процесі виконання роботи. У другому розділі кваліфікаційної роботи запропоновано архітектуру моделі синтезу вокалу. Описано архітектуру застосунку синтезу вокалу. Показано етапи опрацювання датасету. Висвітлено процес тренування моделі. У третьому розділі кваліфікаційної роботи описано тестування застосунку синтезу вокалу. Оцінено якість отриманої моделі синтезу вокалу. Описано процес субʼєктивного та обʼєктивного оцінювань. У четвертому розділі кваліфікаційної роботи описано фізіогічний та психологічний впливи синтезованого вокалу на життєдіяльність людини. Висвітлено проблеми, які можуть виникати під час роботи зі застосунок. Подано рекомендації щодо безпечної роботи зі застосунком синтезу вокалу. The qualification work is devoted to the development of a vocal synthesis method and an application based on it. The first chapter of the qualification work describes existing applications of vocal synthesis. Existing methods of vocal synthesis based on deep learning are considered. The requirements for the application developed in the course of the work are defined. In the second chapter of the qualification work, the architecture of the vocal synthesis model is proposed. The architecture of the vocal synthesis application is described. The stages of dataset processing are shown. The process of model training is covered. The third chapter of the qualification work describes the testing of the vocal synthesis application. The quality of the resulting vocal synthesis model is evaluated. The process of subjective and objective evaluation is described. The fourth chapter of the qualification work describes the physiological and psychological effects of synthesized voice on human. The problems that may arise when working with the application are highlighted. Recommendations for safe work with the vocal synthesis application are given.
Content: Вступ 9 РОЗДІЛ 1. Аналіз Задачі синтезу вокалу та постановка завдання 10 1.1 Предметна область 10 1.2 Огляд існуючих застосунків синтезу вокалу 10 1.3 Огляд існуючих рішень на основі глибинного навчання 13 1.4 Постановка завдання 16 1.5 Висновок до першого розділу 17 РОЗДІЛ 2. Проєктування архітектури моделі та застосунку синтезу вокалу 18 2.1 Пайплайн застосунку 18 2.2 Архітектура моделі 19 2.3 Датасет 21 2.4 Попереднє опрацювання датасету 21 2.5 Функція втрат 24 2.6 Тренувальний процес 25 2.7 Постфільтр 26 2.8 Проєктування системи класів застосунку 27 2.9 Інтерфейс застосунку синтезу вокалу 33 2.10 Висновок до другого розділу 33 РОЗДІЛ 3. Оцінювання якості моделі та Тестування застосунку синтезу вокалу 34 3.1 Оцінка прогнозованих значень 34 3.2 Обʼєктивне оцінювання 41 3.3 Субʼєктивне оцінювання 42 3.4 Тестування функціональності застосунку синтезу вокалу 45 3.5 Висновок до третього розділу 46 РОЗДІЛ 4. Безпека життєдіяльності, основи Охорони праці 47 4.1 Фізіологічний та психологічний вплив синтезованого вокалу на життєдіяльність людини 47 4.2 Заходи щодо зниження ризиків для оператора ПК при роботі із застосунком синтезу вокалу 48 4.3 Висновок до четвертого розділу 50 Висновки 52 Перелік джерел 53
