24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
>>102574 Да тот тред сдох, ответов на вопросы нет. А этот по сути ни чего нового не предлагает. Пока не будет адекватной нейросети на русском в открытом доступе, я не думаю что тема будет актульна. Нам нужны специалисты в лингвистике, кто хотябы с фонемами разбирается.
>>102843 линия горизонта нужна толко, если у тебя фигуры можно поместить в gараллелепипед и все они стоят на одной плоскости. Или же у тебя есть парадейные полу линии, типо стыка стены и потолка. А для органике они используются как вспомогательный элимент и ты не сможешьь их повторить.
>>103185 У тебя была проблема во время выполнения строки `pip install -r requirements.txt`? Кинь скрин лога побольше, чтобы было видно последние строки.
>>103276 Там в середине мой логин. Но ошибка максимум долбоёбская, вряд ли с ней можно что-то сделать, кроме как снести мою старую как говно мамонта ЛГБТ шинду и накатить что-то поновее.
>>103281 Эта ошибка уже встречалось у двух человек. Просто следуй дальше по инструкции. И да у тебя не такой уж уникальный ник чтобы переживать об том что по нему можно задеанонить, но ты можешь просто его замазывать в следующий раз
>>103389 Советую, сначало читать инструкции, а потом им следовать. Потому что там дальше по инструкции на 57 строчке написанно: "Если у вас ошибки, то смотрите в повершел, и смотрите что пишут, если там ModuleNotFoundError: или AttributeError: То это значит что у вас не все модули скачались. Их можно докачать с помощью команды pip install "название модуля"..." В твоём случае надо написать `pip install librosa` если и это не поможет, то скачать через ссылку которая есть дальше по инструкции.
>>103842 >Советую, сначало читать инструкции, а потом им следовать. Я программист до мозга костей, поэтому исполняю всё построчно. Скачивание директории помогло, спасибо. Хотя интересно конечно, что ему там не нравилось. Судя по попытке что-то сбилдить, ему нужны билдтулы из вижуалстудии...
Бля, как вы генерите? У меня без впн не открывает, а с впн банят якобы за абуз фри версии. Сгенерьте Джинкс, вот аудио https://vocaroo.com/14gcLSyK7ecY
Добрый день, уважаемые господа. Пожалуйста, подскажите можно ли, и если да то как: 1. Генерировать русский голос (мужской, женский, детский) 2. Генерировать японский голос (мужской, женский, детский)
>>105332 >1. Генерировать русский голос (мужской, женский, детский) Пока нету, нужно тренировать. >>105332 >2. Генерировать японский голос (мужской, женский, детский) Как говна в проруби, особенно женских.
Я тоже столкнулся с ошибкой >>103281 "Не удается найти указанный файл" если делать череp pip установку зависимостей командой pip install -r requirements.txt общим списком
Пошел посмотреть список модулей, которые по зависимостям требует VITS-Umamusume-voice-synthesizer, всего 22 пакета, на установке 12 пакета - pyopenjtalk - через pip (установщик пакетов Питона) как раз эта ошибка "Не удается найти указанный файл".
Остальные модули при установке по одному с конца списка ручным копированием названия в powershell поставились через pip без ошибок.
Для получения ссылки на локальную интернет-морду в powershell 1. Запустил powershell от администратора 2. Перешел к папке с виртуальной средой через cd 3. Активировал скрипты командой .\название папки для виртуальной среды\Scripts\activate 4. Перешел к папке с VITS-Umamusume-voice-synthesizer через cd 5. Для её запуска использовал python3.exe .\app.py (у меня есть как и обычный старый 2-ой питон, если пробовать искать его через python.exe, так и python3.10.exe - поставленный из магазина Майкрософт, так и отдельный обычный Питон 3, который находится через python3.exe. У меня под Windows 10 работает и через обычный скачанный с сайта Питон 3 (python3.exe) и через Майкрософтовский (python3.10.exe).
Powershell еще сказала надо поставить через pip модуль tqdm, при выполнении pip install tqdm вижу: WARNING: The script tqdm.exe is installed in 'C:\Users\bk\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\Scripts' which is not on PATH. Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location
Пошел к доп. настройкам Windows, без задней мысли добавил везде где можно директорию со Скриптами в PATH.
Если не добавлять в PATH и пробовать запустить локальную вебморду в браузере и нажать Generate, получаю Error. Но после добавления в PATH и активации скриптов запускаю python3.10.exe .\app.py или python3.exe .\app.py получаю локальную вебморду http://127.0.0.1:7860/ - жму Generate и слышу заветное konnichi wa! (Каждый раз разное при генерации).
Записи лежат в wav в папке, про которую написано в гайде - да, надо открыть app.py и прописать в трех местах с 27 строки в параметрах dir=self.temp_dir вместо self.temp_dir название директории (папки), которую вы сами создаете и называете для хранения аудиозаписей, причем обратный слэш в конце названия может быть не обязателен, на своей машине я проверял запуск с названием этой папки со слэшом в конце и без него, замену названий проводил через Notepad++
Что же, теперь когда VITS-Umamusume-voice-synthesizer работает и генерирует, возникает резонный вопрос: как ее настроить или натренировать на кастомном аудиопотоке чтобы получить собственного японского персонажа?
> Luke, did I ever tell you about Ahsoka Tano? She was your father’s exotic teenage alien apprentice, a fine piece of jailbait from a more civilized age. She had the tightest body and the perkiest little breasts in the galaxy; barely legal in most systems.
> Anakin and I used to doubleteam her at the end of every successful campaign during the Clone Wars, and once in a while we’d even have the entire 501st run a train over her, part of official Jedi “training” of course. In time, she learned how to handle a meatsaber better than anyone in the Jedi Temple. She wore a miniskirt every day so we told her there were no panties in space, and since she was constantly doing acrobatics you’d get a glimpse of her orange pussy mid fight as she’d do a flip while slicing a B2 Super Battledroid in half. It was surreal.
> We taught her to grip her weapon backwards like a dildo and she constantly got captured by pirates and slavers almost every other day. It was ridiculous, like a constant porno Luke, you have no idea. And she was a good friend.
>>105639 В общем, как я понимаю, "Советский учебник по алхимии 3.0" не для слабых духом, да и только для видеокарт, и натренировать даже один голос на моем двухгиговом старом видеоведре, уже не говоря про CPU, невозможно в принципе.
>>106088 >Почему ты так решил? Потому что внутри train.py английским по черному написано: "CPU training is not allowed." и рядом всякие assert torch.cuda.is_available() для Nvidia.
А из статьи на китайском ясно, что для моего AMDшного видеоведра никакой ROCm не светит, да и крепкий волос мудрый вождь нефритовый стержень запретил колдовать на процессоре.
>>106112 Ох нифига, ты читаешь код перед запуском? Ладно, попробую у себя. Главное чтобы под шиндой работало. Формат тренировочных данных кто-нибудь знает?
>>105273 Удали куки по сайту. Заходи в настройки браузера и ищи вкладку с куки, потом ищешь имя сайта в списке и жмёшь удалить, всё. На самом деле это ещё задроченный вариант, может просто другой аккаунт зарегать можно.
Обмазался пакетами питона, удалил обычный parselmouth, поставил praat-parselmouth и все равно в итоге вся эта ебала so-vits-svc и не дизайнилась под тренировку своей модели на кастомном датасете wav через ЦПУ. Не видать мне заветного голоса покуда CUDA не пришла в мой дом.
>>106223 Куки легко чистятся, но эта хуйня не помогает. После первой попытки что либо сгенерить на сайте вылезает третий пик. Еще не пробовал другие впн.
>>106919 Хммммм, со старого аккаунта ещё можно создавать, значит либо смотрит на гугловскую привязку к телефону либо новые аккаунты теперь кастрированы, теперь только за деньгу.
>>112901 Не угадал. Нужно закиинуть подготовленные wav (через скрипт в convert) в подкаталог в voices (назови сам). Но это какая-то стрёмная хуйня, которая жуёт входные файлы каждый раз, поэтому генерация занимает больше 10ГБ врамы и идёт по 5 минут, лол. Качество... Ну явно не для русского, хотя оно пыталось, да. Впрочем, может это я засрал настройки. Вот короче результат на паре файлов из моего предыдущего набора с русским голосом из песни Саи. https://voca.ro/1mZD3KEUH7ML
>>119127 То, что я заставил работать - это уже тренированные готовые модели для голоса.
В треде есть ссылки на проекты гитхаба, которые позволяют создать датасет (набор wav) и натренировать собственную модель. Для этого нужна CUDA и хорошая GPU от зеленых. Насчет AMD не знаю.
>>119157 >натренировать собственную модель См. выше, оно не тренирует, а жуёт каждый раз. Но да, типа подделывает. Но на русском получается УГ. Про другие методы с тренировкой модели пока аноны не запускали.
>>137167 Спасибо конечно, что последовал моему "гайду" и запустил Ксению, но я про обучение своим голосам. Плюс тут надо научится играть с эмоциями и прочим (вроде как возможно, но пока не тестил). И да, может, всё таки в TTS тред? А то два треда с одним предназначением.
>>260448 Да небось их жапонки голос сделали, у них с Р плоблема. >>261480 Так то всё что угодно оскорбляет кого-нибудь, красивые девушки оскорбляют жирух. Что теперь, дрочить на жирух?
Двач КАК сгенерировать звуковую дорогу на основе загруженного голоса? Я точно знаю, что такое есть. Помню где-то в телеге видел мол грузите голос, желательно пол часа и нейронка озвучит им любой текст.
Я даже нашел какую-то статью на дзене где есть ссылка на колаб, но там какие-то беды с тензерфлоу-гпу, разбираться в падлу. Дайте ссылочбку бога ради.
Нужна простейшая нейронка для распознавания даже не речи, а звуковых паттернов, которые я вручную ассоциирую с текстом. В результате должно получиться что-то вроде караоке, но с дообучением распознавания озвучиваемого текста (поскольку этот текст будет озвучиваться неоднократно). Кроме пистона есть советы?
Облазил тырнеты, результаты меня нихуя не устроили.
Задача: на основе мужского голоса (.mp3 запись) преобразовать его в женский. Нахуя: хочу аудиокнижки позаписывать, но, как положенно любому хикке, без привлечения иных лиц.
У меня впечатление, что ебучие чатики есть, генерация изображений есть, генерация музыки есть, а вот банальное преобразование одного голоса в другой -- хуй, да нихуя, особенно, на русском языке. Либо английский, либо японщина. И либо сосать хуй, либо как 15-20 лет назад Change Pitch и скорость менять в audacity, получая на выходе поеботу.
>>459020 >Такого, я так понимаю, в принципе нет. RVC и SVC могут работать как в режиме реального времени, так и с отдельными файлами. >русского почти нихера нет. Обучи свои модель — будет.
https://beta.elevenlabs.io/speech-synthesis
примеры
https://www.youtube.com/watch?v=9Xqw11NPC40
https://www.youtube.com/watch?v=kMPHsCn4RtA
https://www.youtube.com/watch?v=XYWh4gTs3tY