Сохранен 119
https://2ch.hk/ai/res/102542.html
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

AI голоса AI voice Elevenlabs AI 11.ai thread

 Аноним 05/02/23 Вск 20:34:19 #1 №102542 
image.png
Дикторы всё, но пока только американские
https://beta.elevenlabs.io/speech-synthesis

примеры
https://www.youtube.com/watch?v=9Xqw11NPC40
https://www.youtube.com/watch?v=kMPHsCn4RtA
https://www.youtube.com/watch?v=XYWh4gTs3tY
Аноним 05/02/23 Вск 20:45:25 #2 №102556 
2023-02-0401-32.png
1675450548121456.gif
>>102542 (OP)
https://vocaroo.com/14JW4THw4mIc
Аноним 05/02/23 Вск 20:48:53 #3 №102563 
>>102542 (OP) (OP)
японские тоже
>>88212 (OP) (OP)
Аноним 05/02/23 Вск 20:49:53 #4 №102565 
https://vocaroo.com/1aXsLiOIx7rI
Аноним 05/02/23 Вск 20:53:50 #5 №102569 
dfbe56a11640a1dc229f005e152285e7.jpg
>>102556
>>102565
Аноним 05/02/23 Вск 20:57:41 #6 №102574 
>>102563
Значит нужно быстрее тот тред до бамлимита довести, чтобы перекатить с ссылками актуальными
Аноним 05/02/23 Вск 21:00:12 #7 №102578 
>>102542 (OP)
блин я раньше думал это какая-то переговорная труба а теперь понял это микрофон и поп фильтр

жаль такого арта мало...
Аноним 05/02/23 Вск 21:21:24 #8 №102620 
>>102574
Да тот тред сдох, ответов на вопросы нет. А этот по сути ни чего нового не предлагает. Пока не будет адекватной нейросети на русском в открытом доступе, я не думаю что тема будет актульна. Нам нужны специалисты в лингвистике, кто хотябы с фонемами разбирается.
Аноним 05/02/23 Вск 21:33:13 #9 №102646 
>>102578
Ну ты пиздец, первый на очередь для замены нейросетями
Аноним 05/02/23 Вск 21:52:07 #10 №102686 
image.png
>>102542 (OP)
Я уже нихуя не понимаю, какая перспектива на этом арте? Пикрил, что ли?
Аноним 05/02/23 Вск 22:53:41 #11 №102768 
>>102686
это кстати не нейроарт

а перспектива нормальная анимешная тебя скорее всего сбивает поп фильтр, он немного наискосок от ююдачи
Аноним 05/02/23 Вск 23:34:02 #12 №102843 
>>102768
>сбивает
Меня сбивает моя криворукость, т.к. рисовать я совсем не умею. Просвети пж, как точки схода определять на уже нарисованном арте
Аноним 06/02/23 Пнд 00:21:58 #13 №102968 
>>102843
линия горизонта нужна толко, если у тебя фигуры можно поместить в gараллелепипед и все они стоят на одной плоскости. Или же у тебя есть парадейные полу линии, типо стыка стены и потолка. А для органике они используются как вспомогательный элимент и ты не сможешьь их повторить.
Аноним 06/02/23 Пнд 02:10:29 #14 №103079 
>>102620
Больше дохлых тредов! Надо моче написать, чтобы слила. Но кажись такой функции на имиджбордах нет, поэтому этот тред должен умереть.

Ах да, я бы и от англояпонского голоса не отказался бы, лишь бы можно было нормально без ебли у себя запускать.
Аноним 06/02/23 Пнд 02:21:40 #15 №103103 
>>102620
>>103079
Перекат нормальный делаете и всё.
Аноним 06/02/23 Пнд 02:25:12 #16 №103108 
cornel.jpg
ТРАХАТЬ УБОРЩИКОВ
https://vocaroo.com/1YE0eLvSzO4w
Аноним 06/02/23 Пнд 02:31:41 #17 №103115 
>>103103
>Перекат
>177 сообщений
Аноним 06/02/23 Пнд 02:56:47 #18 №103146 
>>103079
вот гайд по японскому ттс, если будут вопросы спрашивай.
https://textbin.net/kfylbjdmz9
Аноним 06/02/23 Пнд 03:12:36 #19 №103185 
изображение.png
>>103146
Я бы удивился, если бы оно сработало с первого раза без ошибок.
Аноним 06/02/23 Пнд 04:01:04 #20 №103276 
>>103185
У тебя была проблема во время выполнения строки `pip install -r requirements.txt`? Кинь скрин лога побольше, чтобы было видно последние строки.
Аноним 06/02/23 Пнд 04:03:20 #21 №103281 
изображение.png
>>103276
Там в середине мой логин. Но ошибка максимум долбоёбская, вряд ли с ней можно что-то сделать, кроме как снести мою старую как говно мамонта ЛГБТ шинду и накатить что-то поновее.
Аноним 06/02/23 Пнд 04:11:50 #22 №103309 
>>103281
Эта ошибка уже встречалось у двух человек. Просто следуй дальше по инструкции. И да у тебя не такой уж уникальный ник чтобы переживать об том что по нему можно задеанонить, но ты можешь просто его замазывать в следующий раз
Аноним 06/02/23 Пнд 04:42:39 #23 №103389 
изображение.png
>>103309
>Просто следуй дальше по инструкции
Результат немного предсказуем.
Аноним 06/02/23 Пнд 15:14:01 #24 №103842 
>>103389
Советую, сначало читать инструкции, а потом им следовать. Потому что там дальше по инструкции на 57 строчке написанно:
"Если у вас ошибки, то смотрите в повершел, и смотрите что пишут, если там ModuleNotFoundError: или AttributeError: То это значит что у вас не все модули скачались. Их можно докачать с помощью команды pip install "название модуля"..." В твоём случае надо написать `pip install librosa` если и это не поможет, то скачать через ссылку которая есть дальше по инструкции.
Аноним 07/02/23 Втр 13:15:06 #25 №105186 
>>103842
>Советую, сначало читать инструкции, а потом им следовать.
Я программист до мозга костей, поэтому исполняю всё построчно. Скачивание директории помогло, спасибо. Хотя интересно конечно, что ему там не нравилось. Судя по попытке что-то сбилдить, ему нужны билдтулы из вижуалстудии...
Аноним 07/02/23 Втр 13:32:26 #26 №105205 
а чего они у меня все тараторят? Есть какие-нибудь опции, чтобы успокоить их и замедлить, менять интонацию в предложениях и фразах.
Аноним 07/02/23 Втр 13:54:14 #27 №105232 
>>105205
>замедлить
Duration
>>105205
>менять интонацию в предложениях
Phoneme Input и там вводи всякие ↑↓
Аноним 07/02/23 Втр 14:36:59 #28 №105270 
>>105205
Модель для японского? Если да, то всё нормально, японцы всегда тараторят.
Аноним 07/02/23 Втр 14:38:43 #29 №105273 
photo2023-02-0714-38-18.jpg
Бля, как вы генерите? У меня без впн не открывает, а с впн банят якобы за абуз фри версии.
Сгенерьте Джинкс, вот аудио
https://vocaroo.com/14gcLSyK7ecY
Аноним 07/02/23 Втр 15:46:51 #30 №105332 
image.png
Добрый день, уважаемые господа. Пожалуйста, подскажите можно ли, и если да то как:
1. Генерировать русский голос (мужской, женский, детский)
2. Генерировать японский голос (мужской, женский, детский)
Аноним 07/02/23 Втр 16:15:35 #31 №105364 
>>105332
>1. Генерировать русский голос (мужской, женский, детский)
Пока нету, нужно тренировать.
>>105332
>2. Генерировать японский голос (мужской, женский, детский)
Как говна в проруби, особенно женских.
Аноним 07/02/23 Втр 16:34:56 #32 №105383 
>>105186
Сори, это мой первый гайд, поэтому там есть проблема со структурой. А пакет скорее всего не скачивался из-за проблем с виндой. У меня она 11.
Аноним 07/02/23 Втр 16:36:55 #33 №105386 
>>105332
https://colab.research.google.com/github/snakers4/silero-models/blob/master/examples_tts.ipynb#scrollTo=0c29189f
Аноним 07/02/23 Втр 17:50:55 #34 №105487 
image.png
image.png
image.png
2023-02-07 19-16-26.mp4
Оно работает! Немного напильника.

Я тоже столкнулся с ошибкой >>103281 "Не удается найти указанный файл" если делать череp pip установку зависимостей командой pip install -r requirements.txt общим списком

Пошел посмотреть список модулей, которые по зависимостям требует VITS-Umamusume-voice-synthesizer, всего 22 пакета, на установке 12 пакета - pyopenjtalk - через pip (установщик пакетов Питона) как раз эта ошибка "Не удается найти указанный файл".

Остальные модули при установке по одному с конца списка ручным копированием названия в powershell поставились через pip без ошибок.

Пришлось скачать готовые папки с модулями pyopenjtalk через https://drive.google.com/drive/folders/1WY5kumfugiwYk-CJEU9eU2sEVAIOCqpr?usp=share_link и поместить их оба как в папку с виртуальной средой (venv) в Lib\site-packages так и в сам клонированный через git репозиторий VITS-Umamusume-voice-synthesizer.

Для получения ссылки на локальную интернет-морду в powershell
1. Запустил powershell от администратора
2. Перешел к папке с виртуальной средой через cd
3. Активировал скрипты командой .\название папки для виртуальной среды\Scripts\activate
4. Перешел к папке с VITS-Umamusume-voice-synthesizer через cd
5. Для её запуска использовал python3.exe .\app.py (у меня есть как и обычный старый 2-ой питон, если пробовать искать его через python.exe, так и python3.10.exe - поставленный из магазина Майкрософт, так и отдельный обычный Питон 3, который находится через python3.exe. У меня под Windows 10 работает и через обычный скачанный с сайта Питон 3 (python3.exe) и через Майкрософтовский (python3.10.exe).

Powershell еще сказала надо поставить через pip модуль tqdm, при выполнении pip install tqdm вижу:
WARNING: The script tqdm.exe is installed in 'C:\Users\bk\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\Scripts' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location

Пошел к доп. настройкам Windows, без задней мысли добавил везде где можно директорию со Скриптами в PATH.

Если не добавлять в PATH и пробовать запустить локальную вебморду в браузере и нажать Generate, получаю Error. Но после добавления в PATH и активации скриптов запускаю
python3.10.exe .\app.py
или
python3.exe .\app.py
получаю локальную вебморду http://127.0.0.1:7860/ - жму Generate и слышу заветное konnichi wa! (Каждый раз разное при генерации).

Записи лежат в wav в папке, про которую написано в гайде - да, надо открыть app.py и прописать в трех местах с 27 строки в параметрах dir=self.temp_dir вместо self.temp_dir название директории (папки), которую вы сами создаете и называете для хранения аудиозаписей, причем обратный слэш в конце названия может быть не обязателен, на своей машине я проверял запуск с названием этой папки со слэшом в конце и без него, замену названий проводил через Notepad++
Аноним 07/02/23 Втр 17:52:56 #35 №105490 
>>105487
аватарку убери, чмо
Аноним 07/02/23 Втр 18:14:33 #36 №105522 
>>105487
Я думаю я просто соберу контейнер без ненужной хуйни и просто залью, чтобы не ебаться с этим.
Аноним 07/02/23 Втр 18:17:38 #37 №105523 
Что же, теперь когда VITS-Umamusume-voice-synthesizer работает и генерирует, возникает резонный вопрос: как ее настроить или натренировать на кастомном аудиопотоке чтобы получить собственного японского персонажа?
Аноним 07/02/23 Втр 20:37:34 #38 №105639 
>>105523
Вот тут есть некоторая информация (а так же около 3000 готовых голосов)
https://huggingface.co/spaces/skytnt/moe-tts/discussions/17
Аноним 07/02/23 Втр 23:07:08 #39 №105887 
> Luke, did I ever tell you about Ahsoka Tano? She was your father’s exotic teenage alien apprentice, a fine piece of jailbait from a more civilized age. She had the tightest body and the perkiest little breasts in the galaxy; barely legal in most systems.

> Anakin and I used to doubleteam her at the end of every successful campaign during the Clone Wars, and once in a while we’d even have the entire 501st run a train over her, part of official Jedi “training” of course. In time, she learned how to handle a meatsaber better than anyone in the Jedi Temple. She wore a miniskirt every day so we told her there were no panties in space, and since she was constantly doing acrobatics you’d get a glimpse of her orange pussy mid fight as she’d do a flip while slicing a B2 Super Battledroid in half. It was surreal.

> We taught her to grip her weapon backwards like a dildo and she constantly got captured by pirates and slavers almost every other day. It was ridiculous, like a constant porno Luke, you have no idea. And she was a good friend.
Аноним 08/02/23 Срд 00:22:21 #40 №106056 
image.png
>>105639
В общем, как я понимаю, "Советский учебник по алхимии 3.0" не для слабых духом, да и только для видеокарт, и натренировать даже один голос на моем двухгиговом старом видеоведре, уже не говоря про CPU, невозможно в принципе.
Аноним 08/02/23 Срд 00:54:44 #41 №106088 
>>106056
Почему ты так решил? Если что, потрейнить мог бы и я, у меня 3080Ti, должно хватить для голоса.
Аноним 08/02/23 Срд 01:15:12 #42 №106112 
image.png
>>106088
>Почему ты так решил?
Потому что внутри train.py английским по черному написано:
"CPU training is not allowed." и рядом всякие assert torch.cuda.is_available() для Nvidia.

А из статьи на китайском ясно, что для моего AMDшного видеоведра никакой ROCm не светит, да и крепкий волос мудрый вождь нефритовый стержень запретил колдовать на процессоре.
Аноним 08/02/23 Срд 02:37:04 #43 №106168 
>>106112
Ох нифига, ты читаешь код перед запуском?
Ладно, попробую у себя. Главное чтобы под шиндой работало.
Формат тренировочных данных кто-нибудь знает?
Аноним 08/02/23 Срд 07:44:05 #44 №106223 
>>105273
Удали куки по сайту. Заходи в настройки браузера и ищи вкладку с куки, потом ищешь имя сайта в списке и жмёшь удалить, всё.
На самом деле это ещё задроченный вариант, может просто другой аккаунт зарегать можно.
Аноним 08/02/23 Срд 07:53:35 #45 №106224 
image.png
image.png
>>106168
В датасете LJSpeech-1.1, например, идет метадата - csv таблица с названием wav и текстом рядом, и сами wav в папке.

А для собственного датасета должно быть wav конвертированное в 32kHz через питоний скрипт, положенное в папке dataset_raw

https://github.com/innnky/so-vits-svc/blob/32k/Eng_docs.md
Аноним 08/02/23 Срд 13:37:01 #46 №106410 
image.png
Обмазался пакетами питона, удалил обычный parselmouth, поставил praat-parselmouth и все равно в итоге вся эта ебала so-vits-svc и не дизайнилась под тренировку своей модели на кастомном датасете wav через ЦПУ. Не видать мне заветного голоса покуда CUDA не пришла в мой дом.
Аноним 08/02/23 Срд 15:19:25 #47 №106543 
>>102542 (OP)
Блин, что за ебаная шапка? Где мануал? Как вкатиться? Что делать?

Сделать им семпл голоса мечты? Как это работает?
Аноним 08/02/23 Срд 15:37:20 #48 №106561 
>>106543
Шапка тут
>88212
Аноним 08/02/23 Срд 15:38:06 #49 №106563 
>>106561
>>88212 (OP)
Фикс
Аноним 08/02/23 Срд 17:24:59 #50 №106704 
image.png
image.png
image.png
>>106223
Куки легко чистятся, но эта хуйня не помогает. После первой попытки что либо сгенерить на сайте вылезает третий пик. Еще не пробовал другие впн.
Аноним 08/02/23 Срд 19:21:22 #51 №106919 
>>106543
Да всё, закрыли лавочку. Три дня назад можно было до 5 кастомных голосов создать, а теперь нельзя.
Аноним 08/02/23 Срд 19:28:47 #52 №106945 
>>106919
Хммммм, со старого аккаунта ещё можно создавать, значит либо смотрит на гугловскую привязку к телефону либо новые аккаунты теперь кастрированы, теперь только за деньгу.
Аноним 08/02/23 Срд 19:33:37 #53 №106957 
Всё пиздец
Voice Lab is only available on paid tiers. Please subscribe, a free trial is available for Starter tier.
Аноним 08/02/23 Срд 19:42:28 #54 №106976 
>>106957
Ну и прекрасно. Платная параша же. А теперь пошли трейнить на колабе с открытым кодом.
Аноним 09/02/23 Чтв 09:17:35 #55 №107665 
>>106945
БЛЯЯЯЯЯЯЯЯЯЯЯЯЯЯ. У меня даже одного текстового запроса не вышло сделать. Сука.
Аноним 09/02/23 Чтв 23:46:06 #56 №108423 
Чо так все сложна, нихуя не понимаю, когда запилят webui для голоса?
Аноним 10/02/23 Птн 00:28:19 #57 №108459 
>>108423
Вебморда здеся - https://huggingface.co/spaces/skytnt/moe-tts
Проблема в том, что ее пишут азиаты (ебаные гуки, спасибо им за всё), судя по наполнению.
Аноним 10/02/23 Птн 23:31:57 #58 №109889 
>>102542 (OP)
Дикторы-то хуй с ними, а вот голосовым актёрам и всяким там сэйю стоит пристрематься.
Аноним 11/02/23 Суб 02:02:17 #59 №110222 
>>109889
До уровня сейю этим программам ещё срать и срать.
Аноним 11/02/23 Суб 07:51:16 #60 №110412 
1675135197846029.jpg
https://files.catbox.moe/e7dw81.mp4
Аноним 11/02/23 Суб 13:58:14 #61 №110678 
BgCDO-UcAEEkmY.png
https://vocaroo.com/1lMnkDDIEAvM
Аноним 11/02/23 Суб 14:34:15 #62 №110733 
>>110678
Для глухих
>иди нахуй, сука, я твою маму ебал, ах.
Аноним 12/02/23 Вск 04:52:13 #63 №111839 
j.webm
https://rentry.org/AIVoiceStuff
https://rentry.org/AI-Voice-Cloning
Аноним 12/02/23 Вск 17:29:08 #64 №112683 
>>111839
Так, вторая ссылка выглядит более перспективно. Спасибо!
Аноним 12/02/23 Вск 18:50:19 #65 №112901 
>>111839
>https://rentry.org/AI-Voice-Cloning
Я так понял образец нада в утилиты кидать? Пишет файл без методанных иди нахуй. В основном окне только запись с микрофона.
Аноним 13/02/23 Пнд 04:21:20 #66 №114169 
изображение.png
>>112901
Не угадал. Нужно закиинуть подготовленные wav (через скрипт в convert) в подкаталог в voices (назови сам).
Но это какая-то стрёмная хуйня, которая жуёт входные файлы каждый раз, поэтому генерация занимает больше 10ГБ врамы и идёт по 5 минут, лол. Качество... Ну явно не для русского, хотя оно пыталось, да. Впрочем, может это я засрал настройки. Вот короче результат на паре файлов из моего предыдущего набора с русским голосом из песни Саи.
https://voca.ro/1mZD3KEUH7ML
Аноним 13/02/23 Пнд 11:33:55 #67 №114403 
>>114169
Бля, ну это кал. Даже FreeVc лучше.
Аноним 13/02/23 Пнд 12:48:33 #68 №114472 
>>114169
Пара файлов это что, тренировка на датасете ровно из двух wav файлов?
Аноним 13/02/23 Пнд 13:59:33 #69 №114551 
изображение.png
>>114403
На английском оно лучше. С русским да, пока везде беда.
>>114472
Пяти, если быть точным, где-то на минуту.
Аноним 13/02/23 Пнд 15:17:51 #70 №114702 
>>114551
>Пяти, если быть точным
Этого хватает для полноценного датасета и получения годных результатов?
Аноним 13/02/23 Пнд 18:05:57 #71 №114955 
>>114702
Там по сути нет датасета. И голос так себе. Ищем другие, более удобные варианты.
Аноним 16/02/23 Чтв 09:20:34 #72 №119127 
>>105487
Голос он сожет подделать или только готовый?
Аноним 16/02/23 Чтв 10:47:01 #73 №119157 
>>119127
То, что я заставил работать - это уже тренированные готовые модели для голоса.

В треде есть ссылки на проекты гитхаба, которые позволяют создать датасет (набор wav) и натренировать собственную модель. Для этого нужна CUDA и хорошая GPU от зеленых. Насчет AMD не знаю.
Аноним 16/02/23 Чтв 18:49:13 #74 №119710 
>>119157
>натренировать собственную модель
См. выше, оно не тренирует, а жуёт каждый раз. Но да, типа подделывает. Но на русском получается УГ.
Про другие методы с тренировкой модели пока аноны не запускали.
Аноним 17/02/23 Птн 07:30:25 #75 №120689 
>>119710
Если китайцы смогли, то и у нас получится
Аноним 18/02/23 Суб 02:11:06 #76 №122113 
>>120689
Китайцев 1,5 лярда, нас в 10 раз меньше. Соответственно в 10 раз меьше мозгов, чтобы фонемы под русский починить да моделей натрейнить.
Аноним 23/02/23 Чтв 20:52:22 #77 №129455 
>>105364
>Пока нету, нужно тренировать.
Можно подробнее? Какие мощности нужны, сколько данных для треннировки?
Аноним 24/02/23 Птн 04:50:01 #78 №129862 
>>129455
В шапке ТТS треда должна быть инфа.
>>88212 (OP)
Аноним 26/02/23 Вск 00:28:06 #79 №131785 
>>108459
она японская, другие языки не поддерживает.
Аноним 26/02/23 Вск 00:37:25 #80 №131799 
>>131785
А стонать и визжать она умеет?
мимо
Аноним 26/02/23 Вск 00:44:13 #81 №131804 
>>131799
А нарезать этих стонов с хентая и вставить в озвучку нельзя?
Тожемимо
Аноним 26/02/23 Вск 07:50:43 #82 №131949 
изображение.png
>>131785
>другие языки не поддерживает
Да что ты говоришь...
Аноним 26/02/23 Вск 19:45:51 #83 №132679 
>>131804
Для этого нужно просматривать тонны хентая в поисках нужного стона, и подгонять голоса разных актеров друг под друга.
Аноним 27/02/23 Пнд 21:38:05 #84 №134063 
>>111839
А можно делиться итогами? Моделью голоса? Не каждому же с нуля ту же Эмму тренить?
Аноним 28/02/23 Втр 04:51:19 #85 №134480 
>>132679
Каторжный труд
Аноним 01/03/23 Срд 09:19:52 #86 №135793 
>>134063
конешн, для этого и тред создан
Аноним 02/03/23 Чтв 19:50:33 #87 №137167 
1677775833472.mp4
>>114551
> С русским да, пока везде беда.
Аноним 02/03/23 Чтв 21:47:13 #88 №137337 
>>137167
Спасибо конечно, что последовал моему "гайду" и запустил Ксению, но я про обучение своим голосам. Плюс тут надо научится играть с эмоциями и прочим (вроде как возможно, но пока не тестил). И да, может, всё таки в TTS тред? А то два треда с одним предназначением.
Аноним 11/03/23 Суб 19:53:39 #89 №150974 
В Эвеленлабс получаетсяя надо брать Стартовый пак для клонирования голоса?
sage[mailto:sage] Аноним 11/03/23 Суб 23:08:18 #90 №151315 
>>150974
Нет, и бесплатного хватает для небольших тестов (по состоянию на январь, сейчас ХЗ).
А вообще, лучше в единый TTS тред >>88212 (OP)
Аноним 14/03/23 Втр 10:02:51 #91 №155101 
>>102542 (OP)
А голос обэмы и бидона есть?
Аноним 14/03/23 Втр 16:38:54 #92 №155465 
>>102542 (OP)
Кидайте контент
Аноним 26/03/23 Вск 20:38:46 #93 №184961 
>>151315
Сейчас беслптано только вмроеннве голоса, клонирование только платно
Аноним 18/04/23 Втр 03:09:51 #94 №235725 
>>137167
А детские есть голоса? У майкрософта в наборе онлайн ттс английские есть, русских пока не находил.
Аноним 18/04/23 Втр 03:28:02 #95 №235737 
image.png
>>235725
Есть, адрес пиши свой, анончик. Или телегу.
Аноним 18/04/23 Втр 09:28:32 #96 №236004 
>>235737
И че ты возбудился? Включи озвучку в эдже, на инглише девочки угарно читают, отправляй микросам пативен
Аноним 23/04/23 Вск 21:07:19 #97 №251694 
>>137337
> что последовал моему "гайду" и запустил Ксению
Какую блядь Ксению? Каким гайдам? Ты ебанутый?
Аноним 23/04/23 Вск 21:14:03 #98 №251722 
1682273643456.mp4
>>235725
> А детские есть голоса?
Да хоть MLP.
Аноним 26/04/23 Срд 03:35:40 #99 №259414 
>>251722
А что у неё с акцентом?
Аноним 26/04/23 Срд 14:22:29 #100 №260164 
>>251722

Ракосель, уходи.
Аноним 26/04/23 Срд 15:57:27 #101 №260330 
>>102542 (OP)
судя по оп-пику, звуки там однотипные. ну, знаете: ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ!
Аноним 26/04/23 Срд 16:44:25 #102 №260448 
>>251722
У неё нет букв Р, потому что она испекла из них капкейки?
Аноним 26/04/23 Срд 17:12:23 #103 №260532 
>>260448
тоутики
Аноним 26/04/23 Срд 23:39:23 #104 №261548 
>>260448
Слышь, сука, ты на детей наезжать вздумал, педофил? Небось тилибонькаешь на детсадовцев? Картавят они ему, суке.
Аноним 26/04/23 Срд 23:53:46 #105 №261606 
>>260448
Да небось их жапонки голос сделали, у них с Р плоблема.
>>261480
Так то всё что угодно оскорбляет кого-нибудь, красивые девушки оскорбляют жирух. Что теперь, дрочить на жирух?
Аноним 27/04/23 Чтв 09:54:55 #106 №262506 
Так-то я бы тоже от детских голосов не отказался.
Аноним 27/04/23 Чтв 10:56:29 #107 №262593 
a4c921f2bb421b6d4ab1c2538ba8efb2.jpg
>>262506
+++
Аноним 29/05/23 Пнд 21:15:10 #108 №329121 
VID20230529211325658.mp4
С помщью какой нейросети пикрил сделали?
Аноним 29/05/23 Пнд 23:00:49 #109 №329434 
>>329121
Эта нейросеть называется рандомное приложение в плеймаркете с эффектиками
Аноним 29/05/23 Пнд 23:02:51 #110 №329442 
>>329121
>>329434
Бля, название треда не прочитал. Насчет звука без понятия
Аноним 01/07/23 Суб 22:54:26 #111 №381206 
Двач КАК сгенерировать звуковую дорогу на основе загруженного голоса? Я точно знаю, что такое есть. Помню где-то в телеге видел мол грузите голос, желательно пол часа и нейронка озвучит им любой текст.

Я даже нашел какую-то статью на дзене где есть ссылка на колаб, но там какие-то беды с тензерфлоу-гпу, разбираться в падлу. Дайте ссылочбку бога ради.
Аноним 01/07/23 Суб 23:15:42 #112 №381286 
>>381206
Уточню. Надо чтобы я загрузил голос, потом написал текст и она загруженным голосом озвучила этот текст.
Аноним 01/07/23 Суб 23:24:02 #113 №381315 
>>381206
>ссылка на колаб
Оказывается репозиторий не обновлялся уже 4 года. Если 4 года назад такое могли делать, то щас то почему хуй найдешь???
Аноним 01/07/23 Суб 23:32:29 #114 №381340 
Нужна простейшая нейронка для распознавания даже не речи, а звуковых паттернов, которые я вручную ассоциирую с текстом. В результате должно получиться что-то вроде караоке, но с дообучением распознавания озвучиваемого текста (поскольку этот текст будет озвучиваться неоднократно). Кроме пистона есть советы?
Аноним 16/08/23 Срд 09:27:40 #115 №457954 
Облазил тырнеты, результаты меня нихуя не устроили.

Задача: на основе мужского голоса (.mp3 запись) преобразовать его в женский.
Нахуя: хочу аудиокнижки позаписывать, но, как положенно любому хикке, без привлечения иных лиц.

У меня впечатление, что ебучие чатики есть, генерация изображений есть, генерация музыки есть, а вот банальное преобразование одного голоса в другой -- хуй, да нихуя, особенно, на русском языке. Либо английский, либо японщина. И либо сосать хуй, либо как 15-20 лет назад Change Pitch и скорость менять в audacity, получая на выходе поеботу.
Аноним 16/08/23 Срд 17:50:39 #116 №458413 
image.png
>>457954
Посмотри rvc из треда https://2ch.hk/ai/res/314948.html
Там дохера моделей.
Аноним 17/08/23 Чтв 04:07:10 #117 №459020 
>>458413
В том-то и дело, что мне нужно не realtime, а на основе заготовленных записей.
Такого, я так понимаю, в принципе нет.

И да, моделей там дохера только для английского и японского, русского почти нихера нет.
Аноним 17/08/23 Чтв 18:23:43 #118 №459527 
>>459020
>Такого, я так понимаю, в принципе нет.
RVC и SVC могут работать как в режиме реального времени, так и с отдельными файлами.
>русского почти нихера нет.
Обучи свои модель — будет.
sage[mailto:sage] Аноним 21/08/23 Пнд 05:59:42 #119 №462337 
>>461500 (OP)
>>461500 (OP)
>>461500 (OP)
comments powered by Disqus

Отзывы и предложения