AI голоса AI voice Elevenlabs AI 11.ai thread

Аноним 05/02/23 Вск 20:34:19 #1 №102542

Дикторы всё, но пока только американские
https://beta.elevenlabs.io/speech-synthesis

примеры
https://www.youtube.com/watch?v=9Xqw11NPC40
https://www.youtube.com/watch?v=kMPHsCn4RtA
https://www.youtube.com/watch?v=XYWh4gTs3tY

Аноним 05/02/23 Вск 20:45:25 #2 №102556

2023-02-0401-32.png

1675450548121456.gif

>>102542 (OP)
https://vocaroo.com/14JW4THw4mIc

Аноним 05/02/23 Вск 20:48:53 #3 №102563

>>102542 (OP) (OP)
японские тоже
>>88212 (OP) (OP)

Аноним 05/02/23 Вск 20:49:53 #4 №102565

https://vocaroo.com/1aXsLiOIx7rI

Аноним 05/02/23 Вск 20:53:50 #5 №102569

dfbe56a11640a1dc229f005e152285e7.jpg

>>102556
>>102565

Аноним 05/02/23 Вск 20:57:41 #6 №102574

>>102563
Значит нужно быстрее тот тред до бамлимита довести, чтобы перекатить с ссылками актуальными

Аноним 05/02/23 Вск 21:00:12 #7 №102578

>>102542 (OP)
блин я раньше думал это какая-то переговорная труба а теперь понял это микрофон и поп фильтр

жаль такого арта мало...

Аноним 05/02/23 Вск 21:21:24 #8 №102620

>>102574
Да тот тред сдох, ответов на вопросы нет. А этот по сути ни чего нового не предлагает. Пока не будет адекватной нейросети на русском в открытом доступе, я не думаю что тема будет актульна. Нам нужны специалисты в лингвистике, кто хотябы с фонемами разбирается.

Аноним 05/02/23 Вск 21:33:13 #9 №102646

>>102578
Ну ты пиздец, первый на очередь для замены нейросетями

Аноним 05/02/23 Вск 21:52:07 #10 №102686

image.png

>>102542 (OP)
Я уже нихуя не понимаю, какая перспектива на этом арте? Пикрил, что ли?

Аноним 05/02/23 Вск 22:53:41 #11 №102768

>>102686
это кстати не нейроарт

а перспектива нормальная анимешная тебя скорее всего сбивает поп фильтр, он немного наискосок от ююдачи

Аноним 05/02/23 Вск 23:34:02 #12 №102843

>>102768
>сбивает
Меня сбивает моя криворукость, т.к. рисовать я совсем не умею. Просвети пж, как точки схода определять на уже нарисованном арте

Аноним 06/02/23 Пнд 00:21:58 #13 №102968

>>102843
линия горизонта нужна толко, если у тебя фигуры можно поместить в gараллелепипед и все они стоят на одной плоскости. Или же у тебя есть парадейные полу линии, типо стыка стены и потолка. А для органике они используются как вспомогательный элимент и ты не сможешьь их повторить.

Аноним 06/02/23 Пнд 02:10:29 #14 №103079

>>102620
Больше дохлых тредов! Надо моче написать, чтобы слила. Но кажись такой функции на имиджбордах нет, поэтому этот тред должен умереть.

Ах да, я бы и от англояпонского голоса не отказался бы, лишь бы можно было нормально без ебли у себя запускать.

Аноним 06/02/23 Пнд 02:21:40 #15 №103103

>>102620
>>103079
Перекат нормальный делаете и всё.

Аноним 06/02/23 Пнд 02:25:12 #16 №103108

cornel.jpg

ТРАХАТЬ УБОРЩИКОВ
https://vocaroo.com/1YE0eLvSzO4w

Аноним 06/02/23 Пнд 02:31:41 #17 №103115

>>103103
>Перекат
>177 сообщений

Аноним 06/02/23 Пнд 02:56:47 #18 №103146

>>103079
вот гайд по японскому ттс, если будут вопросы спрашивай.
https://textbin.net/kfylbjdmz9

Аноним 06/02/23 Пнд 03:12:36 #19 №103185

изображение.png

>>103146
Я бы удивился, если бы оно сработало с первого раза без ошибок.

Аноним 06/02/23 Пнд 04:01:04 #20 №103276

>>103185
У тебя была проблема во время выполнения строки `pip install -r requirements.txt`? Кинь скрин лога побольше, чтобы было видно последние строки.

Аноним 06/02/23 Пнд 04:03:20 #21 №103281

изображение.png

>>103276
Там в середине мой логин. Но ошибка максимум долбоёбская, вряд ли с ней можно что-то сделать, кроме как снести мою старую как говно мамонта ЛГБТ шинду и накатить что-то поновее.

Аноним 06/02/23 Пнд 04:11:50 #22 №103309

>>103281
Эта ошибка уже встречалось у двух человек. Просто следуй дальше по инструкции. И да у тебя не такой уж уникальный ник чтобы переживать об том что по нему можно задеанонить, но ты можешь просто его замазывать в следующий раз

Аноним 06/02/23 Пнд 04:42:39 #23 №103389

изображение.png

>>103309
>Просто следуй дальше по инструкции
Результат немного предсказуем.

Аноним 06/02/23 Пнд 15:14:01 #24 №103842

>>103389
Советую, сначало читать инструкции, а потом им следовать. Потому что там дальше по инструкции на 57 строчке написанно:
"Если у вас ошибки, то смотрите в повершел, и смотрите что пишут, если там ModuleNotFoundError: или AttributeError: То это значит что у вас не все модули скачались. Их можно докачать с помощью команды pip install "название модуля"..." В твоём случае надо написать `pip install librosa` если и это не поможет, то скачать через ссылку которая есть дальше по инструкции.

Аноним 07/02/23 Втр 13:15:06 #25 №105186

>>103842
>Советую, сначало читать инструкции, а потом им следовать.
Я программист до мозга костей, поэтому исполняю всё построчно. Скачивание директории помогло, спасибо. Хотя интересно конечно, что ему там не нравилось. Судя по попытке что-то сбилдить, ему нужны билдтулы из вижуалстудии...

Аноним 07/02/23 Втр 13:32:26 #26 №105205

а чего они у меня все тараторят? Есть какие-нибудь опции, чтобы успокоить их и замедлить, менять интонацию в предложениях и фразах.

Аноним 07/02/23 Втр 13:54:14 #27 №105232

>>105205
>замедлить
Duration
>>105205
>менять интонацию в предложениях
Phoneme Input и там вводи всякие ↑↓

Аноним 07/02/23 Втр 14:36:59 #28 №105270

>>105205
Модель для японского? Если да, то всё нормально, японцы всегда тараторят.

Аноним 07/02/23 Втр 14:38:43 #29 №105273

photo2023-02-0714-38-18.jpg

Бля, как вы генерите? У меня без впн не открывает, а с впн банят якобы за абуз фри версии.
Сгенерьте Джинкс, вот аудио
https://vocaroo.com/14gcLSyK7ecY

Аноним 07/02/23 Втр 15:46:51 #30 №105332

image.png

Добрый день, уважаемые господа. Пожалуйста, подскажите можно ли, и если да то как:
1. Генерировать русский голос (мужской, женский, детский)
2. Генерировать японский голос (мужской, женский, детский)

Аноним 07/02/23 Втр 16:15:35 #31 №105364

>>105332
>1. Генерировать русский голос (мужской, женский, детский)
Пока нету, нужно тренировать.
>>105332
>2. Генерировать японский голос (мужской, женский, детский)
Как говна в проруби, особенно женских.

Аноним 07/02/23 Втр 16:34:56 #32 №105383

>>105186
Сори, это мой первый гайд, поэтому там есть проблема со структурой. А пакет скорее всего не скачивался из-за проблем с виндой. У меня она 11.

Аноним 07/02/23 Втр 16:36:55 #33 №105386

>>105332
https://colab.research.google.com/github/snakers4/silero-models/blob/master/examples_tts.ipynb#scrollTo=0c29189f

Аноним 07/02/23 Втр 17:50:55 #34 №105487

image.png

2023-02-07 19-16-26.mp4

Оно работает! Немного напильника.

Я тоже столкнулся с ошибкой >>103281 "Не удается найти указанный файл" если делать череp pip установку зависимостей командой pip install -r requirements.txt общим списком

Пошел посмотреть список модулей, которые по зависимостям требует VITS-Umamusume-voice-synthesizer, всего 22 пакета, на установке 12 пакета - pyopenjtalk - через pip (установщик пакетов Питона) как раз эта ошибка "Не удается найти указанный файл".

Остальные модули при установке по одному с конца списка ручным копированием названия в powershell поставились через pip без ошибок.

Пришлось скачать готовые папки с модулями pyopenjtalk через https://drive.google.com/drive/folders/1WY5kumfugiwYk-CJEU9eU2sEVAIOCqpr?usp=share_link и поместить их оба как в папку с виртуальной средой (venv) в Lib\site-packages так и в сам клонированный через git репозиторий VITS-Umamusume-voice-synthesizer.

Для получения ссылки на локальную интернет-морду в powershell
1. Запустил powershell от администратора
2. Перешел к папке с виртуальной средой через cd
3. Активировал скрипты командой .\название папки для виртуальной среды\Scripts\activate
4. Перешел к папке с VITS-Umamusume-voice-synthesizer через cd
5. Для её запуска использовал python3.exe .\app.py (у меня есть как и обычный старый 2-ой питон, если пробовать искать его через python.exe, так и python3.10.exe - поставленный из магазина Майкрософт, так и отдельный обычный Питон 3, который находится через python3.exe. У меня под Windows 10 работает и через обычный скачанный с сайта Питон 3 (python3.exe) и через Майкрософтовский (python3.10.exe).

Powershell еще сказала надо поставить через pip модуль tqdm, при выполнении pip install tqdm вижу:
WARNING: The script tqdm.exe is installed in 'C:\Users\bk\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\Scripts' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location

Пошел к доп. настройкам Windows, без задней мысли добавил везде где можно директорию со Скриптами в PATH.

Если не добавлять в PATH и пробовать запустить локальную вебморду в браузере и нажать Generate, получаю Error. Но после добавления в PATH и активации скриптов запускаю
python3.10.exe .\app.py
или
python3.exe .\app.py
получаю локальную вебморду http://127.0.0.1:7860/ - жму Generate и слышу заветное konnichi wa! (Каждый раз разное при генерации).

Записи лежат в wav в папке, про которую написано в гайде - да, надо открыть app.py и прописать в трех местах с 27 строки в параметрах dir=self.temp_dir вместо self.temp_dir название директории (папки), которую вы сами создаете и называете для хранения аудиозаписей, причем обратный слэш в конце названия может быть не обязателен, на своей машине я проверял запуск с названием этой папки со слэшом в конце и без него, замену названий проводил через Notepad++

Аноним 07/02/23 Втр 17:52:56 #35 №105490

>>105487
аватарку убери, чмо

Аноним 07/02/23 Втр 18:14:33 #36 №105522

>>105487
Я думаю я просто соберу контейнер без ненужной хуйни и просто залью, чтобы не ебаться с этим.

Аноним 07/02/23 Втр 18:17:38 #37 №105523

Что же, теперь когда VITS-Umamusume-voice-synthesizer работает и генерирует, возникает резонный вопрос: как ее настроить или натренировать на кастомном аудиопотоке чтобы получить собственного японского персонажа?

Аноним 07/02/23 Втр 20:37:34 #38 №105639

>>105523
Вот тут есть некоторая информация (а так же около 3000 готовых голосов)
https://huggingface.co/spaces/skytnt/moe-tts/discussions/17

Аноним 07/02/23 Втр 23:07:08 #39 №105887

> Luke, did I ever tell you about Ahsoka Tano? She was your father’s exotic teenage alien apprentice, a fine piece of jailbait from a more civilized age. She had the tightest body and the perkiest little breasts in the galaxy; barely legal in most systems.

> Anakin and I used to doubleteam her at the end of every successful campaign during the Clone Wars, and once in a while we’d even have the entire 501st run a train over her, part of official Jedi “training” of course. In time, she learned how to handle a meatsaber better than anyone in the Jedi Temple. She wore a miniskirt every day so we told her there were no panties in space, and since she was constantly doing acrobatics you’d get a glimpse of her orange pussy mid fight as she’d do a flip while slicing a B2 Super Battledroid in half. It was surreal.

> We taught her to grip her weapon backwards like a dildo and she constantly got captured by pirates and slavers almost every other day. It was ridiculous, like a constant porno Luke, you have no idea. And she was a good friend.

Аноним 08/02/23 Срд 00:22:21 #40 №106056

image.png

>>105639
В общем, как я понимаю, "Советский учебник по алхимии 3.0" не для слабых духом, да и только для видеокарт, и натренировать даже один голос на моем двухгиговом старом видеоведре, уже не говоря про CPU, невозможно в принципе.

Аноним 08/02/23 Срд 00:54:44 #41 №106088

>>106056
Почему ты так решил? Если что, потрейнить мог бы и я, у меня 3080Ti, должно хватить для голоса.

Аноним 08/02/23 Срд 01:15:12 #42 №106112

image.png

>>106088
>Почему ты так решил?
Потому что внутри train.py английским по черному написано:
"CPU training is not allowed." и рядом всякие assert torch.cuda.is_available() для Nvidia.

А из статьи на китайском ясно, что для моего AMDшного видеоведра никакой ROCm не светит, да и крепкий волос мудрый вождь нефритовый стержень запретил колдовать на процессоре.

Аноним 08/02/23 Срд 02:37:04 #43 №106168

>>106112
Ох нифига, ты читаешь код перед запуском?
Ладно, попробую у себя. Главное чтобы под шиндой работало.
Формат тренировочных данных кто-нибудь знает?

Аноним 08/02/23 Срд 07:44:05 #44 №106223

>>105273
Удали куки по сайту. Заходи в настройки браузера и ищи вкладку с куки, потом ищешь имя сайта в списке и жмёшь удалить, всё.
На самом деле это ещё задроченный вариант, может просто другой аккаунт зарегать можно.

Аноним 08/02/23 Срд 07:53:35 #45 №106224

image.png

>>106168
В датасете LJSpeech-1.1, например, идет метадата - csv таблица с названием wav и текстом рядом, и сами wav в папке.

А для собственного датасета должно быть wav конвертированное в 32kHz через питоний скрипт, положенное в папке dataset_raw

https://github.com/innnky/so-vits-svc/blob/32k/Eng_docs.md

Аноним 08/02/23 Срд 13:37:01 #46 №106410

image.png

Обмазался пакетами питона, удалил обычный parselmouth, поставил praat-parselmouth и все равно в итоге вся эта ебала so-vits-svc и не дизайнилась под тренировку своей модели на кастомном датасете wav через ЦПУ. Не видать мне заветного голоса покуда CUDA не пришла в мой дом.

Аноним 08/02/23 Срд 15:19:25 #47 №106543

>>102542 (OP)
Блин, что за ебаная шапка? Где мануал? Как вкатиться? Что делать?

Сделать им семпл голоса мечты? Как это работает?

Аноним 08/02/23 Срд 15:37:20 #48 №106561

>>106543
Шапка тут
>88212

Аноним 08/02/23 Срд 15:38:06 #49 №106563

>>106561
>>88212 (OP)
Фикс

Аноним 08/02/23 Срд 17:24:59 #50 №106704

image.png

>>106223
Куки легко чистятся, но эта хуйня не помогает. После первой попытки что либо сгенерить на сайте вылезает третий пик. Еще не пробовал другие впн.

Аноним 08/02/23 Срд 19:21:22 #51 №106919

>>106543
Да всё, закрыли лавочку. Три дня назад можно было до 5 кастомных голосов создать, а теперь нельзя.

Аноним 08/02/23 Срд 19:28:47 #52 №106945

>>106919
Хммммм, со старого аккаунта ещё можно создавать, значит либо смотрит на гугловскую привязку к телефону либо новые аккаунты теперь кастрированы, теперь только за деньгу.

Аноним 08/02/23 Срд 19:33:37 #53 №106957

Всё пиздец
Voice Lab is only available on paid tiers. Please subscribe, a free trial is available for Starter tier.

Аноним 08/02/23 Срд 19:42:28 #54 №106976

>>106957
Ну и прекрасно. Платная параша же. А теперь пошли трейнить на колабе с открытым кодом.

Аноним 09/02/23 Чтв 09:17:35 #55 №107665

>>106945
БЛЯЯЯЯЯЯЯЯЯЯЯЯЯЯ. У меня даже одного текстового запроса не вышло сделать. Сука.

Аноним 09/02/23 Чтв 23:46:06 #56 №108423

Чо так все сложна, нихуя не понимаю, когда запилят webui для голоса?

Аноним 10/02/23 Птн 00:28:19 #57 №108459

>>108423
Вебморда здеся - https://huggingface.co/spaces/skytnt/moe-tts
Проблема в том, что ее пишут азиаты (ебаные гуки, спасибо им за всё), судя по наполнению.

Аноним 10/02/23 Птн 23:31:57 #58 №109889

>>102542 (OP)
Дикторы-то хуй с ними, а вот голосовым актёрам и всяким там сэйю стоит пристрематься.

Аноним 11/02/23 Суб 02:02:17 #59 №110222

>>109889
До уровня сейю этим программам ещё срать и срать.

Аноним 11/02/23 Суб 07:51:16 #60 №110412

1675135197846029.jpg

https://files.catbox.moe/e7dw81.mp4

Аноним 11/02/23 Суб 13:58:14 #61 №110678

BgCDO-UcAEEkmY.png

https://vocaroo.com/1lMnkDDIEAvM

Аноним 11/02/23 Суб 14:34:15 #62 №110733

>>110678
Для глухих
>иди нахуй, сука, я твою маму ебал, ах.

Аноним 12/02/23 Вск 04:52:13 #63 №111839

j.webm

https://rentry.org/AIVoiceStuff
https://rentry.org/AI-Voice-Cloning

Аноним 12/02/23 Вск 17:29:08 #64 №112683

>>111839
Так, вторая ссылка выглядит более перспективно. Спасибо!

Аноним 12/02/23 Вск 18:50:19 #65 №112901

>>111839
>https://rentry.org/AI-Voice-Cloning
Я так понял образец нада в утилиты кидать? Пишет файл без методанных иди нахуй. В основном окне только запись с микрофона.

Аноним 13/02/23 Пнд 04:21:20 #66 №114169

изображение.png

>>112901
Не угадал. Нужно закиинуть подготовленные wav (через скрипт в convert) в подкаталог в voices (назови сам).
Но это какая-то стрёмная хуйня, которая жуёт входные файлы каждый раз, поэтому генерация занимает больше 10ГБ врамы и идёт по 5 минут, лол. Качество... Ну явно не для русского, хотя оно пыталось, да. Впрочем, может это я засрал настройки. Вот короче результат на паре файлов из моего предыдущего набора с русским голосом из песни Саи.
https://voca.ro/1mZD3KEUH7ML

Аноним 13/02/23 Пнд 11:33:55 #67 №114403

>>114169
Бля, ну это кал. Даже FreeVc лучше.

Аноним 13/02/23 Пнд 12:48:33 #68 №114472

>>114169
Пара файлов это что, тренировка на датасете ровно из двух wav файлов?

Аноним 13/02/23 Пнд 13:59:33 #69 №114551

изображение.png

>>114403
На английском оно лучше. С русским да, пока везде беда.
>>114472
Пяти, если быть точным, где-то на минуту.

Аноним 13/02/23 Пнд 15:17:51 #70 №114702

>>114551
>Пяти, если быть точным
Этого хватает для полноценного датасета и получения годных результатов?

Аноним 13/02/23 Пнд 18:05:57 #71 №114955

>>114702
Там по сути нет датасета. И голос так себе. Ищем другие, более удобные варианты.

Аноним 16/02/23 Чтв 09:20:34 #72 №119127

>>105487
Голос он сожет подделать или только готовый?

Аноним 16/02/23 Чтв 10:47:01 #73 №119157

>>119127
То, что я заставил работать - это уже тренированные готовые модели для голоса.

В треде есть ссылки на проекты гитхаба, которые позволяют создать датасет (набор wav) и натренировать собственную модель. Для этого нужна CUDA и хорошая GPU от зеленых. Насчет AMD не знаю.

Аноним 16/02/23 Чтв 18:49:13 #74 №119710

>>119157
>натренировать собственную модель
См. выше, оно не тренирует, а жуёт каждый раз. Но да, типа подделывает. Но на русском получается УГ.
Про другие методы с тренировкой модели пока аноны не запускали.

Аноним 17/02/23 Птн 07:30:25 #75 №120689

>>119710
Если китайцы смогли, то и у нас получится

Аноним 18/02/23 Суб 02:11:06 #76 №122113

>>120689
Китайцев 1,5 лярда, нас в 10 раз меньше. Соответственно в 10 раз меьше мозгов, чтобы фонемы под русский починить да моделей натрейнить.

Аноним 23/02/23 Чтв 20:52:22 #77 №129455

>>105364
>Пока нету, нужно тренировать.
Можно подробнее? Какие мощности нужны, сколько данных для треннировки?

Аноним 24/02/23 Птн 04:50:01 #78 №129862

>>129455
В шапке ТТS треда должна быть инфа.
>>88212 (OP)

Аноним 26/02/23 Вск 00:28:06 #79 №131785

>>108459
она японская, другие языки не поддерживает.

Аноним 26/02/23 Вск 00:37:25 #80 №131799

>>131785
А стонать и визжать она умеет?
мимо

Аноним 26/02/23 Вск 00:44:13 #81 №131804

>>131799
А нарезать этих стонов с хентая и вставить в озвучку нельзя?
Тожемимо

Аноним 26/02/23 Вск 07:50:43 #82 №131949

изображение.png

>>131785
>другие языки не поддерживает
Да что ты говоришь...

Аноним 26/02/23 Вск 19:45:51 #83 №132679

>>131804
Для этого нужно просматривать тонны хентая в поисках нужного стона, и подгонять голоса разных актеров друг под друга.

Аноним 27/02/23 Пнд 21:38:05 #84 №134063

>>111839
А можно делиться итогами? Моделью голоса? Не каждому же с нуля ту же Эмму тренить?

Аноним 28/02/23 Втр 04:51:19 #85 №134480

>>132679
Каторжный труд

Аноним 01/03/23 Срд 09:19:52 #86 №135793

>>134063
конешн, для этого и тред создан

Аноним 02/03/23 Чтв 19:50:33 #87 №137167

1677775833472.mp4

>>114551
> С русским да, пока везде беда.

Аноним 02/03/23 Чтв 21:47:13 #88 №137337

>>137167
Спасибо конечно, что последовал моему "гайду" и запустил Ксению, но я про обучение своим голосам. Плюс тут надо научится играть с эмоциями и прочим (вроде как возможно, но пока не тестил). И да, может, всё таки в TTS тред? А то два треда с одним предназначением.

Аноним 11/03/23 Суб 19:53:39 #89 №150974

В Эвеленлабс получаетсяя надо брать Стартовый пак для клонирования голоса?

[mailto:sage] Аноним 11/03/23 Суб 23:08:18 #90 №151315

>>150974
Нет, и бесплатного хватает для небольших тестов (по состоянию на январь, сейчас ХЗ).
А вообще, лучше в единый TTS тред >>88212 (OP)

Аноним 14/03/23 Втр 10:02:51 #91 №155101

>>102542 (OP)
А голос обэмы и бидона есть?

Аноним 14/03/23 Втр 16:38:54 #92 №155465

>>102542 (OP)
Кидайте контент

Аноним 26/03/23 Вск 20:38:46 #93 №184961

>>151315
Сейчас беслптано только вмроеннве голоса, клонирование только платно

Аноним 18/04/23 Втр 03:09:51 #94 №235725

>>137167
А детские есть голоса? У майкрософта в наборе онлайн ттс английские есть, русских пока не находил.

Аноним 18/04/23 Втр 03:28:02 #95 №235737

image.png

>>235725
Есть, адрес пиши свой, анончик. Или телегу.

Аноним 18/04/23 Втр 09:28:32 #96 №236004

>>235737
И че ты возбудился? Включи озвучку в эдже, на инглише девочки угарно читают, отправляй микросам пативен

Аноним 23/04/23 Вск 21:07:19 #97 №251694

>>137337
> что последовал моему "гайду" и запустил Ксению
Какую блядь Ксению? Каким гайдам? Ты ебанутый?

Аноним 23/04/23 Вск 21:14:03 #98 №251722

1682273643456.mp4

>>235725
> А детские есть голоса?
Да хоть MLP.

Аноним 26/04/23 Срд 03:35:40 #99 №259414

>>251722
А что у неё с акцентом?

Аноним 26/04/23 Срд 14:22:29 #100 №260164

>>251722

Ракосель, уходи.

Аноним 26/04/23 Срд 15:57:27 #101 №260330

>>102542 (OP)
судя по оп-пику, звуки там однотипные. ну, знаете: ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ!

Аноним 26/04/23 Срд 16:44:25 #102 №260448

>>251722
У неё нет букв Р, потому что она испекла из них капкейки?

Аноним 26/04/23 Срд 17:12:23 #103 №260532

>>260448
тоутики

Аноним 26/04/23 Срд 23:39:23 #104 №261548

>>260448
Слышь, сука, ты на детей наезжать вздумал, педофил? Небось тилибонькаешь на детсадовцев? Картавят они ему, суке.

Аноним 26/04/23 Срд 23:53:46 #105 №261606

>>260448
Да небось их жапонки голос сделали, у них с Р плоблема.
>>261480
Так то всё что угодно оскорбляет кого-нибудь, красивые девушки оскорбляют жирух. Что теперь, дрочить на жирух?

Аноним 27/04/23 Чтв 09:54:55 #106 №262506

Так-то я бы тоже от детских голосов не отказался.

Аноним 27/04/23 Чтв 10:56:29 #107 №262593

a4c921f2bb421b6d4ab1c2538ba8efb2.jpg

>>262506
+++

Аноним 29/05/23 Пнд 21:15:10 #108 №329121

VID20230529211325658.mp4

С помщью какой нейросети пикрил сделали?

Аноним 29/05/23 Пнд 23:00:49 #109 №329434

>>329121
Эта нейросеть называется рандомное приложение в плеймаркете с эффектиками

Аноним 29/05/23 Пнд 23:02:51 #110 №329442

>>329121
>>329434
Бля, название треда не прочитал. Насчет звука без понятия

Аноним 01/07/23 Суб 22:54:26 #111 №381206

Двач КАК сгенерировать звуковую дорогу на основе загруженного голоса? Я точно знаю, что такое есть. Помню где-то в телеге видел мол грузите голос, желательно пол часа и нейронка озвучит им любой текст.

Я даже нашел какую-то статью на дзене где есть ссылка на колаб, но там какие-то беды с тензерфлоу-гпу, разбираться в падлу. Дайте ссылочбку бога ради.

Аноним 01/07/23 Суб 23:15:42 #112 №381286

>>381206
Уточню. Надо чтобы я загрузил голос, потом написал текст и она загруженным голосом озвучила этот текст.

Аноним 01/07/23 Суб 23:24:02 #113 №381315

>>381206
>ссылка на колаб
Оказывается репозиторий не обновлялся уже 4 года. Если 4 года назад такое могли делать, то щас то почему хуй найдешь???

Аноним 01/07/23 Суб 23:32:29 #114 №381340

Нужна простейшая нейронка для распознавания даже не речи, а звуковых паттернов, которые я вручную ассоциирую с текстом. В результате должно получиться что-то вроде караоке, но с дообучением распознавания озвучиваемого текста (поскольку этот текст будет озвучиваться неоднократно). Кроме пистона есть советы?

Аноним 16/08/23 Срд 09:27:40 #115 №457954

Облазил тырнеты, результаты меня нихуя не устроили.

Задача: на основе мужского голоса (.mp3 запись) преобразовать его в женский.
Нахуя: хочу аудиокнижки позаписывать, но, как положенно любому хикке, без привлечения иных лиц.

У меня впечатление, что ебучие чатики есть, генерация изображений есть, генерация музыки есть, а вот банальное преобразование одного голоса в другой -- хуй, да нихуя, особенно, на русском языке. Либо английский, либо японщина. И либо сосать хуй, либо как 15-20 лет назад Change Pitch и скорость менять в audacity, получая на выходе поеботу.

Аноним 16/08/23 Срд 17:50:39 #116 №458413

image.png

>>457954
Посмотри rvc из треда https://2ch.hk/ai/res/314948.html
Там дохера моделей.

Аноним 17/08/23 Чтв 04:07:10 #117 №459020

>>458413
В том-то и дело, что мне нужно не realtime, а на основе заготовленных записей.
Такого, я так понимаю, в принципе нет.

И да, моделей там дохера только для английского и японского, русского почти нихера нет.

Аноним 17/08/23 Чтв 18:23:43 #118 №459527

>>459020
>Такого, я так понимаю, в принципе нет.
RVC и SVC могут работать как в режиме реального времени, так и с отдельными файлами.
>русского почти нихера нет.
Обучи свои модель — будет.

[mailto:sage] Аноним 21/08/23 Пнд 05:59:42 #119 №462337

>>461500 (OP)
>>461500 (OP)
>>461500 (OP)