24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
>>962581 можешь попробовать дотренить лору на пикчах с этого тг канала (не реклама), не оч качественные, но иногда норм пикчи. чел наверн сам с 1.5 ебеней делает, хз. https://t.me/+rrxkTBHHQFAxM2U6
Чем можно подавить стремление нейросетки рисовать рваные края на границе маски при инпэйнте? Брашнет не предлагать (требует специфичных моделей, обученных под архитектуру той же модели).
Признайтесь честно, всё что вы тут в тред постите это внимательный дроч инпаинтом или просто удачная выборка из сотен генераций? Не вижу косяков и странностей. Где все ученики?
скачал нуб, перепробовал 33 лоры, нихрена нормально не получается. эта хуета на пикриле максимум шо получается. но не исключаю, шо насрал в промпт =-= бекнусь обратно на анимагин
>>962823 Четкие камушки. По свободному промту без указания персонажей нуб плохо работает. >>962884 Расскажи что именно промтишь и хочешь достигнуть. Нуб не подарок, но не настолько ужасен чтобы анимейджину уступать.
Рощу злодеек. Сотни часов дрочения инпаинтом. И я даже не шучу сейчас, тяжело двоих. Сейчас попробую ваш Regional Prompter. Latent Couple. не дождался.
ЧЕлы, я посмотрел аппдату и у меня там из-за нейрнок просто петросяния какая-то. За неделю вжухнулось 50 гигов. Временный файлы экстеншоном, питан костыли, которые не используются, какой-то файл пососный оперативочный 16 гигов, сотни папок с пустыми подпапками. Это можно как-то контролировать? Ладно ещё в СД все сгенерированные пикчи сохраняются в папку куда установил, это можно контролировать, но когда системный диск засоряется, тут уже лажа, не ясно что оставить, а что снести нахер. Боюсь если всякие костыли питоновые трогать, то всё сломается.
Понимаю что двач не мой личный справочник, но все же хотелось бы узнать мнение экспертов (если таковые имеются) по некоторым вопросам: 1. Насколько я знаю, чем дальше теги находятся от начала промта, тем меньшее влияние они оказывают. Является ли это влияние эквивалентом весов? То есть если я просто подниму вес тегу будет ли это равносильно перемещению этого тега ближе к началу промта или же это все-таки разные вещи? 2. Какая структура промта вообще оптимальна? Я использую примерно такую структуру (на примере пони модели): 2.1 стандартные сурс теги 2.2 описание персонажей 2.3 описание каких то элементов и атрибутов сцены 2.4 общее описание (теги детализации, стиля, освещения,мб сеттинг(хотя сеттинг обычно выше ставлю)), сюда же например докидываю тег с лоры на увеличение детализации. 3. Как лучше всего использовать BREAK, особенно для разделения описания разных персонажей.
>>963019 1. Разные. (Гигантские сиськи:1.5) в конце промпта и "гигантские сиськи" первым тегом в самом начале дадут принципиально разный эффект, очевидно же. ...Можешь проверить, лол. 2. Зависит от модели, как тренили. В её описании разрабы обычно указывают. Хотя у меня есть ощущение, что это всё плацебо отдаёт. 3. Для разделения персов - никак или в комбинации с расширенями типа Forge Couple, про который этот >>962781 анон забыл.
>>962823 >и не будет ниче путать Ага. Запили грид из 25 картинок с Рей и Аской по тэгу 'size difference, height difference', и сделай так, чтоб Рей на всех из них была выше.
Без сегментации предсказуемо обосрешься.
Нуб хорош нет, но понимания промпта как у флюкса у него нет.
>>963101 >Не понял, это тут при чем? >узнавание персов >не путать их черты >черты Вот об этом. Персов модель может узнавать, но вот черты ты им стабильно никак не задашь. Бог с ним с size difference, в разную одежду (которая с персонажами не ассоциируется) двух разных персов одеть - уже гемор. Постоянно протечки туда-сюда будут. Про лоры и персов, которые нейронке неизвестны - вообще речи нет. Без сегментации будет каша постоянно.
>>962924 Ручками рисуй какую-нибудь мазню, и в и2и загоняй. Будет у тебя магия. Чем лучше нарисуешь - тем меньше можно нейронку напрягать. Без ручного контроля только всякая фигня будет получаться.
На пикриле пришлось сильно фантазию нейронки контролнетами давить, потому что разорви-экран, и когерентность постоянно шла погулять, пририсовывая посохи и другие странные штуки куда надо, и куда не надо.
>>963126 Давно уже так делаю. Нейронки постоянно обсираются в самых неожиданных местах. А уж если у тебя идея вдруг появилась, и ты хочешь ее реализовать так, как в голове видишь - тут без допиливания вручную не обойтись.
>>962994 Оче красивые и эстетичные. >>963000 Кэш пакетов пихона, кэш обниморды если скачивал через хаб модели (это может делать любой софт). Загугли как их удалить, ничего страшного не будет. >>963019 Делай структуру которую самому потом будет удобно редактировать. Единственный нюанс - если промтишь несколько чаров для некоторых моделей может быть предпочтительно объединение атрибутов одного в единый чанк токенов клипа. Другие же наоборот от этого путаются, просто попробуй на чем генерируешь и сравни, разницы может и не быть. > чем дальше теги находятся от начала промта, тем меньшее влияние они оказывают Только если при тренировке они жестко стояли в начале, иначе без разницы. >>963087 Справедливо, зря быканул. шрек.пнг
>>963334 Да, работает, но иногда может подглючивать. Ну и может быть плагин для работы установить надо (динамик промптс?) - я джва года назад поломатик устанавливал и плагины накатывал, так что не уверен на счёт этого. >>963346 Плагин для того чтобы можно было указывать в промпте название текстового файла, содержащего в себе набор кусков промпта, и он при генерации выбирал и вставлял из этого файла случайные куски. Больше файлов-вайлдкарт = больше рандома богу рандома и больше шизы.
>>963399 Реквестирую моар с райдер >>963439 16канальный конечно! > clearvae Это для 1.5, вместе с хл оно запустится но выдаст вот такие артефакты. Исходный размер около мегапикселя ставь а не шакалов.
>>963384 Но там много стилей, есть 2д с лайном и есть живопись в цифре. Если сделать standalone-лору на данных с тэгами, то она как минимум улучшит результат.
>>962678 Все вместе. В подавляющим большинстве случаев просто удачная выборка. С современными моделями сотен не нужно, даже на что-то сложное, как правильно выход хороших очень высокий. И немаловажным будет приноровиться к поведению модели. Вообще почти во всех генах можно найти много косяков, просто они в большинстве случаев незначительны. >>962687 Эльфы как кошки страдают полидактилией?
>>963550 >очень неплохие генерации с первых попыток >с первых попыток >с первых Ага. Пока поймешь, что твой поломатик с этой моделью без плагина/патча не работает. Пока со структурой промпта разберешься. Куда мастерписи ставить, куда не ставить, какие вообще нужны, какие устарели. Пока не найдешь правильные семплер и шэдулер. Потом еще ищещь тэг рисоваки или лору, которые хоть как-то побеждают лютый базовый разброс по стилю...
>>963566 Не использовать пони. В аутизме использовать правильную структуру промпта - будет у тебя желтоватое аниме.
Для вангёрлов что-то типа такого позитива >score_9, score_8_up, score_7_up, score_6_up, source_anime, >1girl, solo, pose,
И такого негатива >score_4, score_5, score_6, source_pony, source_furry, source_cartoon, realistic, photorealistic, 3d, worst quality, low quality, lowres, jpeg artifacts, sketch, greyscale, monochrome, text, signature, watermark, username, bad hands,
Будет уже кое-что.
Дря рандома можно после сурс_аниме добавить что-нибудь одно или несколько но не всё! из этого: >wpt, kpg, mjm, vum, rkmb, lakf, cayless, cayb, thon, apo, zvu, jlv, qkzf, 8um, xlx, wihp, mydw, ccbi, meb, invej, mjxw, gwmbz Некоторые из хэшированных тэгов рисовак, которые более-менее работают. Результат может быть интересным.
>>963569 > Пока со структурой промпта разберешься. > мастерписи > правильные семплер и шэдулер Это ерунда в целом. Очень много крутых пикч встречается где просто копипаста с буру, включая повторяющиеся теги или объединяющие иерархичные. Теги качества указаны к модели, один эйлер чтобы править всеми. Для разнообразия можно поднадусеровый cfg+. > которые хоть как-то побеждают лютый базовый разброс по стилю Ладно, советовать натренить самостоятельно будет слишком жирно тут.
А вот промтинг, общие знания и прочее неодоценены. Еще в 23 году такие штуки делали на сраной 1.5 которая почти ничего из мелочей нормально нарисовать не могла и выдавала только подобие когерентности в задниках.
>>963574 >Это ерунда в целом. Вот уж точно не ерунда. Может, конечно, и повезет на что-то хорошее наткнуться, но обычно без знания структуры и деталей получится какая-нибудь мазюка, которую даже апскейлить не стоит.
На пикрилах буквально одна модель. Только на последней пикче - правильная структура промпта, плюс тэг художника, которого модель знает. И очень хорошо знает, кстати. Сходу и не скажешь, что это не Mogudan рисовал.
>>963574 >Ладно, советовать натренить самостоятельно будет слишком жирно тут. В твоем случае - действительно. Опять свои засветы-пересветы притащил. Тыщу загрузок хоть собрало твое поделие?
>>963579 Сами знания - решают, об это написано. Ты хочешь сказать что у тебя на этих пикчах одинаковые теги, просто в одном случае правильно структурированы а в другом рандом? >>963587 Опять выходишь на связь, мудило? То что ты порвался еще в прошлый раз выяснили, на второй круг пошел?
>>963594 >Опять выходишь на связь, мудило? Посмотрел специально. Нет, не собрало. Ожидаемо.
>>963593 >Это Rouwei Удивительно. Вот что лора животворящая делает! Хотя на части картинок все равно засвет жестко с одной стороны идет, но из-за удачного подавления базы стилизацией - сразу и не скажешь.
>>963593 Эпсилон или впред? На днях рейтрейн впреда будет с устраненными косяками, заодно и некоторый буст мелочей что сейчас мыльные. >>963597 Про структуру там прежде всего порядок промта. В остальном все так, но квалити теги/стили с копипастой работают. >>963601 > засвет Как называется это болезнь? Ты шиз или серьезно это пишешь?
>>963598 Ну вот последние две - базовый аутизм, как он выглядит, плюс-минус. "Желтоватое аниме", как я и говорил.
Если тебе вот такое дефолт-аниме не нужно, то: - либо меняй структуру промпта. Например, перемести реалистик или разные сурсы между негативом/позитивом. - либо стилизируй хэш-токенами. Или обычными, по типу стиля рисунка, или даже чего-нибудь еще. Аниме или франшизы. `lucky star` или ` jiggly girls` работают, например. - либо ставь лору. Аутизм их хорошо и стабильно принимает. Тенденция к желтому, правда, остается. Можно попробовать через VectorScope ее забороть.
>>963603 >Как называется это болезнь? Вот и я хочу знать, как она называется? Почему твое поделие в 80% картинок так свет ставит? Как будто прожектором с одной стороны светят. Где-то сильнее заметно, где-то слабее, но оно так практически постоянно.
>>963632 С картинки словил флэшбэк своих первых генераций с чистого поня, лол. Такая же в хлам убитая фигня получалась.
>А как добавить деталей? У тебя их тут уже сильно много. Настолько, что друг в друга проваливаются. Но вообще - увеличивай размер картинки через апскейл. Хз как это в лапше делается. Не мазохист ее использовать.
>И каких-то специфичных действий Кидай тэгами то, что хочешь видеть, и крути рулетку. >store, shop, cash register, cashier, groceries, grocery bag, apple, money, фига ей там на полки бабла насыпало...
За какими-то "специфичными действиями" - тебе Flux ставить надо. Там ты что угодно можешь текстом задать. Ну, почти. Только памяти он жрет не в пример поням, специфичного, длинного и подробного промпта требует, изложенного "натуральным" нет языком, и базово в аниме не умеет практически вообще.
>>963635 >Из-за "dynamic light source" Нет. Это стандартное поведение этой модели. У меня около 80% генов с таким вот светом были, когда я модель тестировал, без указания этого "динамик" в промпте.
>ну вот пик5 откуда свет должен падать? Да не в том вопрос, правильно или неправильно свет падает. Вопрос в том, что оно так светит постоянно, даже ночью, где видимых источников света нет. Вот кто на девок в онсэне фонариком светит? Зачем? Что они туда, без спроса пробрались, и охрана их теперь ловит?
>>963626 > в 80% картинок Выборка недостоверная у тебя. Получается так потому что модель может сдвинуть яркость от средней и показать что-то контрастное. Особенно когда это запромчено. Мне нравится игра света на пикчах и потому делаю так. В то же время никто не мешает запромтить иначе или воткнуть любой из множества стилей и получить плоскость. Или даже просто попросить соответствующее окружение а не темноту с источниками света или то же солнце на границе здания. Это какбы само собой разумеющееся, постоянно мелькают пикчи где или дохуя контастно и с направленным светом, или наоборот равномерно залитые, и от модели это не зависит.
>>963644 > Нет. Это стандартное поведение этой модели. Таблетки принимай, чел. Если ты впервые увидел прямую реакцию на то что у тебя в промте вместо игнора большей части и однотипного слоупа, который на двинуть бел лор - такое случается. С этим нужно смириться и жить, все модели без специально плоского стиля так себя ведут, и даже большинство это котирует или специально тренит такие стили. Не нравится - жри другие кактусы и шиль их, все свободные люди (нет), но нехуй наговаривать такую ерунду, объективно. > Вот кто на девок в онсэне фонариком светит? Lantern на фоне на заметил?
>>959198 → > Рили? Когда очень поверхностно пытался знакомиться, ничего толкового не находилось. Или совсем простейшие ттс, или что-то специфическое для преобразования, или оче оче сырые претрейны дитов с поломанным кодом инфиренса. Скорее всего ты говоришь про Stable Audio Tools: https://github.com/Stability-AI/stable-audio-tools
Там действительно есть проблемы с дефолтным кодом - мне пришлось пару ПР-ов из репы применить, чтобы код тренировки просто запустился.
По правде говоря, я был очень воодушевлён, когда они это релизнули, и был уверен, что, в ближайшее время, у нас появится открытый аналог suno/udio... Но чуда не произошло. Я тыкал эту модель локально и пробовал файнтьюнить, но ничего толкового не вышло. У релизнутой модели есть проблемы. Но это проблемы именно модели, а не инструментов тренировки:
1. Размер модели таков, что она чуть-чуть не лезет в 24 GB VRAM для тренировки, а над оптимизациями там никто не работал (по крайней мере несколько месяцев назад, когда я интересовался темой)
2. Отвратительный датасет, тут описывал: https://2ch.hk/ai/arch/2024-10-29/res/718382.html#772899 Они использовали ~500к звуковых отрывков со свободной лицензией. Я смотрел этот "датасет" - там огромное число всяких звуков аля "шелест листьев" и прочее. Удивительно, что оно вообще может генерировать музыку.
3. Использование одного единственного T5-эмбеддинга в качестве кондишна. Если рассуждать логически, то T5 для генерации песен по тексту скорее всего вообще не нужен. В плане, T5 это про извлечение смысла из текста, что имеет смысл в генерации картинок и LLM. Та же SD должна понимать, что "cowboy" и "cowboy shot" это вообще разные вещи, но для TTS или генерации песен такое извлечение смысла просто не нужно. Скорее нужно просто использовать какой-то алгоритм для преобразования текста в набор фонем (т.е. элементарных звуковых единиц аля солнце => со́нцэ).
Одной из недокументированных возможностей, предоставляемых тулзами от стабилити, является задание кондишнов в виде морфем, перегнанных в тензоры, вместо использования условного T5. Правда, из коробки работает только для английского, но не вижу какой-то проблемы заменить на любой другой язык, были бы в публичном доступе готовые алгоритмы для преобразования. Технически это работает как обычный токенайзер, насколько помню. То есть на входе будет эмбеддинг, кодирующий морфемы + attention mask. Там, на самом деле, много способов как можно задавать кондишны, но это нужно экспериментировать.
https://github.com/suno-ai/bark Почему-то я был уверен, что для опенсорсной bark были релизнуты тулзы для файнтьюна. Это TTS с возможностью вставок всяких штук для более точной эмуляции естественного языка аля - [laughs] или [clears throat]. Вот только по факту там не выложили какие-либо тулзы для тренировки, и они явно сказали, что не хотят их релизить.
Так что в плане того, что инструментов для тренировки "полно", я наврал, похоже.
> Тренить с шума - оче тяжело выходит, если знаешь какие-нибудь ресурсы, модели, инструменты - можешь сориентировать? По поводу тренировки с шума - тут у меня опыт отличается. Пробовал взять готовый VAE от стабилити и, при помощи вышеупомянутых тулзов, тренить диффузионную модель на нескольких десятках часов датасета по двум разным классам для элементарной проверки, работает ли вообще тренировка по кондишнам. На одной 4090 в течении одних суток добивался того, что при тренировки из шума в нейронку вжаривался датасет целиком, так что можно было по указанию класса получить рандомный 30-секундный элемент из заданной коллекции. Выходит что по крайней мере элементарные кондишны там работают.
Так что кажется что можно было бы пробовать и в домашних условиях тренить на пачке условных 3090/4090, было бы только время и желание. Я что-то пробовал по датасету подготавливать и подзабил в какой-то момент. Слишком много усилий такое будет требовать, а результат непонятно какой будет. Я как-бы ни к питону ни к машин-лёрнингу профессионального отношения не имею, поэтому не уверен что конкретно мне в это стоит с головой прыгать. Хочу сперва другими вещами заняться, где в целом меньше неизвестных для меня составляющих.
Но на самом деле я просто надеюсь, что найдётся какой-то китаец который выпрыгнет из ниоткуда и сам это всё сделает. Ну не верю я, что с такими инструментами никто не запилит открытый аналог suno/udio.
>>963645 >Выборка недостоверная у тебя. Больше сотни картинок. Вполне достаточная. Плюс на твоих пикчах, которые лорами не задавлены, или без отдельного промпта на свет - оно тоже читается просто вот прям сходу. Как желтизна в аутизме. Стандартное. Поведение. Модели. Мощный боковой свет, до засветки в белый, с лютым контрастом на незасвеченную область картинки. Что просто таки раздражает, потому что оно везде. >Особенно когда это запромчено. Ага. А когда не запромчено - получаем то, что получаем. Выделил в предыдущем посте. И в прошлом треде пикчу с Аской еще показывал, как ярчайший пример того, что твоя модель постоянно делает. >Мне нравится игра света на пикчах и потому делаю так. Ну вот, а подавляющему большинству - не нравится. Поэтому у тебя даже тысячи загрузок и нет, при всех прочих преимуществах. >В то же время никто не мешает А это уже пердолинг.
>>963648 >Не нравится Не нравится. О чем я тут и говорю. >и даже большинство это котирует Ага. Сколько загрузок у какого-нибудь WAI не говоря про аутизм - и сколько у RouWei? То-то и оно. Вся эта стилизация и прочие перделки - оно хорошо, когда оно под капотом, и вызывается по желанию. Когда же оно лезет в 4 из 5 генов - это уже плохо. На моей памяти из таких моделей только старый пастель-микс взлетел, и то остался уделом небольшой прослойки, так как не позвлял делать ничего другого, на что был затренирован.
>>963651 > Больше сотни картинок. Чел, можешь возле алкодиспансера провести опрос по употреблению чего-нибудь, а потом утверждать что в район_нейм одни колдыри и наркоманы, сотню человек опросил! > Как желтизна в аутизме. О, стадия принятия, а раньше было что он вовсе не желтый. И точно также читается страшная выжженость темных оттенков и лайна в нубе. И страшная кислотность всяких мержей. Другое дело что здесь все это управляется, а где-то практически неизменно и просвечивает сквозь все. > получаем то, что получаем Получаем естественный шейдинг а не монотонную заливку огромной яркости. > Ну вот, а подавляющему большинству - не нравится. Если посмотреть на твои же примеры и на то какие там гены - ты в меньшинстве. > А это уже пердолинг. Кек > Сколько загрузок у какого-нибудь WAI не говоря про аутизм - и сколько у RouWei? Алгоритмы цивы не любят нсфв кроме конских членов, кто-то упарывается бесконечной рекламой на популярных ресурсах, суя всюду свою микс, кто-то накручивает. А кто-то специально делает кислотный деревянный слоуп для миллионов мух. Это нормально. При этом одни модели активно используются, всегда встречаются с теплотой и хорошими отзывами, а другие упоминаются только в виде "мэх очередной шизомердж". Тренд вообще печальный, вместо выбора прогресса и достижений популяризуются деградация и инцест, а как это повлияет на будущее - очевидно. И ты туда же, пилишь сук на котором сидишь.
>>963655 >сотню человек опросил! Атличный пример! А вот когда мне модель по промпту из инструкции, написанной автором, выдает в 80 из 100 свет из примеров - это, конечно же, нерелевантно. Надо было в другое место идти, опрашивать другой промпт писать! >Другое дело что здесь все это управляется, а где-то практически неизменно и просвечивает сквозь все. А я и не говорю, что другие модели хороши. Нуб и люстра меня тоже раздражают своей кривизной. И аутизм тоже плох, но он плох нейтрально, а не ссыт тебе агрессивно в глаза своими косяками. Давно его хочу на что-то себе заменить, но вот как-то не выходит. Ибо то, что на поне было натренировано, принимает в таком виде, в каком оно должно быть, почти не давя это своими задвигами. >Получаем естественный шейдинг >естественный шейдинг Нет. Это что угодно, но не "естественный шэйдинг". >Алгоритмы цивы не любят А, вот, пошли отмазы. То, что мы объективно фигню сделали, мы признать не готовы. А вот на конские члены и на миллионы мух, наехать - пожалуйста! Это вы все ничего нипанимаити! У миня шидевор! А вы говно жрети! Переделай базовый шэйдинг, выложи новой моделью, с нормальными картинками, а не твоим личным фетиш-фуелом или ты думал, оно незаметно? - и оно взлетит. Может не шибко высоко, но лучше, чем сейчас.
>>963651 > Сколько загрузок у какого-нибудь WAI не говоря про аутизм - и сколько у RouWei? Сравнивать между собой мёрджи и файнтьюны по числу загрузок это конечно сильный ход. Ну давайте тогда сделаем вывод что аутизм (232к загрузок) это прям заебись и прогресс, а вот люстра (21к загрузок) это никому ненужный кал.
Секрет успеха - намёрджить рандомного говна в текущий хайповый чекпоинт, чтобы получить симпатичный стиль по дефолту - в плане числа загрузок будет явно больше толку, чем пытаться тьюны делать. Так победим.
>>963659 >а вот люстра это никому ненужный кал. Всё так. В чистом виде оно как понь. Слабоуправляемое рандомное нечто, требующее вдобавок индивидуального подхода, и с полностью отсутствующей на данный момент инфраструктурой.
Хотя, конечно, фактор времени тоже есть. Аутизм свои тыщи не сразу взял. Но когда тюн за две недели собирает меньше тысячи - это, как бы, показательно.
>>963657 Если ты схавал деревянный сепийный аутизм и довольно урчишь, то ты не имеешь права высказывать свое мнение о каком-то там не таком стиле на других моделях, ты просто говноед. Твой уровень - жрать всратое нечто только потому что там не нужно думать над промптом. Можно что угодно запромптить и выйдет что-то приблизительно съедобное. Похуй что всратая анатомия, одинаковые позы, одинаковые ракурсы, главное чтоб без ПЕРДОЛИНГА
>>963666 > инфраструктурой Так весь этот коупинг и нахрюк был в защиту утиной реакции на отмирающее нечто, которое и так прожило слишком долго? Оставайся на пони и стакай лоры на то что даже в sd1.41.5 работало, называя груду костылей ИНФРАСТРУКТУРОЙ
>>963669 Ну вот, пошли прямые оскорбления. Ожидаемо. Чел, если модель требует каких-то изворотов (лор или тэгов художников), тупо чтоб работать и выдавать стабильную картинку - это херовая модель. Без вариантов. И да, понь - херовая модель.
>>963672 Модель без инфраструктуры тупо не нужна. И нет, лоры и прочее - это не костыли. Как ты ни изворачивайся, но весь интернет, все стили, всех персонажей, и все концепты ты в одну модель не запихнешь. Или тебя устраивает хавать то, чем тебя снабдил неизвестный дяденька, и не пытаться настроить это под себя? Чего ж ты на далле или каком-нибудь другом корпоративном дерьме не сидишь?
>>963694 >А есть не херовая модель? Аутизм Пони-миксы, на самом деле, нормальные. Многие. Они затирают рандомность поня, сохраняя большую часть знаний, и устанавливая некий свой бейслайн, который просто работает. Вот когда оно просто работает - это уже неплохая модель.
А когда у тебя в промпте для получения картинки должно быть >(wagashi \(dagashiya\):1.15),(iumu:1.15),(aji \(sakanaaj1\):1.05) >impasto,(nat the lich:0.9),(artist:alphonse \(white datura\):0.7),(oyari ashito:0.6), >(quasarcake:0.95),tianliang duohe fangdongye, то это модель херовая.
>>962624 Ты реально сейчас жалуешься на то что в модели есть имена рисовак а не хэшированый взорванный кал и вместо этой простыни другая в виде score_9, score_8_up, score_7_up,source_anime ?
>>963666 >> а вот люстра это никому ненужный кал. > Всё так. Погоди, я правильно понял, что если я сейчас для роувея обучу лору в которой я исправлю > базовый шэйдинг и затем подмёржу её в модель с последующим заливом на цивит, то выйдет что я молодец и делаю хорошие, годные модели, а вот автор роувея ничего не понимающий дод, не могущий пофиксить элементарные вещи в своей кривой поделке, так что-ли?
Алсо, ради интереса глянул, какие там ещё тьюны люстры появились в целом за последний месяц, открыл ту модель что на втором месте по числу загрузок (после нуба) и проиграл, ведь тренили это буквально на 50к картинках нейрослопа (+10к картинок от кожаных мешков). Зато 7.5к загрузок за месяц.
>>963569 > Пока поймешь, что твой поломатик с этой моделью без плагина/патча не работает.
> 2024 > поломатик вместо комфи + крита плагин
> Пока со структурой промпта разберешься. Куда мастерписи ставить, куда не ставить, какие вообще нужны, какие устарели.
Вон те мои картинки по промпту - это буквально нефильтрованный выхлоп клода, лол. А он с буру тегами и структурой может достаточно свободно обращаться.
> Пока не найдешь правильные семплер и шэдулер. Буквально эйлер а + нормал, 28 шагов, кфг 4
> Потом еще ищещь тэг рисоваки или лору, которые хоть как-то побеждают лютый базовый разброс по стилю
У меня все мои стандартные художники хорошо из коробки работали без всяких проблем и разброса по стилю.
А так в плане первых попыток, это я буквально скачал эпс версию нуба, которую в хдг посоветовали, закинул клоду список рандомных персонажей и оставил скрипт (с более-менее стандартным сдхл комфи воркфлоу) в автоматическом режиме крутиться.
>>963696 > А когда у тебя в промпте для получения картинки должно быть ... > то это модель херовая.
Это буквально суть таких моделей, их никто не использует без тегов художников в здравом уме. Вон, когда вышел НАИв3 тот же, никогда и никто его без тегов не использовал всерьез, это нормально, оно так и должно работать.
Хочешь встроенный явный дефолтный стиль - жди миксов и тьюнов, где уже васяны зашьют что-то стандартное (поломав пол модели по пути).
>>963697 Хэшированный кал - это хэшированный кал. Личный задвиг понишиза. Гореть ему в аду за это.
Проблема в том, что тот же нуб без этих токенов нормально не работает. Я вот, например, из сверху перечисленных рисовак не знаю ну ни одного. Кого мне в промт писать, чтоб картинка была? Тех, кого пытался, и кто мне нравится, модель либо не знает, либо знает недостаточно.
Еще ржу с миксов/дотренов нуба/люстры, у которых буквально в титульных картинках используются лоры. Сразу сигнал такой: моя модель нихера не может, чтоб была картинка - пердольтесь!
>>963700 >Погоди, я правильно понял Ну, ты, типа, описал то, как получились почти все понимиксы с их популярностью. Так что да, если автор - "дод, не могущий пофиксить свои очевидные косяки" - то это его проблемы, другие аноны сделают исправления за него, и будут получать профит в том или ином виде. Но это только в том случае, если его творение вообще кто-то заметит. >ведь тренили это буквально на 50к картинках нейрослопа И? Оно этого не заслуживает, если стиль приятен для большинства, а не только для автора-нитакусика?
>>963701 >выхлоп клода Доступ к клоду ты всем желающим на этой модели погенерить предоставишь? Ну, чтоб самому с промптами не париться? >Буквально эйлер а + нормал, 28 шагов, кфг 4 И вот пока ты этого дойдешь - потратишь хз сколько времени. Особенно заниженный кфг. Обычный чел покрутит на стандартных 6-7, да еще и на каком-нибудь ДПМ-карасе, что дефолтный в автоматике нынче, увидет пережаренное нечто, и забьет. >У меня все мои стандартные художники хорошо из коробки работали А мои - не работали. Вывод? Для тебя модель подойдет. Для меня - модель говно. И для чувака, кто хочет без художников что-то генерить - тоже говно, потому что базы у модели нет, она, прям как понь, выдает "по умолчанию" неудобоваримую мазню.
>в здравом уме Ну, значит я не в здравом уме. Про художников - смотри выше.
>поломав пол модели по пути Лучше так, чем "только с рисоваками". Хоть какая-то база будет.
>>963593 Попробовал найти картинку чтобы спиздить готовый воркфлоу с настройками, там сплошняком любители китайского средневекового гачимучи. Не ожидал.
>>963708 >>963700 Вот кстати, я тут еще подумал, и понял, что твоя модель - по сути такой же "микс", как и аутизм, с точки зрения конечного юзера. Буквально ведь - оба чекпоинта сделаны из другой модели пофиг как, юзеру это неинтересно Оба работают с теми знаниями, что были в исходной модели. ...И оба имеют встроенный базовый стиль, который трудно забороть. Вся разница только в том, что у аутизма это желтая сепия, а у тебя - эти лютые односторонние засветы прожектором.
Но смотрите не перепутайте! Аутизм - желтушный говномикс, а вот в хвосте у нас - неповторимое авторское видение правильного освещения!
На самом деле, конечно, здорово, когда модель работает "просто так", и вдобавок тупо из промпта принимает другую стилистику. Совсем не здорово, что это "просто так" задавить совсем не получается.
>>963726 >>963593 Вроде мутанты не лезут так же, как в поне. Надо с драконами и гарпиями попробовать и прочими сложными в промптинге существами. Нейросети уже надрочены рисовать зверодевок едва ли не сильнее, чем людей.
>>963700 >Алсо, ради интереса глянул, какие там ещё тьюны люстры появились в целом за последний месяц, открыл ту модель что на втором месте по числу загрузок (после нуба) и проиграл, ведь тренили это буквально на 50к картинках нейрослопа (+10к картинок от кожаных мешков). Если нейрослоп высоко оценен кожаными мешками, то что мешает ему тоже быть референсом? Внешняя оценка хотя бы ранжирует, что людям не нравятся мутации нейросеток, а если что-то случайно им приглянется - то почему бы ему и не остаться?
>>963708 > Ну, ты, типа, описал то, как получились почти все понимиксы с их популярностью. Так что да, если автор - "дод, не могущий пофиксить свои очевидные косяки" - то это его проблемы, другие аноны сделают исправления за него, и будут получать профит в том или ином виде. Но это только в том случае, если его творение вообще кто-то заметит. Это попросту объясняет, почему у нас так мало тьюнов и так много мёрджей. Ведь зачем тратить время на подготовку датасета и тратить деньги на аренду/покупку железа, если можно просто намёрджить готовые лоры в готовые модели и получить свою дешёвую славу?
> И? Оно этого не заслуживает, если стиль приятен для большинства, а не только для автора-нитакусика? На мой взгляд, это просто показывает, что мы где-то свернули не туда, если мы всерьёз рассуждаем, что это нормально, что модель, обученная на 50к картинках нейрослопа, получила больше внимания, чем модель, обученная на 4.5кк картинках - ведь у первой модели "более приятный для большинства стиль". Заставляет задуматься, что будет с комьюнити, когда последние файнтьюнеры, пилящие модели в опенсорс, разочаруются в сообществе и отойдут от дел или же закроются за сервисами, как сделал тот же Хачатур или что изначально делали разрабы люстры, руководство которых вообще, похоже, не планировало сливать чекпоинт в паблик - похоже на то, что Ангел по ушам своему СЕО проехал, так что тот просто не до конца понял, что именно тот собирается сделать.
Возможно, мы просто придём к ситуации, которая была до выхода поней/хлл - все сидели на сыплющихся как из рога изобилия инцест-миксах, либо покупали подписочку NAI3 и получали качественный (по сравнению со всем что было в паблике) продукт.
В общем-то, я поэтому и не уверен, что мы вообще увидим в публичном доступе вменяемый аниме-тьюн моделей на базе более продвинутого текстового энкодера и 16-канального VAE, таких как FLUX/SD3.5/AuraFlow - это просто сверхзадача, требующая больших финансовых затрат (сильно больше тех, что понишиз потратил на свой чекпоинт) и подготовки. С таким отношением сообщества может просто выйти так, что это просто некому будет делать.
>>963732 Это не моя модель. Просто у меня бомбит с самой ситуации, что сообщество, по сути, принижает усилия файнтьюнеров, отдавая большую часть своего внимания мёрджам, хотя последние не могут привнести ничего нового, просто по определению. И это при том, что мёрджи требуют минимальных затрат как по времени, так и по финансам.
>>963735 > Если нейрослоп высоко оценен кожаными мешками, то что мешает ему тоже быть референсом? Внешняя оценка хотя бы ранжирует, что людям не нравятся мутации нейросеток, а если что-то случайно им приглянется - то почему бы ему и не остаться? Да я в целом не имею ничего против этого чекпоинта, я его не смотрел даже. Но ситуация такая, что это был бы буквально топ-1 файнтьюн люстры по популярности, если бы у нас не было нуба.
>>963743 > И это при том, что мёрджи требуют минимальных затрат как по времени, так и по финансам. Мерджи позволяют переиспользовать лоры от родственных моделей, худо или бедно. По сути, я не могу слезть с пони аутистик уже почти годовой давности только из-за нескольких удачных лор, которые дают ровно тот стиль и освещение, которые мне нравятся.
>>963744 Чисто технически можешь попробовать на своих пикчах лору обучить под ту же люстру. Тут было несколько анонов, кто на своих удачных генерациях тренировал лоры, чтобы добиться нужного им стиля.
Нужна доработка деталей, конечно, но похоже более новые модели понимают, как выглядит пианино и как на нём играют. В поне совсем жуткие фантазии на тему рояля были.
>>963780 У тебя два пути: 1) ты как промпт-онли пишешь в негатив (((watermark, signature, sign, logo, patreon logo, my brains, my honour))), потом запускаешь генерацию на 1000 батчей и смотришь пуская слюни на калейдоскоп, после чего выбираешь те, где ватармарки действительно нет. Тогда вопроса "как убрать подпись" у тебя не будет. 2) ты запускаешь процесс инпэйнта, обводишь ватермарку маской и прописываешь промптом примерно то, что за ней должно находиться. Или не должно. В разных клиентах SD инпэйнт различается, поэтому это зависит от того, чем ты пользуешься.
>>963709 >>963708 Погоди. То есть ты пытаешься сказать что модель без указания художников или лор не будет работать? Или что там нужно пердолиться по-особенному с промптом и его структурой? Или там семплеры и скедьюлеры особые нужны? Вот базовая люстра. Промпт рандомно составлен, художников нет, кфг пережарен, 20 стандартных степов. Ты же понимаешь, что ты просто утёнок, который копротивляется за первую каличную модель на которой он смок сисик нагенерить? Я почему-то уверен что ты ни люстру ни нуба даже не качал, потому что ты рассказываешь какие-то страшилки, которые к действительности отношения ну вообще не имеют
>>963823 То же самое, но страшный кривой взорванный нуб впред Я просто испердолился пока генил. Вот на пони было бы все просто и понятно - score_9_up, score_8_up, score_7_up, score_6_up, source_anime, rating_safe, лора на мику, лора на v-позу, лора на стиль от которого глаза не вытекают, 3 абзаца хуйни в негативном промпте про source_furry, score_1_up и прочее и можно кумить
>>963743 Может для тебя станет новостью, но самая популярная лора для люстры/нуба - это лора, которая превращает картинку в понислоп. По числу генераций уж точно. У большинства вкус хуевый, если судить по цивиту и этому треду https://civitai.com/models/856285?modelVersionId=1036362
>>963838 >У большинства вкус хуевый, если судить по цивиту и этому треду Двачую, половина картинок это ебучие дети. Нахуя ебучие дети в 18+ треде? Какой смысл? Хуесосы блядь.
>>963819 >>963822 Есть же приблуды онлайновые где в один клик это дело убирается/инпейнтится, думал мало ли прикрутил кто вумный уже такое к автоматику скажем. Хотя я нашёл вотермарк адетайлер, но не юзал ещё.
>>963743 >и получить свою дешёвую славу? Всё так. У тебя тут стандартная ошибка: вложение труда не равно качеству. Ты можешь подготовить отличный датасет, убить сотни тысяч часов компьюта, но все равно получить говно. Примеров масса.
>На мой взгляд, это просто показывает, что мы где-то свернули не туда Пластмассовый мир победил!
>на базе более продвинутого текстового энкодера и 16-канального VAE, таких как FLUX/SD3.5/AuraFlow 24 гига памяти аноны где возьмут? Оно, конечно, хорошо, но тут ты либо апгрейдишь железо на топовое, либо жрешь огрызок. В результате основной проект не "окупается" по причине крайне ограниченной аудитории, а огрызок никому из-за низкого качества не нужен. Буквально то же самое с VR-индустрией случилось, она уж который год на ладан дышит, и все никак не определится - помирать уже, или начать все-таки куда-то развиваться.
>сообщество, по сути, принижает усилия файнтьюнеров Смотри в начало поста. А еще у "файнтюнеров" бывают очень странные задвиги. И когда эти задвиги не совпадают с целевой аудиторией продукта - получается не очень. Кому-то может повезти, и он успеет взять свою нишу, как понишиз. А кому-то - нет, и будет он собирать 500 скачиваний в неделю.
>>963823>>963825>>963842 >модель без указания художников или лор не будет работать? От модели зависит. Конкретно люстра будет выдавать какую-то фигню уровня NAI двухлетней давности. Даже анатомия точно так же погулять уходит. Всей разницы - больше знаний плагсьют - мое почтение Вдобавок на нуб-впреде если забудешь кфг скинуть - у тебя монитор взорвется нахер.
Но и чистый понь в этом плане ничуть не лучше.
Поэтому я и не считаю ни одну из этих моделей "хорошими". Модели нужен четкий, приятный глазу, работающий базовый стиль, который, тем не менее, должен легко затираться лорами или через промпт, если потребуется. И, крайне желательно - отсутствие ебли с настройками генерации. Все эти "цфг не выше 3, не забудьте этот плагин, в лапше ноду специальную", и прочее.
>>963700 >.png Если галочку "trained" убрать, то там вообще, сисик-писик рулит нипадеццки! Мб минти стоило тоже разок засунуть свои предпочтения в графоне куда подальше и нагенерить сасных дженериковых баб для превью. Алсо да, отсутствие дефолтного красивого стиля отпугивает. В примерах к Роувей тоже такое себе, буйство китайской гачимучи, и даже если этого пидораса отфильтровать, то красивых картинок на мой дженериковый вкус там по пальцам посчитать будет.
Illustrous лучше поней, например он знает элементы восточной культуры (арабская и персидская архитектура, мухаррам... разные вещи как мне нравится), а пони делают лишь мыло. Может в версии 7 пофиксят.
>>963690 > Модель без инфраструктуры тупо не нужна. Костыли для достижения базового функционала при наличии альтернтанив не нужны. Даже если гордо именовать их инфраструктурой. Под люстру и дериативы есть контролнеты, уже достаточно лор, а всякая редчайшая дичь, типа поедания ампутированной матки, подходит с поней. > Или тебя устраивает хавать то, чем тебя снабдил неизвестный дяденька Чел, таблетки. У тебя ассоциативные связи нарушены и постоянные самопротиворечия. >>963732 > что твоя модель Чел, ты бред несешь и с тебя мимокроки в треде проигрывает, в ответ же "твоя модель" так ни разу и не попав. Такой-то рофел. Хз как это всерьез можно воспринимать, какой-то пост-реверс-троллинг или реально больной человек. Лучше бы потратил усилия на что-то полезное, а не закапывался все глубже в оправданиях очередного своего перла. >>963937 > нагенерить сасных дженериковых баб для превью https://civitai.com/models/942663 Вот так надо! Заодно и сразу билет на главную цивы.
Так и выходит, что если мерить успешность модели исключительно числом загрузок на цивите, то вообще нет смысла заниматься тьюнами, ведь мёрджи ты можешь высирать хоть каждый вечер, какой-то удачный с дефолтным базовым стилем и выстрелит. А ебаться месяцами с подготовкой датасета и арендовать/покупать железо смысла нет, ведь хз какой там будет стиль в стоке и это всё равно никто не оценит. Если уж и серьёзно вкладываться во всё это, то тогда сразу идти по заветам хача - с ботом в дискорде и входом за $$$.
>>963921 Я тебе уже показал что нуб впред генерирует без каких-либо настроек вообще, или ты просто решил проигнорировать неудобные скрины То что у тебя получается кал - это скилл ишью. Ты не описываешь позу, бэкграуд, одежду, просто жмешь кнопку и надеешься, что из черного ящика выскачить что-нибудь удобоваримое. Короче, тебе лучше действительно не думать, не пытаться приложить минимум усилий, а стакать лоры в аутизме. Благо никто у тебя такую возможность не забирает
Но вообще возникает вопрос - если ты не знаешь художников, как вообще буру теги размечаются, на которых и тренировалась модель, то зачем тебе генить аниме?
>>963709 > Ну, чтоб самому с промптами не париться Это я упомянул для демонстрации того, что любой более-менее разумный промпт работает без особых игр с форматом, скорами, мастерпиями и т.п.
> Особенно заниженный кфг. Обычный чел покрутит на стандартных 6-7, да еще и на каком-нибудь ДПМ-карасе, что дефолтный в автоматике нынче, увидет пережаренное нечто, и забьет.
На странице нуба на цивите прям написано крупным текстом, берите эйлер а. Да и эпс модель на дпм-карасе что-то разумное выдаст, может быть чуть-чуть пережаренное, юзер посмотрит, занизит сам кфг и будет всё у него хорошо.
> А мои - не работали. Вывод? Для тебя модель подойдет.
Ну мои редкие, на 30 артов на буре, тоже не работали. Но лора с их стилем обучилась куда лучше, чем те же пони, с меньшим количеством артефактов, явных биасов, скошенных цветов и другой шизы.
> И для чувака, кто хочет без художников что-то генерить - тоже говно, потому что базы у модели нет, она, прям как понь, выдает "по умолчанию" неудобоваримую мазню.
Ну с впред моделями бывает не так стабильно, но эпс версии нуба выдают по умолчанию обычный дженерик аниме стиль, что соответствует среднему по бурам. Как модель, добросовестно обученная на бурах и должна делать. Кто захочет другой дефолтный стиль найдет себе художников (словно это так сложно) или подождет файнтьюнов нуба и всё. С понями всё было куда сложнее в этом плане.
И имеет смысл по умолчанию сравнивать анимешные модели не с понями, а с НАИв3 и, пока, нуб ближе всего к ней подошел локально, настолько близко, что можно прекращать платить новелам за подписку.
>>963960 >для достижения базового функционала "Базовый функционал" ИИшно нарисованные тянки судя по треду, был доступен уже на НАИ. Чего тогда все перекатились, раз оно там уже было? Или ты из тех шизов, которым нейронка должна пикчи только по тексту генерировать? Тогда все с тобой понятно, ограниченный.
>Чел, таблетки. >Чел, ты бред несешь >реально больной человек >поедания ампутированной матки У кого что болит, как говорится.
Нейропикчи сейчас суют везде в маркетинге, и особенно в этой стране, т.к. руки из жопы... Уже и отечественных моделей понаделали - Кандинский, Шедеврум (говно). С тем персонажем видел референс на behance, мб и ручная работа, но на банках точно печатают нейроарт.
>>963970 >то вообще нет смысла заниматься тьюнами, ведь мёрджи Смысл есть. Тюны, при прочих равных, лучше. Надо просто уметь попадать в аудиторию. Тогда всё будет. Вон как хач, да. Заебенил чё-то, что аудитории зашло, а дальше понеслося. Ну или понишиз. Та же ситуация, только в профиль, и пока без анального блока за пэйволом.
>>963976 >То что у тебя получается кал - это скилл ишью. >Взорванные задники, проебанные позы, отвалившиеся руки, да еще детализация как на полторахе. Скилл ишью, да. Постеснялся бы.
>Ты не описываешь позу, бэкграуд, одежду А так же тэги рисовак и прочую стилизацию. Ты вообще читаешь, что я пишу? Главная претензия в том, что без этого всего модель не работает. В хорошей модели у тебя должен быть приемлемый вывод даже с минималистичным вводом. Без простынь описания с "видид атмосфер, рискуе позин, провокатив секси фейс, бай джереми липкинг". Бахнул перса, бахнул позу, бахнул бэкраунд (это все у меня в промпте было, кстати) - и поехал.
>Но вообще возникает вопрос Тэги я знаю. И художников знаю. Проблема в том, что это всё не мейнстримные художники, и модели их, как правило, не знают, или знают недостаточно. А те мейнстримные, что я вот сходу вспомню - мне не интересны для репликации. Вот такой вот я необразованный, да.
Тут, блин, начинаешь понимать преимущество "кластерных художников" от понишиза. Вместо КТО ВСЕ ЭТИ ЛЮДИ отсюда >>963696 пишешь `"anime_style_42` или `shojo_drawing_7` - и что-то получаешь. И чтоб кардинально сменить аутпут не надо искать какого-то `tianliang duohe fangdongye`, а просто поменять цифру "кластера"
>>964037 Пока что всё что я вижу это то что ты нихуёво так полируешь член понишиза, вместо того что бы вписать наглядный стиль который можно посмотреть ты собираешься юзать магические числа из кластеризации, так для того что бы модель работала нормально нужно что то писать или нет?
>>963990 >Но лора с их стилем обучилась куда лучше, чем те же пони Чтоб начать лоры тренить - надо базовую модель опробовать. Определиться с тем, где оно лучше того, что ты уже используешь. А это затруднительно. Особенно когда ты получаешь какой-то очень фиговый вывод на рекомендованных настройках, просто потому, что модель, оказывается, без лор или стилевых токенов не работает.
>или подождет файнтьюнов нуба >С понями всё было куда сложнее в этом плане. Ну вот да. Я с полторахи слез с перетреном всей своей инфраструктуры только тогда, когда понял, что понь/аутизм сможет повторить все то, что я делал, и именно в моем стиле. Включая генерацию картинок из скетча и тайловый апскейл контролнетами.
>сравнивать с НАИв3 Еще б они без оплаты погенерить пускали. Чужие гены смотреть - такое себе.
>>964045 >почему не yaoi_sketch_666? Ассоциация вылезла на одну из превьюх нуба. Но, понятное дело, можно и яой ставить, и картун, блендер3д, и хоть чёрта лысого. Главное чтоб юзеру понятно было, и чтоб легко переключалось.
>>964047 >что ты нихуёво так полируешь член понишиза Я, блять, буквально несколько раз писал, что не считаю поня хорошей моделью - ровно по тем же косякам, что сейчас вылазят на нубе и люстре.
Про кластеризацию тут >>964058 написал. Вместо цифр, кстати, кластеры можно текстом кодировать. Вместо Anime_1, Sketch_4, Cartoon_76 тренить на Anime_alpha, Sketch_gamma, Cartoon_epsilon. Должно быть стабильнее, но от юзера потребуется знание греческого алфавита. Ну или файл с автокомплишном. Запомнить и сёрфить по этому, опять же, проще, чем ники художников перебирать.
>>964061 Покормлю Как средний юзер должен понять что из себя представляет стиль anime_76 и чем он отличается от 75 других аниме стилей? И почему это лучше, чем написать в промпте условно ishikei или там wlop или asanagi - и сразу в голове примерно прикинуть какой результат будет?
>>964061 Ну то есть писать в промт что то нужно будет что бы нормально работало? И какая разница цифрами или греческими цифрами когда они всё равно ничего не будут означать и понять что они делают можно будет только попробовав? Сколько таких класторов будет описано в какой то документации? То есть вместо того что бы проверить работает художник или нет 1 раз написав его ник нужно будет посмотреть есть ли такой кластер и потом посмотреть что он делает, я правильно понял?
>>964067>>964069 Встречный вопрос: откуда "среднему юзеру" знать, как выглядят работы wlop или asanagi, и кто это вообще?
Для получения качественной картинки такому юзеру достаточно будет вписать кластер, и результат уже будет. Банальный "квалити" тэг, но в другой обертке.
Не понравится - он просто сменит кластер, названия которых будут ему интуитивно понятны.
Тогда как поиск по имени художника, особенно без дополнительных "стилевых" плагинов (вспоминаю времена полторахи, где целые библиотеки под это дело собирали) - это адовый ад. Юзеру мало того, что неизвестно, как выглядят работы того или иного художника, там еще и имена бывают такие, что с похмелья не затайпишь.
А если юзер у нас не "с улицы", и ему нужен конкретно wlop - он всегда сможет взять лору.
Хотя, конечно, в идеале это можно (и нужно) объединять в самой модели - и кластеры, и стили, и художников.
>>964090 >Встречный вопрос: откуда "среднему юзеру" знать, как выглядят работы wlop или asanagi, и кто это вообще? Если юзер не знает анимешных художников, то ему лучше пройти нахуй с пляжа, и не юзать анимешную модель И вообще, че ты суетишься? Там же понибедил как раз делает сейчас так, как ты описываешь. Будешь кушать те стили, которые барину зоофилу красивыми показались и довольно урчать
>>964091 Однокнопочный, ты когда сюда свой рэндом шит из папки аутпут дропать перестанешь? Ни ума, ни скила чтобы нажать генерейт по украденным со всех уголков вайлдкартам не требуется. Пожалей хотя бы энтропию во Вселенной.
>>964090 danbooru знают не только задроты дрочащие на нейронки, но и в полне себе обычные люди дрочащие на аниме, в nai3 почему то знают и пользуются. Тогда такой вопрос, а как будут тренировать лоры на стиль? Получается когда выпустят модель, текстовый энкодер будет запрещено использовать при тренировке? Иначе я не понимаю как будет тегатся пикчи с этими кластерами. Будет такая же хуйня с тренировками как на понях когда обязательное использование _score полностью ломает тренировку стиля. Если не проставлять эти _score при тренировке то будет разность при инференсе между тем что тренировал и что получится. Если поставить в промте пикч при тренировке то сломается сам _score. Ну а для того что бы всё работало всё таки нужно ставить кластеры да? Простыня какая то всё таки должна быть?
>>964098 Грубо. Как раз то,че он последнее время кидает не выглядит как рандом сблев сетки по вайлдкардам. Просто генерит свою жену райдер в разных костюмах
>>964095 >Если юзер не знает анимешных художников Ты их сам-то прям всех знаешь? Что-то сомневаюсь. Копировать кого-то одного - это самое тупое, что можно с ИИ придумать. Им дали инструмент с неограниченными настройками, но все, что они могут - дрочить на стили трех человек, к которым у них импритинг произошел.
>делает сейчас так, как ты описываешь Читать ты не научился, видимо.
>>964101 >а как будут тренировать лоры на стиль? Эээ. Что? Почему будет нельзя тренировать ТЕ? У тебя какая-то каша там, если честно. Как тренируют стили сейчас - так и будут тренировать. Кластеры тут никак не влияют и ничем не помешают, ибо от уже существующих во всех моделях стилевых тегов или тэгов художников/франшиз на техническом уровне не отличаются. Может даже проще быть - вместо вжаривания нового для сети токена `by vasya pupkin` можно будет тонко донастроить существующий `cartoon_72`, который визуально этому пупкину окажется наиболее близок. Добавление в кэпшны лоры условного "квалити" по типу скоров или мастерписей тоже ничем не помешает, как не мешает сейчас - потому что это лора, и ее влияние на вывод в любой момент можно устранить, просто отключив. Кластеры тут тоже могут быть полезны, кстати. Потому что если тренировать только кластер-тэг, без квалити, то влияние от подключенной лоры без активации кластера будет минимальным. Протечка со всяких вангёрлов и лардж бреастс правда, всё равно будет.
>Простыня какая то всё таки должна быть? В идеале - для красивой картинки должно быть достаточно только базового квалити ввода. Неважно, как он будет реализован - в виде мастерписов/бэд квалити, или скоров. Остальное уже должно работать как дальнейшая донастройка картинки, и преобладать над базовым стилем.
Причем, оно вполне реализуемо. В Нубе есть разбивка по датам в виде old\early\newest. Если художник рисовал прям долго, и у него по времени менялся стиль, то это можно вытащить, тренировка модели такое разграничение позволяет. Mogudan - отличный пример, ибо он рисует прон с Аянами с 97 года (!), и за это время у него стиль глобально менялся раза 2 минимум.
>>964205 >Копировать кого-то одного - это самое тупое, что можно с ИИ придумать. Про лоры со стилем художников не ты говорил?
>дрочить на стили трех человек, к которым у них импритинг произошел Ты ведь себя описал, потому что копротивляешься против того чтоб пробовать стили новых художников и хочешь чтоб за тебя все решили.
>>964220 >пробовать стили новых художников >за тебя все решили. Эх...
>поиск по имени художника, особенно без дополнительных "стилевых" плагинов - это адовый ад. Юзеру мало того, что неизвестно, как выглядят работы того или иного художника, там еще и имена бывают такие, что с похмелья не затайпишь.
>>963990 > Но лора с их стилем обучилась куда лучше, чем те же пони, с меньшим количеством артефактов, явных биасов, скошенных цветов и другой шизы. Вот этого двачую, нет смысла сравнивать пони и люстру, уже просто за то настолько по-разному обучаются. То что есть некоторые косяки в стоке - не повод уравнивать их. >>964012 > "Базовый функционал" ИИшно нарисованные тянки судя по треду, был доступен уже на НАИ. Ну вот опять шизу какую-то сочинил и пытаешься выдать это за чужие доводы. > У кого что болит, как говорится. Так сильно болит что весь выходной срешься путаясь, оправдываясь и тыкая, закапываясь уже по 3-му кругу. Особенно иронично выглядит варьирование градуса агрессивности в зависимости от наличия прикрепленных пикч. >>964037 > Вместо КТО ВСЕ ЭТИ ЛЮДИ отсюда >>963696 пишешь `"anime_style_42` или `shojo_drawing_7` - и что-то получаешь. > Или тебя устраивает хавать то, чем тебя снабдил неизвестный дяденька Взвизнул.
>>964089 >>964091 Хорош! На 3й прямо "за секунду до". >>964126 Милота. > А я на диете. Оно видно по тому сколько заготовила. >>964210 Какие приятные гладкие кандевочки. Костюм на второй зачетный, интересно как она его снимает/одевает. >>964268 Топ
>>964279 >уже просто за то настолько по-разному обучаются >с меньшим количеством артефактов, явных биасов, скошенных цветов и другой шизы. Звучит как скилл ишшью. Причем не обязательно того, кто обучает лору. На флюкс с понем отработанные техники тоже не сразу появились.
>Особенно иронично Зависит от тона сообщения на которое отвечаю, имбецильный ты шизодаун. Пример доступен, надеюсь?
>Взвизнул. Лоры: существуют. Причем зачастую качеством значительно лучше того тэга, что встроен в саму модель - тупо потому, что у анонов при тренировке определенного концепта есть возможность тщательно собрать, обработать и протэгать датасет, а так же варьировать кучу параметров самой тренировки исходя из того, что тренируется, а не ебашить всё скопом на авто-тэгах. Так что визжи дальше, свинка. Тебе идет.
>>964095 Мелкие детали оче хороши для исходного гена, даже лучше чем наи3 с их кастомным вае. Но при этом местами типичные артефакты и не похоже на адетейлер. Признавайся, это удачное сочетание промта-лор или особая метода? >>964296 Че такой агрессивный, скиловичок? > Звучит как скилл ишшью. Все кто что-то тренит отмечают насколько люстра лучше поней, а ты один такой уникум. Вкус лошадиной залупы все скрашивает? Давай ка вместо пустого пиздежа ты покажешь свои восхитительные лоры и выложишь подробное сравнение плохих результатов обучения на люстре и отличных на пони. А то такой эксперт - экспертом, а ни одной нормальной лоры не натренил. > Так что визжи дальше, свинка. Тебе идет. Хуя крит залетел.
>>964336 >удачное сочетание промта-лор Я хочу попробовать лору на добавление деталей, не знаю пока как именно они работают. Но в очереди на выполнение ещё кучка другого запланированного.
>>964336 >Признавайся, это удачное сочетание промта-лор или особая метода? Там нет ничего особенного, даже адетейлера. Просто нуб эпсилон 1.1 Вот метадата https://files.catbox.moe/a5wvkx.png
>артефакты Потому что glitch в промпте. Без него выходит чисто, разве что гексагоны в любом случае будут кривыми
>>964350 Не, с глитчами все в порядке и они в тему, то про мусор 4-канального вае типа пикрел, странно смотрится рядом с неплохими ресницами. Как вообще 1.1 версия? >>964432 >>964433 Uohhhhhhhhh! 😭
>>964648 Реализмоблядь, плиз, какие ещё маленькие головы в аниме-рисовке? Я даже ни одного рисоваку с ходу не вспомню, который практикует микроцефалию (хотя его тег это выход для тебя). Ну и да, там выше правильно заметили - генери не лолей делай больше сиськи и всё остальное, тогда пропорции будут смотреться иначе.
>>964700 схуяли в аниме головы обязаны быть огромными? мне не нравится эстетически вот эта элипсообразность, она еще иногда их делает широкими пиздец, как ебало моргерштерна
>>964760 Вариант нормы. Я специально промптил, бтв. >>964820 Ещё спроси, почему в аниме глаза большие, а пупки - вакуумные. Потому. Ищи теги на рисовку с маленькими бошками и не выёживайся.
>>964825 у тебя мутант на картинке. И она рисует всех такими, с огромной головой. В большинстве аниме у взрослых голова нормальная по пропорциям. На глаза мне все равно
>>964684 Ересь! >>964735 Богоугодная херня >>964700 Правильно, когда бубсы больше головы, про нее уже не скажешь что она большая. >>964865 Вотэт ее распидарасило, пусть ногу опустит чтобы посмотреть как устроено ее тело и одежда.
>>964974 Стиль у меня через лору, но можно найти художников, которые подобное делают, тупо пройдясь по данбуре по тегу чиби + скетч и т.п. Настройки: swg + pag + sag, Euler A, 28, кфг около 4-5 (всё сложно с ним, т.к. своя нода которая его нестандартно считает)
>>965026 Ну да, по факту все лора решает, у тебя красиво все и чисто, а на голой модели ерунда получается. Или в негативе может проблема, у тебя какой?
Ты ещё учти, что тут может быть не лора виновата, а весь мой шизо-стек с идущими подряд attention guidance'ами и нестандартным кфг. Плюс я это делаю не на нубе 1.0 эпс, а на personalmix3 мерже.
>>965070 Я только сегодня снова подчистил папку моделей от неиспользуемого трэша, который накачал во время экспериментов. Место захламляется с безумной скоростью.
>>965214 Я экспериментировал с апскейлерами и кажется, особо много выгоды из них трудно извлечь для качественной и быстрой картинки одновременно. Только генерация в один прогон в разрешении не менее 1024х1024, только хардкор. Самый простой метод в итоге даёт наилучшее качество картинки. С тем же успехом можно просто уменьшить количество шагов.
1 - dmd2 двухпрогонный процесс на 8+12 шагов для дистиллята SDXL с поней и лорами поверх, 2 - однопрогонный процесс на 20 шагов на пони с лорами
Пожалуй, осталось только точный дистиллят для пони или люстрой сделать и сравнить результаты, чтобы наверняка. Я не исключаю вероятности, что дистиллят как лора к базовой SDXL вносит мелкие искажения из-за несовпадения с поней, хотя они недостаточно велики, чтобы изображение стало целиком бессмысленным (но некоторые токены пропадают из результата). Но я не уверен, что потяну процесс перегонки по машинным мощностям.
Интересно, никто не пытался между понем/аутизмом и нубом/люстой сделать экстракт в виде лоры?.. Базовая архитектура там одна, токены тоже совпадают частично, лоры говорят тоже работают иногда. Какой кадавр из этого получится?
>>965271 В этом нет практического смысла. Получится зашакаленная разница, которая будет оче плохо работает везде. Если углубляться, то можно попробовать мерджить не по блокам а по слоям внутри блоков, вообще не трогая атеншн, для ограниченного их числа. И брать в таком случае есть смысл не ванильную пони и что-нибудь из наиболее удачных дериативов. >>965332 Бинго! Ну все, иди сюда!
>>965364 Пытался просто запромптить супер дженерик но почему-то в таком случае нуб вытянул из картинки все цвета напрочь как будто я в 2022 на наи без вае генерю (пик 1). Пришлось писать цвета в промпт.
>>965497 Ну тут они далеко не идеальные, если присмотреться, проблем навалом. Это же модель на основе сдхл, чудес на ней не будет. За чудесами надо идти во флукс.
Но и из сдхл можно что-то разумное получить, если не пытаться делать сложных вещей (это главное) и обмазаться всякими трюками типа pag и т.п., они с консистентностью в целом помогают.
>>965613 >24 гб минимум? С квантованием в gguf формате можно в меньшие видеокарты запихать флюкс. Если тебе время некритично, так-то ты можешь и по 20 минут на 4Gb генерить каждую картинку, нужно только много RAM.
>>965661 Люстра потенциально интересна как источник фонов, к которому не надо ставить лоры, чтобы всё работало.
А вообще да, у нынешних моделей есть ограничения или по производительности, или по возможностям. Их уже очень сильно оптимизировали, но всё равно не хватает, чтобы генерить видео в режиме онлайн на карточке 1Gb.
Если не обращать внимание на артефакты, что вы думаете про цветовую гамму этой генерации? Стоит её доработать или просто забить? Она такая... кристальная.
>>965631 >и по 20 минут Я попробовал на форж это накатить, вае, потом текст энкодер, модель скачал квантованную. В 44 гига общей памяти не влезло. Остаюсь на XL.
>>965635 Для комфортной генерации явно нужно больше.
>>965908 Сгенерировалось две левые ноги, я порофлил и заинпеинтил такой взгляд. Она смотрит на свои ноги и охуевает. И с кот смотрит на неё тоже с неким недоумением. А третья-четвёртая это кадры из Драйва, у Гусли там ебало пустое, так что плюс-минус сохранил.
>>965900 > Я попробовал на форж это накатить, вае, потом текст энкодер, модель скачал квантованную. В 44 гига общей памяти не влезло. Остаюсь на XL.
У меня т5 в q8 и unet в быстром fp8, это самый оптимальный вариант для флукса, прежде всего из-за того, что оптимизации только для fp8 сделаны нормальные. В итоге выходит около 10-15 секунд на 1-1.5мп картинку на флукс дев с basic guider'ом.
>>966026 Где-то 3 секунды, если играться с хитрыми самплерами и т.п. - то где-то 6 сек. Но тут надо учитывать, что это комфи + линукс + торч компайл. Ну и сдхл для кучи случаев нет смысла без минимум 1.5х хайрез фикса использовать, так что суммарно выходит те же секунд 10 с его учётом.
>>967549 Можно использовать дефолтный из описания с цивитая, ну или немного его менять, типа того nsfw, adult, milf, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands,
Мэтры, поделитесь воркфлоу для атеншен гайденсов и прочих магических улучшаторов. Если PAG я ещё завёл, то включение нескольких сразу мылит и артефактит мне всю картинку.
>>967571>>967814 Пробовал Pag юзать, мне показалось что без него лучше, пробовал разные показатели cfg и pag scale, не понял прикола и чем лучше, возможно при использовании control net он должен лучше работать, или при impaint, но с этим в последнее время не занимался
>>967922 У меня просто своих нод дофига, поэтому думал, что быстрее будет методом тыка разобраться. Переделал без них вот тут с PAG + SAG: https://rentry.org/9zfk9i3c
Вот пример, первая картинка - без улучшателей, вторая с ними.
>>968051 > Очередные улучшатели качества ценой скорости работы. А можно обнаглеть и попросить примеров? Или хотябы описать по ощущениям что дает. >>968086 > 1 Хотеть!
>>968120 > Или хотябы описать по ощущениям что дает PAG - по ощущением заставляет чуть лучше при хайрезе работать, как минимум, с ним вижу меньше откровенных косяков. Насколько это плацебо или нет - не знаю. SAG - делает более консистетным лайнарт и мелкие детали, вот это 100% не плацебо, эффект легко заметить.
>>968223 >Есть какие-нибудь вводные статьи/видео по теме или вы это просто по рандомным постам с условного реддита/форча собираете и наобум тыкаете? Я в твиттере на кучу ML ресерчеров подписан, там часто можно натолкнуться на ссылки на статьи про подобные улучшатели. Часть из них почти сразу (иногда буквально день в день) в виде комфи нод энтузиасты делают, часть достаточно просто самому закодить.
>>968303 >>968304 Большую часть тренировки там был шафлодроп средней хитрости, потому будет работать как угодно. Даже код выкладывался, ну что такие ленивые. >>968308 Можно. Но как и для любого заработка, нужно или делать что-то оче хорошо, или седлать волны хайпа и нагонять трафик всеми способами. Стили в чистую не используют а миксуют с другими, так типа недоказуемо.
>>968223 Какая красота! >>968374 2 хороша >>968399 Стиль на 2-4 приятный. Спасибо за разъяснения, интересная тема. >>968447 Ну что же ты, нужно хотябы пару десятков пикч сделать и там считать количество косяков, группируя их (типа пальцы вблизи, пальцы издалека, соосность прерывающихся объектов, периодические структуры и т.д.).
Я правильно понимаю, что если в промпте написано что-то вроде {day|night}, то для повторной генерации картинки по тому же seed надо раскрыть промпт и написать что-то типа night, потому что каждую генерацию клип будет срать на промпт и давать другой набор тегов?
>>968461 Не совсем, экстеншны на вайлдкарты, в том числе инлайновые, ориентируются по сиду и просто его установка будет работать. По крайней мере раньше так было.
>>968521 Ну они обещали в этот раз быстрее выпустить статью о своей архитектуре и обучении, так что может локальные модели быстрее нагонят, чем в прошлый раз.
Да и так, вон, локальные модели более-менее (разве что инпеинта нет нормального) догнали (а где-то и перегнали) их в3 где-то за год.
>>968471 >По крайней мере раньше так было. В ComfyUI судя по опытам вайлдкарды определённо раскрываются каждый раз по-новому, и я не вижу причин для того, чтобы это было не так (поскольку зерно задаётся в независимой от ноды-клипа ноде-сэмплере, которых в воркфлоу может быть несколько).
Но! Я нашёл в исходнике картинки поле tEXtprompt, которое не содержит вайлдкарды и судя по всему является предобработанным воркфлоу, до которого комфи усёк версию пользователя после того, как поработал рандомайзером и раскрыл вайлдкарды.
Полный воркфлоу в картинке хранится в поле ZtEXtworkflow, и оно-то и раскрывается в редакторе, если кинуть картинку в браузер.
Дело раскрыто! Если просто взять воркфлоу комфи из картинки, то она вероятнее всего не воспроизведётся из-за вайлдкардов. Но информация не проёбана - она вшита в другое поле картинки.
>>968536 Зависимость выбора вайлдкард от сида есть на автоматико-подобных интерфейсах. В комфи же нет стандартизации на этот счёт и там несколько расширений для вайлдкард, так что может по разному работать в зависимости от особенностей используемых нод.
Сейчас NAI вообще выглядит и ощущается как фигня без задач, если честно. Неужели при наличии того же цивита, и прочих сервисов по генерации, куда ты можешь подключать свои модули, кто-то будет их снабжать баблом? Откуда у них столько денег на тренировку?
>>968500 > похоже скоро NAIv4 выйдет Вот этого >>968619 двачую, даже хорошую модель можно загубить неудобным и всратым взаимодействием. Чтобы как-то привлечь это должно быть что-то уровня флакса, но при этом знающеей и чаров, и артистов, и общие/ирл концепты. Если будут действовать также как с в3 - хз насколько получится, 75к часов выльются в 750к, лол. Но раз пишут значит уже что-то готово, так-то пора бы уже. Можно сванговать что это будет что-то на базе сд3 ларджа. >>968524 Помимо понифага с рофлами о 800к пикчевом датасете, сейчас как минимум пара команд пробуют на зуб флакс и подобные модели, нуб-тим также явно чем-то после хл будет заниматься. И общий уровень хорошо поднялся, так что надежда есть. >>968693 Она не няшная, зачем ее когда есть Pramanix >>968709 Если будет ничего не есть и работать сверхурочно.
>>968619 > Контролнета нет? Я около года назад ковырял их апи, в нём явно были обозначены поля для поддержки контролнета, так что планы подключить его точно есть.
> Лор нет? Думаю, расчёт на покрытие кейсов 95% аудитории. Если модель знает большую часть чаров на данбуре и артистов/концептов, то и лоры многим будут уже не нужны. Да и вообще, сейчас до сих пор есть люди, кто не так активно следит за движухой, и поэтому неиронично сидят ещё на том самом AOM'е (наверное, выбирали модели по числу скачиваний на цивите за всё время) - думаешь, таких расстроит отсутствие каких-то там лор?
> Неужели при наличии того же цивита, и прочих сервисов по генерации, куда ты можешь подключать свои модули, кто-то будет их снабжать баблом? Если там будет явный некстген, то конечно будут. Как это и было год назад до выхода поней/хлл - тогда локально просто ничто не могло даже близко конкурировать с NAI3.
Да и локально настраивать всё это добро это тот ещё гемор, это удовольствие не для казуальных юзеров. По этой же причине я использовал текстовый сервис генерации историй от новелов до событий 2022 года, несмотря на то, что уже были всякие LLM-модели в паблике - вот только за $10/месяц ты получал готовый сервис и вообще не надо было ебать себе голову покупкой железа, настройкой торчей и всей этой ML-вознёй, которая мало кому интересна. Зачем страдать, если можно за небольшой прайс получить готовый сервис, обходящий опенсорсные аналоги?
> Откуда у них столько денег на тренировку? https://arxiv.org/pdf/2409.15997 Для обучения NAI3 использовали 75k часов на H100. По стоимости обучения это на уровне годовой зарплаты кодера в США. То есть для любой компании это копейки, а для энтузиастов - неподъёмная сумма. Скрин с ценником на akash network прошлогодний, но сейчас порядок цен не особо поменялся.
>>968808 >Если модель знает большую часть чаров на данбуре и артистов/концептов, то и лоры многим будут уже не нужны. Вот в этом то я как раз и сомневаюсь. Весь интернет в модель за засунешь. Вдобавок, один-единственный богатый фетишист, фапающий на пердящих лис и подгузы, переплюнет по выхлопу пару десятков обычных чуваков. Судя по тому, как они за коммишны платят. Т.е. в идеале надо не 95% покрывать, а 99% - а как это без лор делать, я понятия не имею.
>ничто не могло даже близко конкурировать с NAI3. Да не, почему. Обмазываешься лорами, и фигаришь. По крайней мере у меня такое ощущение сложилось из тех артов с НАИ3, что я в пабликах видел. Лично модель не щупал.
>Да и локально настраивать всё это добро это тот ещё гемор Так вроде однокликовые инсталлеры уже почти все интерфейсы имеют. Гитпуллить и отдельно всякое качать не надо - жмешь, и оно все само ставится.
>>968500 Тебе не кажется, что все эти вмешательства в цфг на уровне "передвинуть цфг влево-вправо", ну или просто сид чуть пошаффлить? У меня вот такое ощущение сложилось от всего этого, но при этом скорость генерации они срезают, некоторые вообще в 2 раза >>968832 > Так вроде однокликовые инсталлеры уже почти все интерфейсы имеют. Гитпуллить и отдельно всякое качать не надо - жмешь, и оно все само ставится. Давай, братишка, нажимай одну кнопку апдейта, сейчас самое время https://github.com/ltdrdata/ComfyUI-Impact-Pack/issues/843 https://github.com/ultralytics/ultralytics/issues/18027
>>968825 Появилась какая-то конкретная инфа или всё так же слухи? Всё ещё собираю информацию, сколько можно выручить за продажу почки.
>>968832 > Вдобавок, один-единственный богатый фетишист, фапающий на пердящих лис и подгузы, переплюнет по выхлопу пару десятков обычных чуваков. Ну обойдутся значит без любителей редких фетишей. Платит же кто-то за миджорней и прочее, где вообще NSFW нет.
> Обмазываешься лорами, и фигаришь. Вот от этого кошмара мы во многом и ушли с полторахи на поней и далее. На полторахе тебе надо было качать модель на стандартные позы, на люстре/нубе тебе (во многих случаях) не нужно качать лоры даже для артистов и чаров. Это и есть развитие - чем умнее модель, тем меньше ей нужны такие костыли. Тем более нужной лоры может и не быть, а обучением своих лор занимается лишь небольшая часть пользователей SD.
> Так вроде однокликовые инсталлеры уже почти все интерфейсы имеют. Гитпуллить и отдельно всякое качать не надо - жмешь, и оно все само ставится. Мне недавно в /b/ пришлось ассистить одному вкатывальщику, который скачал АВТОИНСТАЛЛЕР для какого-то автоматикоподобного гуя (не помню точно какой). Этот инсталлер автоматом поставил самый свежий питон, который был попросту несовместим с torchvision, так что дальнейшая установка падала. Так что не всё так гладко.
>>968845 Стабильные релизы работают. Лапша же вообще для отбитых. Если ты это выбираешь - ты гарантированно знаешь, на что идешь.
>>968853 >Платит же кто-то за миджорней Вот тоже всегда интересно было, кто все эти люди. Но вообще, NAI то изначально на кумеров нацелена. А там как раз такой разброс. Куча нищеты, и киты со странными запросами.
>Это и есть развитие Прорывного только я вот ничего в этом не вижу. Та же жопа, только в профиль, и побольше. Уровень "ничто не могло даже близко конкурировать" - это у флюкса, и то в узеньком диапазоне.
>Тем более нужной лоры может и не быть, а обучением своих лор занимается лишь небольшая часть пользователей SD. Захочешь - так научишься. Тем более, это сейчас значительно проще делать, чем год назад. Есть рабочие ресурсы, есть рабочие конфиги, есть цивит, где ты это все можешь делать за нифига практически. А вот на NAI3 этого не будет принципиально.
>Так что не всё так гладко. Частный случай, как у чувака выше. Стабильные и официальные релизы гуев почти всегда протестированы и работают.
>>968875 > Куча нищеты, и киты со странными запросами. Китам буквально нечего предложить NovelAI с их системой монетизации. Самая дорогая подписка стоила $25/месяц и позволяла генерировать без лимитов. Киты это больше про настоящих художников, где можно разориться на комиссиях.
> Захочешь - так научишься. Тем более, это сейчас значительно проще делать, чем год назад. Есть рабочие ресурсы, есть рабочие конфиги, есть цивит, где ты это все можешь делать за нифига практически. Это уже уровень хобби, где надо курить мат. часть, подготавливать датасеты и прочее. А сервисы рассчитаны на то, что весь твой уровень вовлечённости - это раз в день к ним зайти чтобы передёрнуть на хентай с вайфу. Неспроста в некоторых сервисах вообще не используют термины типа SFG Scale, заменив его на "уровень креативности". Это просто замена условному порнхабу/данбуре, для большинства этого достаточно.
> Прорывного только я вот ничего в этом не вижу. Та же жопа, только в профиль, и побольше. Ну, мы похоже о совсем разных полторахах говорим. Я в гробу видал на что угодно сложнее "1хёрл стендинг" подключать контролнет и идти искать/тренить лору и потом как-то менеджерить эти сотни лор, записывая кейворды и бороться с пережаркой при подключении более чем пары лор и прочее. Я бы наверное на картинко-генерации уже давно забил, если бы понь не случился.
> Уровень "ничто не могло даже близко конкурировать" - это у флюкса, и то в узеньком диапазоне. Посмотрим, что у новелов выйдет - у них там 16-канальный VAE и своя архитектура. Пока вообще не о чем говорить, а модель годовой давности сейчас нет смысла сравнивать с локалками.
> Стабильные и официальные релизы гуев почти всегда протестированы и работают. Пилятся васянами за идею и в свободное от работы время. Вообще нет причин считать, что там хоть что-то может быть стабильное - этому и логика и практика противоречат.
>>968808 > Для обучения NAI3 использовали 75k часов на H100 Нельзя не отметить что это тот еще треш и там или совокупный компьют, которые они потратили на все-все, включая исследования, тесты, обработку датасета и т.д., или они там совсем дурные что реально столько тренили непойми что дурной пример заразителен > для казуальных юзеров > за $10/месяц ты получал готовый сервис This, ключевое. >>968832 > Весь интернет в модель за засунешь. Не то чтобы, сложно со всякими мемчиками и прочим ибо они слишком однотипны, или оче редкими вещами. А так самое основное - вполне. Но всегда будет хотеться большего и расширять творчество дополнительной тренировкой, всегда найдется что-то что хочешь сделать - а хуй тебе. Алсо будь они похитрее - могли бы как кокпропики на авс поступить и дополнительно доить гоев, или даже развить >>968853 > от этого кошмара мы во многом и ушли с полторахи на поней С понями это безумие только крепчало, только сейчас люди отходят от бедтрипа и искренне удивляются очевидным вещам. Но вообще в лорах на что-то оригинальное или интересные стили ничего плохого нет. > обучением своих лор занимается лишь небольшая часть пользователей SD Но скачать их могут все, что активно практикуют.
>>968712 У нуба засветка слишком жёсткая. Я пока не придумал как добиться таких же мягких цветов, как в пони с накопленными лорами. Возможно, придётся подбирать стилевые лоры или даже тупо фиксить освещение лутом или цветокором.
>>968875 > Вот тоже всегда интересно было, кто все эти люди. Нормисам про диффузию или локальные ллм попробуй рассказать - или будут с глазами-блюдцами смотреть и удивляться что такое можно, или вообще не поймут > ой это что-то сложное там для программистов, вот у меня в телефоне фильтр на лицо есть, там настоящий ии! сила этих сервисов в лени и глупости масс. >>968938 > Киты это больше про настоящих художников Ну вот шишка встала у тебя, и ты пошел генерировать всякое с желаемой вайфу, делая сотни пикч подряд. Да еще не ебучих шакалов а хотябы в 3 мегапикселя. Вот тебе и киты. > у них там 16-канальный VAE Ничего нового, есть даже для XL. Просто тренить это сейчас - вообще нецелесообразно, большинство хавает всратомерджи или что-то хайповое, а отцом-основателем не станешь потому что закат эпохи, впереди новые модельки и лучше вкладываться в них. > и своя архитектура В сдхл у них тоже "своя" была, а по факту лишь минорные модификации. В лучшем случае они переработают т5 или заменят его на другой кондишионер от сд3.х медиум/лардж.
>>968938 >Это просто замена условному порнхабу/данбуре, для большинства этого достаточно. Это пиздец какой-то крышесносный, когда персонажа можно ставить для ёбки в желаемую позу и сцену. Порно такой степени вовлечённости не даёт. Хожу довольный, как кот.
>>968938 >Китам буквально нечего предложить NovelAI с их системой монетизации. Упущение с их стороны, между прочим. >Это уже уровень хобби Сейчас порог вхождения очень сильно понизился энивэй. Даже не шибко усидчивый чел справится, у меня уже были такие примеры. >Пилятся васянами за идею и в свободное от работы время. Ты так говоришь, будто васяны ничего не могут и все поголовно нубы. Это ж не так. Ты вот тоже васян с интернета, а поди шаришь в чем-то, даже за идею и после работы.
>>969139 >А так самое основное - вполне. Вот в этом и проблема. Даже нуб с его "турбо-тренировкой" не может часть вполне примитивных концептов нарисовать, западных художников или редких персонажей. Весь интернет в модель не влезет. Поэтому если у нее нет возможности тонкой настройки - это уже плохо.
>>969147 >есть даже для XL Хде? На поня встанет? В автоматике/фордже/рефордже заработает?
>>969147 >Нормисам про диффузию или локальные ллм попробуй рассказать - или будут с глазами-блюдцами смотреть и удивляться что такое можно, или вообще не поймут Ты им на видео покажи, как по промпту генерится картинка, которую почти не нужно исправлять. Вау-эффект от рисовальных нейросетей шикарнейший.
>>969171 > Даже нуб с его "турбо-тренировкой" Там мало чего нового по сравнению с люстрой по знаниям, больше цветных фекалий и подгузников из e621, плохой эталлон чтобы в "даже" приводить. > западных художников Если совсем западные то неудивительно, в датасетах только буру и фурри. > Поэтому если у нее нет возможности тонкой настройки - это уже плохо. Вроде об этом и написал в конце. > Хде? https://huggingface.co/ostris/vae-kl-f8-d16 и пикрел > На поня встанет? Нет, оно даже на ваниле работает неоче, с анимцом на кастомных моделях ужасно, это все просто демонстрация возможности. Чтобы работало - нужно крупно тренить, но по описанной причине не сказать что будет оправдано. В сд3 16-канальный вае в стоке, чему вообще тут удивляться? > В автоматике/фордже/рефордже заработает? Ни один из гуев не поддерживает без правок кода.
>>968875 > ничто не могло даже близко конкурировать
Ну даже пони не особо догоняли в3, только люстра и нуб подтянулся и то обе со своими приколами.
Главное преимущество наи перед понями - нефильтрованный и нехэшированный датасет, персонажи и художники в датасете, неужаренный ТЕ, ребалансированные по частоте теги, хорошие цвета и контрасты, инпеинт и ип адаптер местный. И лорами очень мало что из этого полноценно заменяется. (Даже стиль сложно, потому что стилелоры смешиваются менее приятно для глазу, чем авторские теги у наи)
Главный недостаток - то что новые концепты и персонажей не добавить, но того, что там есть, уже для кучи всего веселого хватает.
Т.е. в целом общий юзер экспириенс куда приятнее, чем у тех же поней. Зашел в удобный UI, закинул промпт в текстбокс, получил картинку. Кривая рука? Три секунды в инпеинте и готово. Хочется скопировать цветовую гамму и т.п. с картинки? Местный ип адаптер и всё.
Я уж молчу, о том, что легко доступно с любых устройств, даже с телефона будет удобный интерфейс.
И это всё было доступно за пару месяцов до поней, напоминаю.
>>968845 > Тебе не кажется, что все эти вмешательства в цфг на уровне "передвинуть цфг влево-вправо", ну или просто сид чуть пошаффлить
От PAG - кажется, что вне специфичных кейсов он прям кардинально ничего не дает, от SAG - так не кажется, на тех стилях, что я юзаю, он правда помогает.
>>968759 > общий уровень хорошо поднялся, так что надежда есть.
Ну я думаю, что вообще проблем не будет с опенсорс моделями, просто это как обычно требует времени. Компьют, как видно, народ научился находить, а всё остальное решится как-нибудь.
>>969203 >плохой эталлон чтобы в "даже" приводить. Тем не менее в этом треде с этой парочки (люстра/нуб) все писаются кипятком. Ну и я хз, какая модель знает больше. У поня плюс-минус те же знания, просто с другим смещением, и почти все рисоваки нафиг захэшированы под токенами типа "gwmbz, mydw, vum". Западных художников он, кстати, лучше знает. Из тех что расшифровали, по крайней мере. >в датасетах только буру и фурри И вот это уже большой минус. >Нет, оно даже на ваниле работает неоче Тю. А я то думал, там такой крутяк кто-то выпустил, а я и не заметил.
>>969273 Люстра - да, от нее все и идет. > У поня плюс-минус те же знания Вообще не близко. Там и датасеты несопоставимы, и их наполнение, и качество тренировки, хоть в обоих случаях не без проблем. > И вот это уже большой минус. В чем? Ца покрывается. Минус в том что все что было в ваниле забыто.
>>969242 > от SAG - так не кажется, на тех стилях, что я юзаю, он правда помогает. И дроп скорости в два раза бонусом. А что за стили? Пробовал просто цфг++ сэмплеры заюзать? Они каким то чудесным образом умеют иногда лютые артефакты фиксить кстати, скорость дропают на процентов 5-10 всего
>>969242 > думаю, что вообще проблем не будет с опенсорс моделями Может обернуться и наоборот. Сложность растет и выходит за рамки энтузиазма по фану. Компьют что "находят" - спонсорство в виде разовых акций от корпов, преследующих свои интересы, или собственные/собранные средства. Выйдет что желающих кто может - не останется (примут оффер, огородятся пейволлом, потеряют возможность), а кто хочет - не смогут, ибо путь нужно пройти нужно все сложнее. Передача знаний и кооперация идут вяло, только грызня и аутистичные исследования минорных эффектов.
Останутся только релизы всратого дистиллята от корпов с барского плеча, и инцесты у них на подсосе.
Алсо тут наи4 может помочь с точки зрения ускорения выкидывания в сеть весов пони7, ибо она нахуй никому не нужна окажется за деньги.
Люстра явно лучше умеет в анатомию, в ней можно генерить любых известных персов вообще без лор и результат будет хороший. Но в то же время люстра очень негибкая в плане модификации стиля промптом. И при этом есть аутизма, которая очень гибкая в плане модификации стилей промптом, но чаще проебывает анатомию и не может рисовать персов без лор. Что же выбрать?
>>969318 >И дроп скорости в два раза бонусом. Сага незначительно изменяет картинку. Поэтому её использование может выглядеть так: ты не мигая смотришь на мелькающий AI слоп, который высирается 1 картинка в секунду со всеми оптимизациями, а потом если что-то годное заметил раньше чем отъехал кукухой - то достаёшь из картинки зерно, промпт и хуяришь по этим исходникам сагой, пагой, фейс/хэнд детейлером и прочими мокрописьками в расширенном воркфлоу, в котором зерно зафиксировано.
Хорошо бы конечно автоматически распознавать дефекты на картинке.
>>969462 > Но в то же время люстра очень негибкая в плане модификации стиля промптом. Одно это меня останавливает от того, чтобы перелезть на люстру. Не считая того, что можно обжечься.
>>969462 > Люстра > негибкая в плане модификации стиля промптом > аутизма > которая очень гибкая в плане модификации стилей промптом Сюрр >>969492 Какие позы не знает и что за модель? >>969517 Кайф
Посоны, подскажите, что сейчас есть из локальных моделей для анимирования картинки (т.е. пик уже есть, нужно сделать короткую анимацию)? Какой-то вау-йобы не жду, хотя бы чтоб персонаж просто улыбался и слегка шевелился.
>>969462 > люстра очень негибкая в плане модификации стиля промптом.
По сравнению с понями, люстра и нуб кучу стилей знают из коробки вообще без каких-либо проблем, т.к. художники не удалены. Да и в понях те художники, которые были захэшированные, выглядят хуже, чем аналогичные же у люстры и нуба.
>>969222 Uohh? >>969237 Рогули кайф, а ушастой что-то плохо аж изо рта течет. >>969479 Заебал шакалистые кропы постить, давай полные. Рассуждения о превосходстве поней с потерянным задником и тремя сиськами - тот еще рофл.
Результат не гарантирую вообще. Я генерил 6 фреймов анимации на 20-40 шагов 20 минут на 4Gb vram, и получил зернистое видео, где что-то шевелилось на фоне. Если твоя видяха мощнее, можешь рискнуть потратить время на это.
В целом рекомендую отделить персонажа от фона и анимировать его в фотошопе, крите или ещё какой-нибудь хрени. На локалке ты нейронки для видео особо не погоняешь.
>>969845 >выглядят хуже, чем аналогичные же у люстры и нуба Некоторые лучше, некоторые хуже. Тут нельзя сказать, что превосходство прям 100% у какой-то модели.
Понь не только с бур тренился, поэтому охват у него, в теории, шире. Но качество очень сильно гуляет, плюс все зашифровано, а то, что расшифровано - не факт, что расшифровано 100% правильно. Ибо понишиз хэш токенов не сливал, а то, что найдено - найдено силами анонов, тупо переборм.
>>969869 > с потерянным задником и тремя сиськами Меня штырит пониевский цветокор. Да, выдачу неплохо бы отрефайнить и пони реже выдаёт ваншоты, не требующие обработки; но я пока не выкрутил другие модели на похожий арт-стиль.
> давай полные Мы в треде аи, дружище. Просто сделай аутпэйнт к картинке, если тебя так интересует что над люстрой.
>>969880 Любовь к заебавшему всех поникалу? Чтож, на вкус и цвет, видали и похуже и не вправе осуждать. Но точно выглядит убого в таком исполнении. > Мы в треде аи, дружище. Пол треда - вареники и голожопые лисы, чего там стесняешься
>>969881 "Хэш-токены", под которыми тренировались стили художников.
Он свою модель позиционировал как "дружелюбную" к художникам именно потому, что их стили нельзя было бы вызывать, и, таким образом, воровать.
Но аноны довольно быстро вскрыли, что художники никуда не делись, и просто зашифрованы под случайными комбинациями символов. И начали их искать. И многих нашли.
Например, PersonalAmi захэширован под токеном `rkmb`. BlueTheBone под токеном `vum`, Ishikei под `8um`, и т.д.
Работают и на "миксах" поня в том числе. Правда, в зависимости от того, насколько сильно микс задавлен присадками, и настолько точно аноны вскрыли правильный токен, воспроизводимость стилей разная будет.
Прошлый тред: https://arhivach.xyz/thread/1099750/
Схожие тематические треды
• SD-тред (не аниме):
• Технотред:
FAQ
https://2ch-ai.gitgud.site/wiki/nai
Установка
• NVidia: https://rentry.co/2ch_nai_guide
• AMD: https://2ch-ai.gitgud.site/wiki/nai/install/amd
• Облака: https://2ch-ai.gitgud.site/wiki/nai/install/clouds
Дополнительная информация
• Интерфейсы: https://2ch-ai.gitgud.site/wiki/nai/interfaces
• Модели: https://2ch-ai.gitgud.site/wiki/nai/models
• Промпты: https://2ch-ai.gitgud.site/wiki/nai/prompts
• Апскейл: https://2ch-ai.gitgud.site/wiki/nai/upscale
• LoRA: https://2ch-ai.gitgud.site/wiki/nai/lora
• ControlNet: https://2ch-ai.gitgud.site/wiki/nai/controlnet
Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci