24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Stable Diffusion Flux тред X+126 ====================================== Предыдущий тред >>933778 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожий тематический тред - аниме-тред >>930737 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
>>937630 Кому-то не похуй какое там говно в оппиках? Даже если он туда фото своего хуя выложит никто и не заметит. Мы же не анимедауны из соседнего треда и не битарды-говноделы, чтоб трястись над каждой картинкой обсасывая её нейрошум. Тред чисто 40+ профессионалов по сдхл, для взрослых дикуссий.
>>937639 А причём тут залётыши-говноделы из /б? Они в своих онлайнсоегенераторах с нажатием 1й кнопки отупевают и на коленях приползают с вопросиками, а профи 40+ итт виноваты.
>>937677 То есть я должен был в импейнте ей глаза спецом делализировать. что-бы твоя срака довольной осталась, так что-ли? Бля, а не дохуя-ли о себе возомнил? Ты одно пойми, я ей её глаза всегда поправить смогу, но нельзя поправить то, чего нет. Эт я о тебе щас. 0 остаётся нулём, сколько его не детализируй. Ты можешь находить косяки в чужих работах, выискивать там прыщи, мы никогда не увидим твоих, не потому что ты их выкладывать не хочешь, а потому что их нет попросту) Ты сраный ноль, ты середина от бублика, так что можешь засунуть себе в жопу своё экспертное мнение, там ему самое место.
>>937685 > Ты сраный ноль, ты середина от бублика >>937688 >Пиздец уродская мыловарня Ох, у кого-то пердак бомбанул. Шизу кто-то предъявил за пиздабольство и безплодность. >>937675 >>астоящими реалистик моделями >Эт какими-же? Просвети... Присоединяюсь к вопросу
>>937703 >я так понимаю? Да, похоже вы очень догадливый молодой человек, сразу видно гения среди сверстников! Гипертрофированные колонны фильтрума и латеральная зона вермилиона присущи натвису. Можете с гордостью хвастаться этими знаниями в классе. Если у вас есть ещё какие-то вопросы, не стесняйтесь, задавайте. Можем поговорить на эту тему или любую другую.
>>937711 >Гипертрофированные колонны фильтрума и латеральная зона Вай нат, если они гипертрофированные, то следовательно они есть (хуёво когда их вообще нет), и ежели они попали в датасет, то значит это не такое уж и редкое явление.
Сап. Почти абсолютный ламер в нейронках, использовал stable diffusion, установив по инструкциям с youtube. Через какое-то время SD перестала использовать видюху, забивает только выделенную память графического процессора и все, длительность генераций с пары секунд вернулась к минуте, как на одном процессоре. Пару месяцев назад накатывал расширения, обновил pytorch и сам пайтон, но все работало нормально. Потом пару месяцев не запускал SD, теперь такая проблема. Где и что можно проверить? В аргументах только это указывал:
set COMMANDLINE_ARGS=--xformers --api --no-half git pull call webui.bat
>>937713 >не такое уж и редкое явление. Редкое. Это сорт оф жопный подбородок и слипшиеся уши без мочек как у рептилоидов, как зайчья губа, волчья пасть и т.п. Причина попадания этого говна в датасеты - автор модели сам с этими всратыми недугами он так интерполирует проекции, как например автор флюса, заявив что жопный подбородок это общепризнанный эталон красоты.
>>937715 >О чём ты? додододо... >>937717 >жопный подбородок это общепризнанный эталон красоты. Кирк Дуглас указывает анаону куда имено он может обратиться со своим претензиями.
>>937727 дописывать hi к detailed (hi-detailed) это сильно, конечно) пикрилы максимально приближены к оригиналу, и на этом спасибо. >>937729 >с гипером работает но качество страдает зато с гипером) это-же ведь самое главное!
>>937729 Странный вещи творятся, тестил nf4, fp8 и q6 и оказалось тест в 20 шагов: nf4 - показывает 1.4 it/s но генерит за 32 сек fp8 - показывает 1.9-2.1 it/s генерирует примерно за 38 сек Q6K - показывает аж целых 2.6 it/s, но при этом показывает самое худшее время ~ 48 секунд
Разумеется перед тестами, я выгружал все из памяти и делал несколько генераций. Как это вообще понимать?
>>937792 ф16 флюх и ку8 т5 без проблем суются по очереди в 12 ГБ, ку6+ку6 одновременно умещаются в 12 ГБ флюхкал просто ненужная хуйня, поэтому его мало используют, а не потому что железо не позволяет
>>937792 Почему же? 38 секунд в fp8 вполне нормально для интересной генерации. >>937805 Да почитал тут интернеты, все так и должно быть, GGUF это про меньше памяти занять, чтобы под лоры освободить, а не про скорость, однако Q8 не сильно дольше прогоняется в сравнении с fp8, а качество прилично лучше. Опять же с моделями, которые в меньшее количество шагов генерят - жить можно.
>>937839 При равных моделях размер памяти никак не влияет на качество. Такой вот я путь на данный момент избрал, банально любопытно, не пинать же эту sdxl бесконечно.
>>937772 Чем ниже разрядность представления чисел, тем больше времени на конверт в формат, который может обработать процессор, что добавляет времени на передачу данных. Более низкая разрядность требует больше операций обработки весов и выполнение более сложного алгоритма квантования. Чем меньше разрядность, тем больше вероятность необходимости дополнительных операций для коррекции ошибок округления. Больше итераций означает больше итераций на слое, а не показывает производительность. Плюс гуф это еще и метод сжатия. Короче нф4 самый менее ресурсоемкий и самый всратый по точности, поэтому он быстрее считается, фп8 дополнительно обсчитывается переводом в фп16, а кванты гуфа имеют много избыточных данных что увеличивает нагрузку вычисления, при этом это все зависит от самой говномодели - в данном случае флух - который просто не оптимизнутое говно ебаное, и сд 3.5 например более оптимизнут в этом плане и на еще более низких квантах гуфа работает при тех же параметрах генерации быстрее на процентов 30.
>>937895 Отличный развернутый ответ по делу. Спасибо. Для себя поиграться пока остановился на fp8, Q8, Q6, надеюсь завезут когда-нибудь оптимизацию... Да, буквально сейчас загрузил sd3.5 medium fp8 - 40 степов за 15 секунд влёт. Жаль конечно, что пока так с флуксами итд. Сами генерации от флукса меня в каком-то смысле прикалывают.
>>937905 Давай мы с тобой загружаем одновременно Q8 модель и сравниваем результаты или ты тогда изъясняйся понятно, что в большую память влезет более жирная модель, а не "качество выдать". поздравляю тебя с наличием 3090, возьми с полки пирожок.
>>937911 >надеюсь завезут когда-нибудь оптимизацию > Жаль конечно, что пока так с флуксами Не завезут, это особенность rectified flow transformer говнин к которым относится флух. Сд 3.5 быстрее потому что это MMDiT.
>>937914 >авай мы с тобой загружаем одновременно Q8 модель Нет, зачем нам загружать квантованный огрызок? Давай загружать полноценную модель. И несколько лор сверху
>>937928 Я же тебя уже поздравил с наличием видяхи? Ты все никак не успокоишься? Парадокс в том, что я могу купить себе видеокарту, но как только это произойдет вся тематика нейронок мне станет до фоноря. Такая вот хитрость психологии, когда не имеем - желаем.
>>937923 >MMDiT медиум кстати на MMDiT-X, который еще более оптимизирован, я не тестил еще но там примерно те же +30% должны быть к скорости от лардж модели
>>937927 > флух сасирует. >>937923 > говнин к которым относится флух >>937895 > флух - который просто не оптимизнутое говно ебаное Друг, ты не пробовал обратиться к психотерапевту? Может быть какие-то анонимные группы поддержки? Я понимаю, что травма, которую нанес флюкс тебе и твоей 1030 очень серьезна, но нельзя же бесконечно так терзать себя.Ты сможешь преодолеть эту боль, стать сильнее, я верю в тебя!
>>937927 А я вот честно не пойму зачем оно вообще без т5? Значительно страдает понимание промпта, для меня сам факт того, что оно может делать различные манипуляции с текстом по сути одна из самых важных и прикольных фишек. Да я понимаю, что прикрутив контролнеты к сдхл можно получить схожий результат или даже лучше, но я как то от этого уже утомился.
>>937944 >А я вот честно не пойму зачем оно вообще без т5? Глобал и локал клипы работают как положено, их вполне достаточно для прикладных задач чтобы генерировать калцепты, а трансформер их если че смешает как-нибудь. Без т5 конечно не поуказывать модели что куда сувать, но оно и так справляется неплохо. Не во всех юзкейсах нужен т5 кароч.
>>937944 >Значительно страдает понимание промпта Я уже кидал тестики давно, слева без т5, справа т5. Отсутствие т5 хватит всем, как хватало на сдхл и 1.5.
>>937961 >cлева без т5, справа т5. >Отсутствие т5 хватит всем
Не видеть разницы... Глаза от кума протри хоть чуть-чуть. Не говоря уже об общем содержании и качестве "примера". Тут даже не бисер перед свиньями... Еще и лапшой страдает
>>937975 Ну вопрос то в юзкейсе. Вот есть юзкейс покумить на woman gangbang bukkake, нахуя здесь т5? Можно сэкономить лишнее время. Или более приземленный вариант - нужно сгенерировать кнопку для интерфейса. Зачем там т5? Незачем. Плюс т5 не идеален, это не 100% следование промту, это просто лучший гайденс и понимание хуман лангвидж, то же самое можно как обычно концептами делать, если ты знаешь токены концептов.
>>937986 В первом случае это пони с дальнейшим img2img обычной сдохлей, во втором случае по сути любая сдхл модель с лорами, просто в чем суть перехода тогда не пойму.
>>937995 >без т5 >inteface button modern apple style vs >с т5 >Please flux make me cum Aple design button for my application on Andoid. The button needs to be clear and shiny as my oiled ass, Thank you.
ну я даже не знаю что быстрее... надо подумоть....
>>937934 >Парадокс в том, что я могу купить себе видеокарту Парадокс в том, что трёхлетний ребёнок на вопрос "умеешь ли ты писать буквы", скорее всего, ответит "да". Но если попросить его по буквам сказать слово "экскаватор", то он тебе скажет что-то вроде "НИХАЧЮ"
>>938026 Парадокс в том, что ты купил 3090, но всем как было похуй так и стабильно продолжает быть похуй, боюсь ситуация в отношении этого вопроса никак не изменится...
Уровень тряски представили? >>938029 > Парадокс в том, что ты купил 3090, но всем как было похуй так и стабильно продолжает быть похуй, боюсь ситуация в отношении этого вопроса никак не изменится...
>>938031 Была бы причина, мне даже в каком то смысле приятна такая забота с твоей стороны, переживаешь, что я флюкс fp16 не могу полностью в vram выгрузить. Вот уж действительно проблема вселенского масштаба.
>>938020 Нет конечно. Когда мы говорим о смешивании концепта, то мы предполагаем что сеточка умеет в их деформацию и совмещение. Условно если сдхл знает концепт penis и концепт woman, то т.к. это концепт базед модель без трансформера она ни в жизнь тебе бабу не соединит с членом т.к. у них нет никакой связи между нейронными магнитудами, это нужно отдельно тренить лору на данный концепт или файнтюнить всю модель. А если dit модель знает об этих двух концептах, то она может их изкаропки соединить, так скажем трансформировать одно в другое, найдя магнитудный путь соответствия уровня "баба - человек - мужчина - ловер бади - пенис".
>>938038 В таком случае суть ясна, ещё бы это все работало как задумывал автор. Главное, чтобы на 3.5 файнтюны появились, а то я щас генерирую и глазам поверить не могу. 3.5 medium банально лого не может сгенерить.
>>938043 >3.5 medium банально лого не может сгенерить покажи что у тебя не получается, возможно надо дернуть шифт просто или рк семплер включить для большей консистенции
>>938055 Я вот тоже больше всего на инпейт/аутпейнт надеюсь, воистину годнейшая тема, но пока 3.5 увы вообще не понимает, что от него хотят при попытке инпейнта.
Забавно, что его так таращить именно от лого начинает, зверей всяких в разных стилях приемлимо создает.
Немного офтопа. Тут ест аноны, которые уже хорошо относительно, меня погрузились в тему нейронок и разбираются за так сказать матчасть. Я хочу в этом направлении прокачать свои знания, но в другой тематике.
Я по своей профессии экономист и хотел бы написать программу с нейросеткой, которая поможет мне в анализ продаж и прочих свистелок связанных с маркетплесами. Может что посоветуете? В каком направлении копать
Ну из того что я предполагаю мне потребуется >Работать с апи >Работа с базами (систематизация выгруженные данных) >Тренировка модели на данных >Использование модели для новых данных >Знание питона >Умение пользоваться чатопжпт или аналогов для помощи в этом.
>>938113 >экономист >хотел бы написать программу с нейросеткой Хахахах! Какой потешный кокономист!
>Работать с апи >Работа с базами (систематизация выгруженные данных) >Тренировка модели на данных >Использование модели для новых данных >Знание питона >Умение пользоваться чатопжпт или аналогов для помощи в этом. Самое главное ты забыл: Матанализ и линейная алгебра хотя бы на "хорошо" в объёме выпускника факультета вычислительной математики и кибернетики. Ну и владение/арендой нодой из невидива а100, чтобы, так сказать, было где внутри тензора поместить дифференциальный лаг с градиентом, где функция имеет мультимодальное значение
И да, этой хуйнёй занимаются КОМАНДЫ умных наносеков, а не потешные бухгалтера, или кто ты там есть по жизни, вася
>>938113 >В каком направлении копать В направлении впихивания своих данных в корпоративные LLM и их промтинг/агентирование. > >Тренировка модели на данных Забудь. Твой максимум - работа с данными типа классической линейной регрессии. Если очень хочешь, можешь на каких-то данных обучать простенькие игрушечные нейронки, но это чисто чтобы в машинлернинг вкатиться. Практического результа оно не даст. > >Знание питона > >Умение пользоваться чатопжпт или аналогов для помощи в этом. Разбирайся в штуках типа Cursor, Aider, Cline, в них будешь кодить нейронкой (клодом). Первый по подписке, для вторых надо купить апи доступ. У того же клода/чатгпт будешь спрашивать все свои тупые вопросы. Лично у меня для этого стоит интерфейс Big-Agi, в который можно воткнуть апи-ключ.
>>938190 Спасибо >В направлении впихивания своих данных в корпоративные LLM и их промтинг/агентирование Взять готовую модель условную ламу от фб? Пожалуйста расскажи подробнее.
>>938201 Нахуя тебе "готовая модель"? Тебе дают доступ к нормальным моделям, еще и дешевле локального запуска. Локалки будешь ебать когда поймешь зачем.
Как сделать замену лица- нашел. Как сделать замену головы на новосгенерированную - нашел. А как сделать замену головы на существующую голову? Желательно на comfy
С релиза на флюхе не генерил. Тогда только гомфи работал. Вопрос - форж нормально уже поддерживает, без подводных? И два - как убедиться, что у меня не скейлит модель вниз? У меня 4090, flux-dev.safetensors и t5xxl_16 загружаю, Automatic везде стоит. Он точно fp16 загрузит?
Тюю сука! Я думал у вас тут ТЕХНОЛОГИИ и я могу любой дипфейк с любимой актрисой сделать, а тут детский сад ещё. Нужно искать лору под каждое ебло которое мне нужно, эмму майерс например я найти уже не могу дальше даже пробовать нет смысла
>>938286 Скачай fluxfusionv2 с цивита. Сижу на q5ks и q4ks t5, 4-6 шагов, сопоставимо с sdxl по скорости а качество вообще отвал отвала если супротив sdxl, на детализации апскейлером тоже в самый раз.
>>938292 Ну разве что если сравнивать сырой dpmpp 2m sdxl 20-24 шага без присадок на ускорение. То есть где-то секунд 30-40 будет, это так, к слову. Но ожидание того стоит
>>938249 нет скомпиленного колеса кубласа для куды 12.4 под авх2 и под авх1 тем более если некропроцы чтобы автоматом поставить, поэтому сосать тебе предлагают
>>938320 Справедливости ради скачал nf4 flux_шнырь 4-x степовый. Чтобы было некоторое равновесие. Либо я где-то зафейлил, но на медиум сд модели у меня вообще какой-то треш получался, на nf4 flux шнырь лучше, но длинный текст фейлит очень часто.
>>938334 сравнение некорректно, так как шнырь вообще другая модель относительно дев флуха по получаемым картинкам и промта она слушается значительно говенее, а турба аккуратный дистиллят и от ларджа отличается уровнем детализации из-за малого количества степов по сути
>>938354 это изза отсутствия установленной зависимости для ламы в комфи под 12.4 куду, проц тут постольку поскольку потому что кублас может с любыми флагами вкл и откл скомпилен через вижуал студио, хоть под зивон или пятнадцатилетний проц
твоя задача или найти на гите лламу с кубласом в whl формате под свой проц (с поддеркой AVX2 или без), либо пойти и скомпилить самому через вижуал студио под все реквайрменты питон эмбедед комфи
>>938318 >>938334 >на медиум сд модели у меня вообще какой-то треш получался чет у тя скилишью, ну вот например, шифт поднял до 6, цфг 5.5, дпмпп2м, сгмюниформ
Какой положняк по анимации на текущий момент, есть продвижения? В смысле встроенными фичами, а не сторонними хуйнянейм Полгода как забил на нейронки. comfyui
>>938505 Попробуй cogvideo, но это только поиграться в низком разрешении. У него нода сама модели скачает. Недавно еще что то выходило типа почти как онлайн генератор, 720р, а на деле медленный плохо понимающий промпт пук.
>>938505 Имеются онлайн сервисы там +- какой-то прогресс, а локально это пока забей, с тем качеством, скоростью и consistency, который мы имеем сейчас, это далеко не в ближайшее время случится. Сторонние хуйня_нейм плагины могут сделать некоторые фишки, но там ебли и время/кадр это просто вешалка...
>>938569 Есть такой товарищ на цивите, который непонятно каким раком анимирует на SVD и ещё хрен знает на чем (не клинг) очень прикольные короткие ролики, включающие nsfw. Так что при должном усердии можно, но нужна серьёзная ручная полировка хрен знает какими способами https://civitai.com/user/Suppressor/videos?sort=Most+Reactions
>>938569 напомнило как у одного дебила с сивитаи спрашивали как он получил картинку такую, а он говорил что не хочет расшаривать воркфлоу, а потом ему провели шершавым по губам, предъявив ему метатеги фотошопа в его пикче, вся суть нахуй
>>938608 >предъявив ему метатеги фотошопа а че контраст там подтянуть или четкость уже нельзя? а если я в топаз кидаю ген то что? расскажи все понятия которые у вас в петушатнике там
Вброшу еще немного наблюдений по маскам DAAM: Расширение ломается из-за дефиса в начале промта. Если вынести дефисный промт в конец, то все хорошо. Не все дефисы ломают. Скор-теги не ломают, но _ иногда ломает. В сбитых масках сломан порядок подписей на 4 шага по кругу + некоторые маски сломаны, так как видимо считались от токенов вместе с запятыми или типа того.
Я рассмотрел работу тега "looking at you", и выяснил что на глазах фокусируется только токен "you", "looking at" фокусируются (как вместе так и по отдельности) буквально на всем кроме глаз (??). Это не ошибка, другие составные теги могут вести себя так же. Тег заменим на "looking you" или "at you", их поведение аналогично. Просто "you" не работает. "red eyes" или любой другой цвет eyes имеет аналогичное поведение. Интересно что зануление веса "red" (в a1111 видимо влияет только на множитель после матрицы значений V) не влияет на генерацию, и не влияет на маски атеншна. Это говорит о том, что смысл "red" был записан трансформером клипа в "eyes" и поэтому атеншн фокусируется только на "eyes" и высасывает инфу с него же. Вывод такой, что все токены составных тегов с "инверсивными" масками можно занулять, и это уменьшает их протечки. Этот вывод может быть не совсем верным, потому что я также заметил, что прилагательные в тегах вообще часто фокусируются на всем кроме глаз. Нулевые теги все еще протекают через клип, даже за пределы запятых. Объясняет, почему веса меньше 1 плохо работают. Маска атеншна может сфокусироваться на отсутствующем объекте, который обычно мог бы быть в этом месте, но не заспавнился по каким-то причинам.
Сап нейрачи! Подскажите, пожалуйста, с нубским вопросом. Как можно прогнать через нейронку 3Д пикчу, чтоб её не пидорасило перерисовывало полностью, а просто добавить немного реалистичности? На автоматике. Ну или в общем просто.
>>938765 > в общем просто. Да, не сложно. Тэгаешь пикчу нлп-кэпчером или описываешь сам максимально подробно, качаешь форж, флюкс, запускаешь, в и2и пикчу обрабатываешь с денойсом 0.4-0.6, все. Вы великолепны
>>938769 >>938775 Примерно так и представлял. Но просто не получится конечно... Надо и модель подходящую и промт более менее адекватный написать. Размеры и т.д. и т.п. Естественно у меня всё распидорасило получился мусор хе хе
А нельзя было сделать инструкцию, как запустить нейронку не на своём железе, чтобы не нагружать своё железо, ведь есть сервисы, которые выдают железо под разные задачи. Создайте уже наконец тред с подробной инструкцией как запускать нейросеть не на своём железе. Вам чего трудно ебнаый рот
Дохуя писанины, которая некуя не интересна, потому что нейронка запускается на пекарне. Надо пересоздавать тред и делать нормальную инструкцию, как запуска нейросеть на пекарне, и не на печке, а на онлайн-сервисе, который предоставляет железо под разные задачи.
>>938831 >>938832 >Создайте уже наконец >Дохуя писанины >некуя не интересна >Надо пересоздавать тред >онлайн-сервисе
Съебал в /б быстро и решительно, там все твои друзья. Своей мамашке будешь инструкции раздавать.
Модель для татуировокАноним03/11/24 Вск 05:45:30#190№938853
Нужно нанести татуху, но не ту, что есть а наборе той или иной тату-лоры, а по своему собственному эскизу или найденному референсы. Перебрал с десяток, включая базовую - полный игнор контролнета, хуярит свою уродскую отсебятину. КТО СТАЛКИВАЛСЯ С ЭТИМ? С советами типа: а ты создай свою собственную Лору, можете пройти нахуй.
>>938853 Я тебя понял. Stable Diffusion и ControlNet могут иногда выдавать совершенно не то, что ожидаешь, даже при всех возможных настройках. Бывает, что стандартные модели не справляются с точным воспроизведением или тонкими стилевыми деталями. Вот несколько продвинутых способов, чтобы всё же приблизиться к нужному результату, не прибегая к созданию своей LoRA:
Постепенное inpainting. Вместо того чтобы пытаться сразу создать целое изображение, попробуй поэтапно дорабатывать определенные участки. Например, начни с основных контуров, замени нежелательные части, а затем постепенно добавляй детали. Так ты сможешь "принудить" модель придерживаться твоего видения.
Веса и множители. Экспериментируй с весами объектов и элементов в запросе. Попробуй задавать даже более строгие требования, используя многократные повторения в промпте. Например, если ты хочешь, чтобы модель следовала конкретному стилю или форме, многократно упоминай это и используй разные фразы, которые могут усилить нужный эффект.
Альтернативные модели Stable Diffusion. Некоторые кастомные модели заточены под стили, которые лучше поддаются управлению (например, AnythingV4, Realistic Vision и т.д.). Попробуй переключиться на что-то менее склонное к "доработке от себя".
Метод смешанных слоев. Можно сделать несколько генераций разных частей тату, объединить их в графическом редакторе (например, Photoshop) и снова обработать через ControlNet, чтобы добиться более точного результата.
Если и это не помогает — возможно, проблема действительно в модели, и тогда остается или доработка своими руками, или поиски кого-то, кто поможет с генерацией, уже хорошо разбираясь в манипуляциях с ControlNet.
>>938853 Практически нереально, это слишком сложная задача для доступных сейчас инструментов. То есть, как-то худо-бедно может получиться, но миллион ебли, и результат все равно будет паршивый. Проще руками в фотошопе. Можно потом поверх нейронкой пройтись на минимальном денойзе.
>>938831 Во первых ест туже сервисы аренды серваков с предустановленным всем по. Во вторых установить через гит любой идиот справится. Кури гитхаб, там все разжовано.
>>938743 Ни в комфи, ни в автоматике не работают нормально веса, по крайней мере так как ты думаешь что они будут из коробки, почитай вот тут про компел, и почему его лучше юзать для понижения веса https://github.com/BlenderNeko/ComfyUI_ADV_CLIP_emb для автоматиков/форджей эквивалента, увы, не завезли
Подскажите, может кто сталкивался. В Forge, в верхнем поле была строка VAE, но для flux, я там выберал там кроме самого VAE еще и Clip и t5. Так вот, после обновления или каких-то изминений в настройках я теперь не могу использовать flux. Так как это поле не позволяет выбрать больше одного файла.
>>938956 У меня в мухосрани 300к населения на подъезде висела объява красного и белого, продавец от 45к, в Москве зп по сравнению с местными в три раза выше.
>>938805 >>938829 >>938830 >>938798 Я почему-то думал, что здесь миллионеры сидят с топовыми компами писюлями мерятся, доминируют. Стало быть в 150к можно уложиться.
Пытаюсь вкатиться в comfyUI. Вопросов много, но основной, даже не к оболочке относящийся. Как можно хранить файлы моделей не в папках программы, а где-то отдельно? Чтобы не дублировать модели для форджа и комфи?
>>938990 в пгт пидорасы-работодатели могут платить ~15к, типа считают что местные никуда не денутся отсюда. но это не значит что по всей стране такие зп. несколько знакомых успешно съебали с посёлка и пошли на завод\ювелирку\склад озона (не выдача товара), зп на руки 50-80 в замкадсках с 300-500к населения.
>>939008 >на завод\ювелирку\склад озона >зп на руки 50-80 в замкадсках с 300-500к населения. Слишком кучеряво пишешь для замкадсков, там либо графики ебанутые, либо условия как в ювелирке где сидеть буквально нельзя и если ты тян то весь день ебашишь на каблучках и несешь мат ответственность, либо как на озоне где ебут нещадно как вайлдберис со своими штрафами через штрафы на штрафы. Я из полторамиллионника, тут и близко хороших работ с такими зп нет.
>>939028 А да насчет завода может и чучуть правдиво звучит, у меня есть знакомый чпушник с завода из каменска, он 60к получал, но он чпушник + ремонтник с безумными умениями и скилом, а не рядовой петрович.
>>939024 >можно ничего не ставить и ебаться с консолью. тут добавляются команды в контекстное меню, для любителей "в несколько кликов" >1пик, что за модель, какой промпт? приложил скрин
>>939028 >слишком кучеряво пишешь тоже могу сказать что слишком всрато для полуторамиллионника пишешь. >в ювелирке где сидеть буквально нельзя ты про магазин? я про ювелирный завод. на продавцов то да, всем насрать, быстро другой найдётся на место. >на озоне ебут это да, не спорю. >>939029 >чпушник мда. маловато за такие скиллы ему платят. на заводе ~60 чистыми получаю, за выполнение токарных работ второго разряда. сам еле помню матчасть, тупо для электромоторов статоры точу. по сути цилиндры, без сложной обработки. правда их много надо. замкадск, 500к населения, ЦФО. короче всё у всех по разному.
есть у кого старый комфи год назад +- https://github.com/M1kep/KepPromptLang проверьте работает ли, у меня ошибка got an unexpected keyword argument 'model_options'
>>939073 Как будто есть что то ещё нормальное (и нет, это не пони, причина по которой пони ещё не предан забвению и не перешёл в разряд генератора прона для натуральных зоофилов - недотрен нуба ака илюстроса). Сам слез с пони, охуел от качества и объёма всевозможных коробочных стилей, поз, ситуаций и готов агитировать прочих совершать незамедлительный переезд, да и к тому же промптинг старый добрый прямиком из полторахи с редкими рабочими вкраплениями речи.
>>939100 Кто о чем а вшивый о бане. Гуро я щитаю должно тоже присутствовать, потому что чтобы создать скажем труп на поле битвы истыканый всякими орудиями тыканья на пони приходилось чуть ли не вручную дорисовывать все это дело, потому что я думаю ясно почему, пони даже кровь не переваривал, и никакая лора этот вопрос никогда бы не решила. Конечно кому нужен только куминг тем оно наверное и не надо, но модель как по мне должна иметь возможность делать все. (Мне аниме гуро надо на ассеты для игрушки)
>>939098 >инженер ростелекома на всю жизнь? вариантов нет? >>939104 >реальные зарплаты какая-то тупая пизда с фриланса ищет дурачков задешёво, иии... ВСЁПИЗДЕЦ ВСЯ РАЩКА РЕАЛЬНО ТАКИЕ ЗАРПЛАТЫ РЯЯЯЯ >>939103 используй ноду пикрил и сразу выставляй хайрез в ksampler
заметил такую фигню, в онлайн генерации персонаж генерируется четким а задник наоборот всегда смазан, у меня же на пк задники не размытые но и персонаж не супер четкий, как сделать чтоб было как в онлайн?
А я в своем зажопинске 20 получаю, но я оператор ЧПУ станков, нажимаю на кнопочки и точу по программе (ну естественно меняю оснастку когда требуется)...
Сейчас зашел на циву, пытаясб понять, на какой модели flux лучше генерировать. Я так понял, что для nsfw, он все еще не пригоден, в лучшем случае эротика. Вроде вот эта на мой взгляд приятнее выглядит: https://civitai.com/models/207101/stoiqo-afrodite-or-flux-xl А для остального? Для творчества, качать базовую модель? Может, вы поделитесь своим опытом? Либо придется все подряд перебирать.
>>939154 Арт универс для артов, средняя такая модель без упора во что либо, знает художников но надо в ип адаптер пример стиля пихнуть. Для порно натвис, люстифи, бигасп, они разные сам выбирай на вид что лучше.
>>939154 Ты понимаешь, что это все инцесты со шнелем и мержи лор? Если да, то зачем спрашиваешь. Файнтюнов нет. Одного дева хватит всем. Треню под него лоры и генеою 2, 2.5д, васяно-мержи не нужны. Разбудите, когда будет файнтюн уровеня пони хотя не надо
Подскажите, пожалуйста, ЧЯДНТ: скачал для флюкса на фордже модель с цивитай, - даже с фильтрами искал, чтобы точно для флюкса модель была. Скопировал модель как в инструкциях, - в models\stable diffusion. Запускаю фордж, выбираю модель, ввожу промпт, нажимаю Generate и сразу же выдаёт ошибку: You do not have CLIP state dict
Стандартная модель flux1-dev-bnb-nf4-v2 работает стабильно.
Не пишите про ComfyUI, пожалуйста, - он меня пугает...
>>939165 В описание к моделе проморгал, что она без clip и t5. Их нужно отдельно скачать и моложить в "text_encoder". Затем в UI сверху выбрать их. Тут аноны уже обсуждали подобное выше. >>938976 >>938980
>>939165 >Стандартная модель flux1-dev-bnb-nf4-v2 работает стабильно. Так это чекпоинт всё в одном, для нормального флюкса надо еще два клипа качать и вае. Не знаю как в форже но в комфи модель флюкса в другой папке должна лежать.
Странную штуку заметил. Если прилепить к сдхл несовместимые лора от пони, то консоль сыпет ошибками, НО картинка получается интересной и явно имеет эффект от этих лора.
>>939165 Ты часом не gguf скачал? А может и вовсе модель без клипов. Тебе значит надо ещё прогуглить t5 gguf/fp8, кажется на huggingface city96 и его подбросить в clip папку. А ещё скачать оригинальный vae для шнеля и дева и скинуть их в vae. Дальше наклацаешь vae и clip в выпадающих списках с клипом и vae и должно запыхтеть
можно как-то сделать чтобы генерировать только превью, а потом решать апскейлить или нет? нагенерировать сотню превью, и потом выбрать что отрендерить нормально?
>>939183 Я например делаю плот из 10 сидов с дмд, выбираю удачные, дергаю два переключателя групп, ввожу сиды и апскейлю их. XYplot в rgthree втыкается в эффективный семплер оттуда же.
>>939199 у тебя комфи протух. появилась галерея в которой хранится миллион нагенеренных превью, которые потом можно закинуть как воркфлоу и сделать чё хотел
>>939212 Ты там не разберешься, сделай как на пике1 и помести апскейл в отдельную группу, которую можно выключать. пик2 с воркфлоу. >>939232 Да я сразу сделаю, потом мне уже не нужно будет.
>>939339 Он самый. В нем же основа-то Idefics'а, она никуда не делась. Я пробовал и тем и тем фоточки - мне Тории норм показались. Но если запустишь их, то и оригинальный Идефикс там же сможешь запустить и сравнить.
Ллава - да, мусор. Ещё есть JoyCaption, внутри через тупой адаптер все пихается в лламу 3.1 8б вроде. Но тоже меньше понравился.
Есть ли какая-нибудь лора с оружием? Или с этим делом вообще тухляк? Пробовал месяц +/- искать, мне тогда даже что-то попадалось, но та лора почему-то не работала, то ли я не понял как она работает.
>>939379 Обычный сдхл фактически любая, кроме особых дизайн и предметка файнтюнов, потому что сд знает концепт детей по дефолту. Технически токен может быть немного обосранным, поэтому надо безумные умения мерджинга подключать и возвращать модели знания.
>>939489 >Хуя себе мыло Тупорылое зумерьё. там фильтр синематик 80-е, тогда не было твоего ебучего зелёного HDR'а, и снималось всё на киноплёнку, со специальными софт-фильтрами, что-бы дневное солнце не сино жестило с тенями . Сидел бы не вякал, тупая школота. С какой пизды тупой вы все повылазили? Уж не спизды-ли бузовой?
>>939474 Так, профи итт, что тут? Братан, я конечно в основном генерю олдскул фото и поднаторел на этом, но у тебя реально перебор. Хуй пойми что с волосами. Там будто их приклеили в фотошопе и края размазали. олд-дизайнер 100 лет в фотошопе и нейронках
В очередной раз одебилевшие дмд-дауны постят кал и потом всему треду доказывают, что это не говно, это они так видят. Хотя бы пощупайте нормальную генерацию, твари необучаемые. Не смейте кому-то что-то пояснять, вы самая низшая категория. Даже у домохозяйки, которая в Bing генерит больше скилла, чем у дмдшника.
Вообще чёт в голосину проорал, осознав как говноделы из /б трясутся старясь отшлифовать свой кал в онлайн генераторах, жаждая внимания и одобрения от такой же школоты-битардов. Клепают 100 картинок в день, выбирают что-то там, в фотошопчике, лол, доводят. В то время как тут профи 40+ вальяжно юзают тред как сортир, высирая неудачный кал, который не жалко спалить быдлу. Залетухи приходят и их бомбит от этого. Как же так, почему никто картинки годные не выкладывает, сука это же разрыв шаблона.
>>939550 >Эта дрисня ебет пони с полпинка, не говоря уже про количество и вариативность концептов. Ну давай, сгенерируй мне скринкап аску, хочу посмотреть на результат.
>>939597 А эта хуйня появилась в 2024 и едва лучше NovelAI из 2022. А по пикам из треда выглядит даже хуже. Но тут большинство криворукие, поэтому делаю поблажку на это.
>>939694 Вы Мне личный тред создали? Для Меня? Хвалю! Аноны сами пишут, что постят тут только говно. Безусловно верим, что они генерят не только говно. Несомненно, они могут и генерить не говно.
>>939726 Тоже не понял хайпа, в чем плюсы? Там на бурушных тегах на дефолтных пони моделях есть просто вагон и тележка калцептов, не говоря уже о лорах, кто там чего не может?
>>939785 Я пока понял только то, что нубай может в ампутанток и теоретически в гуро (последнего не видел). Плюс, видимо, он побольше аниме персонажей знает и кое-каких авторов-рисовак, которых автор пони тщательно вырезал из "этических" соображений.
>>939726 >Не понял, в чем проблема такое в понях делать, я там че только не делал со всякой динамикой. Пони не умеет в консистентную не кринжовую динамику потому что астралох чарактершиты не использовал, нубай умеет, потому что там не резали датасет буры и е621.
Ребята, кто-нибудь знает кто из этих двух потребляет меньше видеопамяти? Фордж или комфи? Я запускаю 8-битный флюкс на 16гб врам и оно кое как влезает во всю видеопамять, приходится перезагружаться иногда, чтобы оно генерило адекватно.
>>939875 >Что по ссылкам? лоры >Какие-то клипы, впердиксы нужно подрубать для нормальной работы? нет, впред ток у промежуточной модели нубая есть > Скинь плиз простое воркфлоу. там базовое воркфлоу, ток семплер с шедулей под себя подобрать, ну кроме векторайзед, там лцм на цфг 2-4
>>939895 > кто-нибудь знает кто из этих двух потребляет меньше видеопамяти? Фордж или комфи? форж на градио как вебморде работает и от этого сосет жопу комфи может спокойно хоть на цопе запускать уи в 20 фпс и не трогать карту вообще
Аноны, поясните за сэмплеры, шедулеры, dmd2 и ligthning модели. Значит, генерил пикчи из sdxl модели dpm++ 3m сэмплером и каррас шедулером и всё ок. Попробовад sdxl ligthning модель и ничего не завелось. Менял шедулер, сэмплер и всё стало ок. Euler ancestral cfg pp выдал результат близкий к обычной sdxl. Lcm тоже неплох.
Поясните, как в них ориентироваться и что для чего предназначен? Модель было lustify 4 и lustify 4 dmd2
>>939900 >поясните за сэмплеры ну кароч преимущественно надо избегать мультистеп семплеры, они с большинством убыстрялочных лор не работают и жарят
лично я использую чтото из этого euler euler a res sonar euler dy Kohaku RK LCM (под дефолт дмд2) TCD (это как лцм ток тцд)
>шедулеры щедулер это нисходящая кривая поставки шума зависящая от стартовой сигма поинт, может быть линейно и гиперболической, долго расписывать проще граф ноду подключить к выходу шедулера и картинки посмотреть
>dmd2 консистенси траектори убыстрялочная лора дистиллят под lcm 1 cf и simple шедулер
>ligthning еще один но старый дистиллят, в основной под эйлер семплер, страдает от отсутствия деталей, у создателей лайтнинга есть hyper новее, он лутше
>как в них ориентироваться и что для чего предназначен? ну семплеры разделяются по семействам и поколениям, поэтому можешь попросить гпт расписать и все поймешь, в основном у них различие в скорости и консистенции/следованию промту, ну то есть есть ультраконсист RK, который считается долго, есть быстрый лцм который без дмд сосёт, но считается быстро, вооот
>>937578 (OP) >Альтернатива - еще поддерживаемый форк ранее популярного WebUI от Automatic1111 (R.I.P) последний раз заглядывал в ваш тред год назад. Поясните, а что значит эта строка? С автоматиком что-то случилось? А то у меня как раз вопрос по нему. У меня почему-то лора грузится в рам вместо врама и сраный автоматик падает по ООМ.
>>939913 >Поясните, а что значит эта строка? С автоматиком что-то случилось? забил болт на опенсурс деятельность с лета
>У меня почему-то лора грузится в рам вместо врама и сраный автоматик падает по ООМ. ну если у тебя оом от лоры то у тебя видимо 8 гигов карта и старые дров 2023 года до введения врам шаринга кожанкой а так енжой автоматик, типичное говно для него для говнокарт, там еще мемори ликинг от градиоговна прогрессирует со временем, перекатывайся в комфи, там здоровье и благополучие
>>939915 >забил болт на опенсурс деятельность с лета вот пидорас >у тебя видимо 8 гигов карта у меня 8 гигов рам. А врам у меня 96 блять. у меня 4 tesla p40. эта залупа при загрузке лоры сжирает рам полностью. До загрузки там 1.5 гб занято, а после - все 8. Приходится убивать процесс. сейчас попробую комфи.
Кто-нибудь из вас тренировал лоры? Очень хочется вкатиться и попробовать. Только все гайды, которые я видел на ютубе, очень простые. Обычно тренируют на внешность, а конкретнее лицо кого-то там. Мне же интересно, тренировать на стиль, отдыльный концепт, или какие-то детали, типа оружия или одежды. Так вот, может кто подскажет хорошие гайды?
>>939958 Модели временно хранятся в рамке, такто можно отключить чтобы полностью выгружало, в комфе. Ну и в комые кнопка высвобожденич всеготчего угодно есть.
>>939847 Любопытства ради попробовал данную модель, суть ясна, действительно (хоть и история исключительно анимешная), лучше передается движение, нормально работают motion lines, speed lines, даже реагирует на какие то теги от себя, вне рамок бурушных.
>>939916 > А врам у меня 96 блять. >у меня 4 tesla p40. И хули? Это тебе не генерация текстов. Лучше бы у тебя была 1 карточка на 24 кекобайт, чем 4 ископаемых говнотеслы на 96
>>939958 в самом процессе генерации - не нужна. это кэш моделей, загруженных в процессе работы, пространство для объединения лоры с моделью, квантизации или изменения точности модели и так далее. даже на 16 гб несколько одновременно подключенных моделей с лорами и различными контролнетами еле ворочаются. 32 более-менее, 64 уже нормально. с малым количеством озу будут часто юзаться SSD\HDD с длительным временем ожидания загрузки. в то время как скорость обмена между озу и видеокартой составляет 32 гбайт\с на pcie 4.0 и 64 гбайт\с на 5.0
>>940035 это какая-то хуйня. Я еще раз обрисую поведение. Я гружу модель которая весит >>940046 чё ты смеёшься, собака сутулая? Я для ллм эту сборку юзаю. А генерация картинок - побочная активность. иди передж зеркалом над уродом в нём посмейся.
>>940034 >96 гб врам >8 гб рам >РЯЯЯ ну а чего ты хотел. а ещё 24 гб на одной p40 можно смело делить на 2 по эффективности. т.к. этот мамонт не умеет в fp16, только 32.
>>940052 >>940035 Не дописал. Ну так вот. Я гружу модель которая весит 6.5 гб. Ни в каком кеше в рам она не хранится, потому что когда модель полностью загружена в теслу - утилизация рам на автоматике 1.5 гб, а в комфи - 3.5 гб. потом я гружу ложу которая весит меньше 300 мб и у меня съедается вся рам. Это никакой не кэш, это утечка памяти. >>940060 чел, завали ебальник
>>940064 >Это никакой не кэш, это утечка памяти. модель 6.5 гб хочет пойти в озу, чтобы объединиться с лорой и вернуться на видеокарту. стучится туда, а там всего 8 гб, часть из которых уже занята. вот хохотач-то.
>>940070 Можт ты тупой? Попробуй аргумент --gpu-only Store and run everything (text encoders/CLIP models, etc... on the GPU)
Вовторых попробуй эти ноды с форс выставлением видяхи https://github.com/neuratech-ai/ComfyUI-MultiGPU , можешь вообще по разным картам раскидать, у тебя все равно теслакал фп16->фп32->фп16 дрочит и уполовинивает врам
>>940080 Втретьих помимо гпу онли есть --highvram By default models will be unloaded to CPU memory after being used. This option keeps them in GPU memory.
>>940086 ёбаный. рот. этого. казино. блять, в аргументах есть --lowram и я предполагал, что нужно использовать ЕЁ, а не --highvram Спасибо, с этим ключем она не заООМ-илась
>>940121 тегируешь датасет, используешь уникальный токен в каждом кепчер файле дополнительно для вызова концепта на основе датасета, тренируешь с настройками в зависимости от того сколько у тебя врам: 1. халявный быстрый метод если у тебя 12+ гигов это тренировать фул модель а потом вычесть ликорис из нее 2. менее халявный тренить чисто лору через какойнибудь вантрейнер и терпеть факапы если настройки неправильно подобрал
Есть лора с анимешной рисовкой, я хочу сделать максимально похожую на фото генерацию. Такое получилось на пониреальзме. Можно ли выжать из нее что-то лучшее или надо искать другую модель? Очевидные косяки типо кривых коленей и фона не важны, здесь просто не правил ничего.
чуваки у меня нихуя вообще не получается. Что блять я делаю не так? первый пик - образек на который я равняюсь. Его сгенерировал какой-то анон по меой просьбе в /b. Второй пик - то говно, что выходит у меня.
>>940243 Потому что ты не читал, как пользоваться моделью. Особенно вот эту строчку:
>Add 3d to negs if you want a more traditional anime style. Quality tags should be same as ponyv6, but feel free to experiment: "score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, source_anime, BREAK"
>>940158 У меня почему-то моментально вылетает панель запуска при инсталле, чето красным пишет но я не успеваю увидеть что там. У меня есть питон, но он 3.11, это может быть проблемой?
Но если прямо нужно кровь из носу лору, то я бы обратил внимание на https://b-lora.github.io/B-LoRA/ один из самых интересных методов наверно и требует нихуя времени и нихуя датасета, плюс сепарировать контент и стиль можно https://github.com/liusida/ComfyUI-B-LoRA Я хуй знает почему билора такая непопулярная и все по старинке тренят лоры.
Эм-эм господа двачане, а как блять грамотно составить inpaint на фордже, чтобы буквально просто сделать из картинки где тянка задирает футболку картинку, где футболка не задрана? Постоянно получаю какую-то хуйню
>>940426 > Чтобы обучить нормальную обычную лору надо 60-100 часов беспрерывного просчета Хуйню несёшь не по делу. Лоры действительно бай дезайн тренируются через жопу, фокусируя большинство связей в нескольких слоях, конкретно на xl архитектуре. B-lora просто абузит эту хуйню, выкидывая остальные слои со слабыми связями и фокусируясь на этих нескольких. В тт кто то лекцию на очень похожую тему затухания скинул >>936423 → Тюнить чекпоинт дороже по врамке будет, ну и вообще больше телодвижений, с последующим гемором извлечения, но если оверфитнуть на 15 картинках как в том говногайде от поехавшего турка и потом извлечь в мелкий ранг, то точность передачи конечно будет выше и оверфит даже скорее всего пропадёт от сжатия
профессиональные, это не значит особенно хорошие или вообще хорошие, это значит челик на них деньги рубит и там могут быть не картинки, а шумы, куски дизайна, и т.д. нейронка всё может.
>>940489 >ну тогда ты странный. листва? Ебать в голове насрано. Чел нашёл новую игрушку/хобби, генерирует картинки себе в кайф, а его уже в лиственники определили. Как это вообще может быть связано? У меня у самого больше половины терабайта всяких нейроувеселений, генерирую всякие арты и прочее (и порнушку для дрочки, конечно же, тоже), иногда тренирую лоры и т.д. И со своей тян ебаться это ну вообще никак не мешает почему то.
>>940489 >деньги рубит дальше не читал, чет я так и понял сразу. следовательно тратить время и деньги на свое хобби - быть дебилом
ну и у кого в голове насрано? как там в гонке за успешным успехом? надеюсь не сильно в минус уходишь, пока отвечаешь мне в тредике, а то ведь время - деньги
В общем этот люстранубай походу сд3.5/флюс в мире маняме. Даже текст сам генерит. Даже истории придумывать не надо. Я не удивлюсь если там что-то связанное, если перевести.
>>940595 >>940615 Сейчас попыхтел с негативами и промптом и что-то не смог выдавить подобие иллюстрации к старым книгам. Даже чёт олдскул диснеевский не осилил. Если кто сможет - поделитесь плиз.
>>940648 Да, в общем нашёл годноту от гения - мерж люстры и нубая. Вышел вчера. Работает дмд2 и спо на высоких кфг и низких шагах с любым семплером. Теперь смело можно удалять любые стилевые лора, модели, пони и т.п. https://civitai.com/models/838773?modelVersionId=1025999 Смержено: Illustrious-XL-v0.1 NoobAI-XL (NAI-XL) Epsilon-pred 1.0-version NoobAI-XL (NAI-XL) Epsilon-pred 0.75-version NoobAI-XL (NAI-XL) Epsilon-pred 0.5-version Obsession (Illustrious-XL) v2.0 LibrasIllustriousXL v3.0 Addillustri v4.0 Raehoshi illust XL v2.0
>>940459 такие вопросы: 1) насколько будет лучше качество генераций если я в кохе той же самой будут тренить чекпоинт (SDXL) а не лору? 2) в чём смысл regularization images? почему кто-то их использует а кто-то нет? 3) какие требования для ПК нужны для тренировки чекпоинта SD1.5 и SDXL?
> Illustrious-XL-v0.1 > NoobAI-XL (NAI-XL) Epsilon-pred 1.0-version > NoobAI-XL (NAI-XL) Epsilon-pred 0.75-version > NoobAI-XL (NAI-XL) Epsilon-pred 0.5-version чего он вообще добиться хотел
>>940666 Я тоже мержи не уважаю, это у меня 2й, после другого его мержа сдхл, который юзал очень давно и он очень качественным оказался. Т.е. это явно не говнодел рандомный, а грамотный тип, не руби с плеча.
>>940249 а поясните ра разрешение генерации (которое получено не апскейлом, а непосредственно генерируемое). Я думал, что SD сетки обучены на 512х512, поэтому и должны по идее на таком разрешении давать наилучший результат? Я что-то упускаю?
>>940652 >Работает дмд2 и спо на высоких кфг и низких шагах с любым семплером Ну это видимо с твоей йоба дмд работает, с обычным выше 1 кфг разъеб. >>940677 сдхл 1024х1024
>>940680 >с твоей йоба дмд Не, я ту дмд2 анона итт не юзал, у меня обычные лора с сивитаи. Вот этот пик спо+дмд2 ойлер_а ддим_юниформ кфг 2б 12 шагов и хайрезфикс 6 шагов с теми же параметрами.
>>940659 > 1) насколько будет лучше качество генераций если я в кохе той же самой будут тренить чекпоинт (SDXL) а не лору? Этого тебе никто не скажет, всё будет зависеть конкретно от датасета, какие то идеально лягут на лору и будут выглядеть даже лучше оригинала, каким то ты заебёшься параметры подбирать, чтобы было эквивалентно полному чекпоинту. Но полный, как правило, должен быть всегда математически точнее, если прямо хочется попердолиться вот эту шизохуйню читай https://rentry.org/lora-is-not-a-finetune > 2) в чём смысл regularization images? В том, чтобы наконец забыть и забить на них, они воюют во время тренировки в другую сторону с помощью пикч сгенерённых моделью, на которой ты тренишь, в теории помогая более мягко втренить что ты там пытаешься добавить, это старая и не нужная хуйня и лучше обратить внимание на всякие dpo или spo > 3) какие требования для ПК нужны для тренировки чекпоинта SD1.5 и SDXL? XL 8 гигов хватит с фп8 юнет онли для тренировки лоры, это компромисс, но в целом рабочий, про чекпоинт не знаю, в рентри пишется тоже про 8, но я не верю в эту хуйню особо, плюс там ещё придётся потерпеть на адафакторе, что уж легче будет лору сделать с такими вводными. 1.5 давно не юзал и не тренил, уже небось и в 4 влезет если захотеть
как же люстрапенциль ебёт >masterpiece, best quality, 1girl, NikkeProfile, full body, checkered background, white background, zoom layer, copyright name, character name, english text, logo, holding weapon, holding gun, assault rifle, on one knee, looking to the side, nishikigi chisato, red eyes, short hair, hair ribbon, two-tone dress, pleated dress, red dress, grey dress, neck ribbon, long sleeves, collared shirt, black kneehighs,
>>940711 ебет анатомию? что ебет то? или ты радугой кончил от того, что тебе нарисовали два аниме человечка похожих, один большой и полупрозрачный, а второй поменьше и непрозрачный
ну прям как в аниме в заставке, на котором модель и обучалась, да? ух как же ябет
а меня разъебало с очередного убер ствола, которые генерятся в сд
>>940715 Я объективен просто. Это с учётом того, что я не анимедаун и не делаю такие картинки, но для эксперимента я затестил и реально охренел. Ну во-первых текст может полноценно, может оружие держать, понимает вообще все стили по ощущениям, даже какую-то гачакал распознал. Промпт я спиздил с сивитаи и думал это фейк на картинке, оказалось нет. А анатомию да, разъёбывает часто. 3 ноги и 6 пальцев это обычное дело у люстоподобия. Ну а вообще еси сложить минусы и плюсы и то что я знаю о возможностях, то - ебёт. Правда пикча выше дмд2+спо ещё, для честности скажем.
>>940715 >ну прям как в аниме в заставке, на котором модель и обучалась, да? Кстати об этом. Понятное дело для понимания стиля модели нужны примеры и когда ты обращаешься к стилю - ты ожидаешь увидеть похожее, не так ли? На от он и стиь. Вот только то, что на этой картине не может ни одна модель, даже флюс, даже сд3.5, даже пони с лора.
>>940721 >я объективен >текст может, хотя выше выяснили, что не может, да и на твоем пике видно , что не может >может оружие держать, ведь другие модели не могу нагенерить несуществующее оружие в руках, только эта аниме модель >понимает стили по ОБЪЕКТИВНЫМ ощущениям, правда не знает что такое sumi-e >часто разъебывает анатомию, да, бывает три ноги, бывают косяки полторахи, бывает промптить нужно через очко, но если судить объективно, то ебет все начиная от кандинского заканчивая миджорни
аргументы и факты, пожалуй, и правда не на моей стороне туше
>>940727 Объективно, да. Насчёт того что ты написал ты не учитываешь факта, что модель нишевая, для аниме, там буквально теги из бору. Сумиё это и т.п. явно не аниме. Промптинга через очко не заметил. Хайрезфикс латентом фиксит 90% косяков. Стили связанные с аниме очевидно же, а не живопись шишкина, лол.
>>940725 я чет не совсем понял а если б ее на кал обучили хотя уже, ты бы тоже говорил, что модель ебет, ведь она рисует самое реалистичное говно еще и текст из него выкладывает
что вообще в твоем понимании хорошая модель? ты точно не анимешник там?
>>940735 Нельзя говорить всратая анатомия, это неуважение к внешности моделей. Все индивидуальны со своими особенностями. Поддельный идеал красоты навязывается твоим социальным паттерном и он явно искажён.
Попробовал ToriGate 03. Запустил через tramsformers в пайчарме. Надеюсь их можно настроить, чтобы не выгружало модель из памяти после окончания работы скрипта (ну или хотя бы пока идет цикл по картинкам в папке).
Получается такое. Получше llava, но косяки все равно есть. Придется делать обработку текста, чтобы выковыривать неправильные имена персов и некоторые мусорные слова. Вот пара результатов: Пик2: { "character": "The image features a girl with short purple hair styled in a ponytail, adorned with cat ears. She has vibrant green eyes and a gentle smile. Her outfit is a maid costume, consisting of a black dress with a white apron and frills, a black ribbon tied at the neck, and a matching black bow on her head. She wears white thigh-high stockings and wrist cuffs, adding to the maid aesthetic. Her pose is playful, with her hands raised in a paw-like gesture, emphasizing her cat-like features.", "background": "The background shows a bright, sunny day with a clear blue sky and fluffy clouds. There are large windows that allow natural light to fill the room, and the girl is sitting on a couch with colorful pillows and a few red roses scattered around.", "texts": null, "atmosphere": "The atmosphere is cheerful and playful, with a sense of warmth and coziness. The bright colors and the girl's friendly expression contribute to a lively and inviting scene." }
Пик3: { "character": "The image features a girl with long brown hair and green eyes, dressed in a cosplay outfit inspired by the character Ayanami Rei from 'Neon Genesis Evangelion'. She is wearing a black cabbie hat with a red and white emblem, a red jacket with white stripes on the sleeves, and tight red bodysuit that accentuates her figure. She has red lipstick on and is wearing red gloves. Her pose is confident, with one hand on her hip and the other hand raised, index finger pointing upwards. She has a serious expression on her face.", "background": "The background is a dark, industrial setting with stairs and a wall. The lighting is dim, creating a dramatic contrast with the character's bright outfit.", "texts": "None", "atmosphere": "The overall atmosphere of the image is intense and dramatic, with a focus on the character's confident and serious demeanor. The cosplay and setting suggest a theme of science fiction and action." }
>>940803 > Попробовал ToriGate 03 > tramsformers в пайчарме. Надеюсь их можно настроить, чтобы не выгружало модель из памяти после окончания работы скрипта Есть же костыли для пакетной обработки, хоть 1000пикч из папки обкапчует. И для ллавы, и для идефикса, и для жойкапчи - чем хочешь делай.
>>940820 Ну joycaption тоже самое, но с другой моделью, а второе хз. Я пока просто хотел попробовать эту модель, сейчас буду смотреть как батч обработать
>>940882 Локальная языковая модель, как обычная ллм запускается на компе в угабуге(софт для ллм), а в комфи(софт для генерации картинок) нода уже туда посылает запросы ей и получает ответ, как в чатике.
>>940808 >Каких авторов писать в нубаи, чтобы было супер-качество, а не дженерик плоское аниме? там до пизды хуйдожников, что всякие wlop, что топ авторы пиксива что какой-нибудь рандом тег типа yello в качестве артиста (я даже не ебу кто это, хотел написать yellow, а мне стиль с ватермаркой прихуячило через yello)
>>940923 покрутил примеры картинок от даунов с цивита, там подобного стайла и куолити как на пикчах нет вообще, пиздарики там криворучки сидят с плоским говном
>>940457 Жаль, никто ничего годного не предложил. Знаю, что flux из коробки умеет в довольно хороший пиксельарт и может спрайты делать, если грамотно промпт составить.
>>940934 Слишком большое разрешение изображения. Потому две пары рук и удлиненное тело. Ставь: 832х1216 (В пределах 1к)
И тебе уже говорили! Поставь скоры в промпте! Пони без них не может нормально. Вот эту хрень суй в начале промпта: "score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up"
>>940936 попробовал. вот что получается с денойз 1.0 я пробовал разные сиды - всегда подобное вытянутое нечно получается. Как кстати в комфи задать рандомный сид? >>940939 я поставил такие же размеры, какие у оригинального изображения. Получается оригинальное заапскейлено? Попробую поставить разрешение поменьше... >скоры да я не шарю, что за скоры! Что они делают? >>940940 что это?
>>940939 попробовал поставить 758х1024 и действительно тело стало пропорциональным хотя бы... Но это кловер с черными волосами, а не алекс... и картинка какая-то перенасыщенная цветом. Я предположил, что надо снизить количество шагов с 25 до 20 и результт - 2 пик. Как будто не изменилось ничего в насыщенности.
а ещё - как мне запускать только какую-то выбранную цепочку пайплайна? Если я например две разных построю - как мне контролировать их по отдельности?
>>940947 Ну поменяй разрешение empty latent image, то что у тебя больше стандартного. Посмотри какие разрешения можно пихать в SDXL модели >Получается оригинальное заапскейлено? Да
>>940947 >да я не шарю, что за скоры! Что они делают? ну вообще это теги качества для поней, а у тебя судя по пикче аутизмокал который понибейсд score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up >что это? выпрямлялка генов если у тебя пикчи не в размер обучения с артефактиками типа многорук длиннохуй, ставь ноды https://github.com/nullquant/ComfyUI-BrushNet и там есть RAUNet >>940952 >попробовал поставить 758х1024 и действительно тело стало пропорциональным хотя бы... ну это почти дефолт размер, 768 по стороне минимум для сдхл >а ещё - как мне запускать только какую-то выбранную цепочку пайплайна? Если я например две разных построю - как мне контролировать их по отдельности? каждую в отдельную группу кидаешь, отдельно нодой на байпас груп отсюда https://github.com/rgthree/rgthree-comfy управляешь
>>940955 >Посмотри какие разрешения можно пихать в SDXL модели а, погоди, там несколько конкретных разрешений, которые подходят для sdxl? Я думал нужно брать просто по размерам чтобы умещалось в 1024х1024. А где это посмотреть можно?
>>940959 >там несколько конкретных разрешений, которые подходят для sdxl? базовое разрешение сдхл это 1024 по стороне, такой был датасет >Я думал нужно брать просто по размерам чтобы умещалось в 1024х1024. не совсем так, можно и выше/ниже но не во всех случаях, правила по размерам жеские ток наверно эти - чтобы на 64 делилось ровно, не было меньше 768 по стороне, а остальное правится мокрописями >А где это посмотреть можно? гдето была картинка на каких размерах конкретно файнтюнилась пони, я не найду щас, там и квадраты, и вертикаль и горизонталь в разных размерах
>>940975 я уже загуглил и нашел подходящие разрешения, спасибо >>940958 >rgthree-comfy кажется понял, как этим управлять
ну вот я добавил score_9 - не поменялось вообще ничего. Как сделать оригинальный пик-то...? помогите... есть ряд проблем: 1. не та прическа 2. brown_eyes в промте проигнорирован, как и black_hair 3. перенасыщенные цвета. Оригинал - как будто из мультика взят, у меня - очевидная нейронка 4. линии, очерчивающие контур персонажа у оригинала намного тоньше
>>940983 либо у тебя либо у меня поломались тензоры от частой смены моделек и инжектов всякого кала, учитывая что у меня есть вот такой артефактыч то видимо у меня
>>940979 >ну вот я добавил score_9 - не поменялось вообще ничего. это кволититеги чел, они не могут не поменять ничего... >Как сделать оригинальный пик-то...? Если у тебя нет доступа к ориг промту, настройкам семплера, сиду, возможной стилевой лоре и модели то никак ориг не достичь через говнопромптинг - бери ipadapter и пизди стиль с изначальной картинки, заебал. Если прям копию делать - еще и контролнет прихуярь. >1. не та прическа >2. brown_eyes в промте проигнорирован, как и black_hair Изучаем как работает сдхл и больше не спрашиваем почему промт не 100% гайдед. >3. перенасыщенные цвета. Оригинал - как будто из мультика взят, у меня - очевидная нейронка >4. линии, очерчивающие контур персонажа у оригинала намного тоньше Ипадаптер пофиксит всё.
>>940987 У меня ласт комфи, ну конечно может что-то подшаманили в поставке шума (даже банально шум с гпу и шум с цпу дает разные выходные данные), но я сомневаюсь. Скорее у меня пизданулось в какойто момент когда я ликорис тестил и там матрицы не сошлись и всю командную строку еррорами засрало.
Возможно ли в автоматике сделать xyz plot с всеми шагами генерации + с негативными + с позитивом до применения cfg? Еще бы и подсветку диффа маской чтобы сразу видно было что откуда пришло. Но это я опять дохуя хочу, да?
>>940993 >Изучаем как работает сдхл и больше не спрашиваем почему промт не 100% гайдед. нет, я явно что-то делаю не так. Анон по моей просьбе насоздавал много картинок с Алекс и все были годнотой. И у всех была корректная прическа и корректный цвет глаз. Это критичные вещи - это детали персонажа. Пока что мой лучший результат - черноволосая кловер... мда... А вот то, что создал он (2, 3, 4 пик). Я хочу научитсья так же. Это точно возможно, я же видел.
>>941022 Тебе сказали полный список скоров добавить - ты неохотно добавил только скор 9. У тебя в промте нет триггеров твоей лоры ебучей (пикрелейтед). Которые как раз отвечают за стилистику как в мульте. И вполне вероятно, что тот анон тебя наебал и на самом деле он использовал не только эту лору, но ещё и лору на персонажа, на саму эту Алекс, типа такой: https://civitai.com/models/695625/totally-spies-alex
>>941042 >Тебе сказали полный список скоров добавить - ты неохотно добавил только скор 9. что блять? Их все что ли надо добавлять? Я думал это взаимоисключающие теги. Что это за хрень, что они делают - эти теги-то, может кто-нибудь пояснить? >в промте нет триггеров твоей лоры ебучей да блять, откуда мне знать, что надо добавлять триггеры для лоры? У неё уже есть коэффициенты какие-то, по которым она задействуется. Нахуй ей еще какие-то триггеры?
>>941007 >>941005 >>941004 Кароче, обновил зависимости, по итогу рес моментум как делал каждый раз типа тоже самое изображение но чучуть по разному так и делает. Другие легаси семплеры стабильны и выдают всегда одно и то же. Хуй его знает почему так. Нажо другие моментумы чекнуть.
>>941060 >Что это за хрень, что они делают - эти теги-то, может кто-нибудь пояснить? Повышают качество, заставляют ориентироваться на более высоко оцененные пикчи. Это заместо стандартного мастерпис, бест квалити и пр.
>да блять, откуда мне знать, что надо добавлять триггеры для лоры? У неё уже есть коэффициенты какие-то, по которым она задействуется. Нахуй ей еще какие-то триггеры? Ну вот нужны, многие лоры так натренированы, что дают эффект только при использовании триггера. Обращай на это внимание. И ещё всегда полезно проверять, че за промты у автора лоры в примерах. Особенно если у тебя с наскока нужного эффекта не выходит.
>>941089 ближе, но всё ещё не то... прическа долдна быть округлая... Придется ловить наверное анона, который делал оригиналы, да где ж его в /b поймаешь... Если только в нейрогенеративном треде... Всем спасибо за помощь, сегодня проделан хороший прогресс, завтра скорее всего снова приду с ньюфажными вопросами.
Кароче, напердолил себе апскейлер на RTX, апскейлит картиночку за 4 сек Всем у кого RTX карты рекомендую, правда с нестандартными разрешениями почемуто не хочет.
>>941138 > это говно надо на каждую модель На каждую модель
>на каждую лору Лоры не поддерживаются же
>на каждое разрезшение преобразовывать Ну апскейлеры нет, а для моделей есть динамическое преообразование с поддержкой от такого то до такого разрешения, какой промежуток укажешь
>>941142 Поставил, попробую >>941134 >>941125 Анон, поделись апскейлом в рт и нубаем ещё бы воркфлоу чтоб получать такие же пикчи на нубаи или намёкни что для этого надо, если не трудно.
>>942020 > Почему не похуй на лецензию? Нет нормальной лицензии - нет влошений в файнтюны. Никто забесплатно обычно не работает, вон астралайт сделал пони и спокойно продает подписку в дискорде на гены.
> У SD 3.5 люди норм начали получаться? SD-шку же жестко лоботомировали, чёб никогда в обнажёнку не умела. В 3.5 аккуратно занулили половые органы и чучуть соски, так что ты можешь прописать нюд и получить нюд, но с софтовой цензурой. Даже токен ass есть и сетка понимает что такое ass, в отличие от флюха того же где чтобв человека со спины генерить надо from back писать. Кароче лучше все стало и быстрее.
Сап, не ли видео короткого как делать свои лоры в аутомтик111 ну прям изи пизди без всего этого профессорского на 10 томов? Чтоб по порядку чел вбивал в автоматик что нужно, а я бы за ним повторял. Мне бы понюхать просто, чтоб втянуться можно было. Пока сам что-то не сгенирирую не интересно читать лекции.
======================================
Предыдущий тред https://arhivach.top/?tags=13840
------------------------------------------
схожий тематический тред
- аниме-тред
========================
Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях.
Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion.
Полный функционал в локальной установке (см. ниже)
Пробный онлайн-генератор Stable Diffusion: https://dezgo.com/txt2img
Пробные онлайн-генераторы Flux:
https://huggingface.co/black-forest-labs
https://fluxpro.art/
⚠️ Официальные модели stable diffusion от Stability AI значительно отстают по качеству от кастомных моделей (см. civitai ниже).
🔞 Без цензуры и полный функци_анал: только ПК-версия
===========================================
🖥УСТАНОВКА НА ПК
Портативная версия основного WebUI от Comfy (запуск с одного из run.bat файлов)
https://github.com/comfyanonymous/ComfyUI/releases
Примерные workflow для ComfyUI (можно загружать напрямую из картинок)
https://comfyanonymous.github.io/ComfyUI_examples/
------------------------------------------
Альтернатива - еще поддерживаемый форк ранее популярного WebUI от Automatic1111 (R.I.P)
https://github.com/lllyasviel/stable-diffusion-webui-forge?tab=readme-ov-file
------------------------------------------
👉 Для новичков - простой в работе WebUI Fooocus
https://github.com/lllyasviel/Fooocus?tab=readme-ov-file#download
------------------------------------------
Для тех, у кого видеокарта не тянет - оптимизированная генерация на ЦПУ
https://github.com/rupeshs/fastsdcpu
===========================================
📚 РАЗЛИЧНЫЕ МОДЕЛИ (И МНОГОЕ ДРУГОЕ) 👇
https://civitai.com/
https://huggingface.co/
------------------------------------------
📊 ПАРАМЕТРЫ И НАСТРОЙКИ ГЕНЕРАЦИИ 👇
https://teletype.in/@stablediffusion/samplers_steps
===========================================
🎨 ГАЙД ПО СОСТАВЛЕНИЮ ЗАПРОСА, СТИЛИ
https://teletype.in/@stablediffusion/artists_for_prompts
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols
Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her
------------------------------------------
♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇
https://supagruen.github.io/StableDiffusion-CheatSheet/
https://www.artvy.ai/styles
------------------------------------------
💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ
https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td
==========================================
🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇
https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora
https://civitai.com/models/train