24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Stable Diffusion Flux тред X+124 ====================================== Предыдущий тред >>924550 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожий тематический тред - аниме-тред >>916025 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
натвис 2.5 против 1. Лучше следует промту, все dressed, сиськи мнут только свои, более skinny, все сиды более однородны. Контраста больше и четкости.
breathtaking (lewd smirk:1.3), diverse appearance, 18yo skinny, medium breasts, (squeezing breasts:1.5), 2girls, random color hair twintail and tail, random pale color dress, dressed, bra, tight (white stockings), cute face, standing, indoor, intricate detail, sunlight . award-winning, professional, highly detailed
Допустим я сгенерировал картинку, мне все на ней понравилось, но вот вместо нормальной руки там получились кривые ветки с 8 пальцами, ктоторые торчат в разные стороны. Мои действия?
В какой модели лучше всего генерировать нейровсратых мутантов с пятью руками восемью ногами? Говорят полтораха на хайрезе с этим хорошо справляется, но может есть что лучше?
шедулер надо карась и степсов где то 70. А лучше подключи лору дмд2, семплер lcm, шедулер ддим_униформ\сгм_униформ, 8 степс, кфг 1. Можешь еще хайрезфикс сделать с простым апскейлом латента в 1.3 и денойсом 0.3 или 1.5 и 0.5, сам смотри.
>>930065 Как же натвиз ебёт своих юзеров Как уже написали, можешь поступить как все криворучки - юзать дмд, обтекая, не в силах ничего сгенерить на нормальной xl.
>>930134 Там только на сиськи запрет, всё остальное разрешено включая баб в стрингах. Селебов любых сделаешь, а вот сдкал тебе двух селебов ни одна локалка не сгенит.
>>929157 → >wd14 не подходит? Спасибо Анон, твой пост натолкнул меня на поиски вижен моделей и я нашел florence2, он отлично закрывает мое потребности.
>>930140 Я на форчане и не такое видел, хочешь сказать у них "секретные" военные технологии? Я готов завтра пойти и купить 5x RTx 4090, но кто мне настроит
>>930200 >обосрался Пока в треде не будет сд пика который похож на фото, где трамп и харис просто пожимают руки и смотрят в камеру, все эти попуки с кривой сиськой и пиздой ничего не стоят, такой хлам и полтораха генерила.
Очередной вопрос про раздевание готовых.раньше делали через инпейт. Сейчас же можно наложить маску через сегментацию по одежде. Нужна сейчас инпейт модель? Как вообще в 2024 выглядит воркфлоу по раздеванию?
>>930295 Такто нет, но все зависит от задач, в любых моделях (кроме тех что жестко натренены на -2 слой) последний слой содержит знания о мелких объектах и максимальную точность (представь что каждый слой клипа это буквально луковица уровня "планета - страна - область - город - улица - дом - комната - лоли")
Ебучий кривооукий инсектинойд кубик, автор Ипадптера плюс. Я с его первым творением ебался 5 дней. Сегодня решил установить инстант айди, а тут такое же говно. Нихуя не работает, черные экраны срет. Хорошо, чт оч этого выблядка по аватарке узнал на гихабе. Сразу полез в код, и да там те же ошибки. Какой же он пидор кривооукий. Пиздец я уже прыщами покрывают от этого питона.
>>930261 >А голое тело лучше брушнетом рисовать? Голое тело базируется на самой сдхл модельке которую ты выберешь, а инпеинт модели с ней работают каждый со своим уникальным результатом
>>930310 >В каких задачах может потребоватся клип скип? ну допустим концептные параметры детей педофобы, спок на реалистиках содержатся на последнем 1 слое обычно, если тебе ну вообще нужно чтобы не учитывало эти концепты - используешь 2 слой или допустим детализация кожи тоже на 1 слое, если тебе ретушить ебальник, то чтобы не насрать рытвинами и прыщами тоже работаешь на слое 2
>>930468 У меня нет аккаунта гитхаб, лол. В целом у него написано правильно, просто он не учел в своем коде, что некоторые фреймворки не поддерживаются в половинчатом режиме. Что их надо запускать в фл32. Он тупо написал >Ну короче если ты стартанул в 16, весь код работает в 16, если стартанул в 32, то ебашим в 32. Я запускаю в 16, но вот конкретно в его узлах это не работает, потому что на моем говно железе не работает в 16. Короче это очень узкая тема и никто не будет говнокодить под таких, как я. Ну это один хуй не оправдывает его, как криворуког опидорса, труъ программист должен учитывать все. А то выходит, как в бугуртах про больницу и программистов.
>>930482 Так я правильно понял, что все говно которые не нужно на 2 слое. И клип скип -2 как раз его пропускает. А откуда лезут мутации эти? У меня вот так >-2 каждая вторая я генерация это лишние пальцы, сросшиеся руки и прочие уроды >Без клип скип все четко
https://civitai.com/models/880208?modelVersionId=985334 там кстати мердж турбы с ларджем, сохраняющим скорость турбы и умения ларджа, ну кароч как с флухом сделали, можно отдельно юнт скочать в фп8 где гуфы сука, в 12 кеков с т5 помещается
>>930472 >инпеинт модели с ней работают каждый со своим уникальным результатом Я отстал от реалий. Раньше было у моеделедедов 2 модели, обычная и инпейт. Сейчас же у всех одна модель. Надо самому инпейт модель делать? Или теперь она не нужна и можно на обычной модели все делать.
>>930504 >А откуда лезут мутации эти? если ты не пользуешься никакими консистенси выпрямителями типа dmd/pcm/хупер и тд и/или raunet/pag/mswmsa/sega/rave/slothful и/или подсети контролнетов/ипадаптеров, то тебе надо применить свои умения в подборе параметров генерации и промтинга чтобы доджить кривоватости
>Как она выпримялет, я думал она тупо ускоряет. Любой дистиллят это кароч прямое указание сетке на квалити в латенте, т.к. незначительные остальные шумные веса просто не учитываются. Дмд спокойно работает на 15-20 шагах, не нужно его насиловать 4 степами как указано. Если у тебя на дмд лезут мутанты, то это может быть проблема модели, проблема разрешения, проблема семплера (с дмд выбора особо нет, там их два работает с ним лцм и второй со сложным названием из репо еулер смеа ди), проблема шедулера. Че за модель то?
> Видимо надо осваивать раунет. Если ты не генеришь высокое разрешение лучше освой ипадаптер и атеншнеры.
>>930524 Натвис, лсм сгм юниформ, разрешение 768*1024, 8 шагов сфг 1 > атеншнеры что это? >ипадаптер Освоил только для стилей, как его еще использовать в данном контексте не понимаю >высокоре разрешение после еще раз прохожусь в 1.5 разрешении, косяки некоторые правятся + детализация появляется
>>930531 > Натвис, лсм сгм юниформ, разрешение 768*1024, 8 шагов сфг 1 Ну 8 это шумно и мыльно, у меня с натвисом никаких проблем нет на указанном разрешении, генерю по дефолту на 15 шагах. > > атеншнеры > что это? Это все во втором блоке прошлого поста начиная с раунета > >ипадаптер > Освоил только для стилей, как его еще использовать в данном контексте не понимаю Загрузи тела или фоточки и вместо стиля используй джва других метода
>>930524 >из репо еулер смеа ди Я нашел его, но не понимаю, как установить. Видимо уже поздно и мозг не работает. >>930531 >атеншнеры С этим разобрался и оно действительно работает.
>>930554 > >из репо еулер смеа ди > Я нашел его, но не понимаю, как установить. Видимо уже поздно и мозг не работает. Установить через комфи манагер просто сам репо с эйлером ди
Там баг в коде кстати, в ишуях в репо гуид как поправить kohaku семплер
>>930542 >Загрузи тела или фоточки и вместо стиля используй джва других метода Их тут дохрена, видимо придется все попробовать, что бы разобраться, что это такое. Спасибо за наводки.
⚡ CtrLoRA: Расширяемая и эффективная платформа для генерации управляемых изображений
Сперва обучается ControlNet с LORA, настроенный на конкретные задачи, с использованием крупномасштабного датасета.
Затем базовая сеть ControlNet может быть эффективно адаптирована к новым задачам с помощью новой LoRa, которой необходимо всего 1000 изображений и менее 1 часа на одном графическом процессоре.
Это сокращает количество параметров на 90%, что значительно упрощает создание новых условий управления.
Анончики.. Есть тут знатоки постобработки? Нужно понять, как получить такой же эффект "мягкость" "крахмальности" как на пике... Возможно это связано с лорой или моделью, но как мне кажется, это именно постобработка.. Очень хочу получить похожий стиль изображений... Прошу советов
Выпал из ИИ на полгода и перестал понимать, что происходит? Дайте краткий брифинг. - SDXL SD3, а в чем отличия? Что лучше использовать. - Что это за пони модели? На Au1111 можно запустить? - DMD2 постоянно вижу это в треде, что это такое?
И конечно, что лучше использовать SDXL,SD3,Flux? П.С. au1111 совсем перестал использоваться? Заранее спасибо Иач
Из Шварца сделать терминатора? То есть сохранить позу (контролнет?), мышцы, и лицо (инстантИД?) Но при этом сделать железным, как терминатор? То есть по факту должен получится позирующие терминатор с железным лицом Шварцнеггера.
>>930709 >В чем отличия На ХЛ много мокропись, на сд3 нихуя нет ещё >Пони Натренинная Модел ьна всякую йобу порнуху мультяшную, пойдет на каломатике (переходи на Комфи это база) >Дмд Лора, ускорялка.
аинанасы подскажите, как сделать рабочую флукс фп8 лору из фп16? нагенерил приличную лору, на фп16 модели всё збсь. но локально могу только в фп8. пробовал через коху конвертировать, не работает. чекпоинт норм из фп16 в фп8 конвнртируется, лора нерабочая. пробовал извлекать лору из чекпоинта, тоже не работает. есть какие варианты или надо сразу в фп8 делать?
Что сейчас по теме переодеваний в топах? Из старых методов помню: 1) Фокус + инпейнт + Image Prompt 2) Comfy + IPApapter и выделение по маске SAM детектор Может уже появились локальные решения из коробки, как для лиц с этим Fase Fusion?
>>930709 >au1111 совсем перестал использоваться? Есть форж. То же самое, но быстрее и с регулярными апдейтами. >>930709 >пони модели Массивный файнтюн xl, как была novelai на 1.5, самое большое количество вшитых концептов. >DMD2 Охуенно полезная штука для фото, если нужно сэкономить время + ты криворучка и не умеешь пользоваться XL без стабилизаторов. Абсолютно бесполезно для базовой пони, ухудшает генерацию до безобразия, даже сокращенное время генерации это не компенсирует. Разница колосальная, если сгенерить с дмд и без. Но если ты калоед-говнямешник, то пойдет, тут один такой опущенец постоянно вылазит. Подойдет для генерации примитивных пикч с плоским фоном. Но нахуя тогда брать пони? С таким же успехом можно опуститься до помойных моделей вроде люстры и прочего мусора. >сд 3 Лучшие портреты после миджорни. На этом всё. >flux Прорыв канализации Не годится для реалистичных фотографий, если не накачаешь лоры. Уровень DALLE 3 и даже выше по следованию промпта. Идеальный текст, причем не просто банальная хуйня на листике, а текст, образованный из каких-то объектов, материалов, в известных шрифтах и стилях. Охуительный уровень лор - персонажи выглядят даже лучше чем на пони, стили скоро будет не отличить от оригиналов художников, лучше обучается концептам. Годный пиксельарт из коробки. Но так же попадается немало криворуких лор, которые сломают отличную анатомию базовой модели, чудес тут нет. НСФВ на крайне низком уровне. В общем, если надо что-то не связанное с фото людей - на локалке нет ничего лучше флакса. Если не лень ждать, то во флаксе можно нагенерить разных реалистных сцен со взаимодействиями разных персонажей, а потом пройтись по ним XL с контролнетами. По поводу ожидания - на днях вышла еще более порезанная модель на 8B, хз что там по скорости и по качеству и нужно ли оно, когда есть гиперлоры, рисующие хорошо за 6 шагов.
>>931020 Со Шварцем это был пример. Воо мне надо лицо рандом человека перенести на железное лицо, или маску анонимуса сделать с лицом ноуйнема условно. Для этих целей Лора конечно подойдёт, но мне что каждый раз Лору тренить для таких людей. Так что ищу способ без лор и без тех людей, что знает сама модель.
>>931072 У нормальных людей стоит автозапуск воркфлоу и селектор пикч из батча, на котором оно стопорится. Сгенерил батчем штуки 4 лоуреза, выбрал лучшую, оно уходит на апскейл.
>SDXL SD3, а в чем отличия? в архитектуре, параметрах, умениях, скорости, ну и сд3 мусорка, 3.5 ебет >Что лучше использовать. ну под сд 3.5 ниче нет еще, кроме базовых моделей, так что сдхл >Что это за пони модели? файнтюн сдхл на 2.5 миллионах рисуночков, 2.5д, чучуть 3д артах, великое множество концептов персонажей, фулл нсфв и куча фетишей, больше наверно только у NoobAI (там обучается на всех картинках с данбуру и е621, а это овер 10 лямов картиночек) где растеряны все унифицированные знания базовой модели при высоком лернинг рейте, что превратило ее в уникальную модель с уникальным клипом и уникальными возможностями делать любые exaggerated формы
>На Au1111 можно запустить? да
>DMD2 постоянно вижу это в треде, что это такое? топовый дистиллят sdxl (дистилляты лишены джанк шумных незначительных весов, поэтому требуют меньше шагов для качества и вообще не требуют негативов), помимо них есть хупер, пцм, турбо и прочие лайтнинги, у дмд2 лучший адхеренс к промту и лучшее качество, отличная работа на цфг1 (дизайнилось под это и под лцм семплер), есть возможность генерить хайрезы вне размеров датасета, чего лишены большинство других дистиллятов, работает на всех сдхл моделях, т.к. это дистиллят архитектуры и он не содержит концептов, только короткие пути векторов в латентспейсе
>И конечно, что лучше использовать SDXL,SD3,Flux? зависит от задачи и мощностей, большинство задач покрывается сдхл с мокрописями
>au1111 совсем перестал использоваться? наверно, он и заброшен к тому же, только самые отъявленные любители кала на градио остались пользоваться И нфажики по старинке вкатывающиеся через него, все остальные сидят в комфи, еще есть форки а1111 в виде всяких говнофорджей такто никакого смысла в градио нет, все самое новое и в качестве моделей и в качестве мокропись сразу впиливается в комфи за наносек, а для уи на градио нет
>>931008 >Уровень DALLE 3 и даже выше по следованию промпта. Чиво блять, скажи ещё пизже гула, в голос с шизы сддауна, до дали ему как до луны пешком, из флюса про версия которая только онлайн, ещё что-то может, а все локалки калговна мыльного.
>>931132 >не накладывается вообще никак на стили и не живые лица. В примере у инстант айди негра зелёного сделали. Пробовал тоже самое, получилось не то что ожидал. >На не живые лица Вот это и не получилось, надо было на железную маску натянуть лицо
>>930998 >Что сейчас по теме переодеваний в топах? Уже отвечали недавно, вот ветку сообщения >>930229 глянь и прошлый тред загляни
>Может уже появились локальные решения из коробки Вообще давно существует Крита с подключением к комфи через плаген и загрузкой любых моделек с инпеинтами изкаропки, но с обновленной возможностью юзать кастомные воркфлоу сразу из комфи стало проще некуда теперь хоть какую модель инпеинта использовать и в удобном интерфейсе криты мазюкать
>>931145 Есть такие же удобные плагины для Фотошопа? Что бы прям из Фотошопа можно было конфи кастомных узлы использовать? Видел разные, но они все говно какое то. Под Криту самый удобный, чт оч видел. Может есть, которые я упустил из виду.
>>930509 >Или теперь она не нужна и можно на обычной модели все делать. Это, целенаправленные инпеинт модели работают как патчи для основной модели. Есть конечно хз как полученные конкретно фуловые чекпоинты инпеинтовые (4 под пони и 16 для сдхл, лежат на цвите), но смысл в них, когда можно любую модель юзать как инпеинт базу.
>>931163 >Что тупо маску наложил, и по ней обычной моделью сгенерировал. А не как раньше инпейт моделью? Да, ток не самой моделью, а моделью + подключенную специализированную дополнительную инпеинт подсеть, которая и будет заниматься инпеинтом на основе основной модели.
>>931165 >почему тогда на Крите Ну там супер ёбово сделан плагин для самой криты чтоб нейронки юзать, ощинь удобна, регионалки есть, можно всякие контролнеты подключать. Я ее в стиме еще давно купил поддержал разрабов все дела. Плюс крита работает быстрее фш сама по себе.
>>931168 А да лайвмод в крите есть. Ну и для тех кому нужно еще апскейлинг и отдельная реализация менюхи под анимацию, т.к. у криты есть таймлайн для анимирования.
>>931099 ну вообще 8 шагов мало, чем больше разрешение тем больше шагов надо обычно чтобы квалити потек, но давай попробуем 8
Вот допустим пик 1 дефолт ген с артефактом, пик 2 с раунетом. В раунете от балды быстрое срабатывание на ранних шагах даунапскейл, и половина шагов кросатеншен чтобы удерживать контекст сцены.
>>931129 Её какой-то дебил делает. Обучил на тегах первую версию, всё отлично было, а со второй пытается сделать то, на что xl не способен, ожидаемо дерьмо выходит.
>>931131 Гугл вершина по качеству, по промтам не тестил его. Покажи пример далли 3 и флакса, где они не будут равны. Не по качеству картинки, а именно следование промпту. С учетом, что далли ещё и дописывает что-то свое, плюс неизвестно какие ухищрения помимо этого, и хуй знает какой там размер модели вообще. >>931202 Нихуя себе. Это сд3.5? Выглядит как гугл, но без "хайрезфикса". Прогнать с адетейлером, апскейлом и обратно даунскейлом в 1024х - будет не отличить от имагена, по крайней мере на этих пиках. >>931087 Неси сюда ху плот без плоских примитивных изображений, без черипика - на дмд и рядом на нормальных настройках -, а потом хрюкай про дмд на пони.
>>931273 >без плоских примитивных изображений Это как? Что значит плоское примитивное изображение? Критерии отбора будут или ты просто пукнул чтобы был вариант сдать назад с обосранными штанами у тебя?
>а потом хрюкай про дмд на пони Мне кажется это тебе надо хрюкало завалить и прыгнуть в окошко, у тебя весь пост это невъебенное чсв и пассивная агрессия. Ты же просто говно с двачей, лоускилл, носкилл, криворучка.
>>931335 Это блять делается на автомате батчем алё. Хоть с видео, хоть с картинок, даже в ссаном ффмеге была такая фича уже 5 лет назад. Не оправдывай этого еблана.
>>931341 Да с сохранением в лосслесс любой формат, любое разрешение. Ты не понимаешь, она кропается а замазывается алгоритмом как это работет в фотошопе к примеру меджик браш или в виндовом просмотрщике картинок любая ватермарка заменяется соседними писелями и ты не поймёшь что она там была вообще.
>>931344 Ну ладно, все равно лишние телодвижения, а нейронка вполне может эту повторяющуюся замазку увидеть и пердеть ей на генах. Проще просто прописать в негативы ватермарк при гене или если негативы не работают то потом одним мазком убрать через инпеинт.
Что можно вставить в промт такого заметного и безопасного? Что бы игнорировалось, надо для автозамены говна в чужих промтах, как же они заебали со своими веснушками и скорами. >>931209 4xNomos2_otf_esrgan Пока лучшее что нашел из легких но он зернит. 4xFaceUpDAT Для лиц хороший но тяжелый. nomos8khatLOtf_v20 Ахуительный для всего но очень тяжелый.
>>931295 >>931300 Ну вот и завали ебальник. Сразу видно конча, который только на дмд сидит и не знает как оно генерит без него. >>931202 Уебок, наебал меня imagefx пикчами из /b/ Интересно, что СД 3.5 может в прямых руках, пока неохота качать
>>931376 Алсо я думаю что проблема в том что, я в рунете с бикубик сменил набилинейную. Для моей уидюхи не завезли бикубик. Хотя я пробовал в ноде менять в преобразование в фл32 и обратно в фл16 и получается мыло с небольшими ореолами вокруг объекта. Я думал что дело из-за смены точности, поэтому поменял бикубик на билинейное. Но на 15 шагах все ок генерирует. Короче я уже заебался. Но мне в целом нравится ебаться с конфи лол.
А по поводу раунета, я так понял он бесполезен если не генерить в один проход большие изображения. Мне как то по старинке лучше в 2 прохода делать. Ну либо я рукажоп и так и не разобрался с эти раунетом.
>>931440 Если у тебя не хард нсфв, то llava 34b охуенно считывает. Очень мало галлюцинаций по сравнению с другими сетками. Выдает даже чересчур много деталей, которые не нужны в хл, может для флакса подойдет.
Давайте разберём на пальцах данную ситуацию, чтобы даже мамкин эксперт понял: сравнивать локальные нейросети с Midjourney — это как сравнивать молоток, который ты сам держишь в руке, с мужиком на час, который приехал с пневмомолотком и набором спец-гвоздей. Только у мужика этого одна задача: нафигачить по-быстрому и свалить, чтобы ты потом его опять вызвал. Суть Midjourney в том, чтобы впаривать массам максимально обобщённый результат — глянцевую, приятную картинку, которую даже бабуля лайкнет.
А что у нас тут с локалками? Тут ты сам Бог и Царь. Настраиваешь параметры под себя, берёшь модель по вкусу, настраиваешь шаги, без всяких ограничений. Это не тупой конвейер, а кастомный инструмент, где можно сделать как угодно, что угодно и без тупых ограничений. Захотел кривое, грязное, глубокое — настроил и получил. Захотел идеальные детали? Добро пожаловать в мир, где всё на твоей стороне, и где можно загнать систему под свой уникальный вкус, а не под потребности обывателя.
Так что выбирать тебе: или зависеть от конвейера для масс, или потратить время, разобраться, и делать так, чтобы даже чёрт в аду ахнул от твоих результатов.
вот смотри: >Настраиваешь параметры под себя, берёшь модель по вкусу, настраиваешь шаги,
особенно для комфиебов. а генерировать не обязательно, да они и не генерируют. мы имеем очень приятную программу, которую просто нравится крутить, щелкать кнопочки, ползуночки. а картинки на выходе значения не имеют. они второстепенны.
>>931599 Ну, ты раскрыл великую тайну: оказывается, локал генерация — это просто кнопочки и ползуночки для комфиебов. Что не так?
Пока ты там щёлкаешь одну кнопачку отправки сообщений в дискордике Midjourney, и слюняво ждёшь очередной рафинированный "шедевр", или чего хуже - сливая бабки за женерик-картинки под усредненный "среднестатистический" вкус, взрослые действительно крутят ползунки нейронки и используют их как инструмент, а не как платный автомат для мемасов. Ток вот результат у локальщиков действительно уникален, а не тупая штамповка обмазанная хуман преферс оптимайзом чтобы гои несли шекели.
Так что продолжай сосать лизать мижорни, платить за женерик и считать себя особенным в клоседсурс соевичковом сервисе где все как один генерят отполированный фастфуд, а те, кто в теме, пусть и дальше наслаждаются "ползуночками".
>Там один шаблон, локально - миллиарды вариаций. И там и там одинаково шаблонные картинки. Загугли, что такое Дженерик. Только у дяди они красивые, а у анона скучные.
>>931625 У меня 300к картинок заархивировано, надо было срать ими по кд в тред чтобы тебя удовлетворить?
На самом деле всем поебать на чужие картинки, и уж тем более на картинки из говноджорней. Это просто ноль эмоций вызывает всегда. Ого ебать чел сгенерировал скейтера ахуеть. Болгары восхитились, хуй вырос!
Весь прикол нейросетей что ты генеришь контент ПОД СЕБЯ, он не должен быть для кого-то, только если он не решает определенную задачу уровня нафармить бабок на обработке фоток или юзать как концепт генератор (но это тоже сорт оф ген под себя, так что нещитова).
Бля да кому вообще нужны чужие картинки? Я всегда обращал внимание что большинство реактов идет только на такой ген контент:
а) селеба (если ты говноед) б) раздевание еот (помню треды в гг были, там постоянно кидали своих блядей на заказ раздеть) в) порнуха (и то если ты сам не можешь генерить или тебе лень, зашёл на цивит и дрочишь хуй) г) показ особых умений недоступных только лишь всем (использование генов для муз клипов, презентация фич инструментария и тд)
Какие ты нахуй картинки требуешь чтобы выкладывали итт? Ты че дебил вообще? Похуй всем на твои картинки и на мои картинки, не похуй тут только на порнуху, лолей и гайды как какать настроить ту или иную хуйню и как пользоваться, чтобы опять же самому в соло генерить свой личный манямирковый контент.
>>931639 > Только у дяди они красивые, а у анона скучные. Пашол ты на хуй, меня уже блевать от мижорниговна в инете тянет, а от своих генов буквально перманент стояк. Чуешь в чем прикол? В личных предпочтениях, далбаеб узкокругозорный, сыбись нахуй в дискорд мижорни обратно и не беси меня.
>>931641 Соглашусь с тобой. Вот чем приятны фото голой тяночки, что она прислала тебе в личку? Даже если там и лица ее нет. Тем что это фото видел только ты. Оно сделано для тебя. С нейросетью тоже самое. Генерируешь сам себе картинку, которую никто не видел, не обязательно ню-картинку. В этом весь вайб, для меня, весь смысл генерации. Даже если я просто рассмотрю картинку и удалю её. Смысл всего этого и был ради этого момента когда я ее рассматриваю.
Да вроде ебёт последний натвис, даже не стараясь, в 1 проход задний даже дмд2:1+спо:1+2кфг(пиздец 2 кфг) с апскейлом и пердолисом вообще нет анал логов
>>931589 >и делать так, чтобы даже чёрт в аду ахнул от твоих результатов. Бла-бла-бла, как обычно пизданул тонну текста бескартиночный сддаун без примеров, какой же жидкий пук среньк.
В общем единственная причина по которой я здесь это фото не отличимое от реальности с которого я охуел. Но я вот пробую модели и там мазня обычная как и 2 года назад. Как я понял это тупа челы на четырех 4090 без конца генерят по тыще картинок и выбирают ту единственную что не обосралась, а для простых работяг такое качество ещё очень далеко
>>931681 Не понимаю, что происходит. Очередная обнавленная модель выдает хенрю. Вчера ебал натвис, сегодня бигасп. Какого хуя у меня все изображения хреновые выходят? Это я разучился промптить или это разработчики переиграли с Natural Language?
>>931724 Мне почему-то кажется, что ты сильно ошибаешься в представлениях требований для генерации. Ыо-первых покажи о чём ты, во-вторых генерация будет даже на говне мамонта любого качества ы любой модели, просто дело врмени. На 4090 генерация любой мега-крутой пикчи занимает 1 сек, на 4060 тоже 1 сек. Если говорить про флюкс, то на 4090 это займёт 20 сек, на 4060, внезапно 20 сек если подобрать ггуф, ну а без гуфф 1 мин. Это не полчаса страданий. Пошёл посрать, запусти 100 генераций, пришёл удалил 80 шт кала, оставил 20 шедевров.
Почему raunet оставляет какие-то сука разноцветные точки на изображении? Даже с пустым промптом какая-то ебатория. Куда копать кого винить? Шедулер? Сэмплер?
>>931937 Разный результат будет. Но на самом деле лень воркфлоу менять, я даже размеры не меняю лол. Часто просто во 2й проход другой семплер юзаю, так и осталось типа для тестов.
>>931817 >На 4090 генерация любой мега-крутой пикчи занимает 1 сек, на 4060 тоже 1 сек Пахнет, что ты пиздабол. У них шина разная, и это самая незначительная разница, но этого уже должно быть достаточно для разницы во времени.
>>931970 А теперь ты как нормальный человек запускаешь нормальную модель с дмд2 4-8 шагов и смотришь на время генерации годноты, которое составит 1-2 сек. Ну если ты особо одарённый с 80 шагами и цфг 10 c двойным апскелом через номос, а ещё может и рефайном, то флаг в руки - такая хуита и на 4090 займёт от 2 мин минимум.
>>932039 >>932068 Какой-то фееричный наёб гоев, вместо выхлопа в гифке просто оригинальный пик засунули. На пикриле второй квадрат dc-ae-f64c128-in-1.0, третий - VAE от XL, четвёртый флюкс.
Почему ебучий инпейнт не добавляет еще одного черта? Я этого то кое как добавил. Всегда такая хуйня! Помоги, анон, что я делаю не так? Просто пишу в промте на инглише, мол, сидит красный черт на пне, и выделяю справа от костра 128*640 пикселей, примерно, а эта хуета ни хуя не рисует на том месте! Сижу в фордже, ибо не хочу заморачиваться. Дмд не пользуюсь, ибо все желтое и с артефактами получается. Вообще на любом чекпоинте артефактов слишком много
>>932239 Какой же ты ебанутый нетакустк. Вот аналогия твоей ебанутости(это же ты топил тут за ролстон?): "Вот был у всех ойлер_а, а теперь выдали криворучкам ролстон. Кто не может в ойлер_а и использует ролстон, тот криворучка."
Какие убогие лора на сд 3.5, уровень XL или даже ниже. Даже ебанная вотсон на себя не похожа.
>>932124 А сколько фармишь? 220 база. Можно больше, если постить на доску попрошаек, оттуда фармится дневной лимит в 50 лайков. Итого ~300 в день, загружая одну пикчу.
>>932244 Если инпеинт по какой-то причине тебя не слушается, то остается применять художественные мэдскиллзы и рисовать черта самому, джва часа в пэинте, потом уже инпеинтить поверх рисунка.
>>932375 Эту вашу дмд на фордж можно поставить? Она быстрее лайтинга и гипера? И если она токая охуенная то почему я кроме как на двачах о ней не слышал ничего?
>>932414 >Криворучка Да, я пользователь дмд. Это не значит, что меня нужно хуесосить всем тредом. Криворуким тоже нужно как-то генерировать. Боже, спасибо за дмд. >>932450 Она красивей и совсем не требует скилла, чтобы сделать хорошо.
>>932450 >Эту вашу дмд на фордж можно поставить? обычная лора > Она быстрее лайтинга и гипера? Ни лайтнинг ни гипер не могут высоконсистентное выдавать на цфг 1, а цфг 1 быстрее считается т.к. не работают негативы, так что да. >И если она токая охуенная то почему я кроме как на двачах о ней не слышал ничего? Хз, может у тебя кругозор узкий, у нее на хаге за последний мес 65к скачек. На самом деле просто нишевый продукт под конкретный семплер два семплера.
>>930210 Я тут подумал... Пока в треде не будет миджорникал/идеограмкал пикчи, где жестко ебут гарем аниме баб, все эти попуки с обосранным оранжевым мужиком и обосранной черной бабой ничего не стоят, такой хлам и кандинский выдаст.
>>932494 От какого цфг начинают работать негативы? Хули я тогда ваш дмд натвис дрочу, если он мне рисует хуиту но быстро, а позитивные подсказки выпиливаются фильтром ушлого хуисоса который из-за повксточки прогнулся? Я думал я рукожоп, а это не работает негатив. >Инбифо ты криворучка
>>932496 >От какого цфг начинают работать негативы? ты тупой чтоли? > 1 1+ > 1 + хоть 1.01 поставь негативы начнут влиять, но не так как ты ожидаешь конечно > если он мне рисует хуиту но быстро, а позитивные подсказки выпиливаются фильтром ушлого хуисоса который из-за повксточки прогнулся? што блять? какого фильтра? какого хуисоса? если ты про сам дмд, то это дистиллят, там никаких фильтров и концептов не содержится > Я думал я рукожоп, а это не работает негатив. ну технически ты рукожоп
>>932503 >Какого хуисоса Автора чекпоинта Вот мне надо сгенерировать хуиту нейм, а мне срет в выдачу то что мне не недо, я выпиливаю это негативом. А негатив не работает. >Жри что дают
>На 1 цфг негатив не рабоатет Когда эта инфа вообще вылезла?
1920 изображений: 32 промпта по 9 дмд изображений на 6 моделях Рейтил 6 пикч, положение рандомное, не знал к какой модели относится
Результаты (ЧЕМ МЕНЬШЕ, ТЕМ ЛУЧШЕ): Model 0: Total Score = 113 # nv1 Model 1: Total Score = 111 # nv2 Model 2: Total Score = 147 # pyros Model 3: Total Score = 120 # sdxxl Model 4: Total Score = 87 # lustify Model 5: Total Score = 92 # pworks
Это не последний тест. Ни на что не претендую. Кто не согласен - тот скилл ышью криворучка флюхокал анскилл без юзкейсов с жопным подбородком
>WebUI от Automatic1111 Я правильно понимаю что он не поддерживает пиздатые модели типа SDXL и флакса и поэтому у меня вместо картинок шумы и мазня генерится?
Как смержить Лоры в одну в Комфи? Чем-то стандартными можно или надо дополнительные годы ставить? Нашел только мерж модели и Лоры. Как потом извлеч Лору из модели?
В общем я амдаун и мне сказали идти на линукс там х5 прибавка к скорости ну я пришел накачал хуйни словил кучу ошибок но вроде рос работает и интерфейс запускается только прибавка всего в 1.5 раза как фиксить
>>932564 >нужно понимать композицию, уметь в нее и обладать соответствующим чувством Здесь как бы логическое противоречае. Если мж умеет в композицию, но по твоему не только лишь все могут ее видеть мало кто может это делать, значит в мж результатах мало кто видит эту твою композицию.
Если речь идёт о художественной ценности то всё сводится исключительно к композиции, вообще всегда и везде, говорил уже как-то тут
Есть такая максима "ты можешь гениально нарисовать кувшин, но если он плохо закомпонован – можешь выбросить в окно"
С другой стороны несмотря на то что мижорня лучше умеет в композицию, это всё равно машинная хуйня
Я тут не адвокат мижорни, мне на неё похуй, я наоборот считаю что ебать за счёт композиции в перспективе будут именно лолкалки из-за возможностей более глубоко влиять на процесс генерации
Тут просто у всех мысли немного в другую сторону повёрнуты, наверное потому что анальников полон тредю
Хотите жёсткой ёбки – спорьте не на тему жопных подбородков, блюра и качества тихстурок на натвисовой пизде, а на тему композиции
И думайте в сторону того как на формирование композиции можно влиять
Если конечно интересует художественная составляющая
Если не интересует, тогда просто дрочите на всратые картинки как и те говноделы из /b/, все ваши ползунки, тумблеры, кнопоки, завороты лапши ни на что не влияют, это просто онанизм ради онанизма и вы ничем не лучше. Хотят наверное даже хуже, ведь вы всераете время, а они нет, лол
Однако если вы посмотрите в сторону композиции и художественной ценности то тогда может быть поймёте в чём сила и потенциал локалок
У вас есть шанс использовать эту силу
Но для этого нужно понять что такое композиция и научиться влиять на её формирование
>>932570 >ежли кто-то не видит Х значит Х не существует Скорее не "не существует", а "не имеет значения". Это как со знаменитым "Чорным квадратом". Большинство видит в нём тупо чёрный квадрат и всё, "да это любой дебил нарисует, в чём суть?" Самые наблюдательные заметят, что квадрат кривой-косой, то есть четырёхугольник. "Квадрат-то не квадрат, кек". И только специально обученные задроты будут яростно малафить "О, это настоящая веха в живописи, новое слово, которое Россия дала миру, а-а-а!" мимо
Ку, ананасы, можно в двух словах чем сейчас можно качественно делать nsfw inpainting? Раньше полтораха могла, потом sdxl с контролнетами, а появилось ли чего более прогрессивное?
>>932570 Не люблю таких людей: ответ верный и логичный, но абсолютно не в тему вопроса и ходит нос задрав как будто он победил. Таким ничего не докажешь. Нет смысла с такими общаться. Съехал с темы на что-то знакомое: "а вот, если бы у рыб была шерсть, то там водились бы бхоли, которые...".
>>932522 >>932525 >>932559 Да я и сам своему тесту не верю. Буду еще перепроверять и тестить на гридах 2х2 вместо 4х3, а потом на одиночных пикчах, но без дмд. И только потом удалю натвиз 2 и пересяду на что-то другое. Пока только pornworks иногда юзаю, он как будто рили лучше натвизов, не глядя на тесты. Остальные почти не юзал вне тестов. И я обосрался, пикч было не 1920. Это гридов было 192. А пикч - 2304: 32 промпта по 12 пикч, 6 моделей. Промпты простые, но разная хуйня, от поз, до разных действий и мест, 'woman. ' + 3-12 слов (~5). В точности результатов сомневаться нельзя. Сразу можно уверенно решить, что они рандомные и трайнуть самому ху плот.
>>932712 Используй синонимы, чел, пусть волосы будут не red, а crimson. До кучи можешь ginger в негатив добавить (если ты не дмд-даун, сидящий на кфг 1 без рабочих негативов, конечно).
>>932521 Лустифай действительно лучше прочих надрочена на хорошие фотки, а не мыльное говно для онлифанса, снятое на телефон. Но какой же он хорни, это пиздец... Я понимаю, что модель так и называется, но порой бесит, когда без упоминаний и просьб вдруг появляется ебля, хуи, дилдаки. Просто пишешь бабу, сидящую на кортах с раздвинутыми ногами, так он её рисует сидящей на хуе\дилдаке. Ну правильно, хули, на чем ещё ей сидеть.
>>932762 в /б съебон оформил выполнять как шлюшка малолетняя реквесты таких же, битард-говнодел и не мешай итт взрослым 40+ профи дискутировать о умных вещах
>>932671 Почему именно такой выбор? Типа не бу и за одну цену? Лично я бы взял 3080, потому что она считает быстрее. В реальном пользовании 12 гигов это тоже самое что 16, но на 4 гига повыше, особой выгоды не получишь, sdxl хватит 12 гигов и на мокрописи останется, dit модели что в ту что в другую не влезут полностью в fp8, а раз так, то значит гуфы ниже квантом влезут и туда и туда. LLM в 4060ти повыше квантом залезут разве что, но профит сомнителен т.к. все равно квант/параметры LLM пососные будут. Потребление энергии выгоднее у 4060ти. А так лучше добавить денех и взять 3090/3090ти.
>>932773 >Почему именно такой выбор? Типа не бу и за одну цену? Да, цена +- для меня будет одинаковая, смущает лишь объём памяти, потому что тут кто-то писал что 16 гигов намного лучше, чем 12 гигов, даже на более слабом чипе и при меньшем количестве куды. Электропотребление не особо волнует, а 3090 это уже дораха, да и под неё придётся докупать хороший и более мощный БП, а 3080 заведётся и на том который сейчас есть. В любом случае, спасибо за совет, анончик.
>>932793 > Красота была бы красивее если бы тон фона отличался от общего тона тела Так-то да, это у меня на маленьком деноизе получилось делать лицо, которые мне нравится. Дальше мне уже было всё равно.
>>932564 >>932570 >хрююии композикция кококо Давай начнем с того что восприятие эстетики комопзиции это человеческое предпочтение, если мижорни натренирована на среднее по палате изображение эстетически удовлетворяющей композиции то это плохо с точки зрения кастомного инструмента, но хорошо с точки зрения быдла, которому надо одну кнопку чтобы сделать "красиво".
Вовторых чтобы получить идеальный композ на сдхл условной тебе надо просто дать данные о композе нейросети, это можно сделать буквально одним кликом через айпиадаптер (даже отдельный адаптер натренированный на перенос композа есть), контролнет с гайдирующим слоем или лору которая содержит данные о эстетически приятных композах - то есть DPO и SPO.
То есть по итогу миджорникал проигрывает кастомизации сдхл, снова и опять.
>хрюки про композ с худ стороны Тут буквально мнение обывалы с падика, который узнал о золотом сечении, хотя по факту композ это субъективность восприятия.
Если все оценивать строго по "ряяя правильный неправильный композ", то получается что сирик с пик1 полное говно, а кинчик справа шедевр на века, но в реальности то наоборот, потому что эстетика это комплексность, а не просто "давайте по золотому сечению хуйнем композ, кологрейд как в галивуде и будет шедевр", хуй там, ты пососал кароч.
>>932786 >тут кто-то писал что 16 гигов намного лучше, чем 12 гигов это вообще не так вот 24 гига против 12/16 это да, намного лучше, а 16vs12 'это два говна с разных сторон
>>932786 > а 3090 это уже дораха, + 15-20к срук >да и под неё придётся докупать хороший и более мощный БП у 3090 потребление как у 3080 - 350 ватт, у 3090ти на 100 ватт больше - 450 ватт, 3090 спокйно залезет в 600 ватт даже по самому низкой отдаче по 12 вольтовой линии в 480 ватт, а 3090ти залезет туда же с андервольтом; если у тя более менее хороший бп и проц не печка то и без андервольта должно вытянуть
>Портативная версия основного WebUI от Comfy (запуск с одного из run.bat файлов) > Альтернатива - еще поддерживаемый форк ранее популярного WebUI от Automatic1111 (R.I.P) Первый типа быстрее или в чём смысл?
>>932837 А зачем они вообще этот кал тренируют? Промпта он не слушается как и илюстрейшн, "эстетики" даже с лорами нет, просто куча ресурсов в пустоту.
>>932943 Щас придёт дебил трясясь доказывая тебе что ты ничего не понимаешь и там стили есть, пусть и датасет кал говна, но стили же. Хули нам надо, главное же говном обмазаться со стилем.
>>932943 >зачем Картинки делать >Промпта он не слушается как и илюстрейшн скилишуя >"эстетики" даже с лорами нет Субъективно >просто куча ресурсов в пустоту не нравится - не ешь, ток ебало закрой
обратно невозможно проделать чтобы из весов получить токены, которые переведутся в клип и потом в промт
такое могут только специальные модели для кепчеринга которые заточены на то, чтобы переводить картинку в описательный промт, и то там заточено чтобы входные данные также были, в виде картинки
>>932840 >A100 4090 в два раза быстрее по чистому компьюту. Причина, почему нельзя ужаться по памяти и тренить sdxl на ней? Даже если это будет медленнее по времени из-за оптимизаций, все равно 4090 дешевле почти в 10 раз. Или будет качество сильно страдать? На таобао кста есть 4090 с 48 гб памяти. Стоит в районе 400к...
Анон, подскажи совет. Долгое время был не в теме, хотя начинал с 1.5 версии, сейчас смотрю уже куча версий СД вышла, и пони какие-то, флюксы-флаксы. Анон, пожалуйста, поясни за каждую версию коротенько, что годно, а что на параше? Чем сейчас пользоваться трендово? SD XL 1 еще работает? Что такое пони? Короче Анон верю в тебя, спасибо заранее
>>933064 >куча версий СД вышла, и пони какие-то, флюксы-флаксы. 1.5 - мертвец, живущий за счет инпеинт моделей и пары файнтюнов для нищих, плюс есть ELLA как дешевый экспириенс т5 для нищих
SD 2, 2.1 - мертвецы, по сути чуть улучшенные полторашки на другом датасете
SDXL - стандарт индустрии, куча мокропись, куча файнтюнов, пушка гонка самолет лидер митол группы
Cascade - модель прикол на одной клевой архитектуре за патентами и нонкомершл юз лицензией, мертвец
Pony - мощный файнтюн на архитектуре SDXL, направлен на 2д иллюстрации, нет явного упора на онеме, имеется миллиард файнтюнов уже на основе пони; т.к. создатель пони дегенерат, то во время обучения изза ебанутого лернингрейта модель растеряла большинство знаний sdxl, зато приобрела возможность делать об exaggerated формы, которые невозможны в сдхл, и имеет свой уникальный клип, изза чего прямое смешивание пони моделей с сдхл невозможно, только через костыли; полностью нсфв ориентированная модель для куминга
Illustrious - мощный файнтюн SDXL направленный конкретно на онеме арты и нсфв хентай, от него отпочкавался NoobAI, который еще более ебанутый т.к. включает весь датасет е621 и данбуру, опять же невозможно смешать с моделями обычной SDXL без применения костылей
Playground 2.5 - мощный файнтюн от плейграундаи с использованием континуус EDM, никакого нсфв, имеется пара интересный файнтюнов
Пиксарт сигма - улучшенная альфа, можно запускать не только на топ картах, по сути тоже мертвец, разрабы пилят модель Sana под крылом нвидии
Hunyuan - dit говно от тенцент байду, мертвец
Lumina - риктифайд флоу дит говно, мертвец
Kolors - годное dit говно от китайцев с упором на иллюстрации
SD 3 - мультимодал дит, эпический летний обосрамс стабилити, и обосрамс тот в основном изза лицензии ублюдской, и во вторую очередь количеством параметров, потом они конечно все с лицензией исправили исправили по лицензии, но все довены уже сели на флюкс ну и кароч треха теперь нинужна никому и мертвец
Aura Flow - тру опенсурс флоу дит модель, в стадии тренинга, на ее архитектуре вероятно будет выпщуен новый пони
Flux - риктифайд флоу дит модель, примечательна тем что старается сделать лакшери говно чтобы угодить быдлу, то есть далеко не базовая модель по факту, две версии - шнель которая никому нинужна, с норм лицензией, и дев на коорую все дрочат, но там лицензия говно и файнтюнить никто не хочет бишплатна; в целом модель тормоз ебаный и много занимает места
SD 3.5 Large - мультимодалка опять же, 8 лярдов параметров эпический камбек и ебка флюкса, работает как метеор, дистиллят на 4 шага не сильно отличается от лардж модели, в целом приемлемая лицензия для тюнеров, к ней они же готовят выпустить пачку контролнетов, кароче ебут
SD 3.5 Medium - релиз 29 октября, 2.5 лярда параметров чтобы запускать на кофеварках и чето там с архитектуров улучшенной, вооот
>>933119 >ебка флюкса Как на том видео >а продемонстрируйте В сравнении с флакс, даже не нужно сравнений с файнтюнами хл. Пока видел исключительно хуевые пикчи из сд3.5 Эти же криворукие люди постили тут куда более лучшие пикч, даже когда пытались засрать флакс.
Не пойми криво, я сразу же забуду про флакс, если сд3.5 рили достойно сделали. Пока даже лоры убогие. Про их нищее количество молчу. Это все, что есть, плюс одну скрыл для скрина. Ну, а пока ничего лучше xl+pony+flux не наблюдаю.
>>933119 >SD 3.5 Medium Так медиум же уже была. Причем тут кофеварки, она пыхтела не сильно быстрей флуха и выдавала говно. Это по сути 3.1 будет? Или они наебланили с ярлыками и это новая модель?
>>933119 Анон, спасибо тебе за развернутый ответ, ты лучший. Подскажи еще насчет текущего положняка по веб интерфейсам для сд. Я раньше сидел на автоматике1111, но вижу что он почему то рип в шапке профиля, что с ним случилось? Он больше нахуйу никому не нужен и все на комфи перешли? Мне если честно комфи не нравится, считиаю что у автоматика идеальный интерфейс, он поддерживает 3.5 новый? И че там по фукусу, он такой же уебищный и бесполезный как и раньше? Раньше там не было ни инпейнта, ни контролнета, ни нормальных расширений в целом. Что посоветуешь для 3.5 кроме комфи?
>>933135 > >SD 3.5 Medium > Так медиум же уже была. >Или они наебланили с ярлыками и это новая модель? Там была 3, тут 3.5 >Причем тут кофеварки, она пыхтела не сильно быстрей флуха Ну а 3.5 сильно быстрее флюха, ген на 20 шагах примерно 1 мин, в то время как у флуха 1.5 мин.
Кофеварки в смысле что если 8 млрд гуф ку4 весит 5 гигов, то посчитай примерно сколько он будет весить с 2.5 млрд.
Аноны, где почитать про фокус камеры? Видел в некоторых промтах запросы в стиле "снято на камеру X" и это выглядит довольно убедительно. Как узнать, какие такие запросы поддерживает модель?
>>933119 >ELLA Я так и не понял, что это такое. Это ллм? Почему мне сказали, чт она хл нет аналогов Эллы, если в комфи я могу поднять буквально любую языковую модель? Это не олн ли тоже? Поясните пожалуйста.
>>933152 >Я так и не понял, что это такое. Это симуляция Т5 на сверточной архитектуре UNET, на которой работает полтораха. >ллм Она использует ллм чтобы переводить промт в токены. >Почему мне сказали, чт она хл нет аналогов Эллы, Потому что нет реализаций. >если в комфи я могу поднять буквально любую языковую модель? Это не олн ли тоже? Не одно и тоже, ты просто промт генеришь и он кормится концептами в модель. Так скажем "взаимодействие концептов" внутри промта не учитывается и точность падает.
>>933168 Полтораха и сдхл юзают старые методы шумодава и гена через латентспейс (юнет не позволяет особо чтото пиздатое юзать), в них нет трансформера.
>>933170 >Так Элла получается ебет? Ну не прям ебет, но учитывая что полтораха реативная как понос то экспириенс т5 на ней лишним только одни плюсы дает.
>И что то такое есть в фокусе и прочих дали? Т5? В фокусе? Во флюхе мб? Во всем современных моделях т5, и в клоседсурс, и флюксы, и аауры, колорсы, хуелорсы, сд 3+.
>Странно почему подобное не завезли в сдхл. Гигакорпорация китайская разрабатывала, в гараже такую хуйню сложно сделать наверно.
>>933173 >заменяет клип модели, гапе анус плохо делает ну а че ты от гугловского т5 хотел? максимальная соя тащемта есть отдельная нода, через которую можно недостающие концепты из основной модели подтягивать и аккуратненько подмешивать в инференс
>>933194 Такие у меня на 2.5 генерируются. Только он ещё любит слова гапе (зевок) ко рту пририсовыввть. И получается все тян с открытым ртом. Алсо натвис старух генерит.
>>933143 >Я раньше сидел на автоматике1111, но вижу что он почему то рип в шапке профиля, что с ним случилось? Последний коммит от 27 июля, каломатик рип. >Он больше нахуйу никому не нужен и все на комфи перешли? Ну в принципе так и есть, вся говнота как выходит так ее в тот же день пуляют в комфи. Пока там мейнтейнеры UI основанных на говне градио распердолятся уже сто лет пройдет.
>Мне если честно комфи не нравится Че так? Там щас новый интерфейс максимально удобный для нубиков, с мультиворкфловами и даже можно отключить лапшу если раздражает. Комфи супер простой, 13 основных нод на всё запомнить и ты король лапшичной.
>считиаю что у автоматика идеальный интерфейс, он поддерживает 3.5 новый? Там ток треху завезли летом и всё.
>И че там по фукусу, он такой же уебищный и бесполезный как и раньше? Раньше там не было ни инпейнта, ни контролнета, ни нормальных расширений в целом. Такой же уебищный и бесполезный, за исключением что инпеинт (со своими патч моделями, которые можно въебать в комфи) и контролнеты есть, расширений кастомных нет.
>Что посоветуешь для 3.5 кроме комфи? Только комфи. Для любителей градио еще был фордж от илюхи китайца который факас делает, ток он его закрыл, и поэтому щас там какието форки форджа под названием рефордж и всякое такое, вероятно там может и запилили уже поддержку 3.5.
>>933207 >Раньше там не было ни инпейнта, ни контролнета Слышь, ты заебал сам с собой разговаривать. Не было импейнта в фокусе? Блядь, ты ебанулся? Кому ты это вчехляешь, говноед лапшичный? В фокусе самый удобный импейнт эвар, с гарантированным, предсказуемым охуенным результатом. То, что поддержку флюкс-хуюксов и прочего оскоплённого говна не завезли, так хуй с ним, для генераций ваших любимых баб - телеграфных столбов, хватит и сдохли за глаза.
>>933217 Факасокал сосет у криты по части инпеинт уи, а крита это фронтенд для комфи в данном случае, значит факас сосет еще и у комфи по части инпеинта, двойной блуджоб, не учитывая что факас это просто кал.
>>933220 Набор случайных букв и звуков, удавись лапшой, пидарас. А теперь подставляй свой ротешь, туда сосать буду) Крита-хуита юзает корявое сд 1.5 двигло, в прочем как и лапша твоя. Сама Крита ничего не рисует, удобство Крита начинается и заканчивается если у тебя есть планшетная рисовалка со стилусом, и не абы какая, а чтобы дрова были свежие. И если у тебя карта не гипер-супер, то ни о каком реалтайме при рисовании речи идти не может. Ну, что как моя моча на вкус, уёбак?
>>933256 Ты самый тупой человек на планете. Я даже сомневаюсь в том человек ли ты вообще. Нельзя быть таким тупым, это наверно троленк чтобы очернить репутацию факассеров.
>>933269 >флюс на данный момент ебёт 35 наоборот или ты любитель навернуть мыльца и ательешкоговна? напомню что флюх нихуя не имеет широких знаний, даже пинап рисовать не умеет
>>933271 Даже близко не наоборот. Чекнул на прошлых заказах - ну и хуйню всратую выдаёт. У флюса же чекпоинтов и лор дофига уже, 35 когда допилят может и будет хорошо, а пока неюзабельно
>>933278 > Флюс обычно используешь для коммерческих целей, т.к. результат озуенный. Дев нельзя использовать для коммерческих целей, да он и не способен на что-то осмысленное. Как мы уже знаем он даже не может в пинап.
>А если ты говноед, то используешь неюзабельную (пока что) 35ку Нет, 35 универсальная модель с гигантским количеством незасранных ательешкой концептов.
>>933245 Ну какой это т5? Это же при обучении говно мерджа, автор из тегов лламой сделал НАТИВ ЛЕНГВИЧ который собственно нахуй не нужен, мы же не англичане и пендосы, и нам тегами проще писать. Поясните если я не прав.
>>933119 > SD 3.5 Large - мультимодалка опять же, 8 лярдов параметров эпический камбек и ебка флюкса, работает как метеор, дистиллят на 4 шага не сильно отличается от лардж модели, в целом приемлемая лицензия для тюнеров, к ней они же готовят выпустить пачку контролнетов, кароче ебут А этот неебический камбэк когда нибудь научится с обычным воркфлоу ган апскейлом работать или нет? Не, серьёзно, этот воркфлоу со всеми моделями стабильно работал https://comfyanonymous.github.io/ComfyUI_examples/2_pass_txt2img/ хоть я и недолюбливаю флюкс и не верю что оно вообще выстрелит хоть каким то аниме тюном, что кумеров привлечёт к нему, но даже он может >>933179 Не идеальная, такой черный хл и ниже не выдадут без костылей
>>930482 >Концептные параметры То есть, если я не хочу генерировать детей, мне надо использовать -1 а лучше -2? Или наоборот? Алсо как вообще работают концепты. Вот пример: >Я генерирую хуйня нейм Она генерируется нормально >Я добавляю к хуйня нейм что то ещё Хуйня нейм исчезает.
>>933301 Да если бы он это ещё сделал. На деле он втупую сломал модель без эффекта. Уже бы мог обучить охуенный флакс чекпоинт вместо создания этого калеченного монстра из хорошей первой версии.
Объясните мне почему всё подстраивается под то что я не могу генерить 4к изображения без топовый видеокарты? Да даже просто нормальные не могу, 512х512 это не серьезно, какой то 2005 год
>>933324 Все актуальные модели заточены под 1024, апскейлить можешь сколько угодно, просто с определенного размера у тебя закончится врам и придется продолжать плитками.
>>933145 >ген на 20 шагах примерно 1 мин, в то время как у флуха 1.5 мин. Мальчик, здесь взрослые дяди с видеокартами обсуждают серьезные вещи. Или играть дальше на затычке
>>933322 Если у тебя апскейл меняет картинку слишком сильно, то значит денойз слишком высокий стоит. Оптимальная величина это 0.3-0.5 в зависимости от сэмплера. Еулер А например очень любит менять картинку, так что ему 0.3 за глаза хватит. И то порой баги высирает типа вторых пупков, которые потом в инпеинте фиксить приходится.
>>933322 обучил свою лору на плохом датасете sd1.5, сгенерил фотки, прогнал через flux upscaler получились несколько фоток лучше чем в датасете и схожесть под 100%
Почему дефолтный sd1.5 это пик 1 а SDXL с дмд2 это пик 2-3? Причем в первом случае ещё рандома дохуя, носит платье по разному и само платье рандомится, позы, место, а 2-3 пики всегда почти одинаковы
>>933384 Потому что у тебя настолько кривые руки что ты даже с дмд не можешь получить вменяемую картинку? Тогда как в треде уже было куча примеров обратного.
>>933384 Дмд не бесплатно ускоряет, а за счет снижения вариативности, она обучена вести генерацию к предпочитаемой людьми картинке, поэтому из вангерл получается вангерл сидит и смотрит на вьювера.
>>933433 Если сильно нужно, то по моему опыту меньше всего на картинку влияет DPM++2M SDE Exponential, вот ему вообще похеру, можно выставить денойз 0.5, и он ничего заметно не изменит при апскейле.
>>933442 >>933453 Эмм, проверил без моих самодельных лор. Без них не так красиво будет. 1,3 - без моих лор. 2,4 - с лорами. Я их хочу когда-нибудь смержить вместе с дмд и спо и выложить в общий доступ, но чёт не пойму как, хоть и советы давали.
Подскажите по API, плз Мне нужно генерировать несколько изображений, например 2 - я передаю в txt2img {... "batch_size": 2, "do_not_save_grid": true, ...} В ответ получаю ТРИ изображения в response.images и все три это сетка из 2 изображений (одних и тех-же).
Как избавиться от сетки и получать в ответе 2 раздельных изображения?
>>933465 Эффект от твоих лора это тупо сжатие динамического диапазона. Методов для этого дохера. Делается это за наносек любой прогой. Так же можно тупо кривые скорректировать в самом комфи без лора.
>>933704 >Лучше чем в натвисе 1 версии никогда не будет Дженерик кал уровня полторахи, не позорься с такими пиками клоун, лучше ничего не пости, только текст.
>>933722 Ну конечно тебе сразу видно, раз это в нейротреде запощено, лол. Если б ты это в дикой природе где-то встретил, то не факт, что распознал бы, по крайней мере без очень тщательного приглядывания.
Скажите честно, что, на ваш взгляд, сейчас актуальней всего: каломатик, комфи или форж?
Я в основном в аниме-треде сижу, но мне понадобились новые модели и я заметил, что у вас тут другая атмфосера. Поэтому хочу понять, что же там на самом деле происходит-то по итогу.
Ну и реквестирую заодно SDXL-модель, которая может в архитектуру и пейзажи ХОРОШО. Если такая вообще есть.
И что насчёт флюкса? На 12 врам его гонять адекватно или нет? А если придрочиться в плане промптом и брать жирный квант, запуская генерацию на ночь, вываливая слои модели в оперативку? Наверняка же там так можно, как в LLM.
>>934588 >каломатик, комфи или форж комфи вне конкуренции, можно сделать всё, схемы сохранять ну и понимаешь что куда идёт и что для чего нужно насчёт моделей не скажу поищи на civitai, тем более там фильтры есть SD1.5/SDXL/FLUX >И что насчёт флюкса? На 12 врам его гонять адекватно или нет? у меня на 12гб VRAM работает но сейчас проблема, памяти RAM всего 12gb поэтому не юзаю, долго только генерить будет одно изображение 1-1,5 мин P.S. Уже был перекат
Существуют какие-то методы для контролнета, которые с чудовищной точностью переносят черты лица, выражение лица, даже если персонаж находится далеко? Например, составляя очень подробную карту морды, контуров, деталей и так далее. При условии, что изначальное изображение в хорошем качестве и сделано на профессиональное оборудование, 8К, например, на огромную светосильную линзу и низким исо, где всё отлично видно.
Canny здесь хуйня, не выцепляет всё, что нужно.
В идеале, нужен инструмент, который переварит всё изображение целиком для предоставление его нейросети со всеми мельчайшими деталями, даже если мне придётся долго ждать, для кормления img2img. Текстура кожи или пейзажи — неважно. То есть безумно подробная карта, с помощью которой можно в итоге лепить что угодно дальше.
======================================
Предыдущий тред https://arhivach.top/?tags=13840
------------------------------------------
схожий тематический тред
- аниме-тред
========================
Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях.
Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion.
Полный функционал в локальной установке (см. ниже)
Пробный онлайн-генератор Stable Diffusion: https://dezgo.com/txt2img
Пробные онлайн-генераторы Flux:
https://huggingface.co/black-forest-labs
https://fluxpro.art/
⚠️ Официальные модели stable diffusion от Stability AI значительно отстают по качеству от кастомных моделей (см. civitai ниже).
🔞 Без цензуры и полный функци_анал: только ПК-версия
===========================================
🖥УСТАНОВКА НА ПК
Портативная версия основного WebUI от Comfy (запуск с одного из run.bat файлов)
https://github.com/comfyanonymous/ComfyUI/releases
Примерные workflow для ComfyUI (можно загружать напрямую из картинок)
https://comfyanonymous.github.io/ComfyUI_examples/
------------------------------------------
Альтернатива - еще поддерживаемый форк ранее популярного WebUI от Automatic1111 (R.I.P)
https://github.com/lllyasviel/stable-diffusion-webui-forge?tab=readme-ov-file
------------------------------------------
👉 Для новичков - простой в работе WebUI Fooocus
https://github.com/lllyasviel/Fooocus?tab=readme-ov-file#download
------------------------------------------
Для тех, у кого видеокарта не тянет - оптимизированная генерация на ЦПУ
https://github.com/rupeshs/fastsdcpu
===========================================
📚 РАЗЛИЧНЫЕ МОДЕЛИ (И МНОГОЕ ДРУГОЕ) 👇
https://civitai.com/
https://huggingface.co/
------------------------------------------
📊 ПАРАМЕТРЫ И НАСТРОЙКИ ГЕНЕРАЦИИ 👇
https://teletype.in/@stablediffusion/samplers_steps
===========================================
🎨 ГАЙД ПО СОСТАВЛЕНИЮ ЗАПРОСА, СТИЛИ
https://teletype.in/@stablediffusion/artists_for_prompts
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols
Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her
------------------------------------------
♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇
https://supagruen.github.io/StableDiffusion-CheatSheet/
https://www.artvy.ai/styles
------------------------------------------
💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ
https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td
==========================================
🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇
https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora
https://civitai.com/models/train