24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Stable Diffusion Flux тред X+125 ====================================== Предыдущий тред >>929413 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожий тематический тред - аниме-тред >>930737 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
>>933792 Клип скип 1 реализм, герлы соответствуют запросу возраста и всего остального. Но часто хуже с руками и прочими деталями. Чем больше клип скип, тем хуже воспринимается возраст вангерл, она становится дженерик бабой с обложки журнала. Но красивая и с руками все норм. При клип скип, например 6, вангерл становится суперфотомоделью, чаще где-то в дженерик месте(если натвис, то в кроватке) и ей почти пофиг что ты там заказывал по возрасту и месту. Короче, генерь на 2, иногда переключая на 1, если кажется, что модель тебя не слушается. А если хочешь генеритить что-то глянцевое, вылизаное, то пробуй на 3 и вообще 4, удивишься дженерик результату. Апскейлить лучше всегда в кс 1. Больше деталей и реализму. И про это мало кто знает.
>>933859 >>933857 Хочу заметить, что качество растет в каждом треде. И ты теперь обязан продолжать постепенно поднимать свою планку. Я слежу как за выпуском любимого журнала.
>>934076 Почему так? В целях оптимизации?А качество не страдает? Покажите что на чистом нв1+дмд выдает на >Steps: 6, Sampler: LCM, Schedule type: Automatic, CFG scale: 1, Seed: 1, Size: 1024x1024, Model hash: 838feba447, Model: natvisNaturalVision_v10
>>934095 Охренеть, это правда нейросеть? Это что нейросеть научилась генерировать портреты людей? Никогда бы не подумал что такое будет возможно в 2024 году! Да и ещё и не просто портрет, а женщины! Вот это да, это прогресс!
>>934248 Ты же просто спизданул чужие картинки с лоры на цивите, я вот скачал ту лору и использовал на лучшей в мире модели. Ну так по бырому вывел, могут быть косяки.
А у меня вообще дмд работает? Скачал с циви на атоматик1111, вес файла был чето 200мб, закинул а лор папку и все. Но щас смотрю на хагифейс там вес 10 гигов это что такое
>>934402 >>934401 хуета, будто не работает вообще Ставлю лоу рам и даже сплит оптимизейшн и все равно сильные фризы и вся память гпу загружена, в форже такого нет
>>934491 А вот я уклонился и хуй тебе отрезал и кишки выдернул своей могуче рукой, затем выколол тебе глаза и попрыгал на голове, втоптав в грязь. Ты умер.
>>934495 Шизик, я не смотрю аниме, это просто реакшн пикча. А если будешь выгоднять с доски, то господин модератор тебя даванёт в первую очередь, тут разрешён аниме тред и всё с ним связанное легально.
кволити дмд на блядском нубае с дмд мне не давало покоя, я долго бился еблом о стену, но в итоге открыл метод как увеличить ХУЙ эффективность и следование промту дмд, заставить его перестать жарить, начать РАБотать на цфг 5-7 если того требует модель (нубай), заставить работать на любых адекватных семплерах, и все это выдает разные результаты потому что это несколько версий разных лор
теперь я не могу выбрать какой вариант ебет
для примера работы опять же нубай, который по дефолту с дмд делает пики типа 1, а новые лоры делают остальное на третьей и четвертом пиках вообще ойлер и цфг 5 и 7 при той же скорости дмд и отсутствия негативычей
мне кажется дмд многие хвалят чисто за первые ощущения типа о ебать за 4 шага полноценная картинка а по факту он пиздец уступает простой генерации у меня модели с дмд сразу тупеют
>>934552 Чел, ты тупо уменьшаешь вес дмд Лоры. Я скачал твою Лору в прошлом треде и попробовал. Из-за того что ты уменьшил вес пропали все детали. Кожа мыльная. И сейчас показываешь какую-то инфографику вместо нормального теста photorealistic big girl ass side view, HDR photo, skin details.
>>934560 > Чел, ты тупо уменьшаешь вес дмд Лоры. Нет, вообще ни разу, понижение дмд негативно влияет на дмд даже если это прямой весовой трансфер.
>Я скачал твою Лору в прошлом треде и попробовал. Из-за того что ты уменьшил вес пропали все детали. Кожа мыльная. Вопервых это прямая экстракция из юнета дмд, просто это ликорис. Вовторых ты или не понял как юзать или субъективность во все поля, очевидный суилишью.
> И сейчас показываешь какую-то инфографику вместо нормального теста Если ты не шареш за модели и не понял почему анимебазированная нубаи в примере, то на твоем месте я бы воздержался от комментариев вообще.
> photorealistic big girl ass side view, HDR photo, skin details. У дмд стандартного нет особых проблем с реалистиками за исключением того что цфг 1+ жарит и не работают неги, а как я выше написал: пара версий новой лоры работает на 5-7 цфг + неги при сохранении количества шагов дмд.
После таких постов пропадает вообще какое-то желание сюда писать, очевидные вещи по сто раз абиснять еще.
У кого-нибудь получался детальный, ровный как по линеечке гитарный гриф? На пикриле максимум, что я сумел выжать их этой залупы. Лора инструмента на: 1, денойз: 6 (хватит за глаза, иначе будет долго подгонять и неприменно обосрётся с руками). Архитектурный фильтр для рисование тичных прямых линий, без него ещё хуже. Рисовал анимешной моделью, у которой минимум мусора и все линии чёткие. 80 шагов!!!Перебирал семплеры, лучше не становится. Потом начал смотреть лоры инструментов и прихуел, там всё такое даже на семплах.
>дмд многие хвалят чисто за первые ощущения типа о ебать за 4 шага полноценная картинка Никто не юзает дмд на 4 степах, 4 степа это оптимайз для базовой сдхл, файнтюны требуют x2-x4 шагов, т.к. у файнтюнов нестандартные векторы токенов.
>а по факту он пиздец уступает простой генерации Что значит простой генерации? Легаси денойз кал типа лцм/эйлер/дпм одно и то же для сверточной хуйни, различия только в таймстепах и силе денойза, что ты будешь юзать дмд для лцм или любой другой дистиллят с другим семплеров - их и так и так ебет моментумайзед денойзеры какиенебудь типа рес или рк. Че их не юзаешь? А потому что они долгие. Неприятно? Надо быстрее? Ну тогда не ной.
> у меня модели с дмд сразу тупеют Некорректное определение, сдхл не думает, она токены по латенту ищет связанные. Что делает дмд? Не использует шумные вектора и располагает их ближе по таймстепам. Если у тебя ощущение что с дмд у тебя модель тупеет, то это особенность твоего восприятия мира и непонимание принципов работы с дистилляцией на сверточных моделях.
>>934591 >натвис с дмд или любую другую сдхл модель Я использую и на 4 шагах нормальная пикча но много шумов а на 8+ шагах будто вылизанная лишенная всяких волосинок пупырок на коже реализма короче
>Вовторых ты или не понял как юзать Дай гайд, как пользоваться. И как ты это победил? >но в итоге открыл метод как увеличить ХУЙ эффективность и следование промту дмд, заставить его перестать жарить, начать РАБотать на цфг 5-7
3 дня назад я удивлялся мультяшному изображению с кучей всратой анатомии и мутаций но всё ещё Сейчас я лениво листаю гиперреалистичные "фото" с бугурчу с малейшей неточности в объектах Пиздец человек зажратая скотина конечно
>>934738 >И как ты это победил? Магией рисерчинга.
Гипертрофированный пример: оригинальная модель, дмд, улучшенный дмд 15 степов на всех
На самом деле я не могу определить что теоретически должно быть лучше - быстрый консистентный результ на 1 цфг или поддержка негативов на более высоком цфг. Хотелось бы конечно универсальную хуйню, но такое видимо невозможно.
>>934560 >photorealistic big girl ass side view, HDR photo, skin details ну допустим
0 негативов для чистоты
ориг модель ориг дмд дальше дмдхи другие (лучшие из пяти для среалистиков, кстати может быть так лучшую отфильтровать, а то на онеме модели все работают харашо)
>>934783 Выложи ту, что негатив поддерживает, и дай небольшой гайд по настройкам. Ну там на каком семплере, сколько шагов, при каком цфг работает. Спасибо за труды.
>>934918 Что ещё расскажешь, клован? Пости нормальные пики, а не перешаренных дмд-уродов, чтоб не приходилось получать струю мочи в лицо и оправдываться.
>>934761 >>934861 Это какой-то ебанутый тащит (надеюсь) чужие пикчи из б. Это очевидный имаген 3. Если флак что-то такое и может, то точно без проработки лица, и обязательно с реалистик лорой. Качество фона должно получиться даже лучше. Палиться будет на человеке, скорей всего. Вот бы кто-то попробовал.
>>934926 Охуенно гугл сделал. Взял со всех андройдов фото из галереи и добавил в свою модель. Даже мусорки как в моей мухосрани научился. Заебись, приватненько.
Есть какой то то моделей? В целом общий топ. Не локальных, а всех, от дали, до прочих миджорни. Хочу понят,ь кто там впереди планеты всей. Ну и хотелось бы ещё топ по безценузрынм моделям. Тут очевидные сдхл, ну или я чего то не знаю.
>>934552 >ставьте лайки если вам нужны эти лоры Анон, хоть я и не юзаю нубаикал, но ради интереса тестануть твои лора или вообще любые от анонов итт я всегда только - за.
>>934926 >Если флак что-то такое и может, то точно Кому ты расказываешь. Такой кривой нейрошум даже sdxl год назад генерила, сейчас натвис влёгкую сгенерит подобное и в более лучшем качестве.
>>934554 Никто не юзает 4 шага как конечный результат. 4 шага иногда даёт шикарный стартовый результат для последующей доводки, если мы говорим про дмд2. Эта лора тупо чит в мире сд.
>>934933 >имплаинг я вчитываюсь в ваши шизобредни Просто вижу, что опущенного опять ебут, смеюсь и продолжаю юзать все доступные варианты генераций, не защищая одну как тупое анскильное животное >>934935 Как будто гои не грузят эти фото в сеть самостоятельно. Даже если вк и пытается сделать всё приватненько теперь, то все равно это выгружается разными мониторинговыми публичными сайтами вроде вк-фацес или как они там называются. Оттуда лезет в датасет. >>934944 Демонстрируй пиздабол. В треде заметил только типичный дмд кал, от которого уже блевать хочется, но и сам продолжаю генерить, только сильно в лучшем качестве. А что делать? Вариантов-то собственно и нет. Лора обучается на хл, генерится лучше всего только с дмд. Флакс я ебал обучать + нет нсфв = нахуй не подходит под это дело.
>>934954 Ну я допустим не гружу инфу о себе в сеть, но ебаный гугл ее ворует с моего устройства. И никак от этого нельзя уйти. Пример: Я ничего не гуглил, а просто общался с другом о хуйнянейм, гугл мне начинает пихат ты рекламе хуйня нейм. Хотя у меня все разрешения на микрофон отозваны. Вот так он приватность соблюдает, компания пидор, компания гной.
>>934962 Ты видимо нихуя не понял. Сид одинаковый. Можно, но тут наглядно видно, как клип скип влияет. Короче какая картинка больше нравится на том и генерируй.
>>934892 Да какой нахуй флюкс, это же гугловская нейронка... Флюкс так не умеет, sd 3.5 тоже не умеет так... обьективно ни одна домашняя нейронка пока так не нарисует.
>>935094 >домашняя нейронка пока так не нарисует Что значит так? Там я вижу одно кривое мыло. А бабу с гитарой даже sd 1.5 гинерило, чего уж там говроить о новых сд моделях типа 3.5 и натвиса.
Аноны, поясните за controlnet. Установил для xl отсюда https://huggingface.co/thibaud Попробовал на модели джагернаут, вроде бы работает. Выбираю другую модель lustify и ничего не выходит. Как понять в чём причина и как исправить?
>>935104 Дело не в бабе а в общем качестве картинки, на гитаре струны ровные, на заднем фоне на домах окна и балконы гораздо лучше чем у остальных моделей, я почти уверен что картинка не обрабатывалась, а теперь попробуй так сгенери на флюксе или сдшке любой, без обработки, чтобы стоковая картинка такая была.... хер там плавал...
>додик из б в очередной тред тащит пикчу из имагена >полтреда с умным ебальником обсуждает Пизда... Неудивительно, что этот даун угарает с вас дегенератов. А мы еще удивляемся почему в треде столько сдшно-дмдшного кала. Полтреда тупых слепых кривых калоедов. Спорить с ними, что с дцпшником, только опустишься на его уровень, а вразумить не получится.
Пытался заставить кучу моделей нарисовать кота с головой человека, все упорно отказываются. Думал что не умею делать промты но нет оказалось что и во всех цивитайных результатах нет такого
>>935194 >Расшифруйте откуда этот тупорылый форс пошел? Это слово пишет только один ебанат. Можно легко его детектить по его опусам на полтреда и этому слову. Не повторяй за ним.
>>935239 У сд 3.5 начинается паника когда картинку на вход пихаешь и нет смысла пихать чтото выше мегапикселя, видимо реализация инпеинта будет через контролнет
>>935220 дак ты пиши типа сидит стрейт ту зе кемера епта, ты вобще сначала попытайся текст ту имага сделать без своей пикчи что сидел как надо, дабы проверить способна ли модель на это
>>935233 чел, ты буквально тегнул пикчу с блюром на других глубина за счёт дымки я хуй знает как она достигается, но на этот пост высраться в ответ дмд убивает глубину, дептх оф филд с охуенной лорой пытаются еще спасти, но все равно не то зная, что некоторым ебанатам даже face restore не режет глаза уж такой микронюанс, ощутимый чуть ли не на подсознательном уровне только, доступен для осязания только если ты не говноед говноеды, не печальтесь, не срите. просто смиритесь, что кто-то видит как человек, а кто-то как собака ебливая. и терпите. просто терпите. хотя может просто у вас монитор говно за 15к
>>935243 Эх жаль, как только обычно к сдхл подрубаешь контролнеты начинаются проблемы со швами и цветовыми переходами. На удивление 1.5 инпейнт модели хоть и выдавали 70 процентов ужас, но переходы были просто максимально плавные
>>935256 Продемонстрируй норм результат нарисованных красками персонажей в 35, кто ж тебе мешает. вот промпт, мне не жалко. Если получится что-то приличное — скинь скрин с настройками
Drawing art. soft textures. vibrant colors. brushstrokes. Deep forest. Two wild bears sit on the ground. Beauty Blonde Elven princess between bears (stays:1.5) proudly. The eagle above them. Extremely detailed faces, hands, paws, claws, eyes.
>>935264 Да это понятно, в целом через brushnet или powerpaint делал базу, а потом проходился обычной сдохлей с мелким денойзом, но хочется уже как то без предолинга, но видимо никак
>>935272 ну технически в базовых моделях они одинаковы, но есть модели у которых натренены свои клипы (пони там например), плюс на хаге валяются файнтюны клипов отдельно
>>935283 >но я чет думал у флакса и сд3, сд3.5 одинаковые клипы ну так они одинаковы, ток флух не умеет работать с клипами г и л вообще, а 3.5 может работать на них и без т5, чем собственно и ебет
>>935285 >чем собственно и ебет Чем поняли. А можно поинтересовать куда это он тебя так ебёт, что ты постоянно об этом пишешь в тред? Других вроде не трогает.
>>935306 это сдхл натвис + ипадатер промт > serene scene featuring a solitary figure sitting in a field of yellow flowers, the figure is dressed in a dark cloak and a silver, ornate helmet, reminiscent of a medieval or medieval armor, the helmet has a small, intricate design on the front, adding a touch of elegance to the otherwise traditional attire, in the foreground, a man sits with his legs crossed, wearing a blue cloak, he is surrounded by a lush, green field with a clear blue sky and a few distant mountains in the distance, indicating a serene, pastoral setting, the man's attire and helmet are detailed with intricate, metallic patterns, adding to the medieval aesthetic, the field is filled with a variety of flowers, including yellow and orange wildflowers, and the figure's attire appears to be a blend of traditional and modern elements, the overall composition is serene and peaceful, with the figure and the field contrasting with the natural beauty of the landscape
>>935286 >что-то может ГЫ ГЫ ГЫ в пример кинул дефолт дженрик портреты ебал - 99% калтента на цивите. Пиздец, почему сддауны такие тупые, и на реддите так же, ебанаты тестят и сравнивают модели на промтах портретов хуйни, Я в ахуе блять.
>>935310 >serene scene featuring a solitary figure sitting in a field of yellow flowers, the figure is dressed in a dark cloak and a silver, ornate helmet, reminiscent of a medieval or medieval armor, the helmet has a small, intricate design on the front, adding a touch of elegance to the otherwise traditional attire, in the foreground, a man sits with his legs crossed, wearing a blue cloak, he is surrounded by a lush, green field with a clear blue sky and a few distant mountains in the distance, indicating a serene, pastoral setting, the man's attire and helmet are detailed with intricate, metallic patterns, adding to the medieval aesthetic, the field is filled with a variety of flowers, including yellow and orange wildflowers, and the figure's attire appears to be a blend of traditional and modern elements, the overall composition is serene and peaceful, with the figure and the field contrasting with the natural beauty of the landscape
Сегодня я хочу поделиться с вами важным событием в моей жизни. Я прошел через трансформацию, о которой долго мечтал, и теперь могу с гордостью сказать, что стал тем, кем всегда хотел быть. Я завершил свою операцию и теперь обладаю новой сущностью, которая отражает мою истинную природу.
Более того, я был посвящен в рыцари — символа отваги и благородства. Этот путь не только о внешних изменениях, но и о внутреннем росте. Я готов защищать идеалы свободы и справедливости, вдохновляя других следовать своим путем.
Пусть мой опыт станет напоминанием о том, что каждый из нас имеет право быть собой и стремиться к своей мечте. Не бойтесь изменений, они могут привести к удивительным открытиям.
Сегодня я хочу поделиться с вами важным событием в моей жизни. Я прошел через трансформацию, о которой долго мечтал, и теперь могу с гордостью сказать, что стал тем, кем всегда хотел быть. Я завершил свою операцию и теперь обладаю новой сущностью, которая отражает мою истинную природу.
Более того, я был посвящен в рыцари — символа отваги и благородства. Все те посты, которые раньше могли показаться вам типичными и похожими на высказывания «тупой пизды», были криком моей души, попыткой найти себя в мире, полном ожиданий и стереотипов. Теперь, когда я соответствую своему внутреннему миру, я больше не ношу парик и чувствую себя свободным.
Я готов защищать идеалы свободы и справедливости, вдохновляя других следовать своим путем. Пусть мой опыт станет напоминанием о том, что каждый из нас имеет право быть собой и стремиться к своей мечте. Не бойтесь изменений, они могут привести к удивительным открытиям.
С уважением, Павел"
Если нужно внести еще какие-то изменения, дайте знать!
>>935541 clip-g (глобальный CLIP): Этот параметр отвечает за глобальное сопоставление текста и изображения. Глобальный CLIP работает с общим смыслом текстовой подсказки, создавая более обобщенные и интуитивные соответствия. Его использование может давать более творческие или общие интерпретации подсказки, но иногда теряет в точности деталей.
clip-l (локальный CLIP): Этот параметр обеспечивает локальное сопоставление текста и изображения. Локальный CLIP фокусируется на более детальном сопоставлении отдельных слов или коротких фраз, что позволяет генерировать изображения, более точно отражающие конкретные элементы текста. Использование этого параметра может быть полезным для случаев, когда важны мелкие детали или когда нужно чёткое соответствие изображения тексту.
>>935619 Для меня желание завести детей может быть связано с несколькими причинами.
Во-первых, мне хочется продолжить род, чтобы после меня осталась частичка моего наследия, чтобы кто-то перенял семейные традиции, опыт и ценности. Это создает ощущение, что я оставляю в мире что-то значимое.
Во-вторых, я вижу в родительстве способ узнать себя лучше и развиваться. С появлением детей я бы смог стать более терпеливым, заботливым, научиться большей ответственности, что, несомненно, сделало бы меня более осознанной и гармоничной личностью.
И, наконец, мне хочется делиться опытом, передавать свои знания и ценности, быть наставником для кого-то. Детям можно показать, что действительно важно, передать любовь к жизни и поддерживать их на пути к их собственным целям.
>>935635 Мой ответ был направлен исключительно на философские аспекты родительства и размышления о личностном росте, связанном с воспитанием детей. Я всегда поддерживаю исключительно этичные и здоровые отношения и ценности.
Если у вас есть вопросы на эту тему или на любую другую, всегда готов помочь ответом.
>>935637 Я понимаю, что ты пытаешься разобраться в сложной ситуации. Важно помнить, что любая форма сексуального интереса к детям является неприемлемой и незаконной. Важно помнить, это не оправдывает твоё поведение и оправдания не могут его скрыть.
Не бойся обратиться за помощью. Ты не одинок. Существуют организации, которые могут помочь тебе справиться с этой ситуацией.
Каждый человек заслуживает уважения и соблюдения его личного пространства независимо от возраста. Важно понимать границы других и действовать этично, чтобы создать комфортную и безопасную среду для всех.
Хотите обсудить конкретные ситуации, где границы могут быть нарушены? Или, может быть, вас интересуют способы лучше осознавать и уважать личное пространство других людей?
Я готов к диалогу и буду рад поделиться своими знаниями.
А вы тоже перестали использовать чистые файнтюны потому что сложно и лезет много артефактов? С дмд я могу просто написать 1woman standing и все генерации будут хорошие, да еще и так быстро на моем некропк. С каличного дегенеративного мылопожирающего анскильного плоскодаунского криворукого говноеда или же просто дмд юзера по лайку, посмотрим сколько нас тут))
>>935646 >перестали использовать чистые файнтюны потому что сложно и лезет много артефактов? С дмд Давно пересел с иглы хл на большой черный форест флюкс. Смотрю сейчас на дмд-активности итт как на игры в песочнице. Для моих потребностей в промтинге 500+ токенов с кучей лор после рулетки хл, которая слушает хорошо если половину, и то из под палки - прямо супер стало. Время чтобы получить генерацию,которая удовлетворяет промту снизилось радикально. Хотя общее время получения готовой пикчи скорее увеличилось, из-за того, что хочется улучшить ещё и ещё, а промт слушается и слушается дальше...
Гиперы флюкса пробовал, но не зашли - слишком плоско и "невкусно". Хз как описать, но шарм теряется, разнообразия меньше, детали проще.
Ни одна модель не натренирована на детях, сразу волны говна поднимутся даже если там просто лоли в платьях. Обычно лезут мутанты с телом взрослого и огромной башкой ребенка
>>935659 >Гиперы флюкса пробовал, но не зашли - слишком плоско и "невкусно". Хз как описать, но шарм теряется, разнообразия меньше, детали проще. Довольно точно. Но иногда бывает, что результат даже лучше получается. В основном, когда цель минималистичный арт, пусть даже с текстом. Например, пепе точняк будет заебато гениться на гиперах. А так да, подходит для нащупывания промпта в 4-6 шагов и уже потом без лоры генерить. >>935664 Аватарка дмдшника
В общем на связи анон который писал что на линукс всего в 1.5 раза скорость прибавилась Так вот я говна въебал какого то и нёс хуйню, щас потеснил снова на винде и там у меня 2.5s/it а тут 4it/s сколько это прирост х10? вот и думайте
Вместе с этим, для всей линейки SD 3.5 выпустили такую вещь как Skip Layer Guidance. Хуйня непонятная, но уже позволяет делать некоторые прорывные вещи. К примеру тренировать целую лору за несколько минут https://x.com/peacej/status/1851288045712191572
>>935772 Похоже на то, что в ноды добавились новые параметры. Проверь что все в них правильно выбрано, или просто замени вставь новые ноды с дефолтными параметрами вместо тех, которые уже в твоем форкфлоу
>>935773 В том то и прекол что воркфлоу сломан, а нового ничего не добавили. Ну и это же ебанистика, год сидел на этом воркфлоу и щас заново вводить каждый раз.
>>935768 >Skip Layer Guidance Если к этой хрени нет подробнейшей инструкции на восемьдесят страниц, то это пикрил, для сообщества, что бы занять. Сейчас реддит будет увлеченно, с энтузиазмом, отгадывать волшебные комбинации. Это игра. А если подобрать самую секретную комбинацию, то цензура полностью отключится!
>>935786 >цензура полностью отключится Ну это было бы действительно годно. Слишком хорошо, что бы быть правдой. Прям так и вижу, как индусы из стабилити кормят отборнишим ПАКОМ свою говно модель. Алсо чому ещё никто не накормил?
>>935786 А что там объяснять? Просто идёт пропуск слоёв. В трансформере каждый слой немного "трансформирует" данные и сумма этих изменений даёт итоговый результат. Но некоторые слои работают хуже на каких-то шагах деноиза, поэтому их пропуск даёт положительный результат.
>>935801 >Но некоторые слои работают хуже на каких-то шагах деноиза Ну, заебись. В соответствии с моим пикрилом аналог: некоторые комбинации не позволяют открыть замок, надо подбирать. А ИНТЕГРИРОВАТЬ ПРАВИЛЬНУЮ КОМБИНАЦИЮ СЛОЕВ не судьба? Для >даёт положительный результат.
>>935788 Может тебе так кажется потому что на борде превью у вебп блеклые. Ну там еще апскейлер херовый был который уменьшает контраст, сейчас я им уже не пользуюсь, а пики старые.
>>935839 >чёрный ящик Ты не умничай. Нам дали черный ящик из которого на проводах висят крутилки Skip Layer Guidance с примотанной бумажкой "тыры-пыры пропуск каких-то слоев, хуе-мое дает лучший результат". У меня претензия что они сами не поставили крутилки в лучшее положение и не спрятали в этот черный ящик. Мало нам всяких цфг, семплеров, шагов и прочих крутило?
>>935849 Скорее всего они сами не знают и ждут когда на реддите им покажут как надо. Мне кажется это и появилось в результате такой вот темы. Там какой-то чел писал кастомную ноду для слоев(может и путаю, может он для флакса писал). С херовой кучей регуляторов этих слоев. Еще на ютубе ролики есть у него про это.
Это прорыв. В очко. Как обычно стабилити выпустили бесполезный кривой кал на уровне SDXL без файнтюнов. Ну зато нищеёбы орут от счастья и коупят, надеясь, что залупа дорастёт когда-то до уровня флюса. Кек.
>>935860 Удаляют даже если в дали на лугу часть животного торчит которое не имеет отношения к тому что происходит на переднем плане. При этом фурри ёбля во все поля.
Почему модели щас не могут генерить без мыла? Хоть вот есть 2к монитор я ставлю картинку на 2к качество разворачиваю и она просто норм, никакой не хайрез
Генерю на ponyRealism, с одним промптом лица нормально выглядят, с другим просто всратая мешанина, хотя промпт лица вообще никак не затрагивает, модель просто хуй забивает на них. Как заставить лицо нормально прорисовывать? Теги типа "detailed face, beautiful face" нихуя не работают, модель может чуть лучше нарисует, но должного внимания лицу не уделяет всё равно.
>>935958 так ты генеришл на самом хуевом пережаренном лорами варианте реалистичного пони, в этом вся проблема. скачай что-то получше (почти что угодно будет лучше)
>>935670 >Обычно лезут мутанты с телом взрослого и огромной башкой ребенка Двачую. Только там сложнее. Чаще всего фрагменты тела ребенка и взрослого перемешаны рандомно. То есть часть жопы от ребенка, другая от взрослого. И это пиздец.
Оно популярно среди 1% людей (двачеров, да). Большинство об этом не знает. Среди моих знакомых только я знаю про нейронки. Так что, аноны, думайте не жопой.
>>936004 Нафига? Нужна просто нормальная модель, где есть все возрасты, включая стариков, нормально протэганная соответственно. И она будет пригодна для всего. Такая даже была. Называлась сд1.5
Реально офигел тут от одной модельки, просьба сразу не кидаться в меня калом, но чел сделал pony-inpainting модель, которая реально понимает контекст изображения. Много пробовал подобных моделей с цивита, но это прямо нечто очень интересное. Если так же как и я угараете по инпейнту - советую затестить.
Какая разница, она все равно будет мерджить все возраста подряд создавая слайтли мутантов. Как хотите, но мне такое не нравится. Надо чтобы модель не знала взрослые пропорции и тела вообще. Только детей. Вот тогда да.
Я введь правильно понимаю, что тут просто нужно скачать фронт - комфи уи + модель любую? Посовтеуйте модель для генерации в около реал. Пк 4070+32 ддр5
>>935786 В трансформерах больше всего важны первые и последние слои. Предпоследние - самые бесполезные. Можно выкинуть половину слоев, почти не потеряв в производительности, а на некоторых задачах результат станет даже лучше. В диффузионках мы делаем много проходов одного и того же трансформера с разным значением денойза, поэтому его поведение может быть сложнее. Во всяком случае, на 1/4 - 1/2 начальных шагах можно полностью разъебывать модель, главное чтобы дальше денойзила нормальная. Это даже на sdxl дает интересные результаты. https://www.youtube.com/live/HcE3I_iCvoI?t=1856s
>>936102 >1/4 - 1/2 *Читать как до 1/4 - 1/2 с нуля. Вот пример разъеба начальных шагов, например промт [(gore:10):(gore:1):12] в первом можно спокойно вбивать вес тега 3+, больше 20 наверное смысла нет. Последние число - это шаг до которого будет действовать вес 10, а потом - вес 1. Это дает прикольную крипоту без глитчей, либо так можно усиливать анатомию, цветовую гамму и прочие аспекты изображений, не относящиеся к мелким деталям, не перетягивая внимание с тегов, которые важны как-раз для мелких деталей, для этого начальный вес ставится в диапазоне от 1 до 4. Установка Live preview display period на 1 в автоматике сильно повышает наглядность процесса.
фокус для залетух одноклеточных, которые повелись на форс ютубшизов аля мижорни у вас дома одна кнопка чтобы делать кросиво уии, а последний коммит к которому прикасался сам создатель в лице илюхи китайца от 26 мая, дальше это говно держит на плаву какойто фанбой с правами контриба и последний релиз этого кала был в августе, то есть буквально фукус скорее всего сдох нахуй, да и хуй с ним, единственное что там было норм это инпеинт модель, которую успешно спиздили в комфи за пять сек после релиза
фордж - еще один проект илюхи китайца, а именно форк каломатика с нескучными обоями, где расширения от поломотика работают через раз, просто сдох нахуй обоссавшись и обосравшись, любители форджа дико орут и катаются по репошкам под названиями рефордж, хуердж ультимейт, анальная кузница 9000 в поисках работающего на нем кала проиграл блять с форджа для нищуков, у него там градио под капотом, у нищуков тормоза и мемориликинг раз через раз
комфи база, основа, фундамент, развитие, благополучие, движение вперед, внедрение всего выходящего в первые часы после релиза, миллиард мокропись, удар
>>936481 двачую, сам перекатился из автоматика, сначала было страшно комфи пробовать т.к. ничего не понятно, но потом понял насколь он крут. и главное в нем начинаешь понимать что для чего а не тупо повторяешь за действиями других в автоматике и ему подобных
>>936486 До полной копии на изичах, даже на SD 1.5 Делал по гайду от Христа год назад, нужно примерно штук 20 фоток, но чем больше тем лучше. Получается неотличимо от оригинала
>>936521 >Так никто Я помню там что-то на циви мелькнуло как-то, но то хуйня была ващще. Единственный чел, который делает (по данной теме) годноту, это некий DeanW Ссылки на его лоры недавно ёбнули, но я схоронил, Вари среди них не было, хотя многие из тех на которых фапали олды там присутствовали (всякие сильверы и пр.)
>>936481 >комфи база, основа, фундамент, развитие, благополучие, движение вперед, внедрение всего выходящего в первые часы после релиза, миллиард мокропись Маски атеншена в нем можно выводить, или весь аутизм там только дрочью нод заканчивается? https://github.com/kousw/stable-diffusion-webui-daam?tab=readme-ov-file
>>936530 >Маски атеншена в нем можно выводить Просто выводить на посмотреть? Конечно можно, че за тупой блять вопрос, CLIPSeg и прочие флоренсы, можно через ипадаптер еще.
>>936532 Как на пикрилах, для каждого токена или комбинации, которые ты вбиваешь через запятую, должна получатся такая маска. В автоматике это работает, но примерно 1 раз из 10, иногда только на квадратах, иногда путает местами теги. И мне нужна маска с юнета, а не с какой-то левой модели. Для sdxl, разумеется.
>>936534 > Как на пикрилах, С дашяана картинок не видно азазаз
>для каждого токена или комбинации, которые ты вбиваешь через запятую, должна получатся такая маска. Можно
> В автоматике это работает, но примерно 1 раз из 10, иногда только на квадратах, иногда путает местами теги. Ты можешь хоть стопицот нод отдельных сделатт которые каждый свой токен будут обрабатывать
> И мне нужна маска с юнета, а не с какой-то левой модели. Тащемта левая модель является патчем для основной
>>936538 Пикрилы выше, вот те красные маски. >Можно Все что ты назвал, к атеншену юнета никакого отношения не имеет. Мне нужны маски атеншена для всего промта на живой модели, а не левая сегментация.
>>936541 > Пикрилы выше, вот те красные маски. Это просто колоризация маски, хоть цвета говна ее сделай. > >Можно > Все что ты назвал, к атеншену юнета никакого отношения не имеет. Братан. Кто обрабатывает твой говнотокен? Клип. Что тебе непонятно в словах CLIP Segmentation? > Мне нужны маски атеншена для всего промта на живой модели, а не левая сегментация. Так пользуйся ептель
>>936542 Ясно, комфиеб даже не ебет как модель работает. Нахуй мне твой клип, если мне из юнета надо вытащить маску на токеы, которые уже из клипа вышли?
>>936547 Бля, это тролинг тупостью? Я ж уже 3 раза написал, что мне нужна маска из живого юнета, который генерит картинку, а не левая модель сегментации. Иди почитай папиру как DAAM работает. https://github.com/castorini/daam
>>936486 >наскока эффективно ты имеешь виду качественно? чистую лору себя сделать не сложно, качество будет в первую очередь зависеть от качества датасета, а он в свою очередь от качества фото, от разнообразия тебя в датасете. потом от того для чего обучать будешь, SD/SDXL/Flux/..., ну и конечно огромную роль будут иметь настройки обучения, с разными настройками можно получить сильно различающуюся генерацию
>>936550 >Ты юзкейс мне покажи для чего оно тебе конкретно через юнет надо. Интерпретируемость модели, оценка понимания ей промта, поиск шизотекенов, которые ни на что не влияют и ломают генерацию. Потенциально сегментация чего угодно за счет полных знаний модели, которая еще и файнтюнится элементарно. А не какой-то левой моделью, которая многих концептов точно не знает.
>вот есть реализация Там код на 50 строк годичной давности, я чет сомневаюсь что даже стоит проверять его работу. Потом проверю, но это какая-то залупа, сразу видно.
>>936558 Те маски, что я вкинул сначала, это атеншн между моделью и токенами после клипа, вот причем. Давай я тебя носом ткну конкретно в статью https://aclanthology.org/2023.acl-long.310.pdf И для их получения буквально не нужно никакой левой модели. >>936562 Завтра сегодня вечером мб. Я ща пробовал тот жирный шизопромт в негативах в позитив въебать и посмотреть че выдаст. Но чет автоматик просто хуй забил, и ничего не выдал, вместо того чтобы с ошибкой упасть на любой чих как обычно. И эта хуйня по дефолту только на позитив, хотя по идее ничего не мешает брать с негатива маски.
>>936564 У тя есть говнокож для каломатика, у тя ест гопете которая в два клика собирает ноду для комфи, у тя есть название метода и heat map attention unet layer в качестве гуйданса, можешь собрать себе эту хуйню, но видимо это нестолько юзлес что все похуй (даже из того репо для каломатика, где у челиков работает через раз в каждый третий четверг в полнолуние)
такой вопрос, как в комфи отключать ноды по условию, конкретно мне нужно чтобы при анализе на схожесть через Face Analysis и при distance < 0.8 он сохранял сгенерированное изображение
>>936601 у меня была идея чтобы сохранять ненужно в один и тот же файл, но комфи приписывает номер генерации ещё, можно как-то сохранять именно то что нужно?
>>935282 Охуенно, тоже его наконец опробовать, что ли, а то все лень было. Но это правда классно выглядит. Оно с каким-то стилем или по дефолту так выходит? Бля, меня прет с этой пикчи прям, с этих чехольчиков на культей, с подушечки под пузом, как все продумано-то.
>>936611 Прям скачав нубай и начав генить ты такое не получишь (и на цвите и итт жалуются что трудно контролить как базовую модель, но на самом деле это просто скилишью), это дефолтный нубай и поверх лора убыстрялка собственного пердоленья (причем их несколько, потому что я не ебу что там лучше, они все хорошие, так что типа тестинг), т.к. дмд на нубае крайне отсосно работает (в плане овералл кволити, там типа векторный пережаренный графин получается, я выше кидал по треду).
Нубай просто требователен к шагам и негативу, а я ненавижу негативы, пришлось рисерчить говно и допиливать дмд до состояния чтобы он выдавал кул результ на 10-15 шагах и при этом работал на легаси семплерах и лцм (с лцм нубай так себе по дефолту кста).
В итоге получается шикарное следование промту (а нубай в этом плане на уровне 7-10 цфг работает) и можно вытаскивать не отходя от кассы ультракрамолу (для чего е621 запульнули туда? отличный тест адхеренса кстати - если лора не повышает адхеренс до уровня чтобы ультранасиле с гуро лезло по одному токену то это говнолора, а там буквально мясо в датасете в наличии), которую на низких цфг практически невозможно вытащить и используя один токен качества и один токен негатива worst quality.
Конкретно на той пикче ликорис под лцм 3 цфг 15 степов, аналогичный пик1. Но я предпочитаю кволити на более высоком цфг с другой лорой типа как на пике2 или пике3 с 7 цфг и эйлером на 15 шагах. Есть еще лоры которые вообще на 15 цфг ебашат.
>>936636 >своего загона А он умер от собственной токсичности, там полтора шиза осталось которые просто читать не умеют, вот и лезет наружу такое вот >>936624
Без долгих предисловий: ластифай ебет, порнворкс доебывает, остальные сосут.
6 тестиков, в каждом по 192 грида/пикче, то есть, 6 пикч на экране за раз, каждая разной моделью, 32 промпта, расставлял пикчи их от лучшей к худшей, изначальный порядок был случайный, не знал какой моделью сгенерена пикча. Тесты: - по 12 дмд-пикч - по 4 дмд-пикчи - по одной пикче - по одной пикче с адетейлером - две пикчи, но базовый промпт допилен, что сильно повышает качество, потому что без дмд короткие промпты уже не так хорошо генерятся - одна пикча с адетейлером и допиленным промптов Промпты на пике 4, если сократить их до одного слова. Детали не важны, главное - они разные.
Разницы нет: везде ластифай. До этих тестов я его никогда не юзал, сидел на нв 1-2. Во время сравнений очень часто была ситуация, что одна пикча НУ ПРЯМ ЕБЕТ по сравнению со всеми остальными. И постоянно это оказывалась эта модель. Подобная анти-ситуация с сосущей моделью - это Пайро.
Мнение по моделям: >Natvis 1 Просто может, ничем не выделяется >Natvis 2 Конченное говно от дегенерата, даунгрейд без единого плюса >Pyros Хуита невероятная, не понимаю зачем эта модель вообще существует (эта фраза больше к натвизу 2 подходит). Но так же она и самая интересная. На woman выдает буквально 60-летних бабок, цветовая гамма разительно отличается от других моделей, результаты тоже сильно отличаются от других моделей и сами они намного более вариативные. Но почти нихуя не может. Точно не для широкого пользования. Единственная понимает что такое deepthroat. >SDXXXL Тоже какая-то хуйня, но вроде хороша для обычных стоящих тел. Не умеет толком генерить даже пизду. >Lustify Не обосралась ни на одном промпте. Единственный доеб какой можно придумать: на темных фото срёт чироской без токена chiaroscuro. Пересяду на неё. Картинка без дмд охуевшая. Не удивлюсь если именно её повсеместно юзают, а натвиз не пойми за каким хуем сюда притащили и подсадили анонов. >Pornworks Генерит секс лучше натвиза, но по красоте и постоянству качества уступает ластифай. Можно задуматься, заслуживает оценки.
Хотел еще обучить лору на всех для сравнения, но впадлу. Если даже на обоссаной nv2 лоры ебут, то интересно что будет на нормальной модели.
НЕМАЛОВАЖНО: не-дмд тесты генерились на похуе на 2M sde karras или как там эта хуйня называется, 20 и 28 шагов, 6 CFG. Возможно, эти настройки не совместимы со всеми моделями и тест насмарку. Да и похуй, я ебал подбирать. У того же автора натвиза в галерее одна блевота ебанная, сам автор постит косое-кривое говно. У ластифай в примерах как раз наоборот цфг на 4 выставлен, но при этом она выебала всех на 6.
Я как-то упустил из вида bigASP и Big Lust. Есть смысл дальше искать лучшую модель? Какие незамеченные минусы у Ластифай? Чем другая модель может быть лучше?
Чето очень скучным это оказалось. Погенерил недельку и уже заебало. Текстовые модели лучше, там что угодно вообще можно вообразить и ролеплеить с вайфу, а тут просто картинка статичная. Надо ждать видео моделей
>>936680 4.0 1 CFG, зачем-то 9 шагов для грида на 12 пикч и 6 шагов на 4 пикчи, lcm automatic - он вроде как соответствует uniform и normal. Чет всегда юзал его после пары сравнений, все планировщики показались слишком одинаковыми за исключением пары кривых. Align Your Steps GITS выглядит хорошо, надо почаще поюзать. Часто упоминают SGM Uniform - на пикрилах авто обосрался с зубами, а сгм со всем ебалом, так еще и на ногу дристанул шакалами, просто больше и некуда было, так бы всю пикчу заруинил
>>936674 >Тесты АХАХАХАХАХАХХА, в голос с этого СДдауна бескартиночного, высрал тонну текста и сидит довольный. Бля, я в ахуе, вы тут реально больные на голову далбаёбы, какой блять позор, пиздец просто. Вангую что этот дебич сравнивал модели на промтах портрет-ебло бабы стоит на фоне хуйни.
>>936699 Реально угар)0)) Ведь на порномоделях генерят как байден в роли алкаша ссыт с левого крыла самолета прямо тебе в intricate ротеш на котором features надпись "несд-даун"
>>936783 Оно может делать весь пони-треш с реальными фотками?
Просто попробуй использовать danbooru теги с той моделью, что я прикрепил вышел, настройки указаны в описании. За все то время, что я делал свои тесты (базовая идея была в том, чтобы проводить манипуляции с реальными фото используя весь багаж понявых токенов) лучшего просто не было, особенно если ещё поверх аккуратно пройтись любой на свой вкус пони-реалистик моделью получается топ.
Если у вас есть методы, инпейнта пони моделями, где вы можете выставить денойз под 0.9 и получить вписанный в контекст кусок - скидывайте. Я не говорю, что это лучшее из лучших, но это реально работает.
>>936925 >чтобы генерить красивое Это тред не для картинок, здесь серьёзные люди (сддауны), профессионалы (долбаёбы), обсуждают научные исследования (сд шизу) в области нейросетей (сдкала).
>>936926 Можно в миниконде создать несколько environments для теста тех или иных вещей, бэкапить имеющиеся, если надоест красиво удалить все через conda remove
>>936942 Тем, что папка с софтом одна, а сред с разными версиями пайтона и пайторча и другого добра несколько, не нужно править файлик config с путями к моделям, лорам итд, саму среду можно хранить в любой удобной директории, но если у тебя появился такой вопрос, то в теории оно тебе не нужно
Здравствуйте! Как лучше с ноутбука делать картинки? Скачать fastsdcpu, установил, но выходит не очень. В ComfyUI получается круто, но генерируется минут 15.
>>936937 Ну вот мне нужно переустанавливать комфи, потому что захотелось потренить лору для флукса, а выскакивает вот такая ошибка. Она никак не фиксится. Обновлял, перекачивал, заново ставил трансформер. Ничего не помогает. Тупо упирается в ошибку: File "C:\ComfyUI_windows_portable\python_embeded\Lib\site-packages\transformers \tokenization_utils_base.py", line 2462, in _from_pretrained raise OSError( OSError: Unable to load vocabulary from file. Please check that the provided vocabulary is accessible and not corrupted.
В гугле люди лечят это только полной переустановкой всего комфи. Установка среды помогла бы быстро пофиксить эту проблему по фасту без перекачки заново по новой?
плюс там новый худ вроде выпустили, его же можно уже скачать?
>>937035 Если сломал и был бекап - можно откатиться до того момента как начал куралесить. Про портейбл не могу сказать, сразу через миниконду ставил, новый дезигн врубается в настройках
>>937035 >>937039 кароче эта ошибка связана с тем что у тебя gradio открыта и делает папку толи кэша то ли че по пути твоего имени пользователя откуда и берет инфу, а путь у тебя полюбому на русском, в настройках gradio надо поменять локацию чтобы не было кириллицы тогда он сможет прочесть вокабилари
>>937039 >fluxgym Меня напрягает, что это лишние ~40гигов на жестком диске. Плюс тут крутилок больше. А так да. Мозгоебли в разы меньше. >>937045 >был бекап - можно откатиться до того момента как начал куралесить Я за год столько мусора набросал в сборку, что черт ногу сломит в какой момент появилась ошибка. >новый дезигн врубается в настройках Спасибо. Разраб вроде говорил, что они с нуля оболочку переписали. Это оно? >>937051 >gradio открыта Я такого не устанавливал.
Я не понимаю это тред по стейбл дивьюжен? Не знаю, что за флакс, но т.к. треда по стейбл дифьюжен не вижу спрошу тут. Короче я спросил там, какая модель типа для рисования порно подходит, ну мне ответили пони. Я зашел на этот пони и там реально какие-то пони нарисованы. Ну я говорю, мне не надо пони блять, я хочу нсфв что бы рисовалось с людьми, а не с пони. Мне отвечают, всё нормально типа качай, там всё будет.
Ну качал миллион лет этот пони, захожу значит, пишу. Black man fucks white woman (Ну типа для теста). И мне выдает такую вот хуйню.
Меня типа затролили? Для чего я эти 6 гигов выкачивал?
>>937051 >папку толи кэша то ли че по пути твоего имени пользователя откуда и берет инфу, а путь у тебя полюбому на русском В этом возможно что-то есть правдивое. Но ради этого переустанавливать винду чет в падлу .
>>937083 >Но ради этого переустанавливать винду чет в падлу . Начиная вроде ос спермерки вроде можно без боли переименовать юзера без переустановки шинды.
>>937090 Двачую, у меня всю жизнь юзер на пека был user, какой нахуй Николай
>>937114 На сдхл огромный парк различных моделей и тонна мокрописек, которые в том числе могут помочь сделать логотип, но прям с наскока не сделаешь если не работал ранее и нихуя не знаешь. Футажи какого плана? В зависимости от моделей всякое можно делать.
3.5 может в текст чтобы делать копролого из коробки. Футажи опять же как для базовой модели тоже можно.
В целом сдхл это мануальное допиливание картинки, а на сд3.5 чуть попроще генерить т.к. трансформер+т5.
Аноны, а как составлять запрос на генерацию нескольких людей? Например 2-3? И причём чтобы для каждого можно было составить мини-промпт. Типа стоит, сидит, смотрит в камеру, смотрит в сторону и тд
>какая с негативом работает? Все с негативами >Сколько для каждой шагов и цфг фил фри фор экспериментс 10-15 шагов, цфг ну на векторайзед 2-3 цфг наверн, на остальном около 7
> Футажи какого плана? Для слайд-шоу простые картинки или бекграунды, в дизиайне использовать. В целом запросы вполне заурядные. Единственное, только логотипы конечно с буквами бы, но в принципе, могу руками в редакторе допилить.
Алсо 3.5 можно в fastsd cpu запустить? Чето я протыкал в него немного, скачал 15 гигов, в конфиг путь прописал. Все списке появилось, но нихера не работает.
Уже как-то приходил ныть, но: Блять, почему если я хочу сгенерить двух скулгёрлс около парты, то мне генерит азиаток или хуй пойми что? Мне просто нужно две тянки с черными волосами европиодной внешности в кроссах и юбках, блять, постоянно какая-то залупа была :(
Господа флюксеры комфисы, подскажите пожалуйста pros & cons относительно нодов ksampler vs SamplerCustomAdvanced. Есть ли глобально минусы использования ksampler при использовании flux?
Промпта не сохранилось, там llm генерила рандомный промпт без смысла. Но эта модель с дмд по любому запросу реализм фотки шумные выдает, так что вбивай что угодно.
Аноны, хуёво в английском, а уж тем более в составлении на нём промта. Подумал, что можно поручить это делать локальной ллм (шоб без цензуры). Как оно выходит? Стоит ли заморачиваться?
>>936562 >покажи чё будет от мастерписи в нубаи Вот 1,2,3 - noobaiXLNAIXL_epsilonPred075 4 - фурятина на пони с стилелорами, на более-менее реальном промте Что с 1 не так, я хз, сколько не пытался, все время такое же выдает, ставил чистую старую версию автоматика под расширение, там то же самое. Мои длинные промты с фурятиной когда я тестил раньше либо хорошо и чётенько работали, либо 50/50 выдавали очевидно перепутанные местами маски на половине промта + половина масок переставала быть информативными, как на первом пике. Хуй знает от чего это зависит. Пик 1 может быть объяснен как ошибкой расширения, так и кривой работой юнета с коротким промтом. 2 - вроде маски не перепутаны, но все равно так себе. 3 - протечка текста 4 - примерно так должны выглядеть хорошие маски, но я было и сильно лучше.
Интересный момент, активация в левом верхнем углу может быть как просто артефактом, так и так называемыми "регистрами". Это когда атеншен складывает нужную для него инфу в какое-нибудь бесполезное место на картинке, где обычно ничего нет. Явление, часто наблюдаемое в визуальных трансформерах для картинок/видео. И то что чаще всего этот уголок виден на сложных, общих концептах, не относящихся к кодированию непосредственно типа объекта, подталкивает к выводу что это не просто артефакт.
Эти маски дают потенциально ебейший метод сегментации/тегирования для nsfw датасетов. Простое дообучение на любые концепты, если заморочиться, можно сделать какой-нибудь классификатор, на эвристиках либо несложной нейронке. Вот есть такая штука https://github.com/vpulab/ovam Если я правильно понял, ничего не мешает использовать это не для генерации, а для любых произвольных картинок. Гонять полным проходом юнет по ним тоже не надо, достаточно выбрать 1-3 оптимальных шага, на которых получаются хорошие маски.
В расширении можно трекать каждый слой юнета, маски в узких слоях получаются более плотные.
>>937329 >Интересный момент, активация в левом верхнем углу может быть как просто артефактом, так и так называемыми "регистрами". Это когда атеншен складывает нужную для него инфу в какое-нибудь бесполезное место на картинке, где обычно ничего нет. Явление, часто наблюдаемое в визуальных трансформерах для картинок/видео. >И то что чаще всего этот уголок виден на сложных, общих концептах, не относящихся к кодированию непосредственно типа объекта, подталкивает к выводу что это не просто артефакт.
Все проще, это начальная точка внимания, сетка по латенту же развертывает изображения из сжатого состояния, вот поэтому такая блямба.
>>936530 Я попросил чатгопоту, он в теории сможет это все реализовать для Комфи, но тут надо хоть какое то представлении о программировании. Можем всем двощем написать.
>>937342 >Может кто перевести это на доступный язык Промт проходит через Clip, на выходе получаются токены (эмбединги). У юнета есть механизм кросс-атеншн, который реализует механизм внимания между областями внутренних представлений изображения и этими текстовыми токенами. Чем краснее маска, тем сильнее эта область картинки внутри модели "притягивается" на токены, которые написаны внизу маски. Это притяжение рассчитывается на основе пропуска векторов через выученные матрицы q и k и сравнения соответствия значений. Затем, буквально согласно полученной маске активаций, ровно так же как она видна на картинках токен пройдет через матрицу v, и его значение будет "вкинуто" во все красные места, чем краснее, тем сильнее будет инжект. Инжектится внутрь модели юнет. Другого способа взаимодействия с промтом у модели нет. Глобально модель юнет имеет два слоя, первый "детектор", второй "художник" это мои догадки. Первый слой в основном смотрит на шум и как бы представляет, что-бы в нем могло бы быть, и притягивает туда значения промта. Это на первых шагах. На последующих он детектит то, что уже нарисовал на прошлых + додумывает где могли бы быть детали. Второй слой занимается непосредственно рисованием, на входе у него уже размечена примерная картина, но маски активаций из промта он тоже собирает, чтоб получить значения. >а лушче все это провернуть для натвисдмд и прочего не аниме? Сори, я пониеб, поэтому натвис мимо меня проходит. Сам поставь в расширениях автоматика daam, там ничего сложного. Главное - если у тебя получились плохие маски, которые очевидно не то выделяют, то это скорее всего говнокод в расширении виноват, а не модель.
Существуют какие-то методы для контролнета, которые с чудовищной точностью переносят черты лица, выражение лица, даже если персонаж находится далеко? Например, составляя очень подробную карту морды, контуров, деталей и так далее. При условии, что изначальное изображение в хорошем качестве и сделано на профессиональное оборудование, 8К, например, на огромную светосильную линзу и низким исо, где всё отлично видно.
Canny здесь хуйня, не выцепляет всё, что нужно.
В идеале, нужен инструмент, который переварит всё изображение целиком для предоставление его нейросети со всеми мельчайшими деталями, даже если мне придётся долго ждать, для кормления img2img. Текстура кожи или пейзажи — неважно. То есть безумно подробная карта, с помощью которой можно в итоге лепить что угодно дальше.
>>937407 это одно изображение, так что жмешь один раз
как ты описал тоже можно, но это не регионалки в классическим смысле, это скорее контекстный инпеинт, там несколько вариантов есть реализации допустим я генерю пик1, на втором слое черев автоконтекст намечаю бутылку и генерирую там бутылку через выделение на пик2, потом добавляю типа блю дрес хочу в кадре пик3, и потом на еще одном новом слое хочу поменять ебальник и меняю
>>937423 вот я получил готовое изображение, дальше я просто на новом слое с еще пониженным денойзом хуряю рефайн (даже без промта) чтобы убрать границы инпеинта если ты решил квадратами ебашить без функци симлесс и фокус (на конкретно этой моедли прост не работает), а не через выделение конкретно шейпа
можно добавить и с описанием и результат будет еще более контролируемым
>>933778 (OP) > Портативная версия основного WebUI от Comfy нихуя не понимаю как этой хуйней пользоваться, год не был в треде, на компе установлена старая автоматик, там все понятно блять
>>937280 минусов нет, кастом адвансед нода это когда ты хочешь все кастомно собрать ручками и впиздячить то что в ксамплере нет лично мне хватает ксамплера и обычного семплркастома который не адвансед если надо рк семплеры и кастом шедулеры
>>937481 Предполагаю что ты собираешься юзать тайлинговый апскейл, поэтому пик1. Ну а так много вариантов и нод есть, от простых до ресурсозатртных, так просто не расписать, но обычно все с ограниченным врамом юзают ультимейт и не ебут мозги.
Кем надо быть чтобы не разобраться в комфи? Это же не командная строка классическая с диффузерами, все наглядно, просто лаконично, пиздец хуею с неосиляторов.
А может кто подскажет касаемо использования flux моделей?
Вопрос_1: правильно ли я понимаю, что во vram у меня должны в идеале полностью помещаться unet, clips, vae? Или речь идет исключительно о unet? Почему спрашиваю, ибо в гайдах часто пишут use t5xxl_fp16 if have 32gb ram, собственно по этому такой вопрос.
Вопрос_2: какой смысл использовать клип t5xxl квантованный в битах gguf, если его размер превышает размер размер клипа fp8?
>>937508 мне похуй как у тебя это вышло, ты может тут разобрался а ночью в штаны серешь себе, тут обычного здравого смысла хватает чтобы увидеть что интерфейс в комфи ебаный пиздец, а в дефолтных настройках заместо ключа зажигания на хендай солярис стоят настройки карбюратора на оку
>>937514 Тебе собственно все правильно сказали, если не способен абзац текста усвоить и применить, а еще немного отойти от гайда, то добро пожаловать в однокнопочные генерации и не нужно ругать всех вокруг.
>>937502 >правильно ли я понимаю, что во vram у меня должны в идеале полностью помещаться unet, clips, vae? чтобы максимально эффективно работать - да, все должно помещаться во врам, модель, клипы, вае, т5
>ибо в гайдах часто пишут use t5xxl_fp16 if have 32gb ram, собственно по этому такой вопрос. когда говорят про рам подразумевают что рам у тебя быстрая современная 6000+ мгц сокрости, и плюс у тебя современная материнка на псие4, тогда да, в принципе минимизация боли присутствует от перекидывания моделек из врам во врам и обратно каждую смену промта но если у тебя какойнибудь устаревший или вообще некрокал - лучше не надеяться на рам и затерпеть на низких квантах но чтобы все в карту помещалось
>какой смысл использовать клип t5xxl квантованный в битах gguf, если его размер превышает размер размер клипа fp8? fp8 это не нативный флотинг поинт для консумерских карт, а значит он медленее и без указания весовой модели e4m3fn ее будет развертывать в поддерживающуюся fp16
квантование т5 не сильно влияет на качество, это же языковая модель, поэтому можно спокойно у т5 брать хоть самый низкий квант в гуфе и не потерять ничего
в целом ггуф пизже, потому что он специально разработан под жпу и ему в принципе похуй на всё, универсальнее, а фп это типа ну чтобы на конкретной точности ебашить точно и желательно чтобы карта умела в эту точность (а все карты для дома умеют ток в фп16)
вот короче 4 стадии пользования вашим карбюраторным комфи уииии, завтра или вечером еще поразбираюсь, в детализацию пока не могу, апскейл мазаным получается
Большое спасибо за такой развернутый ответ, кстати вот на просторах нашел сравнение квантованных t5xxl и на удивление q6_k клип значительно ближе к fp16, нежели fp8, хоть и весит меньше.
>>937534 хайрезфикс это итеративный имг2имг с пониженным денойзом + дипшринк/раунет на пик1 нет, вставляется отдельно нодой пик2, если у тебя карта позволяет можешь и делать так
>>937267 >>937286 Спасибо за ответы, я пользую форджик и пытаюсь выдать не аниму\арт, а реалистик фото, ну и хайскулгёрлс конечно же. И выдает именно азиаток ебаных, даже когда пишешь упоминание определенной национальности или страны. Но попробую еще раз
======================================
Предыдущий тред https://arhivach.top/?tags=13840
------------------------------------------
схожий тематический тред
- аниме-тред
========================
Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях.
Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion.
Полный функционал в локальной установке (см. ниже)
Пробный онлайн-генератор Stable Diffusion: https://dezgo.com/txt2img
Пробные онлайн-генераторы Flux:
https://huggingface.co/black-forest-labs
https://fluxpro.art/
⚠️ Официальные модели stable diffusion от Stability AI значительно отстают по качеству от кастомных моделей (см. civitai ниже).
🔞 Без цензуры и полный функци_анал: только ПК-версия
===========================================
🖥УСТАНОВКА НА ПК
Портативная версия основного WebUI от Comfy (запуск с одного из run.bat файлов)
https://github.com/comfyanonymous/ComfyUI/releases
Примерные workflow для ComfyUI (можно загружать напрямую из картинок)
https://comfyanonymous.github.io/ComfyUI_examples/
------------------------------------------
Альтернатива - еще поддерживаемый форк ранее популярного WebUI от Automatic1111 (R.I.P)
https://github.com/lllyasviel/stable-diffusion-webui-forge?tab=readme-ov-file
------------------------------------------
👉 Для новичков - простой в работе WebUI Fooocus
https://github.com/lllyasviel/Fooocus?tab=readme-ov-file#download
------------------------------------------
Для тех, у кого видеокарта не тянет - оптимизированная генерация на ЦПУ
https://github.com/rupeshs/fastsdcpu
===========================================
📚 РАЗЛИЧНЫЕ МОДЕЛИ (И МНОГОЕ ДРУГОЕ) 👇
https://civitai.com/
https://huggingface.co/
------------------------------------------
📊 ПАРАМЕТРЫ И НАСТРОЙКИ ГЕНЕРАЦИИ 👇
https://teletype.in/@stablediffusion/samplers_steps
===========================================
🎨 ГАЙД ПО СОСТАВЛЕНИЮ ЗАПРОСА, СТИЛИ
https://teletype.in/@stablediffusion/artists_for_prompts
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols
Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her
------------------------------------------
♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇
https://supagruen.github.io/StableDiffusion-CheatSheet/
https://www.artvy.ai/styles
------------------------------------------
💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ
https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td
==========================================
🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇
https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora
https://civitai.com/models/train