24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Stable Diffusion Flux тред X+131 ====================================== Предыдущий тред >>954566 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожий тематический тред - аниме-тред >>957112 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
>>957883 → все fp8 flux веса, которые весят ~11 гб или меньше требуют дополнительно t5xxl+clip. они сидят в ОЗУ компа и перекидываются в видеопамять при надобности (при изменении промпта). насколько долго? ну хз, вот как на видео выглядит. если у тебя pci-e 4.0 то еще быстрее должна быть смена моделей.
>>957906 > если у тебя pci-e 4.0 Я паприколу запускал на псие2 с 1600 мгц рамкой 32 гига чтобы в карту все не влезало, у меня клип считался по минуте. Нирикамендую на аутдейтед железе такое делать.
>>957905 >0 аргументов кроме безпруфных падений и градио Да мы поняли что красноглазики порвались Когда там кстати завезут производительность? В фордже все быстро генерит
>>957917 >у меня клип считался по минуте Ну в смысле пока модели поменяет, пока пропердит клип, пока обратно все загрузит. Для такого надо действтиельно псие 4 и 6мгц рамку.
>>957905 >>957910 Очень милая подборочка постов (один из которых написан комфиюзером), но я-то помню, как половину прошлого треда обсуждали неспособность анона запустить комфи, необходимость откатываться на старую версию и все в таком роде. Но в этих случаях сам анон виноват, верно? Скиллишью у него.
>>957918 >Когда там кстати завезут производительность? >чушка на градио чето за производительность вякает ору, проверь не случился ли отвал изза протечки памяти >В фордже все быстро генерит форджкал это фронтенд просто, он сам ниче не генерит, дурында дебильная
>>957923 >обсуждали неспособность анона запустить комфи >Но в этих случаях сам анон виноват, верно Конечно, он не смог заглянуть в командную строку и срал вместо этого в тред, как типичный форджпоносник. >необходимость откатываться на старую версию Ниразу не откатывался на старую версию, реально скилишью после каломатиков у пацанов, соболезную.
>>957924 >отвал изза протечки памяти Нихуя что только не придумает комфиговноед, лишь бы по кнопочкам не тыкать У вас там ещё и промпты не сохраняются и ещё какая-то хуйня, кто ж виноват что красноглазики ломают то что работает из коробки хех >форджкал это фронтенд Ну да, поэтому в комфикале генерация медленнее, а автоматике ещё медленнее
>>957923 >Очень милая подборочка постов (один из которых написан комфиюзером) Комфи насрало тебе штаны, да чтож такое. Вот еще бетонной базы треда основы фондейшена.
>>957928 >У вас там ещё и промпты не сохраняются У нас промты ллмки пишут, подключенные в комфи, шо с ебалом, фордлох с (((((masterpiece,masterpiece,masterpiece, бля отвал)))))?
26 секунд фордж, 15 секунд комфи. повторная генерация одного и того же промпта с одинаковым сидом в обоих GUI, чтобы подсчитать чисто скорость генерации, исключив влияние загрузки flux с диска и работу t5xxl модели.
>>957964 Таблетки забыл? Мозги от кума вытекли, не видишь, что постишь уже? Форже он первым рекомендует, но при этом не страдает твоей религиозной фанатичностью, что что-то одно лучше.
А есть нейросеточки, которые так же просты в использовании как и Кандинский от Сбера, но лучше? Я пробовал Бинг-ом попользоваться, но они поняли, что я с Тора сижу и приостановили аккаунт, затребовав телебон.
>>957972 у меня изначально фордж был, так что я уж достаточно старался там подкрутить быстродействие. потом перешел на комфи и оставил фордж как запасной вариант (приложение для андроид к нему коннектится по api, удобно на мобиле картиночки генерить)
>>957976 >А есть нейросеточки, которые так же просты в использовании как и Кандинский от Сбера, но лучше? То, что у тебя на пикчах уровень херовой полтарашки. Что угодно будет лучше.
>>957986 Пикрел в пике около 9 гигов (6.7 сдхл, 2.5 юнион, и по мелочи говно). В принципе можно затерпеть на 8, но лучше сконверти нужный чекпоинт в FP8, изи минус 3.5-4 гига использования врама и тогда точно влезет всё.
>>957991 На второй Захарова или Брежнева, или все вместе?>>958039 >Следовал Всё равно ты безрукий мудак, ничтожество, наверняка фукучер-ниосилятор, сдохни пидар.
>>958043 > а у тебя дев, её надо 20 шагов минимум. Ну и гайденс с цфг Вот я дурак. Ну я же видел, что картинка не завершена, ой бляяя...... >>958044 > наверняка фукучер-ниосилятор, сдохни пидар. Всё так, позор мне.
Давно не следил, посоветуйте достойные модели под малое количество шагов (4-8). SDXL, Flux или Пони, лол не суть, просто интересно узнать чего хорошего появлялось за последние месяцы.
Есть какие-нибудь подводные у того чтоб в промпте было дохуя новых строк? Мне так удобнее ориентироваться, разбив на части по смыслу и важности, чем когда всё в одной строке. Слышал что вроде новая строка работает как запятая, надо запятую в конце тогда ставить? Ещё вроде запятые без промта нихуя не делают, хуже от того что они в конце строки быть не должно, правильно? И ещё, есть разница между пробелами после запятой и их отсутствием?
>>958313 Всё сильно зависит от модели и гуя. Что васян в твоём фронтэнде задумал, так и будет реализовано понимание промпта. Так же у каждой модели есть рекомендации, читай ридми к ним. Важна даже последовательность типа токенов.
>>958317 >Тут есть прям PRO 80lvl в SD и фотошопе? Здесь 100лвл считаются залетухми-говноделами из /б, итт в основном профессионалы 40+, но занятые и нихуя может отвечать на твои нубовопросы только самый свободный.
>>958319 Ну ЮИ, комфи. А насколько последовательность вшитая в модель важна? И как это будет работать с использованием новых строк? Там разве не что-то вроде супер хуёвой ллм(клип), которая просто текст взвешивает в меру своего понимания? Я вроде делаю не так как в ридми, но всё работает, ок.
>>958323 > не так как в ридми Я чёт повнимательнее почитал и там автор(нубаи) сам своим же инструкциям не следует вообще. Так что сомневаюсь что это сильно важно. Пишет в гайде порядок для промпта и сразу же после в примере делает не так как сказал.
>>958307 >>958306 Мде. Ну и кал. Хочу генерить эротишные фотки. Голый сисек и нолый писек трже будут присутствовать на жтиз фотокарточках. Лоры то я сам найду. А чекпоинт какой брать для подобных дел?
>>958327 >Пишет в гайде порядок для промпта это порядок тегирования датасета же, дядь
ты можешь как угодно токены вызывать, но если они не имеют указания веса дополнительного (кроме ультра сильных токенов типа girl, loli, man), то будут добавляться как бы последовательно как написано (но одномоментно с точки зрения генерации) в силу возможностей сетки соединять концепты или трансформировать их (если dit модель)
чел выше писал что "Что васян в твоём фронтэнде задумал, так и будет реализовано", это в принципе не совсем так, потому что в основном это обычная средневзвешенная конкатизация токенов по дефолту (но можно накачать нод где можно менять принцип, там их не много в целом, штуки четыре или чето такое)
кароче не забивай голову хуйней, не шизопромти просто и будет все ок
помимо этого есть BigAsp (CocksXL если членодевки) Rsm Embrace The Suck XL LUSTIFY! от местного анона (бигасп + пирос + файнтюн) Pyro's NSFW SDXL (но он ебнутый, токенликинг ебейший и пиро видимо сдох что аж недотренил на самом деле этот шиз пошел дрочить флюхкал) PornWorks Real Porn и PornWorks Sexy & Beauty от порнворкс Anteros XXXL Halcyon (чисто софт и всякая фотоательешка) вроде все на данный момент из тру нсфв
>>958334 Ну про веса и то что начало важнее я знаю.
> не шизопромти просто и будет все ок Я ещё вспомнил что некоторым моделям же вообще надо натуральным языком пропт писать. Так что тут явно больше понимания нужно чем просто не писать как попало.
> это порядок тегирования датасета же, дядь Да вроде нет. Мне кажется автор просто мудак и сам как попало пишет. I suggest usually writing prompts in the following order: number of characters (1girl/1boy), character name, artist prompt, scene/environment/camera angle, action, expression, items, quality prompts. ... Here is an example of an image tag Plain Text 1 girl,(klee \(genshin_impact\):1.2 ),blonde hair,(alternate costume:1.2),(foreshortening ),smug,mesugaki,hand to own mouth,half-closed eyes ,[[artist:wlop]],[ningen_mame],[ciloranko],[sho \(sho_lwlw\)],[[tianliang_duohe_fangdongye, as109]],(azuuru,torino aqua,(fuzichoco,nobaba:1.17),ask \(askzy\):1.15),dynamic angle,depth of field,high contrast,colorful,detailed light,light leaks,beautiful detailed glow,best shadow,shiny skin,cinematic lighting,ray tracing,female focus,+++,open mouth,1girl,bare legs,black ribbon,blonde hair,blue skirt,blush,braid,fang,feet out of frame,hair ribbon,jacket,long hair,looking at viewer,multicolored clothes,multicolored jacket,pleated skirt,ribbon,shirt,simple background,skin fang,skirt,smile,solo,twin braids,white background,yellow eyes,yellow shirt,(((masterpiece,best quality,newest,absurdres,highres)))
>>958322 Ну базовый левел это буквально денек посидеть, углебленный ну неделю. Если прям совсем упарываться и всё вообще занюхивать в том числе обучение - ну месяц со всей практикой. Но это я с высоты трех лет генерирования смотрю, я необъективен в отношении новичков, умножай на какое-нибудь число мои варианты.
>>958339 >Я ещё вспомнил что некоторым моделям же вообще надо натуральным языком пропт писать. Только тем которые имеют т5 на борту, а это флюх, аура, сд3.5, колорс, хуйнандит, люмина и еще кучка DIT моделей. Все остальные модели без Т5 - тру концептбейзд и не воспринимают хуман лангвидж (есть один момент что модель или лора может быть натренирована на хуман ленгвидж частично, но толку от этого ноль целых хуй десятых). >Да вроде нет. Я при пикрел 1
>Here is an example of an image tag Ну тут да пиздец из скобочек, но дело в том что нубай прям на всем говне данбуру и е621 натренирован и все токены занюхнуты, плюс настройки ебанутые обучения были и там без убыстрялок результат начинается на 30 шагах, и сам нубай очень exaggerated по работе с формами, еще пизже чем пони, так что в принципе тонкое управление токенами имеет место быть конкретно на дефолт нубае. Но это шизу можно легко обойти генеря с помощью убыстрялок, и времени сэкономишь при этом. Пикрел допустим сделан на нескольких токенах позитива и одном токене негатива.
>>958350 Это я так написал, чтобы вызвать в треде дискуссию и он бампался сам. Дальше я написал что первое время бесплатно. Потом прибыль делим по % как договорились.
А вы знали, почему было клип скип 2? Ну, типа, так картинки становились лучше, но почему? Как так, что мы отрезаем кусок от трансформера клипа, и результат становится лучше? Не, ну на самом деле это частое явление, что у нейросеток случайно можно отрезать рандомный кусок, который только говнил... Но теперь я знаю почему - потому что кто-то где-то проебался с 16-битной точностью и градиент не дотек то последнего слоя layernorm, вызвав смещение норм (длин) векторов, поступающих в юнет, что и является непосредственной причиной ухудшения эстетики.
>>958339 > Мне кажется автор просто мудак и сам как попало пишет. Тебе же сказали, если указывать веса, то не важен порядок, логику улавливаешь? Только захочешь ли ты дрочить веса к токенам, вместо того чтоб тупо слова накидать изначально в правильном паттерне.
>>958369 Ты хочешь прогонять голых баб img2img через флюкс или чё? >>958370 А как же на олимпиаде все же полуголые. Там у фигуристок камелтое видно у некоторых я проверял.
>>958380 Ты такой заходишь на сайт, а твой скрипт его парсит на картинки и отправляет их по апи в какую-нибудь лмм, получаешь нсфв токены, скрипт скрывает картинки. И через каких-то пару-тройку минут у тебя открывается страница. Не ну норм придумал.
>>958384 > Не ну норм придумал. Да, я такой. >>958384 >И через каких-то пару-тройку минут у тебя открывается страница. квантованная модель довольно быстро должна с этим справиться.
>>958358 Не кто то где то, а наи с их тренировкой просто выключили этот слой. Львиная доля 1.5 говна была завязана на этот слив и проебались оно тогда во многом, вае например там вообще наны сыпет. Астралайт до сих пор это какой то магией считает, у него даже в инфе про пони есть рекомендация скипать, хотя я более чем уверен, что он тренил кохьей не особо запариваясь, в котором и скип то не работал год назад
>>958358 Ты бы ещё задумался как чекпоинт 6,7гигов при запекании в него 2х лора по 300Мб остаётся размером в 6,7 не увеличиваясь ни на Мб и становитсятольколучше. Не стоит вскрывать эту тему, ты молодой, шутливый...
>>958358 >Но теперь я знаю почему - потому что кто-то где-то проебался с 16-битной точностью и градиент не дотек то последнего слоя layernorm, вызвав смещение норм (длин) векторов, поступающих в юнет, что и является непосредственной причиной ухудшения эстетики. Как стать таким же умнынм? Я знаю всё это в отдельности, но в схему всё это не укладывается.
А есть нормальная галлерея для комфи? В фордже несколько нормальных расширений для этого. А в комфи я только нашёл одно, которое добавляет какую то ёба полоску, ещё и нихуя не показывает после перезагрузки.
>>958629 Просто слово. Токены, которых нет в нубаи воспринимаются им как обычный текст и он думает что его надо высрать как подпись атора и т.п. Особенно если расположить это слово в нужном месте, для повышения веса как артиста.
Полтора года не трогал SD. В последний раз это был автоматик, комфи юи только зарождался. Генерил на gtx980.
Щас полностью обновил комп до видюхи RTX 4070, и оперативы 32Гб. Установил комфи юи, дефолтная модель 1.5 генерит моментально, 3.5 быстро. Но вот FLUX dev раздупляется хуй знает сколько.
Мять минут на подготовку генерации одной картинки, потом 45 секунд генерит картинку. Это нормально вообще?
>>958744 > RTX 4070 Она ток в 12 гигах существует, очевидно ты скачал жирную точность флюха и у тебя веса ушли с карты частично и замедлили что просчет клипа что ген.
>>958744 12гб модель дев флюх 38сек на 4070, у тебя просто не влезает полностью в врам. Есть еще куча обрезанной ускоренной залупы разной паршивости которые быстро генерят.
Как сохранить картинку пережатой, но при этом с метадатой(в комфи). Вроде WAS нода делает что надо, но промт не сохраняет, хотя галка стоит. В пнг весит дохуя, в вебп не сохраняет промт.
>>958771 Если флюкс завелся, то генерит картинку по 45 секунд. Основное время уходит, как я понял, на загрузку модели в оперативную память. У меня жесткий диск говно.
>>958762 Ну изначально меня "анимэйтэд" отвело. Но вообще спасибо буду стандартной пользоваться. Но тоже не работает так же как WAS нода. Просто сохранённые пнг нормально работают
Ок, я разобрался. Я пытался картинку закинуть из галлереи которая в комфи. И с ней только пнг работют. А если из вне закидывать то всё нормально работает.
>комфи >нихуя не комфи Охуеть просто вы реально воркфлоу под каждый пук делаете? В дефолтном воркфлоу просто генеришь по промпту и всё, больше нихуя нет
>>958808 >>958813 Я-то могу установить, но разве разрешение не влияет на время и качество генерации? Я помню, что в автоматике генерили строго квадрат 512х512 или 768х768, а потом изображение подрисовывали.
Аноны, нид хэлп, в СД реально что-то подобное (пик 1) сгенерировать? И как? Может нужны специальные лоры? Или вообще другие сетки попробовать? Пока получается что-то типа (пик 2,3,4)
>>958928 Фарш неправильно метадату парсит из лоры скорее всего и считает что она от какойто другой архитектуры нежели загруженная модель. На каломатиках можно вручную указать к какому типу моделей лора относится через то ли гаечный ключик настройки то ли через шестеренку, не помню точно.
Смещение базы — это небольшая, последовательная настройка, которая стабилизирует процесс создания изображения, в то время как максимальный сдвиг — это максимально допустимое изменение скрытых векторов, предотвращающее экстремальные отклонения в выводе. Вместе они сочетают в себе стабильность и гибкость при создании изображений.
На примере собаки:
Увеличение смещения базы: Если вы увеличите смещение базы, сгенерированное изображение может стать более последовательным и приближенным к желаемой форме (четкому изображению собаки) с меньшими вариациями или шумами. Собака может казаться более устойчивой, с четко выраженными чертами, но она также может потерять некоторые тонкие детали или стать слегка повторяющейся по текстуре.
Уменьшение смещения базы: уменьшение смещения базы может привести к большей вариативности, что позволит выявить более мелкие детали или более тонкие текстуры. Однако это также может сделать изображение немного менее стабильным, что может привести к появлению незначительных артефактов или несоответствий.
Увеличивая максимальный сдвиг: Увеличивая максимальный сдвиг, модель получает больше свободы для исследования скрытого пространства, что потенциально может привести к более творческим или преувеличенным интерпретациям собаки. Собака может в конечном итоге получить более преувеличенные черты лица или более стилизованный внешний вид, но она также может слишком сильно отклониться от реалистичного представления.
Уменьшение максимального сдвига: Уменьшение максимального сдвига ограничило бы модель, что привело бы к более контролируемому и реалистичному изображению собаки. Изображение, скорее всего, останется близким к типичному внешнему виду собаки с меньшим количеством неожиданных вариаций, но ему может не хватать некоторых творческих элементов или тонкой уникальности.
>>958983 Я и не спорю, но бля, зачем ты добавил в свои - блюр, хотя мог его и не добавлять? Причём такой жосенький, флюсовенький. Ты бы ещё жопные подбородки добавил. Кстати видел лора на сивитаи, лолбл.
>>958982 Ну как бы теперь сравни, или ты реально не видишь разницы, тут дело даже не в блюре (который там кстати в тему). Там фотография а тут мазьня какаята. Но если у тебя не про реализм то тогда терпимо.
>>958989 >>958989 Вы не в ту сторону воюете. Аутоффокус и глубина резкозти там норм тема, если они не жёсткие как в флюскале. Не, там реалистик фото типа, но флюс не смог. >>958997 Тут норм, но переборщил, добавь блюр мальца. Жаль нет слайдера на блюр да?
>>959000 У тебя какой-то шнелевский блюр, совсем жесть. Пикрел - девовский. >>959012 Я тебе написал и сразу подумал о том, что я не искал, а вдруг он есть. Если найдёшь, скинь ссылку итт плиз.
Скачал в папку (пикрил 1). Единственное, что отличается от тутора, это название нод (пикрил 2). Но при попытке выбрать модель для загрузки, нода Load ControlNet Model ничего не предлагает.
Сап аноны делаем игру. Новеллу, просто капец как нужны художники, план такой.
1. Создаём 3D окружение в Blender (будет несколько сцен с одной локацией).
2. Делаем много скриншотов из разных ракурсов и углов камеры
3. Далее, используя эти скриншоты, с помощью Stable Diffusion превращаем их в более проработанные, красивые картинки, добавляем персонажей, текст и прочее.
Вопрос: Можно ли в SD на разных скриншотах сделать одно и то же окружение (например, если на одном скрине у меня есть цветок, и я его вижу с одного ракурса, а на следующем — с другого ракурса), так, чтобы этот цветок был одинаковым на обоих скринах? То есть, чтобы окружение было постоянным, а менялись только ракурсы и элементы на переднем плане?
>>958982 Ты говоришь, что это типа флюх? Бля, ну, надо постараться, чтобы там такое днище загенерилось. Видимо, флюху уже научили тегам sdxlstyle или aidegeneratedshit, лоль.
>>959136 Говнище ссаное. Раньше я выбирал любую основную модель и все остальное работало, сейчас под флюкс нужен отдельный сет моделей, а под другую SDXL другой сет.
Я нашел контрол нет для флюкса, но теперь я не могу выбрать другую модель. Все разжирело, но я не вижу прироста качества. Раньше я на гтх980 рендерил в 512, апскейлил и у меня получалось качество гораздо выше, чем этот кал, что я получаю сейчас.
>>959275 Контролнету вообще насрать на бэкграунд. Я даже пытался копипастить другие промты. Когда генеришь картинку, то все адекватно (пикрил 1 и 2)
Как только юзаешь контролнет на основе карты глубины или наброска, по получаешь пикрил 2 и 3. Порой дикие артефакты получаются. Пытался менять strength и emd_percent в ноде Apply ControlNet и бестолку, разве что при определенных параметрах получается больше мультяшности.
>>959280 Ну да, это реальное фото. Ты разве не знал, что в подземных лабораториях ЦЕРН вывели новую породу кошек с раковинами, чтобы их бродячие собаки не ебошили по беспределу?
>>959279 >Хуёвые какие-то корабли выходят. Чего ты ожидал от модели, обученной на хуях? Скажи спасибо, что корабли не попердолило в неведомый артефакт для починки копыт коням.
>>959469 Комфи обновлен до последней версии. >>959476 Мне нода нужна, чтобы отойти от компа, а он сам продолжил ебаться с флаксом. pulid +contrlnet выжирает все 16gb vram. Еще и всю оперативку выжирает мразь. Самое тупое, что я пробовал перейти с q8 на q4. Ноль разницы.
>>959236 >Ты говоришь, что это типа флюх? Бля, ну, надо постараться, чтобы там такое днище загенерилось. Это дефолтный флюскал дев, не квантованный, без лора, в промпте буквально токенов 10. Что там стараться, долбоёб? Флюскал есть флюскал. Будто я его промптом ещё хуже сделал и теперь тебя трясёт, флюсошиз ссаный. Прими реальность, хуле
Сука, как у меня горит. Мало того, что на каждую модель, свой контрол нет, так еще и каждый уебан создает свои кастомные ноды, которые требует свой набор моделей.
Насрали своими моделями, и как с этим работать вообще? Почему я должен на каждый пук скачивать отдельную модель глюкса?
Что это за наркоманская ебань на пикриле? У кого нибудь есть проверенный воркфлоу контролнета и апскейлера?
> science fiction, original spaceship long linear cargo frame- block- modular construction, cubic cargo containers on frame, plasma engines on sternback, original design, on orbit, in space
Если бы вы знали как же контролнету насрать на все написанное
>>959804 SDXL которую дообучили на своих картинках, натвис например на тяночках. На цивите их сотни, фильтруй по "чекпоинт" "сдхл" и качай самые популярные.
>>959764 >всем и так будет понятен контекст и что речь идёт об окружающей среде Когда говорят окружение мне сразу вирчл енвиронмент в голову лезет. Выбирай кто ты: колхозан или первоклассник.
>>959719 Хз я пишу английские слова просто потому что я к ним привык. Если варишься в какой-то теме смотря все туториалы уроки и обсуждения на инглише, иногда в разы сложнее вспомнить\подобрать слово на русском, просто потому что я его в этом контексте и не видел никогда. Короче иногда быстрее и почти всегда проще длинное слово написать к которому привык, чем вспомнить как это по русски сказать пару секунд.
>>960032 О, борец за чистоту языка нарисовался. Вот поэтому русек в жопе, а англюсик топ по количеству словоформ, там каждый пук новый в словарик записывают, все эти NOPE, NAH, ASAP, DIPSHIT, пока такие как ты убивают развитие языка своими "нету такого слова нету". Урод ты!
>>960040 англюсик для дебилов, тут но дискас, поэтому каждый высер рождённый порождение двух родственииков или мамкиного половца с австрийцем засчитывается, ибо как иначе их удерживать в своём полем, соседи же у них смартововые
другое дело богатырский богоспасаемый правовернославный русский язык искоренящий из своего состава всякую причудливую шелупонь выдуманную в хмельном бреду толпой мужеложцев, якобы непонимающих слова нет
>>960040 Расслабься, в российской мове все эти новые словоформы тоже очень оперативно документируют. И это вообще никак не мешает существованию поехавших пуристов. Эти люди просто долбоёбы даже за рамками своей позиции по языковым вопросам. мимобезграмотныйлингвист
>>959805 >>960027 Проверил, действительно работает с SDXL. У меня сложилось впечатление, что эта модель хуево понимает перспективу, даже при наличии кары глубины. Объекты могут иметь разную перспективу, смотреть в разные стороны. Карта глубины работает как будто сandy.
>>959983 >>960025 >>960026 Вы так говорите будто это айти где давно всё придумано и расжеванно, куча гайдов и видосиков учись не хочу Это непаханное поле с экмперементами
Аишки, хочу плотно взяться за этот ваш нейроген, надо по работе. Хочу прояснить пару вопросов:
1. Какие модели, или как это там называется, нынче самые актуальные? Недавно хайпил флюкс, его уже дотянули до нужно кондиции? Он не мог сисик делать, и прожорливый по враму был. Или пока сдхл остается лучшим и универсальным вариантом?
2. Есть где-то хорошие чекпоинты для гена всякого по играм? Мне в казуальном стиле надо, мобилочки — иконки там, рубчики, сундучки. На цивитаи смотрел, тнам какое-то мутное, невнятное. Или для этого особый чекпоинт не нужен? Лора нужна? Или как лучше вообще вытянуть абстрактный казуальный стиль?
2.1. Если таки сдхл, а третий СД тухлый, то разве сдал не достигнет предела, пока другие модели смогут расти дальше? Или как это работает?
3. Есть актуальная база знаний, чтобы термины в этом вашем комфи/фордже вдуплить?
4. У меня есть 4070, этого достаточно для умеренного рабочего юза? Генерить видео не планирую, но мб учить лоры надо будет по работе.
>>960184 >>960184 > Какие модели, или как это там называется, нынче самые актуальные? сдхл, флюхкал, сд35
>его уже дотянули до нужно кондиции? эээ нет, размечтался, там лицензия говно и тренить ебано, полгода почти прошло и никто ничего не делает, ну кроме всяких изъебств с оптмиизацией чтобы говно быстрее генерилось
> и прожорливый по враму был ну это пофикшено, ггуфы + альфа модель на 8 лярдов параметров, все влезает в 12 кеков
>Или пока сдхл остается лучшим и универсальным вариантом? да, естественно
>Есть где-то хорошие чекпоинты для гена всякого по играм? Мне в казуальном стиле надо, мобилочки — иконки там, рубчики, сундучки. На цивитаи ну цивитай этой хаб всего вообще, 99% моделей лежит там, есть еще площадка китайская копия забыл как называется там тоже свои локальные модельки есть и есть хагинфейс
> Или для этого особый чекпоинт не нужен? Лора нужна? Или как лучше вообще вытянуть абстрактный казуальный стиль? ну как бы да, особо какойто особый чекпоинт нинужон, все файнтюны знают что такое иконочка как концепт потому что это знает базовая сдхл, но есть конкретно файнтюны на концепт диз и игровые, они наверно лучше подойдут
проще всего через ипадаптер въебать референсов в модель и хоть обгенерись иконочками
лору тоже можно, особенно билору или дору, билору вообще минут 20 тренить нужно (гайд в одном из прошлых тредов) и все - можешь опять обгенериться
>а третий СД тухлый 3.5 камбекнулся, ебет, быстрее флуха, меньше требований, три версии - лардж обычный, лардж турбо для фаст гена, и медиум который весит нихуя
>то разве сдал не достигнет предела, пока другие модели смогут расти дальше? Или как это работает? хуйн написал, сдхл это архитектура сверточная на чисто концептах без т5, вокруг нее ебическое коммунити и миллион мокрописек, она существует как вещь в себе отдельно от остальных, лучше теоретически только dit модели (флюх, аура, 3.5, етц) с т5 на борту, но это теоретически потому что нихуя нет считай кроме базовых моделей, которые никому нинужны и не решают задач так как решает их сдхл. под флюх вон выпустили флюхтулс (считай пачкой официальных контролнетов), уже чето может решать, но опять же ни ху я файнтюнов нет, только сосать лизать говно базовое
>Есть актуальная база знаний, чтобы термины в этом вашем комфи лол нет, такто пикрелы достаточны для вкатунизма, все остальное что существует это уже нюансы использования и конструирования, там дохуя всего и по разному можно решать одну и ту же задачу, если есть какието конкретные вопросы спрашивай
>У меня есть 4070, этого достаточно для умеренного рабочего юза? да
>учить лоры надо будет по работе тоже хватит, для сдхл по крайней мере точно
>>960266 У него проблема не только в жопных подбородках, форсированном блюре и общем неестественном стиле. но многие упускают, что он не может в позы сложней чем вангёл стнединг лукинг ат вьюер. Если ноги скрещены или вот как тут пальцы вниз, то идет распидорас. Будет где-то 80% брака, пока ты не наролишь где, внезапно пальцы будут скрыты и ты успокоишься.
>>960270 я ещё заметил что на нём нереально получить генерацию человека чтобы был похож на него, ни одной генерации не видел, всё пластиковое. свою 1-ю лору на нём обученную потестил, генерация похожа на качественный рисунок, меня он сделал в виде индуса, на заднем плане тоже индусов нарисовал ясно откуда датасет был, другую 2-ю лору сделал получился шарж на человека + мыло, ощущение что флюкс пытается везде как можно больше закруглённых линий влепить вместо того что нужно
>>960272 За всем не уследишь, гдето косяки всегда проскакивают, я эти картинки делал чисто по приколу поэтому задачи не стояло отпидорить их до блеска.
парни, вот я сижу кручу сд3.5 медиуи ггуф но я все в толк не возьму, вот у меня трипл клип лоадер, клип л отвечает за теги, грубо говоря, т5 позволяет написать промпт как хочется, а клип г зачем? это что-то среднее между л и т5? что в него то вписывать?
>>960284 непонятно из чего это все у тебя следует жду эксперта по сд3.5 наверное можно и в один текст енкодер все это запульнуть, но он наверняка может все криво мне там нахуевертить и я получу хуевый результат
>>960280 >клип л отвечает за теги, грубо говоря, т5 позволяет написать промпт как хочется, а клип Г глобальное понимание контекста, л детали и точное сооттветствие изображения описанию, т5 улучшает промт чтобы сеть понимала что где зачем в какой форме и нахуя находится. >что в него то вписывать? то же самое что в клип л
>>960356 >клип л отвечает за теги, грубо говоря, т5 позволяет написать промпт как хочется, а клип Г глобальное понимание контекста, л детали и точное сооттветствие изображения описанию, т5 улучшает промт чтобы сеть понимала что где зачем в какой форме и нахуя находится.
>что в него то вписывать? то же самое что в клип л
>>960358 >то же самое что в клип л Я читал, что в т5 нужно писать что-то художественное, типа "в дождливую погоду маленький щенок тащит шляпу и на лице его грусть"
А в клип л лучше записывать в обычном формате, какие-то сухие данные о стиле и композиции, типа "кинематографичный стиль, виньетка, приглушенные цвета".
>>960368 >Я читал, что в т5 нужно писать что-то художественное, типа "в дождливую погоду маленький щенок тащит шляпу и на лице его грусть" Так и есть. Т5 это ллм которая понимает человеческий язык. >А в клип л лучше записывать в обычном формате, какие-то сухие данные о стиле и композиции, типа "кинематографичный стиль, виньетка, приглушенные цвета". Клипам так-то поебать, они токены и из промта т5 вытащат (если у тебя сингл поле для ввода под все три клипа), но ты спрашивал че такое клип г же, вот я тебе и ответил, что клип г и клип л жрут одинаковое говно и не понимают хуман лангвидж. В т5 пишешь прямым текстом.
Как тут и говорили - не умеет флюкс в сложные позы. Да и в девушек тоже. Посоветуйте чекпонит, чтобы женжин эротичных його позах генерировать. Может быть ещё и голые письи и сиськи. Но без членов!
>>960280 >парни, вот я сижу кручу сд3.5 медиуи ггуф Я попробовал эту сборку. В отличие от многих других ггуфов, она у меня завелась, но я чот кекнул от времени выполнения в 4 раза дольше, чем на других моделях в формате tensorflow. Видимо весь выигрыш в квантизации теряется на том, что у неё огромные размеры весов у модели энкодеров (те самые клипы).
Какой же это пиздец, я как взял поню аутиста в самой попсовой сборке, так и не могу найти ничего лучше по производительности/качеству. Разве что фотореализм на ней бессмысленно хуярить.
>>960405 >но я чот кекнул от времени выполнения в 4 раза дольше, чем на других моделях в формате tensorflow. Щито? Ген на медиуме 22 сек в 1024 у меня, на сдхл соответственно 12. >Видимо весь выигрыш в квантизации теряется на том, что у неё огромные размеры весов у модели энкодеров (те самые клипы). Хуйню написал. Клипы весят 1.6 гига, т5 может весить в никзом кванте 2 гига, а сд35 вообще может работать без т5 есличе.
>>960405 >Разве что фотореализм на ней бессмысленно хуярить. Подскажите, кстати, какой сейчас фотореализм (или можно 2.75d) хорошо умеет в знаменитостей? Чтобы как встарь на полторахе [emma watson:ginny weasley:0.5] можно было побаловаться.
>>960424 А чому у тебя cfg такой маленький для SDXL? Там же чуть ли не 6 ставят. И почему шагов 15? Мне, чтобы избавиться от говняка, приходится ставить 60.
Объясните мне, почему до сих пор эта магия Кохаи Дип Шринк(простите за инглишь) еще не встроена по умолчанию везде? Вот генериции натвиса дмд в исходном разрешении. Без апскейла! Как так?
>>960420 Ну они вроде в базовой сдхл есть, но порномодели после файтюна стали плохо их генерить без лора. А вот двор ид например вроде нормально генерит, потому что его тяночками не замусорили.
>>960439 >А зачем нужен SEGAttention Это атеншнер, усиливает атеншн. Их много разных, можешь подобрать себе другой, PAG, Sloth, Rave и тд. >и каким образом ты подобрал параметры для этой генерации RAUNet? Это шаги на которых применяется даунскейл-апскейл и кроссатеншн, в зависимости от задач настраивается срабатывание либо позже, либо раньше, либо перекрестно, либопоследовательно.
>>960416 > а сд35 вообще может работать без т5 есличе. Оказывает околонулевое влияние на производительность, судя по моим замерам.
>>960416 > Ген на медиуме 22 сек в 1024 у меня, на сдхл соответственно 12. 12 s/it на поне, обмазанной пятью лорами против 24 s/it на голом гуфе 3.5. Если уменьшить разрешение в задаче для гуфа до 512х512, будет 6 s/it.
Я пробовал грузить sd3.5_medium-q1_0.gguf, выдаёт > ValueError: 34 is not a valid GGMLQuantizationType И тому подобные ошибки сыпятся при любом шаге влево.
Работает хорошо ровно с теми параметрами, которые выложены в воркфлоу на хагинфэйсе (с частности, с sd3.5_medium-q5_0.gguf). Я думаю, это решаемо, просто не выглядит как работа из коробки.
>>960428 Эта хрень хоть из беты вышла, может до людей наконец дойдет, ей если не скейлить то хотя бы ускорять можно шакаля первые мусорные шаги. А что насчет градиентного дипшринка? По замыслу он должен еще лучше ебать, но уже год всё еще в бете.
>>960444 >12 s/it на поне, обмазанной пятью лорами против 24 s/it на голом гуфе 3.5. >Если уменьшить разрешение в задаче для гуфа до 512х512, будет 6 s/it. Зачем ты итерации пишешь, они показывают насколько твоя карта быстро работает на слое нейросети на определенных настройках. Говори просто финальное время с настройками гена. >Я пробовал грузить sd3.5_medium-q1_0.gguf какой Q1? минимальный квант же Q3KS >И тому подобные ошибки сыпятся при любом шаге влево. что ты делаешь
>>960446 Разве что запросы ветвистые удобно писать.
> cute anime girl with massive fluffy fennec ears and a big fluffy tail blonde messy long hair blue eyes wearing a maid outfit with a long black gold leaf pattern dress and a white apron mouth open holding a fancy black forest cake with candles on top in the kitchen of an old dark Victorian mansion lit by candlelight with a bright window to the foggy forest and very expensive stuff everywhere
>>960457 конкретно веса не располовинить, но если это сборная модель из вае+клипг+клипл+т5+веса, то можно веса на одну карту кинуть, а все остальное на другую, или как угодно по другому или допустим контролнеты пусть на другой карте считаются без выгруза частей модели из первой карты, есть спешл ноды https://github.com/neuratech-ai/ComfyUI-MultiGPU
>>960453 >Q3KS Попробовал его. Такая же скорость на моей видеокарте с 4 GB. Наверное, квантизация даёт выигрыш на 8-12 гигах, иначе просто не вмещается.
>>960460 Ссылку на репо дай. Я так понимаю это челик просто бахнул еще более низкие кванты не проверив их работспособность, а квантизация сверх меры есличе ломает модели
>>960464 >Такая же скорость на моей видеокарте с 4 GB. Так ты бомж, у тя там пиздец вообще с утекающими весами. Иди сдхл в FP8 еби, это потолок. >Наверное, квантизация даёт выигрыш на 8-12 гигах, иначе просто не вмещается. Так в этом и суть.
Это пока единственный ггуф, который хоть как-то завёлся, так что чел хоть какую-то нормальную работу проделал. Но я не могу достичь выигрыша в производительности.
Хорошо бы сравнить вчистую, пони сейфтензорс против пони ггуф, но я не разобрался пока как нормально перегнать модель в этот формат. Я скачал llama.cpp, потыкал скрипт, он похерил мне мою версию торча (пришлось заново потом качать), начал жаловаться что не хватает каких-то вспомогательных конфиг файлов, которые неизвестно где брать.
>>960465 Она на первых шагах генерации уменьшает разрешение что бы последующие шаги делались уже по этому рисунку и меньше мутировало, как бы имг2имг но первый имг генерится там же просто в низком разрешении.
>>960469 >Это пока единственный ггуф, который хоть как-то завёлся Ну а че ты от 4 гигов хотел. >Но я не могу достичь выигрыша в производительности. >Хорошо бы сравнить вчистую, пони сейфтензорс против пони ггуф 1. У тебя 4 гига. Модель в ку1 весит гиг, вае 400, клипг и л 1600, т5 в минимуме 2 гига, у тебя в карту все не влезет и будет тасовать модели из рам во врам, какой выигрыш? Ну допустим даже ты без т5 запустишь чисто на клипах, но: 2. Это дит модель, сдхл это юнет, это разные архитектуры, их некорректно сравнивать потому что дит модели более сложный матан. 3. Это гуфы, а значит это сжатие данных и дополнительное время на их развертывание в читаемый вариант для гпу.
>Древние греки и римляне считали именно такой вариант ноги правильным, что отражали в своих скульптурах. Поэтому стопу с пальцем Мортона ещё называют греческой стопой, в противоположность египетской, каждый палец которой короче предыдущего.
>У многих персонажей итальянцев Боттичелли (1445—1510) и Микеланджело (1475—1564) второй палец стопы длиннее первого. Видимая стопа американской Статуи Свободы (1886) тоже имеет палец Мортона
Очередное доказательство, что плюх находится на уровне Микеланджело и Боттичелли.
>>960472 Не имг2имг ниразу. Дипшринк это техника регуляризации, основанная на сжатии или пороговом методе для работы с коэффициентами вектора, активно уменьшает слабые, менее значимые элементы в латентспейсе, сохраняя только наиболее важные компоненты, по итогу получается стабильный шум -> подавление мутаций на хайрезах. Раунет примерно то же самое но на основе атеншена.
>>960475 >Ну а че ты от 4 гигов хотел. Нет, дело в том что ими занимаются в основном ради flux, потому что его огромный размер заставляет подгорать даже 24 GB бояр. Так-то я стал крайне редко натыкаться на ООМ ошибку по сравнению что было год назад, из минусов только долгая генерация. Проблема в том, что ггуф просто почти не найти для SDXL (вероятно, по причинам, которые ты привёл).
> 3. Это гуфы, а значит это сжатие данных и дополнительное время на их развертывание в читаемый вариант для гпу. Видимо да, ггуф не будет эффективен, поэтому нигде не лежат модели в этом формате. Сообщество уже прокалькулировало отсутствие выгоды.
Комфибоги, как вы работаете с ним? Просто пикчу сгенерить это просто, а вот если хочешь БОЛЬШЕ: добавить контролнет, лору, апскейл и тд, то вы под это отдельный воркфлоу держите или что
>>960482 >Так-то я стал крайне редко натыкаться на ООМ ошибку по сравнению что было год назад, из минусов только долгая генерация. ООМа нет потому что кожанка впилил слив невмещающихся весов на рам, поэтому у тебя долгая генерация к тому же, помимо того что карта говно. >Проблема в том, что ггуф просто почти не найти для SDXL (вероятно, по причинам, которые ты привёл). Да в этом смысла просто нет, сдхл и так влезает даже в 4 гига в FP8, смысл еще квантовать? Там веса 2.6 и так. Плюс насколько я помню там какието сложности с квантизацией unet, далеко не все модели квантабельны, DIT модели (флюх и тд) квантуются потому что могут, они сами по себе имеют трансформер на борту, поэтому их легко квантовать, в юнете трансформера нет. >поэтому нигде не лежат модели в этом формате Везде где нужно лежат, ты че епт. >Сообщество уже прокалькулировало отсутствие выгоды. >флюхговно помещается со всей мишурой в 12 кеков >отсутствие выгоды Ты че тупой чтоли. Не беси меня.
>>960486 1. Ты можешь несколько нод сколлапсить в одну, как у гудини. Выделяешь ноды и в контекстном меню выбираешь "Convert to group node", потом можно отредактировать: переименовать контакты или скрыть. 2. Можно темплейт сделать. 3. Можно воркфлоу.
Выбор зависит от масштаба задачи. Но в целом склоняюсь к воркфлоу: в одном генерация, в другом апскейл. Птшто шаблоны и группо-ноды все равно надо подключать к другим нодам, а это время. Но правда я еще до больших проектов не доходил.
А как вы запоминаете параметры Lora моделей? К примеру накачали вы с десяток Lora и уже забыли у какой какие кулючевые слова и где есть -clip а где нет?
>>960526 В автоматике был аддон, который автоматом скачивал с цивы данные о модели и мог даже ключевые слова вставлять. В комфи разве нода автоматом не добавляет ключевые слова?
>>960526 Клип пропускаешь через все и похуй, большинство лора работает без ключевых токенов. Пик инфо через пкм из Power Lora Loader (rgthree) если забыл токены, можно выбрать нужные и скопировать. >>960546 В промте.
>>960554 >я немногое теряю записывая все в один текст енкодер или лучше разделять их? Зависит от того какую ноду пользуешь. Пикрил видишь? Можно так, а можно вот так >>960280 Различия очевидны: можешь совершенно левую хуйню на кадлый енкодер подавать. >клип л получается можно пустым оставить в принципе? Нет, дублируй то что в г. Локал клип не используется ток в альфа флюхе пик 2. >за кой хуй заставляют сразу три клипа грузить если б я мог только т5 использовать, пидорасы Потому что это база. Клип г и клип л в сдхл, в полторахе, в ранее полторахи... Без т5 ты можешь работать (не на флюхе, на сд35), а вот без клипов хуй. Сам по себе т5 недостаточен.
>>960520 Потому что 1. Если части модели не находястя в карте полностью, то у тебя увеличивается время гена т.к. части модели выгружаются и загружаются по очереди 2. У тебя происходит очень сильное падение скорости если любая часть модели (конкретно веса или т5) не полностью входит в карту.
>>960541 >все данные лоры сохраняются внутри неё и копипастятся в промт вместе с ней Хуйню какую-то написал, инвалид. Метадата парсится из чего угодно, если она есть, в том числе в комфи. А еще мы знаем мы как парсит условный фарш лоры косистенции без метадаты, вот так >>958928 Шо с ебалом?
>>960526 >А как вы запоминаете параметры Lora моделей? К примеру накачали вы с десяток Lora и уже забыли у какой какие кулючевые слова и где есть -clip а где нет? Не запоминаю, потому что не качаю говняк с триггервордами а делаю его сам иногда. А вообще стилевое говно или экстракты из моделей с клипами так и так применятся к модели, клип вкл/выкл отдельной менюшкой в ноде лоры.
>>960576 Иди на цивит аи, бери первую попавшуюся картинку, сохраняй, тащи в окно с воркфло - тебе даст готовенькое воркфлоу. Если поставишь confyui manager, то недостающие узлы сможешь установить не включая головной мозг.
>>960586 >>960594 Ладно, тогда крути настройки. Ультра кволити на 1024 все равно не ожидай и раунет выключи на 1024, он там не нужен вообще с таким разрешением. Можно помочь себе ипадаптером и дипшринком хотя он тоже на 1024 не нужен например, до, после. Ну и цфг повысь и промт распиши.
И так, господа. При перерисовке Lora без ключевых слов не работает. 1 пик - lora без trigger word 2 пик - lora с trigger word При генерации вроде бы работает так-же... Но нужно наверно несколько тестов делать.
>У меня модель в 23Gb загружается используя почти всю доступную память, выходит около 40-43GB + 2GB lora+vae. Короче говоря она упирается в потолок, так как в системе 64GB оперативки всего. Возможно даже файл подкачки частично использует. >3060 У меня только один вопрос нахуя ты фуловые веса в 3060 пытаешься втиснуть? Есть кванты и альфа. Любой слив на рам из видяхи - всегда хуево. > И вот отсюда вытекает в плане апгрейда, менять 3060 на 4070 или покупать 128GB оперативки сначала, а в следующем уже году думать про замену видюхи. Ну если ты шиз и тебе обязательно надо оригинальные веса оригинального флюхкала, то тебе надо думать о покупке 3090/ти или 4090 на 24 гигах, а не менять 12 гигов на 12 гигов и оперативку бля
>>960685 >кстати, кто объяснит, зачем нужны пик3? Это как если бы ты хотел объяснить тебе зачем у шизофреника рожа в говне. В общем это бессмысленная хуйня без задач и ты можешь удалить к хуям и ничего не изменится. Ну т.е. картинка будет другой немного, но сорт оф сид рольнуть. Комфи это такая штука, что можно дохуя ненужной хуйни нахуевертить, которая что-то меняет только в манямирке пердолика. Есть дауны что вместо обычного промпт клипа делают с нипут аут резолюшеном и т.п.
>>960707 давай разберем по частям тобою написанное, складывается ощущение что ты реально контуженный , обиженный жизнью факассер, хотя нет, это не ощущение а реальность
>фп32 вместо фп16 есть карты которые быстрее считают фп32, обоссан >препроцессор для контролнета без препроцессора ты не можешь подать гайдирующее изображение в контролнет, обоссан >"униКАЛьные" кастомные шедулеры сделанные васяном только для своих шедулер это формула поставки шума, буквально какая-нибудь x((x+1)phi)sigmax+y((x+1)phi)sigmin, каррас это буквально (sigmax (1 / 7) + y * (sigmin (1 / 7) - sigmax (1 / 7))) 7, ты наверно имел в виду семплеры, но семплеры действительно уникальные и дают разный результат, скорость, консистенцию, твои проблемы что в факассе какое-то говно одобренное китайцем стоит только, обоссан
давай, попытайся прочитать, усвоить и просветиться, я верю что твой интеллект чучуть подыметься от отметки минус 100500, добра, здоровья, удачи
>>960714 >без препроцессора ты не можешь подать гайдирующее изображение в контролнет 'эо сразу выдало в тебе тупого дебила, дальше не читал, ибо нет смысла общаться с тупым, не знающим элементарных вещей
>>960721 хуню не неси, твои оправдания легко перечёркиваются тупо тестом. Любой анон может вставить фотку и програть через контролнет без препроцессора и сделать маняме, меняя тип контролнета будет меняться тип картинки в зависимости от типа контролнета, если отрубить контролнет будет всратый img2img в ту же фотку по сути но на датасете модели. Нахуя я кормлю тролля.
>>960729 Любой, который требует препроцесс имаге. Кани, депф, поз, вариатор, лайнарт, скрибл, сегмент, колорспейс... Проще сказать каким типам не требуется, например тайлу, но он по дефолту с блюренными пикчами на входе должен работать или чето такое.
>>958317 >для игр типа визуальной новеллы >игр >визуальной новеллы А в чём интерактивность твоей игры заключается? Читать текст с экрана? Да заебись придумал ты 100% первый в этом деле
ИТТ кто-то генерил img2vid на Mochi? Покажите результат, ноды.
Алсо, в этом обкончанном комфи до сих пор не добавили возможность выровнять элементы одной кнопкой? Сука интерфейс говна. Хоть чуть обновили, но все равно неюзабельный пиздец для графического программирования.
>>961195 В этом воркфлоу картинка уже подготовлена под ожидаемый контролнетом формат данных: карта глубины, кенни, скрибл и проч. Когда ты пихаешь свою картинку, то ты должен обработать ее в препроцессоре, потому что на вид это явно не скрибл.
Никто тебе не мешает кратинку скрибл обработать как карту глубины, но это либо пикрилейтед, либо хитрый план. Твой план уровня img2img.
>>961241 Есть union модели контролнета и они могут задетектить тип подаваемых данных, но даже для юнион моделей есть ноды, где можно указать конкретный ожидаемый тип данных, иначе работа будет непредсказуемая.
>>961250 >не добавили возможность выровнять элементы одной кнопкой У меня горит с того, что у них есть параметры ноды, которые можно редактировать только вручную. На пикрил, к примеру, есть апскейлер. Я генерю изображение, я знаю его пропорции и размер, почему я не могут подсчитать нужный размер изображения математическими нодами и подать эти данные снаружи, я должен как последний конченый хуесос каждый раз высчитывать пропорции на калькуляторе и вводить их ручками.
Вот ноды анрил энжина не имеют в себе контролов, там все состоит из инпутов и аутпутов, а в гудини есть контролы, но там можно менять параметры при помощи ссылок. Везде есть внешний контроль. Здесь решили сделать проще для обычного юзера, но сделали только сложнее — с этим невозможно адекватно работать. Я бы на их месте таки добавил инпуты для каждого параметра, но скрывал ползунки, если к инпуту что-то подсоединено.
>>961261 Для начала нулевых характерен дикий пересвет и плоские лица. Даже в фильмах.
У тебя, в целом, может быть и фото из 2000х (после обработки в фотошопе), но я бы не удивился, если бы это было сделано на смартфон сегодня. Я помню нулевые, когда абсолютно все было цветастое и разноцветное, но при этом камера передавала это все в бледных тонах.
>>961263 >почему я не могут подсчитать нужный размер изображения математическими нодами и подать эти данные снаружи
потому что ты дебил, который по какой-то причине в себя поверил как уже сказали выше: пкм по ноде, виджет ту инпут, и ты любое значение которое есть в ноде можешь посылать из других нод и так в каждой ноде
>>961280 Да конечно, это я дебил, а не интерфейс кривое неудобное говно, надо просто терпеть. Сил уже моих нет мучаться с этим комфи, на каждом шаге какие-то трудности и дополнительные действия нужны, просто заебало.
>>961281 >кривое там все прямо, все работает, хз в чем предъява >неудобное все удобно и интуитивно понятно, не могу понять в чем неудобство заключается
что ты не можешь через математические ноды поставить себе разрешение? а то что есть upscaleby, которая позволит заскейлить то, что на входе, без математических нод и высчитывания на калькуляторе тебя вообще не ебет? или ты просто не знал, что там такое есть? ну для таких как ты, которые знают чего хотят, но не знают где найти - есть поиск, там вводишь любое слово и тебе покажут, что с ним связано
если не нравится комфи - иди в другой вебуй, в чем проблема то? иди в удобный и прямой
>>961212 >брашнета Ну где-же тогда шедевры вашего брашнета, где величайшие полотна сравнимые с сикстинской капеллой? Вы баб безруких высераете на 3-м году движа. и дело не в том, хуёвый или хороший тот или иной воркфлоу или Ui. Дело в вас в бесталанных, токсичных ебланах, в том, что в бвшке у вас пусто. И эту пустоту не заполнить ни чем, ни стенами наукобразного бреда, ни километрами лапши. Вы ебаные нули, абсолютно везде. Вы ничтожества.
>>961250 Добавили автовыравнивание по сетке, шаг сетки редактируется. Но я уже привык всегда шифт зажимать. Еще там какое то выравнивание выделенных нод есть по одной стороне, или нод в группе, что то такое.
>>961275 >Для начала нулевых характерен дикий пересвет и плоские лица. Даже в фильмах. Никогда не понимал в фотографии. Плоские лица из за пересвета и отсутсвия нормальных теней? Я даже не зною ,как это нормальна реализовать.
>>961286 >все удобно и интуитивно понятно, не могу понять в чем неудобство заключается
Например работа с темплейтами. Какой уебок додумался отображать команду "Save selected as Template" в контекстном меню ТОЛЬКО когда твой курсор находится за пределами нод? Любому дегенерату очевидно, что когда ты хочешь превратить выбранные ноды в темплейт, то в 99,99999999999999999999% случаев твой курсор будет находиться на одной из выделенных нод. В итоге минут пять тыкаешь и не понимаешь куда исчез пункт меню? Стоит ли говорить, что эту команду я обнаружил чисто случайно, когда мой курсор промахнулся мимо ноды?
Или, вот, есть"group" а есть "group node". Только человек с больным воображением мог до такого додуматься. Поэтому когда ты пишешь о какой-то интуитивности, то ее нет, потому что хуй знает что может скрываться под указанным словом.
Хуй с ним, запускаешь "manage group nodes", это недвижимое окно, которое к тому же нахуй блокирует рабочее пространство. Попытка в менеджере переместить инпуты\аутпуты вверх или вниз, за каким-то хуем редактирует связи внутри групп-ноды, либо вовсе разрывает их, либо скрывает другие инпуты. Какой дегенерат додумался привязать положение элементов списка контролов в ноде с положением нод в группе? Или тут тоже имеется какой-то тайный смысл, непонятный дуракам?
Я уже молчу про неинтуитивное масштабирование, когда разрабы вырубили стандартный подход ресайза и при этом спрятали стрелку в правом нижнем углу (как это сделано у порядочных окон). Даже битарды на дваче додумались добавить иконку ресайза в окне ввода сообщения.
УХБЛЕАТЬ... В общем, план такой. В свои первоначальные 12 гб засоcываю Q4 Flux Shell, а на p102-100 - t5, clip_l и clip_g. Какие подводные? Насколько на Й4 она говном будет?
>>961294 >Плоские лица из за пересвета и отсутсвия нормальных теней? Почему это было в фильмах тех времен, я не знаю, может быть постобработка, может быть сказался переход на цифровые камеры. У фото с мыльниц точно были технические ограничения. Скорее всего был слишком узкий диапазон от светлого к темному, причем в какой-то момент светлые оттенки вовсе не улавливались камерой и там было просто белое пятно. Даже если ты заморочишься с постановкой освещения и созданием мягких градиентов, то камера это просто урежет. Грубо говоря, если в фотошопе в редакторе кривых урезать слишком светыле участки и слишком темные, а середину сделать контрастнее, то будет примерно тоже самое.
>Я даже не зною ,как это нормальна реализовать. Я думал ты какую-то свою модель тренируешь. Я думал, что в этом и суть моделей, что их учишь на исходника, а она потом сама все делает как нужно. Есть же лоры всякие на темы фильмов 70х, 80х, 90х.
Моё любимое занятие - проверять нейронки на позы с йоги. Флюкс был близок, если бы не одно но. Там вроде бы была фича отдельных поз, или мне привидилось?
>>961324 >Я думал ты какую-то свою модель тренируешь. Я думал, что в этом и суть моделей, что их учишь на исходника, а она потом сама все делает как нужно. Есть же лоры всякие на темы фильмов 70х, 80х, 90х. Я со своими мощностями максимум лору обучу. Но я думал, что уже что то готовое есть. >У фото с мыльниц точно были технические ограничения. Скорее всего был слишком узкий диапазон от светлого к темному, причем в какой-то момент светлые оттенки вовсе не улавливались камерой и там было просто белое пятно. С этим вопрос надо сходить к /p/.
>>961351 Во-первых, если хочешь что-то сымитировать, то придерживайся условий имитируемого. К примеру, у тебя все картинки почему-то с видом из тени, а ни одна мыльница тех времен такое потянуть не могла — это не айфон. Поэтому даже композиционно ты чувствуешь, что что-то здесь не так.
Во-вторых, при съемке на мыльницу как правило отсутствует абсолютно черный цвет из-за ограниченного диапазона гаммы. Посмотри на пикрил 3, как исключение, где есть черный. Он там присутствует в тенях черной ткани, все остальное вокруг не имеет черного. Даже на 4-й пикче вроде бы черные штаны, видно, что камера не справляется с такой глубиной оттенков черного, сделав все плоским, но даже здесь черный не абсолютный.
Вы заблудились в лесу. И видите мираж такой. А может и не мираж Ваши действия? >>961382 >из-за ограниченного диапазона гаммы. Вот это надо правильно описать как то.
>>961412 Но сам я уже не юзаю это, если что. Пересел на фп8 версию с бэендом вае и коипа - советую. Апскейлер тоже говно, уже не юзаю, лучше ставить сразу в флюсе разрешение в пределах 2048x2048 апскейл не нужен.
>>961288 >за матан >ну мням пук надо стопицот кликов сделать чтобы циферку прокинуть >абсолютно точно разраб не тупой еблан без понимания нормального ux
>>961288 >Комфи для тех, кто за матан Так красноглазики хуесосы не смогли пояснить чем комфи лучше форджа, кроме вкукареков >ШВАБОДА ВЫБОРА В фордже также есть контролнеты, апскейлеры, обучение и прочая хуйня, какая разница?
>>961427 >В фордже также есть контролнеты, апскейлеры, обучение и прочая хуйня И все актуальное йобовое отсутствует, либо неработает, а если что-то работает, то падает. Не интерфейс, а мечта!
>Так красноглазики хуесосы не смогли пояснить чем комфи лучше форджа Буквально всем.
>>961453 Напомнило одну шалаву малолетнюю из несуществующей страны, которую мамашка травила за то что та наруто смотрела, лолбля. Какая же она всратая, хоспаде...
>>961445 Примерно ничем. Зато очень легко детектить шизов, которые швейцарским ножом режут колбасу каждый день, пока нормальные люди используют для этого обычный удобный инструмент.
Кто нибудь работал с компонентами? Почему компоненты не хотят иметь вложенную структуру? По идее, я сперва должен видеть "group nodes", дальше раскрывается субменю и я должен видеть "workflow", "components" и "alxNodes".
Вместо этого я вижу весь путь в одном пункте меню.
>>961561 Питонисты хуевы. Установил WAS Node Suite, и эта залупа срет мне в консоль умными цитатками. Просто слов нет, я такую хуйню впервые вижу. Все таки правы люди, утверждающие, что питон и джава скрипт — зло. Высокий порог должен не впускать сумасшедших.
>>961568 Да блять, оно меня бесит. Я убираю его постоянно правлю код. >>961576 Эта хуита меня вообще бомбанула нахуй в rgthree нодах, что за нетакусики-ебланы там на макаках сука.
a frog sits in the lily pad near a blooming waterlily, solo, 1girl, sitting, nipples, flower, male focus, nude, outdoors, water, no humans, colored skin, realistic, frog, indian style, green skin, lily pad, lotus, fine art parody, pond, kappa
a frog in a business suit using a computer, solo, open mouth, shirt, 1boy, sitting, jacket, white shirt, upper body, short sleeves, male focus, collared shirt, indoors, black eyes, black jacket, colored skin, realistic, frog, computer, green skin, monitor, laptop, mouse \(computer\), kappa
Попробовал занюхнуть очередной мега-апскейлер, который грозился расщеплять картинку на фрагменты, допрашивать их клипом и инпэйнтить их запросом. Ага, классический ад зависимостей. Притом, я это потом отдельно вынес в чистую сборку комфи и там оно тоже обосралось под себя.
>>961640 >ттпленет Это известный говнодел. Известный тем, что у него на любой пук нужно миллион кастомнод. Пробовал его контролнет и апскейлер какой-то, пришлось потом переустанавливать комфи, ибо дерьмо вычищать заебёшься. Даже пробовать его новое поделие не буду не умоляй.
>>961625 >Каков вес лор? В этом шаблоне дмд 0.8, спо 1.5 плюс мои лоры дополнительно, так что сорян. >>961633 >Выше 1го натвиса какоой-то кал Да. Вот, натвис с дмд2 и спо плюс еще мои лоры. 1,3-натвис версия1; 2,4-версия2.7. Может сам по себе натвис и стал лучше. Пальцы там или что вообще он там улучшал, но то что версиии выше 1 перестали сочетаться с моим шаблоном ставит крест на всех потугах автора. Мне не нужен натвис без дмд. Версия 1 форева. >>961631 >А как делать таблицу? Это Fooocus.
======================================
Предыдущий тред https://arhivach.top/?tags=13840
------------------------------------------
схожий тематический тред
- аниме-тред
========================
Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях.
Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion.
Полный функционал в локальной установке (см. ниже)
Пробный онлайн-генератор Stable Diffusion: https://dezgo.com/txt2img
Пробные онлайн-генераторы Flux:
https://huggingface.co/black-forest-labs
https://fluxpro.art/
⚠️ Официальные модели stable diffusion от Stability AI значительно отстают по качеству от кастомных моделей (см. civitai ниже).
🔞 Без цензуры и полный функци_анал: только ПК-версия
===========================================
🖥УСТАНОВКА НА ПК
Портативная версия основного WebUI от Comfy (запуск с одного из run.bat файлов)
https://github.com/comfyanonymous/ComfyUI/releases
Примерные workflow для ComfyUI (можно загружать напрямую из картинок)
https://comfyanonymous.github.io/ComfyUI_examples/
------------------------------------------
Альтернатива - еще поддерживаемый форк ранее популярного WebUI от Automatic1111 (R.I.P)
https://github.com/lllyasviel/stable-diffusion-webui-forge?tab=readme-ov-file
------------------------------------------
👉 Для новичков - простой в работе WebUI Fooocus
https://github.com/lllyasviel/Fooocus?tab=readme-ov-file#download
------------------------------------------
Для тех, у кого видеокарта не тянет - оптимизированная генерация на ЦПУ
https://github.com/rupeshs/fastsdcpu
===========================================
📚 РАЗЛИЧНЫЕ МОДЕЛИ (И МНОГОЕ ДРУГОЕ) 👇
https://civitai.com/
https://huggingface.co/
------------------------------------------
📊 ПАРАМЕТРЫ И НАСТРОЙКИ ГЕНЕРАЦИИ 👇
https://teletype.in/@stablediffusion/samplers_steps
===========================================
🎨 ГАЙД ПО СОСТАВЛЕНИЮ ЗАПРОСА, СТИЛИ
https://teletype.in/@stablediffusion/artists_for_prompts
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols
Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her
------------------------------------------
♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇
https://supagruen.github.io/StableDiffusion-CheatSheet/
https://www.artvy.ai/styles
------------------------------------------
💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ
https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td
==========================================
🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇
https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora
https://civitai.com/models/train