24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Stable Diffusion Flux тред X+128 ====================================== Предыдущий тред >>941228 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожий тематический тред - аниме-тред >>944600 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
какое минимальное железо нужно для Флакс Про? на релизе качал и запускал через фордж, нихуя не работало на 3070. просто вылетало. очень хотелось бы попробовать новые возможности, а то СД 1,5 и Фукус уже надоели.
>>945850 флакм про на локалке не запускается флакм дев на моей 4060ти на 16гб возможно и не запустится, ггуф что весил 8гб генерит минуту - нахуй такое счастье, лучше на хагинфейсе в спейсе генерировать
>>945848 >>945891 >>945891 >ну аноны кидают, у некоторых нормальные и чистые пики получаются, потому и решил попробовать тоже >dpmpp 3m sde gpu karras >дополнительных лор не использую Ну сумплер ты конечно выбрал, лучше обходит мультистепы (циферка с буквокой м). Тут основной фокус в лорах консистенции.
>>945930 >Зачем вообще нужны lora? Типа констистентность на выходе? Ну есть три типа лор: лоры на стиль, лоры на концепт и лоры убыстрялки. Просто упрощение достижения желаемого или достижения того чего нет в модели изначально.
>>945869 Нубаи топ для 2д иллюстраций - 1-2 пикрел. Если тебе нужен нубаи для полуреалистика или с эффектом рендера, то он тоже может, но проще это делать в говномерже illustrious_pencil-XL (3-4 пикрел) что я советовал в прошлых тредах, в нём хуже понимание промпта и у него форсирован маняме 3д стиль пиздецки, поэтому я его удалил.
>>945980 да впердоливал видимо нужно обязательно промптить через артист:хуяка бубуяка хотя анон присылал просто теги как я на скрине пишу и ему рисовало нормально
>>945993 >хотя анон присылал просто теги как я на скрине пишу и ему рисовало нормально Небось это был какой-нибудь говнодел из /б? Щас бы битардам верить. А вообще читай ридми к нубаи > 1girl/1boy/1other/..., character, series, artists, special tags, general tags В конце ебани мастерписю и бест квалити.
>>945937 >слишком взрослая child girl 99 yo, child body, childish face, + age slider v2. Что значит вылазит, это всё таки пони, ты сам пиши, что должно быть на ней, средневековое платье с вышивкой (есть Лора с украинской вышиванкой, идеально подойдёт), платок, какие-нибудь сандали, вот кстати лапти там есть?
>>946028 >>946026 а нахуя ты на впреде сидишь? прикол впред что он суперсенситивный и суперстабильный (если условно бекграунд не указывать то он его и не будет рисовать)
V-prediction: как правило, способствует более плавной генерации с фокусом на общих формах и композиции. За счет того, что модель предсказывает скорость изменения, изображения получаются стабильными, с меньшим количеством артефактов и "зернистости". Но при этом v-pred может немного потерять в детализации — мелкие текстуры и тонкие линии могут быть сглажены или менее выражены.
Eps-prediction: обеспечивает точное восстановление деталей, так как напрямую предсказывает шум. Этот метод позволяет модели захватывать мелкие текстуры и высокую детализацию, включая тонкие линии и текстуры поверхности. Однако eps-pred может быть менее устойчивым к артефактам и шуму, особенно при работе с большим количеством шагов, что может сделать результат более "зернистым" и чувствительным к настройкам.
В общем, v-pred предпочтителен для более гладких, менее шумных изображений, особенно если важна стабильность на низких шагах, тогда как eps-pred лучше для детализированных, текстурных изображений, но может требовать большего контроля над параметрами генерации.
а еще он же еще в половине тренировки находится, версия 0.5
>>946027 У тебя какое-от маняме стилизация фото, даже иллюстрации с блюром, лол. Фейл. >>946028 Ну хз без него норм. >>946042 Кстати я тоже потестив остался на версии без впердикса.
>>946052 >2.jpg всратенько, ужас. но это мы не видим, а блюр у других видим. >маняме что это? вот у тебя типичные анимешные ебла, ничем не отличающиеся. скучнота. хоть бы лоры какие пользовал. подобный кал, насколько помню, тут не постят в перекатах. а мои генерации иногда туда попадают, в общем всё понятно)
>>946075 1girl, solo, если не хочешь чтоб хуета всякая на заднем фоне мельтешила. тега devil woman на данборе нет, есть demon girl, только этот тег тебе почти ниче не даст. если это не какой-то конкретный персонаж нужно описывать все что ты хочешь видеть на нем
>>946101 Понял, чисто по данборе нужно Ну мне нравится, пока что ковыряюсь, с готовыми персонажами куда проще, конечно, и не нужно кучу лор ставить под стилизацию, как раз место освобожу
>>946096 Ну давай разберём написанное тобой... Я указал на дженерик стилизацию флюса и очевидные косяки и его рамки, а не на качество в целом. Если бы я хотел утереть тебе нос качеством, то делал бы не в базовом воркфлоу комфи на 8 шагах за 1 сек, а прошёлся бы хайрезфиксом хотя бы или апскейлом. Я то не против признать, а вот ты похоже не хочешь очевидные косяки флюса признать почему-то. Смысл? Причины? Фанбойство? Про пикчи в перекате смешно вообще, т.к. это не аниметред.
>>946103 ну персонажей он все же далеко не всех знает, как и художников. но по сравнению с пони это всё равно небо и земля. ниче лучше я не встречал из маняме моделей не знаю что там у nai, может оно и лучше
>>946114 >дженерик, рамки с этим соглашусь. хоть лоры выручают и можно относительно быстро получить вылизанную картинку без дрочки промптов. >если бы я хотел утереть нос качеством да толку в качестве, типичную однообразность анимешных ебл тут не исправить. у нуба же узкоспециализированный датасет. скучные неестественные рожи, зловещая долина. >это не аниметред вот-вот
>>946174 >типичную однообразность анимешных ебл тут не исправить ты тупой блять чтоли? это онеме модель от и до, пиздец блять ты б еще доебался до своей мамки что она тебя из пизды родила, а не из жопы
>>946185 это знаменитый флюкс? какой-то обосранный бесплатный клипарт из гуглокартинок? флюксокал художественной ценности не представляет, у модели нет представлений об эстетике, композиции и всем том что делает картинку красивой, потому что датасет собирали из говна и палок, из рандмных фоток и прочей хуеты. в отличие от иллюстриуса, нуба и даже пони. те хотя на артах художнииков тренировались каких-никаких, с градациями по качеству. флюкс может высирать только зернистый "фотореализм" прямиком из зловещей долины, и спецэффекты из фильмов 90х, чтобы показать одноклассникам как круто ты байдена в пятерочке нарисовал
>>946196 боишься что твоих копроголемов из флюкса никто не заметит? сходи поплачься мочуху
>>946174 >да толку в качестве, типичную однообразность анимешных ебл тут не исправить. у нуба же узкоспециализированный датасет. скучные неестественные рожи, зловещая долина. Но ты же либо не разобрался, либо судишь только по пикчам итт. Если коротко - ты не прав. Т.к. я не фанбой ни флюкса, ни нубаи, ни вообще чего-либо, то доказывать не буду. Я сам пользуюсь всем вышеперечисленным и знаю недостатки каждой. Мне странно когда пишут выворачивая факты как ты. Если нужны именно разнообразные иллюстрации без ограничений - нубаи, если нужен клоузап вангёл клефт чин аут оф фокус - флюкс. Если нужен фотореализм а ля фото соседки на мыльницу в 90е - натвис. Тут всё просто.
по сути всё это аниме с максимально упрощенной рисовкой является экономией времени у узкоглазых. надо же ведь успевать высирать тонны лупоглазого плоского контента и скармливать нетакусикам-анимешникам. отсюда и низкая частота кадров, множество упрощений, мало цветов. достаточно сменить форму рожи с овала на шар, прическу и ее цвет, вуаля, готов новый персонаж.
>>946219 если честно, у меня не только флюкс стоит. я просто люблю доебываться до анимешников, лол. правда не лезу в их тред со своими картинками, от слова вообще.
>>946224 Лол, ну ирония в том, что я сам недавно хейтил нубаи и гонял анимешников итт, у меня было отрицание, т.к. не анимешник. Но попробовал из-за анона форсящего его итт, сделал пару иллюстраций всяких и прихерел, признал очевидное и неизбежное, юзаю. В общем там вполне реально сделать не аниме. Авторов много туда запихнули.
>>945833 (OP) Анонии, подскажите актуальный гайд на создание лор? В шапке устаревшая шляпа. Да, можно через цивит сделать, но хочу научиться. В идеале - локально, но и коллабом воспользуюсь
>>946469 >дохуя врам 12 гб всего лишь, но дохуя основной оперативки. модельки между ней и видюхой довольно быстро кабанчиками метаются. с pcie 5.0 было бы вообще идеально, но это уже что-то на богатом. >>946475 как живется без извилин и с выебанными глазами?
>>946488 >девки разные Не девки, у тебя руки разной длинны) Если тебе что-то понравилось, поза допустим, ставишь это в img2img, чуть повыше денойз, чтобы вариативность была, и крутишь до тех пор пока более-менее не получится.
>>946508 > да похуй как выглядит рандомная картинка. По-моему хорошо выглядит для базовой модели > как эта хуйня реагирует на промт Трансформер жи есть
>и насколько глубоки дегенеративные познания Астрапон грит что ноль цензуры и ноль запреток
>>946196 Отчасти верно, но "преимущественно технического направления" != "строго технического направления". Если выгонять отсюда праздных любителей погенерировать, то куда? Из /b/ их погонят (собственно, после этого, ЕМНИП, доска и была создана).
>>946521 С тем, что аниме-генерации - в аниме-тред - согласен. Однако, вопрос был не только о них, но и об иных, редирект которых не был явно прописан в правилах.
>>946503 >Очень интересно было бы послушать зачем пополняешь копилку доказательств того что ты выебан в глаза по полной? >>946466 >как вам качество типичная аниме хуйня, понятие качество к этому однообразию неприменимо >>946398 аниме-доска где-то там. ссылку не знаю, тебе виднее. пиздуй туда.
>>946524 То что не разрешено то запрещено, мне тоже некуда реалистик копро выкладывать, отправляют в хентай но я же не инфантил как анимедебилы, которые думают что если им нравится то и всем должно нравится и можно постить нерелейтед куда вздумается.
>>946535 > То что не разрешено то запрещено наоборот же, копропорно это порно поэтому нельзя, а ты просто обиженный, оказывается, других обидеть пытаешься, фу таким быть
>>946543 а как стащить только архитектуру проигнорировав имеющуюся базу? обычно же все модели это тренировка поверх базовой модели, если убрать знания базовой модели, то ничего не получится, потому что опираться не на что, так понимаю, по-другому чёт пазл не складывается в голове. или как?
>>946547 Если архитектура готова, но базовая модель не до конца обучена, можно начать файнтюнинг, если есть доступ к промежуточным весам базовой модели. Особой разницы не будет с законченной базой, т.к. астралайт опять все знания затрет и будет чисто нсфв порно цопе модель.
>>946543 >других обидеть пытаешься Аненемедебилы первые огрызаться начали, я нормально без агрессии просил обсуждать аниме в аниме треде, почему бы не сидеть в тепле и уюте с единомышленниками? Никто туда не залетает и не постит нерелейтед, как делают они, нет надо вылезти и по всей борде свое анимеговно размазать.
>>946553 >астралайт опять все знания затрет Ну тащемта в этот раз он аккуратнее ебашит + трансформер вместо калцептов, поэтому может в предметку >>946539 как тут
>>946554 > просил обсуждать аниме в аниме треде >Генерируем тяночек! >обсуждать >Генерируем тяночек! Дебильный реалистикопидорок, там всем похуй на то как и что генерится, сидят долбят свои (((((мастерпися:100500)))) и копируют стены промтов в негатив для сдхл вместо использования дмд, нюансы лапшеведения только тут обсуждают.
>>946554 > Аненемедебилы под кроватью ещё их поищи, это те же аноны, что постили голых тяночек натвиза бигаспа реалпонихуйню флюсокал и остальное, просто новую игрушку выпустили (люстра-нубаи) пидорбля нахуй мозги ебёшь даун ограниченный никто не набегал в твоё уютное логово, потому что оно только в голове
>>946561 >Технические аспекты там обсуждают orly >сиди вы там и дмд с лапшой обсуждали бы предлагаешь мне пойти и начать туда срать картиночками из натвиса? или у тебя фиксация что нужно срать онеме в онеме а все остальное итт? ну это ОКР значит, ты шиз, твое мнение не учитывается, можешь не продолжать раздавать свои особо ценные советы
>>946284 Стандартный тренинг лор стандартных очень заебный какой-то как по мне. Хотя тут есть аноны которые могут не согласиться и принести лору натрененную за 7 минут и тольковыиграть от этого.
Я бы предпочел файнтюн полной модели и вычитание ликориса из нее, либо B-Lora https://b-lora.github.io/B-LoRA/ потому что там стиль и концепт могут быть раздельными.
>>946560 Вы считаете что раз тут раньше сидели и постили релейтед то теперь можно засирать тред нерелейтед и превращать его во второй аниме тред. Нормальные люди просто начнут его обходить стороной и он загнется, аниме тред не просто так отделили. >>946568 Нет, никто и слова вам не говорил пока вы постили аниме связанный с другими аспектами генерации, но сейчас же вы опустились до тупого засирания треда аниме картинками >>946520
Не ну бля реально я кстати тоже осуждаю вброс манямекала без причины ради того чтоб просто запостить манямекал. НО если это постится для обсуждения технической части ещё терпимо. Просто так постите это в релейтед треде.
пиздец панику навели, просто челы открыли для себя нубаи и посрали аниме, сейчас со школы придут адепты гусиной кожи и все снова встанет на свои места, хули трясемся
>>946612 анимедебил не копротивляся. мне ещё бабка грила что если глаза на пол ебала и занимают место мозга, это говорить об анимедаунстве и таких тёлак надо избегать, т.к. там места для мозга нет нихуя бля
>>946724 спасибо, получилось. результаты не всегда стабильные, иногда пидорасит картинку. ну поиздеваться над фотками друзей сойдёт. я так понял, не смотря на fp8 модель, всё это развертывается в пожирание видеопамяти и выпадение за ее пределы. аж 22 гига съедает при попытке комбинирования двух картинок, из них 10 в озу забирает.
>>946747 > я так понял, не смотря на fp8 модель, всё это развертывается в пожирание я так думаю, что дело во враппере в этом можно выбирать, но он насильно качает 16 кековую https://github.com/1038lab/ComfyUI-OmniGen
>>946502 Да в пизду, сидеть заморачиваться из за пяти минут любования а потом выбрасывания в корзину.... Эта не та картинка над которой хочется сидеть работать...
кароче блять решил попробовать билору тупа 10 шагов, на одной картинке пик 1, 2 минуты нода блоры в комфи ее не определяет как билору, но зато если ебануть ее в обычнолора ноду и выставить вес в 50-100, то выдает вот такое
я хуй знает то ли обосрался толи нет, как ее в тру билору то превратить нахуй
>>946765 так я тренирую билору, там концепт и стиль должны быть разделены, обычную лору на весе 100 бы в черный экран ушатало а тут работает, при этом эта говнолора не определяется как билора
>>946747 >For image editing tasks, we recommend placing the image before the editing instruction. For example, use <img><|image_1|></img> remove suit, rather than remove suit <img><|image_1|></img>
>>946771 Там даже раздела под билоры, как я тебе дам, иди в репо готовые билоры потыкай тестовые, там их куча. Но я со скорости обучения и скорости пиздинга стиля даже на таком говне прихуел уже.
>>946763 взял другой томл конфиг blora_content_layout_style, 10 степов, билора все равно нетопределилась, вес работы в обычноноде снизился до 25-50 я так понимаю оно тренит ликорис но с функциями билоры
>>946701 >>945893 спасибо за наводку, анон. квантованная модель завелась. скачал отсюда со встроенными сиськами https://civitai.com/models/730767?modelVersionId=817164 правда по началу выдавало просто чёрные квадраты, перезапстил, начало рисовать, но с артефактами. перезапустил ещё раз и теперь рисует чисто.
>>946879 хорошо, давай попробуем так >флюхкал, лапшеговно, гомфи, мыло, факасс, каломатик-поломатик, гусиная кожа, аниме, педофил, дмдшиз, %геймчейджернейм% ЕБЕТ, давно не трогал ВАШ сд расскажите че там как там
>>946899 >как билора не определяется все равно блять если кто непынял проблема в том что мне нужен ток стиль, а оно мне еще концепт с пикчи по факту пихает
>>946901 Да это мем, b-lora это такая же обычная лора, просто с отключенными слоями, ничего в ней особенного нету и скорее всего это всё не переносится не то что между кардинальными изменениями в архитектуре, а возможно даже и между моделями, которые далеко друг от друга в плане весов, по типу пони и нуба, и нужно подбирать будет слои, которые больше всего оверфитятся на каждой модели
Бля, 7 понь можно не ждать... Это буквально выглядит как его попытки тренить полтораху, только у этой полторахи текстэнкодер чуть получше. И это какая эпоха вообще, не пишет?
>>946952 >и скорее всего это всё не переносится не то что между кардинальными изменениями в архитектуре, а возможно даже и между моделями, которые далеко друг от друга в плане весов пиздец ты колумб ебаный, >>946864
> b-lora это такая же обычная лора, просто с отключенными слоями >нужно подбирать будет слои, которые больше всего оверфитятся на каждой модели
>>946899 Ну кстати отдельно слайсер скрипт есть, надо попробовать стиль и концепт разделить и посмотреть че будет. Так даже лучше наверно что отдельно ноду билоры можно не юзать. Тольковыиграли!
>>946968 Да я видел эти конфиги, ты на разных моделях попробуй, после релиза хл с кохьей вообще около года впринципе не работало отключение отдельных блоков
>>947013 >базовая ага. не качай, жди когда базовый анимешный кал отполируют файнтюнами и мержами и можно будет нормально генерить реалистик, а не только плоские лупоглазые рожи
>>947013 >Это типа базовая модель? весь датасет данбуру и е621 >Как точно пишется? NoobAI, там епс и вперд версии, епс дотренена до 1.0, вперд 0.5 пока что >И есть ли там позы, потому что адекватно раком только пони вроде ставит. Там полная ебка поней по позам. Да и не по позам.
Дифузанычи, нужна ваша помощь. Год назад когда начинал ковырять автоматик1111 делал по гайдам картинки через контрлнет - всякие стилистики, замена лиц, объединение картинок. Но я тогда просто повторял, без понимания. Сейчас опять накатил себе уже фордж и хочу понимать как этот контролнет устроен: 1. Нахуя все эти препроцессоры есть, если по ним нету моделей в из коробки? Или не для всех нужны модели? Или их надо докачивать? (пик 1) 2. Если модели надо докачивать, то в https://huggingface.co/lllyasviel/sd_control_collection/tree/main , например какие то годовалые файлы, они актуальные? 3. Есть простое и понятно описание как, в дефолтном фордже (и автоматике) пайплайн устроен? В какой момент контролнет в дело вступает? После промта? В комфи я так понимаю там можно как угодно сделать пайплайн. 4. В частности интересует генерация txt2img и замена лица с сохранением стилистики изображения. Например если я рисую аниму, то хочу чтобы и лицо было конкрентого человек, но в стиле анимы. Короче если использовать НЕ контролнет, а какой-нибудь фейссваппер - там как будто просто прифотожабленое лицо. 5. Есть какой-то общий туториал по препроцессорам контролнета, хуле их там штук 20 - по каждому свой гайд страниц на 10 может быть. Мне бы выжимку какой для чего. Или 90% из них нахуй не нужны?
Короче, буду задавать тупые вопросы по контролнету. В ютабе че то залупа какая-то годовалой давности. Понятно что за год наверное ничего особо не поменялось, но хочется инфы в понятном и простом виде.
>>947023 >каломатик >фураж ну пожелаем тебе удачи наконец найти комфи в интернете >Нахуя все эти препроцессоры есть, если по ним нету моделей в из коробки? Или не для всех нужны модели? Или их надо докачивать? (пик 1) для лайнартов куча контролнетов, докачивать >Если модели надо докачивать, то в https://huggingface.co/lllyasviel/sd_control_collection/tree/main , например какие то годовалые файлы, они актуальные? ну скажем так, актуальные, но с нюансом - не под все модели допустим большинство контролнетов под обычные файнтюны реалистики SDXL контролнеты работают, а вот с условными понями нужны свои (нет там конечно какойнибудь канни и там и там работает, но если позы то нужна своя модель) алсо если тебе лень ебаться с тонной моделек контролнетов то можешь просто скачать Union, это типа мультиконтролнет https://huggingface.co/xinsir/controlnet-union-sdxl-1.0 >сть простое и понятно описание как, в дефолтном фордже (и автоматике) пайплайн устроен? также как везде, особых отличий нет под капотом >В какой момент контролнет в дело вступает? После промта? промт это нулевой пациент, он ебашит в клип, потом начинается денойзинг и если у тебя контролнет применен на 0 шаге, то он и будет с нулевого работать, как укажешь так и будет кароч >В комфи я так понимаю там можно как угодно сделать пайплайн. на самом деле от перестановки мест слагаемых сумма не меняется, только в редки особых случаях, когда у тебя из одного говна обязательно должно в другое говно лезть, а так пайп модели применяется последовательно с точки зрения загрузки моделей но одновременно с точки зрения применения, если применение отдельно не настроено >В частности интересует генерация txt2img и замена лица с сохранением стилистики изображения. Например если я рисую аниму, то хочу чтобы и лицо было конкрентого человек, но в стиле анимы. Короче если использовать НЕ контролнет, а какой-нибудь фейссваппер - там как будто просто прифотожабленое лицо. Для переноса ебел есть фейсайди и инстантайди, инстантайди может в рисовачку, но не уверен что в аниме. Ну и айпиадаптер в целом может тоже ебальник консистентным сохранять. >Есть какой-то общий туториал по препроцессорам контролнета, хуле их там штук 20 - по каждому свой гайд страниц на 10 может быть. Мне бы выжимку какой для чего. Или 90% из них нахуй не нужны? они нужны, но большинство ситуативные, на ютубе есть сотня видосов с обзорами того как работают
>>947018 >>947020 >>947026 лол, опять анимешные пуканы взрываются. хотите избавиться от тряски и прожигания стула? просто оставайтесь в своем стойле онеметреде и все будет нормально.
>>947036 спасибо, ананас, за отклик >ну пожелаем тебе удачи наконец найти комфи в интернете для меня он черезчур. я хочу максимум клипать арты от киберпанка, до фентези в разных стилистиках (от реализма, до мазни маслом на холсте) >для лайнартов куча контролнетов, докачивать >ну скажем так, актуальные, но с нюансом - не под все модели а есть общая помойка где можно поискать подходящее, что-то вроде того же civitai? или с ебаного худжингфейса в слепую качать по 1.5Гб? >на самом деле от перестановки мест слагаемых сумма не меняется ну я видимо совсем не шарю. я думал так: ты задал промт, он рисуется шагами один за другим, например 30 шагов. И на 25 шаге я подсовываю лицо и уже 25-30 шаги рисуются с учетом этого лица. нахуя лицо подсовывать в начале, когда там еще бесформенного говно. или это не так работает? >Для переноса ебел есть фейсайди и инстантайди вот я то как раз хочу генерить txt2img, а не свапать лица. чет сегодня пробовал с инстант-айди, хуета какая-то вышла, кусок говна вместо лица.
>>947044 >для меня он черезчур он прост как две копейки, видишь картиночку? это все что нужно знать + отдельно втыкнуть контролнет/адаптер/говно >а есть общая помойка где можно поискать подходящее чтобы прям все все все контролнеты нет, >что-то вроде того же civitai? есть общеиспользуемые это вот например https://civitai.com/models/136070/ там же есть еще, в поиске вбей >или с ебаного худжингфейса в слепую качать по 1.5Гб? ну обычно там примеры есть >ты задал промт, он рисуется шагами один за другим, например 30 шагов. И на 25 шаге я подсовываю лицо и уже 25-30 шаги рисуются с учетом этого лица. нахуя лицо подсовывать в начале, когда там еще бесформенного говно. у тебя на 25 шаге подсунутое литсо не успеет обработаться, т.к. шедулер уже к нулю стремится и поставка шума минимальна будет, на половине шагов еще ок >или это не так работает? да, контролнет расширяет архитектуру модели, добавляя дополнительную сеть, которая берет входной сигнал (например, скелет позы, контур или другое) и направляет основную модель генерировать изображение на основе этого сигнала. эта дополнительная сеть подключается к каждому слою основной модели и контролит процесс генерации на каждом этапе, подсказывая, как должны быть расположены основные элементы изображения >вот я то как раз хочу генерить txt2img не понял тебе надо генерить тхт2имг с конкретным еблом, но не переносить?
>>947054 >ссыкуха интересно, чего тут бояться? вот пачкаться - неохота. как об бомжа пьяного, который навязчиво предлагает выпить. можно конечно въебать по мордасам, а смысл? он и так жизнью обиженный. а, чуть не забыл, в стойло! ссылку ты знаешь.
>>947083 Ну или так. Фактически можно до полного сходства крутить просто на ипадаптере (сорт фо контролнет) и брашнете (или инпеинт контролнете любом). Но фейсид очевидно будет проще, особенно если у тебя нет ошибок инсайтфейса и не надо пердолиться с ним.
>>947094 А да, можно в первый шаг грузануть тоже фотку скарлеты вместе с условным стилем чтоб сетка знала с чем работаем изначально, чтоб облегчить сведение еблетов в конце, ну похуй я уже все закрыл.
>>947094 >>947103 брат-анон, по живому режешь. Я как раз эту хуйню и не могу раздуплить. Есть у меня такая хуйня, что я если сразу не понял как что-то работает, потом пиздец, хожу кругами и всё больше не понимаю.
Ниже скирины из ИП-адаптера и Инстант-ИД Мне что-то докачать надо? Можешь как тупому прям ссылку дать? С тем что на скринах пробовал - абсолютно нихуя не меняется. Явно я че то не то делаю. BrushNet - это тоже препроцессор какой-то?
Если да, то его просто одним из следующих шагов в контролнете ставить? Порядок не важен, как ты выше писал?
>>946977 >Ну кстати отдельно слайсер скрипт есть, надо попробовать стиль и концепт разделить и посмотреть че будет. Кароче да, эта хуйня работает. пик 1 дефолт натвис пик 2 контент билора пик 3 стайл билора
вес выкрутил на двушечку чтобы виднелось лучше, и это за пятиминутную тренировку на одной говнофотке
остается подобрать правильный томл и решить вопросик почему в билора ноду не суется орижинал модель
>>947112 >Мне что-то докачать надо? Можешь как тупому прям ссылку дать? У тебя какая модель изначально? Если сдхл - качаешь все для сдхл. Инстантид и фейсид разные модели, у них разные условия работы, фейсиду вообще лора нужна, а инстантиду инсайтфейс модель антелоп2
Касательно скринов, я вообще не ебу почему форж считает клипвижн модель препроцессором, а сам я каломатики открывал при царе горохе, хз как там щас, может так и принято там тут не помогу. Вот по комфи бы помог.
>BrushNet - это тоже препроцессор какой-то? Это инпеинт модель продвинутая, для каломатиков реализации нет насколько я знаю. Ты можешь заменить ее на любую другую которая заработает в форже.
>>947133 Спасибо, анон. Пока ждал твоего ответа уже накатил, похоже как раз то же самое что ты скинул. Брал отсюда https://huggingface.co/h94/IP-Adapter-FaceID С мёртвой точки сдвинулось. Крипота ебаная выходит, но похоже на правду у этой Скарлет лошадиное ебало, что мало куда подходит
>>947120 > вопросик почему в билора ноду не суется орижинал модель Все ясно, в реализации через сдскриптс https://github.com/ThereforeGames/blora_for_kohya мы получаем билору, а потом делим ее и можем использовать как обычные лоры, так и задумано кароч
Анон, есть ли из моделей сейчас что-то лучше чем flux/flux fusion на forge? 8гб видеокарта, мне для объектов, дизайна, фонов и прочего. Если не цензурированы авторскими правами, то ещё лучше. Алсо, сиськи письки тяночки нахуй не нужны.
>>947194 >Остальных просто пожрал Местный хейтер который триггерится на слова фокус, дмд. Он же и набрасывает для срача например так >>946906 Для него скриншот фокуса, как красная тряпка. Или это ты и есть, лол?
>>947238 >Майонез Ты в курсе, что сабж невозможно сейчас сделать из магазинного масла подсолнечного? Туда (в масло) хуярят какую-то залупу, что-бы мазик сами не делали)
>>946738 >Пригожин и какаято шкура смотрят на тебя как на говно - то вполне удачно Проорал, сам удивился почему Пригожина нарисовал, там моя фотка была) ток я на него вообще не похож
>>947015 А, так на нубаи нет реалистика? Ну для меня это огромный минус. Хотя если честно то и на поней реалистик ну так себе. по сравнению с Флюксом конечно.
>>947280 жаль нативно в буру тегах кепчерит хуеватенько, щас попробую чтобы он сначала генерил огромный промт, а потом просить чтобы уменьшал до буру тегинга
>>947298 Не стоит удивляться. Для человека которые впервые увидел реку(море), лодку, велик и колесо - вполне себе нормальный вопрос. Мне пони понравились тем что там можно много гадких поз нагенерить, а так же буратин совокупить. Есть ли ещё подобная реалистик модель? Я не нашёл. Вкот два дня.
Вопрос для знатоков и опытных - я хотел сгенерить пикчу, где девушка в ночном клубе нюхает кокс с стеклянного столика. Подключал для промта даже чат джпт - результат никакой! Щас скину что выдало. Так вот вопрос к знатокам - как победить генератор? На текущий момент для меня это непосильная задача, а тема очень интересная.
>>947305 У тебя результат вполне неплохой, тут есть и девка, и стол, и кокс, и клуб. С занюхиванием сложно, вполне вероятно, что таких данных у нейронки просто нет, их могли специально вырезать, т.к. употребление наркотиков плёхо и показывать это зопрещено. Попробуй просто носяру ей порошком белым измазать, как будто она уже бахнула как следует. Импейнт в помощь.
>>947310 Ну через импейт можн опопробовать думал об этом. Точнее думал через контрол нет, типа скачать такую фотку из инета, имедж ту имедж, врубить конрол нет по максимуму и попробовать. Прокатит?
>>947329 прикольно получилось. Трубочка во рту правда, лол. Я вобще заметил что трубочку флюкс рисует какуюто максимально уёбичную. Писал ему чтобы он из доллара свернул, так он мне выдал рулон обоев блин. Так и получилось что шлюха притащила с собой рулон обоев в ночной клуб.
>>947345 Этой технике инишл нойза тыщу лет, сетке гораздо проще делать чтото исходя из любого шума, пусть даже это цветное полотно, а не с рандомного нуля латента. Потом еще откроешь для себя плазма нойз вообще охуеешь.
Почему-то изи лора трейнинг скрипт просто перестал работать. gui запускается, загружаю yaml по которому тренил прошлую лору, ниче не меняю, жму старт - не происходит ваще нихуя. ни ошибок, ниче нового в консоли, просто кнопка меняется на "стоп трейнинг". что это может быть за хуйня? чё-то с питоном?
>>945893 в целом доволен, можно юзать. нормально понимает человеческий промпт и теперь не нужно ебаться с регионал промптерами и прочей хуйнёй. а можеш пояснить, почему лоры не работают с квантованной моделью? пробовал подключать парочку, но процесс крашится. нужно какие-то специальные лоры по квант или я что-то не так делаю?
Почему у меня в PixAI получаются лучше генерации чем на локалке. Позитивные и негативные промпты те же, лоры те же, модель та же, поверхностные настройки которые на главном экране те же.
>>945855 У меня 4060ти 8врам я в день релиза флюс шнель запускал оригинал и генерил 4 минуты, но до этого рн ещё минуту обрабатывал промпт и это при 12 шагах. Пробовал потом гуфы и они все херили качество и по сути скорость генерации только увеличилась, но уменьшилось потребление врам, я послал их на хуй. Щас генерю на обновлённой версии от разрабов флюкс ДЕВ и уходит 1 минута вообще на всё и главное результат похерен сеткой и полосами квантов. На самом деле я не генерю на этом флюскале, ибо нахуй он нужОн всратый блюр с жопами на роже и ёблами дженерик до тошноты. Годится только какую-то техническую хуиту высрать или другая специфика. Я всё сказал.
>>947411 так по сути это просто другая GUI обертка для sd-scripts? у меня он установлен, можно потестить, тоже сегодня о нём думал, может быстрее дело пойдёт
>>947451 для xformers этот тритон нужен вроде, ну а ждал долго после начала тренировки? как показатели память и видеопамять меняются после старта тренировки?
>>947444 у меня 16 гб, в принципе все тож самое флюкс лично мне не нужен, не могу найти ему применение для своих задач (редхед еуропеан вуман кежуал дрессед)
>>947457 >как показатели память и видеопамять меняются после старта тренировки? никак, на нуле остается. тренировка тупо не стартует. короче в пизду, просто установлю заново это говно. спасибо за помощь
>>947445 >обертка судя по коду - нет >>947449 единственное что верно, это то что тебе забрызгали очи малафьей >>947461 >школота хехе, у школоты обычно нет железа\мозгов для трейна лоры. судя по тому что у тебя ничего не выходит, ты из их круга.
>>947425 ты запускаешь в фордже? Тогда там насколько помню нужно что-то вроде low bits в Automatic (fp16 LORA) выбрать.
С Комфи сложнее, там изначально все работало как надо, но потом автоматическую оптимизацию лор для Flux убрали, и теперь она подключается только при запуске в fp8 режиме с командой --fp8_e4m3fn-text-enc --fp8_e4m3fn-unet
Анон, а как сделать, чтоб объекты не обрезались? Например, хуярю обычный череп. Часть генераций делается так, что этот череп не влазит в кадр, блять. Кто-то сталкивался с подобной хуйнёй? Может промт какой дописать, или что?
>>947522 >12RAM озу компа маловато, хорошо если хоть будет свопить на ssd, а не вылетит вообще. там качается официальная 32-гиговая модель flux, затем при обучении квантизируется в выбранную в настройках точность.
>>947554 >Может у тебя с разрешением пикчи что-то не то? Хороший вопрос. Изначально был квадрат 1000 на 1000. При изменении разрешения разницы не было. Когда вернул разрешение на дефолтное для модели, вроде стало лучше. Бля. Короче, у меня череп с брызгами, искрами, дымом или любой другой хуйнёй для украшения. Сам череп влазит, а вот этот дым/искры всегда за край экрана уходят. Вверху особенно.
>>947640 >не умеет в git clone и venv Да умею я в git clone, просто тут когдато кидали портабл версию, я подумал что она на линухе тож зведется, а так то у меня стоит... в том числе и комфи на компе.
>>947648 >кидали портабл версию, я подумал что она на линухе тож зведется виндовый портабл? нет. >>947651 google images\yandex images для чего? введи что хочешь найти, скачай ~10 картинок и обучай
Насколько шизовая идея обучать одновременно несколько лор, которые будут переключаться по тегам прям в процессе обучения + несколько слайдеров на параметры изображения? А еще лучше несколько DoRA. И как там со слайдерами, кроме веса лоры ничего умнее не придумали?
Ставлю лоры на эмму ватсон для теста на натвис, 9 из 10 кадров шляпа какая-то выходит. Если мне нужна конкретная телка, нужно самому тренить лору конкретно под него, чтобы похоже было и не шакалило? Или у меня руки кривые
>>947770 Берешь несколько фоток, тренируешь билору 500-1000 шагов прямо на натвисе тупа без описания чисто с токеном вызова уровня [93847] можно в принципе и расписать тхт, но по моим наблюдениям если надо прямо спиздить все подчистую то надо чисто на токен тренить, собсно в папере так и расписано, дальше либо используешь полную лору содержащую концепт и стиль, либо только концепт, либо только стиль. Учитывая что тебя субъект, то это концепт. На всё минут 20 уйдет на 3060.
Можно в принципе и дору натренировать, она как раз про консистентных субъектов, но дора функции включаются в билору в том числе.
Лораделы, назрели вопросики, так как мой попуки с лорой закончились еще во времена полторашки. А тут уже какие то новые Доры, Уантрэйнеры и пр... Так что сейчас золотой стандарт? Нужны ли регуляризационные изображения? Какого вида описания в ходу и нужны ли они сейчас?
>>948184 > Так что сейчас золотой стандарт? 98% шизов тренируют обычные лоры с пережарами и ебкой модели, 1% сидит на дефолт ликорисе, 1% растекся по всем остальным методам (дора, билора, дилора, локр, хуекр). Я лично за дору и мейбибейби билору, потому что их перетренировать практически невозможно.
>Нужны ли регуляризационные изображения? Обычно нет
>Какого вида описания в ходу и нужны ли они сейчас? Зависит от типа лоры и целей. Если цель обучить лору на сорт оф хуман лангвиж то пойдет ллмное описание картинки, если нужны вызовы по токенам то просто буру тегами, в особых случаях как с билорой кепчер файл может содержать только один токен вызова.
1. https://github.com/kohya-ss/sd-scripts клонируем, ставим реквайременты 2. https://github.com/ThereforeGames/blora_for_kohya - качаем, кидаем файлы папки в корень к sd-scripts где лежат реквайрменты 3. Клониуем sdxl_blora_fast.bat и переименовываем в удобное, этот файл для запуска тренировки, внутри оставляем только accelerate launch --num_cpu_threads_per_process 8 sdxl_train_network.py ^ --pretrained_model_name_or_path="K:/абсолютный путь к модели" ^ --train_data_dir="example" ^ --output_dir="output_dir" ^ --output_name="pidoras" ^ --network_args "preset=K:/sd-scripts/sd-scripts/lycoris_presets/blora_content_layout_style.toml" dora_wd=True ^ --resolution="1024,1024" ^ --save_model_as="safetensors" ^ --network_module="lycoris.kohya" ^ --max_train_steps=100 ^ --save_every_n_steps=20 ^ --save_every_n_epochs=20 ^ --network_dim=64 ^ --network_alpha=64 ^ --train_batch_size 1 ^ --gradient_checkpointing ^ --persistent_data_loader_workers ^ --enable_bucket ^ --random_crop ^ --bucket_reso_steps=32 ^ --min_bucket_reso=512 ^ --mixed_precision="fp16" ^ --caption_extension=".txt" ^ --lr_scheduler="constant" ^ --lr_warmup_steps=0 ^ --network_train_unet_only ^ --prior_loss_weight=0 ^ --use_8bit_adam ^ --learning_rate=5e-5 ^ --seed=0 ^ pause
Соответственно pretrained_model_name_or_path указываем модель (билора тренируется под модель), train_data_dir - папка рядом с батником с датасетом и кепчер файлами (структура самой стандртного вида "exmpale/1/файлы тренировки", где 1 количество повторений), output_dir - очевидно то место где будут храниться промежутки тренинга и финал билора, output_name - название, network_args - томл файл для тренировки билоры (находятся в lycoris_presets, можно выбрать другие), дора_вд - применение декомпрессии весов как у доры, остальные настройки по своему усмотрению, данные были взяты из оригинального репо https://github.com/yardenfren1996/B-LoRA , но можно и всякие продижи в качестве оптимайзер юзать в доп аргументами и тд. Если тренируется под пони или нубай то указывается аргумент --clip_skip 2
4. Если во время обучения кмд ебет мозги депрекейт фучур варнингами их можно вырубить в sdxl_train_network.py прописав выше всего: import warnings warnings.filterwarnings("ignore", category=FutureWarning)
5. Подготовить датасет можно ручками, достаточно раскопировать тхт с одним и тем же токеном вида "A [токен]" или "[токен]" без кавычек, будь внимателен и бери слабый или незанятый токен, или вообще последовательность цифр, потому что допустим тренировка под [v] согласно паперу не совсем корректна, т.к. большинство файнтюнов в курсе насчет v-gesture и будет токенликинг и все объекты генерации будут вам два пальчика пытаться показать. В идеале сеть не должна знать о токене, поэтому берите ченить на транслите типа [pidoras] или цифрах [34452], можно кобинировать в [p1d0r45]. Квадратные скобки кстати не обязательны, просто дополнительное отделение токена от токенов сети.
6. Если требуется раздрочить кепчер (что для билоры в принципе не требуется но мало ли), то картинки прогоняются условным дипданбуру или вайфудифужн таггером и получаешь последовательности концептов. Если хочется натренить на сорт оф хуман лангвиж, то хорошая нсфв модель для кепчеринга это Torii-Gate. Модель в nf4 https://huggingface.co/2dameneko/ToriiGate-v0.3-nf4/tree/main Скрипт для использования https://github.com/2dameneko/ide-cap-chan Ставишь скрипт, создаешь папку внутри 2dameneko внутри ToriiGate-v0.3-nf4 куда кидаешь все файлы с хага.
Команда генерации для торигейта находится в файле ide-cap-chan.py в строке user_prompt = "Give...", можно свободно менять, т.к. по дефолту торий генерит огромные шизопосты с детальным описанием. Команда типа "Give a detailed description of the picture (subjects, objects, background, colors, etc). Make the description short as possible." на мой взгляд работает гораздо лучше. Кидаешь все картинки в папку 2tag, запускаешь batch_processing.bat, ждешь. В среднем на 3060 одну картинку кепчерит за 20 сек. Алсо торигейту можно скормить бурушный кепчер для более лучшей генерации.
7. Когда получилась лора ее можно оставить как есть, либо разрезать на составные части. Допустим если взят томл конфиг тренировки blora_content_layout_style то лору можно разрезать на три лоры - content, layout и stye. Слайсинг делается с помощью blora_slicer.bat, blora_slicer.py и blora_traits.json, их можно скопировать в аутпут папку к билоре и оттуда поменять blora_slicer.bat настройки и запустить. Алсо если билора недотренена, то у нее спокойно можно поднимать вес при использовании.
>>948233 >потому что допустим тренировка под [v] согласно паперу не совсем корректна, т.к. большинство файнтюнов в курсе насчет v-gesture и будет токенликинг и все объекты генерации будут вам два пальчика пытаться показат Поправка, это будет только если билора тренируется без тренировки клипа. Если билора тренируется вместе с клипом то применение лоры с весом клипа 1 будет перезаписывать токен основной модели и токенликинга не бу дет.
>>948233 спасибо за инструкцию, а модель можно любую? натвис например? и какие требования к датасету? если у меня например фото разных размеров мне их нужно подгонять или есть что-то вроде bucket?
Попытка номер два сделать говномерж лучшую в мире модель. Цель повысить четкость и красивость лица оставив круглые жопы, вроде вышло.
Кстати лайфак для комфи если места нет, если оутпут на другом свободном диске можно в него модели пихать \Output\checkpoints без пердолинга с симлинками.
>>948370 >а модель можно любую? натвис например? Любую, в которой будешь юзать, да. >и какие требования к датасету? если у меня например фото разных размеров мне их нужно подгонять или есть что-то вроде bucket? Требований особых нет. Есть букет и есть рандом кроп, обе в конфиге базовом включены.
>>948407 >MBW Брат, поблоковый вейтед сум мердж хуйня постная. Бери DARE (там и клипы можно друг об друга перетрахать еще) и ебись с ним или хотя бы пикрелы (самый йобовый из них что для лор что для моделей это метод сингулярного разложения aka SVD aka Rotate в mecha, но если че он считается оч долго).
>>948261 >у меня не получается мердже, кто нибудь сможет сделать из sdxl модели inpaint. zavychromaxl-v10. Пожалуйста Зачем тебе мерджем делать инпеинт, когда ты можешь подключить BrushNet к модели и она станет инпеинтом? > И не знаю что грузить в третичную модель Если ты стандартным аддифренсом хочешь из не инпеинт модели сделать инпеинт, то тебе нужна инпеинт модель в A, твоя неинпеинт модель в B и базовая модель архитектуры в C. Так как оффициальных инпеинт моделей не существует под сжхл ты можешь попробовать взять натрененые сообществом, например в жагернаутовской говноипеинт модели взяли вот этот инпеинт версии 0.1 https://huggingface.co/wangqyqq/sd_xl_base_1.0_inpainting_0.1.safetensors/tree/main сконверченный из дифузерсов https://huggingface.co/diffusers/stable-diffusion-xl-1.0-inpainting-0.1 сделанную диффусер тим
>>948414 Сложна, тарабарщина какая то, я только сегодня понял что за блоки. Когда нибудь и это пойму и сделаю лучше. Но вышло то нормально, то что хотел и как в лустифи херы с сосками не лезут из всех щелей.
>>947513 спасибо. да, в фордже запускаю. переключил на fp16 LORA теперь работает, но иногда всё равно вылетает. возможно когда подключаю больше одной лоры. видимо они тоже занимают видеопамять. приходится балансировать.
>>947411 попробовал OneTrainer работает быстрее в кохе 6+ секунд итреация, в трейнере 3+, правда другие настройки. может из-за того что модель в кохе более жирная и не влезает в VRAM. Но в новой тренировке Adafactor уже на 4-й эпохе на том же датасете уже более менее нормальные результаты выдает
>>948425 я так и сделал в модель а грузил джигернаут хл, во вторую вот эту из которой хочется инпейт сделать, а в третью базовые только нашел на 1,5, хл модели не нашел.
>>948233 Ради интереса попросил гпт сделать зе бест конфг, получилось пикрел. Иксформерсы у меня не работают, размер я бы оставил 1024x1024 т.к. в 3060 все влезает, в остальном ок. Если скормить конфиг блора классик то предлагает пик2.
>>948471 > в модель а грузил джигернаут хл, во вторую вот эту из которой хочется инпейт сделать, а в третью базовые только нашел на 1,5 >хл >1.5 Чел ебать, ты две разные архитектуры пытаешься смешивать, это невозможно. Базовая модель sdxl вот https://civitai.com/models/101055/sd-xl
>>948494 Я знаю что в третичную не надо грузить 1,5, спасибо за ссылку на базовую модель. Низкий поклон
BrushNet это отдельная суета от а1111? его никак не интегрировать в в ту хуйню которая у меня открывается в браузере? я нуб, как ты понял. В среде конды прописывать и устанавливать BrushNet для меня это темный лес, или может есть туторы адекватные, смотрю щас какого то американца, степбайстеп иду, а мне только хуй сосать остается с моими ошибками
>>948532 >BrushNet это отдельная суета от а1111? Конечно. >его никак не интегрировать в в ту хуйню которая у меня открывается в браузере? Под комфи есть удобненькие ноды. Пример с твоей завихромой. >я нуб, как ты понял. Тебе надо просто освоить комфю, там нечего осваивать. >В среде конды прописывать и устанавливать Это нинужно.
>>948621 сгм униформ, кфг 1.5 и 1 тоже пробовал я так понял тайловый апскейл там не канает? мне почему кажется мыло какое-то, а при тайловом апскейле распадается картинка, ну попробую еще настройки покрутить либо хайрезфиксить
>>948633 Пару месяцев назад тут дрочили на апскейл и кидали 5к картинки, но я не умею. Мне хватает 1.5х с дипшринком. >>948648 А нечего было голенькой сниматься в суицайд герлс, на её паках отфайтюнили модели и стала дефолт тяночкой в люстифи\натвисе с дмд, всем тредом на неё дрочим.
Товарищ Первый, нужна срочная конкретная помощь! Суть - пытался создать эпичное полотно - два всадника несутся друг на друга, кони в стремительном галопе, копья опущены для удара, заморочки с небом, игрой света и тьмы, задумка в принципе не такая уж оригинальная, лучшее что получилось прилагаю. И это убожество - наилучшее что сгенерилось. Я разочаровался. Если что использовал Флюкс дев. Решил сделать хотябы одного всадника. Суть картины такова - всадник на коне, конь максимально на дыбы, почти вертикально, рука с мечом вытянута вверх, на мече яркий солнечный зайчик, под копытами коня полотнище в цветах радуги. Тут вобще приключился позор - в первую генерацию полотнище с цветами радуги нарисовали в качестве плаща всадника. Можете представить как вытянулось моё ебало, почти как рука с мечом. Но через пару генераций, результат хоть не выдавал такую переворачивающую картину, пик прилагаю, это лучшая генерация. Но! конь недостаточно на дыбы, меч недостаточно в небеса, блик на мече недостаточно ослепляет! Как добиться нужного, без использования контрол нета и вообще имидж ту имидж?
>>948681 а метод апскейла такой же? у меня изображения бледнеют по какой-то причине и более плоские становятся >>948685 хм ойлер а симпл 15 шагов, сейчас попробую, спасибо
>>948692 > а метод апскейла такой же? у меня изображения бледнеют по какой-то причине и более плоские становятся Так ты распиши нормально промт, нубай натренен на огромном количестве токенов и натренирован так чтобы минимум на 30 шагаз результат выдавать такто
>>948709 понял, убыстрялки с ним тогда не особо полезны, если на 30 шагах если б за 3 секунды делал - то полезно, иначе не особо много времени выигрваю
промпт вроде нормально расписан, мастерпия, бестквалити, хуемое, или ты что-то еще имеешь в виду? оверсатуратед какой нибудь?
>>948721 >убыстрялки с ним тогда не особо полезны, если на 30 шагах не ты непонил, дефолт без нихуя 30 шагов, с убыстрялками вот 10-15
>если б за 3 секунды делал - то полезно, иначе не особо много времени выигрваю нихуя се, у тя лцм сверхбыстрый + 15 шагов, x2+ по скорости чем 10 цфг 30 шагов эйлер дефолтный
>промпт вроде нормально расписан, мастерпия, бестквалити, хуемое, или ты что-то еще имеешь в виду? оверсатуратед какой нибудь? я имею в виду что 1. нубаю нужен детальный промт учитывающий в том числе цвета из-за особенностей обучения, на примерах cute loli child face, naughty_face, yello stockings, dress, leggings, boots, colorful background, erotic pose, masterpiece, best quality, good quality
2. использование дмд или дмдбейзд лор на нубае это не хуяк хуяк и поехал на одном токене как с обычными сдхл моделями
3. 1 хасл векторизед, 2 хасл диструбшнматчинг на эйлере, 3 векторизед + аутоцфг с проекцией от 7 цфг (притом что не все матричные слои подключатся из-за размера картинки), 4 векторизед + скиммед с проекцией до 1 цфг с 7 цфг все на 15 шагах
то что дмд фичи могут хоть как-то работать на нубае уже лучше чем пережаренное векторное ничего
>>948766 А ты вообще кто? Давай в /б к своим друзьям нахуй быстро и решительно. На нравится обсуждение техвопросов - сиди ридонли. Лично мне инфа интереса. Он же цель преследует не тупо картиночки постить как это делают ебланы в маняметреде со словами УТРИЧКА ПУК ЧПУК НЯ БЛЯ, поэтому твоё желание чтоб он постил "не одни и те же" - странновато.
Для этого есть технотред, дурилка ты тупенькая. Алсо, создал тред в /d/. Послушаем, что старшие модеры скажут. Может нашего пидорнут нахуй дурачка, который не трет технообосуждения из картинкотреда.
>>948839 Недавно залетел к нам, дурачок? Технотред для обсуждения созданий лора, чекпоинтов и т.п. здесь обсуждения генерации картинок, о чём в том посте и речь, с которого тебя затрясло. Разницу ощущаешь?
>>948852 >Алсо, ты тут нахуй не нужен. Я только зашёл. Мимо вообще. А тебя я помню, долбоёб малолетний с машинками из флюсокала, который срёт своим говном пища что тут никто картинки не постит. Ты пидор тут месяц назад нарисовался. Съебос оформи в /б чмоня малолетняя
Охуеть я сегодня открытие сделал. Увеличение разрешения ухудшает качество генерации. И увеличивает время вдобавок. Пиздец, это как то не логично, что более высокое разрешение даёт худший результат. Причём и по идеям худший, и по качеству. Или я сам какую то базу проебланил?
взломал жопу похоже слева дефолт дмд, справа обновленный дмд работает со всеми семплерами, работает в нубае и вообще везде завтра релизну нверно как протестирую хорошенько
>>945833 (OP) Пацаны, переустановил шиндовс, скачал фордж с пайтоном в папке, пишет кулднт ланч пайтон. Скачал аутоматик1111, поставил пайтон руками, гит тоже (и 2.3.2 и 3.1), ни фордж ни автоматик не запускаются, пишет кулднт ланч пайтон. Куда жать, чтобы всё работало? Картиночек погенерить хчц...
>>948913 Проебланил жоска, у моделей есть конкретный диапазон разрешений, на которых они натренированы. Если ставить сильно больше, то модель нихуя не понимает, что делать со всем этим лишним пространством, и ломается нах. Для сдхл и производных базовое разрешение это 1024х1024.
>>948913 > Охуеть я сегодня открытие сделал. Увеличение разрешения ухудшает качество генерации. И увеличивает время вдобавок. Пиздос у нас в треде КАЛумб, всем лежать+сосать > Пиздец, это как то не логично, что более высокое разрешение даёт худший результат. Причём и по идеям худший, и по качеству. > Или я сам какую то базу проебланил? Ты проебланил что юнеты в принципе без мокрописек (шринк, раунет, паг, и прочие атеншнеры + дмд имеет фичу помогать генерить сильно больше размера) не могут в размеры выше размера датасета. Вот трансформерсы типа рфлоу могут.
>>949315 >задача века: заставить дмд работать не на лцм и выше 1 цфг с негативами >залетуха с двачей: а давайте тестировать на лцм и 1 цфг Братик, в этом нет смысла.
>>949324 >давайте тестировать на Ты не понял что тебе сказали. Тестировать высокие цфг нужно на обычных картинках. Без винтажности, не аниме, не хдр. На том, что сразу показывает пережарку по цфг. А ты показываешь тесты на аниме и винтажках которые можно пережаривать без ущерба.
>>949369 > нужно А че еще нужно, давай выкладывай сразу, чтобы точно знать что не делать >на том, что сразу показывает пережарку по цфг. Ну так дмд и так жарит выше 1 кфг как физическая константа, какой-то пост ниочем.
>sd foocus 2-5-0 Не смешивай говно и базу. Сд это семейство моделей, факас это уебанский интерфейс для детишек.
>Пацаны подойдет ли для моей системы >на gtx 1650 4gb mobile ryzen 5 4600h 16gb ram 512gb ssd Проц не важен. 16 гигов хватит в целом с натяжкой если модели не мешать, я два года назад на 1063 с 32 гигами сидел и мешал модели ещё кста. На самой гтхе без танцев запустится полтораха и все с ней связанное. Сдхл модели только в фп8 в ComfyUI сможет уместиться в 4 гига, вот например пони https://huggingface.co/YOB-AI/PDXL-FP8/tree/main , челики на 4 гигах спокойно запускали и только выигрывали
Учитывая изначальный вопрос сможешь ли ты на факасе с комфортом генерить говно дебильное под 4 гигами, ответ - нет, потому что у тебя банально модель полностью в врам не залезет и частично выгрузится в рам, а это критикал падение скорости, да к тому же на 10 поколении которое само по себе тормоз
>>949390 А что посоветуешь я так пологая нужно устоновить какую версию SD и есть ли гайды что такое lora deliberate и как настроить под мой характеристики
>>949404 > А что посоветуешь я так пологая нужно устоновить какую версию SD и есть ли гайды что такое lora deliberate и как настроить под мой характеристики Ты тролеш чтоли? Нука пруфани системками с супом, а то не хочеца впустую писать
>>949406 Неа ты о чем? Я просто хочу понять ты сказал что foocus говно и не подходит для моей системы а я просто прошу какая версия Stable Diffusion подходит и я просто полный 0 мало знаю посоветуй и как настроить есть просто хочу генерировать арты
>А что посоветуешь я так пологая нужно устоновить какую версию SD и Я посоветую не лениться и изучить сразу комфи даже если ты ультра носкилл новичок на говне вместо карты.
>есть ли гайды что такое lora deliberate Это какоето говно дебильное от одного шиза с ютуюа, не бери в голову. Единственные лоры которые тебе нужны на полторахе это лоры консистенции чтобы генерировать быстрее и консистентнее. Ну или лоры стилей или с какими-то особыми фичами типа слайдеров.
Как только освоишься с комфи приходи расскажу как попытаться жить с 4 гб врама под SDXL.
>>949456 теперь чо делать где sd перместил все что ты сказал и где интерфейс SD и run but не нашел в папке я сзапустил и устоновил через python.exe -m pip install --upgrade pip потопм нажал python main.py
>>949547 получился теперь как апскейлить изображение и можно ли еще лору на пальцы или лору на horror поставить и как вместе сделать и как ты где писать негатив промпт
>>949645 можешь добавить ноду clip set last layer чтобы клипом еще управлять
>>949677 >1080 на полторахе это не родной размер, генерь максимум 768 по стороне >как апскейлить изображение с твоей говнокартой только через тайловый ultimate upscale https://github.com/ssitu/ComfyUI_UltimateSDUpscale + апскейл модель по вкусу (их да ху я)
>можно ли еще лору на пальцы эффективных не существует, пальцы правятся контролнетами, которые твоя говнокарта вместе с моделью не потянет в комфорте, так что забей@терпи или можешь инпеинтить проблемные руки до посинения перебирая сиды
>лору на horror поставить ищи лору на хоррор лол очевидно, civitai идешь и ищешь, но вообще есть отдельные чекпоинты помню чисто на такое
>поставить и как вместе сделать вторую ноду с лорой вставь и подключи последовательно
>где писать негатив промпт у тя два поля clip text encoder, один позитив второй негатив, подключены соответственно к одноименным входам в семплере
======================================
Предыдущий тред https://arhivach.top/?tags=13840
------------------------------------------
схожий тематический тред
- аниме-тред
========================
Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях.
Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion.
Полный функционал в локальной установке (см. ниже)
Пробный онлайн-генератор Stable Diffusion: https://dezgo.com/txt2img
Пробные онлайн-генераторы Flux:
https://huggingface.co/black-forest-labs
https://fluxpro.art/
⚠️ Официальные модели stable diffusion от Stability AI значительно отстают по качеству от кастомных моделей (см. civitai ниже).
🔞 Без цензуры и полный функци_анал: только ПК-версия
===========================================
🖥УСТАНОВКА НА ПК
Портативная версия основного WebUI от Comfy (запуск с одного из run.bat файлов)
https://github.com/comfyanonymous/ComfyUI/releases
Примерные workflow для ComfyUI (можно загружать напрямую из картинок)
https://comfyanonymous.github.io/ComfyUI_examples/
------------------------------------------
Альтернатива - еще поддерживаемый форк ранее популярного WebUI от Automatic1111 (R.I.P)
https://github.com/lllyasviel/stable-diffusion-webui-forge?tab=readme-ov-file
------------------------------------------
👉 Для новичков - простой в работе WebUI Fooocus
https://github.com/lllyasviel/Fooocus?tab=readme-ov-file#download
------------------------------------------
Для тех, у кого видеокарта не тянет - оптимизированная генерация на ЦПУ
https://github.com/rupeshs/fastsdcpu
===========================================
📚 РАЗЛИЧНЫЕ МОДЕЛИ (И МНОГОЕ ДРУГОЕ) 👇
https://civitai.com/
https://huggingface.co/
------------------------------------------
📊 ПАРАМЕТРЫ И НАСТРОЙКИ ГЕНЕРАЦИИ 👇
https://teletype.in/@stablediffusion/samplers_steps
===========================================
🎨 ГАЙД ПО СОСТАВЛЕНИЮ ЗАПРОСА, СТИЛИ
https://teletype.in/@stablediffusion/artists_for_prompts
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols
Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her
------------------------------------------
♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇
https://supagruen.github.io/StableDiffusion-CheatSheet/
https://www.artvy.ai/styles
------------------------------------------
💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ
https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td
==========================================
🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇
https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora
https://civitai.com/models/train