24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Дорогие братья и сёстры. Бот в ТГ для генерации с NAI V4, там так же есть Flux (Schnell, Dev, Pro, Ultra), Ideogram (обычный и Turbo), Recraft v3. Поднял временно в честь добавления nai v4. Команды не самые удобные, но что есть, то есть.
@imgfun_bot
Примеры:
/nai -n 2 artist:comodocomodo, 1girl, souryuu asuka langley, red hair, sitting, indoors, looking at viewer, upper body
Тут их новая фича нескольких персов используется, лучше именно в таком порядке, иначе может неправильно парситься:
/nai -noq -n 2 artist:comodocomodo, 1girl, 1boy outdoors, bench, park, bright sky -char girl, sitting, white hair, long hair, loli, target#hugging -char boy, mature, sitting, brown hair, short hair, source#hugging, green eyes
По /nai сможете увидеть все опции - включая более высокое разрешение.
Если кому интересно, там есть и /gram (ideogram), /fluxpro /fluxultra, /recraft и т.д.
>>985985 Релейтед же, там и далли есть >>985987 Собирает статистику, связывая запросы и генерации с вашим аккаунтом. Учитывая легкость насколько сложно найти соответствие личных данных и ника в телеге - думайте перед использованием.
Вот эти посты >>985985>>985987>>986001 оставлены одним человеком по крайней мере с одного ip, благие у тебя намерения, создал для анонов или просто нашел и притащил - хз, но подозрительно.
>>986000 О нет какой то еблан найдет мою 1 герл стандин энд смайлинг ин суимсиут неет. ЗА ЧТО НЕ НАДО ДЯДЯ ААААА Иногда концентрация параноидальных шизофреников на дваче превышает всю допустимую норму. Ты блядь нахуй никому не нужен кроме своей бабы сраки ваня.
>>986054 Лицо и руки я могу немного поправить, если кто-нибудь попросит, а вот
>>986059 неевклидова геометрия - это конкретно черта wai люстры. Я иногда замечал, как персонажи цепляются за далёкие предметы, которые оказались рядом с ними только из-за перспективы. Полагаю, на картинке с большим количеством деталей они упорото сцепятся именно из-за этой фишки.
Пони меньше этим страдает, но у неё другая проблема: если объекты на картинке друг с другом не сношаются, то они просто помещаются рядом (например, из-за этого персонажи не несут оружие). Я думаю, есть какие-то обходные пути, чтобы фиксить это.
Я, походу, тупо шиз, т.к не вижу проблем с тем пиком. Ебало поплыло? Так это лоурез, всё равно фиксить, что руки, что лицо. Геометрия? Да, вроде, норм, ничего не режет особо глаз. Палитра приятная, пик интересный. Единственное, что по моему шизоидному мнению, портит пик, это тени, которые перетекают в цвета, хуже всего с плитками на полу, но и на картинах сломалось, да ещё и с оутлайном.
>>986128 >Я, походу, тупо шиз, т.к не вижу проблем с тем пиком. У картинки много проблем, часть из них проистекают из моей лени, а другая часть - из выбранной модели или сэмплера, не знаю точно. Фишка wai illustrous в том, что иногда объекты сцепляются друг с другом, несмотря на разницу в расстоянии от зрителя. С одной стороны, за счёт этой фишки люстра более компетентна во взаимодействии предметов между собой, с другой стороны - она генерирует майндфаки и невозможные объекты в промышленных масштабах. Если нарисовать люстрой просто портрет, этой проблемы не будет, потому >что на нём всё находится примерно на одном расстоянии. Если не использовать твикеры деталей, лоры на эстетику и стили художников с тягой к обилию рюшечек, думаю такая проблема тоже пропадёт просто из-за меньшего количества объектов на картинке, так что будет меньше неправильных выборов сцепливания.
Возможно, сэмплеры типа TCD с сильным сохранением консистентности исправляют это поведение модели, но я пока не нащупал набор инструментов, которыми можно нарисовать высокодетализированную картинку без майндфаков.
> Палитра приятная, пик интересный. Мой наёб в этой картинке заключается в лорах на эстетику и смешиванию стилей довольно крутых художников, у которых хорошо развит вкус в подборе цветов. Они очень сильно вытягивают среднее качество и детализацию картинки для того костяка, которым она сгенерирована (dmd2+люстра+12steps без улучшайзеров - это буквально фабрика низкопробного слопа с заваленным освещением).
Вообще говоря, это просто реакшон из кучи картинок, на которых я тестировал смешивание стилей. Раз анона так возмущает отсутствие шлифовки, я могу немного пройтись фиксами по персонажу, насколько он вытягивается нейросеткой в этой сборке.
>>986156 positive: masterpiece, best quality, amazing quality, very aesthetic, absurdres, newest, (scenery, volumetric lighting), artist:kawacy, artist:kawacy (fox girl with fox ears with dark tip and fox tail with white tip, 1girl, full body, yellow eyes, slit pupils, open mouth, fang, hair bow, tail bow), , cafe,cake on the table, masterpiece, best quality, amazing quality, very aesthetic, absurdres, newest, (scenery, volumetric lighting)
negative: lowres, (worst quality, bad quality:1.2), bad anatomy, sketch, jpeg artifacts, signature, watermark, old, oldest, censored, oversaturated, overbrightened, bar censor, (pregnant), chibi, simple background, furry, displeasing
На других моделях тебе придётся поменять импорт стиля художника, если это пони-лайк.
>>986208 >>986244 Реально НАИ4 параша какая-то. И всё потому, что криворучки решили с нуля трейнить модель, а не взять выверенный базис у гениев-разрабов SD/Flux.
Слепые челы на данбору не протегали ни artist name, ни signature на всех 100+ работах автора, хотя подпись на них всех есть. Теперь по тегу автора она вылезает на всех генерациях и не убирается соответствующими негативами. Что делать?
>>986166 >иногда объекты сцепляются друг с другом Больше похоже на проблемы какого-то рефайна или лор. Ну, хуже всего тени, остальное не бросается в глаза. На первом пике в чём проблема? Не ровные линии на заднем плане? Кривые блики? Ебать же ПРОБЛЕМЫ.
>>986348 Лол, надо бы его чекнуть. По рофлу говнарскую подборку закинул: дремлющие, siberian sorrow, головы с плеч, aura - радуга. Вообще интересно как разные модели на одно и то же реагируют. Ласт нуб вообще ни одного вайба не понимает, зато такой забористый и мемный делирий выдает, мое почтение.
>>986369 Ну, можно попробовать найти модуль адетальера, тренированный на обнаружение ватермарок, и им обрабатывать. Однако будут ложные срабатывания. Или наоборот - не будет детектить, в зависимости от сложности ватермарок.
Если оно не убирается по стандартным тэгам - `watermark, artist name, twitter username, patreon username, patreon logo, text, english text` то самое простое в таком случае - пост-обработка.
Вдобавок добавляя эти теги в негатив ты можешь влиять на качество и композицию картинки, в зависимости от того, насколько точно оно тренировалось. Но какой-то прям конкретной зависимости тут нет - ватермарки ставят все кому не лень, и на хороших пикчах, и на фиговых. Рандомизатор, короче.
А у меня немного странный вопрос и возможно не в тот тред, но можно ли использовать нейросетевые арты в коммерческих целях? Тип, например, использовать, чтобы создать арты для настольной игры.
>>986547 Если ты случайный васян, то никто не будет заморачиваться, если ты сам прямо не скажешь. А вот если это какая-нибудь гигакорпорация, например Blizzard в Hearthstone решит добавить, то там могут и экспертизу сделать, каждая модель имеет фингерпринты.
>>985970 → Бомбит от добровольного невежества. Почитай вон какая реакция у этих "анти-ии учёных" была, когда их тулзу челики из Цюриха проверять стали. В дискорде Cara такая заварушка была, аж Карла Ортиз прибежала и такая "Почему в глазурь ломаете, вам что не жалко художников, у которых всё украли without consent?". Лучше бы защиту новую придумали вместо того, чтобы доказывать как glaze, оказывает, не выдерживает 5% денойза, да. Вон, почитай тут несколько статей по мотивам этой "драмы" накатили:
>>986556 О, ну хоть увидел, как полностью глазированное изображение выглядит. Ожидаемо уебищно. Но чуваки, конечно, молодцы. Хайпанули на теме, развели гоев.
>>986566 Bias'ы / статистические аномалии, свойственные определенным моделям. Можно натренить нейронку, которая будет детектировать выхлопы разных генераторов.
>>986556 Хорошая подборка, спасибо >>986566 Если тредовичков поспрашивать или провести тест - они с оче высокой точностью скажут где какая модель. Может не сорта масляных лор, но базовые модели легко. Можно подвести более четкий анализ, даже банально сделать fft какой-нибудь проекции или другое разложение, и все эти визуальные особенности будут видны явным пиком. Проход другой моделью с приличным денойзом все замаскирует >>986588 Какая милота! Моар наряжания!
>>986597 >Bias'ы / статистические аномалии Полностью зависит от промпта. Может не встречаться вообще на очень больших выборках. Покрывается лорами или стилевыми токенами.
>>986599 То же самое. Подключем лору/встроенный токен на стиль Васи Пупкина. А заодно на Вынь Суя, Уябуси Сисиписи, и какого-нибудь Кумер Джонсона, для разнообразия. Определяй теперь, на какой модели этой солянкой стилей рисовали.
Особенно критично применимо к современному поколению моделей, кстати. Которые без "художественных" токенов или лор полноценно не работают.
Даже продвинутое "понимание промпта" того же флюкса можно имитировать при желании, банальной композицией нескольких картинок и прогонами и2и под контролнетом.
Аноны, я не про "базовую" стилистику спрашивал. Она вычисляется (с некоторой долей уверенности), но может колебаться в широких пределах и чрезвычайно просто маскируется. Я спрашивал про фингерпринты. Что-то, что вычистить нельзя. И по присутствию чего можно определять модель.
Очевидно, что таких вещей нет, а анон, написавший про это - шизик, которому стоит надеть шапочку. Из фольги. Ведь ОНИ следят!
>>986608 Очевидно что обеспечить фингерпринтинг можно по быстрому только на модификации vae, поскольку остальные нейронки зависят от ввода кумера и для обеспечения стабильного фингерпринтинга нужно слишком много мозгоебства неподвласного человеку который не может не ужарить несчастную сдохлю. Потому можно просто поставить люстроvae и гарантированно избавить себя от любых возможных проблем
>>986608 Лорами и тем более встроенными стилями - не, все равно ключевые вещи будут shines through, даже если ты этого не замечаешь. Даже масштабные файнтюны - в нубе оче много люстры и ее паттернов, назвать его полноценной базовой моделью язык не поворачивается, хотя столько всего пытались намотать. Алсо разве лицензия люстры позволяет вносить модификации на экстра запреты, или там ничего нет про это? Вопрос уже к судебной практике, примут ли не доказательства и что выкатят в ответ. > к современному поколению моделей, кстати. Которые без "художественных" токенов или лор полноценно не работают Ассортимент щитмиксов что работают даже без промта крайне широк. > Что-то, что вычистить нельзя. Скорее всего такого не существует, если речь именно о картинках. Можно легко натренить единый абсолтюный и незаметный паттерн, но даже если как говорит >>986615 засунуть в вае, чтобы иметь что-то в пиксельном пространстве, при обработке другой моделью все улетучится.
>>986618 >Можно легко натренить единый абсолтюный и незаметный паттерн А возможно ли это? Для этого придётся отравить датасет картинок и скорее всего переучивать с нуля всю модель, потому что иначе он будет нестабилен. Либо можно отравить отдельный блок но тогда он будет ебать картинку в кашу. Короче хуй знает, не похоже на реальный способ и уж тем более вряд ли применим к файнтюну
Только сейчас понял, что при латентом хайрез фиксе для повторного прогона через второй семплер не нужно много шагов выставлять. А я ставил 28 шагов. Пиздос. Хоть я и ньюфаг, но этой хернёй пару недель занимался.
>>986618 >в нубе оче много люстры и ее паттернов Сколько в них паттернов от SD-XL? А в поне? А в миксах поня? >щитмиксов То же самое, что и с лорами. Не сдетектишь, только если стиль не пробивает прям все возможные ухищрения, как на том же старом пастель-миксе было. Ну и их банально много, надо очень хорошо в сортах говна разбираться, чтоб вжаренный стиль одного микса отличить от другого. >Можно легко натренить единый абсолтюный и незаметный паттерн Маловероятно, что это "легко", вдвойне маловероятно он будет "незаметный", и втройне маловероятно что кто-то такую модель будет использовать.
>>986618 При обработке другой моделью просто добавятся bias'ы этой модели, но оригинальные все равно останутся, на уровне латентных фич. VAE кодирует пикчи локально, что, например, позволяет работать маскам и bounding box'ам всяким - т.к. они остаются даже после кодирования, просто с определенным loss'ом. То бишь если глянуть на латент, всё равно видна основная композиция пикчи, а значит частоты. Можно натренить классификатор, который будет выдавать вероятности моделей. И если тот же Нуб будет зашкаливать, то его разраб-педик сможет что-то предъявить. Но очевидно практически он ничего не сделает из своего Китая против Васяна, но попортить репутацию получится. Хотя будет plausible deniability, мол, это люстра, на которой нуб натренен. Но тут зависит от качества классификатора.
>>986643 >Можно натренить классификатор, который будет выдавать вероятности моделей. Некоторые сервисы по определению "ИИшности картинки", кстати, детект моделей имеют. Ни один не работает как следует, все лажают, до единого.
>>986625 > А возможно ли это? Да легко, делаешь приличный грокинг заранее заготовленным датасетом, в котором фильтрами добавлены какие-то особенности, например частично линейчатым спектром. На качество картинок и прочее это не повлияет, но ввиду отсутствия чего-то другого будет ультимативный байас на него, будет строго и устойчиво воспроизводиться и тяжело размываться потом. >>986637 > Сколько в них паттернов от SD-XL Хз, речь об уникальных для нее, чего в других моделях нет. > Не сдетектишь, только если стиль не пробивает прям все возможные ухищрения Нюанс в том что фичи базы остаются и детектируется, если только там совсем не что-то ультрарадикальное. > Маловероятно Это элементарно, и у модельмейкеров это невольно получается с завидной регулярностью, с незаметностью правда плохо. Смотри пример выше. >>986643 > При обработке другой моделью просто добавятся bias'ы этой модели, но оригинальные все равно останутся Вот, this. Классификатор в доказательство врядли примут ибо неточный блекбокс, но математических методов анализа картинок уже столько выкатили, что те даже умеют аниме чаров узнавать.
>>986643 До сегодняшнего дня не знал про то что у нуба такая конченая лицензия. А помните SD3? Как стабилити говном поливали, выпилили модель с цивита и вообще тыкали палкой да посильнее? А тут тишь да гладь, спокойствие и благодать с полным взаимопонимаем
>>986641 Ну у меня сейчас 28 генерация + 5 хайрез фикс. Вроде полёт нормальный пока что. А, ну и хайрез фикс не просто латентный, а через предварительный апскейл ещё.
>>986356 > Где же новогодние генерации Там же где и новогоднее настроение >>986651 > никакого настроения новогоднего - одни дедлайны на грани.. Иди обниму
Когда там уже завезут ризонинг для генераторов пикч, как o1. Вот смотришь на реальный арт и всё имеет смысл. ИИ мог бы использовать логику для построения сцены, рассуждать о каждом элементе, а не высирать слоп сразу.
>>986725 Эльфийка была только в /b. Примерно в это время вроде и колаб прикрыли и совсем пропала. Несмотря на попытки увековечить историю треда, за что ее называли архивошизом, пикчи на архиваче все равно удалены из кэша и история ее стерта навсегда
>>986730 > Примерно в это время вроде и колаб прикрыли Это произошло чуть ли не спустя пол года после открытия доски. Какая еще эльфийка? Их много всяких было, но такого хз.
Довольно точная, то есть распознаёт далле, флюкс и диффузию, если они поданы сырыми. Я думаю, сделать ещё более задроченные распознаватели пугающе проще, чем вы думаете. Лоры требуют всего 40 картинок, внутрь лоры вшит определитель признаков, то есть всего 40 вариаций частенько нужно модели, чтобы научиться видеть новую концепцию.
Дошли наконец лапы потрогать массивный боди детайлер.
Как же он люто тащит. Я вкинул в него мыльную картинку из отбросов конвейера смешивания стилей, и получил на выходе отличный хайрез, который управляем промптом (так что персонажа можно доработать на этом этапе). Сильный минус, конечно, в очень долгой работе. Однако даже промежуточные результаты весьма хороши.
>>986771 Изначально он не был заточен на инпэйнт, я выкинул модуль генерации картинок и заменил на загрузку изображения.
По времени получается наверное выгоднее, чем роллить удачные руки в приближении и склеивать туда-сюда. На картинке в итоге есть неясность в количестве пальцев на второй руке, но возможно лишний палец - это шерсть хвоста, которая так нарисована.
>>986771 Тоже пытаюсь напердолить детейлер в комфи, правда уже в связке с критой и для фоновых объектов. Хотя по смыслу это работает больше как инпеинт в режиме Only Masked, вот только если в том же рефордже выбираю область условно 50 x 100 пикселей и ставлю scale by = x4, то всё фризится. Такое ощущение, что оно пытается всю картинку после апскейла ганом целиком загнать в латенты из-за чего происходит какой-то космический жор ресурсов на ровном месте просто из-за неправильного порядка действий.
По смыслу организовал такой флоу: 1. В крите двумя отдельными слоями задаём область видимости и маску для инпеинта 2. Область видимости кропается и скейлится до заданного числа мегапикселей. То есть если выделили область 100x100, то будет заапскейлено в 1000x1000 при задании размера в 1 мегапиксель 3. Делаем инпеинт по заданной маске, которая таким же образом масштабируется 4. После денойза делаем даунскейл в исходное разрешение
Технически выходит что можно различные микродетали инпеинтить не наматываясь на артефакты от VAE/GAN-апсейлеров и неконсистентность из-за маленького размера объекта, т.к. по сути инпеинт происходит в разрешении кратно выше того, которое целевой объект фактически занимает на картинке. Вон даже ступеньки на входе в крепость видно при приближении. В общем-то, чем-то это на флоу ADetailer'а похоже. Если есть желание долго аутировать над одной картинкой, то думаю интересный подход в целом.
>>986840 Я делаю с цельными объектами очень похоже. Инпэйнт по маске даст чудовищно долгое время работы, поэтому я беру прямоугольник с проблемной деталью, вырезаю его, увеличиваю в несколько раз, после чего пропускаю сэмплером 8-20 раз, перед этим модифицировав промпт и оставив вязянку лор, которые это изображение и породили.
> Правда, швы пока не выходит победить, хотя думал если возьму инпеинт модель, то проблем с этим быть не должно. Я просто прохожусь по краям прямоугольника мягкой кистью в режиме ластика. При ровной вставке проблем обычно быть не должно. Иногда я так могу регулировать, что в перерисовке попадёт в финальную версию, а какая часть объекта останется прежней. Очень удобно и даёт много контроля над картинкой. Это занимает время, но гораздо гибче, чем инпэйнт. Да, такой подход ближе к классической цифровой живописи, чем автоматизированная нейрогенерация с адетейлером проблемных зон, однако он гибче, потому что адетейлер сделан только для лиц, рук, тела... Но его очень дорого тренировать на любой объект. Впрочем, если скрестить его с тепловой картой промпта и rembg, это может быть бомбически универсальная штука.
> Из нюансов правда то, что модели на базе люстры для такого сценария попросту не подходят, т.к. модель слишком сильно лоботомизирована данбурой и рисовать просто рандомные объекты не умеет. Если ты можешь склеивать и перекрашивать картинку из разных частей, то ты можешь использовать разные модели. Лишь бы по общему стилю, освещению и палитре результат потом смотрелся однородным.
>>986863 Судя по освещению, это Illustrous или её потомок. Без стиля художника в промпте. Её типичное поведение по умолчанию - взять одну из областей картинки и высветлить её до состояния ядерного взрыва.
Я пытался натренировать лору на Клиффхарт на локалке, но из-за слабой видеокарты кохья фейлила вычисление функции обучения, так что лоры вроде и генерились, но они были ощутимо бесполезные все. В люстре Клиффхарт и так есть в отличном качестве, так что я забил.
>>986887 >>986889 Пробовал красить монохромные картинки с разными источниками освещения, кстати? Мне однажды попалась такая картинка в выдаче генератора, я сделал ночную и утреннюю версии. Правда, из-за мутация картинка всё равно была трэшем.
В кои-то веки дошли руки разгрести 5 Гб порно нейрослопа из папки output.
Первые три - мои опыты генерации чистых картинок под Треллис ради моделей. Четвёртая - это результат обработки боди детайлером поломанной картинки, где была какая-то хтонь с неправильным VAE. Фон остался прежним, поэтому на нём можно прикинуть, как размыто выглядел персонаж.
Попробовал ещё часть своих старых промптов на НАИв4, в целом более-менее справляется. Стилистически очень приятная модель. При этом в консистентные фоны так себе может, но зато спокойно делает то же фигурное катание, на уровне флуксины.
>>986859 >Я делаю с цельными объектами очень похоже. >Инпэйнт по маске даст чудовищно долгое время работы, поэтому я беру прямоугольник с проблемной деталью, вырезаю его, увеличиваю в несколько раз, после чего пропускаю сэмплером 8-20 раз, перед этим модифицировав промпт и оставив вязянку лор, которые это изображение и породили.
Попробуй инвок, в нем с самого начала была функция, позволяющуя выбрать участок картинки для инпеинта и в ней выделить область.
>>987028 >инвок Глянул. Выглядит как гибрид автоматики и комфи. Судя по истории коммитов, проект живой.
Когда будет настроение пощупать что-то радикально новое, я попробую, но пока у меня максимум подвижек будет в сторону ноды в комфи, которая делает тоже самое. Я немного погуглил и нашёл https://github.com/lquesada/ComfyUI-Inpaint-CropAndStitch Когда раздуплюсь, то попробую. Может кто-то в треде работал с этой штукой?
>>987070 >если работать с 4к картинкой Это удовольствие - для владельцев продвинутых карт. Если хочется получить результат каждой итерации за разумное время (хотя бы минут 10), то апскейл удастся разве что с нейросетью без последующего фикса сэмплером (он будет безумно медленным на таком разрешении).
Кееек. Увидел зафиченную картинку на главной - а у неё во флюксе промпт "award winning cinematic shot". В итоге нераскрученному челу отсыпали лайков и чаевых, так что он может обучить лору или что там обычно с ресурсом на цивите делают.
>>987123 Там зависимость линейная, если 1 мегапиксель делается за 30 секунд то 10 будут делаться за 5 минут. Плюс время на кодирование/декодирование вае и апскейл ганов, но они относительно быстрые.
>>973260 → >>973252 → Мне не даёт покоя этот тип картинок, так что я стал пихать их в боди деталер с перерисовкой другой моделью, чтобы получить немного разные стили изображения, не теряя общую палитру и не разрушая целостность.
Взорванный VAE в итоге даёт ебанутый задник, на котором нет фокуса.
У картинки уже было 0.95 в эстетик скорере, детализация накинула 1%. Я бы ещё зрачки вручную поправил, но для проверки гипотезы и так слишком много времени на картинку потратил.
Всё-таки нашёл принципиальный недостаток адетейлера на основе сегментации SAM. Он иногда захватывает не целиком контур персонажа и инпэйнтит его нестандартные части, укорачивая или меняя форму, а потом вклеивая обратно. В итоге от старой формы остаются заметные края.
Инпэйнт с ручной вклейкой таких недостатков в финале не содержит, но там куча ручной работы с чисткой краёв и можно проебаться, забыв подчистить некоторые швы.
>>987155 Размер латента для денойза не сильно увеличивает жор памяти в диффузионной модели, вот если используется контролнет то у него уже аппетиты растут быстро. Но изображение всеравно придется обрабатывать тайлами, потому что выше определенного разрешения у диффузии уже нет когерентности. Так что в теории гигов 12-16 хватит на все. >>987172 Рассказывай как ты получил взорванное вае, задник на самом деле интересно выглядит. > в эстетик скорере Забудьте уже про него, это рандомайзер.
>>987177 Использовать модель что может в любую яркостьОставить как есть @ Применить цветокоррецию @ Накинуть затемняющую лору @ Натренить вае с артефактами чтобы клипать каналы
>>987178 >Рассказывай как ты получил взорванное вае, задник на самом деле интересно выглядит. Я думаю, ядро взрыва - это подмешивание vae на экономию памяти внутрь пони. Палитра даётся смешиванием стилевых лор. Без вае результат - довольно скучная картинка с мягкими цветами, возможно с мутациями. Но из-за сломанного vae все контуры и цвета беспорядочно плывут, а лора на детализацию спавнит их беспорядочно и много. И в завершение этого - хаотичный предковый сэмплер Эйлер А, который подмешивает шумы на каждом шаге и усиливает беспорядок.
Я пробовал воспроизвести результат с другими твикерами и моделями, он не такой бомбический и ломает освещение, к примеру.
>Забудьте уже про него, это рандомайзер. Так-то оно так, но только когда я задрал оценку ботом на 20%, то стал получать больше лайков на цивите. Это беспристрастный показатель вылизанности картинки. Люди лайкают хорошо или отличное порно, или высокоэстетичные картинки, или ебанутых монстров с эстетик скор = 30%, которых автор слепил на похуях с пережжёнными твикерами цветами. Притом няшность картинки оценивается ими даже выше, чем порно. Ты можешь сказать, что это путь в никуда и надо генерить то, что тебе нравится, но я уже настолько пуст внутри из-за одиночества, что могу только опираться на внешние критерии качества.
>>987181 >>987177 Чем более ебанутый рецепт и результат - тем лучше!
>>987227 100+ лайков на цивите - на картинках с хайлайтом с главной страницы и у крутанов с подписотой или кучей моделей, которые находят в поиске и откуда на них льётся траффик. В свою очередь куча моделей натренирована на домашней пекарне или на мощностях цивита за валюту, а валюта фармится долго (хотя за неделю можно две лоры тренировать даже если совсем нулевые активы и никто не шлёт чаевые и лайки).
Когда за одни картинки я получаю 0-1 лайк (с 60-70% скора), а за другие - 4-6 лайков (90-95% скора), это определённо что-то значит. На больших выборках уже больше влияния будет оказывать подписота.
Некоторую роль, похоже, играет и траффик, который капает с галерей лор и моделей.
>>987183 > это подмешивание vae на экономию памяти внутрь пони На пикчах нет подмешивания. По названию это вае fp16fix, которое является стандартом для всех XL моделей. Залей куда-нибудь пикчу с воркфлоу или отдельно жсон, может так еще что-то есть. Или это эффект от той совокупности лор а вае тут не при чем. > когда я задрал оценку ботом на 20%, то стал получать больше лайков на цивите Совпадение, и чтобы собирать много лайков на циве не нужно делать эстетичные пикчи. > Это беспристрастный показатель вылизанности картинки. Это максимально скомпрометированный показатель соответствия пикчи абстрактным критериям, имеющим мало общего с качеством/вылизанностью. Оно низко оценивает многие качественные - залайканные (что на циве что на бурах) и задирает скор всратейшему слоупу и артефачной хуйте. > и надо генерить то, что тебе нравится Только так и надо. Если хочешь выбирать какой-то критерий то странный классификатор - сомнительная кандидатура. > Чем более ебанутый рецепт и результат - тем лучше! Ебанутый рецепт получения чего-то это вмеру круто, странными путями получаешь нужное. Например, те поломки и дальнейшее исправление чаров, выглядит что надо. Но маразматичный - уже херня, там нет никаких профитов а только рофлы с того что чел реально это тренил.
>>987243 >это определённо что-то значит Скорер предпочитает красочные контрастные пикчи, игнорируя композицию и смысл, которые он очевидно не понимает. А красочные контрастные пикчи лучше выглядят на превью и больше выделяются = дают больше кликов.
>>987244 > На пикчах нет подмешивания. По названию это вае fp16fix, которое является стандартом для всех XL моделей. Я проводил неделю назад сравнения на операции vae encode/decode, у XL-моделей есть лёгкие отличия от лежащих отдельно VAE. На том сочетании лор они расходятся совершенно ебанутым образом, давая странную текстуру. На запечённой лоре такого эффекта нет.
> Ебанутый рецепт получения чего-то это вмеру круто, странными путями получаешь нужное. Например, те поломки и дальнейшее исправление чаров, выглядит что надо. Возможно, их надо исправлять, ведя по определённому стилю. Здесь лиса восстановилась максимально генерик, так что эффект потёртой бумажной обложки проёбан.
>Это максимально скомпрометированный показатель соответствия пикчи абстрактным критериям, имеющим мало общего с качеством/вылизанностью. Оно низко оценивает многие качественные - залайканные (что на циве что на бурах) и задирает скор всратейшему слоупу и артефачной хуйте. Я думаю, то что она реально измеряет - это уровень шума. У пикрила к примеру оценка = 0.21
Реально недоваренные картинки с серым шумом и артефактами модель оценивает низко.
> Только так и надо. Если хочешь выбирать какой-то критерий то странный классификатор - сомнительная кандидатура. Я хочу, чтобы фоны выглядели ебануто как витчспейс в Мадоке! Но там довольно сложная стилизация под зернистую советскую и чешскую анимацию.
>>987243 А, ну тебе лайки для баззов нужны, а не сами по себе. Просто на пиксиве 100+ это так себе показатель, это даже я со своими кривульками набираю. >>987275 Блестящий лучше, чем не блестящий.
>>987280 По превью показалось, что с огромным хуищем.
Посоветуйте модель, которая может генерировать лучшее описание пиктов. Только без залупы на 40 гигов. Qven vl не нравится, блипы тоже. Пытаться использовать мундрим или cog?
>>987273 В 1.5 при сравнении древнего вае с 1.4/наишного/kl-f8 и прочих была разница по насыщенности и динамическому диапазону. В XL есть старые вае что немного артефачат, есть fp16fix что идентично стоковому от 1.0 но не порождает наны, есть васяновские с бустом цветов ценой потери деталей. Хз как у тебя оно может влиять таким образом, ведь в денойзе оно никак не участвует, разве что битый файл дает артефакты. Скинь воркфлоу какой-нибудь. > Здесь лиса восстановилась максимально генерик Там весь эффект был в сочетании задника и чара, а тут фона считай нет, и еще цвета куда-то с зелено-коричневое убежали. > Я хочу, чтобы фоны выглядели ебануто как витчспейс в Мадоке! С этим придется потрудиться. Хотя, насколько помню, была на это лора, может в сочетаниях как-то будет работать.
>>987294 A group of women in shiny suits are holding their butts, a comic book panel, by Josetsu:021, by Urakusai Nagahide:0.21, by Nagasawa Rosetsu:0.21, by Sailor Moon:0.20, by Nōami:0.20, fantastic realism, trending on pixiv, tight light blue neopren suits:0.27, skintight suits, giantess art, 3d white shiny thick, computer graphics,
>>987284 Тории, если с проном, Молмо - если без прона, ДжойКапшн, если результат не важен. В принципе Тории лучше всего пока. У дедов тут убеждали, что Квен и Молмо топ, ну... Я как раз сейчас сравниваю, пока пакетную обработку делаю. 72Б Квена потыкаю ещё как скачается. Но это для нлп-описания.
Тебе может тэгов хватит? Тогда там микро-модели и очень быстрые.
>>987318 > by Josetsu:021, by Urakusai Nagahide:0.21, by Nagasawa Rosetsu:0.21, Нихуя подобного. by rindou \(radical dream\), WAI люстра 7 (кстати, восьмая вышла) и TRT стилелора. >>987320 У меня последние лет 20 минимум не активируется. >>987338 А змеечек - можно. Но потом.
>>987314 Диванон по айдикард. > Вернусь с 5090 @ из-за бугуртов от цен 5090 называют то что должно было быть 5080 и заявляют о снижении прайса @ Когда смирившись закупились 5090 анонсируют ti с нормальной врам и чипом, которая изначально должна была быть. >>987315 3 суперахуенна
>chubby girl lying on ground in a tree's shade, reading a book, Читает она, очевидно, жопой. Нуб 1.0 эпс. Как там один-ноль впред, кстати, можно качать? Я предыдущие впреды не ставил, неохота с форжа слезать.
>>987345 >Нихуя подобного. Да я понимаю. Но вот что-нибудь, что тегало бы правильно - не нахожу. Вот на пике пейсбуковая залупа, улучшеная, расширенная, кроссмодальная. Но всё равно хуйня.
>>987336 Потыкал молмо, не то. Это уже больше под флюс. >Тебе может тэгов хватит? Хватит, если они будут правильные. Хочу протегать датасет, но генерируется говно какое-то вместо правильных тегов.
>>987414 Такое может быть если в промте теги что сильно смещают цвета, или лора/экстеншн на цветокоррекцию. Какие настройки инпеинтинга адетейлера? Также есть модели, которые делают не квадрат а чисто сегмент лица, с ними не будет, но лучше решить вопрос на корню. >>987320 Вместо новогоднего только > новогнойное но зато есть блядство с лисобогинями
>>987123 >Если хочется получить результат каждой итерации Так зачем тебе итерации? Делаешь пикчу, намеренно оставляешь часть деталей незавершенными. Апскейлишь тайлово. Нарезаешь нужны незавершенные части, работаешь с ними отдельно. Лицо. Объекты на фоне. Руки-ноги-пальцы. Письку тоже можно отдельно фигарить, если НСФВ промышляешь. Потом в ФШ всё собираешь. Но, понятное дело, это не для всех подходит. Многие только на "Generate" жать обучены.
>>987178 >Так что в теории гигов 12-16 хватит на все. 16 хватает на текущее поколение XL-моделей. Вместе с контролнетами, и небольшой оптимизацией от форджа/рефорджа - 2к на 2к без ООМ работает.
На флюкс-дев полноценно уже не хватает. Только с ухищернниями, квантованием и прочим непотребством. На следующего поня тоже не хватит, скорее всего.
>>987456 1) Базовый ген в 1024х768 (или около того), шоб много и быстро. 2) Хайрезфикс латентом х1.6 денойз 0.6 В зависимости от результата: 3) Либо даунскейл обратно, потом х1.6 апскейл в и2и с контролнетом, потом 4). 4) Либо сразу латент/ГАН/ДАТ до 2к под контролнетом. Латенту денойза побольше, остальным поменьше.
Настройки контролнета везде меняются в широких пределах - смотря от того, надо тебе исходник сохранять максимально, или наоборот, свободы побольше дать хочешь.
5) х2 sd-апскейл тайлом, с жестким контролнетом, либо вообще экстрой комбинацией ДАТ и ГАН апскейлеров.
Но это в личные галереи такой пайплайн. Или на коммишны, с редактированием на разных этапах. Для двача обычно первых двух пунктов достаточно.
>чтобы деталей набустить? Деталей сейчас сама модель набустить может уже на этапе первого латентного апскейла в хайрезфиксе. Ну или второго. Тайлами для этого срать не надо. Прогресс! Нейрошизам же, которые намеренно задники взрывают излишней микро-детализацей, в аду отдельный котел уготован.
>>987486 > задники взрывают излишней микро-детализацей Чем больше детализации на фоне, тем лучше. Фонов всегда мало. И так приходится фонами жертвовать ради стиля/тянок.
>>987456 >не ебете же img2img через sd_upscale А что не так-то? Я именно это и делаю, с тайловым контролнетом. Хотя сейчас часто можно и хайрезфиксом обойтись. Пик - 1504x1088, хфикс на полтора ганом, 0.45 денойз. И норм.
>>987470 Всё решается батчингом. Веса постоянно подгружаются из RAM, пока видюха считает готовый слой для нескольких пикч. Например у PCIe 4.0 x16 32гб/сек скорость, 3060 перемалывает 360гб/сек, то бишь нужен батч больше 360 / 32 = 11.25 пикч, чтобы полностью утилизировать компьют. В итоге ты будешь ждать дольше первого результата, но потом за раз получишь кучу пикч. Память важна только если тебе нужно максимально быстро загенерить одну пикчу или токен в случае с ЛЛМ.
Прошлый тред: https://arhivach.xyz/thread/1109482/
Схожие тематические треды
• SD-тред (не аниме):
• Технотред:
FAQ
https://2ch-ai.gitgud.site/wiki/nai
Установка
• NVidia: https://rentry.co/2ch_nai_guide
• AMD: https://2ch-ai.gitgud.site/wiki/nai/install/amd
• Облака: https://2ch-ai.gitgud.site/wiki/nai/install/clouds
Дополнительная информация
• Интерфейсы: https://2ch-ai.gitgud.site/wiki/nai/interfaces
• Модели: https://2ch-ai.gitgud.site/wiki/nai/models
• Промпты: https://2ch-ai.gitgud.site/wiki/nai/prompts
• Апскейл: https://2ch-ai.gitgud.site/wiki/nai/upscale
• LoRA: https://2ch-ai.gitgud.site/wiki/nai/lora
• ControlNet: https://2ch-ai.gitgud.site/wiki/nai/controlnet
Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci