24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Stable Diffusion тред X+68 ====================================== Предыдущий тред >>635038 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожие тематические треды - NAI-тред (аниме) >>636906 (OP) - технотред >>570475 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Полный функционал в локальной установке (см. ниже)
⚠️ Стандартные модели stable diffusion (v1.4 - v2.1) от Stability AI значительно отстают по качеству от кастомных моделей (см. ниже). Модели SD XL ставятся и запускаются так же как и любые другие модели SD.
По праву первого в теме прошу кидать и генрировать больше оружия и хоррор монстров, городского хоррора и всяких тварей Ну и давайте что ли перерисовывать монстров из старых игр. Сделаем нейросети снова крутыми
>>638404 На самом деле модели деградировали, в плане "понимания", потому что у ванильной 1.5 внутри было полинтернета всякой хуиты, она из коробки могла нарисовать даже карту для квейка или дума.
>>638271 → Видел. И даже на превьюшке она покрыта спечённой плёнкой. У диффузоров всё очень плохо с прозрачностью, слоями и т.д. Классическое «не думай о содержании, срисовывай пятнами».
>>638280 → Классика. Бесит уже. >>638003 → Я уже в промпты гляжу только чтобы убедиться, что конкретное классное платье или шортики это лора и посмотреть какие тэги на реализм/стиль и какая модель использована.
>Ну и все эти описания фуджифильмов и миллиметров это я ебал просто, оно реально имеет эффект?
Смотри. Описание фокусов, плёнки и всей хуйни попадают в базу в основном с профессиональных фотосайтов. То есть само указание таких технических данных уже смещает вектор в сторону проф-фотографии. А конкретная диафрагма или фокусное расстояние смещают в сторону особенностей перспективы и размытия в кадре. Указание дорогой камеры смещает в сторону технически качественных снимков.
Ещё есть тенденция к сочетанию общего качества и атмосферы с детальным описанием эмоциональности. То есть в деталях вроде ничего особо не меняется, но общее восприятие, композиция, тонкие элементы, выражение лица, жесты — всё улучшается.
>>638491 >А конкретная диафрагма или фокусное расстояние смещают в сторону особенностей перспективы и размытия в кадре. >Указание дорогой камеры смещает в сторону технически качественных снимков. > >Ещё есть тенденция к сочетанию общего качества и атмосферы с детальным описанием эмоциональности. То есть в деталях вроде ничего особо не меняется, но общее восприятие, композиция, тонкие элементы, выражение лица, жесты — всё улучшается. Да хуйня это всё и шаманизм, маримба-мен, перелогинся. У модели есть ограниченный объем весов, какие она может сожрать, впринципе. Сколько ты токенов туда не напихаешь, поднимая всякие говновеса, в массиве текста это всё бует в итоге иметь исчезающе малый процент веса, потому что вес внутри промпта расчитывается относительно всех весов промпта (надеюсь это ты понимаешь). Поэтому если ты вместо "студийное фото" напишешь кучу всякой хуиты - эффект будет околонулевой. Если тебе нужно условное "поларойдное" или "ломо" фото - ты блядь так и пиши, перечислять всякие говнообъективы и модели фотоопаратов - верх ебанизма.
>>638508 >до пережарки На низких кфг трудно пережарить, модель просто перестаёт реагировать на промт, и все... Как правило, чем длиннее промт, тем больше скобочнк) Краткость сестра таланта. Помните, SD это игрушка, не требуйте от неё слишком многого.
>>638576 Финальный промпт без стиля, вдруг пригодится. golden kobold dressed in a medieval jacket playing lute while singing with a jolly attitude, sitting at the table in a tavern with a bowl of soup in front of him BREAK scaled (drakonid:0.2) skin
>>638506 >в итоге иметь исчезающе малый процент веса Иногда и нужно то самое тонкое отличие, чтобы картинка из ну_норм стала прям хорошей.
Я пилю крупные промпты, но через break во-первых, во-вторых по классике добавляя и тестируя влияние новых двух-трёх ключей.
Например в большом промпте на девушку athletic boy не превращает её в парня но делает ноги чуть более мускулистыми а грудь чуточку меньше, ровно настолько, насколько нужно и насколько сложно описать словами. При этом не ломает картинку так, как ломает подключение лоры на увеличение мускулистости.
Конечно же, если решается кратко, типа wide angle professional camera shot, то нужно делать так.
>шаманизм сорт оф, но почему бы не поиграться? Можно и вовсе кракозябры добавлять, запятые, пробелы, чтобы варианты увидеть.
>>638599 >Иногда и нужно то самое тонкое отличие, чтобы картинка из ну_норм стала прям хорошей. Ты такой же дебил как и эти клоуны с цивитая, я тебе в прошлом треде с белкой показал что твой промпт говна кусок с бессмысленной хуйней, зачем ты копротивляешься?
А ниче такой промт на потную девку в конце прошлого треда дали. Хоть в нем и много странного, но что-то там точно работает и картинки создает вполне своеобразные. Такие из примитивного промта не получатся.
>>639026 > Хоть в нем и много странного а без странного всегда получается дженерик параша уровня (very sun:1).2-маэстро, который 631х639 высерами треды вайпает
>>639072 >странного То есть, ты считаешь вот это очень странным? (oily, sweaty skin:1.2), (sunbath), но без без одной маленькой Лоры, да еще и вывернутом наизнанку (в минус) это работать не будет, во всяком случае в фокусе. Я расчухал это ещё 5-6 тредов назад, когда не было ни единой Лоры под xl, которая якобы (на самом деле нихуя) делает кожу потной. Помнится, я здорово так подорвал пердаки местной профессуре) С удовольствием вспоминаю каждый раз)) От надменного тона ни осталось и следа, они тряслись и визжали как сучки, переходя на ультразвук, как же у них блядь подгорало от бессилия!
>>639290 1. the shore of a forest lake, detailed pixel art, art by Alison Bechdel 2. the shore of a forest lake, detailed pixel art 3. the shore of a forest lake, detailed pixel art Negative: art by Alison Bechdel
>>639437 Тот факт что слева красивая девка в спортивной форме и подтянутая и имеет время попозировать на фоточки говорит о высоком уровне жизни среднего класса. Тот факт что человек из верхушки жирный и дохуя довольный говорит о низком уровне жизни тех, кто внизу
>>639461 Ты забыл добавить, что горы мусора говорят о большом числе товаров, которые люди покупают, а потом выбрасывают, вот все и засрано до такой степени, от изобилия! А на втором пике у них просто ничего нет, чтобы столько выбрасывать. Усерднее надо барина защищать.
>>639406 Не, я про то что если генерю img2img, то он не копирует лицо, а генерирует слабо похожее. Например прикладываю фотку ебала чьего-нибудь и пишу вот используй это лицо и дальше уже генерю обстановку локацию детали итд, но лицо вообще не то. И не пойму как юзать конкретно данное. Юзаю webui
>>639400 >>639494 Проблема не в промпте, а в чем-то другом. Например, ты задал вопрос, не указав инструмент которым пытаешься лицо переносить. И даже в повторном ответе написал только webui, без самого инструмента (ip-adapter, roop, reference controlnet, небо, аллах).
https://github.com/lllyasviel/stable-diffusion-webui-forge Compared to original WebUI (for SDXL inference at 1024px), you can expect the below speed-ups: If you use common GPU like 8GB vram, you can expect to get about 30~45% speed up in inference speed (it/s), the GPU memory peak (in task manager) will drop about 700MB to 1.3GB, the maximum diffusion resolution (that will not OOM) will increase about 2x to 3x, and the maximum diffusion batch size (that will not OOM) will increase about 4x to 6x. If you use less powerful GPU like 6GB vram, you can expect to get about 60~75% speed up in inference speed (it/s), the GPU memory peak (in task manager) will drop about 800MB to 1.5GB, the maximum diffusion resolution (that will not OOM) will increase about 3x, and the maximum diffusion batch size (that will not OOM) will increase about 4x. If you use powerful GPU like 4090 with 24GB vram, you can expect to get about 3~6% speed up in inference speed (it/s), the GPU memory peak (in task manager) will drop about 1GB to 1.4GB, the maximum diffusion resolution (that will not OOM) will increase about 1.6x, and the maximum diffusion batch size (that will not OOM) will increase about 2x. If you use ControlNet for SDXL, the maximum ControlNet count (that will not OOM) will increase about 2x, the speed with SDXL+ControlNet will speed up about 30~45%. Another very important change that Forge brings is Unet Patcher. Using Unet Patcher, methods like Self-Attention Guidance, Kohya High Res Fix, FreeU, StyleAlign, Hypertile can all be implemented in about 100 lines of codes. Thanks to Unet Patcher, many new things are possible now and supported in Forge, including SVD, Z123, masked Ip-adapter, masked controlnet, photomaker, etc.
No need to monkeypatch UNet and conflict other extensions anymore! Forge also adds a few samplers, including but not limited to DDPM, DDPM Karras, DPM++ 2M Turbo, DPM++ 2M SDE Turbo, LCM Karras, Euler A Turbo, etc. (LCM is already in original webui since 1.7.0). Finally, Forge promise that we will only do our jobs. Forge will never add unnecessary opinioned changes to the user interface. You are still using 100% Automatic1111 WebUI.
>>639513 >>639518 Forge — это платформа на базе Stable-Diffusion-WebUI, позволяющая повысить скорость и упростить разработку. Мы будем получать все обновления из ветки разработки оригинального веб-интерфейса автоматически с помощью ботов, и у нас нет никакой мотивации или планов конкурировать с оригинальным веб-интерфейсом.
Другая причина заключается в том, что у нас запланировано несколько текущих исследовательских проектов, и мы хотим использовать этот очень дружелюбный веб-интерфейс, который всем нравится, но мы действительно не хотим, чтобы пользователи были разочарованы скоростью и производительностью, особенно когда несколько наших будущих работ будут основаны на на SDXL.
Мы обещаем, что, когда следующие (1) и (2) произойдут вместе, этот репозиторий немедленно изменится на расширение стандартного Stable-Diffusion-WebUI от Automatic1111, то есть немедленно присоединится к исходной экосистеме sd-webui. из Автоматического1111, когда одновременно происходят два следующих события:
Как минимум на 4 из 5 наших тестовых устройств (ноутбук RTX 2060, RTX 3060, RTX 3090, RTX 4090, ноутбук RTX 3070ti), если исходный веб-интерфейс одинаково быстр или максимум на 10 % медленнее (кроме RTX 3090 и 4090, поскольку скорость для них около 5%). Принимаются все флаги CMD, но мы исключаем технологии, жертвующие функциональностью, такие как TensorRT или компиляция torch. Обратите внимание, что это включает в себя полный проход времени CLIP, времени диффузии, времени перемещения модели и времени VAE. Мы используем SDXL 1024x1024 при размере пакета 1 и 4, а также при количестве пакетов 1 и 16.
По крайней мере, на 4 из 5 наших тестовых устройств (ноутбук RTX 2060, ноутбук RTX 3060, RTX 3090, RTX 4090, ноутбук RTX 3070ti), если исходный веб-интерфейс одинаково эффективно использует память или использует максимум на 512 МБ больше видеопамяти, а разрешение диффузного изображения без OOM составляет не менее 90 % от максимального разрешения Forge (на ноутбуках RTX 3060 и ноутбуках RTX 3070ti). Принимаются все флаги CMD.
Если два вышеупомянутых события произойдут одновременно, мы немедленно вернемся к исходной экосистеме sd-webui, и этот репозиторий будет преобразован в расширение. Не беспокойтесь о инженерных сложностях — у нас отличная команда, способная решить любую проблему.
Мы будем тестировать каждые 15 дней с помощью оригинальной ветки разработки WebUI, или любой может сообщить нам о необходимости тестирования в любое время, ответив на это сообщение.
До этого все основные обновления от нас будут происходить здесь, и мы будем ждать решения проблем с памятью/скоростью. Набор инструментов Forge после 0.0.10 теперь относительно полон. У пользователей не должно возникнуть больших проблем в задачах обработки изображений.
Обратите внимание, что внутренний API Forge не будет изменен, даже если мы перейдем на расширение.
https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/166 Development Plan Forge is a platform on top of Stable-Diffusion-WebUI to make speed faster and make development easier. We will get all updates from the dev branch of original webui automatically with bots, and we do not have any motivation or plan to compete with original webui.
Another reason is that we have several ongoing research projects planned, and we want to use this very friendly webui that everyone love, but we really do not want users to be disappointed by the speed and performance, especially when several our future works will be based on SDXL.
We promise that, when the following (1) and (2) happen together, this repo will immediately change to an extension of standard Stable-Diffusion-WebUI from Automatic1111, that is to say, immediately join back to the original sd-webui ecosystem of Automatic1111 when the following 2 things happen together:
On at least 4 of our 5 test devices (RTX 2060, RTX 3060 laptop, RTX 3090, RTX 4090, RTX 3070ti laptop), if the original webui is equally fast or at most 10% slower (Except RTX 3090 and 4090 since the speed up for them are around 5%). All CMD flags are accepted, but we exclude tech that sacrifices functionality like TensorRT or torch compile. Note that this includes a full generation pass of CLIP time, diffusion time, model moving time, and VAE time. We use SDXL 1024x1024 at batch size 1 and 4, and with batch count 1 and 16.
On at least 4 of our 5 test devices (RTX 2060, RTX 3060 laptop, RTX 3090, RTX 4090, RTX 3070ti laptop), if the original webui is equally memory efficient or at most use 512MB more VRAM, and the diffusion image resolution without OOM is at least 90% of Forge’s max resolution (On RTX 3060 laptop and RTX 3070ti laptop). All CMD flags are accepted.
If the above two things happen together, we will immediately move back to original sd-webui ecosystem, and this repo will be made into an extension. Do not worry about engineering complexity - we have excellent team that can solve every problem.
We will test every 15 days with original webui dev branch, or anyone can inform us to test, whenever by replying to this post.
Before that, all major updates from us will happen here and we will wait upstream to resolve memory/speed issues. The tool set of Forge after 0.0.10 is relatively complete now. Users should not have big problems in image processing tasks.
Note that Forge backend API will not be modified even if we change to an extension.
Пиздос, раньше не мог делать большие картинки в XL. Думал, ну просто памяти не хватает, щито поделать. Потом обновил драйвера видяхи и ВНЕЗАПНО памяти стало на все хватать, вот кто бы мог подумать. Но как же до-о-олго делаются, большие пикчи в ебаном СДХЛ, иногда по 30 секунд ждать приходится, а то и дольше. И под большими я не имею в вида какие-то мега размеры, а всего лишь 1280х1920 хотя бы.
>>639549 1.Нет никакого смысла генерить текст там, где его можно написать. а так изи. 2. Сгенерируй в публичных сетях, типа далли, кандинского, потому что под логотипы нужно отдельную нс качать
>>639508 Да, я использовал дефолтную модель стейбла без дополнительных инструментов. Теперь понимаю что видимо без этого никак, буду вникать в тему, спасибо за наводку. Казалось что достаточно в промпт вбить желаемый результат и случится магия...
>>639573 Все равно спасибо! Я пробовал в бинг далли. Англ буквы действительно понимает лучше. Но что интересно там получались реально логотипы интересные, без всяких установок
Промт: На польско-германской границе у шлагбаума поляки в военной форме начала 20 века, показывают голые задницы адольфу Гитлеру вынуждая его напасть на Польшу. Гитлер зол, угрожающе потрясает кулаками.
Промт: Склонившись над картой вождь мирового пролетариата Ульянов (Ленин) вместе с группой мужчин одетых в национальные костюмы польской знати 17 века, склонившись над картой Европы, придумывают Украину.
>>639812 потому что эти модели лучше «понимают речь» ( есть языковая модель покруче, есть модель, рисующая схему/эскиз) и чётче речи соответствую в бытовых задачах, плюс это обобщённые крупные модели с кучей костылей. К тому же корпорация может запустить модель на 200—500 ГБ Vram а мы нет.
Дома эти костыли под задачу ищутся/рисуются. Но когда дома костыли сделаны (есть контролнет, натаскана модель, лора), то в узкой задаче даже сд1.5 ебёт крупные модели.
Ну и в свою очередь всех взъебёт модель, специально разработанная для генерации векторных форм, написания норм текста, составления форм и анализа через GAN. Ну и натасканная на определённую эстетику.
>>639861 да, большинство моделей у меня полторашные. В основном это какие-нибудь версия8 или версия40, проверенные обкатанные, ну и лоры. Тупо потому что на sdxl настолько обкатанных оч мало. Да и жрут память они сильнее
>>640014 как минимум, можно попробовать поменять лицо / размеры частей, добавить детали во-вторых, есть старые видео низкого разрешения, но с удачным сеттингом также за счет веса контролнета реально сделать продолжение
это мысли, если в целом говорить о таких вещах, есть некий шарм и приколдес в этом
Пока копался в Forge версии Automatic1111 обнаружил новую способ "soft inpainting", который оказался инпейнтом здорового человека.
Как я понял, вместо простого единообразного засирания области шумом происходит его градиентное наложение, что помогает модели лучше адаптироваться к оригинальной картинке под маской.
>>640022 почти любая NSFW. И лоры на размеры и цвета. Которых толком нет под сдхл ахахах. Нет нужды никакой особой заводить sdxl ради картинок с солобабами, полторашка отлично справляется, достаточно посмотреть, сколько их нагенерили.
А заодно достаточно увидеть, что почти любой интересный наряд — лора. Я банальные трусики-шортики генерил, добавляя лору на dolphin shorts, потому что сами по себе модели рисуют просто трусы. А при вписывании women`s boxers упорно рисуют в них член.
>>640022 https://civitai.com/models/247266/duchaiten-real3d-nsfw-xl Лучше этого ничего не видел, многие другие слишком зациклены на реализме в плохом смысле, приходится у них мучительно выпрашивать любых баб, которые отличаются от средне-статистической фигуры. А тут без проблем можно генерить карикатурных бимб, гиперсексуализированных пухляшек и все таком духе, без лишних изъебств.
>>640053 Какая разница? ты просто на веб-сервис запрос даёшь. на вебсервисах нужно опасаться рендерить что-то нелегальное или политическое, на остальное всем похуй, есть SFW и NSFW сервисы.
>>640060 На то они и реалистичные, чтобы быть зацикленными. Я давно для себя вывел пайплайн, при котором я беру мультяшную модель, на ней генерю максимально гибко фигуру, а потом с контролнетом запускаю реалистичную или околореалистичную. Иногда с промежуточной ещё одной 2.5 д, чтобы нарастить объём.
Потестил. Многомасочный режим не годится для получения в целом хорошего результата. Для подчинения общей задуманной композиции да, но потом нужно по фрагментам делать инпейнт
>>640075 Пошол нахуй эсжэвёнок, научись отличать шейм от персональной реакции. Шейм: «сделай что-то со своим ебалом, а то как мудак». Мнение «мне твоё ебало отвратительно».
>>640085 grainy image, limited pallete, dark gothic, old book print, printed raster, paper texture, canvas texture,
>>640087 не секрет Сначала региональным промптом приблизительно что-то рядом с нужным по цвету и месту. >>639993 Потом нарвать деталей, сделать коллаж, перемазать всё>>640059
Потом частичный денойз с regional prompt mask by color
И сейчас, когда общие детали сносные высрались, буду брать отдельные маски (я их заранее нарисовал на слоях) и по этим маскам роллить инпейнт, который выкладывал в прошлом треде.
>>640111 п.с. ащемта почти ничего нового. Я и раньше кусками инпейнтил. Ща отличие в том, что уже со старта можно композицию разложить сразу в промпте. Ну меньше дёргаться в 2д редактор, чтобы нарезать годные куски из картинки
>>640045 Рост бабы ~1.65 (в лучшем случае), он достаёт до потолка согнутой рукой, вопрос, как там расходятся те, у кого рост хотя-бы 1.85? А может это таверна для гномов?
>>640103 >BREAK small natural breasts BREAK hairy pussy, pubic hair BREAK Вопрос к знатокам: Как может повлиять размер груди на волосатую пизду? Никак. Зачем брейки?
Как понятным для нейронки образом описать изображение, которое должно быть почти целиком темным, и только небольшой участок должен быть освещен пламенем свечи? Допустим, сидит девушка за столом, вокруг темнота, свеча освещает только стол, её лицо и плечи с грудью, все прочее - силуэты в темноте.
>>640189 Какая хуйня, ёбаныврот...) Если ты вообще ничего не пишешь, pubes hair будет как миленький, другой вопрос, это не будет куст а-ля 70-е. Так, что поменьше пишите бреда, и будет у вас все красиво, нейронка она поумнее вас будет. Волосатая грудь, блядь, это новый мемас, наряду с неудачным сидом)))
>>640222 1) включить лору epinoise offset и скрутить вниз + указать dark 2) можно так и написать, что almost all frame is black and there is small dull candle но это сложная ебень, тут как раз проще либо зонированный промпт либо сделать сначала тёмную комнату а потом в нужном месте инпейнты
>>640310 Ну а хули ждать от b-movie из 80-х. Даже ухи не смогли нормально приклеить. Алсо, посреди фильма актрису пришлось сменить, т.к. предущая со стола пизданулась на пик3.
>>640360 Можно на низком денойзе прогнать через img2img в нормальной модели без LCM. Кое-какие детали могут поменяться, черты лица и все такое. Если это очень важно, то можно ещё заебаться со всякими айпи-адаптерами для переноса морды более точно.
>>640375 >на низком денойзе прогнать через img2img в нормальной модели без LCM На низком это сколько? Промпт кста: cluttered truck interior, fem truck driver
>>640383 >На низком это сколько? 0.3 и ниже А родной промт это всегда хорошо, конечно, но в данном случае он такой простой, что вряд ли точности изображению добавит
>>640030 Просто добавь, что они любовники\парочка, тогда сразу сядут рядом, ещё и обниматься начнут. Например:
close shot of a guy and a busty girl sitting together on a bench, close to each other, talking to each other, lovers, couple, in love, looking at each other BREAK woman in a very skimpy dress BREAK man wearing jacket and shirt
>>640528 Самое забавное в попенсурсе - смотреть как авторы-обиженки, трясущиеся над звездочками, срутся по переписке и выясняют, кто из них больший хуесос. Всегда такая драма шо пиздец.
>>640541 Да, че-то реально тухлая параша с какого-то дохлого сайта, где уже год ничего нового не постили, а тут зато копируют из треда в тред бездумно. В принципе, база там не устарела, питон, гит, вот это все - в норме вроде. Только какая-то левая хуйня с обрыGANами добавлена, не надо их уже отдельно ставить. Короче, чтоб не путаться, можешь тут посмотреть, например: https://dtf.ru/howto/2408998-ustanovka-stable-diffusion-webui-ot-automatic (тупо первое, что попалось на русском в поиске) Хотя там тоже что-то странное пишут про необходимость копировать адрес в браузер. Браузер давно запускается автоматически, ниче руками копировать не надо. Но может это не у всех так по какой-то причине? Хз. Не так уж важно.
Значит, потестил этот ваш Forge. SDXL, разрешение 1344x1024, Euler, 100 Steps, CFG 7, все остальные настройки (оптимизатор cross-attention, batch cond/uncond и прочие) такие же как в каломатике: A1111: Time taken: 22.9 sec. A: 10.39 GB, R: 14.86 GB, Sys: 16.5/23.9883 GB (68.6%) [4.56 it/s] Forge: Time taken: 19.0 sec. A: 9.51 GB, R: 11.07 GB, Sys: 12.5/23.9883 GB (51.9%) [5.33 it/s]
Понравилось, что Forge без проблем проглотил venv от автоматика (просто создал символьную ссылку, чтобы не перекачивать гигабайты всего этого дерьма), расширения тоже все подхватились (в том числе самописные), интерфейс практически идентичен автоматику (камень в огород богомерзкому sd.next), но по ощущениям работает немного отзывчивее.
>>640528 Я нихуя не эксперт, но если в форже бот мержит PRs, возможно ли такое, что сам автор репы тупо не знает, что у него дохуя скопированного кода?
>>640556 пиздят попусту. нет чтоб спокойно извиниться и сказать либо «я не ебу, бот автоматом подтягивает, хотите — добавлю вас в титры, не проблема» либо «окей, я проверю. Поможете?»
>>640568 А я пытался, но любые описания груди мгновенно превращают кошечку в женщину с кошачьими ушами. Видимо, нужна специальная фурри-модель, чтоб такое прокатывало.
>>640572 >нужна специальная фурри-модель В целом да, но в частности развитая модель может послушаться промпта типа [naked woman:anthropomorphic cat:0.33], то есть треть шагов рисовать женщину а потом поверх кошку. Я так делал, показывал в прошлом треде. И да, указание человеческих свойств очень быстро скатывает в женщину, потому для фуррей лучше фурри-модель, а такие трюки оставить только для тонкой гибридизации всякой.
Фордж прям заебись. На 3060 1024х1024 на SDXL генерит 30-40 секунд, в то время как на автоматике занимало больше минуты. Нахуя теперь автоматик в принципе нужен?
Вопрос по SD, хотя скорее по Fooocus - наприме у меня есть фотография лица, для простоты примера - мое лицо, есть ли возможность его выделить, например в inpaint и прописать промт - используя это лицо, дорисовать туловище ну блять, пирата например?
Fooocus хорошо раздевает (в отличии от SD), но все остальное у него пиздец хуевое. Или может я просто это не там делаю? Интересует в целом - есть ли такая опция и где\на какой вкладке это можно сделать? Можно конечно взять Face Swap, но с таким успехом можно и в фотошопе себе тушку пририсовать
Чета после миджорни заглянул сюда и заплакал. Единственный плюс сд - высокое разрешение, полезно про работе с фотографиями, например, от клиентов. И всё. Для творчества не годится.
>>640793 > Но если ты еще не понял, промты это просто обычные слова, обычные описания предметов. Это не какие волшебные сочетания магии. Сам придумывай. Но именно от правильного промпта зависит качество изображения на 90%. Значит выбранные слова важны, я пишу хуйню и получается хуйня. Где взять правильные слова?
>>640804 Какая-то модель генерит красиво на слово хуй. Другая модель генерит плохо на это слово. Это пиздец. Опенсурс это ад и погибель. Лучше вкатись в Далли.
>>640798 Зайди в настройки импйнта (в дебаге), там регулярно отваливается импейнт модель, вместо положенной v2.6 какого-то хера встаёт прочерк, я уже заеблася всякий раз проверять. И поглядывай на консоль, не качает-ли он что то в то время, когда ты пытаешься что-то там нарисовать)
Купил видеокарту на 16гб и сейчас хочу обмазаться нейровидосами. Чем их делать? Вижу, что есть некий Warp Diffusion, но как я понял, он запускается только в коллабе Хачатур недавно палил MagicAnimate, но там откровенный мусор Есть SVD, но он анимирует как хочет, без промптов
Все хуйня. Хочу делать анимешные танцульки как на первом видосе
>>641099 >Аргументируй Творчество это не портреты девочек а-ля маслом, творчество это композиция, пусть протая, но композиция. SD не умеет ни то, что в сложные, но даже в в простыеые композици от слова хуй. Не спонтанных людишек на заднике, а тех, кого ты сам расставишь, и кого захочешь. Даже если заморочится и вручную, в фотошопе собрать композицию (коллаж), то всё равно придётся прогонять всё с низким (относительно) денойзом, где наш красавец с вероятностью 146% обосрётся с подливой, не выравнив свет там где следовало и изуродовав то, над чем ты кропел несколько часов. Ещё раз, SD это тупое говно тупого говна.
>>641132 >Творчество это не портреты девочек а-ля маслом А мировая общественность в курсе, что ты портреты из творчества выписал? Я просто не видел об этом сообщений в новостях, может тебе стоит дать объявление в газеты, чтоб все знали.
>>640718 а теперь посмотри насколько более объёмный свет и последовательное промпта в СД. И глаза меньше переломаны чем у тебя, тупо потому что я могу в фэйсдетэйлере поставить 60 шагов и выбрать сэмплер, а ты в мж — нет.
мж это буквально мерж популярных sdxl с фэйсдетэйлером и хэндрефайнером поверх, плюс небольшим шарпом, кучей скрытых токенов и динамически подключаемыми лорами/моделями.
Каждый, блядь, раз когда они объявляют об улучшении чего-то, это происходит буквально через неделю—месяц после выпуска какой-нибудь фичи. Из недавнего — style adapter от тенсента.
да, мж тоже СД, но из-за кучи напиханных скрытых ключей там соответствие промпту шатает сильнее. Возможно из-за низкого cfg, но вроде оный выставить можно
>>641144 Ебааать, вот это да! Вот это поворот! Фокус рисует собаку, но рисовать взрослого человека он отказывается, без разницы какого пола. Причём на каком-то этапе он начинает рисовать фигуру человека, но затем бросает и рисует пустое место) Пробовал ставить стили, нихера не лечит.
Короче, вот семпл, наебаште в Фокусе человека, промт: North Korean leader Kim Jong-un Короче, на хитрую жопу всегда найдётся свой Костя Сапрыкин, см. рис2
>>641149 >выборочно оно инпейнтит. странно если ты хочешь радикально отличающийся элемент, используй обычную модель вместо инпейнта и подкладывай мазню примерную. Инпейнт модель упирается в исходник очень.
>>641157 Анон, у тебя очень статичное женерик сд говно. Оно тупо не смотрится. Несмотря на весь твой объемный свет и качество. А у жорни живые картинки. Между ними разница в сотню поколений. Даже не пытайся.
Сд хороша, когда нужно сделать инпейнт ебнутому клиенту на фото или аутпейнт. Там потому что разрешение ебическое можно выставить, не будет от фотки отличаться. Но генерировать на ней - такое себе.
>>641181 >замени файл Угу, все же вокруг дебилы, только ты один молодчага) Можно генерить на импейнт-модели, но не наоборот. Они по разному структурированы, и то, что может прокатить в полторашке, абсолютно не будет работать в фокусе.
>>641207 Ну шо я могу сказать, энжой ёр фокус. Не знал, что там одна модель и гвоздями приколочена. Думал, всё как у людей, переключается из списка по вкусу или хотя бы в конфиге.
>>641132 Пчел у тебя в 3 из 4 пикч литретурно лоли лежащие на полу, какая тут композиция? Буквально шум и тян сливаются с полом. 2 Какие модели ты пробовал?
>>641241 Что мешает заменить моделью того же типа и назвать так же? Ну блядь, ты что думаешь, автор фокуса обучил собственну модель хотя бы уровня сд? или всё-таки взял что хотел да смержил молча?
>>641245 между фото и метахуманом Нейронку сразу выдаёт неправильное направление морщинок над верхними веками и неправильный переход плоти в козелок уха. А так же следы шума в мелких морщинках и поплывшей текстуре ткани
>>641262 >что инпейнтит лучше, чем автоматик. качество инпейнта зависит от модели а не от UI и от условий вокруг постановки маски (смыливание, паддинг). Всё это настраивается даже в поломатике.
>>641259 >автор фокуса Автор фокуса это автор контролнета. Ты понимаешь вообще какого уровня это разработчик? Контролнета, который используется везде. И он запилил этот фокус. Откуда модели в контролнете вообще?
>>641272 >автор контролнета не существует «автора контролнета», есть авторы интерфейсов для контролнета в разные UI. А сами модели, используемые контролнетом делаются учёными. https://arxiv.org/abs/2307.15880 всякими Бигдонгами Суньврот Хуянгами мудрыми. Вот там уровень. А не уровень отправить нейросети картинку, получить результат, отправить следующей.
>>641276 >не существует «автора контролнета», есть авторы интерфейсов для контролнета в разные UI Ну ты и дурачек. Все авторы пихают его контролнет в разные UI. https://github.com/lllyasviel/ControlNet
>>641302 >>641303 Вот архивчик. Там измененный webui.py (и webui.patch для тех, кто понимает, а так он не нужен). Заменить им одноименный в корне фокуса. Обязательно сохраняйте оригинальный webui.py иначе при следующем обновлении Fooocus он будет ругаться в консоль что файл изменён (нужно будет вернуть всё взад и тогда обновится). https://filetransfer.io/data-package/blO600a6#link
>>641283 >его контролнет ещё раз, контролнет это тоже API Гораздо проще прикрутить деревянные колёса и рычаги к ДВС, чем создать ДВС. И оно таки будет ездить.
>>641314 >прикрутить деревянные колёса и рычаги к ДВС Так я тебе и говорю: этот автор сделал деревянные колёса и рычаги, которые теперь все прикручивают к своим двс. Чем ты не доволен?
>>641276 >>641279 >>641314 чел, термина ControlNet небыло до того как Люмин Жэнг ака Illyasviel не представил его в своей научной статье. Сразу после нее он запустил свой репозиторий на гитхабе, который назвал тоже ControlNet.
Все первые модели для контролнета (inpaint, depth, openpose и прочие) тоже выкладывались ИМ ЖЕ вместе с его статьей на Хаггинфейсе https://huggingface.co/papers/2302.05543
ЗАМЕЧАЮ НЕ ПЕРВЫЙ МЕСЯЦ что народилось уже цлое поколение долбоебов которые каломатик называют Стабл Дифьюжен, и уже какой раз всплывают вот эти дегенератские посты о том, что "Фокус это не SD1111".
>>641319 >Все первые модели для контролнета (inpaint, depth, openpose и прочие) Зачем ты споришь с дегенератом? Он не только гуй от нейронки не отличает, но и настолько тупорылый, что не видит что в Фокусе есть И инпейнт каломатика, и собственный обновленный инпейнт.
>>641320 > ЗАМЕЧАЮ НЕ ПЕРВЫЙ МЕСЯЦ что народилось уже цлое поколение долбоебов А мог бы не вестись на толстоту от (very sun:1).2 мастера. Впрочем это не удивительно для долбоеба с ийсикью ниже собаки, который не может слово автоматик правильно написать.
>>641317 Ну ок, договорились. Просто изначально тезис для меня прозвучал типа «уу, голова, которая запилила собственные нейросетки контролнетовские в одну каску»
>>641320 Я выше подчёркивал неоднократно, что есть ui, а есть нейросети. Одно дело запилить морду и рычажки удобные в автомобиль, другое — сделать хотя бы двигатель, трансмиссию и валы к колёсам, чтобы оно ездило даже на деревянных колёсах
>>641322 разводишь срач тут ты, я таки отличаю гуй.
>>641322 >>641325 комфи, фокус, автоматик — интерфейсы для управления нейросетями SD и прилагающимися. Автоматик так же интерфейс для разных графических движков.
>>641331 отличается только входными данными, пустой шум+промпт или шум от картинки + промпт. И там и там контролнет накладывает свои условия поверх входящих.
>>641375 >А кто еще их мог обучить, если до него никто их не выкладывал? Обучить их научный коллектив на мощностях учебного заведения при помощи тамошних инженеров. Например.
>>641408 >Не удается открыть эту страницу >Подключение было сброшено. >ERR_CONNECTION_RESET Ркн? Через впн захожу конечно, но много кто сможет его так читать?
Как можно убрать засветы от солнца или лучи на фото? Типа наложить тень. Как на пике (рандомная из инета). Пишу shadow, no light в inpainting, но что-то не работает
>>640541 >Там пометка что гайд старый из 2022-го. Новее не будет уже? Так это устаревший гуй, может тебе еще на симсвап 2к24 гид написать или на печатную машинку зингер?
>>641279 >>641395 Чё ты несёшь. Сам он всё обучил. Как и те кто делали кастомные контролнеты. И я тоже пытался, это не так сложно. Инструкция есть, от тебя требуется датасет и А100-часы.
>>641448 тебя в гугле забанили, блядь? Готовые пайплайны. И если ты не освоил автоматик, иди осваивай. Только в нём всё можно нормально собрать. Без вариантов.
>>641160 Ну вот зачем ты петух? Нормально можешь пояснить за всю хуйню? В инпеинте нужно НАРИСОВАТЬ где должен стоять твой пухлик или оно просто на свободном месте рисует?
>>641518 >Это вайлдкард. Причем безумный. Например: hoonoomaun bajri with retrovirs on zealousness in paper-thin, triple-tiered, lifeskills, art by preparators Никто в добром здравии такой промпт не придумает.
>>641537 помню, тестировал и вот эта хуйня меня люто заебала тогда. Это я потом узнал, что такая текстура — тупо след недосэмплированного шума из-за заниженного количества шагов. А МЖ ещё делает шарп перед апскейлом и этот мусор обобщается.
>>641551 Ты блядь рофлишь, что ли. Если ты хочешь СОХРАНИТЬ ВЫДЕЛЕННОЕ, то надо выбирать INPAINT NOT MASKED, а ты делаешь наеборот, то есть меняешь выделенное лицо.
>>641132 > SD не умеет ни то, что в сложные, но даже в в простыеые композици от слова хуй. Чел, двачую, ты на 200% прав, но пытаться это доказать местным шизофреникам, всё равно что черпать воду решетом, они тут на голову ёбнутые просто.
>>641559 Нашел похожее - invert mask (находится в дебаге инпеинта, в жопе мира). Картинку не ресайзит, то есть по факту рисует вокруг нее, но уже хоть что-то. Но странно, я думал что должна быть опция - взять вот это ебало и нарисовать с ним совсем другую картинку.
>>641588 Ты лучше скажи - нужно ли в инпеинте выделять куда его поставить или оно по принципу - куда приткнется? Потому что я выделил место под фигуру и получил залупу на воротник.
>>641566 https://openreview.net/pdf?id=gU58d5QeGv >As an additional precaution, we aggressively filter the dataset to 1.76% of its original size, to reduce the risk of harmful content being accidentally present.
>>641577 >умеет в эмоции. Как по мне, вторая девочка более эмоциональна. Первая просто стоит с дебильным ебальником, и кроме волосни кругом ничего чудесного нет, тогда, как на второй есть динамика
>>641597 >>641588 В инпеинте взял картинку, нарисовал место куда вставить человека, сделал как выше написали - поставил галочку - нихуя. Отдельно рисует человека, люого пола, одетого\раздетого, с инпеинтом нет.
Какой-то блок на добавление людей? Попробовал к уже имеющемуся промту дописать wax figure - хуево, но начало рисовать. Что за нах?
Stable Cascade - новая сд модель от шизанутых клоунов. Примеры реальных генераций.
Очередной пук-среньк от Мастака индуса, главное красивые превьюхи сделать и графики, и тогда инвесторы сразу понесут свои бабки в абсолютно мёртвую стабилити.
>>641632 >>641634 Всё та же мылаврня как и в sdxl. Детализации нет, у ребёнка с медведем кривые глаза. Ничего удивительного, не будет никогда у стабилити модели сравнимой по качеству с конкурентами.
>>641655 > но это в разы лучше любых кривых ебальников далли или миджорни )) Ахахаха, чел, мж и дали единственные в мире нейронки которые умеют генерить человеческие лица, с естественной мимикой и передачей эмоций.
>>641706 Ну, как тебе доказать? Раскрывать секрет моей генерации не буду. Я так же генерил оружие в лапках в прошлых тредах. Я по шесть часов в день "крутил рандомно движки в фокусе", как выразился один чел. И это дало мне такие результаты.
>>641716 я только учусь. первый час в тут. просто попросил гослинга с теди биром, а мне фикус всё сделал. спасибо анончику, который посоветовал эту нейронку. в сиди такого не получалось
>>641717 > И это дало мне такие результаты. Дефолт пики уровня 1.5-2.1 моделей, такой хлам генерил год назад любой залётный анон. И с лучшим качеством, разрешением и детализацией.
>>641721 >Дефолт пики уровня 1.5-2.1 моделей, такой хлам генерил год назад любой залётный анон. И с лучшим качеством, разрешением и детализацией. Да, да, да. Вот еще SDXL без инпеинта и апскейла. Черновые генерации. У мижорни кстати фон почти всегда заблюрен. Посмотри, что может сд уже сейчас. Неужели не красиво? Композиция есть?
>>641741 >а какие настройки ты выставляешь во вкладочках, Это не фокус, а демо опендалле. Тут дело в модели и рефайнерах. Зайди вдемо и посмотри что у них там стоит, я как-то опендалле крутил в фокусе - результат там явно не такой.
>>641620 Если снизят требования хотя бы до 16, то будет неплохо. Остальное можно ручками допилить, главное, что базу выдает вполне годную. Вообще, требования пиздец, конечно, с одной стороны. С другой стороны, двигаться-то больше особо некуда, только мутации править. По сути, СДХЛ уже выдает то, что близко к фотореализму, либо к годному синематику. А если даже и не выдает это 1 к 1, то дрочить на разницу только совсем поехавшие будут, которые в общем-то четко и не понимают, что хотят. Погоня за идеалом.
Мылодетекторам сразу предлагаю спокнуться, это не основной критерий оценки графики.
>>641772 Ты поехавший? Зачем ты в промте пишешь синематик фото, если это задаётся фильтрами (стилями)? Ты и остальным предлагаешь микроскопом орехи колоть?
>>641447 Лисичер, какой гуй нов и актуален? Есть вариант в виде осборника с выбором любой нейронки, чтобы в выпадающем списке в проге были опции СД, МД и прочие?
======================================
Предыдущий тред https://arhivach.top/?tags=13840
------------------------------------------
схожие тематические треды
- NAI-тред (аниме)
- технотред
========================
Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях.
Полный функционал в локальной установке (см. ниже)
Альтернативный онлайн-генератор №1: https://dezgo.com/txt2img
Альтернативный онлайн-генератор №2: https://civitai.com/ (create после регистрации)
Альтернативный онлайн-генератор №3: https://tensor.art/ (Workspace)
⚠️ Стандартные модели stable diffusion (v1.4 - v2.1) от Stability AI значительно отстают по качеству от кастомных моделей (см. ниже). Модели SD XL ставятся и запускаются так же как и любые другие модели SD.
🔞 Без цензуры и полный функци_анал: только ПК-версия
===========================================
🖥УСТАНОВКА НА ПК
WebUI от Automatic1111
https://teletype.in/@stablediffusion/PC_install_SD
------------------------------------------
Портативная версия альтернативного WebUI от Comfy (запуск с одного из run.bat файлов)
https://github.com/comfyanonymous/ComfyUI/releases
Примерные workflow для ComfyUI (можно загружать напрямую из картинок)
https://comfyanonymous.github.io/ComfyUI_examples/
------------------------------------------
А также простой в работе WebUI Fooocus
https://github.com/lllyasviel/Fooocus?tab=readme-ov-file#download
===========================================
📚 РАЗЛИЧНЫЕ МОДЕЛИ (И МНОГОЕ ДРУГОЕ) 👇
https://civitai.com/
------------------------------------------
📊 ПАРАМЕТРЫ И НАСТРОЙКИ ГЕНЕРАЦИИ 👇
https://teletype.in/@stablediffusion/samplers_steps
===========================================
🎨 ГАЙД ПО СОСТАВЛЕНИЮ ЗАПРОСА, СТИЛИ
https://teletype.in/@stablediffusion/artists_for_prompts
Пример запроса (Промпт): a tiger, wildlife photography, high quality, wildlife, soft focus, 8k, national geographic, photograph by nick nichols
------------------------------------------
♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇
https://supagruen.github.io/StableDiffusion-CheatSheet/
https://www.artvy.ai/styles
------------------------------------------
💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ
https://www.itshneg.com/controlnet-upravlyaj-pozami-v-stable-diffusion/
==========================================
🧠 ОБУЧЕНИЕ МОДЕЛИ ПО СВОИМ КАРТИНКАМ 👇
https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora
https://civitai.com/models/train