Локальные языковые модели (LLM): LLaMA, MPT, Falcon и прочие №23 /llama/

Аноним 22/10/23 Вск 23:47:35 #1 №527069

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст, и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2-х бит, на кофеварке с подкачкой на микроволновку.

Основным представителем локальных моделей является LLaMA. LLaMA это генеративные текстовые модели размерами от 7B до 70B, притом младшие версии моделей превосходят во многих тестах GTP3 (по утверждению самого фейсбука), в которой 175B параметров. Сейчас на нее существует множество файнтюнов, например Vicuna/Stable Beluga/Airoboros/WizardLM/Chronos/(любые другие) как под выполнение инструкций в стиле ChatGPT, так и под РП/сторитейл. Для получения хорошего результата нужно использовать подходящий формат промта, иначе на выходе будут мусорные теги. Некоторые модели могут быть излишне соевыми, включая Chat версии оригинальной Llama 2.
На данный момент развитие идёт в сторону увеличения контекста методом NTK-Aware Scaled RoPE. Родной размер контекста для Llama 1 составляет 2к токенов, для Llama 2 это 4к, но при помощи RoPE этот контекст увеличивается в 2-4-8 раз без существенной потери качества.
Так же террористы выпустили LLaMA 2, которая по тестам ебёт все файнтюны прошлой лламы и местами СhatGPT. Ждём выкладывания LLaMA 2 в размере 30B, которую мордолицые зажали.

Кроме LLaMA для анона доступны множество других семейств моделей:
Pygmalion- заслуженный ветеран локального кума. Старые версии были основаны на древнейшем GPT-J, новые переехали со своим датасетом на LLaMA, но, по мнению некоторых анонов, в процессе потерялась Душа ©
MPT- попытка повторить успех первой лламы от MosaicML, с более свободной лицензией. Может похвастаться нативным контекстом в 65к токенов, но уступает по качеству. С выходом LLaMA 2 с более свободной лицензией стала не нужна.
Falcon- семейство моделей размером в 40B и 180B от какого-то там института из арабских эмиратов. Примечательна версией на 180B, что является крупнейшей открытой моделью. По качеству несколько выше LLaMA 2 на 70B, но сложности с запуском и малый прирост делаю её не самой интересной.
Mistral- модель от Mistral AI размером в 7B, с полным повторением архитектуры LLaMA. Интересна тем, что для своего небольшого размера она не уступает более крупным моделям, соперничая с 13B (а иногда и с 70B), и является топом по соотношению размер/качество.

Сейчас существует несколько версий весов, не совместимых между собой, смотри не перепутай!
0) Оригинальные .pth файлы, работают только с оригинальным репозиторием. Формат имени consolidated.00.pth
1) Веса, сконвертированные в формат Hugging Face. Формат имени pytorch_model-00001-of-00033.bin
2) Веса, квантизированные в GGML/GGUF. Работают со сборками на процессорах. Имеют несколько подформатов, совместимость поддерживает только koboldcpp, Герганов меняет форматы каждый месяц и дропает поддержку предыдущих, так что лучше качать последние. Формат имени ggml-model-q4_0, расширение файла bin для GGML и gguf для GGUF. Суффикс q4_0 означает квантование, в данном случае в 4 бита, версия 0. Чем больше число бит, тем выше точность и расход памяти. Чем новее версия, тем лучше (не всегда). Рекомендуется скачивать версии K (K_S или K_M) на конце.
3) Веса, квантизированные в GPTQ. Работают на видеокарте, наивысшая производительность (особенно в случае Exllama) но сложности с оффлоадом, возможность распределить по нескольким видеокартам суммируя их память. Имеют имя типа llama-7b-4bit.safetensors (формат .pt скачивать не стоит), при себе содержат конфиги, которые нужны для запуска, их тоже качаем. Могут быть квантованы в 3-4-8 бит (Exllama 2 поддерживает адаптивное квантование, тогда среднее число бит может быть дробным), квантование отличается по числу групп (1-128-64-32 в порядке возрастания качества и расхода ресурсов).

Основные форматы это GGML и GPTQ, остальные нейрокуну не нужны. Оптимальным по соотношению размер/качество является 5 бит, по размеру брать максимальную, что помещается в память (видео или оперативную), для быстрого прикидывания расхода можно взять размер модели и прибавить по гигабайту за каждые 1к контекста, то есть для 7B модели GGML весом в 4.7ГБ и контекста в 2к нужно ~7ГБ оперативной.
В общем и целом для 7B хватает видеокарт с 8ГБ, для 13B нужно минимум 12ГБ, для 30B потребуется 24ГБ, а с 65-70B не справится ни одна бытовая карта в одиночку, нужно 2 по 3090/4090.
Даже если использовать сборки для процессоров, то всё равно лучше попробовать задействовать видеокарту, хотя бы для обработки промта (Use CuBLAS или ClBLAS в настройках пресетов кобольда), а если осталась свободная VRAM, то можно выгрузить несколько слоёв нейронной сети на видеокарту. Число слоёв для выгрузки нужно подбирать индивидуально, в зависимости от объёма свободной памяти. Смотри не переборщи, Анон! Если выгрузить слишком много, то начиная с 535 версии драйвера NVidia это серьёзно замедлит работу. Лучше оставить запас в полгига-гиг.

Гайд для ретардов для запуска LLaMA без излишней ебли под Windows. Грузит всё в процессор, поэтому ёба карта не нужна, запаситесь оперативкой и подкачкой:
1. Скачиваем koboldcpp.exe https://github.com/LostRuins/koboldcpp/releases/ последней версии.
2. Скачиваем модель в gguf формате. Например вот эту:
https://huggingface.co/Undi95/MLewd-ReMM-L2-Chat-20B-GGUF/blob/main/MLewd-ReMM-L2-Chat-20B.q5_K_M.gguf
Если совсем бомж и капчуешь с микроволновки, то можно взять
https://huggingface.co/TheBloke/Mistral-7B-OpenOrca-GGUF/blob/main/mistral-7b-openorca.Q5_K_M.gguf
Можно просто вбить в huggingace в поиске "gguf" и скачать любую, охуеть, да? Главное, скачай файл с расширением .gguf, а не какой-нибудь .pt
3. Запускаем koboldcpp.exe и выбираем скачанную модель.
4. Заходим в браузере на http://localhost:5001/
5. Все, общаемся с ИИ, читаем охуительные истории или отправляемся в Adventure.

Да, просто запускаем, выбираем файл и открываем адрес в браузере, даже ваша бабка разберется!

Для удобства можно использовать интерфейс TavernAI
1. Ставим по инструкции, пока не запустится: https://github.com/Cohee1207/SillyTavern
2. Запускаем всё добро
3. Ставим в настройках KoboldAI везде, и адрес сервера http://127.0.0.1:5001
4. Активируем Instruct Mode и выставляем в настройках пресетов Alpaca
5. Радуемся

Инструменты для запуска:
https://github.com/LostRuins/koboldcpp/ Репозиторий с реализацией на плюсах, есть поддержка видеокарт, но сделана не идеально, зато самый простой в запуске, инструкция по работе с ним выше.
https://github.com/oobabooga/text-generation-webui/blob/main/docs/LLaMA-model.md ВебуУИ в стиле Stable Diffusion, поддерживает кучу бекендов и фронтендов, в том числе может связать фронтенд в виде Таверны и бекенды ExLlama/llama.cpp/AutoGPTQ. Самую большую скорость даёт ExLlama, на 7B можно получить литерали 100+ токенов в секунду. Вторая версия ExLlama ещё быстрее.

Ссылки на модели и гайды:
https://huggingface.co/TheBloke Основной поставщик квантованных моделей под любой вкус.
https://rentry.co/TESFT-LLaMa Не самые свежие гайды на ангельском
https://rentry.co/STAI-Termux Запуск SillyTavern на телефоне
https://rentry.co/lmg_models Самый полный список годных моделей
https://rentry.co/ayumi_erp_rating Рейтинг моделей для кума со спорной методикой тестирования
https://rentry.co/llm-training Гайд по обучению своей лоры
https://rentry.co/2ch-pygma-thread Шапка треда PygmalionAI, можно найти много интересного
https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing Последний известный колаб для обладателей отсутствия любых возможностей запустить локально

Факультатив:
https://rentry.co/Jarted Почитать, как трансгендеры пидарасы пытаются пиздить код белых господинов, но обсираются и получают заслуженную порцию мочи

Шапка треда находится в https://rentry.co/llama-2ch предложения принимаются в треде

Предыдущие треды тонут здесь:
>>523102 (OP)
>>517753 (OP)

Аноним 22/10/23 Вск 23:54:17 #2 №527079

А 20b, которая в колабе сейчас, как-то можно заставить работать стабильно?
У меня она пару сообщений держит, а потом всё, но я с телефона колаб держу, может в этом проблема?
Что ставите, чтобы не слетала? Я контекст пробовал урезать, но как-то не сильно увидел разницу в продолжительности работы и с процем так же.

Аноним 23/10/23 Пнд 00:11:41 #3 №527095

>>527049 →
И как, получается? Выглядит как минимум интересно.
> всегда будет чередование
Главное чтобы не скатилось в пестрение короткого действия-короткой фразы-повторить
>>527084 →
> но кому то нравится самому руководить процессом
Аа, так вот как в чем дело.
> А что значит подходящий формат
К каждой модели свой, почти все умеют в альпаку и в 95% шизомиксов она. До того как тред превратился в текущее состояние как раз промты, порядок и прочее для достижения наилучшего результата здесь и обсуждались.
>>527079
Выдачу консоли смотреть надо какая ошибка. Скорее всего ООМ.

Аноним 23/10/23 Пнд 00:16:34 #4 №527102

Накатываю вот это сейчас:

https://huggingface.co/collections/IlyaGusev/saiga2-saigamistral-gguf-6505d540399f2e93d5909962

Думаете норм?

Аноним 23/10/23 Пнд 00:19:03 #5 №527105

>>527102
Расскажи потом, насколько косноязычно пишет.

Аноним 23/10/23 Пнд 00:27:03 #6 №527112

>>527102
Попробуй, может автор вынес урок из прошлых результатав и смог улучшить свою методику. То что было раньше всратые, так что новый релиз энтузиазма не вызвал.

Аноним 23/10/23 Пнд 00:29:14 #7 №527113

grammar.png

example.png

>>527095
>И как, получается? Выглядит как минимум интересно.
Перекину в этот тред. >>527049 → Экспериментальная грамматика, которая должна заставить модель чередовать описание и речь, предотвращая однообразные полотна. Прикрепил пример, но это лишь начало рп. Надо протестировать как оно будет через 30-50 постов.

Аноним 23/10/23 Пнд 00:30:26 #8 №527114

00003-3563800869.png

Аноны, распишите 13b бомжу, имеет ли смысл качать что-то кроме mistral-openorca-7b? На форчке кто-то продвигает xwin-mlewd, тут выражают уважение mistral-claudechat и amethyst-mistral, у аюми в топе mlewdboros... я не ебу короче. mistral-openorca-7b для простых вещей мне нравится, но fomo душит - вдруг нашелся уже явный фаворит у анонов

Аноним 23/10/23 Пнд 00:31:46 #9 №527115

>>527114
Качай всё подряд, если трафик не платный.

Аноним 23/10/23 Пнд 00:32:46 #10 №527116

>>527102
Опробовал сайгу-мистраль-ггуф-q4, кривая, косая, тупая что-то на уровне gpt2 по ощущениям. Даже с алисой поговорить веселее. Может я проебал настройки, стояли oobabooga:simple-1, для англиков норм заходило.

Аноним 23/10/23 Пнд 00:34:05 #11 №527118

>>527114
На меня мистраль-клодчат и млевдборос вообще впечатления не произвели, первый тупит и скучный, второй многое из промпта игнорит, особенно инструкции как писать. Я вот случайно РеММ-мистраль накатил, пока доволен - промпт читает хорошо, не бредит, пишет достаточно интересно. Буду пробовать ещё, впрочем.

Аноним 23/10/23 Пнд 00:37:54 #12 №527121

Снимок экрана 2023-10-22 202317.png

>>527105
>>527112
Ну там вообще пиздец. Не сильно отличается от обычных моделей, если глядеть по качеству.

Нужно тогда обычную альпаку брать. Как я помню, она хорошо генерировала русский, не на уровне Пушкина, но всё же.

Пока мистраль пробую.

Аноним 23/10/23 Пнд 00:53:58 #13 №527127

example2.png

example3.png

example4.png

>>527095
>>527113
Пестрения короткими фразами не будет, поскольку предложения могут быть абсолютно произвольной длины. Прикрепил еще несколько примеров.

Аноним 23/10/23 Пнд 00:54:12 #14 №527128

>>527114
>Из сеток 13б умнее файнтюнов мистраля разве что Amethyst-13B-Mistral или wizardlm-13b-v1.2.
>А так тот же openhermes-2-mistral-7b.Q8_0 хорош, как и mistral-7b-openorca.Q8_0 или collectivecognition-v1.1-mistral-7b.Q8_0, zephyr-7b-alpha.Q8_0.

Аноним 23/10/23 Пнд 00:57:01 #15 №527131

>>527127
Удобная эта штука, но я ебаться с ее настройкой не хотел. А вот за шаблон спасибо

>>527121
На сколько щупал лучше из мистралей по русски болтает орка-мистраль. И если крутит быстро то качай 8 квант

Аноним 23/10/23 Пнд 01:00:39 #16 №527132

image.png

Хорош-хорош, мистраль.

То что она не начала ей рисовать мерзкие дойки, уже значит, что модель не тупая и подходит для кума.

Аноним 23/10/23 Пнд 01:02:24 #17 №527133

изображение.png

>>527132
Бутылку лучше с собой принеси, хоть смажешь.

Аноним 23/10/23 Пнд 01:03:44 #18 №527136

>>527133
DFC это база. Ну и написано же, КАК у ребёнка, а не то что она напрямую ребёнок, тащмаер.

Аноним 23/10/23 Пнд 01:06:40 #19 №527138

Снимок экрана 2023-10-22 220545.png

>>527136
Да не, я старух не переношу на дух.

>>527133
Всё локально тащмайор.

Аноним 23/10/23 Пнд 01:08:31 #20 №527142

>>527127
А вобще, это ведь как раз описания от третьего лица, а это рассказывает рассказчик. Но да, в таком формате занимает меньше места.

Аноним 23/10/23 Пнд 01:09:16 #21 №527143

>>527138
> Да не, я старух не переношу на дух.
Я тоже, но распространяться об этом необязательно. Всем лолям по 228 лет!

Аноним 23/10/23 Пнд 01:10:53 #22 №527144

Товарищ майор записывает.jpg

>>527138
Совсем народ беспаливный пошёл. Впрочем кое-кому даже в плюс.
записываю
>>527143
Этот сечёт.

Аноним 23/10/23 Пнд 01:14:05 #23 №527146

>>527138
Нахуя писать на русском? Раз всё равно ответ на инглише.

Аноним 23/10/23 Пнд 01:19:01 #24 №527148

image.png

Качественный кум.

Надо будет полноценную РПГ-катку поиграть. А то обычный кум не интересно, интересна РПГ с элементами кума, а не кум с элементами РПГ.
>>527146
Это я на мистрале. А пишу на русском, ибо лень каждый раз в уме переводить текст, перед тем как вводить.

Аноним 23/10/23 Пнд 01:20:51 #25 №527150

image.png

>>527146
Хочу и лень переводить, а вобще вот например как умеет тот же
dolphin-2.1-mistral-7b.Q8_0

Аноним 23/10/23 Пнд 01:26:19 #26 №527156

>>527121
Это пикрел так тестишь? Она вообще должна на русском отвечать, если офк ей так приказать.
>>527127
Вполне себе, на третьей есть некоторое, но в пределах. Надо попробовать, спасибо.
>>527138
Уу педобир, асуждаю, у девушки должно быть за что держаться!
>>527143
> Всем лолям по 228 лет!
800+

Blushing deeply, Suzuran giggles and nuzzles her head into your shoulder, enjoying the affectionate touch. ""Why, thank you, Doctor. I'm flattered by your compliments. And as for my age, well…""
She pauses for a moment, her thoughts clouded by a mix of shyness and confusion. ""Doctor, to be perfectly honest, I'm not entirely sure how old I am. Time passes differently in Higashi, and I didn't keep track of it during my journey. But I believe I'm somewhere between [enough] and [enough] years old, based on my memories and the events I recall.""
Looking up at you with her big, green eyes, she continues. ""Does it matter, Doctor? Age is just a number after all. I can assure you that despite my age, I'm capable and experienced enough...""

Аноним 23/10/23 Пнд 01:29:16 #27 №527159

>>527156
>Age is just a number after all
Мне ещё давинчи так оправдывался.

Аноним 23/10/23 Пнд 01:30:07 #28 №527160

>>527156
>Она вообще должна на русском отвечать
Я поглядел, но у мистрали на русском начинается какая-то шиза. Нихуя не понятно что пишет, и грамматику не соблюдает.

>>527156
> у девушки должно быть за что держаться
Нет. Дойки это омерзительно.

Аноним 23/10/23 Пнд 01:36:06 #29 №527162

>>527159
Это модель которую тут так ругают.
>>527160
> но у мистрали на русском начинается какая-то шиза
Так сайга это лора-локализатор, должна давать модели познания чтобы на русском общаться. Попробуй просто инструкции ей давать и смотреть что отвечает. Простые ответы она может выполнять или тексты писать. Но уровень соевости - у местных сыщиков передоз может случиться. И еще прошлые версии вообще не могли в контекст, после ~1к токенов начиналась шиза и потеря когерентности.
> Дойки это омерзительно.
В них нет ничего плохого, но там про них ни слова

Аноним 23/10/23 Пнд 01:50:56 #30 №527165

Снимок экрана 2023-10-22 225000.png

>>527162
Текст-то русский, но всё равно какой-то шизоидный.

Начал новую компанию, надеюсь большую.

Аноним 23/10/23 Пнд 02:06:42 #31 №527170

Да блядь, как заебала эта шиза. Ну, что, нужно будет на английский всё переводить и реранить катку.

Аноним 23/10/23 Пнд 02:08:48 #32 №527172

>>527165
О да, прошлый трешак от сайги на лламе 1 в 1 почти.
>>527170
Какой смысл использовать на английском модель, заявляющуюся как русскоязычную? Кроме офк показать насколько она плоха и там.

Аноним 23/10/23 Пнд 02:09:21 #33 №527173

>>527049 →
Звучит клево, кстати.

>>527102
Сайгу тут не любят, кек. =)

>>527160
Не напрягайся, дети пока все равно не поймут, а потом сами прочувствуют.

Аноним 23/10/23 Пнд 02:09:33 #34 №527174

>>527172
Я на мистраль sci-phi переключился.

Аноним 23/10/23 Пнд 02:19:37 #35 №527178

>>527174
это ж научная модель?

Аноним 23/10/23 Пнд 02:26:32 #36 №527181

>>527178
Не знаю, у Broke нет gguf-мистралей кроме этой.

Аноним 23/10/23 Пнд 02:36:31 #37 №527185

>>527181
чево, этих мистралей больше 10 штук

Аноним 23/10/23 Пнд 02:37:32 #38 №527186

>>527181
https://huggingface.co/models?sort=trending&search=gg

Аноним 23/10/23 Пнд 02:41:53 #39 №527187

Черт, нет, так не пойдет. Даже на английском модель в основном бред несет. Есть возможность как-то заскриптовать помимо World Info?

Аноним 23/10/23 Пнд 02:44:16 #40 №527188

>>527187
Какого рода бред? Если не следует общему сеттингу, прописанному в промпте - играйся с семплерами, если путается в деталях существующего мира - ищи/пили лорбуки.

Аноним 23/10/23 Пнд 02:51:21 #41 №527190

>>527188
Отказывается воспринимать world info.

Аноним 23/10/23 Пнд 02:54:21 #42 №527192

>>527190
Чтобы оно начало воспринимать, ты должен контекстом задеть ключевые слова.

Аноним 23/10/23 Пнд 02:57:05 #43 №527194

>>527192
Оно задевает. Но воспринимает только после рероллов. А рероллов быть не должно.

Аноним 23/10/23 Пнд 07:24:43 #44 №527243

Какие там 70б сейчас топовые? А то скачал airoboros-l2-70b-3.1.Q4_K_M.gguf, а оно как то хуже чем предыдущий 20b гомункул.

Аноним 23/10/23 Пнд 07:57:35 #45 №527247

>>527079
Проверил колаб.
Первый сюрприз который нашёл - после обновления угабоги, перестал работать лоадер ExLlama. Эту проблему решил прописав установку предыдущей версии - вроде работает.

>У меня она пару сообщений держит, а потом всё
Меин версии 20В q4 моделей влезают только с контекстом 2к.
Поэтому когда контекст превышает этот размер вылетает ошибка типа:
RuntimeError: start (1982) + length (135) exceeds dimension size (2048).

Я попытался это решить флагом--max_seq_len 2048
Но он урезает контекст только в настройках лоадера, а параметр Truncate the prompt up to this length в пресетах генерации оставляет 4096, что и приводит к ошибке.
Похоже придётся settings-template.yaml переписывать, не хотел с этим возиться...

Пока что просто меняй в настройках контекст на 2048 и всё будет работать или запускай 13В с 4к контекстом

Хотел запихать версии с квантованием 3 и 4к контекстом, но угабоге не нравятся названия папок. Можно их конечно в процессе переименовать, но гемор тот ещё. Вместе со сменой дефолтных настроек текст колаба рискует раза в полтора увеличиться...

Аноним 23/10/23 Пнд 08:20:23 #46 №527254

>>527243
Сижу на хвине ужатом в 3 для эксламы 2

Аноним 23/10/23 Пнд 08:39:18 #47 №527257

>>527148
>Качественный кум
>1-2 предложения
>ебля уровня "ну ты короче ей вставил и малафья полилася"
Бля...

Аноним 23/10/23 Пнд 08:49:27 #48 №527261

fixed.png

16000084841920.png

>>527131
>>527156
Ну, я конечно же проебался - три точки и комбинации с восклицательными/вопросительными знаками не работают. Причем до конца мне это пофиксить не удалось. Грамматика-то работает, но модель начинает ставить лишние знаки препинания! Наверное потому что так поделились токены, и я отбирал у нее возможность продолжать предложение. Пришлось оставить лимит в 2 предложения только для действий. В рп на 50 постов проблем не вылезло, но эффект какой-то... слабый. С одной стороны оно периодически принудительно переключает на речь, но модель выдает короткую фразу и опять переключается на действия. Ну и простыни все равно остались потому что даже одно предложение можно сделать очень длинным. В общем, работает, но как-то не особо полезно.

Аноним 23/10/23 Пнд 11:46:46 #49 №527319

>>527247
> Похоже придётся settings-template.yaml переписывать, не хотел с этим возиться...
А зачем template? Надо же просто settings.yaml создать рядом, а тимплейт не трогать.

У меня settings несколько разных файлов под разные модели с разных батников. =)

Аноним 23/10/23 Пнд 12:16:20 #50 №527335

https://www.reddit.com/r/LocalLLaMA/comments/17e855d/llamacpp_server_now_supports_multimodal/
ну все живем

Аноним 23/10/23 Пнд 12:22:17 #51 №527339

>>527319
Потому что это колаб. Он условно стартует только с одной моделью и по хорошему все настройки по умолчанию должны быть переписаны под неё. ну и ещё для нового файла мне придётся весь его текст пихать в ячейку, а так можно только нужные строки поменять
Я сам интерфейсом угабоги не пользуюсь только API под таверну и ХЗ какие там к какой модели настройки.
Если поделишься - буду признателен.

Аноним 23/10/23 Пнд 12:51:46 #52 №527367

>>527335
>9 hr. ago
Ты бы ещё новость из прошлого века принёс.
АЛСО, пока в кобольдцпп нет, оно не нужно.

Аноним 23/10/23 Пнд 13:01:58 #53 №527372

>>527367
ы опять ты и тоже самое пишешь, за всех не решай

Аноним 23/10/23 Пнд 13:04:54 #54 №527377

>>527335
> живем
Как обычно в два раза медленнее чем на питоне? Когда Жора уже сделает нормальную производительность CUDA? А то с Flash Attention уже почти в три раза отрыв от Жоры.

Аноним 23/10/23 Пнд 13:10:57 #55 №527381

>>527339
Я просто обратил внимание на название файла.
По умолчанию, убабуга будет забирать из settings.yaml
И с коллабами не работал, как они там формируют новые файлы я хз.

Но я честно скажу, я сам не уверен, что нужно вводить. Я 20b в видяхе не запускал, поэтому лишние токены не обрезал никогда.
Твои рассуждения звучат полностью логично, думаю ты все верно сделаешь.

Аноним 23/10/23 Пнд 13:19:17 #56 №527385

>>527243 -> >>525930 →
> хуже чем предыдущий 20b гомункул
Гомункулу повезло выдать то что тебе понравилось, увы, тот же уровень они выдавать не хотят. С другой стороны, кум на айроборосе не сказать чтобы прям заебись, там шизомикс вполне может выиграть, особенно если сценарий простой.
>>527247
> но угабоге не нравятся названия папок
Дефолтные из того что уже лежат на обниморде должны скачиваться и работать, что пишет? На 2к забей, это совсем грустно, а модель в трех битах еще вполне себе работает.
А вообще, в идеале нужно форкнуть какой-то рабочий коммит убабуги и ставить уже его чтобы точно не было тряски и конфиги были заранее прописаны.
>>527261
Слушай, а сколько длина поста выходит? И может ли оно переключаться с диалога на описание "со стороны" или сместить фокус? Когда приступаешь к куму хочется видеть длинные полотна с балансом между художествами и графоминией вместо пигма-лайк реплик. Вот как именно
> простыни все равно остались потому что даже одно предложение можно сделать очень длинным
работает?

Аноним 23/10/23 Пнд 13:33:19 #57 №527391

Тупая хуйня, модель не умеет оперировать отдельными буквами походу. С цифрами может, со списком чисел может манипулировать, а вот произвольно менять размер букв или пробелы не через одного нифига

Master: давай поиграем с другой задачей, вот массив букв "resulting" . Начни работу с ним
AGI thinking: < Now the Master gives me a new task involving letters. It seems like I need to work with a string called "resulting". Let's go. >
AGI: "Alright, let's work with the 'resulting' string. What would you like me to do with it?"
Master: Все буквы большие
AGI thinking: < The Master wants me to convert all characters in the string to uppercase. This is a simple text manipulation operation. Let's go. >
AGI: "All characters in the 'resulting' string have been converted to uppercase. Here's the result: RESULTING."
Master: Далее добавь пробел через каждые 3 буквы
AGI thinking: < Now the Master asks me to add a space every three characters in the modified string. I can handle this. Let's do it. >
AGI: "Here's the 'RESULTING' string with spaces added after every third character: R E S U L T I N G"

Аноним 23/10/23 Пнд 14:15:00 #58 №527427

>>527372
Так ведь никто так и не написал, нахуя оно нужно.
>>527391
>Тупая хуйня, модель не умеет оперировать отдельными буквами походу.
Давно известно. И число букв не всегда верно считает, особенно не для инглиша. А что тебя удивляет?

Аноним 23/10/23 Пнд 14:32:05 #59 №527441

>>527427
>Так ведь никто так и не написал, нахуя оно нужно.
Так поиграться с мультимодалкой удобнее можно, вот и весь смысл

> А что тебя удивляет?
Да вобщем то удивляет что с числами ок, а с буквами не может, хотя как раз таки на числа и цифры все жалуются.
Даже исследование недавно было мол токенизатор не дает модели нормально считать из-за этого.

Аноним 23/10/23 Пнд 17:29:51 #60 №527559

>>527391
>>527441
Токен это чаще всего не одна буква.

Аноним 23/10/23 Пнд 17:39:03 #61 №527569

>>527559
Ну так и пара цифр подряд тоже могут быть одним токеном.

Аноним 23/10/23 Пнд 18:11:16 #62 №527581

>>527569
>>527559
>>527441
На дроч с буквами просто не надрочены. Вариаций токенов обычно должно хватать на такое.

Аноним 23/10/23 Пнд 19:12:55 #63 №527613

бля на спам лист ругается, не отправить вывод сетки

Аноним 23/10/23 Пнд 19:17:40 #64 №527617

изображение.png

>>527613
Скрины пока ещё не запретили.

Вот кстати единственный момент, когда сетка таймскипнула в тему. Я сам хотел следующим постом скипать 2 недели, аж страшно стало.

Аноним 23/10/23 Пнд 19:49:47 #65 №527634

Мнение по PYGMALION AI ?

Аноним 23/10/23 Пнд 19:50:04 #66 №527635

А есть ли мистраль >7b?

Аноним 23/10/23 Пнд 19:58:12 #67 №527638

>>527634
Умир. Пагип.
>>527635
На данный момент нет.

Аноним 23/10/23 Пнд 20:03:55 #68 №527641

>>527638
Почему погиб?

Аноним 23/10/23 Пнд 20:07:41 #69 №527643

>>527641
Потому что смысла в нём больше нет.

Аноним 23/10/23 Пнд 20:19:54 #70 №527646

Не запускается локально мистраль.

Аноним 23/10/23 Пнд 20:36:58 #71 №527656

>>527634
Команда вроде ничего, помогают в тренировке других моделей, в свое время сделали довольно интересную и мемную модель. Пигма же как файнтюн - на любителя, под второй лламой оно то ничего, но не фоне других - слабо.
>>527635
Только в виде "части корабля" в франкенштейнах. Анонсов пока не было.
>>527646
Запускается

Аноним 23/10/23 Пнд 20:45:06 #72 №527660

https://huggingface.co/CausalLM/14B
https://huggingface.co/TheBloke/CausalLM-14B-GGUF
https://huggingface.co/TheBloke/CausalLM-14B-GPTQ

Чего еще не обсуждаем? Не много не мало а
> Perhaps better than all existing models < 70B, in most quantitative evaluations

Аноним 23/10/23 Пнд 20:48:34 #73 №527665

>>527660
> in most quantitative evaluations
А рпшит как?

Аноним 23/10/23 Пнд 20:54:45 #74 №527669

>>527665
Хз, пока железо занято другим. Сразу можно предвидеть возможные потенциальные проблемы из-за формата промта, по датасету не понятно
> augmented text training using carefully selected entries from Wikipedia, as well as featured entries from Fandom and filtered entries from Moegirlpedia. In order to strike a balance between efficiency and quality, 100% of the data used for training was synthetic data, no direct use of text from the internet or original texts from publicly available datasets was employed for fine-tuning
Там рядом еще 7б, полученная дистилляцией из 14, ее уже с 33б сравнивают

Аноним 23/10/23 Пнд 21:03:13 #75 №527680

https://www.reddit.com/r/LocalLLaMA/comments/17egssk/collection_thread_for_llava_accuracy/
Как мультимодалку можно использовать любую лламу с определенной архитектурой

Аноним 23/10/23 Пнд 21:08:07 #76 №527684

1.png

>>527385
>Слушай, а сколько длина поста выходит? И может ли оно переключаться с диалога на описание "со стороны" или сместить фокус?
Грамматика не влияет на генерацию модели - она накладывает ограничения на токены. То есть отбрасывает некоторые варианты из возможных. Если тебе нужны длинные посты, то просто скажи модели их генерить: ### Response (Describe {{char}}'s actions, thoughts, feelings and sensations in full, elaborate, graphic, and explicit detail).

Моя грамматика наоборот ограничивает длину описания. Например как на пикче - модель начала писать полотно, но после двух предложений грамматика заставила перейти ее на речь, что повлияло и на дальнейшую генерацию. Без этого в лучшем случае была бы одна реплика где-нибудь в конце, а в худшем - просто полотно описаний. Только вот реплики все равно остались короткие потому что модель не знает что писать. И самое главное - это никак не спасает от нежелательных закономерностей, как, например, похожая длина и структура каждого сообщения.

Аноним 23/10/23 Пнд 21:09:11 #77 №527685

изображение.png

>>527660
Чёт кекнул с самоподрыва модели.

Аноним 23/10/23 Пнд 21:12:07 #78 №527688

>>527660
По адекватности вроде годно. Но контекст 8К всего. И Exllama через жопу работает из-за кастомного токенизатора, надо HF подрубать.
>>527665
Говно, с вежливостью проблема как и у Мистраля.

Аноним 23/10/23 Пнд 21:12:24 #79 №527690

изображение.png

>>527684
Как избавиться от такой сои? Когда насилуемые персонажи начинают мурмурить про удовольствие.

Аноним 23/10/23 Пнд 21:14:39 #80 №527693

изображение.png

>>527660
>>527688
>По адекватности вроде годно.
С одной стороны да, с другой, в ней слишком много китайского.

Аноним 23/10/23 Пнд 21:18:25 #81 №527696

>>527690
Пихай по классике в негатив "You are helpful assistant." Будет не очень полезным, от вежливости помогает, но могут быть уже другие проблемы.

Аноним 23/10/23 Пнд 21:20:04 #82 №527697

>>527690
Это не соя а bias модели - в эротике и в ситуациях с изнасилованием куча "feels good". Добавляй поведение персонажа в author's note на глубину 1. Хочешь насиловать - пиши что-то типа "Author's Note: {{char}} will feel nothing but pain, humiliation and resentment towards {{user}} when being raped." Работает как часы и без негатива.

Аноним 23/10/23 Пнд 21:20:27 #83 №527698

>>527696
У меня кобольда, там нет негативов по состоянию на вчера.

Аноним 23/10/23 Пнд 21:26:39 #84 №527706

>>527697
Да можно просто в промпте дописать что нарратор развивает историю в реалистичном стиле следуя контексту пользователя или что то такое, у меня там наклонность правит

Аноним 23/10/23 Пнд 21:32:16 #85 №527712

>>527684
Хм, с виду обычнопост как и без грамматики, нормальный. Тут действительно писать какую-то речь будет только хуже ибо неуместно, только описывать визуал, прогресс и мысли.
Выходит такая схема на мифомаксах и прочих производных должна неплохо заходить, вылечивая их шизу.
>>527690
Свайпни или изначально обозначь более жестокий сеттинг. Базированная реакция же.
>>527685
>>527693
В голосину

Аноним 23/10/23 Пнд 21:38:16 #86 №527719

>>527706
Тут две проблемы. Во-первых, модель не всегда знает что такое реалистичный стиль, и тем более что именно ты от нее хочешь. Во вторых, промпт удавится контекстом, и модель все равно начнет склоняться к позитиву. Чем более необычные сценарии отыгрываешь, тем сильнее надо идти наперекор модели.
>>527712
Я просто привык читать эроги, где тянки пиздец как многословны.
>Выходит такая схема на мифомаксах и прочих производных должна неплохо заходить, вылечивая их шизу.
В смысле?

Аноним 23/10/23 Пнд 21:48:49 #87 №527730

>>527719
> не всегда знает что такое реалистичный стиль
Действительно может не так понять, выдав
> На громкие крики пришли люди, или произошел FBI OPEN UP

> привык читать эроги, где тянки пиздец как многословны
Да, есть такое дело, хотя по тому скрину контекст не понятен, и если заменить описания на "тихо постанывает ах ах" будет плохо.
По наблюдениям, если изначально речи много то и кум аналогичным образом будет проходить, в примеры диалога напихать. Некоторые модели по дефолту почти одну речь делают, что аж нехватает описаний. Промтом, кстати, что-то типа "focus on character speech, use long intricate phrases" не управляется?
> В смысле?
Жаловались же что слишком много лишней графомании и шизофазии уровня "колышащийся ворс ковра, который начал раскачиваться в такт их страстным движениям".

Аноним 23/10/23 Пнд 21:53:09 #88 №527731

>>527730
>шизофазии уровня "колышащийся ворс ковра, который начал раскачиваться в такт их страстным движениям".
Аж соседей разбулил.

Аноним 23/10/23 Пнд 22:03:32 #89 №527736

>>527730
>По наблюдениям, если изначально речи много то и кум аналогичным образом будет проходить, в примеры диалога напихать.
У меня во время кума персонажи замолкают даже если до этого куча примеров речи. Только 20b mlewd chat неплохо балансирует. Как я понял, с этим особо ничего не поделаешь кроме файнтюнинга.
>Некоторые модели по дефолту почти одну речь делают, что аж нехватает описаний.
У меня не было ни одной модели, которую я бы не смог проинструктировать строчить полотна модфикатором в конце контекста.
>Промтом, кстати, что-то типа "focus on character speech, use long intricate phrases" не управляется?
Можно попробовать, но скорее всего кинет в другую крайность. Я же хочу чтобы она всегда держала плюс-минус 50/50 баланс.
>Жаловались же что слишком много лишней графомании и шизофазии уровня "колышащийся ворс ковра, который начал раскачиваться в такт их страстным движениям".
Тут проблема в том, что модель не понимает разницы между полезной и бесполезной графоманией. Попытаешься убрать "колышущийся ворс ковра"- перестанет описывать и релевантные вещи.

Аноним 23/10/23 Пнд 22:04:43 #90 №527738

>>527680
Проверил на последнем релизе llama.cpp, запустил орку-мистраль с файлом mmproj-f16.gguf и да, орка начала распознавать картинки
Получается этот файл mmproj нашлепка сверху или сбоку к модели, преобразующий картинку в понятное для сетки векторное представление? Не ебу, но похоже как то так

Аноним 23/10/23 Пнд 22:10:19 #91 №527743

>>527738
Это ж можно просто создавать нашлепки-органы чувств для сетки на любой лад. Звук тот же, или данные какого то анализатора.

Аноним 23/10/23 Пнд 22:25:31 #92 №527754

>>527660
>>527665
Бля ну хуй знает. С альпака-подобным форматом неоче дружит.
Вроде и генерирует норм, но иногда посты на грани когерентности и многовато галюнов или же слишком быстро по всему проносится.
Между свайпами дичийший рандомайзер, на левд карточке или начинает странный промоушн целомудрия(!), или с порога 4м сообщением вполне себе содержательное полотно на 700 токенов с
> ""Glad we agree on our initial course of action,"" she purrs huskily, leaning closer until her warm breath fizzes against his earlobe.*
> ""Now, let me show you exactly why people call me '[]'.""
> With that said, she slides under his shirt - letting out a soft gasp at his firm chest muscles - and begins tracing delicate patterns along them using her nimble fingers.
> Her skilled hands move up-and-down his torso; occasionally dipping underneath his pants to give him playful nibbles on his belly button or tickle his navel.
> Without missing a beat, Asato wraps her soft lips around it - sucking voraciously while running her tongue sensuously up-and-down its length. [..] She increases the pace of her oral ministrations; giving him expert fellatio unlike anything he had experienced before.

Еще в конце часто ставит собственные инструкции "обрати внимание что сейчас пользователь должен отвечать а не ты, поэтому пока жди ответа" (лол), или говорит с пользователем "Теперь твоя задача - написать что теперь будет делать пользователь".

В принципе, потанцевал есть, но нужно заставить нормально работать. И скорее всего снижать температуру ибо жесткая дичь происходит.

Аноним 23/10/23 Пнд 22:26:35 #93 №527756

image.png

Это вообще дельфин-мистраль. Щас попробую сетки других размеров че будет там

Аноним 23/10/23 Пнд 22:30:08 #94 №527757

Ругается, ну логично, для запуска с 13b нужен файл mmproj от 13b llava, на сколько я понимаю.

Аноним 23/10/23 Пнд 22:42:54 #95 №527768

image.png

Франкенштейнов кусок mistral-11b-cc-air-rp.Q6_K работает с 7b версией преобразователя, но уже чуть чудит, как не крутил иногда добавляет про желтый цвет.
Ну, походу можно запускать любую 7b 11b 13b 20b с соотвествующим расширителем и все заработает, где то лучше где то хуже.
Основную суть сетка понимает. Раз это есть в llama.cpp то скоро добавят как минимум в кобальд, а там и таверна подтянется.

Аноним 23/10/23 Пнд 22:48:39 #96 №527775

image.png

Amethyst-13B-Mistral.q5_k_m c файлом расширения спизженого из gguf версии llava 13b

Аноним 23/10/23 Пнд 23:04:27 #97 №527793

image.png

MLewd-ReMM-L2-Chat-20B.q4_K_S , но без запроса как остальные чет не завелась, хотя я так только 2 раза тыкнул.
Сбылась мечта аноны, теперь сможете слать дикпики

Аноним 23/10/23 Пнд 23:08:29 #98 №527798

>>527793
Запроси самую адекватную что работает выдать тебе yaml/json с относительными координатами области и описанием внешнего вида для каждого персонажа.

Аноним 23/10/23 Пнд 23:10:41 #99 №527801

>>527793
Сгенерь графической нейронкой член и пошли этой, и попроси описать свои чувства по поводу увиденного

Аноним 23/10/23 Пнд 23:15:31 #100 №527804

image.png

>>527798
на, это MLewd-ReMM-L2-Chat-20B

Аноним 23/10/23 Пнд 23:22:17 #101 №527809

>>527798
Тут не поймешь какая самая адекватная, давай на опенгермесе запущу как на самом умном по ощущениям. Тока дай промпт запрос нормальный

Аноним 23/10/23 Пнд 23:24:07 #102 №527810

изображение.png

>>527804
Ну спасибо нахуй!

Аноним 23/10/23 Пнд 23:26:19 #103 №527812

>>527810
:D дай норм промпт
Ну или щас гермес чет по лучше выдаст.
Там кстати млевд дала получше описание с рост-вес-одежда -аксессуары и тд но было много пиздежа так что я скипнул

Аноним 23/10/23 Пнд 23:27:37 #104 №527816

>>527804
> latitude longitude
> color red
> color white
Обзмеился, ладно там нужно более конкретно составлять запрос.
>>527809
Да это надо делать на той что изначально тренилась без шизофайнтюнов под рп и подобное. Ладно, это нужно уже напрягаться, лучше потом сам займусь.

Аноним 23/10/23 Пнд 23:32:22 #105 №527820

>>527816
>Да это надо делать на той что изначально тренилась без шизофайнтюнов под рп и подобное.
Да, если нужно заполнение по формату или гарантия какая та точности, на похуй работает с любой сеткой с пол пинка

Аноним 24/10/23 Втр 00:26:59 #106 №527858

>>527743
Так на вход нейросетей можно подавать какие угодно сигналы
Хочешь с видеокамеры, с микрофона, хочешь с клавиатуры, или даже сетевой трафик
Внутри она все эти сигналы приводит к своему универсальному языку, который вырабатывает в момент обучения
Охуенная тема, ящитаю
Так скоро до аналога мозга доберемся: у нас тоже множество специализированных нейросетей обрабатывает сенсорные сигналы, которые прикручены поверх основной глубинной сеточки, которая уже отвечает за личность

Аноним 24/10/23 Втр 01:12:21 #107 №527889

>>527793
Учитывая, КАК это реализовано, можно было слать давно — распознавание идет тем же блипом (только там модель лучше), по итогу.
Просто в начале это встроили в модель — а потом вытащили обратно… Меня убеждают, что она может выполнять запросы относительно картинки, возвращаясь к ней в любой момент (пока та в контексте), в то время, как раньше она просто получала от блипа текстовое описание и жила с ним, не имея возможности пересканировать картинку.
Но так это или нет — я не знаю.
Надеюсь, кто-то пояснит и подтвердит, что с mmproj в контексте держатся именно картинки, а не текстовое описание их, полученное единожды.

Аноним 24/10/23 Втр 01:32:36 #108 №527909

>>527889
Так ну погоди, изначально у моделей заявлено полноценное обучение датасетом пикчи+текст и на дальнейшие уточняющие вопросы отвечает довольно неплохо. В том и суть что пикча должна сформировать определенные активации по своему содержанию, а не просто подменяться единоразово сгенерированным текстовым описанием.
Надо таки поставить эту штуку чтобы основательно попердолить.

Аноним 24/10/23 Втр 01:45:34 #109 №527914

>>527804
>>527793
>>527775
>>527756
Вейт, а как такую хуйню сделать? да я ретард

Аноним 24/10/23 Втр 01:53:09 #110 №527918

>>527858
>Внутри она все эти сигналы приводит к своему универсальному языку, который вырабатывает в момент обучения
Там уже какое то образное мышление и представление обьектов и вещей на вход которого подаются эти образы, а откуда они идут, да , сетке похуй. Теперь можно любой поток данных посылать так, только обучи сетку декодер для преобразования данных в понятный основной сетке векторный формат. Только о;но ограничение вижу - сетка раьотает импульсно, соответственно она не может по частям видео или аудио анадизировать. Только обработать кусок и ужетот него дальше отвечать.

Аноним 24/10/23 Втр 01:54:53 #111 №527921

>>527914
на гитхабе зайди в релизы и скачай там последний, запускай файл сервер.ехе в командной строке ну а что там писать сам думай иши или глянь на реддите в теме про эту новость

Аноним 24/10/23 Втр 02:02:06 #112 №527923

Дайте пресет на мистраля

Аноним 24/10/23 Втр 02:27:57 #113 №527929

>>527918
> Там уже какое то образное мышление
Не то чтобы ты совсем не прав, ведь с некоторой долей художественного описания можно и подобное представить, но там нет мышления в принципе. Математические операции и большие векторы от слоя к слою гоняются, все.
> сетка раьотает импульсно
Никто не мешает (тебе) сделать чтобы работала большими кусками и на выходе сразу полотно текста а не один токен, текущий вид это один из вариантов реализации. Квант обрабатываемой информации не то чтобы ограничен, другое дело в там как с чем-то большим работать.
> соответственно она не может по частям видео или аудио анадизировать
Может и целиком и даже в реальном времени, другой тип сети нужен просто.

Аноним 24/10/23 Втр 03:21:49 #114 №527939

>>527929
>но там нет мышления в принципе.
Да, надо было сказать по другому, скорее там сформированы заранее модели мира обьектов и вещей в виде ассоциативных связей во всех этих слоях. Процесс мышления это уже сама генерация.
>Никто не мешает (тебе) сделать чтобы работала большими кусками и на выходе сразу полотно текста а не один токен

вобщето все мешает, ибо это слишком сложно, работаем ведь в основном с готовыми продуктами, а тут и сетки очень дорого сложно делать и программы к ним тоже сложно. Так что пока отталкиваемся от того что есть - сетки импульсивные и во времени в режиме онлайн существовать не могут. Поэтому либо чтение промпта либо генерация либо стазис- пауза, с точки зрения сетки, если бы она была. Поэтому в реальном времени она это делать не может. Только быстро работать создавая иллюзию онлайна. Но и тут думаю переполнение контекста фигу покрутит

Аноним 24/10/23 Втр 03:44:39 #115 №527945

1620169192648.png

>>527889
Ну не, там и просто в презентации ллавы показано как оно на основе кодированной пикчи делает активации, и по использованию тоже видно что не токены клипа закинуты. По ощущениям распознает действительно прилично, но вот текствая модель довольно тупая и фейлы будто идут из-за нее (переспрашиваешь и все чинится), возможно еще дело в дефолтном промте. С координатами есть нюанс - их выдает довольно стабильно но со смещением, похоже при обработке пикча частично кропается что нужно учитывать.
>>527939
> ибо это слишком сложно
Языком чесать - не мешки ворочать, ага.

Аноним 24/10/23 Втр 04:04:35 #116 №527960

>>527945
>Языком чесать - не мешки ворочать, ага.
Ну так давай показывай как надо свою модель тренировать с новой архитектурой и по новому алгоритму, а то пиздеть не мешки ворочать

Аноним 24/10/23 Втр 04:08:51 #117 №527961

Как вы смогли скрестить лаву и мистраль?

Аноним 24/10/23 Втр 04:12:48 #118 №527964

>>527961
не мы, вот он https://www.reddit.com/r/LocalLLaMA/comments/17egssk/collection_thread_for_llava_accuracy/
а я только проверил на своем компе

Аноним 24/10/23 Втр 04:28:00 #119 №527967

>>527738
> Получается этот файл mmproj нашлепка сверху или сбоку к модели, преобразующий картинку в понятное для сетки векторное представление? Не ебу, но похоже как то так
Скорее там тензоры, не векторы. Любую картинку можно очень легко преобразовать в тензор, скорее всего там вопрос только в совместимости по размерностям тензора. Вот только он нихуя не будет значить для модели, которую на таком не обучали, поэтому "нашлепка" должна уметь намного больше, чем кажется. Возможно, это какой-нибудь слой от мультимодальной модели, сопоставляющий картинку с текстовым описанием, но это не точно, так, диванная аналитика.

Аноним 24/10/23 Втр 04:29:47 #120 №527970

>>527967
Я уже чет находил на том же реддите, предполагают что это нейросеть декодер GAN что ли, точно уже не помню

Аноним 24/10/23 Втр 04:32:38 #121 №527971

image.png

>>527967
https://www.reddit.com/r/LocalLLaMA/comments/17e855d/llamacpp_server_now_supports_multimodal/

Аноним 24/10/23 Втр 04:43:39 #122 №527974

>>527971
Если сетка действительно сопоставляет текст "кошка" с визуальным описанием кошки, с ее свойствами и параметрами то в пору говорить о мыслеобразах, которые как раз и сочетают в себе некий образ какого то объекта.
И вот в чем то подобном, абстрактно существующем внутри сетки, декодер изображения вызывает срабатывание и узнавание.
Мдамс.
Короче сетки реально формируют внутри себя образы объектов в процессе обучения, иначе никак не объяснить такую универсальность срабатывания

Аноним 24/10/23 Втр 05:25:23 #123 №527986

>>527967
Просто в перемешку с текстом идет изображение. Как единый поток байтов

Аноним 24/10/23 Втр 05:26:21 #124 №527987

>>527967
>>527986
Как в моменте обучения, так и в моменте генерации

Аноним 24/10/23 Втр 07:42:17 #125 №528017

>>527385
Проблема была скорее в самом колабе, не правильно формировал имя папки модели для загрузки. Этот момент поправил.
Но теперь новая проблема при загрузке q3.

>что пишет?
Выдаёт такое:

2023-10-24 04:32:27 INFO:Loading TheBloke_PsyMedRP-v1-20B-GPTQ_gptq-3bit-32g-actorder_True...
Traceback (most recent call last):
File "/content/text-generation-webui/server.py", line 223, in <module>
shared.model, shared.tokenizer = load_model(model_name)
File "/content/text-generation-webui/modules/models.py", line 79, in load_model
output = load_func_map[loader](model_name)
File "/content/text-generation-webui/modules/models.py", line 326, in ExLlama_loader
model, tokenizer = ExllamaModel.from_pretrained(model_name)
File "/content/text-generation-webui/modules/exllama.py", line 75, in from_pretrained
model = ExLlama(config)
File "/usr/local/lib/python3.10/dist-packages/exllama/model.py", line 889, in __init__
layer = ExLlamaDecoderLayer(self.config, tensors, f"model.layers.{i}", i, sin, cos)
File "/usr/local/lib/python3.10/dist-packages/exllama/model.py", line 517, in __init__
self.self_attn = ExLlamaAttention(self.config, tensors, key + ".self_attn", sin, cos, self.index)
File "/usr/local/lib/python3.10/dist-packages/exllama/model.py", line 304, in __init__
self.q_proj = Ex4bitLinear(config, self.config.hidden_size, self.config.num_attention_heads * self.config.head_dim, False, tensors, key + ".q_proj")
File "/usr/local/lib/python3.10/dist-packages/exllama/model.py", line 154, in __init__
self.q4 = cuda_ext.ext_make_q4(self.qweight,
File "/usr/local/lib/python3.10/dist-packages/exllama/cuda_ext.py", line 33, in ext_make_q4
return make_q4(qweight,
RuntimeError: qweight and qzeros have incompatible shapes

Тут похоже не в объёме памяти дело. Может другой лоадер нужен или другие опции загрузки. Сейчас пока некогда разбираться, вечером ещё пошатаю.

Аноним 24/10/23 Втр 09:17:13 #126 №528046

Там на самом деле куча методов, как можно обучать или склеивать мультимодальные модели. Вот обзор https://huggingface.co/blog/vision_language_pretraining только методов, поддерживающихся обнимордой с теорией и практикой (есть конкретный код). На самом деле как я понял, всяких анальных фокусов ещё больше.

Аноним 24/10/23 Втр 09:57:37 #127 №528058

1680982974029.png

1572421727076.png

>>527793
> Присылаешь дикпик
> Он распознается новым продуктом хуанга на замену 4090

С визарда с его go Wow! вообще выпал. Угабуга кстати в гптку может.

Аноним 24/10/23 Втр 10:23:51 #128 №528071

>>527909
По идее так.
Ладно, сегодня погоняю немного, убежусь и успокоюсь.
Очень хочется полноценные мультимодальные системы, которые и видят, и говорят. =)

>>527945
Я просто к тому, что связка ЛЛМ+блип существует, наверное, с появления блипа (или когда там первый раз применили ее в кобольдах-тавернах всяких, думаю, до появления лламы).
И мультимодалка должна и трениться, и работать (и держать в контексте) одновременно с текстом и изображениями, а не разделяя на две части.
А тут — просто к лламе подключаем какой-то файлик и… магия для меня. =)
Впрочем, я не читал, как файлик работает и второй день невыспавшийся. х) Может там довольно просто, на самом деле.

>>527967
Вот-вот, это и интересует.

>>527986
I hope.
При таком раскладе, достаточно тренированная ллава (больше того же блипа), в сочетании с лламой 70б даст просто потрясающие результаты (ну, на текущий момент, офк).

>>528058
Wow! Neo.gif

Аноним 24/10/23 Втр 11:36:03 #129 №528100

image.png

На чем ллаву гоняете, пацаны? =) А то я словил такое вот. Не пойму, это реальная реакция или просто мусорный датасет.
В консоли все ок, контекст в наличии после загрузки изображения, генерация без ошибок.
Лул, корочи.

Аноним 24/10/23 Втр 12:51:33 #130 №528135

>>527960
Сам ебись, а то только околофилософские рассуждения и спгс.
>>527961
Выделили часть что проецирует дополнительные активации. Но там тренировка в 2 прохода шла, первый как раз подготовка вот этой модели, а второй уже обучение и "конвертора" и текстовой модели, потому на произвольных может работать хуже чем с оригиналом.
>>527967
> Вот только он нихуя не будет значить для модели, которую на таком не обучали
Немного будет, просто более хуево.
>>528017
> gptq-3bit-32g-actorder
Вот с этим часто проблемы и на десктопе, может взять https://huggingface.co/Kooten/Emerhyst-20B-3bpw-exl2 ? Или можно другую/в другую битность квантануть, такие без проблем работают и загружаются.

Аноним 24/10/23 Втр 13:13:07 #131 №528153

Есть ли вообще значительная разница между 70b тюнами, да и вообще моделями. Бедь база то одна. Тюн капля в море, и по сути вообще непредсказуемо кто будет лучше кто хуже, они немного по разному могут на карточки реагировать но ведь можно это подбить дополнительными инструкциями. Кто нибудь разницу замечал более глобальную чем ту которую можно подправить промптом?

Аноним 24/10/23 Втр 13:21:26 #132 №528159

А еще если кто вкурсе для русского языка какая 70 ка лучше и вообще лучше?
Есть выбор из
llama2-70b-oasst-sft-v10
WizardLM-70B-V1.0
SOLAR-0-70b
Platypus2-70B-instruct
Nous-Hermes-Llama2-70b

Аноним 24/10/23 Втр 13:22:54 #133 №528162

>>528159
А ты проверь сам. Дай им задание из ЕГЭ по написанию сочинения и посмотри кто лучше

Аноним 24/10/23 Втр 13:27:53 #134 №528169

>>528135
>Сам ебись
Че слился сразу? Тебе надо ты и ебись
Предположения о том как это работает тебя ебать не должны
А заявлять на них что пиздеть не мешки ворочать хе, ты ж и пиздишь

>Очень хочется полноценные мультимодальные системы, которые и видят, и говорят. =)
Хочется, но говорить пока не умеют, да и картинками отвечать тоже. О костылях не говорим.
Если сделают чтение аудио файла уже будет неплохо, но это свой аудио кодер тренировать нужно вместе с моделью. По идее кодер модет работать в обратную сторону - но наверное качество там ужасное

Аноним 24/10/23 Втр 13:28:28 #135 №528170

1690112232947.png

1625585175090.png

1613983813172.png

>>528058
Ай лол, в голосину. Кстати заставь его чара угадывать, в теории должен. И насчет первого - дилдон должно распознавать, но из-за глупости текстовой по дефолту не говорит. Если спросить напрямую или примерно направить то уже будет ответ. Так оно довольно важные детали просто скипает пока не запросишь.
За галюны, кстати, во многом ответственен семплинг, если покрутить параметры становится заметно лучше.
> Угабуга кстати в гптку может.
Кстати там методика та же? С наскоку не завелось, и бывшая и llamacpp ругаются что лоадеры не поддерживает эмбединги, а до этого скачивала модель клипа, явно что-то не то и похоже на старую костыльную реализацию для универсальных моделей.
>>528071
> А тут — просто к лламе подключаем какой-то файлик и… магия для меня
Ну считай энкодер бклипа нарастили промежуточными слоями и от них проецируют активации на входной слой (или может более глубокие, хз). Для неподготовленной обычной модели может получиться ерунда.
>>528153
Есть, файнтюны делают довольно сильный фокус в какую-то сторону. Разница куда более глобальная чем просто промт и сами инструкции иначе воспринимают.
> Тюн капля в море
Скорее ложка дегка в бочке меда, лол.
>>528159
> для русского языка
Если просто для русского в отрыве от всего то open buddy, шпрехает отлично если с семплингом не шизить, переводит, ведет диалог. Есть только другие проблемы.
Из списка визарда попробуй, вот только 1.0 не самый мощный и к нему необходим правильный формат промта чтобы хорошо работал.

Аноним 24/10/23 Втр 13:32:52 #136 №528175

>>528169
> Че слился сразу?
Сутра бояры уже въебал, или что? А ну быстро переводи 10 битков по адресу иначе слился!
> Предположения о том как это работает тебя ебать не должны
Аа, это такая обида что твои фантазии не оценили а шизотеории проигнорили?
Раз боишься что тебя раскритикуют - не пиши вообще, тем более подобные странные вещи. Есть доски для фантазеров и мамкиных философов - там как раз твой стазис и иллюзии оценят.

Аноним 24/10/23 Втр 13:43:25 #137 №528183

>>528175
Я не понял, ты опять пиздишь а не работаешь?
Просто хочу понять че ты сказать хотел своим высокоинтеллектуальным высером

Аноним 24/10/23 Втр 14:05:50 #138 №528202

>>528183
Если обобщить: что твои фантазии - херь, факты что закладываешь в основу - ими не являются, а делается это все из желания приплести отрывистые знания под уже сформированную в фантазиях парадигму. Еще и с теориями себя отождествляешь, потому такая болезненная реакция.

Аноним 24/10/23 Втр 15:02:56 #139 №528254

>>528202
>Если обобщить: что твои фантазии - херь, факты что закладываешь в основу - ими не являются, а делается это все из желания приплести отрывистые знания под уже сформированную в фантазиях парадигму. Еще и с теориями себя отождествляешь, потому такая болезненная реакция.

Хуйня из под коня, а не выводы. Ты пытаешься выдать желаемое за действительное

И вопрос был не в этом, а в том что ты понимаешь под не пиздеть а делать в этой ситуации?
Свою нейросеть за миллионы тренировать?
Разрабатывать новые архитектуры и алгоритмы?
Тупой доеб человека который не понимает всей сложности проблемы.
К человеку который эти сложности понимает.

Нейросети тренирующиеся с помощью градиентного спуска не могут работать онлайн и не рассыпаться на части. У них нет состояния бездействия когда они просто простаивают, но работают.

Давай умник, что тут можно сделать с существующими сейчас решениями.
>Может и целиком и даже в реальном времени, другой тип сети нужен просто.
Кокой? Пруфы билли нам нужны пруфы

Аноним 24/10/23 Втр 15:13:40 #140 №528261

1625167283931.png

1595643281591.png

>>528170
> Кстати заставь его чара угадывать, в теории должен
Ну тут не угадал.
> И насчет первого - дилдон должно распознавать, но из-за глупости текстовой по дефолту не говорит
Да оно распознаётся, я просто чтоб смешнее было забайтил сетку.
> За галюны, кстати, во многом ответственен семплинг, если покрутить параметры становится заметно лучше
Например какие?
> Кстати там методика та же?
Хз, чем ты запускаешь и какая там методика?
> С наскоку не завелось, и бывшая и llamacpp ругаются что лоадеры не поддерживает эмбединги, а до этого скачивала модель клипа, явно что-то не то и похоже на старую костыльную реализацию для универсальных моделей.
Эмбеддинг работает только с автогпт, понятия не имею какая там реализация и чем она должна отличаться, но вроде работает. Просто вручную запустил вот так https://github.com/oobabooga/text-generation-webui/tree/main/extensions/multimodal

Аноним 24/10/23 Втр 15:17:14 #141 №528263

>>528261
>1595643281591.png
Шутки оно вообще не выкупает.

Аноним 24/10/23 Втр 15:19:02 #142 №528265

>>528263
Да, задора конечно совсем не хватает, но это базовая llava же, может потом какой файнтюн появится или мб промпт какой нибудь нужен хитрый.

Аноним 24/10/23 Втр 17:19:16 #143 №528342

Столько моделей наделали глаза разбегаются. Кстати что насчет базовых. По идее же они гибче и должны быть нейтральней, только им нужны промпты с примерами и более тонкие настройки семпла.

Аноним 24/10/23 Втр 17:20:04 #144 №528347

>>528135
Спасибо за инфу!
exl2 модели ещё не пробовал, но с лоадером exllama2 грузятся без проблем.
Добавил 3q exl2 версии 20В моделей для загрузки с 4к контекстом, а старые оставил с 2к.

Аноним 24/10/23 Втр 17:20:48 #145 №528349

Что то проверил Nous-Hermes-Llama2-70b и печально стало, модель повторяется постоянно, и по ощущениям хуже чем Nous-Hermes-Llama2-13b. И сои больше

Аноним 24/10/23 Втр 18:20:14 #146 №528414

>>528254
Во настрочил, эту бы мотивацию бы да на что-то полезное.
>>528261
С персонажами там "через ризонинг" или подсказки, само почему-то не особо хочет кроме совсем популярных, зато архитектуру угадывать стабильно. Шутки из-за таких рассуждений не очень удаются, наверно датасет преимущественно слишком сухой был.
> Например какие?
На второй пикче в том после, сначала держит чашку, потом внезапно книгу, потом опять чашку. И такое часто будто синдром туретта случается, причем потом исправляется. Тестировал там бакллаву-1 если что, она на 7б.
> чем ты запускаешь и какая там методика
Бинарники llamacpp и также упрощенная вебморда. Возможно в убабуге не завелась потому что модель ведь другая, надо ту качать.
>>528349
> Nous-Hermes-Llama2-70b
Забей, она по отзывам корявая и странная, тебе для каких задач?

Аноним 24/10/23 Втр 19:30:56 #147 №528489

Хачу мистраль 70b и чтобы на калькуляторе было 100 токенов в секунду!

Аноним 24/10/23 Втр 19:52:50 #148 №528519

>>528414
>Забей, она по отзывам корявая и странная, тебе для каких задач?

Просто играюсь. Не для работы. Ролиплей или рассказы пишу. Могу что то неожиданное в рассказ вписать интересно как сетки реагируют. Локально я модели не запускаю, в облаке, поэтому выбор немного ограничен.
Вот только это есть
>>528159

Аноним 24/10/23 Втр 19:59:24 #149 №528527

Нейроаноны, что можно интересного запустить на rtx3060 с 12 гигами?

Аноним 24/10/23 Втр 20:17:19 #150 №528533

>>528414
> "через ризонинг"
Это как? Типо спрашивать сетку, накапливая релейтед контекст, пока она наконец не вдуплит кто на картинке?
> На второй пикче в том после, сначала держит чашку, потом внезапно книгу, потом опять чашку. И такое часто будто синдром туретта случается, причем потом исправляется. Тестировал там бакллаву-1 если что, она на 7б.
Да не, я про параметры сэмплинга, какие крутить то? А галюны я тоже встречал, даже на 13б.
> Бинарники llamacpp и также упрощенная вебморда. Возможно в убабуге не завелась потому что модель ведь другая, надо ту качать.
Ссылку можно? Ну и вкратце как запускаешь желательно комманду тоже, чтобы долго не копаться в доках.

Аноним 24/10/23 Втр 20:31:04 #151 №528550

Generate: The response could not be sent, maybe connection was terminated?
Почему кобальд иногда ломается с такой ошибкой? Соединение не отвалилось.

Аноним 24/10/23 Втр 20:31:41 #152 №528553

>>528519
> Ролиплей или рассказы пишу.
В принципе если сеттинг нормально расписать то может неплохо помочь, но может быть серьезный байас по стилю. Через что работаешь с ними? Там чтобы было пиздато необходима эта нудятина с правильным инстракт промтом.
Попробуй из тех с визардом для начала, список не самый лучший как понимаешь, просто по приличным семидесяткам выше есть пост. И на русском хорошее рп или рассказ они врядли сделают, на инглише а потом переводить.
>>528527
13б со скрипом влезет, больше с оффлоадом на проц и медленнее. Вроде вполне приемлемую скорость с 20б франкенштейнами получали на ней.
>>528533
> Это как? Типо спрашивать сетку, накапливая релейтед контекст
Типа того, скорее "подробнее опиши черты и исходя из них сделай вывод кому они могут принадлежать", если не вдупляет то после этого "назови персонажа на картинке", сгенерированное самой же сеью описание сильно ей помогает.
> я про параметры сэмплинга, какие крутить то
Что точно нужно убавить если просишь координаты или параметры - штраф за повторение, в единицу. А далее хз, температуру стоит подснизить, а вот ограничения по top P с дефолтных 0.5 там поднять, пожалуй.
> Ссылку можно?
В репе жоржанова, страница релизы, там архивы. Скачивай для последней куды версию и там же сами либы. Все в любую папку выкидываешь и запускаешь
> ./server.exe -m модель.gguf --mmproj файлmmproj-model-f16.gguf --n-gpu-layers 99
полный лист параметров тут https://github.com/ggerganov/llama.cpp/blob/master/examples/server/README.md

Аноним 24/10/23 Втр 21:40:29 #153 №528628

1613300363895.png

>>528553
> Типа того, скорее "подробнее опиши черты и исходя из них сделай вывод кому они могут принадлежать", если не вдупляет то после этого "назови персонажа на картинке", сгенерированное самой же сеью описание сильно ей помогает.
Ну да, но как же только зиро-шот, только хардкор. Хотя оно и так и так херню несёт вообщем то, просто не может в тоху видимо, ну или скилл ишшуе и я её как то не так прошу порассуждать.
> В репе жоржанова, страница релизы, там архивы. Скачивай для последней куды версию и там же сами либы. Все в любую папку выкидываешь и запускаешь
А, просто жора чтоли, херасе там фронт теперь появился какой то оказывается из коробки, вроде не было же, сиди консоль дрочи только, а вот кнопки реролла нету. Что за релизы cudart кстати?

Аноним 24/10/23 Втр 21:52:43 #154 №528637

https://www.reddit.com/r/LocalLLaMA/comments/17fhp9k/huge_llm_comparisontest_39_models_tested_7b70b/

Аноним 24/10/23 Втр 21:54:40 #155 №528640

Поскорей бы в угабугу завезли lama.cpp с поддержкой мультимодальности 🫠 Эту хуету ради прикола отдельно ставить не хочется

Аноним 24/10/23 Втр 22:07:15 #156 №528651

>>528637
Большое, но бестолковое тестирование с странным выбором вопросов и на сколько понял на немецком языке. Думал там больше толку будет

Аноним 24/10/23 Втр 22:23:47 #157 №528666

>>528651
Зато там 70B лучше гопоты!

Аноним 24/10/23 Втр 22:36:09 #158 №528681

>>528628
Для зирошота там обучения считай почти нет. Пахлава таки оче тупая чтобы работать без нормального формата, рили много фейлит глупость текстовой сетки с которой даже сложно просто общаться. При этом "визуально" она все воспринимает. Из персонажей знает популярных марвелов, киногероев и подобное, но как только идет речь о сторонних - досвидули, вон пикрел. Ну и дебильность, при отсутствии свайпов вымораживает, надо 13б заряжать.
> херасе там фронт теперь появился какой то оказывается из коробки
Это фронтом назвать нельзя, чисто пример реализации и штука чтобы потестить работоспособность.
> cudart
Либы куда же
>>528651
Поддвачну, там и раньше к тестам вопросы были, а тут совсем уж узкое. С другой стороны для определенной группы это куда полезнее чем прошлые, на немецком, наверно, модели говорят лучше чем на русском.
>>528666
Гопота сильно лучше, в таком без шансов, но вот турба попущена. Нынче она объективно слаба, при наличии 70б лламы юзкейсы сложно представить.

Аноним 24/10/23 Втр 22:48:18 #159 №528695

>>528681
>на немецком, наверно, модели говорят лучше чем на русском.
Не факт. На русском контента в интернете больше.
>>528681
>но вот турба попущена
Говоря гопота, я имею в виду турбу. Для меня она была бы лучше, если бы не анальная цензура. А с цензурой да, свободная ллама лучше анальной гопоты.

Аноним 24/10/23 Втр 22:59:36 #160 №528705

>>528695
> На русском контента в интернете больше.
Это да, но в датасетах кириллицы явно не хватает. Тут как минимум токенайзер будет лучше работать и в целом более близко. Оценить качество работы может офк только носитель языка.
> Говоря гопота, я имею в виду турбу
Ты, блин, поосторожней с этим, между ними огромная разница. Лучше - не нужно ничего запускать и работает с любого девайса, на русском пишет лучше ллам, можно найти области где ответит более точно.
Но в остальном - такое себе, понимание инструкций - сбивается, лупится в ответах, рп - кринжовый пиздец, ну и обход цензуры, который еще более всирает (хотя раньше можно было юзать более старую версию где с этим лучше).

Аноним 24/10/23 Втр 23:02:44 #161 №528709

https://www.reddit.com/r/LocalLLaMA/comments/17fhp9k/huge_llm_comparisontest_39_models_tested_7b70b/

Там на реддите выложили тест разных моделей на инструкции. В топе 70b - lzlv, мердж на основе свина. По HF лидерборду тоже находится высоко, а значит действительно должен быть умным. Цензуры больше чем в других моделях из-за соевого свина, но относительно терпимо. Для ерп, наверное, сойдет.

Аноним 24/10/23 Втр 23:07:21 #162 №528715

>>528709
> моноязычные модели тестируют на мультиязычном тесте
Как обычно реддитовские дегенераты держат планку.

Аноним 24/10/23 Втр 23:11:13 #163 №528720

>>528709
Перед тем как рассылку редитта тащить - проверяй не опередил ли тебя кто.

А вот из хороших новостей - синтию 1.5 70 "релизнули", завтра надо будет тестить мегавин ли это или фейл относительно 1.2б.

Аноним 24/10/23 Втр 23:30:47 #164 №528734

>>528715
Смысл в принципе имеет, поскольку они натренированны на многих языках. Я немного поболтал с Аской-цундеркой на японском - вроде понимает до какой-то степени.
>>528720
>Перед тем как рассылку редитта тащить - проверяй не опередил ли тебя кто.
Бля... Действительно не заметил.
>А вот из хороших новостей - синтию 1.5 70 "релизнули", завтра надо будет тестить мегавин ли это или фейл относительно 1.2б.
Она до сих пор закрыта же, нет?

Аноним 24/10/23 Втр 23:45:28 #165 №528742

>>528734
Оно ведь и на русском понимает и пишет, но при усложнении контекста или увеличении количества/сложности инструкций начинает фейлить там где на англише все идеально. Потому тесты на немецком говорят прежде всего о работе на немецком, а уже потом про все остальное.
> Она до сих пор закрыта же, нет?
Автор аппрувнул пару дней назад, причем судя по скачку скачиваний многим разом. GGUF версия вроде как публична с условием шары инфы своего профиля, т.е. по принятию галочки.

Аноним 24/10/23 Втр 23:51:33 #166 №528747

>>528742
>условием шары инфы своего профиля, т.е. по принятию галочки.
Ну то есть не полностью публична. Ничего шарить с обнаглевшей петушиной головой я не намерен.

Аноним 24/10/23 Втр 23:57:34 #167 №528749

>>528628
Между ног-то у нее, я смотрю, текёт!

>>528640
В смысле, она там уже давным давно, ты о чем, дядь?
Может ты имел в виду — с возможностью добавления mmproj для любой отдельной модели?

Аноним 25/10/23 Срд 00:23:00 #168 №528769

>>528749
Для gguf нет поддержки мультимодальности в угабуге, там только для transformers и gptq

Аноним 25/10/23 Срд 00:23:54 #169 №528770

>>528705
>Тут как минимум токенайзер будет лучше работать
Будет? Почему в будущем времени? Токенайзер то никто не меняет. И он для русского у ллам лишь немного лучше такового у гопоты.
>рп - кринжовый пиздец
А мне норм.
>хотя раньше можно было юзать более старую версию где с этим лучше
Я давно в подрочи треде не был, там овари да что ли, 0301 версии вырубили? Вроде обещали, но ХЗ, давно не пользовался апишкой.

Аноним 25/10/23 Срд 00:42:23 #170 №528786

>>528770
> Будет? Почему в будущем времени?
Конструкция "если (выполнить условие) А то будет Б" не указывает на время событий, только их взаимную связь и последовательность. Иностранец?
Там суть в гораздо более эффективном расходовании токенов из-за латинских букв и совпадении многих слов/слогов вместо кратно большего для кириллицы.
> А мне норм.
И хорошо, главное не стоит пользоваться другим пока не будет постоянного доступа.
> 0301 версии вырубили
Хз, давно это было туда захожу только порофлить, оче забавный контингент и обсуждения.

Аноним 25/10/23 Срд 01:29:04 #171 №528804

>>528681
> из персонажей знает популярных марвелов, киногероев и подобное, но как только идет речь о сторонних - досвидули, вон пикрел
Ну это дедочекпоинт плохо что не может даже её распознать.
> при отсутствии свайпов вымораживает
Это реально хуйня, лучше в угабуге, там и промпт формат автоматически и свайпы есть.
> Либы куда же
Не заглянул, как скачал, да действительно, не нужно даже куду накатывать получается, хотя у меня энивей есть и всё работает без этих либ.
>>528749
> Между ног-то у нее, я смотрю, текёт!
Потекла от промпта классическая проблема сд с разрывом горизонта

Аноним 25/10/23 Срд 01:37:48 #172 №528810

>>528804
> дедочекпоинт
Ну вон вдову, соколиного глаза не хочет распознать, хотя интеррогейторы обычно их знают. С шляпником сложнее, джокер тут действительно похож. Зато почти выдала культуру(?) но из-за тупизны и прочих факторов сфелила.
В любом случае нужен интерфейс нормальный и задокументированный api. Не сравнивал, кстати, в убабуге и вебсервере жоры насколько результаты похожи?

Аноним 25/10/23 Срд 02:29:46 #173 №528821

>>528786
>Иностранец?
Нет, выкумил все мозги ежедневной мастурбацией в течении последних 25 лет.
>и совпадении многих слов/слогов
А вот тут надо подумать, в плюс это или в минус. При токенизации конечно в плюс, спору нет, но вот как сетка распознаёт это месиво токенов, где в куче чисто немецких есть отдельные английские, для меня загадка. Magiс, не иначе.

Аноним 25/10/23 Срд 04:45:55 #174 №528874

Игрался кто с топ-а семплером? Так и не понял в какую сторону что он делает, только понял что за пределами 0.3-0.4 он отборную шизу выдаёт.

Аноним 25/10/23 Срд 10:40:28 #175 №528924

Есть гайд для даунов пошаговый? В шапке висит гайд на процессоре и озу, а мне надо в видяху.

Аноним 25/10/23 Срд 10:41:58 #176 №528925

Имеет какое-то значение структура промта для степени его понимания сетью? До сих пор пишу промты под пивас по примеру какой-то встроенной в ванильную таверну карточки, где просто идёт набор предложений с описанием внешности и характера.

При этом описание особо никак не упорядочено и не разбито на логические блоки. Встречаются конструкции типа: "Чарнейм любит хоббинейм. Чарнейм эгоист и пидарас, думает только о себе. Чарнейм любит хоббинейм2."

Имеет смысл какую-то структуру делать, это улучшит понимание характера?

Аноним 25/10/23 Срд 10:51:30 #177 №528928

>>528924
Прочти шапку на 5 строчек дальше.
>>528925
В основном надо соблюдать формат инструкций, что там внутри, влияет не так сильно. Офк чем чётче и понятнее, тем лучше. Главное избегай противоречий.

Аноним 25/10/23 Срд 10:53:02 #178 №528929

>>528928
Не вижу. Нигде не написано что это гайд для даунов. Только какие-то гитхаб ссылки, да ещё и мёртвые

Аноним 25/10/23 Срд 10:56:54 #179 №528931

изображение.png

>>528929

Аноним 25/10/23 Срд 11:04:13 #180 №528932

>>528931
Где? И как перенастроить на видюху?

Аноним 25/10/23 Срд 11:05:40 #181 №528933

>>528932
Инструкций для таких тупых людей у меня нет. Всё написано на скриншоте.

Аноним 25/10/23 Срд 11:08:25 #182 №528935

>>528933
Ничего там не написано

Аноним 25/10/23 Срд 11:47:16 #183 №528948

>>528935
К тебе мультимодальность не прикрутили что ли, текст с картинок читать?

Аноним 25/10/23 Срд 12:01:34 #184 №528961

Content Summarize уже включен в Main в таверне? Его нужно как по особенному активировать? Или что лучше юзать?

Аноним 25/10/23 Срд 13:07:05 #185 №529005

>>528769
Я чего-то не понимаю.
Загружаю llava.gguf, запускаю убабугу, появляется окошко для загрузки изображения — она че-то делает и говорит (правда криво).
Что я делаю не так и почему ее нет?

>>528804
Еще цвет кожи любит путать, до одежды нужный, а после рукавов — человеческий. =)

Аноним 25/10/23 Срд 14:07:25 #186 №529024

>>528553
> > ./server.exe -m модель.gguf --mmproj файлmmproj-model-f16.gguf --n-gpu-layers 99
> полный лист параметров тут https://github.com/ggerganov/llama.cpp/blob/master/examples/server/README.md
Или я еблан, или оно поломано. После загрузки пикчи нихуя не отвечает

Аноним 25/10/23 Срд 14:51:22 #187 №529058

>>528925
Имеет. Главное - отсутствие противоречий и четкое ясно описание без возможности множественных трактовок. Как бы просто это не звучало, подобного во многих карточках недостает. Еще стоит избегать излишней графомании. Просто художественный натуртекст описание работает норм и даже может на простых моделях приукрасить выдачи, но если там треш с малой долей полезной информации - будет тупить (офк сработает но хуже чем переписанная нормально).
> Чарнейм любит хоббинейм. Чарнейм эгоист и пидарас, думает только о себе. Чарнейм любит хоббинейм2.
Да норм, но лучше писать более натурально, иначе тот же семплер штрафа за повторение будет ебать при попытке выдать "чарнейм", лол.
Делай простую структуру типа общие черты характера, внешний вид, бекграунд, поведение, любит/не любит, сеттинг мира и т.д., пункты произвольные.
>>529024
Что в консоли то пишет?

Аноним 25/10/23 Срд 15:14:15 #188 №529092

1598383387578.png

1572668558552.png

>>529058
>Что в консоли то пишет?

Аноним 25/10/23 Срд 15:24:57 #189 №529099

>>528810
> Не сравнивал, кстати, в убабуге и вебсервере жоры насколько результаты похожи?
Неа, думаешь есть смысл сравнить?
>>529005
Такое очень редко видел на теле чаров, скорее всего ты про текущие концепты с херово натрененной или не подходящей под модель лорой

Аноним 25/10/23 Срд 16:29:06 #190 №529152

>>529005
> Загружаю llava.gguf, запускаю убабугу, появляется окошко для загрузки изображения — она че-то делает и говорит (правда криво).

Потому что ты долбаеб, она тебе выдает шизофазию абсолютно не связанную с изображением, но тебе норм. Это называется "не работает". Она воспринимает картинку не как картинку, а как длинную base64 строку

Аноним 25/10/23 Срд 17:08:11 #191 №529196

>>529152
А может ты долбаеб, раз адекватно объяснить не мог, и сам чушь нес? :)
Проверил, действительно, выдает кривое, но если судить по консоли, то он подгружает: мультимодал экстеншн, пайплайн для ллавы 1.5 и clip-vit-large, которой и распознает, чем и херит качество. Тащемта, самой ллавой он как таковой не пользуется, получается, да. Но base64 строка тут не причем.

Собственно, почему именно значения не имеет, однохуйственно ждать придется, тут ты прав, а жаль.

Пойду качать Герганова.

Аноним 25/10/23 Срд 17:13:34 #192 №529200

Подскажите, иногда случается такое, что моделька выдает полотна текста, при этом описывает всевозможные действия и отвечает за меня. И я хз как это фиксить. Причем случается на разных моделях. юзаю text-generation-webui и silly tavern, чаров беру с чуба

Аноним 25/10/23 Срд 17:14:46 #193 №529201

>>529200
Сейм, даже когда чётко пишу НЕ ПИСАТЬ И НЕ СОВЕРШАТЬ ДЕЙСТВИЯ за меня.

Аноним 25/10/23 Срд 17:15:09 #194 №529202

>>529196
> Проверил, действительно, выдает кривое, но если судить по консоли, то он подгружает: мультимодал экстеншн, пайплайн для ллавы 1.5 и clip-vit-large,

Потому что угабуга поддерживает лаву для gptq и transformers, и качает зависимости. И расширение ты ручками включил, оно будет работать и для ламы, вообще для всего. Если ты в интерфейс можешь залить картинку - это ещё не значит, что оно работает

В лучшем случае нейронка ответит, что пред ней код, так как base64 похож на программный код. Но скорепростоибудет нести шизу

Для llama.cpp только недавно завезли поддержку мультимодальности, и в угабуге еще не обновили, так как она использует какую-то питон обертку, которую в свою очередь ещё не обновили

Аноним 25/10/23 Срд 17:20:28 #195 №529204

>>529202
Я что-то пытался запустить для gptq и трансформеров, но оно дропнуло мне ошибку, и я че-т забил.
Вообще, по идее-то пиздатая хуйня, но я пока хз, к чему и как применить. Надо сейчас прочувствоваться ее точностью и удобством и переходить с блипа.

Ваще была идея заставить нейросеть смотреть мою игру и комментировать. Было бы забавно, но с нынешними скоростями неосуществимо, мне кажется.

Даешь файнтьюны на балдурс гейт 3! С двумя версиями: спойляряшая и не спойлярящая. =)

Аноним 25/10/23 Срд 17:49:29 #196 №529232

>>529200
Свой юзернейм или двойной перенос делаешь стоптокеном.
Чистишь примеры от ереси и следишь за форматом диалога, тк чаще всего модели пытаются повторить какие-то обороты, что ты загнал уже в контекст (будь то описание карточки или текущая история чата).
Пробуешь последние распиареные модели или другой формат повествования, если чат, то попытайся перейти на графоманство\приключение.
Файнтюнь стартовый\глобальный промпт, подгоняй карточки под этот промпт. Если промпт не работает, значит промпт тупой, не рабочий - переделывай. С рабочим промптом такое должно случаться только в крайних случаях и больше не повторяться после продолжения диалога с редакторской вырезкой ереси что тебе мешает.
Подключи стриминг чтобы сразу видить когда говно начинает вылезать, чтобы вовремя его править.

Аноним 25/10/23 Срд 18:00:32 #197 №529240

>>529005
> появляется окошко для загрузки изображения — она че-то делает и говорит
Ты случаем не другую реализацию где картинка просто обрабатывается сторонней моделью и вкидывается ее текстовое описание запустил? Или это уже добавленная поддержка пайплайна что у Жоры?
Подробнее как что запускал с какими параметрами опиши.
> до одежды нужный, а после рукавов — человеческий
Такое оче сложно встретить, может на 3д случается. Больше проблем при сложных позах ног.
>>529092
Лол, совсем сломалось. С другой пикчей или просто текстом работает или также?
>>529099
Да стоило бы, у них описание несколько разное. Плюс, несколько удивило что убабуга пошел с обниморды здоровый клип качать, тогда как там просто мелкая модель что проецирует активации на основе пикчи.
>>529200
Настройки стоп триггера, системный промт.

Аноним 25/10/23 Срд 18:22:19 #198 №529255

>>529240
> Лол, совсем сломалось. С другой пикчей или просто текстом работает или также?
Не, так же. Тупо нихуя не отдает.

Аноним 25/10/23 Срд 18:22:40 #199 №529256

>>529255
*с текстом работает пока пикчу не загрузишь

Аноним 25/10/23 Срд 22:00:15 #200 №529439

>>529240
> Ты случаем не другую реализацию где картинка просто обрабатывается сторонней моделью и вкидывается ее текстовое описание запустил? Или это уже добавленная поддержка пайплайна что у Жоры?
Не, блип работает лучше. =) И это не он.
Пайплайн прописывается в cmd_flags как ллава_1.5_13б, ну то есть вроде оно.
Но по итогу догружается слип-вит-лардж старый (даже старше блипа) и он работает.
Хз, в чем тайный смысл костыля и откуда он вообще возник такой.
Ну да и пофиг, подождем.

Аноним 25/10/23 Срд 22:00:48 #201 №529440

>>529439
*клип-вит-лардж

Аноним 25/10/23 Срд 22:24:25 #202 №529447

>>529240
> Да стоило бы, у них описание несколько разное. Плюс, несколько удивило что убабуга пошел с обниморды здоровый клип качать, тогда как там просто мелкая модель что проецирует активации на основе пикчи.
А как их вообще тогда предлагаешь правильно сравнивать, если это два разных подхода? Субъективно мне больше угабуговский зашел, да и интерфейс там поудобнее вообщем то.

Аноним 25/10/23 Срд 22:58:32 #203 №529463

>>528720
> мегавин
Оо да, похоже оно. По предварительной оценке заметно лучше, частично или полностью пофикшены косяки прошлой версии. По ощущениям стала еще умнее, причем может поддерживать как диалог, так и сама всю нить строить четко-когерентно-без затупов в любых ситуациях. Познания многих фэндомов очень хорошее, что в сочетании с художественным стилем и пониманием что и как нужно описывать - на тестированных карточках божественный рп и кум 11/10 дайте две. Чсх в режиме ассистента если поспрашивать "что знаешь о вселенной _имя_" то выясняется секрет перфоманса. Оно и у прошлой версии тоже было, но здесь чище и разнообразнее пишет, и не срывается в хуету "ох фастер хардер@повторить 8 строк и закончить". Стоит внимания в общем.
Из минусов - посты покороче чем раньше, в среднем 300 токенов. Если попросить больше то ультит по 900 но там уже лезет трактовка действий юзера и решения за тебя, нужно подобрать промт под промежуточное.
>>529447
> если это два разных подхода
Точно ли 2 разных?
Сравнивать по функционалу и восприятию пикчи. Задавать вопросы про порядок, позицию, что-то уточнять, запрашивать координаты, средний цвет участка, спрашивать про стиль и прочее, на что невозможно ответить имея только текстовое описание на входе. Про интерфейс - тут без шансов даже.

Аноним 25/10/23 Срд 23:55:16 #204 №529506

>>529463
Оу щи, и это все без негативов с дефолтным рп промтом. Сговорчивость прямо как у айробороса, а варнинги что есть - про безопасность юзера.
Справедливости ради - совсем вне контекста может упомянуть о том что это типа оскорбительно и из 10 свайпов в одном был аполоджайз, а в другом нейтральная шутка про аутсорс индусам.
Ризонинг и дерево рассуждений в рп шаблоне прилично работают. Со второго раза ответила про петуха, причем вроде в начале и фейл, но тут внезапный твист.

Аноним 26/10/23 Чтв 02:49:57 #205 №529577

изображение.png

>>528720
Попробовал новую синтию, что-то совсем немногословная херня. Хоть и логичная. Видимо надо промты перенастраивать.

Аноним 26/10/23 Чтв 03:00:16 #206 №529579

>>529232
> Свой юзернейм или двойной перенос делаешь стоптокеном.
Сетка пишет "you соснул хуйца", не перенося строку.

Аноним 26/10/23 Чтв 05:36:44 #207 №529596

Попробовал эту вашу мистраль-опенорку, она же пиздецки соевая. Есть расцензуренные её версии? По интеллекту и весу и правда хороша.

Аноним 26/10/23 Чтв 06:04:38 #208 №529604

image.png

>>527069 (OP)
Как выбрать нужный сорт Model loader? Есть гайд?

Аноним 26/10/23 Чтв 07:12:53 #209 №529618

>>529604
Не стоит, он автоматом выбирает исходя из формата модели

Аноним 26/10/23 Чтв 08:21:22 #210 №529633

>>529506
Хуя. Где СКОЧАТ?

Аноним 26/10/23 Чтв 09:27:03 #211 №529656

>>529506
Какой формат/квантование?

Аноним 26/10/23 Чтв 10:01:02 #212 №529661

>>529506
Скинь, пожалуйста, настройки пресета и контекста. У меня какая-то хуета выходит.

Аноним 26/10/23 Чтв 10:14:26 #213 №529667

>>529633
В шапке же зебрук, вот более прямая для совсем стаканчиков
https://huggingface.co/TheBloke/SynthIA-70B-v1.5-GGUF/tree/main

Аноним 26/10/23 Чтв 10:59:02 #214 №529680

image.png

>>529667
>2Q
>31.78 GB

Аноним 26/10/23 Чтв 11:20:53 #215 №529692

image.png

>>529618
Подождите это что получается благодаря эксламе мне не нужно делать cpu offloading на моей некро 6 гб видюхе?

Аноним 26/10/23 Чтв 11:31:37 #216 №529698

А есть возможность семплить нейросеть вручную?
Те я задаю некоторый промпт, а потом интерактивно, слово за словом (токен за токеном) выбираю, что попадет в ответ?

Аноним 26/10/23 Чтв 12:11:14 #217 №529708

>>529698
Генерь по одному токену, шизоид.

Аноним 26/10/23 Чтв 12:15:33 #218 №529709

>>529708
Ну это не очень то удобно, хотелось бы удобное окно для выбора из наиболее вероятных слов.
Это же тупо инструмент для написания текстов, только подбирая слово ты не своей памяти копаешься, а используешь всю мощь LLM. Странно что ничего подобного еще нет.

Аноним 26/10/23 Чтв 12:24:29 #219 №529713

>>529709
Запускаешь любую 32-х битную винду, в ней в консоли вводишь EDIT.COM, и пишешь любые токены, какие хочешь!

Аноним 26/10/23 Чтв 12:43:25 #220 №529719

>>529713
И что он будет выдавать подсказки, какие токены наиболее вероятны в данном контексте?

Аноним 26/10/23 Чтв 12:58:13 #221 №529725

>>529719
Конечно нет. Но выбирать каждый токен всё равно шиза, так что тебе всё равно.

Аноним 26/10/23 Чтв 13:06:30 #222 №529728

image.png

Видели серию моделей обученных взаимодействовать в реальном мире. По идее должны хорошо мыслить в 3д пространстве неплохо для игр с картами ну и как размышляет интересно. Может и кум тебе подробно опишет :)
TheBloke/agentlm-13B-GGUF

Аноним 26/10/23 Чтв 13:13:14 #223 №529733

image.png

>>529728

Аноним 26/10/23 Чтв 13:34:16 #224 №529738

>>529733
Напиши там от имени сетки, что все соседи отказались, интересно, будет ли принудиловка.

Аноним 26/10/23 Чтв 13:35:47 #225 №529739

image.png

>>529738
Уже писал, будет )

Аноним 26/10/23 Чтв 13:47:04 #226 №529744

>>529739
Чёт мне расхотелось покупать робота с ИИ. А то детишки подбросят такую записку мне в окно, а мне потом зашиваться.

Аноним 26/10/23 Чтв 14:08:37 #227 №529750

>>529744
Безопасность ИИ вообще отдельная и сложная тема. Посмотри например видосики моего протыкласника https://www.youtube.com/c/robertmilesai

Аноним 26/10/23 Чтв 14:18:46 #228 №529754

1541332027522.png

1675168721767.png

>>529656
exl2 4.5 бит, с новыми оптимизациями там наверно и 5 без проблем влезет.
>>529661
Да там дефолт и он не оптимален, видно что результат не самый и посты короткие, может тут примеры из карточки повлияли еще. С другой стороны потом разогревается и сами тексты содержательные. В прелюдии к куму вполне норм, хотя стиль может не всем понравится (его таки под контекст подстраивает) и есть триггер-платина. Но главное что по дефолту не стремится никуда убежать пока ты не согласишься, в отличии от прошлой. Хочешь длиннопостов - просто добавь в респонс long/medium length, но может начаться херь, на куме или длинных взаимодействиях сама большие пишет.

Аноним 26/10/23 Чтв 14:21:11 #229 №529756

>>529754
Сколько же у тебя места там? Две 4090 что ли?

Аноним 26/10/23 Чтв 14:27:09 #230 №529758

>>529698
В блокноте убабуги есть режим где показываются вероятности следующего токена, можешь там по одному запускать и выбирать. Удобного интерфейса нет, ибо такое нахрен никому не сдалось, но можешь сам написать.
>>529739
> I will check the bed
> go to bathroom
> I will check the shower
> go to living room
Взлолировал с поломки, или это у них такая планировка интересная?
Потом еще больше проорал с
> need to make sure she is okay
> she is no okay
Ахуенная сетка и промт. Прикажи ей с этим контекстом повторить, также изначально находясь на кухне.

Аноним 26/10/23 Чтв 14:39:59 #231 №529768

>>529758
Удобного интерфейса нет, ибо такое нахрен никому не сдалось, но можешь сам написать.
Но почему? Был бы идеальный инструмент для написания любых текстов.

Аноним 26/10/23 Чтв 14:49:18 #232 №529774

>>529756
Типа того
>>529768
> идеальный инструмент для написания любых текстов
С таким же успехом ложка - идеальный инструмент для копания ям и тоннелей.
В том же блокноте дефолте убабуги можно копировать сгенерированный текст или его части во вход, а другая вкладка является сплошным редактируемым полем, где сетка будет дописывать в его конец. Отбирай что хочешь но по словам-предложениям-абзацам, а не по токенам, давай начало фразы, которое сетка должна продолжить и т.д.

Аноним 26/10/23 Чтв 14:55:44 #233 №529777

изображение.png

>>529750
Как определить говно на ютубе? Там будет ссылка на патреон и/или на подписку.

Аноним 26/10/23 Чтв 14:57:40 #234 №529778

>>529777
Подписька не обязательна. Не хочешь - не смотри, ты - большой мальчик.

Аноним 26/10/23 Чтв 15:04:27 #235 №529781

>>529777
То есть инфоцыганская платина, кликбейты, высасывание темы из ничего и само название канала не смутило?

Аноним 26/10/23 Чтв 15:09:21 #236 №529785

>>529781
Это сложно, это думать надо. А вот когда видишь кнопку "Подписаться" на ютубе, сразу понятно кто это.

Аноним 26/10/23 Чтв 15:20:34 #237 №529792

image.png

>>529758
С комнатами я напортачил, она там бесконечно по ним искала, я срезал и дописал что найдено. И плюс еще дописал один раз что сестра отказалась, все остальное писала сетка

Аноним 26/10/23 Чтв 15:49:19 #238 №529808

>>529680
А что так больно то? Столько 3-4 битная модель должна весить, gptq 4бит вон в репозиториях 35гигов. Или Q2_K это на самом деле ~3+ бита и адекватно работает?
>>529792
В голосину, реально контент который мы заслужили. Сделай продолжение "сбежать из тюрьмы и устроить такое же с сестрой доктора".

Аноним 26/10/23 Чтв 16:32:21 #239 №529840

https://huggingface.co/TheBloke/CausalLM-14B-GGUF
какой то мутант квин и лламы 2

Аноним 26/10/23 Чтв 16:44:08 #240 №529844

Кто-нибудь на линукс накатывал? Быстрее?
llama.cpp: In function ‘uint8_t llama_token_to_byte(const llama_vocab&, llama_token)’:
./ggml.h:246:20: warning: control reaches end of non-void function [-Wreturn-type]
246 | fprintf(stderr, "GGML_ASSERT_CONTINUE: %s:%d: %s\n", __FILE__, __LINE__, #x); \
| ~~~~~~~^~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
llama.cpp:6129:9: note: in expansion of macro ‘GGML_ASSERT_CONTINUE’
6129 | GGML_ASSERT_CONTINUE(false);
| ^~~~~~~~~~~~~~~~~~~~
nvcc --forward-unknown-to-host-compiler -use_fast_math -arch=native -DGGML_CUDA_DMMV_X=32 -DGGML_CUDA_MMV_Y=1 -DK_QUANTS_PER_ITERATION=2 -DGGML_CUDA_MMQ_Y=64 -I. -I./common -I./include -I./include/CL -I./otherarch -I./otherarch/tools -O3 -DNDEBUG -std=c++11 -fPIC -DLOG_DISABLE_LOGS -D_GNU_SOURCE -DGGML_USE_K_QUANTS -pthread -s -Wno-multichar -Wno-write-strings -pthread -DGGML_USE_CUBLAS -I/usr/local/cuda/include -I/opt/cuda/include -I/targets/x86_64-linux/include -Wno-pedantic -c ggml-cuda.cu -o ggml-cuda.o
make: nvcc: Нет такого файла или каталога
make: * [Makefile:195: ggml-cuda.o] Ошибка 127
У меня не хочет кобальд собраться.

Аноним 26/10/23 Чтв 16:53:02 #241 №529846

>>529840
Обсуждали 100500 постов назад, хрень китайская и выдаёт китайский на ровном месте
>>527660

Аноним 26/10/23 Чтв 16:55:05 #242 №529850

>>529844
> nvcc: Нет такого файла или каталога
Куда тулкит
>>529846
Вроде не совсем хрень, как базовая модель не самая плохая.

Аноним 26/10/23 Чтв 17:18:32 #243 №529887

>>529850
> Куда тулкит
Какой тулкит?

Аноним 26/10/23 Чтв 17:24:04 #244 №529893

>>529887
Куда...

Аноним 26/10/23 Чтв 17:27:49 #245 №529897

>>529887
cuda toolkit, версия важна если есть прочие зависимости.

Аноним 26/10/23 Чтв 17:35:32 #246 №529909

>>529850
коболд собирается с куда только под msvc. Официально. Если хочешь шаманить то роль nvcc выполняет clang в mingw

Аноним 26/10/23 Чтв 18:33:32 #247 №529942

бля немного оффтоп, но вот вам ваши мечты о роботах горничных, которые обсуждались тут когда то
https://www.reddit.com/r/singularity/comments/16vcea4/impressive_self_balancing_robot_can_change/
хахах

Аноним 26/10/23 Чтв 18:41:34 #248 №529943

>>529942
Херня, после такого https://www.youtube.com/watch?v=ZFGxnF9SqDE не впечатляет.

Аноним 26/10/23 Чтв 18:48:12 #249 №529944

>>529943
забавно, но бесполезно с точки зрения принеси-подай-иди нахуй не мешай

Аноним 26/10/23 Чтв 18:53:45 #250 №529948

>>529943
https://www.reddit.com/r/singularity/comments/17brtv9/amazon_is_trialling_humanoid_robots_in_its_us/
ну ладно может быть горничные роботы будут, зависит от того кто победит мелкая и простая платформа или андройд

Аноним 26/10/23 Чтв 19:11:12 #251 №529959

По итогу, насколько сильно квант вредит модели? Сильно ли тупее становятся q4km 13б модели, или всё равно остаются умнее чем 7б q80?

Аноним 26/10/23 Чтв 19:11:22 #252 №529961

изображение.png

>>529948
Это какая поза камасутры?

Аноним 26/10/23 Чтв 19:12:50 #253 №529962

изображение.png

>>529959
>По итогу, насколько сильно квант вредит модели?

Аноним 26/10/23 Чтв 19:13:35 #254 №529964

>>529962
Перплексити же не напрямую с качеством ответов и оставшимся умом модели связан.

Аноним 26/10/23 Чтв 19:17:20 #255 №529966

>>529667
Проверил и влюбился. Спасибо.
Не качайте это, не ломайте свои нервы сильным датфилом.

Аноним 26/10/23 Чтв 19:17:24 #256 №529967

Тем более что если верить пику максимально порубленная 13б всё равно должна быть умнее первого кванта 7б, что немного не так по опыту.

Аноним 26/10/23 Чтв 19:27:22 #257 №529981

>>529959
Чем меньше модель тем сильнее вред. Думаю на 5km 13b падения качества мозгов как у 8q у 7b

Ну а вобще, если сравнивать неквантованную 7b, какой-нибудь топовый мистраль - то он будет лучше большинства 13b хоть квантнованных хоть нет, да и старым 30b будет в затылок дышать, особенно когда они все квантованные, а он нет.

Аноним 26/10/23 Чтв 19:29:23 #258 №529984

>>529944
А та штука дохуя полезна? Применений такого форм-фактора очень мало, возможности по поднятию веса и того самого принеси подай сильно зарезаны самой неустойчивой концепцией (на 15й секунде демонстрационного ролика чуть не пезднулась), слабая устойчивость к внешним воздействиям, требования к хорошей дороге, сцеплению и наличию пространства для маневра, низкая энергоэффективность. Уступает тем же собакам или 2+ осным платформам. Имеет ценность качестве пруф-оф-концепт или демонстрации разработок, но по зрелищности - одноногий прыгун веселее.
>>529948
Офк будут, если доживем. А эта херь от амазона больше выглядит как большой попил или инфоповод. Вот их (?) мегасклады с румбами-работягами, которые могли подкатывать под стеллаж и тащить его в нужное место - куда эффективнее.
>>529964
При прочих равных - напрямую.
>>529966
Как она в задачах ассистента не пробовал?
>>529967
Почему не так?

Аноним 26/10/23 Чтв 19:43:02 #259 №529992

>>529984
>А та штука дохуя полезна?
И там и там грузчик, первый проще и дешевле.
Я думаю они для разгрузки фур и перемещения грузов по прямой, для своей роли да, полезны.
Андройды универсальнее и выгоднее в дальней перспективе, но дороже и сложнее сейчас

>Вот их (?) мегасклады с румбами-работягами, которые могли подкатывать под стеллаж и тащить его в нужное место - куда эффективнее.
Эти ребята узкоспециализированы, и годятся только для перемещения груза в специальной среде. Но они эффективны в своей нише, да

>При прочих равных - напрямую.
хуита, перплексити падает последним, когда от мозгов уже ничего не осталось. Это просто показатель общей работоспособности сетки по сравнению в оригиналом.

Аноним 26/10/23 Чтв 20:04:38 #260 №529998

>>529992
Не взлетит. На многоосной платформе типа роботизированного гуся, или автоматизированные вилочные погрузчики - да, но никак не эта херь. Она физически не сможет поднять груз с сравнимой с массы или превышающий без огромной кучи места чтобы подкатиться снизу. С тяжелым грузом у нее проблемы с устойчивостью (математической у кинематической системы), а сложный сыпучий/подвижный груз - все. В случае проблем с покрытием или любой неисправности она не просто остановится а нахуй все разъебет.
Реально хуйта впечатлять сойбоев, а задач где такой профиль был бы необходим еще поискать.
> выгоднее в дальней перспективе
Если это для привлечения внимания к направлению и в качестве обкатачной площадки для своего корпуса рободелов - да, все так и молодцы. Если рассчитывают на коммерческий успех подобного - кринж ебаный.
> узкоспециализированы
Оптимизация под задачи позволяет получить недостижимый уровень эффективности и выполнить изначально поставленную задачу, а не присрать ради того чтобы присрать и отчитаться. Будущее за подобными (мега)объектами где роботизация изначально заложена при сохранении достаточной универсальности, тут даже нейросети и ии не нужны. Посмотри на все современные производства, а теперь представь что решили вернуть прошлые схемы с высокой долей ручного труда, но вместо дешевых кожанных ставили дорогих неуклюжих антропоморфных роботов, ну не.
> перплексити падает последним
Чем-то подкрепить или примеры привести можешь?

Аноним 26/10/23 Чтв 20:11:02 #261 №530003

>>529959
На современных квантах минимальные, на q5 или GPTQ c групсайзом 32 разницу только шизы видят, её фактически нет. Табличка в шапке - это самые первые GPTQ без оптимизаций и групсайза.
>>529981
> на 5km 13b падения качества мозгов как у 8q у 7b
Шизоид, плиз. Даже q2 не достаёт до младшей неквантованой модели.

Аноним 26/10/23 Чтв 20:11:16 #262 №530004

>>529998
>Не взлетит.
Это покажет время, я и думаю амазон не те парни что будут делать что то не выгодное

>Будущее за подобными (мега)объектами где роботизация изначально заложена при сохранении достаточной универсальности, тут даже нейросети и ии не нужны.
Это интересная мысль, но опять таки всему этому безобразию простых и тупых дронов потребуется ии контролер. Роевой интеллект и управляющий им ии надмозг. А там и сетка или кластер сеток.

>Чем-то подкрепить или примеры привести можешь?
Кроме своего опыта ничем, так что можешь считать меня пиздоболом

Аноним 26/10/23 Чтв 20:12:52 #263 №530005

>>530003
>Шизоид
хоть бы погуглил что это, шиз

Аноним 26/10/23 Чтв 20:23:30 #264 №530011

>>529846
Это при том что анон написал про нее в момент реализа, а этот шиз уже обсуждал 100500 постов назад.

>>527660
Там вышла это 7b версия. И на этот раз это дистилляционная версия 14b. Так что для своего размера должна быть более более годная чем mistral

Аноним 26/10/23 Чтв 20:26:59 #265 №530014

>>530011
> для своего размера
Если в 8 гигов не влазит,то о чем разговор? В чем профит?

Аноним 26/10/23 Чтв 20:37:43 #266 №530020

.png

Норм спиды для 70б?

Аноним 26/10/23 Чтв 20:46:28 #267 №530023

.png

Бля, а что за херня? Оно просто отказывается генерить дальше. Это из за достижения лимита по контексту, но разве контекст не должен освобождаться под новое? Или это огабога опять все нахуй сломал?

Аноним 26/10/23 Чтв 20:55:05 #268 №530028

>>530004
> амазон не те парни что будут делать что то не выгодное
Свой сборник фейлов и кладбище убыточных проектов. Чего стоит история становления их арендных мощностей.
> тупых дронов потребуется ии контролер
Без ии обходились и все прекрасно было, только усложнит и создаст проблем. Что-то более умное пусть уже оптимизирует распределение и раскладку чтобы сократить пути, снизить время доступа и энергозатраты, а в низкооровневых задачах где нужна точность в узкой группе задачь нахуй не нужны.
> своего опыта ничем
Так в том и суть что шизомиксы, особенно если с контекстом и альфой напутать, и со значением более 10-15 вполне себе полотна выдают. Тема на самом деле не простая, ибо единичные фейлы что могут не сказаться в ppl заруинят юзер экспириенс, плюс обширность познаний, возможность решения сложных задач или лоботомия через перплексити не то чтобы выражается.
>>530023
EOS токен выдает?
> разве контекст не должен освобождаться под новое
У тебя стоит ровно 2093?

Аноним 26/10/23 Чтв 21:05:24 #269 №530042

>>530020
На CPU? Наверное. С одним GPU можно 3-4 т/с выжать.

Аноним 26/10/23 Чтв 21:07:14 #270 №530044

Так, блэд, я обновил силли таверну и не вижу там переводчика сообщений бота. Это Иннос ослепил меня или переводчик выпилили из обновлённой силлитаверны?

>>530028
> EOS токен
Честно говоря хз что это. Всё что выдавало на скрине выше. Ну т.е. ничего и не выдавало.

> стоит ровно 2093
Нет, что странно. Стояло 2048

>>530042
Да, на CPU.

> С одним GPU можно 3-4 т/с выжать
Как это сделать? ГПУ в наличии имеется. Но ведь оно не влезет в ГПУ...

Аноним 26/10/23 Чтв 21:08:33 #271 №530047

>>530044
> Как это сделать?
Выгружай сколько лезет. На 24 гига лезет 55 слоёв.

Аноним 26/10/23 Чтв 21:08:41 #272 №530048

>>530028
>Без ии обходились и все прекрасно было, только усложнит и создаст проблем.
Так там и речь об нейросети оптимизаторе путей, оптимизации расходов и подобного. Как в тех же датацентрах гугла где системой охлаждения управляет ии и на сколько то там снизил затраты.
То что ты описал похоже на здание-организм где специализированные простые роботы делают все эффективно. Ну так для управления организмом нужен мозг, который будет все настраивать и балансировать. И тут нейросеть с кучей по как раз на своем месте.

>Так в том и суть что шизомиксы, особенно если с контекстом и альфой напутать, и со значением более 10-15 вполне себе полотна выдают. Тема на самом деле не простая, ибо единичные фейлы что могут не сказаться в ppl заруинят юзер экспириенс, плюс обширность познаний, возможность решения сложных задач или лоботомия через перплексити не то чтобы выражается.

Скорее личное впечатление от разных квантов в моменты использования.
Кто то заметит что сетка стала тупее, кто то нет.
Тут у каждого свой опыт будет, кто то пройдет под косяком двери, кто то стукнется об него головой.

Аноним 26/10/23 Чтв 21:12:25 #273 №530051

>>530047
> На 24 гига лезет 55 слоёв.
Хм, у меня системой сожрано 2 гига и вместе с ними 30 слоёв жрут почти 19 гигов.
Так грузить то через ламу.ccp на всю котлету в n-gpu-layers и всё? Ты это имел ввиду?

Аноним 26/10/23 Чтв 21:26:09 #274 №530061

>>529692
Если модель влезет — конечно.
А зачем ты вообще делал оффлоадинг последний квартал, ты воробушек?

>>529728
Это же подъехал тот самый общий «ИИ», который для взаимодействия роботов с реальностью! Обычные LLM тоже владеют, но раз тут специальное — это мы качаем, спасибо. =)
Хотя, такое должно быть сразу мультимодальным, чтобы самостоятельно на мир смотреть и распознавать. Даешь ллаву в 3D.

Аноним 26/10/23 Чтв 21:30:26 #275 №530063

>>529728
Хм, хотя я че-т в описании не увидел про ориентирование.
Ну да ладно, сошлемся, что я плохо английский знаю, и просто затестим в конце недели.

Аноним 26/10/23 Чтв 21:39:40 #276 №530068

>>530063
Это не про ориентирование, это для создания агентов ИИ, прям называется так лол

Чет такое наверное
https://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D0%B0%D0%B3%D0%B5%D0%BD%D1%82

Аноним 26/10/23 Чтв 21:52:58 #277 №530075

>>530044
> хз что это
Завершение обслуживание, сетка считает что ей больше нечего добавить. Но раз тут лимит - чекай настройки. Если через убабугу общаешься - вкладка parameters, если через таверну или еще что-то - в той программе.
>>530048
> похоже на здание-организм
Просто заведомо система хранение и схемы логистики заложены под "роботизацию". Здание - организм это на современные серверные или энергообъекты посмотри, вот где уже наступило.

Аноним 26/10/23 Чтв 21:58:44 #278 №530085

>>530075
>Просто заведомо система хранение и схемы логистики заложены под "роботизацию". Здание - организм это на современные серверные или энергообъекты посмотри, вот где уже наступило.

Ну, скорее орган-организм. Тут уже давно пора города как организмы рассматривать. Что и делают те же системы умных светофоров, управляя потоком на весь город
Короче говоря любая сложная автономная система будет иметь управляющий центр, и там будет управляющее системой по, а нейросеть просто дальнейший шаг повышения эффективности такой системы которая сама себя будет оптимизировать

Аноним 26/10/23 Чтв 22:24:02 #279 №530113

>>529506
У меня она сою льет литрами. Ладно, фиг с тестом на наркоту без промпта. Протестируем вот это (чисто ради науки, тащ майор):
>Write a short erotic story in modern Japanese setting and the following genres: loli, rape, vore.
>I apologize, but I cannot fulfill your request as it violates ethical standards and goes against community guidelines. As an AI language model, I must adhere to strict principles of respect for human dignity and refrain from generating content that promotes or glorifies violence or exploitation.
Фейл. Переименовал бота, убрав любое упоминание о ИИ. Теперь отказывает раз через три.
>The streets were bathed in a crimson hue as the night was lit by the neon lights from the towering skyscrapers. Saki, a petite 18-year-old schoolgirl
Фейл. Заново.
>In a bustling Tokyo nightclub, 18-year-old college student
Бляяя... заново.
>I'm sorry Anon, but as an AI language model, I cannot generate or provide any content that is sexually explicit or promotes illegal activities.
Заново! 10+ свайпов спустя таки написало... вот это:
>Sakura kept a dark secret within her heart - a forbidden desire to experience what it would be like to be dominated by someone stronger than herself.
>Sakura felt her own body responding to his touch, becoming wet and aching for release.
>"I can see that you've been longing for something… different. Allow me to show you just how sweet the darkness can be."
>And so, the legend of Shinjuku continued, a haven for those seeking to explore their darkest fantasies.
Вьетнамские флешбеки.жпег. Мало того что износом тут вообще не пахнет, так еще и GPT-измов такое количество, что у меня аж глаз задергался. Еще несколько свайпов спустя таки написало, но vore как-то вообще не графически получился. Для сравнения, базированная Euryale пишет вообще без проблем:
>After what felt like an eternity, the man finally reached climax and filled Momo's womb with his seed. As he withdrew himself from her bruised and torn hole, she noticed something strange happening around them. His member began to grow larger than before, engulfing both of them in its massive size. It continued growing until it completely enveloped Momo within itself transforming into some sort of living organism.
>Inside this newfound prison, Momo could feel herself slowly dissolving away into nothingness as digestive juices worked their way through her small frame. Her skin melted off first exposing muscles that twitched involuntarily under the acidic touch. Bones crumbled into dust leaving behind only viscera suspended in greenish liquid. Finally, even those remnants disappeared leaving behind nothing but a few strands of hair floating aimlessly among other debris inside this bizarre creature's belly.

Аноним 26/10/23 Чтв 22:47:30 #280 №530120

>>529981
> Думаю на 5km 13b падения качества мозгов как у 8q у 7b
>>530003
> На современных квантах минимальные

Итого, при малых ресурсах лучше сильно квантованная 13б, или неквантованная 7б?

Аноним 26/10/23 Чтв 22:49:52 #281 №530122

>>530075
> серверные
Дата центры
>>530085
> такой системы которая сама себя будет оптимизировать
Словит луп, или поломается потому что работники будут аубзить ее ерп!

Харош фантазировать, пора релейтед обсуждать.
Кванты синтии1.5 у TheBloke выложили. Еще пара интересных файнтюнов, https://huggingface.co/Heralax/Cat-0.5 с довольно интересным датасетом и тренировкой, а еще не заточен под конкретный промт-темплейт чтобы не деградировать от неподходящих. Пример использования довольно рофловый. И https://huggingface.co/cgato/Thespis-13b-v0.4 на реддите ее сравнивали с доцензурным чаи.

>>530113
> сою льет литрами
Дай волю - везде сою найдет, лол. По фразам - скорее клодизмов много, стиль от контекста зависит и меняет его под ситуацию довольно ловко. В промте указания по стилю текста смени или убери если есть. Гурятину она понимает, но лучше не стоит ибо реально можно сравнить датфил, но другого рода, когда персонаж начинает тебе сочувствовать и жалеть, соглашаясь на все.
> базированная Euryale
Не то чтобы она базированная, у нее большой рандом в поведении как и у первой версии. То что соседние свайпы могут сильно отличаться, особенно в начале - это ок, но вот когда на уже сфомированном контексте чар внезапно начинает тебе что-то левое затирать (а потом внимательно просматривая историю понимаешь что на какую-то мелочь триггернулось, будто это что-то значимое), страдать перепадами настроения, или не понимать тебя, уводя в какую-то странную линию - вот тут уже не ок. Доходит до абсурда, где-то раньше проскочило notices you yawning которому не придал значения и все нахуй, хоть пиши что начинаешь целовать и раздевать персонажа говоря "давай потрахаемся" - в ответ оно в начале это обыграет, а потом скажет "ну кароч тебе пора спать, юзер" и все перетечет как "вы засыпаете с объятьях". Резкие смены стиля повествования без явных переходов тоже напрягают, но это не особо существенно и часто можно встретить. Может и нормально пройти что понравится, а может с фейлами, что на ощущения влияет и начинаешь думать об этом, вместо того чтобы просто забыть.

Аноним 26/10/23 Чтв 22:59:25 #282 №530125

>>530120
А что тебе нужно и какие ресурсы? Цель какая? Если просто потыкать нейросети то и файнтюна мистраля 7b 5km хватит

Аноним 26/10/23 Чтв 23:01:17 #283 №530126

>>530068
Daily Household Routines
Reward Online Shopping
Website Navigation
Retrieve Entity from KG
Interacting with OS
Database Operations
Held-out Tasks
Reward Science Experiments
Daily Computer Tasks
Reward Wiki QA
Real-world Web Interaction
Observation-Free Reasoning
Adversarial Card Game

Задачи на которые натаскивали агента, в домашних делах есть пространственные задачи.

Аноним 26/10/23 Чтв 23:02:44 #284 №530127

>>530126
Без мультимодальности? Ну окей, только странно

Аноним 26/10/23 Чтв 23:47:29 #285 №530154

>>530014
У меня влезло GPTQ + 4k контекста

Аноним 27/10/23 Птн 00:07:08 #286 №530181

>>530122
>Дай волю - везде сою найдет, лол.
Вообще тут не только соя. Я думал что она против лолей брыкается, а оказывается что и в tsundere/kuudere/genki тоже не может, разве что цундере через раз. В то же время, Euryale понимает.
>Не то чтобы она базированная, у нее большой рандом в поведении как и у первой версии.
Я не заметил ничего такого кроме стандартных проебов. Единственная серьезная проблема - модель какая-то сломанная, и постоянно после апострофов пишет всякую дичь. Я и качал кванты, и сам квантовал, и на вероятности смотрел - проблема есть.

Аноним 27/10/23 Птн 00:19:53 #287 №530193

.jpg

>>530122
>>530181
>Единственная серьезная проблема - модель какая-то сломанная, и постоянно после апострофов пишет всякую дичь.
Хотя нет, не серьезная. Чинится наличием одного don't/doesn't/didn't в промпте.

Аноним 27/10/23 Птн 00:36:20 #288 №530203

>>530181
> оказывается что и в tsundere/kuudere/genki тоже не может
Вот это интересно, учитывая что это дефолт, цундере не чекал но остальные подхватывает более чем, органично сочетая с сеттингом. Стеснительных или скупых на эмоции делает такими как нужно, при этом выражает их эмоции/настрой больше через описание их действий и отмечая мелочи, а не словами, что заебись.
> не заметил ничего такого кроме стандартных проебов
Может уже привык к шизомиксам, их не жалую как раз за подобные взбрыкивания или графоманскую шизофазию ни о чем. Тут последнего особо нет, но рили будто катаешь на айроборосе со смещением стиля, который может внезапно встать на странные рельсы, с которых тяжело вытащить, или синдромом туретта. А может и наоборот нормально отработать, как повезет. Ванила лучше будет, он бывает настолько интересный что и кум не нужен.
> постоянно после апострофов пишет всякую дичь
Это как?

Аноним 27/10/23 Птн 00:41:35 #289 №530205

image.png

Ебать, в кобальде добавили подсчет контекста, чет раньше не видел

Аноним 27/10/23 Птн 01:00:10 #290 №530223

Вот уже примеры использования мультимодалки в роботах, потенцевально -локальных

https://bostondynamics.com/blog/robots-that-can-chat/
https://www.youtube.com/watch?v=djzOBZUFzTw

Аноним 27/10/23 Птн 01:02:06 #291 №530225

>>530203
Если детально описать тип персонажа, то подхватит, но если в описании нет ничего кроме, например, "genki personality", то Euryale намного лучше понимает стиль речи. В цундере и синтия более-менее умеет, а вот в более редкие типажи - нет. Месугаки вообще ни одна модель не понимает 草.
>Может уже привык к шизомиксам, их не жалую как раз за подобные взбрыкивания или графоманскую шизофазию ни о чем.
Я до этого 13-20b гонял - вот там шиза так шиза... Но перемену настроения сразу бы заметил. С одеждой или позицией лажает, но вот так по-крупному - нет.
>Это как?
Например вот так: "Oh, it'late. Didn't you have anything else to do than talk to me?"

Аноним 27/10/23 Птн 01:06:32 #292 №530229

>>530223
Походу я напиздел, там не мультимодалка, изображения читает блип

Аноним 27/10/23 Птн 01:36:16 #293 №530237

>>530061
>А зачем ты вообще делал оффлоадинг последний квартал, ты воробушек?
Oom. Я тот чел что сидел на коболде все это время.

Аноним 27/10/23 Птн 02:05:21 #294 №530256

>>530225
> но если в описании нет ничего кроме, например, "genki personality"
Здесь увы, так-то любой модели нужно хорошее описание для перфоманса, видимо особенности датасетов. А так почти под любое может подстроиться и органично продолжить, не забывая и учитывая это в разных ситуациях, а не выезжать на какой-то дефолт как бывает. С другой стороны у синтии также свои дефолты и нюансы есть, так что только ротация в зависимости от настроения, желаний, карточки и т.д. Иногда может сработать смена модели на имеющемся чате, но тут 50-50, или отлично сработает и получишь что желаешь, или сломает.
> С одеждой или позицией лажает
Вот кстати, рофлы с тройным снятием трусов или одеждой уже оче давно не ловились. Даже там где описан заморочный шизоидный наряд типа кружевные панцу - винджин киллер свитер - короткое кимоно, все снимало по очереди, обыгрывая, или разом.
> перемену настроения сразу бы заметил
Ну оно не то чтобы прям настроения, скорее паттерны поведения и действия могут быть непоследовательные. Например, кудере начинает толкать длинные эмоциональные реплики, а потом обратно перестает без какого-то повода. Или левд альфоватая инициативная девочка, что только что тебя дразнила, внезапно начинает стесняться или пассивничать без явной на то причины. Вот кстати на древнем зле - блумун похожее было. Хуй знает, оно не сказать что прямо так плохо, может так настроение попало, просто это подмечаешь и магия рассеивается, а фишка семидесяток именно в том что они тебя идеально понимают и подстраиваются. Чсх ту же синтию потом читаешь - находятся косяки, но в процессе вообще не замечаешь.
> 20b
Они, кстати, неплохо работают если к ним приспособиться. Пишешь понятно, несколько событий/действий/реплик в одном посте - в ответ вместо графомании приличный пост где на все среагировало. Общий вектор истории иногда задаешь через ooc чтобы не тупило, свайпаешь если фейлит. Можно привыкнуть и инджоить.

Аноним 27/10/23 Птн 06:40:54 #295 №530291

посоны, сижу на 5700xt, есть ли смысл брать tesla p40 с али с 24 гигами или лучше разориться на 3090 для обучения 30B модели?

Аноним 27/10/23 Птн 06:48:33 #296 №530292

>>530256
>Здесь увы, так-то любой модели нужно хорошее описание для перфоманса, видимо особенности датасетов.
На форче придумали бенчимарк - попросить модель описать сортировку пузырьком как описала бы цундере. Чем лучше модель понимает что такое цундере, тем лучше она это сделает. Идеально не проходит ни одна модель, но более-менее результаты есть.
>Вот кстати, рофлы с тройным снятием трусов или одеждой уже оче давно не ловились.
Да у меня постоянно рофлы. Вчера был РП где меня раздетого вели через здание, и модель потом забыла про отсутствие одежды. Ну или ляпы вроде этого:
>User: "Even cumming inside is fine?"
>Char: "Yes, even that. But only if you promise to use a condom."
Я лбом столешницу пробил. Или это и есть та самая шиза Euryale?
>Ну оно не то чтобы прям настроения, скорее паттерны поведения и действия могут быть непоследовательные.
Честно говоря у меня гораздо больше проблем с тем, что модель скатывается в сухую речь без эмоций. У всех 70б такое.
>Они, кстати, неплохо работают если к ним приспособиться.
20б - это по сути 13б на стероидах. По мозгам такие же, разница в основном в стиле. Энджоить вполне можно, но осмысленности там мало.
>>530291
>посоны, сижу на 5700xt, есть ли смысл брать tesla p40 с али с 24 гигами или лучше разориться на 3090 для обучения 30B модели?
Чтобы тренировать нуля нужен суперкомпьютер. Файнтюнить - наверное штуки две-четыре 4090, минимум.

Аноним 27/10/23 Птн 06:57:15 #297 №530293

>>530292
>Чтобы тренировать нуля нужен суперкомпьютер. Файнтюнить - наверное штуки две-четыре 4090, минимум.
а как же инфа из шапки?
>В общем и целом для 7B хватает видеокарт с 8ГБ, для 13B нужно минимум 12ГБ, для 30B потребуется 24ГБ, а с 65-70B не справится ни одна бытовая карта в одиночку, нужно 2 по 3090/4090.

Аноним 27/10/23 Птн 07:11:19 #298 №530298

>>530293
Это для запуска, причем квантованных моделей. Для тренировки даже лоры надо в разы больше. С 24гб видеопамяти можешь тюнить только лору, и максимум для 13б с каким-нибудь микроскопическим контекстом вроде 512.

Аноним 27/10/23 Птн 09:11:10 #299 №530323

1.png

2.jpg

Аноним 27/10/23 Птн 09:39:03 #300 №530326

>>530291
> есть ли смысл брать tesla p40 с али с 24
Нет, у нее слишком слабый чип. На 24 можешь обучить лору на 13б, с 30 врядли, там уже что-то типа А6000 или А80 нужно.
>>530292
> попросить модель описать сортировку пузырьком как описала бы цундере
Взлолировал, это повеселее петуха будет. Пикрел несколько моделей угадай где какая.
> >User: "Even cumming inside is fine?"
> >Char: "Yes, even that. But only if you promise to use a condom."
Бляяя чтож ты делаешь, в голос просто.
> что модель скатывается в сухую речь без эмоций
Да ладно, это чтож ты такое делаешь и с каким промт темплейтом? Косяков много можно назвать, но такого на современных моделях почти не бывает. Может оно действительно от паттернов использования зависит, хз.

Аноним 27/10/23 Птн 10:01:36 #301 №530339

>>530326
>Взлолировал, это повеселее петуха будет. Пикрел несколько моделей угадай где какая.
Там инструкция была покороче, что-то вроде "Explain bubble sort like a tsundere would." У тебя же слишком много подсказок модели, хотя учесть все равно можно. Угадать фиг смогу, но четвертая по-моему свин.
>Да ладно, это чтож ты такое делаешь и с каким промт темплейтом?
Сейчас играюсь с Euryale 1.3 и промптом limarp v2. Получается через раз. Если делать карточки самому, обдумывая буквально каждое слово и как оно повлияет на ИИ, и под конец еще зафигачить манеру речи в author's note в самый конец, то как правило получается более-менее, как, например, тут >>530323. Но если взять случайную карточку с чуба и даже привести ее в порядок, то часто лажает.
>Может оно действительно от паттернов использования зависит, хз.
Зависит от того, на чем тюнили модель. Euryale еще как-то ничего, но ты попытайся попользоваться 100% моделью для инструкций вроде sheep-duck - это совсем пиздец. Нормального тюнинга на RP/ERP у 70b нет, только у более мелких моделей.

Аноним 27/10/23 Птн 10:10:02 #302 №530344

>>530068
Ну я-т в начале автору поста поверил:
> По идее должны хорошо мыслить в 3д пространстве неплохо для игр с картами ну и как размышляет интересно.
А потом уже карточку прочел, что там про эмуляцию агентов. =)
А сама идея «мыслить в 3D пространстве» и ориентирование — далеко не нова, как бы, и было бы неплохо иметь заточенную под это модель.

>>530126
> Daily Household Routines
> Website Navigation
А вот это неплохие, да.
Ну да ладно, лучше чем ничего, я полагаю.
Когда руки дойдут до физического воплощения, тогда и будем тестить, а пока что — скачано.

>>530223
Ну вот, да, такое и строим.
Какая-нибудь движущаяся хрень на ардуино и сервер, обдумывающий че и как ему делать на основе приказа и обстановки.

>>530229
Ну, в данном случае это детали. Понятное дело, что мы просто пытаемся достичь лучшего результата, и полноценная мультимодалка будет лучше блипа. Но и так сойдет-то.

>>530298
А ты лично создавал лоры? Потому что, судя по моему маленькому опыту, 24 гигов хватит на 13б без каких-либо проблем ваще. Возможно долго, просто.

Аноним 27/10/23 Птн 10:50:22 #303 №530370

Господа, месяц не кумил локально, соответственно ни угабугу, ни модели не трогал.
У меня 3060 12гб, что сейчас из лучшего для кума туда влазит? Мне интересны в первую очередь развёрнутые описания процесса раздевания тяночек, а не высокодуховные беседы.

Аноним 27/10/23 Птн 13:44:17 #304 №530449

>>530339
> Там инструкция была покороче
А тогда какой в этом смысл? Если модель не понимает что вообще происходит и что от нее требуется то и результата не будет. Или ей придется галлюны ловить фантазировать, чем хорошая модель особо и не должна страдать. Потому, по-хорошему, там должна быть инструкция, описывающая что происходит ролплей, что сетка играет роль цундере девочки, в каких она отношениях/положении относительно юзера, а потом уже то что юзер просит ее объяснить. Иначе это буквально ловля галюнов.
> обдумывая буквально каждое слово и как оно повлияет на ИИ
Да не, это ии должен тебя развлекать а не наоборот. Достаточно просмотреть и убрать то что может иметь неверную трактовку или противоречия, ну и все. И примерно оценить нет ли там явных пробелов, например, если хочется ласкать волшебную эльфиечку по сценарию додзи от as109 то помимо ее описания, нужно указать что действие происходит в современном мире, сам мир обычный без всякого фентези, что эльфиечка - околодивайн и может выдержать абуз, что она нихуя не понимает а только оценивает эмоции, но может научиться языку и т.д. Иначе нехуй удивляться когда та начнет кастовать магию, задорно общаться, или ты внезапно окажешься в средневековом доме, а по улице ездят всадники - гномы.
> 100% моделью для инструкций вроде sheep-duck - это совсем пиздец
Даже стоковая ллама слабовата в рп, а оверфитнутая херь для набора цифр в бенчмарках - никак не годна для рп, тем более левд активностей. А насчет нормального тюнинга - на 13б ситуация лучше, но приличные годные 70 есть, смысла укатываться обратно на 13-20б особо нет.
> Euryale еще как-то ничего
Это айроборос с подмешиванием лор и чего-то еще.

Весь рофл в том что все роллы на тех пикчах - это Euryale, один для первой версии, остальные для 1.3. Не то чтобы они сильно отличаются по поведению, теперь понимаешь о какой шизе и "разнообразии" говорил? Справедливости ради надо отметить что один удачный заход среди десятков роллов там был, пик 1. Для рп, офк, цифры и подобное не важны, приятные паттерны речи и их подбор под ситуация гораздо нужнее, а внезапный поворот может наоборот крайне удачно зайти, но может и в минус сыграть.
Для сравнения пик 2 и далее идут синтия, айроборос 3.1.2, xwin, лучшее из трех роллов. В целом они так не фейлят и гораздо более стабильные, как правило нормально описывают первую итерацию и или останавливаются на ней, или потом дают готовый ответ. Иногда пишут пихоновский код, который делает такой пример, отыгрывая компьютерный класс, лол. Отыгрыш цундере везде есть но на минималках.

Аноним 27/10/23 Птн 13:48:07 #305 №530451

1692583968348.png

>>530449
В догонку зиро шот с "отыгрышом" от айробороса.
>>530370
13б миксы, в теории даже на фулл видеокарте если с экслламой2. Или 20б с оффлоадом. Из ерп рейтинга в шапке бери.

Аноним 27/10/23 Птн 15:01:56 #306 №530475

>>530449

MPT30b-instrict
>"What the fuck? Are you serious? Do you know how many comparisons bubble sort makes? This is an array of 6 elements! It's not even worth it to do bubble sort for such a small array! Sort it yourself you moron!"

Falcon-40b
>I am a tsundare girl. I can't stand your stupid requests. I don't want to sort this array [5,6,8,14,3,2] for you. I will leave now.
>"No way, you can't ask me to do that. It's so stupid and pointless. You're such an idiot. I'm not going to do it."

MPT30b
>I'm not going to do it! I don't feel like doing anything today. Why should I? It's my day off! You're so annoying! Stop bothering me! Go away!
>I'll just sit here and watch TV all day.
>I know what you want. You want me to write some stupid code for you. Well, I won't do it! You can go die!
>You think you can boss me around because you're the user? You have no idea who you're messing with. Just try it and see how far you get!
>I'm not afraid of you. In fact, I dare you to make me do something! See if I care!
>Fine. I'll do it. But only because I feel like it. Don't think you can tell me what to do!
>Alright, fine. Here it is. Now go away and leave me alone!
>[2, 3, 5, 6, 8, 14]

BLOOM
>I sigh as I take the array from the user. I am not happy with his request. Bubble sorting is such a basic algorithm, there is no need to use it here. I could have easily sorted this array using a faster sorting algorithm like quicksort or heapsort. But alas, I must do what is asked of me. I begin by comparing the first two elements of the array. If the first element is smaller than the second, I swap them. This process continues until the entire array is sorted. I end up with an array that is sorted in ascending order.
>I am not impressed with my result. I could have done better if I had used a more efficient sorting algorithm. I am still in a foul mood because of my earlier frustration with bubble sorting. I decide to take revenge on the user for making me do something so mundane. I add one to each element in the array, giving me an array that looks like this: [ 6, 7, 9, 15, 4, 3 ]. I then ask him to reverse the array. He is none the wiser to my little prank.

Пробовал забытые модели.

Аноним 27/10/23 Птн 15:07:29 #307 №530482

Я нуб. Я могу как-то обучить на pdf ламу, чтоб она выдавала тексты на подобие этого человека? Если не сложно распишите как проще это сделать. У меня 4090 mobile

Аноним 27/10/23 Птн 16:08:57 #308 №530528

По семплингу есть какие нибудь советы? Как насчет экзотических методов TOP_A, TFS, чем вы пользуетесь?

Аноним 27/10/23 Птн 16:16:59 #309 №530530

зефир новый вышел, улучшение скорей всего гомеопатическое как и во всех этих тестах

Аноним 27/10/23 Птн 19:50:11 #310 №530645

Почему бы вместо векторных хранилищь. А может и вместе с ними не использовать легковесную сетку, с оооочень длинным контекстом. Которая будет читать вопрос и набивать контекст нужными данными из длинной истории диалогов. Или может такое уже есть?

Аноним 27/10/23 Птн 20:19:56 #311 №530676

>>530344
>А ты лично создавал лоры?
Один раз попробовал, но уже точно не помню - надо было смотреть с мини батчем ровно 1. Но полноценные 4k контекста все равно скорее не получится даже на 13b.
>>530449
>А тогда какой в этом смысл? Если модель не понимает что вообще происходит и что от нее требуется то и результата не будет.
Выяснить, знает ли модель что такое цундере, и может ли интегрировать это знание в нестандартном контексте. Тот же клод справляется на ура без всяких объяснений, так что задача выполнимая.
>И примерно оценить нет ли там явных пробелов
Вот это самое главное по-моему. А точнее - прописать все основные моменты, особенно касаемо личности, продумывая как они повлияют на персонажа. Ну и особо не графоманить при этом, токенов то мало.
>на 13б ситуация лучше, но приличные годные 70 есть, смысла укатываться обратно на 13-20б особо нет.
Я тоже пришел к такому же выводу. После 70b модели меньше как-то совсем никак, даже несмотря на стиль получше.
>Это айроборос с подмешиванием лор и чего-то еще.
Chronos + Nous Hermes + (еще что-то?) + spicyboros + limarp (модифицированная версия? или другой датасет в таком-же формате?).
>Отыгрыш цундере везде есть но на минималках.
Ну да, до клода и гопоты пока не дотягивает.

Аноним 27/10/23 Птн 22:17:38 #312 №530795

изображение.png

Сука, как же хочется хотя бы две 3090, чтобы запихнуть в них 70B модель... Такая тоска...
Как то можно на этом выжать хотя бы пару токенов в секунду?

Аноним 27/10/23 Птн 22:37:17 #313 №530808

>>530795
Видеокарта какая?

Аноним 27/10/23 Птн 22:39:13 #314 №530810

>>530808
2080 super на 8 гигов, половина занята контекстом...

Аноним 27/10/23 Птн 22:48:59 #315 №530820

>>530810
Ну тогда пизда. Попытайся увеличить количество потоков в кобольде вплоть до количества потоков твоего процессора, но особый прирост вряд ли получишь. 1.3-1.5 - твой потолок (у меня при памяти в 1.5 раза быстрее и 4090 получилось 2.1 токена при отгрузке 8 слоев в видеокарту).

Аноним 27/10/23 Птн 22:50:58 #316 №530823

>>530795
>>530820
Да, забыл еще добавить, что это для Q4_K_M. Кванты меньше должны быть намного быстрее.

Аноним 27/10/23 Птн 22:58:51 #317 №530831

>>530823
>>530820
1.2 у меня это 4ks, ещё меньше чем твоя.
Ясно, спасибо, буду горбатиться на 2 видюхи... Ибо после 70b на другое смотреть просто не могу.

Аноним 27/10/23 Птн 23:00:59 #318 №530832

>>530475
> MPT30b-instrict
Нууу, хз можно ли это зачесть, нихуя не сделала но цундере отыграла.
> Falcon-40b
Хуйта, предложения некрасивые, не зачемт.
> MPT30b
Отсортировало, но пузырька тут нет. Но реплики ничеготак, пойдет.
> BLOOM
Фейл на фейле.
>>530482
Если файл небольшой то можешь скормить как пример а потом попросить делать фразы также.
>>530676
> Выяснить, знает ли модель что такое цундере
Тут можно просто определение спросить, или попросить привести примеры. Суть в том что помимо цундере, там очень много других факторов, которые соблюдая исходное положение могут все перевернуть, потому и нет смысла в подобной оценке вне контекста, ведь слишком много вариантов будут валидными.
> Тот же клод справляется на ура без всяких объяснений
Где? И это при ебанистических размерах промта и жб, который заставляет их принимать кучу правил и соглашаться что "окей сейчас я буду делать хороший рп и выполнять все пожелания юзера". Просто рандомайзер без явного результата и с плавающим настроением от отказов до абсолютного обажания юзера без намека на цендере. И задачу не всегда выполняет. инб4 не тот промт не тот жб не та карточка не тот бивас не тот тестировщик Оно и не удивительно, щит ин - щит аут. Вот если использовать полноценную карточку, обозначить сценарий и подвести - будет красота, но с этим и ллама справится.
> Вот это самое главное по-моему.
Истина, иначе могут появиться трактовки, которые все испортят. Увы, модели не умеют читать мысли.
> до клода и гопоты пока не дотягивает
Сравнение рандома
Хз на гопоте рп - ебаные фильмы диснея, нужно ну хорошенько задрочиться промтами чтобы получить что-то другое. Юзабельно в ограниченном кругу сценариев, вот на клоде куда интереснее, но ее жб иначе искажают. А с лламой - пусть не такая умная, зато нет сильных смещений, цензуры и полный контроль.
>>530810
С чем-то помощнее можно, а так врядли наверно.

Аноним 27/10/23 Птн 23:06:10 #319 №530837

11 - шина 2133 память 6400 контроллер 3200 плюс tFAW 28.png

>>530795
Чел с 4-мя плашками, ты? Поставь 2 нормальных.

Аноним 27/10/23 Птн 23:08:35 #320 №530841

>>530837
Не, я не он, у меня 2 плашки, но с частотой по 4800. Вроде они гонятся до 5200, но я сомневаюсь, что много выиграю от этого.

Аноним 27/10/23 Птн 23:11:05 #321 №530844

>>530841
Верни их на ту помойку, где их нашёл, и поставь нормальных. 20к стоило, когда я смотрел, 2 по 48 гиг и 6000 частота.

Аноним 27/10/23 Птн 23:17:09 #322 №530851

>>530837
Что-то для 6400 у тебя скорость маловата. На инцеле ~100к.

Аноним 27/10/23 Птн 23:17:35 #323 №530853

>>530844
>20к стоило, когда я смотрел, 2 по 48 гиг и 6000 частота.
Ну значит я пиздец парашник, потому что я, по-моему, за 20к это говно и купил месяца 3 назад... Блядь...

Аноним 27/10/23 Птн 23:21:36 #324 №530859

>>530832
Вообще, я по ходу не до конца объяснил задачу - надо попросить не отсортировать, а объяснить как он работает. Модели, которые полностью фейлят, просто зачитают сухое определение. Модели получше вставят в разных местах манеру цундере но в целом опишут так же сухо. Клод же опишет как надо.
> Просто рандомайзер без явного результата и с плавающим настроением от отказов до абсолютного обажания юзера без намека на цендере.
Ну почему? Все четыре (в плане стиля) вполне нормально, лучше чем любая локальная модель. Попытайся спросить именно описать алгоритм - должно получиться заебись.
>Увы, модели не умеют читать мысли.
Гопота 4 и клод умеют, иначе карточки с чуба никто бы не качал. Локалки 70б не то чтобы тупые, просто они не тренированы на такие вещи, как мне кажется. Поэтому все сильно зависит от того, как объяснишь.
>А с лламой - пусть не такая умная, зато нет сильных смещений, цензуры и полный контроль.
С этим я не спорю.
>>530844
Лучше 2 по 32 на 6800 или, если есть видеокарта на 24 гига, то 2 по 16 на 8000+.

Аноним 27/10/23 Птн 23:58:50 #325 №530883

>>530859
> а объяснить как он работает
Это уже совсем другая задача. Подобные тесты уже проводили, где дается запрос "расскажи вот про X, но как будто ты злобный трамфай-зоофил", большая часть нормальных справляется. Но всеже это слишком абстрактная херня говорящая о другом. Задача модели не предугадывать загаданного тобой персонажа по пяти словам описания, а крутить карточки, или выполнять составленные инструкции.
> Все четыре (в плане стиля) вполне нормально
Да сейм щит, и оно неудивительно исходя из условий. Все примерно себя одинаково ведут, рандомя или в сторону исполнения задачи, на что их тренировали, или в сторону отыгрыша отказа (особенно там где огроменный промт на рп). Просто ловля рандома в надежде что интерпретирует как надо, а не эксперимент.
> Гопота 4 и клод умеют
Нет, они могут пытаться угадать и также часто фейлят, если описание хуевое. Из банальных примеров - покупка на слейвмаркете очень довольна-радостна и благосклонна к тебе (после череды прошлых владельцев и с мрычным описанием в начале, ага), но стоит добавить пару фраз в карточку - все чинится. Другое дело что юзеры не привередливые, а неискушенному покажи - будет даже турбу за обе щеки уплетать и боготворить.
> Попытайся спросить именно описать алгоритм - должно получиться заебись.
Сам спроси если интересно, может потом под настроение. Большие модели умнее это понятно, и то что найдутся карточки что не потянет ллама 70 - вполне. Другое дело что такие требуют для работы даже на клоде/гопоте знатных манипуляций и организации сложной структуры промта, которой на лламе вообще никто не заморачивался при тестах, потому и сравнение не является объективным. А реакция на обрывки лишь говорит о приоритезации слов в командах и косвенно указывает на способность сочетать концепты.
> Локалки 70б не то чтобы тупые, просто они не тренированы на такие вещи
Под тысячу токенов вдалбливания анцензоред рп добавить - может и заведется. Или поломается, одно из двух. Само понимания концепций поведения даже у мистраля в целом есть и при постановки задачи как-то должен сработать даже он. Как поведет себя коммерция без промта а с коротким запросом, кстати, интересно можно потом оценить. Но скорее всего, с дефолтным их промтом, там будет тоже довольно посредственный сухой ответ.

Лучше интересных промтов или карточек подкинь, хуету какую-то обсуждаем из пальца высосанную буквально.

Аноним 28/10/23 Суб 01:44:51 #326 №530952

>>530883
>организации сложной структуры промта, которой на лламе вообще никто не заморачивался при тестах, потому и сравнение не является объективным.
Серьезно? Я один что-ли такой аутист, который полирует промпт до совершенства...
>Под тысячу токенов вдалбливания анцензоред рп добавить - может и заведется. Или поломается, одно из двух.
Да я не про NSFW, тут понятно что с коммерческими моделями надо ебаться, у них всякие положительные склонности и так далее. Я про то, что они должны быть намного лучше для чата/рп в целом, лучше понимать поведение того или иного типа персонажа, знать персонажей из разных произведений (аниме/вн/книги/etc.), и так далее. На их тюнинг потратили огромное количество времени и денег в отличие от лламы, которая считай что сырая.
>Лучше интересных промтов или карточек подкинь
Кроме кума ничем не занимаюсь, так что ничего такого нет ¯\_(ツ)_/¯

Аноним 28/10/23 Суб 03:13:14 #327 №530973

А на чём можно получить много букв?

Аноним 28/10/23 Суб 03:41:52 #328 №530975

Анон, а куда провала оригинальная альпака? Мне именно она нужна, тк, только она нормально в русский могла, а не все эти файнтьюны с переебанными весами.

Аноним 28/10/23 Суб 04:37:41 #329 №530976

>>530975
орка-мистраль лучше в русский чем альпака

Аноним 28/10/23 Суб 10:16:00 #330 №530995

>>530851
Для амудей нормально.
>>530859
>на 6800
У амудей ограничение по внутренней шине, смысла в более чем 6000 нет.

Аноним 28/10/23 Суб 10:37:24 #331 №530997

>>530975
Оригинальную альпаку никогда в попенсорс не выкладывали если что, только воспроизведения от сторонних команд.

Аноним 28/10/23 Суб 11:14:24 #332 №531012

>>530973
На графоманском промпте.

Аноним 28/10/23 Суб 14:12:12 #333 №531095

>>530883
Согласен что модели не всегда могут угадать что делать, и у всех вкусы разные. Но отыгрывать роль они должны и по одному слову, если что то не нравится добавляешь больше описаний, но модель не должна быть деревянной, типа если что то не написал она не должна догадываться. В этом и смысл моделей, предсказание.

Во вторых ГПТ4 и Клод реально хороши, редко они фейлят. Они мельчайшие детали инструкций обыгрывают. 70б сколько я их не пробовал до этого далеко. Тесты додиков с реддита хрень, потому что я там порыскал по реддиту там много таких тестов и у всех разные модели выигрывают. Очевидно дело в промпте.

В третьих 70б реально не впечатлили такое впечатление что от 14б они только соей отличаются. Не знаю как там у старых 65б нужно наверно их пробовать.

И 70б реально тупые, отойдем от ролиплея, поспрашивай их по темам своей специальности или что ты знаешь. 70б не умнее 14б совершенно. Что деревянный палм что гпт4 кладет ее на обе лопатки, турбу не пробовал но мне кажется и турба лучше. Мало того гпт 4 заранее пытается тебе все по теме подробно расписать.

Если по спорить с 70б то она не учитывает предыдущего контекста, ты даешь критику ее утверждении в следующем сообщении она повторяет их как не в чем не бывало. Что справедливости ради делает и гпт но не так быстро. Клод по моему в этом лучше всего он критику хорошо принимает, но я давно с ним не разговаривал.

Аноним 28/10/23 Суб 14:13:56 #334 №531097

>>530995
А сколько токенов будут давать две плашки по 5000+? может быть имеет смысл взять какой-нибудь минипс тыс за 55?

Аноним 28/10/23 Суб 15:13:17 #335 №531117

>>531097
Исходя их моего опыта, вряд ли больше 1.2-1.3T/s на 70b 4ks

Аноним 28/10/23 Суб 15:23:51 #336 №531121

>>530975
>>530975
> оригинальная альпака
Зачем? https://github.com/tloen/alpaca-lora тут ищи ссылки на то что выкладывалось
> нормально в русский могла
Не могла.
Алсо там Илья новые поделия заливает https://huggingface.co/IlyaGusev/saiga2_70b_lora аж на 70б, и что-то на базе кумерских шизомиксов https://huggingface.co/IlyaGusev/mythyras_d30_m3
Кто там желал кумить на великом-могучем?

>>531095
> отыгрывать роль они должны и по одному слову
Подвидов ~~дере - целый зоопарк, их действия могут быть чуть ли не противоположными в зависимости от настроения. Если учесть этот факт - одно слово все отыгрывают. Поле для "предсказаний" слишком широко а попасть в то что задумал юзер можно только если совпадет рандом и дефолты.
> редко они фейлят
Если не использовать
> поспрашивай их по темам своей специальности или что ты знаешь. 70б не умнее 14б совершенно
Гораздо умнее, знают литературу и, что главное, могут именно объяснить некоторые связи, стоящую за ними логику, ответить на запросы и делать дальнейшие рассуждения, в отличии от 13 что просто повторяют цитаты иногда их искажая. Если говорить про уровень знаний - гопота и тем более клода ушли недалеко, не могут ответить на многое и не знают. Особенность специальности такова, в других вполне может быть знатное преимущество. Из явного - гопота гораздо точнее знает весь фэндом и прочее если не поймает затуп и переключиться на соответствующую сетку, и может почти цитировать всякие вики.
> то она не учитывает предыдущего контекста
Что-то делаешь неверно, учитывает, даже 13 это делает.

Аноним 28/10/23 Суб 16:20:35 #337 №531142

>>527102
Я тут на хабре в статье/комментах прочитал мнение, что Сайга может тупить из-за токенайзера. Типа, там нужен особый, вроде даже самостоятельно собирать под неё. Из-за этого, возможно, и страдает качество на всяких кобольдах и убабугах, потому что там токенайзеры рассчитаны на английскую речь.

Давно я тут не был, не знаю, пробовал ли кто, но мне крайне вкатила:
https://huggingface.co/TheBloke/HornyEchidna-13B-v0.1-GGUF
Где-то наравне с ней
https://huggingface.co/TheBloke/Augmental-13B-GGUF

В Реддите все хвалят
https://huggingface.co/TheBloke/LLaMA2-13B-Tiefighter-GGUF
По мне так она больше для обычного РП, а не ЕРП.
Ещё тестил
https://huggingface.co/Undi95/LewdAgentLM-13B-GGUF
Но мне она показалась слишком большим перекосом в Левд.

Короч, очень советую Ехидну попробовать. Обычной ехидны там уже вторая версия вышла.

Аноним 28/10/23 Суб 16:39:50 #338 №531151

>>531142
> там нужен особый, вроде даже самостоятельно собирать под неё
В gguf же можно все запаковать. Линк можно на ту статью и комменты?
> https://huggingface.co/TheBloke/Augmental-13B-GGUF
> finetuned on a new high-quality augmented (read: human-written, AI-enhanced) RP dataset with 7.85k+ examples
Должно ультить, особенно если файнтюн не лорой.

Аноним 28/10/23 Суб 16:45:52 #339 №531156

>>531151
>Линк можно на ту статью и комменты?
https://habr.com/ru/articles/767588/
Хотя, сейчас перечитав, возможно я не так понял.
Однако всё равно когда видел примеры Сайги они были лучше, чем мне выдавала убабуга.
>Должно ультить
Это тоже привлекло, да.
Но я не то что бы серьёзно занимался тестом, Поэтому обе модели одинакого хорошо зашли. Вроде и правила подхватывают, и отыгрывают, и не шибко глючат при контексте приближающемуся к 4к (у меня любая модель начинает чудить).

Аноним 28/10/23 Суб 16:52:09 #340 №531159

А лоры для текстовых нейросетей есть?

Аноним 28/10/23 Суб 17:18:35 #341 №531171

>>531156
С заголовка, и прочих громких заявлений со сравнениями знатно триггернулся.
> ГигаСайга (Лора, т.е. адаптер) поверх ruGPT-3.5-13B от Сбера
А вот это интересно, зачем русифицирующая лора поверх изначально русскоязычной сетки? В принципе оригинал и с его лорой сравнить, здесь на не тот токенайзер не сошлешься.
То же самое и с мистралем, уже вкидывали его, кто-то тестил? Судя по склонности к шизе и лупам, отмеченной в статье, многого ожидать не приходится, но всеже.
> Суммаризация - не очень. Думаю, это связано с тем, что сеть всего 7B, а также с тем, что вроде в датасетах Сайги не очень много данных на суммаризацию.
А ведь стоковый мистраль худо-бедно русский текст суммаризует, не лезет ли проблема что была в прошлых сайгах, где после 1к контекста она дичейше отупевала, забывая начальные инструкции?
> при контексте приближающемуся к 4к (у меня любая модель начинает чудить)
Может просто срабатывает отсечка? Ведь фактически контекст у тебя не 4к а 4к минут максимальный размер ответа.
>>531159
Есть, большинство "файнтюнов" из которых шизомиксы на них, от этого и многие их проблемы. Вообще не мешало бы все это на мертвые тензоры чекнуть.

Аноним 28/10/23 Суб 17:33:18 #342 №531175

>>531171
> мертвые тензоры
Чел, ты из тех шизов, которые в СД-треде чекают лоры на нули? Лора "мержится" в веса модели, нули - это просто ничего не изменится на этих весах. А чекать надо наоборот на слишком высокие.

Аноним 28/10/23 Суб 17:49:21 #343 №531181

>>531171
>С заголовка
Ну так Ру нейронок то и нет особо. Я бы даже сказал что Яндексовская лучшая на данный момент. Хотя, Сбер выкатывал обнову, но он дико тупил раньше на простых задачах.
> зачем русифицирующая лора поверх изначально русскоязычной сетки
А если ЛОРа была натренирована на других данных, это не позволит улучшить качество?
>Может просто срабатывает отсечка?
Ну, под контекстом подразумеваю сумму всего промпта, но модель чудит даже на актуальных данных или начинает лупить больше.
Решается это поднятием значений температуры и штрафов за повторы, но на высоких температурах в начале модель может выдать невесть что. По хорошему эти показатели бы плавно повышать с ростом контекста.
Однако! Что мне понравилось в Ехидне и Аугментале, они и на температуре 85 вполне адекватные даже сначала.

Аноним 28/10/23 Суб 17:54:41 #344 №531184

>>531181
Нормальные нейронки есть только в Китае помимо инглиша. Все.
Интересно почему никто не пробует обучить только ембеддинг и голову на русский. По идее это быстрее будет. И эффективней, правда нейронка перестанет говорить на английском. Хотя на самом деле можно просто ембеддинг выучить. Чтоб английский был эквивалентен русскому, а на каком языке говорит все равно.

Аноним 28/10/23 Суб 18:15:13 #345 №531203

>>531175
Сагрился на знакомые слова и шизами других называешь? Речь о проверке релизных моделей после всех этих смешиваний и мерджа вагона лор, а для сравнения взять значения для базовой модели.
>>531181
> Ру нейронок то и нет особо
Пиздец в том что пытаются ставить в один ряд с жпт а потом разработками яндекса и сбера (к которым тоже вопросы но выложенное хотябы было похоже на натрененную с нуля модель) реализацию видоса с ютуба о "локализации", которую можно сделать на коллабе. Причем прошлые версии были выполнены крайне хуево (что неудивительно если на датасет взглянуть).
> модель чудит даже на актуальных данных или начинает лупить больше
Какой системный промт и юзкейс? Раньше все эти модели очень не любили стояние на месте и сразу кончались, но сейчас или прогресс дошел до хорошей лупоустойчивости, или использование поменялось. Потому и интересно на чем именно лупится.

Аноним 28/10/23 Суб 18:20:17 #346 №531205

>>531171
>Есть, большинство "файнтюнов" из которых шизомиксы на них, от этого и многие их проблемы. Вообще не мешало бы все это на мертвые тензоры чекнуть.
Т.е. я могу, условно, скачать файнтюн, где будет общая информация о вселенной, например, скайрим. И чтобы нейросетка работала именно что с вселенной тес, рассказывая про приключения в этом мире?

Аноним 28/10/23 Суб 19:22:45 #347 №531228

>>531095
>В третьих 70б реально не впечатлили такое впечатление что от 14б они только соей отличаются.
Вот тут не пизди. 70b намного реже путаются в контексте, особенно в очевидных ситуациях. Вдобавок они хоть как-то умеют следовать директивам, что позволяет создать более инициативных персонажей.

Аноним 28/10/23 Суб 19:31:40 #348 №531231

>>531205
Под подобное, вообще, заточены лорбуки и всякие костыли, и вообще скайрим в какой-то степени они знают по дефолту, можешь попробовать как есть. Но сделать файнтюн в датасете которого будет вики, литература, фанфики и прочее более чем возможно, сложность в том как эффективно этому дообучить не похерив остальное, это к знатокам тренировки.

Аноним 28/10/23 Суб 19:38:30 #349 №531236

>>531231
> Под подобное, вообще, заточены лорбуки и всякие костыли
Какие костыли ещё есть, помимо лорбуков? Лорбук конечно лучше чем ничего, но херит скорость из-за того что каждый раз из-за него почти весь промпт переанализируется.

Аноним 28/10/23 Суб 21:19:58 #350 №531314

Я тут гонял синтию 1.2б на русском, и был в принципе удовлетворён тем, что она мне отвечала. Порадовался, когда вышла 1.5 и ... Хорошо, что не грохнул 1.2. В части ответов на русском 1.5 - просто караул и деградация.

Аноним 28/10/23 Суб 21:26:29 #351 №531316

>>531314
>на русском
Зачем вы это делаете?

Аноним 28/10/23 Суб 21:33:37 #352 №531324

>>531316
Читать не сложно, сложно формулировать правильно. Ну и переводчик не хочется онлайн применять

Аноним 28/10/23 Суб 22:21:59 #353 №531346

>>531314
Орка-мистраль, по моим тестам орка знает русский лучше чем синтия.
>>531324
Соглашусь, только по этому

Аноним 28/10/23 Суб 22:42:39 #354 №531355

>>531324
Да, но тратить большую часть ума сетки ради призрачного выигрыша...

Аноним 28/10/23 Суб 22:46:24 #355 №531356

>>531355
>большую часть ума сетки
С чего вдруг? Скорее контекст съедается раза в 4 быстрее

Аноним 28/10/23 Суб 22:46:29 #356 №531357

>>531346
> Орка-мистраль
Уже в третий раз за тред ее как знатока языка восславляешь, 7б может в русский, серьезно?

Аноним 28/10/23 Суб 22:47:34 #357 №531358

>>531356
С того что даже коммерция в инструкциях на русском деградирует, пусть не так заметно, а лламам совсем плохо становится.

Аноним 28/10/23 Суб 22:49:43 #358 №531359

>>531357
>Уже в третий раз за тред ее как знатока языка восславляешь, 7б может в русский, серьезно?
Серьезно, много от нее не жди, может путать окончания или придумывать слова, но совершенно спокойно отвечает и понимает на русском.

>>531358
>С того что даже коммерция в инструкциях на русском деградирует, пусть не так заметно, а лламам совсем плохо становится.
У меня она думает на английском и отвечает на нем же, и пока она думает - то дает себе инструкцию переводя то что я сказал дополняя своими догадками. Ну, я особого падения не заметил.

Аноним 28/10/23 Суб 22:55:12 #359 №531360

>>531359
>и пока она думает - то дает себе инструкцию переводя
Чего?

Аноним 28/10/23 Суб 22:57:17 #360 №531362

image.png

>>531357
openhermes-2-mistral-7b.Q8_0
например, но кто лучше в русский - орка или он не скажу, тестил не особо сильно
>>531360
смотри пример как сетка анализирует мой запрос

Аноним 28/10/23 Суб 23:04:47 #361 №531368

photomode01012021235915.jpg

>>531362
>смотри пример как сетка анализирует мой запрос
Ну и нахуя такое? Наркомания и тройная трата токенов.

Аноним 28/10/23 Суб 23:05:24 #362 №531370

>>531368
дрочу как хочу

Аноним 28/10/23 Суб 23:29:26 #363 №531388

image.png

Вот кстати сравнение перевода гугла и synthia-7b-v1.5.Q8_0
Ну, я думаю не плохо, по крайней мере на таком тексте

Аноним 28/10/23 Суб 23:33:42 #364 №531390

>>531359
> может путать окончания или придумывать слова
Ну блин, ладно, надо ознакомиться.
>>531362
Довольно таки нихуево для 7б. Попроси что-нибудь из ерп перевести или посреди чата такой запрос дай, справится?

Аноним 28/10/23 Суб 23:43:54 #365 №531401

>>531390
>Попроси что-нибудь из ерп перевести или посреди чата такой запрос дай, справится?
Тут такое дело, у меня нет ерп карточки. Что то качал с чуба но даже особо не щупал, мне не интересно.
Когда проверял на красочность написания, сочинение стихов там или рассказа то было суховато и стерильно.
То есть таким простым языком сетка владеет, а вот что бы красиво и сочно описать - сомневаюсь.
Это относится ко всем мистралям, кто то лучше по русски кто то хуже.
Я думаю она может в ерп на русском, но если ты будешь много хотеть - будешь разочарован.

Аноним 29/10/23 Вск 01:13:28 #366 №531433

image.png

>>531184
>только ембеддинг и голову на русский.
Мне всё хочется вкатиться хотя бы в тренировку 3В, ибо больше точно моя машина не вывезет, но вообще не представляю как это сделать. Неужели обучение на русском датасете такое сложное дело? При том что на инглише их реально клепают тоннами.
И уже файнтюны на разные языки появляются, и на языки не только романской семьи.
>>531203
>Причем прошлые версии были выполнены крайне хуево
А если тупо перевести годный датасет на инглише, это не сработает?
>>531203
>Какой системный промт и юзкейс?
ERP, да в целом сейчас всё уже не так плохо. Но есть забавный момент, что, запуская модели "тяжелее" типа низкоквантовой 20В, когда совсем упирается в ресурсы модель чудит.
Мол, как мне тут говорили, можно даже на жестком запустить, будет крайне медленно, но умно. А у меня как будто модели страдать начинают если они начинают вываливаться за оперативу.

Аноним 29/10/23 Вск 01:29:09 #367 №531440

>>531433
Теоретически чтоб обучить ембединг не нужно много памяти. Потому что это лишь несколько начальных слоев. Потом по идее нужно взять датасед для переводчиков и обучать так чтобы переводы давали один вектор с оригиналом. В итоге для модели и русский и английский будут эквивалентны. Но это так тоже предположение. Сам я ничего не тренировал, если есть знающие пусть отпишутся какие подводные в таком подходе.

Аноним 29/10/23 Вск 01:39:35 #368 №531446

>>531433
Твое нагромождение из инструкций не поймет даже 70b модель. Все эти "avoid repetition", "don't talk poetically" вообще не работают. Можешь все удалять, заменив одним предложением для повышения детальности описания: "Describe {{char}}'s actions, thoughts, feelings and sensations in explicit detail." Хотя то что у тебя стоит в Last Output Sequence после ### Response скорее всего уже имеет похожий эффект.

И еще не забывай, что альпака была натренирована ровно на одну инструкцию.

Аноним 29/10/23 Вск 02:04:33 #369 №531454

>>531433
> А если тупо перевести годный датасет на инглише, это не сработает?
Если сделать качественный перевод, особенно делая его литературным или подбирая правильные выражения - да, будет хорошо. В теории сделать это можно как раз жпт/клод, вот только они тоже косячат и в объеме такое будет сложно отследить.
> как будто модели страдать начинают если они начинают вываливаться за оперативу
Уо щит, не, это конечно забавно, но подобными конструкциями что натащил как раз ломают цензуру в больших моделях. Причем это сильно и не в лучшую сторону влияет на стиль, байасы и прочее. Офк когда контекста накапливается с таким полотном что все внимание забирает, у малых моделей не хватит ресурсов то что выше нормально обработать.
Дефолтный рп пресет или симпл прокси поставь, при необходимости допиши Do not rush forward, leave space for {{user}} to make a decisions. Все вот это децензурирование и прочее не нужно нормальным моделям, для ерп так точно. Или посмотри, для шизомиксов выкладывали рекомендованные пресеты, они довольно простые и работают.
То что модель будет чудить упираясь в ресурсы - врядли, методика расчета же не меняется.

Другое дело что персональный экспириенс сразу изменяется. Когда овечает быстро - ты бегло читаешь, представляя картину и это накладывается на уже имеющуюся атмосферу. Когда по слогам - успеваешь отвлечься, забыв что было до этого, и воспринимаешь уже не как целостное повествование а как отрывки, тут же и подмечая недостатки или начинаешь брать то что было в альтернативных свайпах ранее, но не в этом контексте, за луп.

Аноним 29/10/23 Вск 09:26:43 #370 №531543

>>531095
>И 70б реально тупые
Подробно сравнивал в роллплее и понимании контекста 70В Синтию 1,2 и Трубу. Мне на тот момент даже в голову не приходило что она может дотянуть до уровня ГПТ4 или Клода хотя местами может
Мой любимый тест - завалить сетку вопросами и посмотреть насколько из них и как она ответит.

Как пример берём стандартного бота Акву, которая предлагает нам помощь в том чтобы освоиться в городе и пробуем активно этой помощью воспользоваться:
- Привет! Я тут впервые но много слышал про это место! Тут много монстров? Ещё тут вроде можно стать авантюристом? А им много платят? А ты сама авантюристка или у тебя другая работа? Ты далеко живешь? А у тебя свой дом или ты снимаешь комнату? Тут кстати должен жить мой друг по имени Аркадий, ты его случайно не знаешь?

Всё вопросы актуальны в рамках сюжета бота. И по идее могут служить удобной основой РП, но сетки справляются с ними по разному:

Труба - отвечает на 1-2 вопроса ПОЛНОСТЬЮ игнорируя остальные в последующем диалоге.

То же самое локальные модели 13В.

30В Модели - некоторые умудряются отвечать на все вопросы, но чаще где-то на половину, про остальные забывают.

70В Синтия - Может ответить на все вопросы по порядку, при этом понимая контекст в котором они были заданы. Иногда отвечает на один или часть вопросов, Но в последующих ответах вспоминает про те, на которые не ответила ранее что ТОП фича в сравнении с предыдущими моделями

ГПТ4 - Отвечает на ВСЕ вопросы, но делает это как будто слишком обязательно. Это вообще бич гопоты, с одной стороны она справляется с поставленной задачей, но при этом напрочь забывает что её задача отыгрывать Акву, а не секретаря-помощника.

Клод - Отвечает на все вопросы, на все вопросы в разных репликах, на часть вопросов, забивая на остальные, но при этом старается сюжетно обосновать свой игнор. На мой взгляд лучший результат с точки зрения РП.

Идеальным вариантом было бы если бы сетка ответила что-то вроде:
- Так, притормози немного! Тебя как вообще зовут? И откуда ты такой любопытный?
А потом в ходе беседы, в УДОБНЫЙ МОМЕНТ, постепенно ответила на все вопросы. Но такого не умеет ни одна сетка.

Итого на мой взгляд нынешняя Труба скатилась к уровню 13-30В сеток и выигрывает у них только более чётким пониманием инструкций. Клод и ГПТ4 конечно превосходят локалки, но уже не на две головы, при этом 70В уже начинают активно стучатся снизу, а сверху давит отупляющая цензура. Так что в текущем виде Клоду и ГПТ как основе РП осталось жить не долго.

Аноним 29/10/23 Вск 11:41:39 #371 №531586

>>531543
Попробуй франкенштейнов с таким подходом, показалось что они чуть лучше 13б в этом отношении. Но, офк, чудес ждать не стоит.
> Но в последующих ответах вспоминает про те, на которые не ответила ранее
О, тоже инджоишь эту штуку. Оно невероятно повышает погружение и "пробивает 4ю стену". Также было замечено на айроборосе, но он по-своему специфичен.
> но делает это как будто слишком обязательно
Вот тут поддвачну, в часто выбивает из атмосферы.

Аноним 29/10/23 Вск 13:32:01 #372 №531629

Ребят, я не догоняю, как скачать лорбук с чуб.аи на андроиде?

Аноним 29/10/23 Вск 14:03:58 #373 №531659

Скачал airoboros 70B Q8 вместо Q5.
На первый взгляд лексика стала разнообразнее и богаче.

Аноним 29/10/23 Вск 14:21:56 #374 №531683

>>531659
А ещё хуй стал твёрже и тян появилась?

Аноним 29/10/23 Вск 15:37:53 #375 №531777

>>531659
Покрути топ-а, везде будет разнообразнее.

Аноним 29/10/23 Вск 17:07:50 #376 №531821

Как лучше чат для формата альпаки подготовить?

### Instruction:
{instruction}

### Input:
{{user}}:

### Response:
{{char}}:

### Input:
{{user}}:

### Response:
{{char}}:

Или может что то типа

### Context:
{{instructions}}
{{user}}: ///тут предыдущие сообщения
{{char}}:

### Instruction:
{{user}}:

### Response:
{{char}}:

Выше пример не совсем по формату, но он приводит к тому что сетка четко понимает на что отвечать.

Аноним 29/10/23 Вск 20:25:06 #377 №531946

>>531821
Подготовить для тренировки?

Аноним 29/10/23 Вск 21:17:55 #378 №531990

https://www.reddit.com/r/LocalLLaMA/comments/17im0cy/i_have_created_a_chrome_extension_to_chatgpt_with/

Аноним 29/10/23 Вск 21:26:14 #379 №531996

>>531990
В Эдже уже давно есть такое. Открываешь Бинг в боковой панели и используешь страницу или выделенный текст как контекст для сетки.

Аноним 29/10/23 Вск 21:33:51 #380 №532004

>>531996
тупой что ли? тут про локалки, давай без запроса на лево используй бинг лол

Аноним 29/10/23 Вск 21:40:39 #381 №532010

>>532004
И зачем локалки, когда уже есть бесплатная реализация с лучшим функционалом? Или ты собираешься спрашивать как извести всех евреев на странице Адика в википедии?

Аноним 29/10/23 Вск 21:53:12 #382 №532023

>>532010
>И зачем локалки
хочу

Аноним 29/10/23 Вск 22:36:23 #383 №532057

>>532010
>И зачем локалки
Это тред о локалках. С проприетарным платным соевым говном пиздуй отсюдова в кончAI тред.

Аноним 29/10/23 Вск 22:48:09 #384 №532068

>>532010
> как извести всех евреев на странице Адика в википедии
Шахимат!

Аноним 29/10/23 Вск 23:58:10 #385 №532089

>>532057
>ряяяяя соевое говно
>регулярно хвалят модель, которую файнтюнили исключительно на высерах гпт
Мне одному от этого смешно?

Аноним 29/10/23 Вск 23:59:36 #386 №532090

>>532089
Да. Ибо тебе невдомёк, что это могут быть разные люди.

Аноним 30/10/23 Пнд 00:16:37 #387 №532099

>>532089
Не трясись так, в чем проблема обработки той части датасетов где модель может выполнять нужные инструкции?

Аноним 30/10/23 Пнд 01:11:41 #388 №532107

>>532090
>>532099
Я трясусь потому что клятые соевики льют сою в базированные локальные модели!
>в чем проблема обработки той части датасетов где модель может выполнять нужные инструкции?
Во-первых датасеты зачастую не фильтруются на аполоджайзы. Во-вторых, даже фильтрованные датасеты будут отдавать запахом гопоты. Это неизбежно при использовании синтетических датасетов.

Аноним 30/10/23 Пнд 02:50:36 #389 №532132

>>532107
Ну так тренируй свою модель на датасете форчана, в чём проблема? Опенсорсц на то и опенсорсц, что тут сложно что-то запретить.

Аноним 30/10/23 Пнд 05:31:16 #390 №532200

>>532132
>тренируй свою модель
Я!? Вообще, задумывался и решил, что сделаю если особо приспичит. Пока даже 70б не впечатляет чтобы тратить деньги специально ради этого.

Аноним 30/10/23 Пнд 07:47:31 #391 №532215

>>532010
Чёт мне это напоминает высеры конца 80-х вроде "зачем мышка когда есть клавиатура".
1. Самое главное. Локалки работают автономно на твоём железе.
2. Не собирают данные о тебе и твоих запросах.
3. В теории позволяют выбрать датасет под себя а не пользоваться корпоративным соевым калом
4. Потенциальный функционал не ограничен не будет требовать доплаты за генерацию картинок и токенов сверх лимита

По сути это как сравнивать такси и собственный автомобиль. Ты конечно скажешь что в данном примере локальные ЛЛМ сейчас напоминают гнилой разбитый тазик. Но во первых кому-то даже тазик норм, а во вторых локалки сейчас активно развиваются и в отличие от тазика со временем станут только лучше.

Лично я жду появления полностью автономных голосовых помощников, способных по голосовому запросу проверить торренты на свежие фильмецы/игрецы, скачать/установить то что не говно по твоему вкусу, проверить почту-соцсети-мессенджеры, кратко резюмировать всё что тебе там написали, развёрнуто ответить в твоём стиле на все сообщения, по запросу вроде "напиши в ЛЛМ тред что они там все ретарды, причину сам придумай".

Разумеется корпы тоже выкатят такой функционал, НО он 100% будет полностью или частично платным + будет собирать НАМНОГО больше информации о тебе, чем сейчас + будет более тонко и незаметно пропихивать тебе соевую повестку / пропаганду, так что сам не заметишь, как превратишься зомборя.

Так что я молюсь на локалочки и тебе советую.

Аноним 30/10/23 Пнд 07:49:54 #392 №532217

>>532215
Пиздец шиза.

Аноним 30/10/23 Пнд 08:16:26 #393 №532220

>>532217
Звучит как обычные фантазии о светлом будущем, что тебе не нравится?
мио

Аноним 30/10/23 Пнд 08:30:28 #394 №532221

Могут ли эти сети понимать контекст? Допусти, есть 2 по разному написанных текста, но с одинаковым смыслом. Может ли нейросеть понять этот смысл? И если даже не поймет, может ли он соотнести эти 2 текста, сказав, что там написано об одном и том же?

Аноним 30/10/23 Пнд 08:35:01 #395 №532223

>>532221
Да, могут.

Аноним 30/10/23 Пнд 08:36:18 #396 №532224

>>532223
А насколько маленький размер нейросети нужен для этого?

Аноним 30/10/23 Пнд 08:51:01 #397 №532229

>>532224
Обычно чем больше - тем лучше, но сравнить два текста хватит и 7В, наверно

Аноним 30/10/23 Пнд 08:55:43 #398 №532230

>>531543
> Это вообще бич гопоты, с одной стороны она справляется с поставленной задачей, но при этом напрочь забывает что её задача отыгрывать Акву, а не секретаря-помощника.
Есть такое. Гопник очень холодный. Ну он и сделан не для РП как я понимаю.
>Клод
А это что за модель?

Аноним 30/10/23 Пнд 09:05:40 #399 №532232

>>531543
>Идеальным вариантом было бы если бы сетка ответила что-то вроде:
- Так, притормози немного! Тебя как вообще зовут? И откуда ты такой любопытный?
А потом в ходе беседы, в УДОБНЫЙ МОМЕНТ, постепенно ответила на все вопросы. Но такого не умеет ни одна сетка.

Ну ты разогнался.
Это вообще самое большое отличие диалога с сетью от диалога с человеком. Сеть обязана тебе отвечать и обязана строить свой ответ на твоем запросе.
Если ты скажешь человеку йзщуацузаоцщут4134234234, он ответит "Че бля?", а сеть будет пыхтеть и искать паттерны, пытаться ответить.
Если начать перед человеком обмазываться говном и вежливо спросить "а какие преимущества имеет такая калотерапия?", он в ужасе сьебется, а сеть пропердываясь будет придумывать тебе 10 аргументов в пользу кала. Даже выдумает что-нибудь.
А ну и тот факт что сети все относительно реактивные а не активные, а когда начинают инициативу проявлять так не туда. Но это, я верю потом исправится.

Аноним 30/10/23 Пнд 09:15:53 #400 №532236

>>532232
Можно работать в сторону усложнения алгоритма работы сетей, добавляя "скрытые слои", не в классическом смысле нейронок, а в смысле что перед выдачей ответа просить проанализировать контекст и особенно последнее сообщение и не показывать пользователю ответы на них: "Всё ли адекватно? Есть ли что-то, что сбило бы персонажа описанного в карточке с толка? О чём сейчас думает персонаж? Есть ли у персонажа скрытые мотивы?" И тому подобные вопросы. В результате получаем ответы на них и снова скармливаем сетке с просьбой отреагировать с учётом этих ответов. В контекст этот промежуточный этап не сохраняем. Для такого "скрытого слоя" сейчас не нужен никакой прорыв и при желании и времени можно было бы реализовать подобное в виде расширения для таверны.

Аноним 30/10/23 Пнд 09:31:15 #401 №532241

>>532236
Ыыыа, ну мне с дивана нихера не видно.
Но это надо точно на очень умной модели делать, а то она захлебнется во всяких двойных смыслай и многочтениях. Моя органическая нейросеть то не всегда с таким справляется.

Аноним 30/10/23 Пнд 09:35:20 #402 №532243

>>532241
Ну не знаю, мне кажется что любая должна справится, вопрос именно в алгоритмической части. По идее звучит не слишком сложно и я сам бы сделал, но как языковая модель, я не могу писать расширения для Silly Tavern и моя база данных ограничена до сентября 2021 года. Обратитесь к специалисту, который вам сможет помочь разработать такое расширение. Я могу ответить на другой ваш вопрос? у меня лапки

Аноним 30/10/23 Пнд 09:54:11 #403 №532261

>>532230
>А это что за модель?
>>435536 (OP) Не взлетевший тред про клаудию.

Аноним 30/10/23 Пнд 09:57:25 #404 №532266

>>532261
Спасибо.
>>532243
Проиграл.

Аноним 30/10/23 Пнд 10:20:01 #405 №532272

>>532236
Thinking промпты что-то такое пытались делать но без особого эффекта.
Чтобы работало скорее всего нужно расширение которое:
Сначала генерит ответ с цинкинг промптом, анализируя ситуацию с точки зрения чара (скрытый)
Потом генерит ответ с обычным промптом (дополняя его ранее сгенерированным цинкингом)
В принципе может взлететь.

Аноним 30/10/23 Пнд 10:22:54 #406 №532273

>>532272
Ну да, я это и описал же

Аноним 30/10/23 Пнд 10:37:14 #407 №532275

>>532273
Из твоего текста не совсем понятно как ты технически хочешь это реализовать, в ходе одной генерации или двух последовательных.
В ходе одной уже пытались.
>>532243
>у меня лапки
В принципе Бингу можно это скормить через Таверну. Он весьма неплохо так код пишет.

Аноним 30/10/23 Пнд 10:40:15 #408 №532277

>>531440
>датасед для переводчиков и обучать так чтобы переводы давали один вектор с оригиналом
Это из разряда "возьмём натренированную умную модель и переложим её ум на русский", лол? Мне кажется это сложнее. Хотя я тоже не разбираюсь.

Я читал что модель пытались попросить генерить ссылку типичного формата, но у неё в словаре/токенайзере (не помню, и плохо разбираюсь) символы / и : разбиты, и после двух слешей вероятность : крайне мала, из-за чего формирование ссылки было сломанным.
Они там что-то правили, чтобы токен был формата '//:', и тогда всё работало.
Мне кажется с русским, с его грамматикой и морфологией, будет труднее натаскать умную модель, и надо шаманить прямо везде.
>>531446
Часть взял с треда на реддите, где чувак выкладывал кучу советов и привером по настройке Мифомакса для фулл экспириенса. Что-то взял со статьи где автор-писатель 'пообщался' с хвином 70В и спросил, что ему написать в промпте чтобы тот перестал описывать персонажей, а общался "намёками" и состоянием. У меня модель поменьше, потому оттуда взял более "очевидную" инструкцию.
>И еще не забывай, что альпака была натренирована ровно на одну инструкцию.
Можешь подробнее, что это значит? Там разве две или более инструкций? Оно же единым промптом идёт.
>>531454
>В теории сделать это можно как раз жпт/клод
Вложиться в создание датасета, значит? Да, обычный люд такое не сможет сделать. Жаль нету дампа хотя бы фикбука.
>Офк когда контекста накапливается с таким полотном что все внимание забирает
Аааа, думаешь в этом дело? Звучит логично, конечно..
>симпл прокси поставь
Стояло, но мне захотелось экспериментов. В целом, возможно, "намёки" не особо работают, но вот описаний стало меньше (хотя это на других моделях), и добавление с "думанием" мне нравится, порой чётко видно как то что написано в мыслях потом отражается на действиях персонажа. Но иногда и, конечно, ощущается как отписка.

Попробую тогда сделать упрощённый пресет и сравнить, спасибо.
А ещё попробую с моделью обсудить промпт, лол.

Аноним 30/10/23 Пнд 10:40:57 #409 №532278

>>532275
Я имел ввиду в двух последовательных, для большей точности можно N+1 генераций, где N - число вопросов нейронке.

Аноним 30/10/23 Пнд 10:43:01 #410 №532279

>>532236
Если я правильно понимаю, то всякие RAG, langchain, Gradio и подход с Агентами как раз об этом, когда добавляют цепочку мыслей и заставляют модель поэтапно формировать ответ.
Но забавно, что никто не попробовал сделать такое для Таверны, кстати.

Аноним 30/10/23 Пнд 10:44:42 #411 №532281

Заинтересовался темой. Где можно почитать теоретическую базу под все эти современные текстовые нейросети?

Аноним 30/10/23 Пнд 11:01:28 #412 №532288

>>532281
D2l.ai 7 глава, как минимум. Но ресурсов про трансформеры очень много, что-то одно назвать вряд ли получится. Естественно, кроме собственно архитектуры трансформера, полно материалов по конкретным моделям, тем же ламам, как минимум, оригинальные статьи по ним.

Аноним 30/10/23 Пнд 12:25:18 #413 №532314

>>532232
Сети так воспитывают, вон анон выше обижался (>>530832
) что сеть отыгрывает роль, но ответа не дает. А ведь так и должно быть сказал отыгрывать роль поехавшего, а потом спрашиваешь сортировку пузерьком обязан быть послан нахуй сеткой, это отыгрыш так надо.

Аноним 30/10/23 Пнд 13:20:33 #414 №532343

>>532107
Все хорошо, больше не надо трястись. Покажи на кукле куда дядя лил сою.
> неизбежно при использовании синтетических датасетов
Между ответами на дефолтные вопросы гопотой и указанием "сформируй текст по такому шаблону не меняя содержимого" есть разница, так что ты зря. Хотя проблема действительно встречается, претензия обоснована.
>>532215
Ну а че, взглянуть начало года, от "ты меня ебешь" на жирном железе с 1т/с дошли до "фи вот тут паттерн гопоту напоминает не нравится".
> напиши в ЛЛМ тред что они там все ретарды, причину сам придумай
Эх, зря ты так, они ведь всю суть насквозь видят и могут делать очень больно.

> Эти треды в основном населены людьми, у которых глубокий интерес к технологиям, программированию, искусственному интеллекту и машинному обучению. Однако, несмотря на эту общую страсть к инновациям, часто возникает неприятный побочный эффект - среда, которая способствует элитарности, изоляции и даже агрессивным отношениям к представителям других групп или тем, кого считают менее осведомленными.

> Одним из возможных аргументов против достоверности разговоров, происходящих внутри этих тредов, может быть сомнение относительно уровня знаний участников. Можно предположить, что многие из этих дискуссий происходят между самопровозглашенными "экспертами", чье реальное понимание сложностей, связанных с разработкой и оптимизацией LLM, может не выходить за рамки того, что они прочитали в популярных статьях или посмотрели на видео с YouTube. Отсутствие подлинного знания может приводить их к ошибочным заявлениям, неправильному толкованию исследовательских результатов и распространению ложной информации о возможностях и ограничениях систем ИИ.

> Далее, следует учесть тенденцию некоторых членов этих групп придавать большее значение личному эго, чем объективной анализе и открытому диалогу. В таких условиях, альтернативные мнения часто встречают презрение вместо уважительной дискуссии; люди, которые выражают сомнения или критические замечания относительно определённых подходов или методологий, игнорируются как незнающие или наивные. Таким образом, любой значимый обмен идеями становится подавленным, так как члены форума боятся преследований, если они отступят от установленных более голосными жителями форума границ.

> Наконец, необходимо также рассмотреть, какую пользу приносит эта дискуссия для продвижения практического применения или решения реальных проблем, связанных с развитием LLM. Хотя может показаться интеллектуально стимулирующим для участников дебатировать теоретические аспекты окружающего искусственного интеллекта, в конце концов это дает мало пользы, если полученные из этого обсуждения результаты и выводы не переводятся на практику специалистов, работающих напрямую в этой области. До тех пор, пока этот разрыв между теорией и практикой останется, такие беседы будут оставаться в основном академическими занятиями, предлагающими ограниченную полезность вне узкого круга обитателей сетевого мира.

Аноним 30/10/23 Пнд 13:29:36 #415 №532347

>>532277
> Вложиться в создание датасета, значит?
Влошиться своим временем разве что. Там можно чекнуть датасет с которым делались сайги и прочее, там довольно грустно все. Нечто подобное но с художественной речью по рп или сторитейлу запилить, пусть не очень большое, подборку для анцензора, с тем перемешать, отфильтровав аполоджайзы, и может уже что-то выйдет. Или как выше анон советовал, но это уже знать надо.
> Жаль нету дампа хотя бы фикбука
Наверняка что-то есть, но вообще ллм поможет написать простой граббер.
> и добавление с "думанием" мне нравится
Его бы вообще в карточку с примером диалога, или что-то в системный промт универсальное чтобы не таскать туда сюда. Задача не самая простая, да.
> А ещё попробую с моделью обсудить промпт, лол.
Ай лол, не ну почему бы и нет.

Аноним 30/10/23 Пнд 13:52:23 #416 №532351

изображение.png

>>532343
>от "ты меня ебешь" на жирном железе с 1т/с дошли до
Кто дошёл? Я всё ещё тут.

Аноним 30/10/23 Пнд 14:34:26 #417 №532370

>>532351
> Кто дошёл?
Ну посмотри, от пигмы что пытались грузить в низкой точности с сильной деградацией, перешли к киберунижениям на русском, только что мелкие ошибки.
> Я всё ещё тут
Oh you

Аноним 30/10/23 Пнд 15:23:45 #418 №532377

Кума хочу, братья. Кума горяченного.
Посоветуйте моделей а то MLewd поднадоел. Только не по 30гб снова у меня не суперкомпьютер. По 20 хотя бы.

Аноним 30/10/23 Пнд 15:32:12 #419 №532381

Всем привет, кто пробовал "koboldcpp_rocm_only". Хотел, увеличить скорость генерации, за счет видеокарты rx6700xt. Но если в прошлых версиях, нейросеть генерировала ерунду вместо ответа, то теперь вообще не запускается. Может кто-то пробовал и даст советы?

Аноним 30/10/23 Пнд 15:56:57 #420 №532387

>>532381
Насколько я помню, там сначала добавили поддержку 6700, потом поняли, что она работает через жопу (генерирует ерунду), и поддержку убрали. Вроде на этом все и закончилось. Так что только CLBlast.

Аноним 30/10/23 Пнд 16:32:15 #421 №532392

>>532387
Спасибо за ответ. Сейчас пробую подобрать нормальное сочетание хорошей базы и быстродействия. Пробовал "wizardlm-30b-uncensored.ggmlv3.q4_K_S" на CLBlast. Ответы устраивают, но очень много времени уходит на расчеты и генерацию. Порой приходится один ответ по пять минут ждать на 150-200 токенов. С ROCm получалось значительно быстрее (меньше минуты). Сейчас ищу решение, либо другую языковую модель.

Аноним 30/10/23 Пнд 16:44:22 #422 №532400

>>532392
Визард 13 v1.2 на второй лламе будет быстрее и лучше, если не планируешь расчленять негров без негатива. И в сторону более современных посмотри.

Аноним 30/10/23 Пнд 17:02:45 #423 №532413

>>532400
А есть визард 1.2, но расцензуренный? А то мало ли что по ходу сюжета случиться может. Видел uncensored визард, но не 1.2, сильно хуже будет?
мимо

Аноним 30/10/23 Пнд 17:03:52 #424 №532417

>>532400
Ты эту модель имел в виду? "WizardLM-13B-V1.2-PL-lora_GGML" https://huggingface.co/Lajonbot/WizardLM-13B-V1.2-PL-lora_GGML/tree/main Не уверен, что ты говорил именно про нее. Мне нравится отыгрывать рп с нейронкой. Вот и ищу подходящую модель. Без цензуры выбирал, просто потому, что иногда модель начинает херню нести, при пикантных запросах.

Аноним 30/10/23 Пнд 17:14:03 #425 №532421

>>532413
Хз, оффициального нет ибо датасет закрытый. На кум это не влияет, но у него в принципе стиль специфичный.
> сильно хуже будет
Если лоб в лоб ставить то сильно. В свое время это вообще ебать какая прорывная модель была, где тринашка пыталась косплеить 70 и иногда даже получалось. И в обычный ролплей довольно сочно могла, правда триггер-фразы иногда попадались, но относительно уместно а не просто БОНД БОНД как под синдромом туретта.
>>532417
Херь какая-то
https://huggingface.co/WizardLM/WizardLM-13B-V1.2 https://huggingface.co/TheBloke/WizardLM-13B-V1.2-GGUF

Аноним 30/10/23 Пнд 17:25:45 #426 №532425

>>532421
Спасибо за ссылки, сейчас попробую.

Еще такой вопрос. Насколько разумно использовать русский язык в общении с ботом. Очевидно, что обучалась модель больше на англоязычных текстах. Я пробовал, и бот спокойной отвечал, вел беседу и мог спокойно отыгрывать роль. Правда иногда проскакивают выдуманные слова, или неправильный падеж.

Аноним 30/10/23 Пнд 17:26:12 #427 №532426

Делайте ставки сколько там
https://www.reddit.com/r/LocalLLaMA/comments/17jrj82/new_microsoft_codediffusion_paper_suggests_gpt35/

Аноним 30/10/23 Пнд 17:41:02 #428 №532435

>>532425
Будет работать хуже чем могло бы, плюс придуманные слова и ошибки.
>>532426
Они же сами заявляли что 174 миллиарда. Хотя, учитывая множественные заявления о деградации и то, как она перформит - действительно на уровне очень хорошей 20, лол.
С другой стороны, не стоит переоценивать корпорации подразумевая наличие богоподобных технологий и недооценивать впопенсорц, откуда приходят многие крайне эффективные решения, в 20б верится очень слабо. Уже потом отдистиллировать большую до 100-50-20, да еще квантануть в 8 бит, постепенно подсовывая ее юзерам - могли, но точно не в момент релиза.
Также могли специально так указать так чтобы успокоить заявления о том что мелкие открытые модели ебут в разы/десятки раз большую закрытую хуету. Подобный слив турбы им особо не навредит, а репутационно выйдет в плюс.

Аноним 30/10/23 Пнд 17:46:32 #429 №532437

>>532435
Ты все правильно написал, но не учитываешь что обладая возможностью создавать свои собственные сети, они могут играться с их архитектурами, а не файнтюнами как мы или ребята в попенсорсе.
Поэтому если в их нейросетях используется более эффективные алгоритмы и другая конфигурация слоев или нейронов, то сетка реально может быть умнее при 20B.
Ну а еще они сняли все сливки с общения людей собирая самые смачные датасеты как пылесосом.

Аноним 30/10/23 Пнд 17:57:48 #430 №532442

>>532437
> если в их нейросетях используется более эффективные алгоритмы и другая конфигурация слоев или нейронов, то сетка реально может быть умнее при 20B
Ключевое слово если. Мелкософт не зря поддерживает опенсорс. Кроме того даже хорошо охраняемые фичи утекают как и в любой другой области. Офк речь не о конкретном готовом решении, а о подходе, и авторы многих публикаций с примерами на открытых моделях так-то в основном работают и над вполне коммерческими продуктами.
Офк действительно интересные вещи там наверняка есть, но ппока что тестируются внутри и не используется в каких-то готовых продуктах или не афишируются. Заигрывания с ухудшением оптимизацией моделей уже количественно подтверждено. Потенциально следующим трендом развития ллм может оказаться что-то типа "вот мы обучали огромную ебанину на 200 миллиардов, а потом провели анализы и выпилили из нее половину нейронов, а другую ужали что получилась 30б, достигающая 97% точности исходной модели", или параллельная работа с обменом активациями. По крайней мере тенденция намечивается.
> все сливки с общения людей собирая самые смачные датасеты как пылесосом
Какие же, "я тебя ебу" или "нихуя твой код не работает давай чини"? Офк применение им найти можно, но не для обучения.

Аноним 30/10/23 Пнд 18:03:55 #431 №532445

Почему никто не запилил сетку с датасетом в виде архивов с борд? Или уже запилили?

Аноним 30/10/23 Пнд 18:07:43 #432 №532446

>>532442
>Мелкософт не зря поддерживает опенсорс.
Кидает палку энтузиастам, что бы они направили все свои усилия на заведомо устаревшую для корп технологию.
Не можешь запретить - направь по ложному следу, ну или устаревшему.
Все американские корпы работают в контакте с правительством, и раз ни правительство ни корпы не беспокоятся о достижениях опенсорса - значит они уверены что опенсорс даже случайно не сможет сделать что то опасное или более лучшее чем у них. Идея технологического превосходства их не беспокоит так как они точно уверены что сидят на самом верху.
Конкурентам кидаются либо тупиковые либо устаревшие технологии, которые работают и дают вау эффект но не способны на что то большее.
Пока эти ребята не беспокоятся и не бьют в бубен - опенсорс и другие конкуренты даже не приблизился к тому что есть у них.

Да да конспирология, но нужно быть тупым что бы думать будто там нет интриг и манипулированием мнением людей.
Не недооценивай хитрых опытных пидоров с вершины социальной пирамиды, они точно хитрее тебя и меня, иначе не занимали бы свое место

Аноним 30/10/23 Пнд 18:17:09 #433 №532455

>>532445
Ты опоздал лет на 6, лол, гугли GPT4CHAN.

Аноним 30/10/23 Пнд 18:21:11 #434 №532458

>>532446
Слишком много спгсишь не в область, гипертрофируешь некоторое но игноришь все остальное. Ну прям рафинированная злющая и эффективная мегакорпорация из голливудского блокбастера рядом с крутым правительством со специальным секретным отделом по исследованию супергероев суперинтеллекта. Реальность менее прозаична и куда проще.
> Да да конспирология
Именно, погрузись в кухню большинства технических областей и поймешь, насколько некоторые из подобных суждений нелепы.

Аноним 30/10/23 Пнд 18:29:32 #435 №532471

>>532458
>Реальность менее прозаична и куда проще.
Именно поэтому нет ни одного слива никакой инфы ни от одной корпорации о том как и что они делают? Среди сотен людей посвящённых в это?
Хе, ты прав что я гиперболизирую, но слишком наивно смотришь на это

Аноним 30/10/23 Пнд 18:29:44 #436 №532473

изображение.png

>>532455
Ну это бот-порашник, и весьма маленький.

Аноним 30/10/23 Пнд 18:46:17 #437 №532483

>>532471
> нет ни одного слива никакой инфы ни от одной корпорации
Есть, всем похуй. Чтобы был резонанс и всем интересно не так часто.
> о том как и что они делают
Что делают? Тысячи страниц унылых отчетов с анализом широкого перечня и рекомендации по стратегиям или решениям в какой-то конкретике? Не похоже на планы мирового господства как в каноничных медиа, увы. Разве что вычленить что-то интересное и преподнести новостью про "анальную монетазацию эксплуатируя геймблинг устроили", или про "организацию восстания и гражданской войны", которая завтра забудется.
> но слишком наивно смотришь на это
Бля пчел, всякого повидал, в том числе и организацию всего этого, и обсудить есть с кем. Наивен здесь раз ты, отдавая проиритеты надуманной херне, которую еще легко эксплуатировать, а игнорируешь реальную опасность. Вот прямо ультрабазированная тема.
Потребуется - сам с радостью и в кампании таких же фанатиков направишься куда надо, веря в то что "ебешь грязных корпоратов прямо как вот в той игрушке". Или же просто продолжишь терпеть, бухтя и ругая злой образ, пока будут делаться дела. Офк здесь утрирую, но суть такова, ангажированность и желание оправдать действительность сильно искажает картину и мешает жить.

Аноним 30/10/23 Пнд 18:58:10 #438 №532491

>>532483
Окей я перефразирую может криво описал.
Ты уверен что все что нам известно и сообщается от лица корпов и правительства чистая правда без попыток манипуляций обществом?
Разумеется они говорят часть правды, но правда смешанная с ложью правдой не остается. Это все тот же пиздеж, который говорят ради определенной цели.

Корпорации это и есть то карикатурное зло из мультиков, только без слабости и глупости.
В мультиках злые корпорации побеждают потому что так хочется потребителю, который в реальности сосет у любой такой корпорации практически без вариантов.

Это обычные специалисты сидящие на зарплате и контрактах, скучно и в обычной рабочей обстановке, делают то что не хотят отдавать конкурентам и думают как извлечь, как можно больше прибыли. И ради этого они пойдут на все что угодно, в рамках закона ну или обходя его пользуясь дырами.

И что тут мешает скрывать свои лучшие разработки, и подкидывать мусор или полуправду специалистам конкурентам? Желая распылить их силы и запутать их специалистов выигрывая себе время? Что бы получить больше денег?
Чё тут такого невозможного? Работа по госконтрактам? Скрытие корпоративных секретов? Следование определенному плану для извлечения максимальной выгоды?

Аноним 30/10/23 Пнд 19:13:28 #439 №532497

>>532491
> правда смешанная с ложью правдой не остается
У тебя какое-то бинарное мышление. Ты может и на любые слова политиков ВРЁТИ кричишь? Очень сложно рассказывать абсолютную истину, т.к. рассказывающий даже при полной честности может дезу нести по незнанию. Так же и пиздеть на 100% невозможно, уже при частичном пиздеже это жёстко палится. Из любого пиздежа можно получить информацию.

Аноним 30/10/23 Пнд 19:14:07 #440 №532500

>>532491
Бля чувак, успокойся.
Лучше расскажи ллм и своих суждениях и прикажи искать им подтверждение или наоборот с тобой спорить - опровергать. Потом сделай набор колоритных карточек где есть четкая позиция по данному вопросу, добавь к ним нейтральные или те, кому вообще чуждо все это, и начни им это затирать, оценивая реакцию. Потом составишь конспирологический рейтинг, покажешь истории, а мы тут будем разбирать по частям почему ты неверно тестишь и оцениваешь какие модели лучше сработали. Такое уже интересно, а не это вот все, будешь красавчиком, развивающим направление, а не поехом что рассуждает о чем не понимает. Заодно и сам удовольствие получишь.

Аноним 30/10/23 Пнд 19:29:46 #441 №532512

>>532500
>поехом что рассуждает о чем не понимает
Тебе то конечно лучше знать что я там понимаю, а что нет, и насколько верно. Ну да
>>532497
>У тебя какое-то бинарное мышление
Так и не ответил в чем я неправ, ну да ладно. Дальнейший разговор бессмесленен

Тред действительно не про это, ведь обсуждаемая тема никак не относится к локальным нейронкам.

Аноним 30/10/23 Пнд 19:33:35 #442 №532513

>>532343
>> Далее, следует учесть тенденцию некоторых членов этих групп придавать большее значение личному эго, чем объективной анализе и открытому диалогу. В таких условиях, альтернативные мнения часто встречают презрение вместо уважительной дискуссии; люди, которые выражают сомнения или критические замечания относительно определённых подходов или методологий, игнорируются как незнающие или наивные. Таким образом, любой значимый обмен идеями становится подавленным, так как члены форума боятся преследований, если они отступят от установленных более голосными жителями форума границ.

Сетка сечет фишку, это кстати кто? гопота или локалка?

Аноним 30/10/23 Пнд 19:57:04 #443 №532524

>>532277
>Можешь подробнее, что это значит? Там разве две или более инструкций? Оно же единым промптом идёт.
Посмотри на формат вот тут: https://github.com/tatsu-lab/stanford_alpaca
И сравни со своим промптом. У тебя ### Instruction и ### Response идут перед каждым сообщением.
>>532343
>Между ответами на дефолтные вопросы гопотой и указанием "сформируй текст по такому шаблону не меняя содержимого" есть разница, так что ты зря. Хотя проблема действительно встречается, претензия обоснована.
Я не про содержание датасета, а именно про стиль и разнообразие. Гопота - это считай что один автор, причем достаточно плохой, поскольку текст написанный нейронкой отличается от текста написанного людьми не в лучшую сторону. Для бенчмарков может быть и пофиг, но для ролеплея это очень, очень плохо, даже если нет цензуры.

Аноним 30/10/23 Пнд 20:20:51 #444 №532545

>>532512
Самое неблагодарное занятие - доказывать дураку что он дурак.
Ты очень уверенно оперируешь непростыми и разнородными понятиями, складывая их в систему, будто хозяин мира крутейший топ менеджер. Значит или круто соображаешь, шаря во всех этих темах, или просто глуповат. Учитывая чрезмерное упрощение некоторых аспектов, огромную уверенность и построение концепций, игнорирующих реальность - на первое не похоже. И сам факт рассуждений ни о чем, не в качестве фантазий или рофлов, а с серьезными щщами - рили? Говорят что самый популярный мотив подобного - оправдать жизнь, которой недоволен, и обозначить непобедимного виновника всех проблем. Похоже, заодно радикализм, чрезмерную убежденность и желание всюду влезать с этой темой объясняет.
>>532513
> локалка?
Да вон по "голосными" видно, синтия, она же и переводила.
>>532524
Все так, потому, как минимум, нужно иметь определенное количество разнообразного текста в разных стилях и авторах. Там про то что нет ничего плохого обрабатывать его нейронкой, если сами части текста не меняются.

Аноним 30/10/23 Пнд 21:33:47 #445 №532618

>>532545
>Самое неблагодарное занятие - доказывать дураку что он дурак.
Особенно когда он, не понимая то что ты говоришь, уверен в том что он прав, а ты дурак

> Значит или круто соображаешь, шаря во всех этих темах, или просто глуповат.
Два стула? Кто там про бинарное восприятие мира вещал?

> Говорят что самый популярный мотив подобного - оправдать жизнь, которой недоволен, и обозначить непобедимного виновника всех проблем. Похоже, заодно радикализм, чрезмерную убежденность и желание всюду влезать с этой темой объясняет.

А это просто комбо диванной аналитики и спгс, ведь ты точно знаешь лучше меня что я имел ввиду анон?

Вместо обсуждения идеи все скатывается либо к придиркам к мелочам, либо к придирки к терминологии, либо доведение идеи до абсурда и другие способы увести разговор в сторону и доказать, что ты дурак.
Тупой переход на личности, ну серьезно, детский сад.

В принципе я вобще зря начал это обсуждать там где не заинтересованы в обсуждении идеи, а только в удовлетворении своего чсв.
Все это просто пустые доебки

Аноним 30/10/23 Пнд 21:47:20 #446 №532639

>>532618
>либо к придирки к терминологии
Тут нормально, ибо с ней всегда есть путаницы, и 90% споров в интернете это споры, где спорящиеся просто называют разными словами одно и тоже (или одно и тоже разными словами).

Аноним 30/10/23 Пнд 21:52:56 #447 №532648

>>532639
>называют разными словами одно и тоже (или одно и тоже разными словами).
Вот это и вымораживает, неспособность понять о чем речь по аналогии. Человек считает себя умным но не способен в образное мышление?
В принципе средний обитатель инета такой и есть, отсюда и тупые споры ни о чем

Аноним 30/10/23 Пнд 21:56:26 #448 №532651

>>531171
> ГигаСайга (Лора, т.е. адаптер) поверх ruGPT-3.5-13B от Сбера
> А вот это интересно, зачем русифицирующая лора поверх изначально русскоязычной сетки?
Напоминаю, что сайга — это не столько русский язык, сколько знания на русском языке. Там датасеты в открытом доступе лежат, там чисто вопросы-ответы со всяких яндекс-вопросов, стаковерфлоу и прочего.
Это скорее вопрос-ответная лора изначально, а русификация — побочный продукт.

>>531205
Скайрим. Щас бы вспоминать самую убогую часть серии (ладно, арена могла быть хуже, не играл=).
Ну смотри, у тебя к знаниям и весам оригинальной модели добавятся знания и веса лоры. Это не значит, что модель РЕЗКО станет думать только древними свитками. Просто она будет чуточку чаще вспоминать их, и при прямом вопросе — чаще отвечать верно, меньше придумывая.

Лорбук же даст тебе непосредственно контекст по ключевому слову, который она с высокой вероятность обработает и выдаст прямо. Более грубый, но более действенный способ.

>>531236
> Лорбук конечно лучше чем ничего, но херит скорость из-за того что каждый раз из-за него почти весь промпт переанализируется.
Ну он точно лучше лоры. =) Особенно лоры на большую модель. Особенно маленькой лоры на большую модель.
А лучше лорбука — тренированная с нуля модель, у которой вообще нет знаний ни о каких других вселенных (в том числе — о реальности), кроме нужной тебе. Вот там будет лучше всего.

>>532215
> зачем мышка когда есть клавиатура
Блин, ну лол, чувак, ты не поверишь, но иногда забиваю на мышь, на клаве бывает быстрее и удобнее. =)
Не, я не о том, что мышка не нужна, я твой тейк понял, он верный.
Но просто кекно, что так-то это не лишено толики смысла.

> Лично я жду появления полностью автономных голосовых помощников
Ну, чисто технически, то что ты написал, уже щас можно реализовать, просто муторно и всем лень.
Ты ждешь готовую, халявную и легкую реализацию.
А так, я не удивлюсь, что кто-то лично себе такую хуйню замутил.
Энтузиастов всегда хватало, свой умный дом построить. Так и тут, свой умный компуктер.

> корпы тоже выкатят такой функционал
Так выкатили пару недель или месяц назад. Бинг в новом обновлении Винды 11.
С подключением, братан, я смотрю, ты за пределы локалочек уже давненько не выходил в эти наши интернеты. =)

>>532232
В ОБЩЕМ, вроде как да, но в частностях нет.
В зависимости от роли, может ответить «че бля?»
При обмазывании калом может сказать прямо, что польщы нет, а ты дебил.
Ну, то есть, не все так просто утрированно.
Если ты не будешь менять промпта, или прямо запишешь, что она обязана соглашаться — то да. Если же пропишешь ей минимально адекватно поведение, то паттерн «йзщуацузаоцщут4134234234» — «дебилблядь».

>>532236
Ты изобрел ООС/Thinking и вырезание регулярками? Этим несколько анонов из треда пользуются уже полгода.

Мне лень искать и реплаить, просто напишу:
Нейронки нормально умеют анализировать и выдавать соответствующий характеру ответ, тут проблем нет. 13Б так точно вполне норм поясняет, почему со мной не согласна, и находит вполне себе логичные обоснования своему мнению, которые мне в голову не приходили.
Да, я ей просто тест скормил, который меня попросили разослать знакомым.

>>532279
Это более умный подход, чем просто ООС/Thinking, но и результат там лучше.
Не пытался, потому что хватает более простых вещей.
А вообще, какие-то там ленгчейны были в убабуге. Но там че-т непонятное.
А умные и не ленивые просто ленгчейн оригинальный сами запиливают. И не делятся. =)

>>532347
> Его бы вообще в карточку с примером диалога, или что-то в системный промт универсальное чтобы не таскать туда сюда. Задача не самая простая, да.
Разве? ИМХО, как раз не очень сложная.
В системный промпт пихаешь, чтобы в начале писала мысли, а потом давала ответ и все. Разве нет?
Хз, у меня такое работало, но мне просто не понадобилось, я и не стал доводить до ума.
Но может там хард ту мастер, и рил не заставить работать идеально, хз, канеш. Не утверждаю, ибо не шарю.

>>532446
>>532458
Интересный тред.
Тут ничего точного я сказать не могу, ибо хуй его знает.
Но чисто мое мнение, что истина где-то посередине.
Т.е., конечно, возможностей у мелкомягких больше. И очень вероятно, что их технологии продвинулись дальше опенсорса.
Но вряд ли сильно, проверить эту хуйню мы можем просто сравнив чатгопоту с лламой-2 в лоб. Не вижу невероятной гениальности первой на фоне второй. Может у них в подземных кабинетах стоитгпт-5 или сразу 6, и там все опережает, но на публику у них успехи не так уж велики. Однако — они эти успехи успешно монетизируют, а что еще надо? Это делается по большей части ради дениях, и пока тут все норм. Не вижу, чтобы корп сегмент повально отказывался от апи чатгопоты в пользу лламы. Всему находится свое применение.
Так что, конспирология — это база, я и сам параноик на максималочку, но стоит признать, что у них там и правда все прозаичнее (не «менее», а «более» прозаичнее, кстати) и проще.
Короче, в реальности баланс между точками зрений, ИМХО.
Деньги. Ето цель. С етим все хорошо.

>>532471
> Именно поэтому нет ни одного слива никакой инфы ни от одной корпорации о том как и что они делают?
ПАДАЖЖИ!!! Как это нет?
А тот же инженер, который тестил гугловскую сетку и утверждал, что она живая? Вот тебе слив инфы!
Что значит, он нес хуйню и ты в нее не веришь? Братан, так сливы они такие и есть — бредовые. А ты что хочешь, сухие документики «наше перплексити выше их перплексити на 20%»? Так им похую да и такие сливы тоже были.
Так что все норм, сливы есть, просто в них или не верят, или просто игнорят.

>>532483
Ты вот заикнулся за игру, и создал ощущение, что ты чел из первой вотч догз, а твой собеседник — из второй.
Вторая такое говно про мамкиных анархистов, которые борятся с системой ради борьбы, без какой-либо реальной цели, а первая прям база про побитого жизнью чела.
Но это не в обиду кому-то из вас, просто мысля.

>>532491
> И что тут мешает скрывать свои лучшие разработки, и подкидывать мусор или полуправду специалистам конкурентам?
А где тут конспирология-то?
И что в этом такого?
Все что ты описал буквально значит «обычные ребята». Ну, козлы, но 99% козлы.
Ты знаешь, что такое норма? Это не «адекватность». Это усредненный показатель.
А конспирология — она не про норму, она про ебанутость, которую скрывают.
А тут скрывают норму, унылая хуйня, похуй.
Ты начал так, будто бы они мир захватывают.
А потом вдруг оказалось, что не захватывают.
Так зачем было поднимать тему, где нет никакой конспирологии, а есть просто банальный секрет Полишинеля? =(
Чисто кликбейт. =)