Сохранен 41
https://2ch.hk/b/res/208762114.html
24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Подскажите как парсить сайт, кароче есть сайт,

 Аноним 04/12/19 Срд 16:26:45 #1 №208762114 
2E4DF517-442E-420D-ACEC-C697E59D88DA.jpeg
Подскажите как парсить сайт, кароче есть сайт, там инфа на тыщу страниц, поиска нет по ключевому слову, как чтобы не листать каждую страницу и через поиск по слову не искать а сразу вбить и чтобы он выдал все Сообщения с ключевым словом, программисты призываются в итт тред с меня как всегда
Аноним 04/12/19 Срд 16:27:54 #2 №208762178 
Бамп
Аноним 04/12/19 Срд 16:28:21 #3 №208762201 
D1BED786-F39A-4D5B-A853-33F405191F5F.jpeg
Бамп
Аноним 04/12/19 Срд 16:31:07 #4 №208762342 
>>208762114 (OP)
бамп
Аноним 04/12/19 Срд 16:32:12 #5 №208762397 
>>208762114 (OP)
бамп
Аноним 04/12/19 Срд 16:35:16 #6 №208762560 
>>208762114 (OP)
бамп
Аноним 04/12/19 Срд 16:37:51 #7 №208762706 
Ctrl+F попробуй
Аноним 04/12/19 Срд 16:39:19 #8 №208762786 
>>208762706
Я же написал, там тыщи страниц, заебешься так, моего терпения хватило на 30
Аноним 04/12/19 Срд 16:41:35 #9 №208762928 
Бамп
Аноним 04/12/19 Срд 16:44:59 #10 №208763127 
Бамп
Аноним 04/12/19 Срд 16:47:18 #11 №208763297 
>>208762114 (OP)
Жмешь F12 и изучаешь сайт на предмет автоматического скрола страниц и поиска нужных тебе слов/вызов апишки, откуда данные берутся
/thread
Аноним 04/12/19 Срд 16:49:54 #12 №208763447 
>>208763297
Можно подробнее, нажал хуйня вышла на 4 строки
Аноним 04/12/19 Срд 16:50:51 #13 №208763491 
Бамп
Аноним 04/12/19 Срд 16:53:36 #14 №208763669 
бамп
Аноним 04/12/19 Срд 16:57:04 #15 №208763876 
бамп
Аноним 04/12/19 Срд 17:00:19 #16 №208764073 
бамп
Аноним 04/12/19 Срд 17:03:26 #17 №208764252 
бамп
Аноним 04/12/19 Срд 17:06:37 #18 №208764406 
Есть дополнение для лисы называется Imacros, но есть минусы
- нужный функционал есть только в старой версии, которая также работает только на старой версии лисы
- нужно знать javascript
был ресурс https://nagibaka.ru/ но сейчас почему-то благополучно сдулся
Аноним 04/12/19 Срд 17:10:56 #19 №208764630 
Спаршу все за час (пишу парсеры больше года) 300 руб
Аноним 04/12/19 Срд 17:11:33 #20 №208764666 
>>208764406
На новой не получится?
Аноним 04/12/19 Срд 17:14:17 #21 №208764812 
>>208764666
разрабы ушли в коммерцию и в новых версиях выпилили весь функционал
Аноним 04/12/19 Срд 17:23:47 #22 №208765333 
>>208762114 (OP)
Как самое простое - wget/curl + grep.
Гугли.
Аноним 04/12/19 Срд 17:30:40 #23 №208765709 
>>208765333
Да хуйли гуглить сделай мне блять!
Аноним 04/12/19 Срд 17:32:40 #24 №208765811 
>>208765333
>wget/curl + grep.
сложновато как-то
Аноним 04/12/19 Срд 17:47:39 #25 №208766581 
>>208762114 (OP)
Вбиваешь в гугл site: www.OPHUY.hk "мамка ОПа" и гугл тебе выдаст все ссылки на твою мамку.
Аноним 04/12/19 Срд 17:53:36 #26 №208766898 
>>208766581
ебанутый ? там дохуя их выдаст ты тупой пизда
Аноним 04/12/19 Срд 17:56:41 #27 №208767029 
>>208766898
Ебать тупая мелкобуква.

Выдаст то что надо.
Аноним 04/12/19 Срд 17:59:11 #28 №208767147 
Тут поиск так работает https://arhivach.ng
Аноним 04/12/19 Срд 18:03:52 #29 №208767393 
>>208762114 (OP)
Я для таких вещей пишу скриптик консольный на питоне. Сначала каким-то образом получаю урлы всех страниц (обычно в исходном коде главной страницы можно надыбать, если там пагинация, то просто номерки страниц подставляешь, например).
Потом через requests.get скачиваешь каждую страничку и сохраняешь в словарь, где ключом будет урл страницы. Можно это сохранить в csv файл потом.
Короче, когда у тебя всё есть, банально ищешь нужное слово по значениям словаря, где нашло - выводишь ключ (урл).
Ничего сложного на самом деле.
Аноним 04/12/19 Срд 18:36:19 #30 №208769060 
>>208764630
>пишу парсеры больше года
Ебать ты долго пишешь конечно. Хоть что-то смог написать уже?
Аноним 04/12/19 Срд 18:37:34 #31 №208769128 
>>208767393
Бля сложно для меня это, может плагин какой-то есть
Аноним 04/12/19 Срд 18:41:27 #32 №208769360 
бамп
Аноним 04/12/19 Срд 18:57:14 #33 №208770270 
Вы чо совсем отупели, довены? Какие еще парсы-хуярсы, питоны, скрипты? Как выживете вообще? Любой поисковик может искать по конкретно указанному сайту. Пиздец блять. google ru/advanced_search
Аноним 04/12/19 Срд 19:31:09 #34 №208772161 
>>208762114 (OP)
Дай сайт,может аноны что-то для себя найдут
Аноним 04/12/19 Срд 20:28:41 #35 №208775521 
>>208762114 (OP)
Что за сайт?
Аноним 04/12/19 Срд 21:20:40 #36 №208778394 
>>208772161
Ты охуел? Палить годноту крысодвачерам?
Аноним 04/12/19 Срд 21:23:24 #37 №208778530 
>>208772161
>>208775521
keys.lol вот
Аноним 04/12/19 Срд 21:40:35 #38 №208779509 
Бамп
Аноним 04/12/19 Срд 21:46:56 #39 №208779880 
fed56653b97b6ab3d9959d069b9c1106[1].jpg

За какую сумму примерно программист мне напишет парсер фотохостинга, чтоб последние фотки парсились за день-неделю?
Аноним 04/12/19 Срд 22:36:03 #40 №208782692 
>>208779880
30 т.р
Аноним 04/12/19 Срд 22:54:13 #41 №208783701 
>>208763297
this
comments powered by Disqus

Отзывы и предложения