24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Привет сосач, вчера гудели треды типа "ДОКУМЕНТОВ ИЗ ВК" и все мамины хаЦкеры спрашивали, как можно просмотреть документа по ИД пользователя. Написал скрипт для этого дела, кто хочет, может попробовать, но предварительно нужно установить OpenServer, т.к скрипт написан на PHP. Манул по установке можно найти в инете или вот для примера линк https://www.youtube.com/watch?v=HVWA6rWXG8s.
После установки и запуска OpenServer'a нужно скачать скрипт http://rgho.st/8Y8LWpXMc и распаковать папку "vk-doc-parser" в С:\OpenServer\domains\ перезапустить OpenServer, делается это так, находите в трее иконку openServera(в виде флажка) нажимаете ПКМ и выбераете "перезагрузить". После перезапуска сервера снова нажимаете ПКМ на иконке OpenServer'a выбираете "дополнительно->консоль" затем вводите команду cd domains\vk-doc-parser и запускаете скрипт командой php index.php далее в консоли выйдет сообщение "Pleace, enter User ID:" после этого вводите ИД пользователя и нажимаете Enter (ИД нужно вводить, вот так 362509508, а не так id362509508). После выйдет сообщение "Please enter a Doc ID to read from this point, or press "Enter" if you want to start from scratch:" сюда нужно вводить ИД дока для чтения с этой точки, проще говоря если вы введете 5000, то документы будут искаться начиная с 5000 до 999999999, а если нет, то 0 до 999999999. Если вы хотите проверить все ВОЗМОЖНЫЕ документы пользователя просто нажимаете Enter и пропускаете данный шаг. После нажатия Enter скрипт начнет свою работу, и будет выводить сообщения в консоли, такие как:
Loading doc ID 0... - Загрузка документа с 0 ИД; Found doc with ID 0 - Значит, что найден документ с 0 ИД; Document with ID 0 not found - Значит, что не был найден документ с 0 ИД;
Комбинаций перебора овер до ху.., а именно 999999999, и сколько времени это займет ХЗ, плюс еще задержка в несколько секунд после каждой итерации, дабы ВК не выплюнул капчу. Если вас это дело переутомит нажимаете Ctrl + C и скрипт тормозит свою работу. Все Документы которые удалось найти будут лежать в С:\OpenServer\domains\docs.
Данные действия на Ваш страх и риск, кто умеет лучше обложитесь проксей. Скрипт ни какие ваши данные не ворует, можете глянуть код он очень прост.
Я не оп но добавлю,сейчас ВК очень и очень не любит посторонние скрипты.И есть риск того что акк заблочат.Рекомендуется делать с фейка.И на чужой машине где нет акка вк.
>>149441285 (OP) Если ты не задал Doc ID, то он идет и перебирает все возможные доки пользователя начиная от 0 до 999999998 если находит доки складывает их в папку docs
Какая-то часть из 999999999 является является осмысленной (дата, время, айди пользователя или еще что-то)? Или какие цифры вводить? Короче, как сузить поиск?
что на маке использовать вместо OpenServer? какая скорость соединения нужна? если буду использовать йотовский модем с бесплатным доступом, чтобы не заболотили мой основной айпи, хватит скорости?
<?phpini_set('display_errors','Off');// Запрос ID пользователяprint 'Pleace, enter User ID:';$userId=fgets(STDIN, 255);// Запрос ID дока для чтения с этой точкиprint 'Please enter a Doc ID to read from this point, or press "Enter" if you want to start from scratch:';$docId=fgets(STDIN, 255);getUserDocs ($userId, $docId);function getUserDocs ($userId, $docId){$userId=trim($userId);$docId=trim($docId);// Если не задан ИД дока для чтения с этой точкиif ( ! $docId){$docId=0;}// Запрос ID если данные не были введеныif (empty($userId)){exit('Error: You have not entered a user ID');}// Создание дректории для доковmkdir('./docs', 0777, true);for ($docId=$docId; $docId < 999999999; $docId++){print 'Loading doc ID ' . $docId . "...\n" ;// Задержка скрипта, во избежаение банаsleep(rand(2, 7));// Формирование url для запроса$url='https://vk.com/doc'.$userId.'_'.$docId;// Загрузка документа$content=file_get_contents($url, true);// Проверка суще-ет ли документ для текущего ИДif (strpos($content, 'docs_panel_wrap')){print 'Found doc with ID ' . $docId . "\n";$file=fopen('./docs/' . $docId . '.html', 'w');fwrite($file, $content);}else{print 'Document with ID ' . $docId . ' not found' . "\n";}}}
>>149439893 (OP) >http://rgho.st/8Y8LWpXMc Случилось так, что один мальчик в один прекрасный день тоже скачал себе архив с Пелевиным. И не поступил в институт. Его забрали в армию, в РВСН, и заставляли там сливать гептил налево. ПАЦАНЫ, НЕ КАЧАЙТЕ! ВЕСЕННИЙ ПРИЗЫВ СКОРО!!!
>>149443807 Что деанон блять? На гитхабе паблик репозитории. Или код закинь, я на питон или шарпы или джаву перепишу, нахуй мне надо твои сервера устанавливать, даун
>>149444095 <?php ini_set('display_errors','Off'); // Запрос ID пользователя print 'Pleace, enter User ID:'; $userId = fgets(STDIN, 255); // Запрос ID дока для чтения с этой точки print 'Please enter a Doc ID to read from this point, or press "Enter" if you want to start from scratch:'; $docId = fgets(STDIN, 255); getUserDocs ($userId, $docId); function getUserDocs ($userId, $docId) { $userId = trim($userId); $docId = trim($docId); // Если не задан ИД дока для чтения с этой точки if ( ! $docId) { $docId = 0; } // Запрос ID если данные не были введены if (empty($userId)) { exit('Error: You have not entered a user ID'); } // Создание дректории для доков mkdir('./docs', 0777, true); for ($docId = $docId; $docId < 999999999; $docId++) { print 'Loading doc ID ' . $docId . "...\n" ; // Задержка скрипта, во избежаение бана sleep(rand(2, 7)); // Формирование url для запроса $url = 'https://vk.com/doc'.$userId.'_'.$docId; // Загрузка документа $content = file_get_contents($url, true); // Проверка суще-ет ли документ для текущего ИД if (strpos($content, 'docs_panel_wrap')) { print 'Found doc with ID ' . $docId . "\n"; $file = fopen('./docs/' . $docId . '.html', 'w'); fwrite($file, $content); } else { print 'Document with ID ' . $docId . ' not found' . "\n"; } } }
>>149439893 (OP) >устанавливать говносервак ради 10, а то и меньше строчек кода Проиграл с пхп-макаки. Такой элементарный парсер пишется за пару минут на javascript.
>>149446808 Только сдаётся мне, что чекать файлы эта прога может очень долго (550627237 файлов нужно прочекать, в секунду обрабатывается около 2к документов. Итого полный цикл на одного юзера вк составит 76 часов, если конечно я всё правильно рассчитал)
>>149447745 550627237 это примерное количество документов на момент когда ты запустил скрипт. "# Получаем верхнюю границу поиска. Предполагается, что за секунду # заливается около 2-3 документов. Нормальное значение дает 2.7, например. # Нижняя граница - 0, но, наверное, ваш внук заберет результаты, если до нее дойдет. docsPerSecond = 2.7 fromDoc = round(411265500 + (int(time.time()) - 1438670946 ) * docsPerSecond)"
>>149448327 Тупо берет, и бежит по всем документам вкшечки, сверяя заданный id с id документа, если сходиться, то кидает документ в заданную папку, нет - бежит дальше. Программа уровня васяна с какого-нибудь политеха
>>149449739 Прога подставляет id всех существующих документов (а их 550627237) к id проверяемой страницы и узнаёт, существует ли такой документ. Таким образом один аккаунт и проверяется ~76 часов
А что если заебенить ДБ, в которую сохранять найденные документы? А прога будет перебирать только еще ненайденные документы, тем самым каждый ускоряя поиск по одному айди.
>>149450273 В идеале в конце должен получится список айдишников, а для каждого список найденных документов. Но звучит как дохуя места для ДБ, не знаю, возможно ли такое запилить.
>>149450510 Идея мегагодная, на самом деле. Я программист-кун, но помочь к сожалению не могу ничем. Сфера у меня другая.
Кстати, я ещё чего думал, может кто сможет написать скрипт который бы сохранял тупо все последние загруженные документы? Например 2000 последних загруженных в вк документов. Так гораздо удобнее искать годноту, чем по этим мини-превьюшкам в вк
>>149450731 Если ты не зелёный, и правда можешь сделать это, может тогда запилишь тред на тематике, чтобы не смыло? А то у всех часовые пояса разные, и не все сидят в /b/ 24/7
>>149450731 Что насчет единой бд с откопанной годнотой? Под такое дело мне и впс\вдс оплатить не жалко будет. >>149450903 Поддерживаю, тут тред смоет к херам.
Достаточно годной идеей, которая становится доступна при создании пусть даже не общей БД, является поиск рандомных ид документа, не совпадающих с предыдущими. После нахождения хотя бы одного -- поиск по возрастанию и убыванию от найденного, допустим, на 100. Шанс влететь на годноту возрастает.
>>149452597 По всей видимости он хотел, чтобы погромист, который собирается реализовать просьбы анонов (по созданию БД, etc.), запилил тред в тематике прямо сейчас и кинул бы ссылку, чтобы потом его же не проебать
Бляха-муха, да что ж такое. Оставлю на ночь, посмотрим вообще хоть что-нибудь найдёт ли. Мне интересно знать для начала хотя бы рабочая ли вообще прога или нет.
>>149450731 Ну, во-первых, надо переписать с ебаного пыха на нормальный язык. Во-вторых, по сапу на хабре есть темка, в которой чувак уже исследовал распределение адресов, вроде. В-третьих, я думаю, что случайные айдишники, вместо последовательного перебора улучшат временную сложность, засчет мат распределения.
Нет смысла ставить поиск до 999 999 999 тк сейчас на всем вк всего 443 428 300 доков. Ставь от 444кк и обратный цикл, хоть немного ускоримся. Зачем вообще токен берем?
>>149454388 Ты посмотри видео, муж - дегенерат. Причем на лицо тоже. Причем он её дропнул с ребенком. Я только пользу обществу принес, ну и молодую красивую девчонку под нового ебыря готовлю
вариант1: 1. поставьте довнлоад мастер, там есть пакетная закачка потом натравите: https://vk.com/doc335837778_437957$$$ потом задайте от 000 до 999 потом смотрите на скачанные файлы, где размер другой - там есть что-то
2. - генерите урлы в екселе - стравливаете менеджеру закачек
из плюсов можно выбирать количество потоков из минусов - куча мелких файлов которые нужно чистить
>>149473197 поставил requests но теперь это logger.py", line 12 print bcolors.OKGREEN + "[>] " + str + bcolors.ENDC ^ SyntaxError: Missing parentheses in call to 'print'
>>149474958 запусти напрямую, по идее тебя должно перекинуть на страницу с access_token или просто вкинь в папку и auth access_token.txt предварительно вписав туда токен
>>149475111 Не попал хуком на миде Не попал хуком на топе Ты наверно худший пудж во всей Европе В команде твоей пудж? Кидай ему репорт Ведь по закону подлости он по любому мид ебет
Переписал с PHP на Python кому надо пользуйтесь, нету ебалы с токенами просто запускаете скрипт и возможно радуетесь.
Скачиваем скрипт http://rgho.st/6tJQQJNr9 запускаем консоль переходим в директорию со скриптом при помощи команды cd путь_куда_вы_распоковали_\vk-doc-parser далее запускаете скрипт командой python parse.py скрипт попросит ид пользователя
Please, enter User ID:
Вводите ид нажимаете Enter, далее необходимо ввести ид документа
Please. enter a Doc ID to read from this point, or press "Enter" if you want to start from scratch:
Вводите ид документа для чтения с этой точки, и нажимаете Enter
Далее необходимо ввести вариант парсинга, по возрастанию или убыванию. Если ввести знак < и нажать Enter, то поиск будет идти от большего к меньшему, т.е 1,2,3 ..., n. Если ввести знак > и нажать Enter, то поиск будет идти от меньшего к большему, т.е 3,2,1, ...
Please, enter a search option: >
Таким образом можете комбинировать как угодно, все найденные файлы будут сохранены в папке dosc с расширением .html (их можно открыть в обычном браузере)
У радиокота документы начинает листать с 550 млн., но последние фотки, датированые сегодняшним днем имеют номер 443 млн. То есть там 100 млн. впустую можно листать
Погромисты, я не шарю в вашем колдовстве, но у меня предложение по улучшению проги. Узнать айди последнего загруженного файла вашей еот-тян легко. Можно попросить скинуть вам файл или иным способом добыть. Так что поиск наверное лучше делать, чтобы можно было выбирать последий номер и по понижению исследовать вниз
Как поставить библиотеку на питон? дайтескачать.. Traceback (most recent call last): File "X:\new_del\vk-doc-parser\parse.py", line 2, in <module> import urllib.request ImportError: No module named request
>>149505800 не для того, кто командную строку раз в год запускает Скачал я скрипт - >>149483021 Пытаюсь делать по инструкции, но у меня руки не под то заточены. Что я делаю не так?
>>149483021 >Переписал с PHP на Python кому надо пользуйтесь, нету ебалы с токенами просто запускаете скрипт и возможно радуетесь.
Скачиваем скрипт http://rgho.st/6tJQQJNr9 запускаем консоль переходим в директорию со скриптом при помощи команды cd путь_куда_вы_распоковали_\vk-doc-parser далее запускаете скрипт командой python parse.py скрипт попросит ид пользователя Анон, объясни, пожалуйста, о чем здесь говорится, что за Питон, что за токены, какую консоль запускаем, в какую директорию переходим?нихуянепонятно
>>149507858 Нагуглил, что такое питон, поставил его, запустил наконец. Мейлач образовательный Теперь пара вопросов. Тут кто-то про бан говорил, но откуда бан, если свой айди не вводишь? И почему на ноуте, куда я поставил этот скрипт консоль закрыается при запуске? Где-нить можно посмотреть лог ошибок?
>>149509164 Скорее всего нужен циферный айди, тогда закрываться не будет. Бан может быть по ip, там увидят что за анон сидит и забанят. Либо речь была о радиокотовском скрипте, где аутент требовался. мимокрокодил
>>149439893 (OP) и чо, рабочая тема? Планирую заняться этой ебалой от нехуй делать. Если я тупо с модема(мтс коннект) запилю всю эту тему, ничо не будет?
С какогото года в вк допилили метку к докам "недоступен в поиске" - следовательно документы созданные после этого момента автоматически имеют метку "недоступен в поиске" - и не показываются и не ищутся скриптом. следовательно писечки надо искать до момента обновления сайта. и следовательно доки писек заканчиваются не 444 кк а гораздо раньше.
Четко объясните, что делать с этой прогой, чтобы не словить бан? Могу я оставить ее в открытом виде и пойти гулять, затем вернуться домой и полутать найденное не схватив бан?
Если использовать метод docs.getById, то нельзя делать запросы чаще секунды, иначе идет ошибка. Реализовал вчерашние идеи, сейчас подумаю, чего еще добавить. Завтра вкину, если это кому-нибудь нужно, еще предстоит потестить. Стоит напомнить, аноны, что погромист из меня никакущий, золотых гор не обещаю. Сейчас буду прикручивать к бд, чтобы случайный перебор точно не повторялся. Также жду еще идей. Работает оно, к слову, на apache+php+mysql.
>>149511546 Чувак, ты бы хоть тред прочитал. Во-первых, тут оказалось, что последние залитые документы не находит, если не выставлять доступность и менять привратность. И второе - для проверки всех документов пользователя нужно 72 часа.
>>149512587 Ага, выйдем с плакатами хуя Медведева под кремль послезавтра. Вот ему бомбанет, Навальный нам бабок даст. Да стока, что от мейл.ру отвяжемся наконец-то.
Держите СОЛУШН 1. Качаем curl: http://www.paehl.com/open_source/?download=curl_752_1_ssl.zip 2. Создаем на диске D, папку vk, закидываем туда curl.exe, создаем go.bat, редактируем 3. Вставляем curl -k https://vk.com/doc341219317_4436533[00-99] -o #1.html 4. сохраняем. 5. запускаем, сортируем файлы по размеру, те которые отличаются - имеют картинки, даблклик и в браузере картинка. 6. Чтобы добавить новое урл, нужно заменить старый. (работаем только в батнике) 7. Можно задавать диапазоны хоть 1234567[0-9], хоть 123[00000-99999], хоть аллаха 8. кому лень делать - залил на ргхост: http://rgho.st/68l4fhNn6 9. скорость большая, можно ебашить задержку через команды курла 10. А теперь можно и пивка
Итак великий прогер-анонимус, да и просто анон. Скажи, какая прога на твой взгляд бэст? Просто их так много, я ж запутался уже. Пока работает радиокот на жертве, есть ли программы лучше него, стоит ли прерывать поиск и переходить на другое?
>>149439893 (OP) Спасибо, анон, напомнил, что у меня в документах море всякой хуйни валялось, которое не нужно видеть другим людям, удалил всю эту ебатню. инбифо кому ты нужен ноулайфер чмо пидор гроб гроб
Можете объяснить для дауна, что нужно качать и что делать потом? Вот только это делать нужно? -> >>149483021 Я просто ни с чем, сложнее куклоскрипта не сталкивался в жизни.
>>149526247 Епт, это же курл, консольная качалка. Ее не надо открывать, ее надо из консольки запускать либо своей командой, либо заботливо написанным анончиком батником.
>>149515349 Помогите кретину! Вот, например, я хочу посмотреть доки не этой пизды, а другой, какую ссылку мне нужно будет вставить вместо >curl -k https://vk.com/doc341219317_4436533[00-99] -o #1.html? Помогите ньюфагу и я пойду парсить нормально.
>>149542430 >https://vk.com/id143677142 Смысл, последние года она сидит онли с телефона ,поэтому на шанс поймать там что либо равен 1%. Так что незачем тратить время на твое желание. Хотя ты даже и не понял как это связанно с ее фотками.
>>149515349 какой приблизительный диапазон размера файла без интересующих нас данных? Можно исходя из веса, прикрутить простенький монитор директории, который сам же и будет подчищать за пользователем не нужные файлы. Т.е. ты поставил себе диапазон поиска от 0 до овер дохуя, и ушёл, а оно уже само там контролирует процесс, делитит что тебе не надо и пр.
Вкатился. Но документ должен быть в общем доступе, думаю все более менее пользующиеся впашей люди давно поудаляли всё. Так что профиты которые можно извлечь минимальны.
Потестил питона на фото из своего открытого альбома. Что-то нихуя он не ищет. Почему? Поставил номер документа на 1 меньше, чем у меня есть и он должен был сразу же найти это фото, а он не нашел. В чем суть?
>>149439893 (OP) ОП-хуй. Где ты видел, чтобы id документа было например 1 или 11 или 111 ? Перебор можно смело начинать с 100000000. Но и это еще не всё - кто тебе мешает использовать многопоточность и Tor?
>>149562149 Нет, самописный кусок пиздеца, тестирую еще, ибо в некоторых случаях ошибками сыпет. Перекатывайте тред, днем-вечером выложу на всеобщий суд.
и все мамины хаЦкеры спрашивали, как можно просмотреть документа по ИД пользователя.
Написал скрипт для этого дела, кто хочет, может попробовать, но предварительно нужно установить OpenServer, т.к скрипт написан на PHP.
Манул по установке можно найти в инете или вот для примера линк https://www.youtube.com/watch?v=HVWA6rWXG8s.
После установки и запуска OpenServer'a нужно скачать скрипт http://rgho.st/8Y8LWpXMc и распаковать папку "vk-doc-parser" в С:\OpenServer\domains\ перезапустить OpenServer, делается это так, находите в трее иконку openServera(в виде флажка) нажимаете ПКМ и выбераете "перезагрузить". После перезапуска сервера снова нажимаете ПКМ на иконке OpenServer'a выбираете "дополнительно->консоль" затем вводите команду cd domains\vk-doc-parser и запускаете скрипт командой php index.php далее
в консоли выйдет сообщение "Pleace, enter User ID:" после этого вводите ИД пользователя и нажимаете Enter (ИД нужно вводить, вот так 362509508, а не так id362509508). После выйдет сообщение "Please enter a Doc ID to read from this point, or press "Enter" if you want to start from scratch:" сюда нужно вводить ИД дока для чтения с этой точки, проще говоря если вы введете 5000, то документы будут искаться начиная с 5000 до 999999999, а если нет, то 0 до 999999999. Если вы хотите проверить все ВОЗМОЖНЫЕ документы пользователя просто нажимаете Enter и пропускаете данный шаг. После нажатия Enter скрипт начнет свою работу, и будет выводить сообщения в консоли, такие как:
Loading doc ID 0... - Загрузка документа с 0 ИД;
Found doc with ID 0 - Значит, что найден документ с 0 ИД;
Document with ID 0 not found - Значит, что не был найден документ с 0 ИД;
Комбинаций перебора овер до ху.., а именно 999999999, и сколько времени это займет ХЗ, плюс еще задержка в несколько секунд после каждой итерации, дабы ВК не выплюнул капчу. Если вас это дело переутомит нажимаете Ctrl + C и скрипт тормозит свою работу. Все Документы которые удалось найти будут лежать в С:\OpenServer\domains\docs.
Данные действия на Ваш страх и риск, кто умеет лучше обложитесь проксей. Скрипт ни какие ваши данные не ворует, можете глянуть код он очень прост.