Сохранен 3
https://2ch.hk/web/res/120766.html
24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

BrowserAutomationStudio

 Аноним 31/03/19 Вск 09:46:32 #1 №120766 
12341234.png
Снимок.JPG
HELP
Пытаюсь парсить инфу с быдлятни.

Вот что получается:

Текст при указании селектора CSS "wall_post_text" парсится нормально, а с картинками при выборе селектора "page_post_sized_thumbs" с атрибутом "style" летит вся хрень которая в этом атрибуте есть "width: 510px; height: 510px;background-image: url(https://sun1-4.userapi.com/c7005/v7005763/17753d/WPoLrSnY1B4.jpg);""
Как же из атребута STYLE вытащить чисто ссылку? Это делаюется с помощью регулярных выражений или как-то по другому?

Вот содержимое поста:
текст:
--------------------------------------------------------------------------------------------------------
<div class="wall_post_text">Покой — это когда тебя не тревожат лишние мысли. Когда ты не беспокоишься, что завтра может произойти то, чего тебе не хочется. Когда тебе не нужно идти туда, куда ты не хочешь. Когда то, что ты делаешь, — это и есть радость. Это когда ты перестаешь анализировать окружающий мир и понимаешь — он просто есть. И ты — просто часть него. И на этом все вопросы замолкают. И вот если этот покой внутри найден, то можно и другим дарить это спокойное, умиротворённое, радостное состояние своей души.</div>
--------------------------------------------------------------------------------------------------------
картинка:
<div class="page_post_sized_thumbs clear_fix" style="width: 510px; height: 510px;"><a onclick="return showPhoto('-45378430_456252701', 'wall-45378430_15256', {"temp":{"base":"https://sun1-4.userapi.com/","x_":["c7005/v7005763/17753d/WPoLrSnY1B4",604,604],"y_":["https://sun1-21.userapi.com/c7005/v7005763/17753e/lK6k3tjyHfg",640,640]},queue:1}, event)" style="width: 510px; height: 510px;background-image: url(https://sun1-4.userapi.com/c7005/v7005763/17753d/WPoLrSnY1B4.jpg);" class="page_post_thumb_wrap image_cover page_post_thumb_last_column page_post_thumb_last_row"></a></div>
Аноним 31/03/19 Вск 13:47:33 #2 №120771 
>>120766 (OP)
>парсить инфу с быдлятни
У них API есть для этого.

>делаюется с помощью регулярных выражений
Да, можно и регуляркой вытащить.
Аноним 01/04/19 Пнд 19:37:54 #3 №120794 
>>120771
С помощью конструктора регуларных выражений сделал такую хуйню https://(.*)\);"\ для текста
width: 510px; height: 510px;background-image: url(https://sun1-4.userapi.com/c7005/v7005763/17753d/WPoLrSnY1B4.jpg);"
В конструкторе все работает, но в самом BASе эта хуйня не срабатывает. В чем прикол?
comments powered by Disqus

Отзывы и предложения