[a / aa / ad / au / b / bg / bo / c / d / dg / di / ew / f / fa / fd / fg / fi / fl / g / gg / h / ho / hr / ja / k / ls / m / ma / me / mo / mu / n / ne / o / p / pa / ph / pr / r / re / s / sp / t / td / tr / tv / u / vg / w / wh / wm / wp / y] - [Главная]

[Назад]
Ответ
(оставьте это поле пустым)
Имя (оставьте это поле пустым)
E-mail
Тема
Комментарий
Файл
Перейти к
Подтверждение обновить captcha
Пароль (чтобы удалить пост или файл)
  • Разрешённые типы файлов: GIF, JPG, PNG
  • Максимальный размер файла 1536 килобайт и 2048×2048.
  • Изображения размером более 200x200 точек будут уменьшены.

Файл: 1246726044280.gif -(23кб, 350x225) Показана уменьшенная копия, оригинал по клику.
23 №1643  

Коллеги, а почему у двача нет rss-ленты? Я бы добавил себе /pr и /s в google reader.

>> №1647  

Была в сети какая-то хуета, позволяющая на основе регэкспов конструировать рсс-ленты из любых страниц, и вроде бы аналогичная с гуем, но может путаю. Алсо, можешь сам написать чисто под двач, захостить и выложить линк, но я тебе спасибо не скажу, мне рсс похуй.

>> №1650  

ОП, ставь specto. Можно натравить её на раздел/тред и она будет автоматически проверять.
Омич

>> №1651  

>>1650
Specto, я так понимаю, может только сообщать об апдейте страницы?

>> №1654  

yahoo pipes во все поля.

>> №1655  

вот у двача например был запрет в роботс.тхт на бб и прочее, а яху пайпс такие запреты соблюдает и не пущает. олсо пайпс анальное рабство, поэтому через некоторое время лично я запилю свой rss-кравлер борд, суть токова. не знаю, выкладывать ли, потому что если много школьников будут травить кравлер на борду, ей станет бо-бо. с другой стороны, они не будут ф5чить. вобщем, вполне возможно что выложу

>> №1656  

олсо сижу на нульчане в /c/, к вам пришел изза данжон-генерейшн-треда

>> №1658  

>>1655
Зачем твоему краулеру лезть на борду при каждом запросе? Пусть у себя кэширует и обновляет не чаще раза в пять секунд.

>> №1661  

>>1658
ессно он будет все кешить. и лазять каждые пять минут а не секунд, например. но представь, если краулер включат 9к человек. потому что централизованно я его не буду ставить, у меня нет лишних средств щас на хостинг. конечно его не поставит себе 9к человек, но какой-нибудь мудак возьмет и поставит время обновления кажду секунду например.

>> №1663  

>>1654
А ты пробовал сделать на нем парсер контента, для которого нет готовых компонентов? Это вообще реально?

>> №1664  

>>1661
9к человек не поставят. Для этого достаточно, чтобы установка требовала хоть немного умственных усилий.

И да, никто и сейчас не мешает поставить wget выкачивать все борды "каждую секунду". Просто такого придурка забанят по айпи - и он с некоторой вероятностью одумается.

>> №1665  

>>1664
Запрос даже раз в секунду с одного человека - не так и много имхо. Вот я раз в 60 секунд скачиваю все борды, чтобы выводить счётчики постов в правом фрейме, и не забанили пока.

>> №1666  

>>1665
Да, с лишним 1 запросом в секунду я преувеличил.

Впрочем, интересно было бы узнать, сколько запросов в секунду в среднем обслуживает двач в моменты наплыва школоты и какого порядка должна быть дополнительная нагрузка (от тех же краулеров), чтобы ее нужно было принимать в расчет.

>> №1667  

>>1665
че, серьезно? пиздец
лол, вот почему нульч так колбасит перманентно. какие же вы уебки, а )

>> №1668  

>>1667
а, пардон, мне показалось как раз "каждую секунду"
но раз в минуту это тоже жестковато, я себе поставлю неск минут, минут 5

>> №1671  

>>1668
Даже 5 минут, думаю, мало.
Допустим, можно сканировать 1 страницу борды и все треды на ней. Тогда надо прикинуть время, за которое изменения на борде выходят за пределы этой первой страницы. И да, многие рссфаги - слоупоки, так что часто обновлять вовсе и не нужно.

>> №1672  

>>1667

>лол, вот почему нульч так колбасит перманентно. какие же вы уебки, а )
>вот почему нульч так колбасит перманентно. какие же вы уебки, а )
>нульч так колбасит перманентно. какие же вы уебки, а )
>нульч
>)

how to spot a cancer in two easy steps

>> №1673  

>>1672
На нульче /с тоже годная доска. Но тормозит оно все пиздец как.

>> №1681  

Реклама.
http://iichan.ru/b/res/670292.html
http://nowere.net/b/res/17722.html
http://www.0chan.ru/s/res/48290.html

Вкратце — джаббер-гейт.
[email protected]

>> №1700  

>>1681
Спасибо, погляжу. Альсо, сейчас тоже велосипедю с парсингом борд.



Удалить пост []
Пароль
[a / aa / ad / au / b / bg / bo / c / d / dg / di / ew / f / fa / fd / fg / fi / fl / g / gg / h / ho / hr / ja / k / ls / m / ma / me / mo / mu / n / ne / o / p / pa / ph / pr / r / re / s / sp / t / td / tr / tv / u / vg / w / wh / wm / wp / y] - [Главная]