Сохранен 24
https://2ch.hk/b/res/166455253.html
24 декабря Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Аноним 07/12/17 Чтв 00:45:57 #1 №166455253 
14601163989010.jpg
Няши, я знаю, здесь есть погромисты.
Есть большие объемы текста. Надо анализировать их на наличие ключевых фраз (тегов), и расставить эти теги на каждый абзац\отрывок.
То есть если в абзаце говорится о компьютерах, то ему следует повесить тег "IT", "компьютер".
Возможно уже есть такой инструмент\фреймворк\библиотека?
Аноним 07/12/17 Чтв 00:46:58 #2 №166455304 
Самому ничего умнее "переберать все слова по списку" не прихдит, но понимаю, что это аутизм.
Аноним 07/12/17 Чтв 00:47:47 #3 №166455339 
14640819531512.jpg
Аноним 07/12/17 Чтв 00:48:23 #4 №166455364 
14640388666371.jpg
Аноним 07/12/17 Чтв 00:49:01 #5 №166455390 
14640377432501.jpg
Аноним 07/12/17 Чтв 00:49:23 #6 №166455407 
14640383690981.jpg
Аноним 07/12/17 Чтв 00:49:39 #7 №166455427 
14623728829610.jpg
Аноним 07/12/17 Чтв 00:50:40 #8 №166455469 
14640888320430.jpg
Аноним 07/12/17 Чтв 00:51:42 #9 №166455516 
А, вспомнил еще вариант. Видел у гугла сервис по анализу текста, картинок и тд, но он платный.
Аноним 07/12/17 Чтв 00:52:36 #10 №166455558 
Собственно вот он. Есть смысл использовать?
https://cloud.google.com/natural-language/
Аноним 07/12/17 Чтв 00:53:47 #11 №166455614 
Так, попробовал и понял что смысла нет. Русский он не поддерживает.
sageАноним 07/12/17 Чтв 00:53:56 #12 №166455619 
Напиши простенькую библиотеку на Джаве, подключи и скомпилируй. Изи же. Там работы на 200 строчек максимум
Аноним 07/12/17 Чтв 00:55:02 #13 №166455672 
>>166455619
Какой-то ты ебанутый. Как я напишу библиотеку если не знаю как ей следует работать?
Аноним 07/12/17 Чтв 00:57:27 #14 №166455798 
>>166455672
пока не дошёл до символ абзаца строки, запоминай самое повторяющееся слово, обнуляй и снова, пока не конец
на петоне минут за 5 реально написать, вот только смысл абзаца не всегда кроется в самых повторяемых словах, так что вряд ли тебе подойдет
Аноним 07/12/17 Чтв 01:00:00 #15 №166455925 
>>166455253 (OP)
Любой проггер-первокурс напишет такую прогу тебе. Тупо берем, вводим в консоль ввода/инпут.файл, нужный текст и теги, прога перегоняет текст в строку (массив символов), а затем начинает идти от начала до конца текста, сравнивая слова с тегами и вставляя эти теги туда, где эти самые слова будут находиться
Аноним 07/12/17 Чтв 01:04:12 #16 №166456121 
>>166455925
Или теги надо не самому вводить? Тогда просто по самому часто повторяющемуся слову в строкея выносить его в тег этой строки. Ток я хз, как обозначать переход на новую строку. Вот обычный текст если с вики скопипастить, ручками неудобно будет вставлять символы перехода на строку, там, где они были в оригинальном тексте
Аноним 07/12/17 Чтв 01:04:14 #17 №166456122 
>>166455798
Вот именно, что далеко не всегда.
Вот например шапка рандомного треда с нулевой:
> Этот пузырь лопнет или нет? Сколько это будет длиться? Кто за этим стоит? Кому это нужно?
О чем этот тред? Не понятно. Каждое слово (кроме знака вопроса) употребляется один раз.
>>166455925
Такую хуету и я могу написать за 5 минут. Что толку то? Представляешь с какой скоростью все это будет работать? Пускай в среднем предложении 10 слов, в абзаце 10 предложений. Это 100 слов. Тегов может быть дикое количество, пускай 1000. Это уже 100000 проверок. А всякие окончания, неверно написаные слова, и прочее?
Аноним 07/12/17 Чтв 01:06:51 #18 №166456224 
Я тут параллельно нашел библиотеку которая вроде как вытаскиевает смысл из предложений. Делает токены, которые те же теги. Надо попробовать....
http://balie.sourceforge.net
>>166456121
Как уже было сказано, самое повторяющее слово не всегда ключевое. Но теги из массива, да.
Аноним 07/12/17 Чтв 01:08:42 #19 №166456306 
>>166455253 (OP)
Тупым шлюхам не помогаем
Аноним 07/12/17 Чтв 01:09:25 #20 №166456340 
>>166456306
Ну и иди нахуй отсюда, чмо бесполезное. Че сагу то не поставил?
Аноним 07/12/17 Чтв 01:16:30 #21 №166456642 
Ебать ну ты и хитрожопый фрукт такие проги по тз пронанисты пишут тока если парсить будеш в ручную
sageАноним 07/12/17 Чтв 01:29:03 #22 №166457156 
ОП, могу написать на питоне за 500р, нужно?
Аноним 07/12/17 Чтв 01:38:26 #23 №166457547 
Это тупая шлюха тян не помогайте ей
sageАноним 07/12/17 Чтв 03:34:27 #24 №166461218 
>>166457547
С чего ты так решил? Что ОП - тян?
comments powered by Disqus

Отзывы и предложения