Няши, я знаю, здесь есть погромисты. Есть большие объемы текста. Надо анализировать их на наличие ключевых фраз (тегов), и расставить эти теги на каждый абзац\отрывок. То есть если в абзаце говорится о компьютерах, то ему следует повесить тег 'IT', 'компьютер'. Возможно уже есть такой

Аноним 07/12/17 Чтв 00:45:57 #1 №166455253

Няши, я знаю, здесь есть погромисты.
Есть большие объемы текста. Надо анализировать их на наличие ключевых фраз (тегов), и расставить эти теги на каждый абзац\отрывок.
То есть если в абзаце говорится о компьютерах, то ему следует повесить тег "IT", "компьютер".
Возможно уже есть такой инструмент\фреймворк\библиотека?

Аноним 07/12/17 Чтв 00:46:58 #2 №166455304

Самому ничего умнее "переберать все слова по списку" не прихдит, но понимаю, что это аутизм.

Аноним 07/12/17 Чтв 00:47:47 #3 №166455339

14640819531512.jpg

Аноним 07/12/17 Чтв 00:48:23 #4 №166455364

14640388666371.jpg

Аноним 07/12/17 Чтв 00:49:01 #5 №166455390

14640377432501.jpg

Аноним 07/12/17 Чтв 00:49:23 #6 №166455407

14640383690981.jpg

Аноним 07/12/17 Чтв 00:49:39 #7 №166455427

14623728829610.jpg

Аноним 07/12/17 Чтв 00:50:40 #8 №166455469

14640888320430.jpg

Аноним 07/12/17 Чтв 00:51:42 #9 №166455516

А, вспомнил еще вариант. Видел у гугла сервис по анализу текста, картинок и тд, но он платный.

Аноним 07/12/17 Чтв 00:52:36 #10 №166455558

Собственно вот он. Есть смысл использовать?
https://cloud.google.com/natural-language/

Аноним 07/12/17 Чтв 00:53:47 #11 №166455614

Так, попробовал и понял что смысла нет. Русский он не поддерживает.

Аноним 07/12/17 Чтв 00:53:56 #12 №166455619

Напиши простенькую библиотеку на Джаве, подключи и скомпилируй. Изи же. Там работы на 200 строчек максимум

Аноним 07/12/17 Чтв 00:55:02 #13 №166455672

>>166455619
Какой-то ты ебанутый. Как я напишу библиотеку если не знаю как ей следует работать?

Аноним 07/12/17 Чтв 00:57:27 #14 №166455798

>>166455672
пока не дошёл до символ абзаца строки, запоминай самое повторяющееся слово, обнуляй и снова, пока не конец
на петоне минут за 5 реально написать, вот только смысл абзаца не всегда кроется в самых повторяемых словах, так что вряд ли тебе подойдет

Аноним 07/12/17 Чтв 01:00:00 #15 №166455925

>>166455253 (OP)
Любой проггер-первокурс напишет такую прогу тебе. Тупо берем, вводим в консоль ввода/инпут.файл, нужный текст и теги, прога перегоняет текст в строку (массив символов), а затем начинает идти от начала до конца текста, сравнивая слова с тегами и вставляя эти теги туда, где эти самые слова будут находиться

Аноним 07/12/17 Чтв 01:04:12 #16 №166456121

>>166455925
Или теги надо не самому вводить? Тогда просто по самому часто повторяющемуся слову в строкея выносить его в тег этой строки. Ток я хз, как обозначать переход на новую строку. Вот обычный текст если с вики скопипастить, ручками неудобно будет вставлять символы перехода на строку, там, где они были в оригинальном тексте

Аноним 07/12/17 Чтв 01:04:14 #17 №166456122

>>166455798
Вот именно, что далеко не всегда.
Вот например шапка рандомного треда с нулевой:
> Этот пузырь лопнет или нет? Сколько это будет длиться? Кто за этим стоит? Кому это нужно?
О чем этот тред? Не понятно. Каждое слово (кроме знака вопроса) употребляется один раз.
>>166455925
Такую хуету и я могу написать за 5 минут. Что толку то? Представляешь с какой скоростью все это будет работать? Пускай в среднем предложении 10 слов, в абзаце 10 предложений. Это 100 слов. Тегов может быть дикое количество, пускай 1000. Это уже 100000 проверок. А всякие окончания, неверно написаные слова, и прочее?

Аноним 07/12/17 Чтв 01:06:51 #18 №166456224

Я тут параллельно нашел библиотеку которая вроде как вытаскиевает смысл из предложений. Делает токены, которые те же теги. Надо попробовать....
http://balie.sourceforge.net
>>166456121
Как уже было сказано, самое повторяющее слово не всегда ключевое. Но теги из массива, да.

Аноним 07/12/17 Чтв 01:08:42 #19 №166456306

>>166455253 (OP)
Тупым шлюхам не помогаем

Аноним 07/12/17 Чтв 01:09:25 #20 №166456340

>>166456306
Ну и иди нахуй отсюда, чмо бесполезное. Че сагу то не поставил?

Аноним 07/12/17 Чтв 01:16:30 #21 №166456642

Ебать ну ты и хитрожопый фрукт такие проги по тз пронанисты пишут тока если парсить будеш в ручную

Аноним 07/12/17 Чтв 01:29:03 #22 №166457156

ОП, могу написать на питоне за 500р, нужно?

Аноним 07/12/17 Чтв 01:38:26 #23 №166457547

Это тупая шлюха тян не помогайте ей

Аноним 07/12/17 Чтв 03:34:27 #24 №166461218

>>166457547
С чего ты так решил? Что ОП - тян?