Бінарний текстовий класифікатор

Я шукаю бінарні класифікаційні методи для тексту. Я знайшов SVM, Наївний Байєс, word2vec, doc2vec і GloVe, але перш ніж спробувати виконати те, що я хочу знати, який може бути кращим підходом, враховуючи обставини.

Дані - це пару тисяч коротких текстів, в основному два, три пропозиції, і я хочу знати, чи говорять вони про якусь тему чи ні. У мене немає виділеного графічного процесора, так що все, що потрібно, знаходиться поза столом. Якщо хтось може порекомендувати Python бібліотекам або приємні статті з цієї теми, це буде безперечно плюс, оскільки я новачок у цій галузі.

0
Вставка документа повинна бути добре. Як представлені теми, використовуючи модель теми?
додано Автор David, джерело
Вкладення документа - це чисельне представлення текстового документа, подібного до того, що ви розглядаєте. doc2vec та перчатки є прикладами моделей вкладання документів. SVM та NB немає. тематична модель забезпечує числове уявлення тем як розподіл над словами. Обов'язково вивчіть їх, перш ніж продовжувати. Ласкаво просимо на сайт!
додано Автор David, джерело
Я не розумію термінологію @Emre. Не могли б ви перефразировать?
додано Автор Sebastian Garrido, джерело

Відповідей немає

0