Для решения данной задачи создана RNN-CNN модель, способная классифицировать
отзывы пациентов о посещенных ими медицинских учреждениях по трем категориям: положительные, отрицательные и нейтральные.
Основу архитектуры сети составляют двунаправленные GRU и LSTM слои, после которых применены слои свертки. На вход сети подаются последовательности токенов, соответствующих уникальным словам текстовых отзывов. В слой вложения (embedding_layer) сети загружена матрица 500-размерных векторов предобученной модели word2vec, в котрой каждому токену соответствует определенный вектор. Таким образом, каждому слову сопоставлен вектор, передающий семантику слова. На выходе сеть выдает предсказания по трем классам в виде one-hot векторов.
Точность модели на тестовых данных 88%.
!При использовании обученной модели для классификации новых данных необходимо переводить тексты в последовательности токенов на основе словаря токенов, использованного при обучении модели!