CNN Text Data 2025
CNN Text Data 2025
Informatics,
St. Petersburg School of Physics,
Mathematics, and Computer
Science, Department of Informatics
СВЕРТОЧНЫЕ НЕЙРОННЫЕ
СЕТИ (CNN) ДЛЯ АНАЛИЗА
ТЕКСТА
Koltcov S.
Размер рецептивной области задается размером фильтра или ядра свертки. Например, если
используется ядро 3x3, то рецептивная область охватывает 3x3 пикселя входного
изображения. Перекрытие областей При свертке ядро перемещается по изображению с
шагом (stride). Если шаг равен 1, то рецептивные области смежных нейронов будут
перекрываться, что помогает лучше захватывать и учитывать локальные детали данных.
Для цветных изображений в рецептивную область включается и третье измерение,
соответствующее цветовым каналам (например, красный, зелёный, синий, или RGB). То
есть, для цветных изображений рецептивная область для ядра с фильтром 3x3 будет иметь
размер 3x3x3 (ширина x высота x число каналов).
Laboratory for Social and Cognitive Informatics,
Department of Informatics
Пулинг это просто выбор определенного значения из окна, таким образом, большая
матрица как бы сворачивается в маленькую.
Laboratory for Social and Cognitive Informatics,
Department of Informatics
1. 'valid'`:
- Свертка выполняется только в пределах границ входных данных.
- В результате выходной массив будет меньше по размеру, чем входной.
- Без добавления дополнений (паддинга) к входным данным.
2. `'same'`:
- Добавляются дополнительные значения (обычно нули) по краям входных данных так,
чтобы размер выходного массива был таким же, как и у входного массива.
- Это чаще всего делается для сохранения одинаковых размеров входного и выходного
массива при заданном шаге.
Laboratory for Social and Cognitive Informatics,
Department of Informatics
# Создание модели
model = Sequential([
Embedding(input_dim=max_features, output_dim=128, input_length=max_len),
Conv1D(filters=128, kernel_size=5, activation='relu'),
GlobalMaxPooling1D(),
Dense(units=128, activation='relu'),
Dense(units=1, activation='sigmoid') # Выходной слой для двух классов
])
Laboratory for Social and Cognitive Informatics,
Department of Informatics
# Создание модели
model = Sequential([
Embedding(input_dim=max_features, output_dim=128, input_length=max_len),
Conv1D(filters=128, kernel_size=5, activation='relu'),
GlobalMaxPooling1D(),
Dense(units=128, activation='relu'),
Dense(units=1, activation='sigmoid') # Выходной слой для двух классов
])
Laboratory for Social and Cognitive Informatics,
Department of Informatics