Skip to content

Дообучение модели distilbert для классификации новостей

License

Notifications You must be signed in to change notification settings

lethnis/distilbert-finetuning

Repository files navigation

Дообучение модели distilbert для классификации новостей

Датасет состоит из коротких новостей семи разных категорий.
image

Для обучения использовалась модель distilbert/distilbert-base-uncased-finetuned-sst-2-english.
Было проведено 3 эксперимента с разными обучаемыми слоями.

  1. Обучался только финальный классификатор.
  2. Обучался классификатор и пре-классификатор.
  3. Обучалась вся модель.
    image

Результаты обучения

image
Полностью обучаемая модель достигла лучших результатов - 96%.
Распределение предсказаний модели на проверочных данных.
image

Проверка работы модели на новых данных

Я скопировал несколько новостей из разных источников и проверил как модель предсказывает их.
image

About

Дообучение модели distilbert для классификации новостей

Resources

License

Stars

Watchers

Forks