HDBSCAN_45_8_ngram2

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("Trubnik1967/HDBSCAN_45_8_ngram2")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 9
  • Number of training documents: 29572
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 не не - не - 44444444444444444444444111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111 - товаоа не - бееееий 363 -1_не не_не_44444444444444444444444111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111_товаоа не
0 не - продавец - деньга - прийти - товар 16 0_не_продавец_деньга_прийти
1 размер - не - маленький - качество - но 15551 1_размер_не_маленький_качество
2 не - ткань - нитка - шов - торчать 7174 2_не_ткань_нитка_шов
3 цвет - не - фото - заказывать - картинка 2892 3_цвет_не_фото_заказывать
4 качество - не - хороший - желать - желать хороший 1821 4_качество_не_хороший_желать
5 запах - не - стирка - ужасный - пахнуть 719 5_запах_не_стирка_ужасный
6 описание - соответствовать - не соответствовать - соответствовать описание - не 572 6_описание_соответствовать_не соответствовать_соответствовать описание
7 брак - прийти брак - прийти - не - место 464 7_брак_прийти брак_прийти_не

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 100
  • n_gram_range: (1, 2)
  • nr_topics: 9
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: True
  • zeroshot_min_similarity: None
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.25.2
  • HDBSCAN: 0.8.33
  • UMAP: 0.5.5
  • Pandas: 1.5.3
  • Scikit-Learn: 1.2.2
  • Sentence-transformers: 2.6.0
  • Transformers: 4.39.1
  • Numba: 0.58.1
  • Plotly: 5.15.0
  • Python: 3.10.12
Downloads last month
3
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.