kmeans_7

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("Trubnik1967/kmeans_7")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 7
  • Number of training documents: 29572
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
0 юбка - брюки - штаны - блузка - носить 8516 0_юбка_брюки_штаны_блузка
1 покупатель - заказывать - отказаться - ожидание - прождать 11298 1_покупатель_заказывать_отказаться_ожидание
2 увы - отсутствие - товар - не - данный 253 2_увы_отсутствие_товар_не
3 невернуть - денежный - деньга - возвратить - доставить 551 3_невернуть_денежный_деньга_возвратить
4 заказ - доставить - arriverd - выслать - увы 110 4_заказ_доставить_arriverd_выслать
5 не - прийти - приехать - дойти - отправить 129 5_не_прийти_приехать_дойти
6 ткань - шов - нитка - хлопок - сшить 8715 6_ткань_шов_нитка_хлопок

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 100
  • n_gram_range: (1, 1)
  • nr_topics: 7
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: True
  • zeroshot_min_similarity: None
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.25.2
  • HDBSCAN: 0.8.33
  • UMAP: 0.5.5
  • Pandas: 1.5.3
  • Scikit-Learn: 1.2.2
  • Sentence-transformers: 2.5.1
  • Transformers: 4.39.0
  • Numba: 0.58.1
  • Plotly: 5.15.0
  • Python: 3.10.12
Downloads last month
5
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.