Bu model https://github.com/stefan-it/turkish-bert'in; aşağıdaki 3 kategorinin olduğu metin sınıflandırma verilerine göre fine-tuned edilmiş halidir.
code_to_label={
'LABEL_0': 'olumsuz ',
'LABEL_1': 'nötr ',
'LABEL_2': 'olumlu' }
Eğitim ve validasyon verisi
Fine-tune işlemi için Gorengoz/tr-customerreview veri seti ve winvoker/turkish-sentiment-analysis-dataset kullanılmıştır. winvoker/turkish-sentiment-analysis-dataset'den her label için 5.000 cümle örneği alınarak iki veri seti birleştirilmiştir. Nihai veri seti ile model geliştirilmiştir.
Hiperparametreler
model_args = { "num_train_epochs":3, "overwrite_output_dir":True}
model = ClassificationModel( 'bert', 'dbmdz/bert-base-turkish-128k-cased', num_labels=3, args=model_args )
Eğitim Metrikleri
Epochs | Running Loss |
---|---|
1 | 0.0052 |
2 | 0.0015 |
3 | 0.0011 |
Nasıl Kullanılacağı
from transformers import AutoTokenizer, AutoModelForSequenceClassification,pipeline
tokenizer = AutoTokenizer.from_pretrained("Gorengoz/bert-turkish-sentiment-analysis-winvoker")
model = AutoModelForSequenceClassification.from_pretrained("Gorengoz/bert-turkish-sentiment-analysis-winvoker")
nlp=pipeline("text-classification", model=model, tokenizer=tokenizer)
code_to_label={
'LABEL_0': 'olumsuz ',
'LABEL_1': 'nötr ',
'LABEL_2': 'olumlu' }
code_to_label[nlp("Ürün berbat, paranıza yazık olur.")[0]['label']]
- Downloads last month
- 12