Gorengoz/bert-turkish-sentiment-analysis-winvoker

Bu model https://github.com/stefan-it/turkish-bert'in; aşağıdaki 3 kategorinin olduğu metin sınıflandırma verilerine göre fine-tuned edilmiş halidir.

code_to_label={

'LABEL_0': 'olumsuz ',

'LABEL_1': 'nötr ',

'LABEL_2': 'olumlu' }

Eğitim ve validasyon verisi

Fine-tune işlemi için Gorengoz/tr-customerreview veri seti ve winvoker/turkish-sentiment-analysis-dataset kullanılmıştır. winvoker/turkish-sentiment-analysis-dataset'den her label için 5.000 cümle örneği alınarak iki veri seti birleştirilmiştir. Nihai veri seti ile model geliştirilmiştir.

Hiperparametreler

model_args = { "num_train_epochs":3, "overwrite_output_dir":True}

model = ClassificationModel( 'bert', 'dbmdz/bert-base-turkish-128k-cased', num_labels=3, args=model_args )

Eğitim Metrikleri

Epochs	Running Loss
1	0.0052
2	0.0015
3	0.0011

Nasıl Kullanılacağı

from transformers import AutoTokenizer, AutoModelForSequenceClassification,pipeline

tokenizer = AutoTokenizer.from_pretrained("Gorengoz/bert-turkish-sentiment-analysis-winvoker")
model = AutoModelForSequenceClassification.from_pretrained("Gorengoz/bert-turkish-sentiment-analysis-winvoker")

nlp=pipeline("text-classification", model=model, tokenizer=tokenizer)

code_to_label={

'LABEL_0': 'olumsuz ',

'LABEL_1': 'nötr ',

'LABEL_2': 'olumlu' }

code_to_label[nlp("Ürün berbat, paranıza yazık olur.")[0]['label']]