IndoBot-AI / update_dataset.py
Sofa321's picture
Create update_dataset.py
113d0fb verified
raw
history blame
945 Bytes
import pandas as pd
# Load dataset utama dan log
try:
dataset = pd.read_csv("dataset.csv")
except FileNotFoundError:
dataset = pd.DataFrame(columns=["pertanyaan", "jawaban"])
try:
log = pd.read_csv("chat_log.csv")
except FileNotFoundError:
log = pd.DataFrame(columns=["pertanyaan", "jawaban"])
# Validasi log: Isi jawaban baru
print("Log baru yang ditemukan:")
print(log)
print("\nMasukkan jawaban untuk setiap pertanyaan:")
for i, row in log.iterrows():
if pd.isna(row['jawaban']):
log.at[i, 'jawaban'] = input(f"Jawaban untuk '{row['pertanyaan']}': ")
# Gabungkan log ke dataset utama
updated_dataset = pd.concat([dataset, log]).drop_duplicates().reset_index(drop=True)
# Simpan dataset terbaru
updated_dataset.to_csv("dataset.csv", index=False)
print("Dataset telah diperbarui dan disimpan ke 'dataset.csv'.")
# Kosongkan log
log.iloc[0:0].to_csv("chat_log.csv", index=False)
print("Log telah dikosongkan.")