Spaces:

Estwld
/

Agent4DB-Speech2Text

Runtime error

File size: 3,143 Bytes

45db271
 
 
 
70ef47c
 
 
45db271
 
70ef47c
45db271
70ef47c
 
 
 
45db271
 
70ef47c
45db271
 
70ef47c
45db271
 
70ef47c
 
 
45db271
70ef47c
45db271
70ef47c
 
 
 
 
 
 
 
 
 
 
 
 
ce67652
 
 
 
 
 
 
 
 
70ef47c

import gradio as gr
import openai
import os

# 配置基本参数
PROMPT = """首先，需要澄清的是，我方对"偏爱"的定义是：**教师基于主观喜好或对"优秀"的片面理解，给予特定学生与其学业表现或课堂行为无关的特殊待遇或关注，而忽视其他学生正当的学习需求和情感体验，从而损害教育公平的行为。**对方辩友试图将"偏爱"的对象限定为客观标准下的"优秀学生"，这是偷换概念的逻辑错误。
即使是看似客观的评价标准，例如"成绩优秀"、"品行突出"，在实际操作中也充满了主观性。每个老师对"优秀"的理解不同，对学生行为的评价标准也不同，最终就会导致"偏爱"的对象并非真正意义上的"优秀"，而是取决于教师个人的喜好。试问，一个在数学方面有天赋但语文成绩相对较弱的学生，难道就不值得被老师关注和鼓励吗？
"""

def transcribe_audio(audio, api_key_state):
    if audio is None:
        return "没有检测到音频，请重新录音或者上传音频文件。", api_key_state
    
    if not api_key_state:
        return "请输入有效的API密钥。", api_key_state
    
    client = openai.OpenAI(
        api_key=api_key_state,
    )
    try:
        # 使用 OpenAI Whisper API 进行转录
        with open(audio, "rb") as audio_file:
            result = client.audio.transcriptions.create(
                model="whisper-1",
                file=audio_file,
                prompt=PROMPT,
            )
        return result.text, api_key_state
    except Exception as e:
        return f'转录音频时出现错误: {str(e)}', api_key_state

def set_api_key(api_key, api_key_state):
    return api_key, api_key  # 更新显示的 API 密钥和存储的状态

def clear_inputs(audio, api_key, api_key_state):
    return None, api_key, api_key_state  # 只清除音频，保留 API 密钥

with gr.Blocks(theme="default") as iface:
    gr.Markdown("# 💬 Agent4DB专用语音转文字工具")
    gr.Markdown("🤟 使用 OpenAI Whisper API 将语音转录为文字")
    
    api_key_state = gr.State("")

    with gr.Col():
        with gr.Row():
            audio_input = gr.Audio(sources=["microphone", "upload"], type="filepath", label="录音或上传音频")
            api_key_input = gr.Textbox(type="password", label="API密钥", placeholder="请输入您的API密钥")
        
        transcribe_button = gr.Button("转录")
        clear_button = gr.ClearButton()
        output = gr.Textbox(label="转录文本", placeholder="转录的文字将显示在这里...", lines=10, interactive=True)
    
    # 设置 API 密钥的回调
    api_key_input.change(set_api_key, [api_key_input, api_key_state], [api_key_input, api_key_state])
    
    # 转录按钮的回调
    transcribe_button.click(transcribe_audio, inputs=[audio_input, api_key_state], outputs=[output, api_key_state])
    
    # 清除按钮的回调
    clear_button.click(clear_inputs, inputs=[audio_input, api_key_input, api_key_state], outputs=[audio_input, api_key_input, api_key_state])

iface.launch(share=True)