Spaces:
Running
on
Zero
Running
on
Zero
khang119966
commited on
Update app.py
Browse files
app.py
CHANGED
@@ -239,23 +239,6 @@ function forceLightTheme() {
|
|
239 |
document.documentElement.setAttribute('data-theme', 'light');
|
240 |
}
|
241 |
"""
|
242 |
-
|
243 |
-
demo = gr.Blocks()
|
244 |
-
|
245 |
-
chat_demo_interface = gr.ChatInterface(
|
246 |
-
fn=chat,
|
247 |
-
description="""**Vintern-1B-v3.5** is the latest in the Vintern series, bringing major improvements over v2 across all benchmarks. 🚀 Fine-tuned from **InternVL-2.5-1B**, already strong in Vietnamese 🇻🇳 tasks thanks to Viet-ShareGPT-4o-Text-VQA data. This **continuous fine-tuning Version** enhances Vietnamese capabilities while retaining strong English performance. It excels in OCR, text recognition, and Vietnam-specific document understanding. 📄 However, users should be mindful of **potential biases** due to the training data. ⚠️""",
|
248 |
-
examples=[{"text": "Hãy viết một email giới thiệu sản phẩm trong ảnh.", "files":["./demo_3.jpg"]},
|
249 |
-
{"text": "Trích xuất các thông tin từ ảnh trả về markdown.", "files":["./demo_1.jpg"]},
|
250 |
-
{"text": "Bạn là nhân viên marketing chuyên nghiệp. Hãy viết một bài quảng cáo dài trên mạng xã hội giới thiệu về cửa hàng.", "files":["./demo_2.jpg"]},
|
251 |
-
{"text": "Trích xuất thông tin kiện hàng trong ảnh và trả về dạng JSON.", "files":["./demo_4.jpg"]}],
|
252 |
-
title="❄️ Vintern-1B-v3.5 Demo ❄️",
|
253 |
-
multimodal=True,
|
254 |
-
css=CSS,
|
255 |
-
js=js,
|
256 |
-
theme='NoCrypt/miku'
|
257 |
-
)
|
258 |
-
|
259 |
from transformers import pipeline
|
260 |
|
261 |
pipe = pipeline("automatic-speech-recognition", model="openai/whisper-large-v3-turbo")
|
@@ -269,14 +252,32 @@ def transcribe_speech(filepath):
|
|
269 |
},
|
270 |
chunk_length_s=30,
|
271 |
batch_size=1,
|
|
|
272 |
)
|
273 |
return output["text"]
|
274 |
-
|
275 |
-
|
276 |
-
|
277 |
-
|
278 |
-
|
279 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
280 |
|
281 |
# chat_demo_interface.queue()
|
282 |
-
demo.launch()
|
|
|
239 |
document.documentElement.setAttribute('data-theme', 'light');
|
240 |
}
|
241 |
"""
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
242 |
from transformers import pipeline
|
243 |
|
244 |
pipe = pipeline("automatic-speech-recognition", model="openai/whisper-large-v3-turbo")
|
|
|
252 |
},
|
253 |
chunk_length_s=30,
|
254 |
batch_size=1,
|
255 |
+
device=device,
|
256 |
)
|
257 |
return output["text"]
|
258 |
+
|
259 |
+
demo = gr.Blocks()
|
260 |
+
|
261 |
+
with demo:
|
262 |
+
chat_demo_interface = gr.ChatInterface(
|
263 |
+
fn=chat,
|
264 |
+
description="""**Vintern-1B-v3.5** is the latest in the Vintern series, bringing major improvements over v2 across all benchmarks. 🚀 Fine-tuned from **InternVL-2.5-1B**, already strong in Vietnamese 🇻🇳 tasks thanks to Viet-ShareGPT-4o-Text-VQA data. This **continuous fine-tuning Version** enhances Vietnamese capabilities while retaining strong English performance. It excels in OCR, text recognition, and Vietnam-specific document understanding. 📄 However, users should be mindful of **potential biases** due to the training data. ⚠️""",
|
265 |
+
examples=[{"text": "Hãy viết một email giới thiệu sản phẩm trong ảnh.", "files":["./demo_3.jpg"]},
|
266 |
+
{"text": "Trích xuất các thông tin từ ảnh trả về markdown.", "files":["./demo_1.jpg"]},
|
267 |
+
{"text": "Bạn là nhân viên marketing chuyên nghiệp. Hãy viết một bài quảng cáo dài trên mạng xã hội giới thiệu về cửa hàng.", "files":["./demo_2.jpg"]},
|
268 |
+
{"text": "Trích xuất thông tin kiện hàng trong ảnh và trả về dạng JSON.", "files":["./demo_4.jpg"]}],
|
269 |
+
title="❄️ Vintern-1B-v3.5 Demo ❄️",
|
270 |
+
multimodal=True,
|
271 |
+
css=CSS,
|
272 |
+
js=js,
|
273 |
+
theme='NoCrypt/miku'
|
274 |
+
)
|
275 |
+
|
276 |
+
mic_transcribe = gr.Interface(
|
277 |
+
fn=transcribe_speech,
|
278 |
+
inputs=gr.Audio(sources="microphone", type="filepath"),
|
279 |
+
outputs=gr.components.Textbox(),
|
280 |
+
)
|
281 |
|
282 |
# chat_demo_interface.queue()
|
283 |
+
demo.queue().launch()
|