khang119966 commited on
Commit
c0db4f3
·
verified ·
1 Parent(s): 95d645e

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +25 -24
app.py CHANGED
@@ -239,23 +239,6 @@ function forceLightTheme() {
239
  document.documentElement.setAttribute('data-theme', 'light');
240
  }
241
  """
242
-
243
- demo = gr.Blocks()
244
-
245
- chat_demo_interface = gr.ChatInterface(
246
- fn=chat,
247
- description="""**Vintern-1B-v3.5** is the latest in the Vintern series, bringing major improvements over v2 across all benchmarks. 🚀 Fine-tuned from **InternVL-2.5-1B**, already strong in Vietnamese 🇻🇳 tasks thanks to Viet-ShareGPT-4o-Text-VQA data. This **continuous fine-tuning Version** enhances Vietnamese capabilities while retaining strong English performance. It excels in OCR, text recognition, and Vietnam-specific document understanding. 📄 However, users should be mindful of **potential biases** due to the training data. ⚠️""",
248
- examples=[{"text": "Hãy viết một email giới thiệu sản phẩm trong ảnh.", "files":["./demo_3.jpg"]},
249
- {"text": "Trích xuất các thông tin từ ảnh trả về markdown.", "files":["./demo_1.jpg"]},
250
- {"text": "Bạn là nhân viên marketing chuyên nghiệp. Hãy viết một bài quảng cáo dài trên mạng xã hội giới thiệu về cửa hàng.", "files":["./demo_2.jpg"]},
251
- {"text": "Trích xuất thông tin kiện hàng trong ảnh và trả về dạng JSON.", "files":["./demo_4.jpg"]}],
252
- title="❄️ Vintern-1B-v3.5 Demo ❄️",
253
- multimodal=True,
254
- css=CSS,
255
- js=js,
256
- theme='NoCrypt/miku'
257
- )
258
-
259
  from transformers import pipeline
260
 
261
  pipe = pipeline("automatic-speech-recognition", model="openai/whisper-large-v3-turbo")
@@ -269,14 +252,32 @@ def transcribe_speech(filepath):
269
  },
270
  chunk_length_s=30,
271
  batch_size=1,
 
272
  )
273
  return output["text"]
274
-
275
- mic_transcribe = gr.Interface(
276
- fn=transcribe_speech,
277
- inputs=gr.Audio(sources="microphone", type="filepath"),
278
- outputs=gr.components.Textbox(),
279
- )
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
280
 
281
  # chat_demo_interface.queue()
282
- demo.launch()
 
239
  document.documentElement.setAttribute('data-theme', 'light');
240
  }
241
  """
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
242
  from transformers import pipeline
243
 
244
  pipe = pipeline("automatic-speech-recognition", model="openai/whisper-large-v3-turbo")
 
252
  },
253
  chunk_length_s=30,
254
  batch_size=1,
255
+ device=device,
256
  )
257
  return output["text"]
258
+
259
+ demo = gr.Blocks()
260
+
261
+ with demo:
262
+ chat_demo_interface = gr.ChatInterface(
263
+ fn=chat,
264
+ description="""**Vintern-1B-v3.5** is the latest in the Vintern series, bringing major improvements over v2 across all benchmarks. 🚀 Fine-tuned from **InternVL-2.5-1B**, already strong in Vietnamese 🇻🇳 tasks thanks to Viet-ShareGPT-4o-Text-VQA data. This **continuous fine-tuning Version** enhances Vietnamese capabilities while retaining strong English performance. It excels in OCR, text recognition, and Vietnam-specific document understanding. 📄 However, users should be mindful of **potential biases** due to the training data. ⚠️""",
265
+ examples=[{"text": "Hãy viết một email giới thiệu sản phẩm trong ảnh.", "files":["./demo_3.jpg"]},
266
+ {"text": "Trích xuất các thông tin từ ảnh trả về markdown.", "files":["./demo_1.jpg"]},
267
+ {"text": "Bạn là nhân viên marketing chuyên nghiệp. Hãy viết một bài quảng cáo dài trên mạng xã hội giới thiệu về cửa hàng.", "files":["./demo_2.jpg"]},
268
+ {"text": "Trích xuất thông tin kiện hàng trong ảnh và trả về dạng JSON.", "files":["./demo_4.jpg"]}],
269
+ title="❄️ Vintern-1B-v3.5 Demo ❄️",
270
+ multimodal=True,
271
+ css=CSS,
272
+ js=js,
273
+ theme='NoCrypt/miku'
274
+ )
275
+
276
+ mic_transcribe = gr.Interface(
277
+ fn=transcribe_speech,
278
+ inputs=gr.Audio(sources="microphone", type="filepath"),
279
+ outputs=gr.components.Textbox(),
280
+ )
281
 
282
  # chat_demo_interface.queue()
283
+ demo.queue().launch()