russwang
/

VisVM-LLaVA-Next-Mistral-7B

Model card Files Files and versions Community

VisVM-LLaVA-Next-Mistral-7B / README.md

nielsr's picture

nielsr HF staff

Add model card, link to paper and pipeline tag

473c771 verified 27 days ago

|

268 Bytes

metadata

pipeline_tag: image-text-to-text

This repository contains the VisVM model described in Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension.

Code: https://github.com/si0wang/VisVM