webrl-glm-4-9b / README.md
zehanqi's picture
Create README.md
90ee56b verified
|
raw
history blame
1.64 kB
metadata
license: other
license_name: glm-4-9b-webrl
license_link: https://huggingface.co/THUDM/glm-4-9b-chat/blob/main/LICENSE
language:
  - zh
tags:
  - glm
  - thudm
  - webrl
inference: false

GLM-4-9B-Chat

Read this in English.

模型介绍

WebRL-GLM-4-9B 是智谱 AI 推出的 WebRL 在 GLM-4-9B 的开源版本。 具备完成在 WebArena 中 OpenStreetMap (Map),Reddit,GitLab,online store content management system (CMS) 和 OneStopShop (OSS) 五个网站上进行网页操作的功能。

评测结果

我们在一些 WebArena-Lite 上对 WebRL-GLM-4-9B 模型进行了评测,并得到了如下的结果:

Model Reddit Gitlab CMS Map OSS Avg.SR
Llama-3-8B-Instruct 0.0 3.3 2.9 11.1 4.8 79.6
GLM-4-9B-Chat 5.4 10.0 6.7 3.3 6.7 6.1
WebRL-GLM-4-9B 57.9 50.0 48.6 36.7 37.8 43.0

更多推理代码和依赖信息,请访问我们的 github

引用

如果你觉得我们的工作有帮助的话,请考虑引用下列论文。

@artical{qi2024webrl,
      title={WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning}, 
      author={Zehan Qi and Xiao Liu and Iat Long Iong and Hanyu Lai and Xueqiao Sun and Xinyue Yang and Jiadai Sun and Yu Yang and Shuntian Yao and Tianjie Zhang and Wei Xu and Jie Tang and Yuxiao Dong},
      journal={arXiv preprint arXiv:2411.02337},
      year={2024},
}