Shallow7 commited on
Commit
beefdb6
·
verified ·
1 Parent(s): 78f73eb

Create README.md

Browse files

针对 GUI 场景中高分辨率视觉 token 带来的计算瓶颈,构建 UI 组件级表示并引入 UI 引导的 token 选择机制,在保持语义表达能力的同时削减冗余计算;结合 ShowUI-desktop、ScreenSpot、GuiAct 与 Mind2Web 等数据集,分别在元素定位与多步导航任务上进行训练与评测,分析不同模型、不同场景、不同元素类型及超参数设置对性能的影响。

Files changed (1) hide show
  1. README.md +11 -0
README.md ADDED
@@ -0,0 +1,11 @@
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ datasets:
3
+ - showlab/ShowUI-desktop
4
+ - KevinQHLin/ScreenSpot
5
+ metrics:
6
+ - accuracy
7
+ base_model:
8
+ - showlab/ShowUI-2B
9
+ - Qwen/Qwen2-VL-2B-Instruct
10
+ - Qwen/Qwen2.5-VL-3B-Instruct
11
+ ---