Qwen/Qwen2.5-VL-7B-Instruct · Video Inference - TypeError: process_vision_info() got an unexpected keyword argument 'return_video

6 days ago

This is the piece of code i am trying to execute
messages = [
{
"role": "user",
"content": [
{
"type": "video",
"video": image_path,
"max_pixels": 360 * 420,
"fps": 1.0,
},
{"type": "text", "text": query},
],
}
]
text = processor.apply_chat_template(
messages, tokenize=False, add_generation_prompt=True
)
print("Video Text ",text)
image_inputs, video_inputs, video_kwargs = process_vision_info(messages, return_video_kwargs=True)
inputs = processor(
text=[text],
images=image_inputs,
videos=video_inputs,
fps=fps,
padding=True,
return_tensors="pt",
**video_kwargs,
)
inputs = inputs.to("cuda")

ERROR - thrown in the line image_inputs, video_inputs, video_kwargs = process_vision_info(messages, return_video_kwargs=True)

TypeError: process_vision_info() got an unexpected keyword argument 'return_video_kwargs'

hmanju

5 days ago

Also running into the same issue.

bluenevus

4 days ago

+1

StefanSong

4 days ago

pip install qwen-vl-utils==0.0.10 fixes the issue.

See https://github.com/QwenLM/Qwen2.5-VL/issues/693

Qwen
/

Qwen2.5-VL-7B-Instruct

Video Inference - TypeError: process_vision_info() got an unexpected keyword argument 'return_video_kwargs'