img2dataset --url_list ccs_synthetic_filtered_large.tsv --input_format "tsv"\ | |
--url_col "url" --caption_col "caption" --output_format webdataset\ | |
--output_folder cc_sbu_dataset --processes_count 16 --thread_count 128 --image_size 256 \ | |
--enable_wandb True | |