{ | |
"_name_or_path": "google/owlvit-base-patch32", | |
"architectures": [ | |
"OwlViTForObjectDetection" | |
], | |
"id2label": { | |
"0": 1, | |
"1": 2, | |
"10": 12, | |
"100": 103, | |
"101": 104, | |
"102": 105, | |
"103": 106, | |
"104": 107, | |
"11": 13, | |
"12": 14, | |
"13": 15, | |
"14": 16, | |
"15": 17, | |
"16": 18, | |
"17": 19, | |
"18": 20, | |
"19": 21, | |
"2": 3, | |
"20": 22, | |
"21": 23, | |
"22": 24, | |
"23": 25, | |
"24": 26, | |
"25": 27, | |
"26": 28, | |
"27": 29, | |
"28": 30, | |
"29": 31, | |
"3": 4, | |
"30": 32, | |
"31": 33, | |
"32": 34, | |
"33": 35, | |
"34": 36, | |
"35": 37, | |
"36": 38, | |
"37": 39, | |
"38": 40, | |
"39": 41, | |
"4": 6, | |
"40": 42, | |
"41": 43, | |
"42": 44, | |
"43": 45, | |
"44": 46, | |
"45": 47, | |
"46": 48, | |
"47": 49, | |
"48": 50, | |
"49": 51, | |
"5": 7, | |
"50": 52, | |
"51": 53, | |
"52": 54, | |
"53": 55, | |
"54": 56, | |
"55": 57, | |
"56": 58, | |
"57": 59, | |
"58": 60, | |
"59": 61, | |
"6": 8, | |
"60": 62, | |
"61": 63, | |
"62": 64, | |
"63": 66, | |
"64": 67, | |
"65": 68, | |
"66": 69, | |
"67": 70, | |
"68": 71, | |
"69": 72, | |
"7": 9, | |
"70": 73, | |
"71": 74, | |
"72": 75, | |
"73": 76, | |
"74": 77, | |
"75": 78, | |
"76": 79, | |
"77": 80, | |
"78": 81, | |
"79": 82, | |
"8": 10, | |
"80": 83, | |
"81": 84, | |
"82": 85, | |
"83": 86, | |
"84": 87, | |
"85": 88, | |
"86": 89, | |
"87": 90, | |
"88": 91, | |
"89": 92, | |
"9": 11, | |
"90": 93, | |
"91": 94, | |
"92": 95, | |
"93": 96, | |
"94": 97, | |
"95": 98, | |
"96": 99, | |
"97": 100, | |
"98": 101, | |
"99": 102 | |
}, | |
"initializer_factor": 1.0, | |
"label2id": { | |
"1": "0", | |
"2": "1", | |
"3": "2", | |
"4": "3", | |
"6": "4", | |
"7": "5", | |
"8": "6", | |
"9": "7", | |
"10": "8", | |
"11": "9", | |
"12": "10", | |
"13": "11", | |
"14": "12", | |
"15": "13", | |
"16": "14", | |
"17": "15", | |
"18": "16", | |
"19": "17", | |
"20": "18", | |
"21": "19", | |
"22": "20", | |
"23": "21", | |
"24": "22", | |
"25": "23", | |
"26": "24", | |
"27": "25", | |
"28": "26", | |
"29": "27", | |
"30": "28", | |
"31": "29", | |
"32": "30", | |
"33": "31", | |
"34": "32", | |
"35": "33", | |
"36": "34", | |
"37": "35", | |
"38": "36", | |
"39": "37", | |
"40": "38", | |
"41": "39", | |
"42": "40", | |
"43": "41", | |
"44": "42", | |
"45": "43", | |
"46": "44", | |
"47": "45", | |
"48": "46", | |
"49": "47", | |
"50": "48", | |
"51": "49", | |
"52": "50", | |
"53": "51", | |
"54": "52", | |
"55": "53", | |
"56": "54", | |
"57": "55", | |
"58": "56", | |
"59": "57", | |
"60": "58", | |
"61": "59", | |
"62": "60", | |
"63": "61", | |
"64": "62", | |
"66": "63", | |
"67": "64", | |
"68": "65", | |
"69": "66", | |
"70": "67", | |
"71": "68", | |
"72": "69", | |
"73": "70", | |
"74": "71", | |
"75": "72", | |
"76": "73", | |
"77": "74", | |
"78": "75", | |
"79": "76", | |
"80": "77", | |
"81": "78", | |
"82": "79", | |
"83": "80", | |
"84": "81", | |
"85": "82", | |
"86": "83", | |
"87": "84", | |
"88": "85", | |
"89": "86", | |
"90": "87", | |
"91": "88", | |
"92": "89", | |
"93": "90", | |
"94": "91", | |
"95": "92", | |
"96": "93", | |
"97": "94", | |
"98": "95", | |
"99": "96", | |
"100": "97", | |
"101": "98", | |
"102": "99", | |
"103": "100", | |
"104": "101", | |
"105": "102", | |
"106": "103", | |
"107": "104" | |
}, | |
"logit_scale_init_value": 2.6592, | |
"model_type": "owlvit", | |
"projection_dim": 512, | |
"text_config": { | |
"bos_token_id": 0, | |
"dropout": 0.0, | |
"eos_token_id": 2, | |
"max_length": 16, | |
"model_type": "owlvit_text_model", | |
"pad_token_id": 1 | |
}, | |
"text_config_dict": null, | |
"torch_dtype": "float32", | |
"transformers_version": "4.38.2", | |
"vision_config": { | |
"dropout": 0.0, | |
"model_type": "owlvit_vision_model" | |
}, | |
"vision_config_dict": null | |
} | |