bitarray datasets gitpython ninja scipy spacy tqdm transformers ujson faiss-cpu torch