Commits · Xenova/sponsorblock-ml

Add language preference list

62ea1e5

Joshua Lochner commited on Feb 27, 2022

Fix logging messages in predict script

4d4de75

Joshua Lochner commited on Feb 27, 2022

Only consider spoken words when calculating metrics

9f15397

Joshua Lochner commited on Feb 21, 2022

Ensure event duration is non-negative

2439d9a

Joshua Lochner commited on Feb 21, 2022

Remove zero-width spaces from text

884d564

Joshua Lochner commited on Feb 21, 2022

Add support for mute action type and remove videos with full action type

1286fe5

Joshua Lochner commited on Feb 19, 2022

Initialize logging in each script

c4f250e

Joshua Lochner commited on Feb 19, 2022

Do not allow predictions to miss start of video

aa018be

Joshua Lochner commited on Feb 19, 2022

Fix `--no_cuda` argument for preprocessing

87b2dec

Joshua Lochner commited on Feb 17, 2022

Revert model input size back to 512 tokens

721bf64

Joshua Lochner commited on Feb 17, 2022

Fix conflicting `--no_cuda` argument

09cabec

Joshua Lochner commited on Feb 17, 2022

Use correct logger per script

e3d3d3f

Joshua Lochner commited on Feb 17, 2022

Update preprocessing script to use logging module

cfbd4d5

Joshua Lochner commited on Feb 16, 2022

Add `no_cuda` argument to not use GPU

de9c8c4

Joshua Lochner commited on Feb 16, 2022

Remove redundant calls to change device

8981122

Joshua Lochner commited on Feb 13, 2022

Add `output_as_json` argument for inference

52340fc

Joshua Lochner commited on Feb 12, 2022

Adjust tokenizer input size based on model input size

9604abd

Joshua Lochner commited on Feb 8, 2022

Remove unused utilities

0e18e8c

Joshua Lochner commited on Feb 7, 2022

Move `load_datasets` to train script

086ca93

Joshua Lochner commited on Feb 7, 2022

Improve how transcripts are stored and how manual transcripts are segmented

583f4cf

Joshua Lochner commited on Feb 7, 2022

Add boilerplate code to detect whether segment was split due to length

df35612

Joshua Lochner commited on Feb 7, 2022

Revert evaluation script to use `processed_file` by default

8fc746d

Joshua Lochner commited on Feb 5, 2022

Fix segmentation using binary search

de9c264

Joshua Lochner commited on Feb 5, 2022

Add fallback for old transcript version

c445f1a

Joshua Lochner commited on Feb 4, 2022

Fix `num_tokens` key in words

83dc695

Joshua Lochner commited on Feb 3, 2022