ValueError: BuilderConfig ‘xxxx‘ not found. Available:[xxx]
huggingface load_dataset报错
ValueError: BuilderConfig ‘xxxx’ not found. Available:[xxx]
真是人才想出来的load_dataset读取数据集配置居然是从readme.md文件读取的…
使用场景是下载了一个huggingface的评估数据集:
https://huggingface.co/datasets/TIGER-Lab/MMEB-eval
然后想新增一个subset, 就直接在它文件路径下加了一个文件夹,然后用load_dataset就报错了:
ValueError: BuilderConfig ‘xxxx’ not found. Available:[xxx]
找了半天没找到在哪注册Available的subset, 最后发现在readme.md里面:
https://huggingface.co/datasets/TIGER-Lab/MMEB-eval/blob/main/README.md
太zz了吧…读取的Available的subset居然是从readme.md文件里面解析的…真是人才想出来的…