您好,我准备做一个clip相关的论文并想复现一下最新的方法,我按照alpha clip项目中写的训练流程下载了grit-20m数据集并使用sam_grit.py生成了mask数据,想问一下如何修改get_file文件进行训练?代码中这个函数是空的,我看到issue里面有一个close的和我是同样的问题但底下没有找到回答,而且dataset文件里面写的是grit-1m是否仅需要用grit-20m的1m子集进行训练?我还想训练一下不使用sam生成mask数据的clip基线模型进行对比这个如何实现?