Open
Description
欢迎各位开发者参加RP2K的打榜活动
RP2K数据集介绍
RP2K数据集收录了50万+张零售商品货架图片,商品种类超过2,000种,是目前零售类数据集中产品种类数量最多的数据集。不同于一般聚焦新产品的数据集,RP2K收录了超过50万张零售商品货架图片,商品种类超过2000种,该数据集是目前零售类数据集中产品种类数量TOP1,同时所有图片均来自于真实场景下的人工采集,针对每种商品,品览提供了十分详细的标注。RP2K致力于帮助物品识别领域进行学术研究,同时为AI物品识别从业者打造真实行业级试炼场。
商品识别的难点
在真实场景中,准确识别货架上零售产品仍然具有很高的挑战性。
- 同一生产线中的产品可能具有不同的尺寸,并且它们通常外观高度相似但价格不同。图像尺寸无法反映产品的实际尺寸。
- 制造商通常会为一条产品线制造多种口味,但是它们的外观在标签上只有非常细微的差别。
- 执行人员在拍摄货架图片时,由于相机角度、拍摄环境不同,图片会产生变形,图像也可能被拉伸,甚至会出现曝光不足的现象。 从下面的样例图可以看到,RP2K针对以上可能的情况均有涉及,采用细粒度识别对商品进行甄别。
RP2K数据集亮点
- 就产品类别而言,毫无疑问,它是迄今为止全球规模最大的零售数据集,超过2000种SKU。
- 所有图像均在自然采光的实体零售店中手动采集,与实际应用场景匹配度极高,具有极佳的实践落地适应性。
- 品览为每种商品提供了丰富的注释,包括大小、形状和味道/气味。期待RP2K数据集可以为计算机视觉领域研究和零售行业AI落地赋能。
Colugo发布RP2K打榜活动
目前Colugo已经发布了基于PP系列模型的基于RP2K的预训练模型,以及相关实验日志,详情见此。欢迎各位开发者参与对RP2K的打榜活动。
相关教程已经发布,您可以通过Goods_Recognition了解PaddleClas的使用方法,PaddleClas的详细使用见其Github官方Repo。
目前ColugoMum最高精度达96.91%,全网最高达97.56%。
Originally posted by @thomas-yanxin in ColugoMum/.github#1
Metadata
Metadata
Assignees
Labels
No labels