stanford_drone_segmentation

Необходимо сегментировать изображение по данным, размеченным bounding-box'ами.

Подход №1: Находим похожий датасет с разметкой для сегментации, обучаем на нем сеть для сегментации, прогоняем на наших изображениях. Такой датасет нашелся - https://www.kaggle.com/bulentsiyah/semantic-drone-dataset. В качестве baseline можно взять какую-то U-net. Скорее всего работать будет не очень хорошо, из-за того, что на нашем датасете масштаб намного меньше и качество изображений гораздо хуже
Подход 2 - обучаем модель непосредственно на данных текущего датасета. Применяем Weakly Supervised Semantic Segmentation, например модель Puzzle-CAM (https://arxiv.org/pdf/2101.11253v3.pdf), пример на github - https://github.com/OFRIN/PuzzleCAM
Подход 3 - поскольку объекты на изображениях достаточно мелкие, заменим боксы, получаемые при детекции крупными точками и будем использовать их в качестве сегментации. полученную карту сегментации объединим с полученной первым способом. там достаточно хорошо выделяются крупные объекты - деревья и т.д. Также можно на этапе постпроцессинга трэчить объекты после детекции, например фильтром калмана.

Ноутбуки для детекции взяты отсюда:

https://www.kaggle.com/shonenkov/training-efficientdet

https://www.kaggle.com/shonenkov/inference-efficientdet

Для тренировки необходимо установить архивную версию пакета timm:

pip install --no-deps 'timm-0.1.26-py3-none-any.whl' > /dev/null

Demo

python semantic_video.py --semantic_model Unet-Mobilenet.pt --detect_model effdet1_loss_0.6516653564969699_batch12_8000_state_dict.pt --colors_csv class_dict_seg.csv --inp_video video.mov

https://youtu.be/Sk1S_fkF6Js

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
data		data
effdet_old		effdet_old
README.md		README.md
Unet-Mobilenet.pt		Unet-Mobilenet.pt
class_dict_seg.csv		class_dict_seg.csv
detection_inference_on_frame.ipynb		detection_inference_on_frame.ipynb
effdet0_loss_055.pt		effdet0_loss_055.pt
effdet0_loss_055_state_dict.pt		effdet0_loss_055_state_dict.pt
effdet1_loss_0.6516653564969699_batch12_8000_state_dict.pt		effdet1_loss_0.6516653564969699_batch12_8000_state_dict.pt
effdet1_loss_0.7770166422261132_batch12_5000_state_dict.pt		effdet1_loss_0.7770166422261132_batch12_5000_state_dict.pt
effdet1_loss_1_42_batch12_state_dict.pt		effdet1_loss_1_42_batch12_state_dict.pt
effdet_inference_stanford.ipynb		effdet_inference_stanford.ipynb
effdet_train_stanford.ipynb		effdet_train_stanford.ipynb
efficientdet_d1-4c7ebaf2.pth		efficientdet_d1-4c7ebaf2.pth
inference.ipynb		inference.ipynb
requirements.txt		requirements.txt
semantic_video.py		semantic_video.py
timm-0.1.26-py3-none-any.whl		timm-0.1.26-py3-none-any.whl
train_effdet.py		train_effdet.py
train_semantic_segmentation.ipynb		train_semantic_segmentation.ipynb
training-efficientdet.ipynb		training-efficientdet.ipynb
utils.py		utils.py
weak_supervized.ipynb		weak_supervized.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

stanford_drone_segmentation

Demo

About

Uh oh!

Releases

Packages

Uh oh!

Languages

altimerk/stanford_drone_segmentation

Folders and files

Latest commit

History

Repository files navigation

stanford_drone_segmentation

Demo

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages