deeplabv3plus_re

semantic segmentation on ros

0410:

学习CityScapes数据集的使用；
尝试将Citycapes中的图片以ROS格式发布；

0411：

将Cityscapes数据集下载好后，使用官方的scripts脚本进行处理，之后整理好train和val文件夹；
组织了半天Cityscapes数据集的文件夹，，，应该将下载好的数据集，解压之后，从文件夹里把子文件夹取出来。
下载resnet101的权重文件，注意下载好的.pth.tar无需解压，提示解压错误后就说明这本身就是一个权重文件，可以直接使用。
运行main.py脚本python main.py --model deeplabv3plus_resnet101 --gpu_id 0 --lr 0.1 --crop_size 768 --batch_size 16 --output_stride 16 --ckpt ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar --test_only --save_val_results --data_root /home/xilm/Cityscapes/ --dataset cityscapes

Device: cuda
Dataset: cityscapes, Train set: 2975, Val set: 500
Downloading: "https://download.pytorch.org/models/resnet101-5d3b4d8f.pth" to /home/xilm/.cache/torch/hub/checkpoints/resnet101-5d3b4d8f.pth
100%|████████████████████████████████████████████████████████████████████| 170M/170M [01:07<00:00, 2.64MB/s]
Model restored from ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar
125it [12:46,  6.13s/it]

Overall Acc: 0.958689
Mean Acc: 0.837516
FreqW Acc: 0.923537
Mean IoU: 0.762100

运行之后，获得了许多分割结果，这些结果都保存在./results文件夹下。

5. 运行predict.py脚本：python predict.py --model deeplabv3plus_resnet101 --gpu_id 0 --crop_size 768 --output_stride 16 --ckpt ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar --save_val_results_to ./result/ --dataset cityscapes --input /home/xilm/Cityscapes/leftImg8bit/test/berlin/berlin_000001_000019_leftImg8bit.png

(base) xilm@xilm-MS-7D17:~/fuxian/deeplabv3plus/DeepLabV3Plus-Pytorch-master$ python predict.py --model deeplabv3plus_resnet101 --gpu_id 0 --crop_size 768 --output_stride 16 --ckpt ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar --save_val_results_to ./result/ --dataset cityscapes --input /home/xilm/Cityscapes/leftImg8bit/test/berlin/berlin_000001_000019_leftImg8bit.png
Device: cuda
Resume model from ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar
100%|█████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00,  2.12it/s]

运行结束后获得了分割结果。

6. 接下来准备将Cityscapes的图片通过ROS的方式发布出去。

从Cityscapes官网上下载下面的数据集，它包含了三个完整的视频；
编写img_pub.py脚本，对数据集中的图像进行发布，该脚本我放到了pub文件夹下；
编写好之后，右键该文件，勾选Allow executing file as program，使该文件可以通过rosrun进行运行；
运行source devel/setup.bash，然后运行RViz;
接着再次运行source devel/setup.bash，输入rosrun img_seg img_pub.py后，就可以在RViz上进行订阅，然后显示视频了。

对发布的图像数据进行订阅，用于语义分割，并将语义分割的结果发布出来，在RViz上进行显示。

复现成功，结果如下：

可以看出，具有一定的延迟，没有办法做到实时。

这个库的功能就到这里啦，接下来继续openpcdet-ros。

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
pictures		pictures
pub		pub
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

deeplabv3plus_re

0410:

0411：

About

Releases

Packages

Languages

License

XxxuLimei/deeplabv3plus_re

Folders and files

Latest commit

History

Repository files navigation

deeplabv3plus_re

0410:

0411：

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages