DeepBeliefSDK with GPU

2018年12月19日 - 未分類

DeepBeliefSDKは、Raspberry PiのGPU を使えば、30倍も早くなるということでやってみました。

結論としては、GPUが使えるのは、Raspberry Pi1だけで、Raspberry Pi2やRaspberry Pi3では動作しませんでした。Raspberry Pi2では、ハングアップしてしまいます。

しかし、Eigenを使えば、6倍ほど早くなるようです。Raspberry Pi3のGPUが使えるまで、まだまだ、時間がかかりそうですね。

Eigen

GPU MEM 512MB EIGEN

make GEMM=eigen TARGET=pi2

~/projects/DeepBeliefSDK/source $ time ./jpcnn -i data/dog.jpg -n ../networks/jetpac.ntwk -t -m s 

0.015300 soccer ball
0.020866 standard poodle
0.169138 boxer
0.038990 corgi
0.213237 Staffordshire bullterrier
0.024005 greyhound
0.012390 English setter
0.013972 miniature poodle
0.016022 tennis ball
0.025065 dalmatian
0.394529 golden retriever

Classification took 3868 milliseconds
real 0m8.559s
user 0m3.555s
sys 0m0.598s

 

make

~/projects/DeepBeliefSDK/source $ time ./jpcnn -i data/dog.jpg -n ../networks/jetpac.ntwk -t -m s 

0.015300 soccer ball
0.020865 standard poodle
0.169137 boxer
0.038990 corgi
0.213236 Staffordshire bullterrier
0.024005 greyhound
0.012390 English setter
0.013972 miniature poodle
0.016022 tennis ball
0.025065 dalmatian
0.394531 golden retriever

Classification took 20106 milliseconds
real 0m20.737s
user 0m20.140s
sys 0m0.550s

ちなみに、BLASは、Eigenほどは早くなりませんでした。

BLAS

~/projects/DeepBeliefSDK/source $ make clean;make GEMM=atlas TARGET=pi2

~/projects/DeepBeliefSDK/source $ time ./jpcnn -i data/dog.jpg -n ../networks/jetpac.ntwk -t -m s 

0.015300 soccer ball
0.020866 standard poodle
0.169138 boxer
0.038990 corgi
0.213237 Staffordshire bullterrier
0.024005 greyhound
0.012390 English setter
0.013972 miniature poodle
0.016022 tennis ball
0.025065 dalmatian
0.394529 golden retriever

Classification took 2659 milliseconds
real 0m9.980s
user 0m6.722s
sys 0m0.564s

Translate »