====== numpyとgeo.pyの速度比較 ====== ===== – numpy はリストと比べて速いのか – ===== ===== 目的 ===== ベクトル，回転行列，座標変換行列といった三次元幾何演算をpythonのリストをベースに[[upload_files:geo.py|geo.py]]というモジュールを自作している．リストベースの処理よりnumpyを使ったほうが高速なのではないかとの疑念もあるので比較を行う． \\ geo.pyはもともとpython2で開発されたが，単純な構造なのでpython3でも問題なく動く．このテストは以下の条件で行った． * ProBook 474s * メモリ：8 GB * CPU：Core™ i5-3230M * OS: Ubuntu 20.04 * jupyter notebook，python3 このipynb自身は，[[./numpy_vs_geo.ipynb|numpy_vs_geo.ipynb]]となっている． ===== モジュールの読み込み ===== geo.py は自作モジュール


from geo import *
import time
import numpy as np
import pandas as pd

===== データの生成 ===== geo.pyには三次元ベクトル：VECTOR と三次元回転行列：MATRIXのクラスが定義されている． MATRIXのa, bはそれぞれx軸，y軸周りの回転を指定する．


g_v1=VECTOR(1,2,3)
g_v2=VECTOR(3,4,5)
g_R1=MATRIX(a=pi/3)
g_R2=MATRIX(b=pi/6)

この内容はこうなる．


print('g_v1 =', g_v1)
print('g_v2 =', g_v2)
print('g_R1 =', g_R1)
print('g_R2 =', g_R2)


g_v1 = v:[1.0, 2.0, 3.0]
g_v2 = v:[3.0, 4.0, 5.0]
g_R1 = m:[[1.0, 0.0, 0.0], [0.0, 0.5000000000000001, -0.8660254037844386], [0.0, 0.8660254037844386, 0.5000000000000001]]
g_R2 = m:[[0.8660254037844387, 0.0, 0.49999999999999994], [0.0, 1.0, 0.0], [-0.49999999999999994, 0.0, 0.8660254037844387]]

同様にnumpyのデータをndarrayで作る．


np_v1=np.array(g_v1)
np_v2=np.array(g_v2)
np_R1=np.array(g_R1)
np_R2=np.array(g_R2)

この内容はこうなる．


print('np_v1 =', np_v1)
print('np_v2 =', np_v2)
print('np_R1 =', np_R1)
print('np_R2 =', np_R2)


np_v1 = [1. 2. 3.]
np_v2 = [3. 4. 5.]
np_R1 = [[ 1.         0.         0.       ]
 [ 0.         0.5       -0.8660254]
 [ 0.         0.8660254  0.5      ]]
np_R2 = [[ 0.8660254  0.         0.5      ]
 [ 0.         1.         0.       ]
 [-0.5        0.         0.8660254]]

計測結果を入れる辞書の作成 ===== 時間計測の関数と結果保存データ =====


def test(n,fn):
    i=0
    start=time.time()
    while i< n :
        fn()
        i += 1
    end = time.time()
    rslt=end-start
    return rslt


data = []


def judge(test_name, g_time, np_time) :
    if g_time < np_time :
        judgment = "geo.pyの勝ち"
    elif g_time > np_time :
        judgment = "npの勝ち"
    else :
        judgment = "引き分け"
    return test_name, g_time, np_time, judgment

===== ループ回数の決定 =====


test(100, lambda : g_v1+g_v2)


0.00030612945556640625


test(1000, lambda : g_v1+g_v2)


0.0015869140625


test(10000, lambda : g_v1+g_v2)


0.024413347244262695


test(100000, lambda : g_v1+g_v2)


0.1378471851348877


test(1000000, lambda : g_v1+g_v2)


1.200444221496582


test(10000000, lambda : g_v1+g_v2)


11.367036819458008


test(100000000, lambda : g_v1+g_v2)


112.89321899414062

百万回ぐらいでループ前後のオーバーヘッドの影響が少なくなってきている．まだ多少影響はあるが，一千万，一億は時間がかかるし，どうせループ内の処理の影響は消せないので百万回に決定する．


N=1000000

===== ベクトルの和　npの勝ち =====


g_v1+g_v2


v:[4.0, 6.0, 8.0]


np_v1+np_v2


array([4., 6., 8.])


g_time = test(N, lambda : g_v1+g_v2)
print(g_time)


1.143357515335083


np_time = test(N, lambda : np_v1+np_v2)
print(np_time)


0.6900453567504883


data.append(judge('ベクトルの和', g_time, np_time))

===== ベクトルの内積　geo.pyの勝ち =====


g_v1.dot(g_v2)


26.0


np.dot(np_v1,np_v2)


26.0


g_time = test(N, lambda : g_v1.dot(g_v2))
print(g_time)


0.6457569599151611


np_time = test(N, lambda : np.dot(np_v1,np_v2))
print(np_time)


1.7959060668945312


data.append(judge('ベクトルの内積', g_time, np_time))

===== ベクトルの外積　geo.pyの圧勝 ===== というか np がひどすぎる


g_v1*g_v2


v:[-2.0, 4.0, -2.0]


np.cross(np_v1,np_v2)


array([-2.,  4., -2.])


g_time = test(N, lambda : g_v1*g_v2)
print(g_time)


1.6717863082885742


np_time = test(N, lambda : np.cross(np_v1,np_v2))
print(np_time)


54.95365524291992


data.append(judge('ベクトルの外積', g_time, np_time))

===== 行列とベクトルの積　npの勝ち =====


g_R1*g_v1


v:[1.0, -1.5980762113533158, 3.2320508075688776]


np.dot(np_R1, np_v1)


array([ 1.        , -1.59807621,  3.23205081])


g_time = test(N, lambda : g_R1*g_v1)
print(g_time)


2.362830638885498


np_time = test(N, lambda : np.dot(np_R1,np_v1))
print(np_time)


1.848921537399292


data.append(judge('行列とベクトルの積', g_time, np_time))

===== 行列同士の積　npの勝ち =====


g_R1*g_R2


m:[[0.8660254037844387, 0.0, 0.49999999999999994], [0.43301270189221924, 0.5000000000000001, -0.75], [-0.25, 0.8660254037844386, 0.43301270189221946]]


np.dot(np_R1,np_R2)


array([[ 0.8660254,  0.       ,  0.5      ],
       [ 0.4330127,  0.5      , -0.75     ],
       [-0.25     ,  0.8660254,  0.4330127]])


g_time = test(1000000, lambda : g_R1*g_R2)
print(g_time)


5.8199920654296875


np_time = test(1000000, lambda : np.dot(np_R1,np_R2))
print(np_time)


2.266876697540283


data.append(judge('行列同士の積', g_time, np_time))

===== 結論 ===== まとめの表


df = pd.DataFrame(data, columns=["項目", "geo.py", "np", "結果"])
df

	項目	geo.py	np	結果
0	ベクトルの和	1.143358	0.690045	npの勝ち
	ベクトルの内積	0.645757	1.795906	geo.pyの勝ち
2	ベクトルの外積	1.671786	54.953655	geo.pyの勝ち
3	行列とベクトルの積	2.362831	1.848922	npの勝ち
4	行列同士の積	5.819992	2.266877	npの勝ち

結論から言うと，意外にに差がないということが分かる．大きなサイズのデータを扱うときはnumpyが良いのだろうが，三次元のベクトルや行列では大きな差は出ない．それ以上に大きな驚きはnumpyのベクトルの外積の遅さであった．ロボットのプログラムで使うときは個々の要素へのアクセスも多くあるので，なおさら差が出にくく現状のgeo.pyで十分であると考えられる． ^ 項目 ^ geo.py ^ np ^ 結果 ^ | foo | bar |