====== numpyとgeo.pyの速度比較 ======
===== – numpy はリストと比べて速いのか – =====
===== 目的 =====
ベクトル,回転行列,座標変換行列といった三次元幾何演算をpythonのリストをベースに[[upload_files:geo.py|geo.py]]というモジュールを自作している.リストベースの処理よりnumpyを使ったほうが高速なのではないかとの疑念もあるので比較を行う. \\
geo.pyはもともとpython2で開発されたが,単純な構造なのでpython3でも問題なく動く.
このテストは以下の条件で行った.
* ProBook 474s
* メモリ:8 GB
* CPU:Core™ i5-3230M
* OS: Ubuntu 20.04
* jupyter notebook,python3
このipynb自身は,[[./numpy_vs_geo.ipynb|numpy_vs_geo.ipynb]]となっている.
===== モジュールの読み込み =====
geo.py は自作モジュール
from geo import *
import time
import numpy as np
import pandas as pd
===== データの生成 =====
geo.pyには三次元ベクトル:VECTOR と三次元回転行列:MATRIXのクラスが定義されている. MATRIXのa, bはそれぞれx軸,y軸周りの回転を指定する.
g_v1=VECTOR(1,2,3)
g_v2=VECTOR(3,4,5)
g_R1=MATRIX(a=pi/3)
g_R2=MATRIX(b=pi/6)
この内容はこうなる.
print('g_v1 =', g_v1)
print('g_v2 =', g_v2)
print('g_R1 =', g_R1)
print('g_R2 =', g_R2)
g_v1 = v:[1.0, 2.0, 3.0]
g_v2 = v:[3.0, 4.0, 5.0]
g_R1 = m:[[1.0, 0.0, 0.0], [0.0, 0.5000000000000001, -0.8660254037844386], [0.0, 0.8660254037844386, 0.5000000000000001]]
g_R2 = m:[[0.8660254037844387, 0.0, 0.49999999999999994], [0.0, 1.0, 0.0], [-0.49999999999999994, 0.0, 0.8660254037844387]]
同様にnumpyのデータをndarrayで作る.
np_v1=np.array(g_v1)
np_v2=np.array(g_v2)
np_R1=np.array(g_R1)
np_R2=np.array(g_R2)
この内容はこうなる.
print('np_v1 =', np_v1)
print('np_v2 =', np_v2)
print('np_R1 =', np_R1)
print('np_R2 =', np_R2)
np_v1 = [1. 2. 3.]
np_v2 = [3. 4. 5.]
np_R1 = [[ 1. 0. 0. ]
[ 0. 0.5 -0.8660254]
[ 0. 0.8660254 0.5 ]]
np_R2 = [[ 0.8660254 0. 0.5 ]
[ 0. 1. 0. ]
[-0.5 0. 0.8660254]]
計測結果を入れる辞書の作成
===== 時間計測の関数と結果保存データ =====
def test(n,fn):
i=0
start=time.time()
while i< n :
fn()
i += 1
end = time.time()
rslt=end-start
return rslt
data = []
def judge(test_name, g_time, np_time) :
if g_time < np_time :
judgment = "geo.pyの勝ち"
elif g_time > np_time :
judgment = "npの勝ち"
else :
judgment = "引き分け"
return test_name, g_time, np_time, judgment
===== ループ回数の決定 =====
test(100, lambda : g_v1+g_v2)
0.00030612945556640625
test(1000, lambda : g_v1+g_v2)
0.0015869140625
test(10000, lambda : g_v1+g_v2)
0.024413347244262695
test(100000, lambda : g_v1+g_v2)
0.1378471851348877
test(1000000, lambda : g_v1+g_v2)
1.200444221496582
test(10000000, lambda : g_v1+g_v2)
11.367036819458008
test(100000000, lambda : g_v1+g_v2)
112.89321899414062
百万回ぐらいでループ前後のオーバーヘッドの影響が少なくなってきている. まだ多少影響はあるが,一千万,一億は時間がかかるし, どうせループ内の処理の影響は消せないので百万回に決定する.
N=1000000
===== ベクトルの和 npの勝ち =====
g_v1+g_v2
v:[4.0, 6.0, 8.0]
np_v1+np_v2
array([4., 6., 8.])
g_time = test(N, lambda : g_v1+g_v2)
print(g_time)
1.143357515335083
np_time = test(N, lambda : np_v1+np_v2)
print(np_time)
0.6900453567504883
data.append(judge('ベクトルの和', g_time, np_time))
===== ベクトルの内積 geo.pyの勝ち =====
g_v1.dot(g_v2)
26.0
np.dot(np_v1,np_v2)
26.0
g_time = test(N, lambda : g_v1.dot(g_v2))
print(g_time)
0.6457569599151611
np_time = test(N, lambda : np.dot(np_v1,np_v2))
print(np_time)
1.7959060668945312
data.append(judge('ベクトルの内積', g_time, np_time))
===== ベクトルの外積 geo.pyの圧勝 =====
というか np がひどすぎる
g_v1*g_v2
v:[-2.0, 4.0, -2.0]
np.cross(np_v1,np_v2)
array([-2., 4., -2.])
g_time = test(N, lambda : g_v1*g_v2)
print(g_time)
1.6717863082885742
np_time = test(N, lambda : np.cross(np_v1,np_v2))
print(np_time)
54.95365524291992
data.append(judge('ベクトルの外積', g_time, np_time))
===== 行列とベクトルの積 npの勝ち =====
g_R1*g_v1
v:[1.0, -1.5980762113533158, 3.2320508075688776]
np.dot(np_R1, np_v1)
array([ 1. , -1.59807621, 3.23205081])
g_time = test(N, lambda : g_R1*g_v1)
print(g_time)
2.362830638885498
np_time = test(N, lambda : np.dot(np_R1,np_v1))
print(np_time)
1.848921537399292
data.append(judge('行列とベクトルの積', g_time, np_time))
===== 行列同士の積 npの勝ち =====
g_R1*g_R2
m:[[0.8660254037844387, 0.0, 0.49999999999999994], [0.43301270189221924, 0.5000000000000001, -0.75], [-0.25, 0.8660254037844386, 0.43301270189221946]]
np.dot(np_R1,np_R2)
array([[ 0.8660254, 0. , 0.5 ],
[ 0.4330127, 0.5 , -0.75 ],
[-0.25 , 0.8660254, 0.4330127]])
g_time = test(1000000, lambda : g_R1*g_R2)
print(g_time)
5.8199920654296875
np_time = test(1000000, lambda : np.dot(np_R1,np_R2))
print(np_time)
2.266876697540283
data.append(judge('行列同士の積', g_time, np_time))
===== 結論 =====
まとめの表
df = pd.DataFrame(data, columns=["項目", "geo.py", "np", "結果"])
df
| 項目 | geo.py | np | 結果 | |
|---|---|---|---|---|
| 0 | ベクトルの和 | 1.143358 | 0.690045 | npの勝ち |
| ベクトルの内積 | 0.645757 | 1.795906 | geo.pyの勝ち | |
| 2 | ベクトルの外積 | 1.671786 | 54.953655 | geo.pyの勝ち |
| 3 | 行列とベクトルの積 | 2.362831 | 1.848922 | npの勝ち |
| 4 | 行列同士の積 | 5.819992 | 2.266877 | npの勝ち |