Jakie są różnice między tablicami numpy i macierzami? Którego powinienem użyć?
Jakie są zalety i wady każdego z nich?
Z tego, co widziałem, albo jeden może pracować jako zamiennik dla drugiego, jeśli zajdzie taka potrzeba, więc powinienem zawracać sobie głowę używaniem obu, czy powinienem trzymać się tylko jednego z nich?
Czy styl programu wpłynie na mój wybór? Robię trochę uczenia maszynowego za pomocą numpy, więc jest rzeczywiście wiele macierzy, ale także wiele wektorów (tablic).
4 answers
Macierze Numpy są ściśle dwuwymiarowe, podczas gdy tablice numpy (ndarrays) są N-wymiarowe. Obiekty macierzy są podklasą ndarray, więc dziedziczą wszystkie atrybuty i metody ndarrays.
Główną zaletą macierzy numpy jest to, że zapewniają wygodną notację dla mnożenia macierzy: Jeśli a i b są macierzami, to a*b jest ich macierzą produkt.
import numpy as np
a=np.mat('4 3; 2 1')
b=np.mat('1 2; 3 4')
print(a)
# [[4 3]
# [2 1]]
print(b)
# [[1 2]
# [3 4]]
print(a*b)
# [[13 20]
# [ 5 8]]
Z drugiej strony, począwszy od Pythona 3.5, NumPy obsługuje mnożenie macierzy infiksowych za pomocą @
operator, dzięki czemu można osiągnąć taką samą wygodę mnożenia macierzy z ndarrays w Pythonie > = 3.5.
import numpy as np
a=np.array([[4, 3], [2, 1]])
b=np.array([[1, 2], [3, 4]])
print(a@b)
# [[13 20]
# [ 5 8]]
Obie macierze i ndarray mają .T
zwracać transpozycję, ale macierz
obiekty mają również .H
dla transpozycji sprzężonej i .I
dla odwrotności.
Natomiast tablice numpy konsekwentnie przestrzegają reguły, że operacje są
zastosowany w elemencie (z wyjątkiem nowego operatora @
). Tak więc, jeśli a
i b
są tablicami numerycznymi, to a*b
jest array
utworzony przez mnożenie elementów składowych:
c=np.array([[4, 3], [2, 1]])
d=np.array([[1, 2], [3, 4]])
print(c*d)
# [[4 6]
# [6 4]]
Aby uzyskać wynik mnożenia macierzy, użyj np.dot
(lub @
w Pythonie > = 3.5, jak pokazano powyżej):
print(np.dot(c,d))
# [[13 20]
# [ 5 8]]
Operator **
zachowuje się również inaczej:
print(a**2)
# [[22 15]
# [10 7]]
print(c**2)
# [[16 9]
# [ 4 1]]
Ponieważ a
jest macierzą, a**2
Zwraca iloczyn macierzy a*a
.
Ponieważ c
jest ndarray, c**2
zwraca ndarray z każdym składnikiem do kwadratu
żywioł.
Istnieją inne różnice techniczne między matrix objects and ndarrays (mając do czynienia z np.ravel, wybór pozycji i zachowanie sekwencji).
Główną zaletą tablic numpy jest to, że są one bardziej ogólne niż Macierze dwuwymiarowe. Co się dzieje, gdy chcesz trójwymiarową tablicę? Wtedy musisz użyć ndarray, a nie obiektu matrix. W ten sposób nauka posługiwania się matrycą obiektów jest więcej pracy - trzeba nauczyć się operacji obiektowych macierzy, A ndarray operations.
Pisanie programu używającego zarówno macierzy jak i tablic utrudnia Ci życie ponieważ musisz śledzić, jakiego typu obiektu są Twoje zmienne, aby mnożenie zwraca coś, czego się nie spodziewasz.
W przeciwieństwie, jeśli trzymać się wyłącznie z ndarrays, to można zrobić wszystko matrix obiektów może zrobić, i Więcej, z wyjątkiem nieco inny funkcje / notacja.
Jeśli chcesz zrezygnować z atrakcyjności wizualnej produktu NumPy matrix notacji (co można osiągnąć prawie tak elegancko z ndarrays w Pythonie > = 3.5), więc myślę, że tablice NumPy są zdecydowanie drogą do zrobienia.
PS. Oczywiście nie musisz wybierać jednego kosztem drugiego,
ponieważ np.asmatrix
i np.asarray
pozwalają na konwersję jednego na drugi (jako
o ile tablica jest dwuwymiarowa).
Jest podsumowanie różnic pomiędzy NumPy arrays
A NumPy matrix
es tutaj .
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-06-13 22:54:34
Scipy.org zaleca używanie tablic:
*'macierz czy macierz? Którego powinienem użyć? - Krótka odpowiedź
Użyj tablic.
Są to standardowe typy wektorowe/macierzowe / tensorowe numpy. Wiele funkcji numpy zwraca tablice, a nie macierze.
Istnieje wyraźne rozróżnienie między operacjami elementarnymi a operacje algebry liniowej.
Możesz mieć standardowe wektory lub wiersz / kolumnę wektory, jeśli chcesz.
Jedyną wadą używania typu array jest to, że będziesz musiał użyj
dot
zamiast*
, aby mnożyć (redukować) dwa tensory (iloczyn skalarny, mnożenie wektorów macierzowych itp.).
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-05-25 12:36:31
Żeby dodać jedną sprawę do listy unutbu.
Jedną z największych praktycznych różnic dla mnie numpy ndarrays w porównaniu do macierzy numpy lub języków macierzowych, takich jak matlab, jest to, że wymiar nie jest zachowany w operacjach redukcji. Macierze są zawsze 2d, podczas gdy średnia tablicy, na przykład, ma o jeden wymiar mniej.
Na przykład wiersze macierzy lub tablicy:
Z matrycą
>>> m = np.mat([[1,2],[2,3]])
>>> m
matrix([[1, 2],
[2, 3]])
>>> mm = m.mean(1)
>>> mm
matrix([[ 1.5],
[ 2.5]])
>>> mm.shape
(2, 1)
>>> m - mm
matrix([[-0.5, 0.5],
[-0.5, 0.5]])
Z tablicą
>>> a = np.array([[1,2],[2,3]])
>>> a
array([[1, 2],
[2, 3]])
>>> am = a.mean(1)
>>> am.shape
(2,)
>>> am
array([ 1.5, 2.5])
>>> a - am #wrong
array([[-0.5, -0.5],
[ 0.5, 0.5]])
>>> a - am[:, np.newaxis] #right
array([[-0.5, 0.5],
[-0.5, 0.5]])
Myślę też, że mieszanie tablic i macierze powodują wiele "szczęśliwych" godzin debugowania.
Jednak scypy.macierze sparse są zawsze macierzami w kategoriach operatorów takich jak mnożenie.Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2010-11-11 20:49:23
Jak już inni wspominali, być może główną zaletą matrix
było to, że zapewniało wygodną notację do mnożenia macierzy.
Jednak w Pythonie 3.5 istnieje wreszcie dedykowany operator infiksu do mnożenia macierzy: @
.
Z najnowszymi wersjami NumPy, może być używany z ndarray
s:
A = numpy.ones((1, 3))
B = numpy.ones((3, 3))
A @ B
Więc w dzisiejszych czasach, nawet bardziej, gdy masz wątpliwości, powinieneś trzymać się ndarray
.
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2016-01-26 11:09:28