Jakie są różnice między tablicami numpy i macierzami? Którego powinienem użyć?

Jakie są zalety i wady każdego z nich?

Z tego, co widziałem, albo jeden może pracować jako zamiennik dla drugiego, jeśli zajdzie taka potrzeba, więc powinienem zawracać sobie głowę używaniem obu, czy powinienem trzymać się tylko jednego z nich?

Czy styl programu wpłynie na mój wybór? Robię trochę uczenia maszynowego za pomocą numpy, więc jest rzeczywiście wiele macierzy, ale także wiele wektorów (tablic).

Author: Teun Zengerink, 2010-11-11

4 answers

Macierze Numpy są ściśle dwuwymiarowe, podczas gdy tablice numpy (ndarrays) są N-wymiarowe. Obiekty macierzy są podklasą ndarray, więc dziedziczą wszystkie atrybuty i metody ndarrays.

Główną zaletą macierzy numpy jest to, że zapewniają wygodną notację dla mnożenia macierzy: Jeśli a i b są macierzami, to a*b jest ich macierzą produkt.

import numpy as np

a=np.mat('4 3; 2 1')
b=np.mat('1 2; 3 4')
print(a)
# [[4 3]
#  [2 1]]
print(b)
# [[1 2]
#  [3 4]]
print(a*b)
# [[13 20]
#  [ 5  8]]

Z drugiej strony, począwszy od Pythona 3.5, NumPy obsługuje mnożenie macierzy infiksowych za pomocą @ operator, dzięki czemu można osiągnąć taką samą wygodę mnożenia macierzy z ndarrays w Pythonie > = 3.5.

import numpy as np

a=np.array([[4, 3], [2, 1]])
b=np.array([[1, 2], [3, 4]])
print(a@b)
# [[13 20]
#  [ 5  8]]

Obie macierze i ndarray mają .T zwracać transpozycję, ale macierz obiekty mają również .H dla transpozycji sprzężonej i .I dla odwrotności.

Natomiast tablice numpy konsekwentnie przestrzegają reguły, że operacje są zastosowany w elemencie (z wyjątkiem nowego operatora @). Tak więc, jeśli a i b są tablicami numerycznymi, to a*b jest array utworzony przez mnożenie elementów składowych:

c=np.array([[4, 3], [2, 1]])
d=np.array([[1, 2], [3, 4]])
print(c*d)
# [[4 6]
#  [6 4]]

Aby uzyskać wynik mnożenia macierzy, użyj np.dot (lub @ w Pythonie > = 3.5, jak pokazano powyżej):

print(np.dot(c,d))
# [[13 20]
#  [ 5  8]]

Operator ** zachowuje się również inaczej:

print(a**2)
# [[22 15]
#  [10  7]]
print(c**2)
# [[16  9]
#  [ 4  1]]

Ponieważ a jest macierzą, a**2 Zwraca iloczyn macierzy a*a. Ponieważ c jest ndarray, c**2 zwraca ndarray z każdym składnikiem do kwadratu żywioł.

Istnieją inne różnice techniczne między matrix objects and ndarrays (mając do czynienia z np.ravel, wybór pozycji i zachowanie sekwencji).

Główną zaletą tablic numpy jest to, że są one bardziej ogólne niż Macierze dwuwymiarowe. Co się dzieje, gdy chcesz trójwymiarową tablicę? Wtedy musisz użyć ndarray, a nie obiektu matrix. W ten sposób nauka posługiwania się matrycą obiektów jest więcej pracy - trzeba nauczyć się operacji obiektowych macierzy, A ndarray operations.

Pisanie programu używającego zarówno macierzy jak i tablic utrudnia Ci życie ponieważ musisz śledzić, jakiego typu obiektu są Twoje zmienne, aby mnożenie zwraca coś, czego się nie spodziewasz.

W przeciwieństwie, jeśli trzymać się wyłącznie z ndarrays, to można zrobić wszystko matrix obiektów może zrobić, i Więcej, z wyjątkiem nieco inny funkcje / notacja.

Jeśli chcesz zrezygnować z atrakcyjności wizualnej produktu NumPy matrix notacji (co można osiągnąć prawie tak elegancko z ndarrays w Pythonie > = 3.5), więc myślę, że tablice NumPy są zdecydowanie drogą do zrobienia.

PS. Oczywiście nie musisz wybierać jednego kosztem drugiego, ponieważ np.asmatrix i np.asarray pozwalają na konwersję jednego na drugi (jako o ile tablica jest dwuwymiarowa).


Jest podsumowanie różnic pomiędzy NumPy arrays A NumPy matrixes tutaj .

 323
Author: unutbu,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-06-13 22:54:34

Scipy.org zaleca używanie tablic:

*'macierz czy macierz? Którego powinienem użyć? - Krótka odpowiedź

Użyj tablic.

  • Są to standardowe typy wektorowe/macierzowe / tensorowe numpy. Wiele funkcji numpy zwraca tablice, a nie macierze.

  • Istnieje wyraźne rozróżnienie między operacjami elementarnymi a operacje algebry liniowej.

  • Możesz mieć standardowe wektory lub wiersz / kolumnę wektory, jeśli chcesz.

Jedyną wadą używania typu array jest to, że będziesz musiał użyj dot zamiast *, aby mnożyć (redukować) dwa tensory (iloczyn skalarny, mnożenie wektorów macierzowych itp.).

 73
Author: atomh33ls,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-05-25 12:36:31

Żeby dodać jedną sprawę do listy unutbu.

Jedną z największych praktycznych różnic dla mnie numpy ndarrays w porównaniu do macierzy numpy lub języków macierzowych, takich jak matlab, jest to, że wymiar nie jest zachowany w operacjach redukcji. Macierze są zawsze 2d, podczas gdy średnia tablicy, na przykład, ma o jeden wymiar mniej.

Na przykład wiersze macierzy lub tablicy:

Z matrycą

>>> m = np.mat([[1,2],[2,3]])
>>> m
matrix([[1, 2],
        [2, 3]])
>>> mm = m.mean(1)
>>> mm
matrix([[ 1.5],
        [ 2.5]])
>>> mm.shape
(2, 1)
>>> m - mm
matrix([[-0.5,  0.5],
        [-0.5,  0.5]])

Z tablicą

>>> a = np.array([[1,2],[2,3]])
>>> a
array([[1, 2],
       [2, 3]])
>>> am = a.mean(1)
>>> am.shape
(2,)
>>> am
array([ 1.5,  2.5])
>>> a - am #wrong
array([[-0.5, -0.5],
       [ 0.5,  0.5]])
>>> a - am[:, np.newaxis]  #right
array([[-0.5,  0.5],
       [-0.5,  0.5]])
Myślę też, że mieszanie tablic i macierze powodują wiele "szczęśliwych" godzin debugowania. Jednak scypy.macierze sparse są zawsze macierzami w kategoriach operatorów takich jak mnożenie.
 25
Author: Josef,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2010-11-11 20:49:23

Jak już inni wspominali, być może główną zaletą matrix było to, że zapewniało wygodną notację do mnożenia macierzy.

Jednak w Pythonie 3.5 istnieje wreszcie dedykowany operator infiksu do mnożenia macierzy: @.

Z najnowszymi wersjami NumPy, może być używany z ndarray s:

A = numpy.ones((1, 3))
B = numpy.ones((3, 3))
A @ B

Więc w dzisiejszych czasach, nawet bardziej, gdy masz wątpliwości, powinieneś trzymać się ndarray.

 16
Author: Peque,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2016-01-26 11:09:28