Wybieranie konkretnych wierszy i kolumn z tablicy NumPy

Wariuję, próbując zrozumieć, co robię źle.

Używam NumPy i mam określone indeksy wierszy i konkretne indeksy kolumn, z których chcę wybrać. Oto sedno mojego problemu:

import numpy as np

a = np.arange(20).reshape((5,4))
# array([[ 0,  1,  2,  3],
#        [ 4,  5,  6,  7],
#        [ 8,  9, 10, 11],
#        [12, 13, 14, 15],
#        [16, 17, 18, 19]])

# If I select certain rows, it works
print a[[0, 1, 3], :]
# array([[ 0,  1,  2,  3],
#        [ 4,  5,  6,  7],
#        [12, 13, 14, 15]])

# If I select certain rows and a single column, it works
print a[[0, 1, 3], 2]
# array([ 2,  6, 14])

# But if I select certain rows AND certain columns, it fails
print a[[0,1,3], [0,2]]
# Traceback (most recent call last):
#   File "<stdin>", line 1, in <module>
# ValueError: shape mismatch: objects cannot be broadcast to a single shape
Dlaczego tak się dzieje? Z pewnością powinienem być w stanie wybrać 1., 2. i 4. wiersze oraz 1. i 3. kolumny? Spodziewam się wyniku:
a[[0,1,3], [0,2]] => [[0,  2],
                      [4,  6],
                      [12, 14]]
Author: smci, 2014-04-08

3 answers

Fantazyjne indeksowanie wymaga podania wszystkich indeksów dla każdego wymiaru. Podajesz 3 wskaźniki dla pierwszego i tylko 2 dla drugiego, stąd błąd. Chcesz zrobić coś takiego:

>>> a[[[0, 0], [1, 1], [3, 3]], [[0,2], [0,2], [0, 2]]]
array([[ 0,  2],
       [ 4,  6],
       [12, 14]])

To jest oczywiście ból do pisania, więc możesz pozwolić nadawanie pomóc:

>>> a[[[0], [1], [3]], [0, 2]]
array([[ 0,  2],
       [ 4,  6],
       [12, 14]])

Jest to o wiele prostsze do zrobienia, jeśli indeksujesz tablicami, a nie listami:

>>> row_idx = np.array([0, 1, 3])
>>> col_idx = np.array([0, 2])
>>> a[row_idx[:, None], col_idx]
array([[ 0,  2],
       [ 4,  6],
       [12, 14]])
 44
Author: Jaime,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2014-04-08 04:59:26

Jak sugeruje Toan, prostym włamaniem byłoby wybranie najpierw wierszy, a następnie zaznaczenie kolumn nad , które .

>>> a[[0,1,3], :]            # Returns the rows you want
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [12, 13, 14, 15]])
>>> a[[0,1,3], :][:, [0,2]]  # Selects the columns you want as well
array([[ 0,  2],
       [ 4,  6],
       [12, 14]])
[[12]}[Edytuj] metoda wbudowana: np.ix_

Niedawno odkryłem, że numpy daje wbudowany jeden liner do robienia dokładnie tego, co zasugerował @Jaime, ale bez konieczności używania składni nadawania (która cierpi na brak czytelności). Z docs:

Używając ix_ można szybko konstruować tablice indeksowe które będą indeksować produkt krzyżowy. a[np.ix_([1,3],[2,5])] zwraca tablicę [[a[1,2] a[1,5]], [a[3,2] a[3,5]]].

Więc używasz go w ten sposób:

>>> a = np.arange(20).reshape((5,4))
>>> a[np.ix_([0,1,3], [0,2])]
array([[ 0,  2],
       [ 4,  6],
       [12, 14]])

A sposób działania polega na tym, że zajmuje się wyrównywaniem tablic tak, jak sugerował Jaime, aby nadawanie odbywało się prawidłowo:

>>> np.ix_([0,1,3], [0,2])
(array([[0],
        [1],
        [3]]), array([[0, 2]]))

Ponadto, jak mówi MikeC w komentarzu, np.ix_ ma tę zaletę, że zwraca widok, którego moja pierwsza (Pre-edit)odpowiedź Nie. Oznacza to, że możesz teraz przypisać do zindeksowanej tablicy:

>>> a[np.ix_([0,1,3], [0,2])] = -1
>>> a    
array([[-1,  1, -1,  3],
       [-1,  5, -1,  7],
       [ 8,  9, 10, 11],
       [-1, 13, -1, 15],
       [16, 17, 18, 19]])
 35
Author: Praveen,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-06-28 22:50:36

Użycie:

 >>> a[[0,1,3]][:,[0,2]]
array([[ 0,  2],
   [ 4,  6],
   [12, 14]])

Lub:

>>> a[[0,1,3],::2]
array([[ 0,  2],
   [ 4,  6],
   [12, 14]])
 4
Author: Toan Nguyen,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2014-04-08 07:39:43