deep-learning

Zrozumienie Keras LSTMs

Staram się pogodzić moje zrozumienie LSTMs i wskazał tutaj w ten post przez Christopher Olah zaimplementowane w Keras. Jest ... eareBot Update2: Mam podsumowałem większość mojego zrozumienia LSTMs tutaj: https://www.youtube.com/watch?v=ywinX5wgdEU

Architektura perceptron wielowarstwowy (MLP): kryteria wyboru liczby ukrytych warstw i ich wielkości? [zamknięte]

zamknięte . To pytanie jest oparte na opinii . Obecnie nie przyjmuje odpowiedzi. ... twie wyjściowej.Ale jakie są kryteria wyboru liczba ukrytych warstw w MLP i ile węzłów neuronowych w jednej ukrytej warstwie?

Wiele do jednego i wiele do wielu przykładów LSTM w Keras

Staram się zrozumieć LSTM i jak je budować z Keras. Okazało się, że są głównie 4 tryby do uruchomienia RNN (4 właściwe Na zdj ... l.add(LSTM(128, input_shape=(timesteps, data_dim))) model.add(Dense(1)) Dla każdego z 4 zadań, może z odrobiną wyjaśnienia.

Jaka jest różnica między "tym samym" a "prawidłowym" wypełnieniem w tf.nn.maksymalna Pula tensorflow?

Jaka jest różnica między "tym samym" i "prawidłowym" wypełnieniem w tf.nn.max_pool z tensorflow? Moim zdaniem, "poprawne" oz ... adding w operatorze puli, tzn. wystarczy użyć 'VALID' z tensorflow. Ale co to jest "ta sama" wyściółka max pool w tensorflow?

Jak zainicjować wagi w PyTorch?

Jak zainicjować wagi i błędy (na przykład inicjalizacja He lub Xavier) w sieci w PyTorch?

Używanie wstępnie przeszkolonego osadzania słów (word2vec lub Glove) w TensorFlow

Ostatnio przejrzałem ciekawą implementację klasyfikacji tekstów. Jednak cały kod TensorFlow, który przeglądałem, używa losow ... bedded_chars, -1) Czy ktoś wie jak korzystać z wyników word2vec lub wstępnie wytrenowanego osadzania słów zamiast losowego?

Dlaczego w sieci neuronowej backpropagation musi być używana nieliniowa funkcja aktywacji?

Czytałem kilka rzeczy na temat sieci neuronowych i Rozumiem ogólną zasadę jednowarstwowej sieci neuronowej. Rozumiem potrzebę ... nieliniowe funkcje aktywacji? Po tym pytaniu następuje to: Jaka jest pochodna funkcji aktywacyjnej używanej w odwrotności?

Keras input explanation: kształt wejściowy, jednostki, wielkość partii, dim, itp

Dla dowolnej warstwy Keras (Layer Klasa), czy ktoś może wyjaśnić jak rozumieć różnicę między input_shape, units, dim, itd.? ... a jednostek? W skrócie jak można zrozumieć / zwizualizować atrybuty modelu - w szczególności warstwy-z poniższym obrazem?

Oszacowanie liczby neuronów i liczby warstw sztucznej sieci neuronowej [zamkniętej]

Szukam metody, jak obliczyć liczbę warstw i liczbę neuronów na warstwę. Jako wejście mam tylko rozmiar wektora wejściowego, r ... est określana przez wypróbowanie różnych topologii sieci i wybranie tej z najmniejszym błędem. Niestety nie mogę tego zrobić.

Jak dodać regularyzacje w TensorFlow?

Znalazłem w wielu dostępnych kodzie sieci neuronowych zaimplementowanych przy użyciu TensorFlow, że terminy regularyzacji są ... Flow (np. wykorzystywany przez optymalizatorów podczas treningu)? A może oczekuje się, że sam będę korzystać z tej kolekcji?

Jaka jest intuicja korzystania z tanh w LSTM [closed]

zamknięte. to pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. ... intuicja za tym? to tylko nieliniowa transformacja? jeśli tak, mogę zmienić obie do innej funkcji aktywacyjnej (np. ReLU)?

Co robi tf.nn.osadzanie funkcji wyszukiwania zrobić?

tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None) Nie mogę zrozumieć obowiązku tej funkcji. Czy to j ... am jeśli użyjemy tf.nn.embedding_lookup(embeddings, train_inputs), to dla każdego train_input znajdzie odpowiednie osadzenie?

PyTorch-sąsiadujące()

Przeglądałem ten przykład modelu języka LSTM na GitHubie (link) . To, co robi w ogóle, jest dla mnie całkiem jasne. Ale nada ... tego czytelnego uniknąłem zamieszczania pełnego kodu tutaj, można go znaleźć za pomocą linku GitHub powyżej.) Z góry dzięki!

Najczęstsze przyczyny nans podczas treningu

Zauważyłem, że częstym zjawiskiem podczas treningu jest wprowadzenie NAN. Często wydaje się, że jest wprowadzany przez wagi ... jczęstszy powód nan do wystąpienia podczas treningu? a po drugie, jakie są niektóre metody walki z tym (i dlaczego działają)?

Jak interpretować "straty" i "dokładność" dla modelu uczenia maszynowego

Kiedy wytrenuję swoją sieć neuronową za pomocą Tensorflow, będą zgłaszać zmienną zwaną "stratą" na epokę. Jak interpretować ... enną? Wyższa strata jest lepsza lub gorsza, czyli co to oznacza dla końcowej wydajności (dokładności) mojej sieci neuronowej?

Najlepszy sposób na uratowanie trenowanego modelu w PyTorch?

Szukałem alternatywnych sposobów na uratowanie trenowanego modelu w PyTorch. Do tej pory znalazłem dwie alternatywy. Pocho ... rowane? Czy to tylko dlatego, że [[21]] Pochodnia.Moduły NN mają te dwie funkcje i jesteśmy zachęcani do korzystania z nich?

Spadek gradientu vs Adagrad vs moment pędu w TensorFlow

Studiuję TensorFlow i jak z niego korzystać, nawet jeśli nie jestem ekspertem od sieci neuronowych i głębokiego uczenia (tylk ... są następujące: 1. Kiedy lepiej jest używać jednego zamiast innych ? 2. Czy istnieją istotne różnice, które należy znać ?

Keras, jak uzyskać wydajność każdej warstwy?

Trenowałem binarny model klasyfikacji z CNN, a oto mój kod model = Sequential() model.add(Convolution2D(nb_filters, kernel_ ... validation_data=(x_test, y_test)) I tutaj, chcę uzyskać wyjście każdej warstwy tak jak TensorFlow, Jak mogę to zrobić?

Jak utworzyć niestandardową funkcję aktywacji tylko w Pythonie w Tensorflow?

Załóżmy, że musisz wykonać funkcję aktywacyjną, która nie jest możliwa przy użyciu tylko wstępnie zdefiniowanych bloków konst ... est to dość skomplikowane, trzeba napisać to w C++ i przekompilować cały tensorflow [1] [2]. Czy jest jakiś prostszy sposób?

Jak zastosować obcinanie gradientu w TensorFlow?

Biorąc pod uwagę przykładowy kod . Chciałbym wiedzieć, jak zastosować obcinanie gradientu w tej sieci na RNN, gdzie istniej ... _X to wejście, a nie grad, co ma być obcięte? Czy muszę zdefiniować własny Optymalizator do tego, czy jest prostszy opcja?