deep-learning

Zrozumienie Keras LSTMs

Staram się pogodzić moje zrozumienie LSTMs i wskazał tutaj w ten post przez Christopher Olah zaimplementowane w Keras. Jest ... eareBot Update2: Mam podsumowałem większość mojego zrozumienia LSTMs tutaj: https://www.youtube.com/watch?v=ywinX5wgdEU

Architektura perceptron wielowarstwowy (MLP): kryteria wyboru liczby ukrytych warstw i ich wielkości? [zamknięte]

zamknięte . To pytanie jest oparte na opinii . Obecnie nie przyjmuje odpowiedzi. ... twie wyjściowej.Ale jakie są kryteria wyboru liczba ukrytych warstw w MLP i ile węzłów neuronowych w jednej ukrytej warstwie?

machine-learning neural-network deep-learning perceptron

Wiele do jednego i wiele do wielu przykładów LSTM w Keras

Staram się zrozumieć LSTM i jak je budować z Keras. Okazało się, że są głównie 4 tryby do uruchomienia RNN (4 właściwe Na zdj ... l.add(LSTM(128, input_shape=(timesteps, data_dim))) model.add(Dense(1)) Dla każdego z 4 zadań, może z odrobiną wyjaśnienia.

machine-learning neural-network deep-learning keras recurrent-neural-network

Jaka jest różnica między "tym samym" a "prawidłowym" wypełnieniem w tf.nn.maksymalna Pula tensorflow?

Jaka jest różnica między "tym samym" i "prawidłowym" wypełnieniem w tf.nn.max_pool z tensorflow? Moim zdaniem, "poprawne" oz ... adding w operatorze puli, tzn. wystarczy użyć 'VALID' z tensorflow. Ale co to jest "ta sama" wyściółka max pool w tensorflow?

python tensorflow deep-learning

Jak zainicjować wagi w PyTorch?

Jak zainicjować wagi i błędy (na przykład inicjalizacja He lub Xavier) w sieci w PyTorch?

python neural-network deep-learning pytorch

Używanie wstępnie przeszkolonego osadzania słów (word2vec lub Glove) w TensorFlow

Ostatnio przejrzałem ciekawą implementację klasyfikacji tekstów. Jednak cały kod TensorFlow, który przeglądałem, używa losow ... bedded_chars, -1) Czy ktoś wie jak korzystać z wyników word2vec lub wstępnie wytrenowanego osadzania słów zamiast losowego?

python numpy tensorflow deep-learning

Dlaczego w sieci neuronowej backpropagation musi być używana nieliniowa funkcja aktywacji?

Czytałem kilka rzeczy na temat sieci neuronowych i Rozumiem ogólną zasadę jednowarstwowej sieci neuronowej. Rozumiem potrzebę ... nieliniowe funkcje aktywacji? Po tym pytaniu następuje to: Jaka jest pochodna funkcji aktywacyjnej używanej w odwrotności?

math machine-learning neural-network deep-learning

Keras input explanation: kształt wejściowy, jednostki, wielkość partii, dim, itp

Dla dowolnej warstwy Keras (Layer Klasa), czy ktoś może wyjaśnić jak rozumieć różnicę między input_shape, units, dim, itd.? ... a jednostek? W skrócie jak można zrozumieć / zwizualizować atrybuty modelu - w szczególności warstwy-z poniższym obrazem?

neural-network deep-learning keras keras-layer tensor

Oszacowanie liczby neuronów i liczby warstw sztucznej sieci neuronowej [zamkniętej]

Szukam metody, jak obliczyć liczbę warstw i liczbę neuronów na warstwę. Jako wejście mam tylko rozmiar wektora wejściowego, r ... est określana przez wypróbowanie różnych topologii sieci i wybranie tej z najmniejszym błędem. Niestety nie mogę tego zrobić.

artificial-intelligence machine-learning neural-network deep-learning

Jak dodać regularyzacje w TensorFlow?

Znalazłem w wielu dostępnych kodzie sieci neuronowych zaimplementowanych przy użyciu TensorFlow, że terminy regularyzacji są ... Flow (np. wykorzystywany przez optymalizatorów podczas treningu)? A może oczekuje się, że sam będę korzystać z tej kolekcji?

python neural-network tensorflow deep-learning

Jaka jest intuicja korzystania z tanh w LSTM [closed]

zamknięte. to pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. ... intuicja za tym? to tylko nieliniowa transformacja? jeśli tak, mogę zmienić obie do innej funkcji aktywacyjnej (np. ReLU)?

machine-learning deep-learning lstm recurrent-neural-network activation-function

Co robi tf.nn.osadzanie funkcji wyszukiwania zrobić?

tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None) Nie mogę zrozumieć obowiązku tej funkcji. Czy to j ... am jeśli użyjemy tf.nn.embedding_lookup(embeddings, train_inputs), to dla każdego train_input znajdzie odpowiednie osadzenie?

python tensorflow deep-learning word-embedding natural-language-processing

PyTorch-sąsiadujące()

Przeglądałem ten przykład modelu języka LSTM na GitHubie (link) . To, co robi w ogóle, jest dla mnie całkiem jasne. Ale nada ... tego czytelnego uniknąłem zamieszczania pełnego kodu tutaj, można go znaleźć za pomocą linku GitHub powyżej.) Z góry dzięki!

neural-network deep-learning lstm pytorch contiguous

Najczęstsze przyczyny nans podczas treningu

Zauważyłem, że częstym zjawiskiem podczas treningu jest wprowadzenie NAN. Często wydaje się, że jest wprowadzany przez wagi ... jczęstszy powód nan do wystąpienia podczas treningu? a po drugie, jakie są niektóre metody walki z tym (i dlaczego działają)?

machine-learning neural-network deep-learning gradient-descent caffe

Jak interpretować "straty" i "dokładność" dla modelu uczenia maszynowego

Kiedy wytrenuję swoją sieć neuronową za pomocą Tensorflow, będą zgłaszać zmienną zwaną "stratą" na epokę. Jak interpretować ... enną? Wyższa strata jest lepsza lub gorsza, czyli co to oznacza dla końcowej wydajności (dokładności) mojej sieci neuronowej?

machine-learning neural-network mathematical-optimization deep-learning objective-function

Najlepszy sposób na uratowanie trenowanego modelu w PyTorch?

Szukałem alternatywnych sposobów na uratowanie trenowanego modelu w PyTorch. Do tej pory znalazłem dwie alternatywy. Pocho ... rowane? Czy to tylko dlatego, że [[21]] Pochodnia.Moduły NN mają te dwie funkcje i jesteśmy zachęcani do korzystania z nich?

python serialization deep-learning pytorch tensor

Spadek gradientu vs Adagrad vs moment pędu w TensorFlow

Studiuję TensorFlow i jak z niego korzystać, nawet jeśli nie jestem ekspertem od sieci neuronowych i głębokiego uczenia (tylk ... są następujące: 1. Kiedy lepiej jest używać jednego zamiast innych ? 2. Czy istnieją istotne różnice, które należy znać ?

tensorflow deep-learning

Keras, jak uzyskać wydajność każdej warstwy?

Trenowałem binarny model klasyfikacji z CNN, a oto mój kod model = Sequential() model.add(Convolution2D(nb_filters, kernel_ ... validation_data=(x_test, y_test)) I tutaj, chcę uzyskać wyjście każdej warstwy tak jak TensorFlow, Jak mogę to zrobić?

python tensorflow deep-learning keras

Jak utworzyć niestandardową funkcję aktywacji tylko w Pythonie w Tensorflow?

Załóżmy, że musisz wykonać funkcję aktywacyjną, która nie jest możliwa przy użyciu tylko wstępnie zdefiniowanych bloków konst ... est to dość skomplikowane, trzeba napisać to w C++ i przekompilować cały tensorflow [1] [2]. Czy jest jakiś prostszy sposób?

python neural-network tensorflow deep-learning activation-function

Jak zastosować obcinanie gradientu w TensorFlow?

Biorąc pod uwagę przykładowy kod . Chciałbym wiedzieć, jak zastosować obcinanie gradientu w tej sieci na RNN, gdzie istniej ... _X to wejście, a nie grad, co ma być obcięte? Czy muszę zdefiniować własny Optymalizator do tego, czy jest prostszy opcja?

python machine-learning tensorflow deep-learning lstm