deep-learning pg. 3

Jak wykorzystać opcję return sequences i TimeDistributed layer w Keras?

Mam korpus dialogowy jak poniżej. I chcę zaimplementować model LSTM, który przewiduje działanie systemu. Działanie systemu je ... TMs, czy model jest taki sam jak "my many-to-many(2)" poniżej? Myślę więc, że do każdego wyjścia nakładane są gęste warstwy.

Dlaczego wejście jest skalowane w tf.nn.rezygnacja w tensorflow?

Nie rozumiem, dlaczego dropout działa tak w tensorflow. Blog CS231n mówi, że "dropout is implemented by only keeping a neur ... ob? Dlaczego nie zachować elementu wejściowego tak, jak jest z prawdopodobieństwem, a nie skalować go za pomocą 1/keep_prob?

machine-learning neural-network tensorflow deep-learning

Korzystanie z Dropout w Pytorch: nn.Dropout vs. F. dropout

Za pomocą pyTorch są dwa sposoby na porzucenie torch.nn.Dropout i torch.nn.functional.Dropout. Trudno mi dostrzec różnicę między ich użyciem: Kiedy używać czego? Czy to coś zmienia? Nie widzę żadnej różnicy w wydajności, kiedy je zamieniłem.

neural-network deep-learning pytorch dropout

Ocena modeli pytorcha: "z torch.no model grad 'vs'.eval ()"

Kiedy chcę ocenić wydajność mojego modelu na zestawie walidacji, czy preferowane jest użycie: with torch.no_grad: Lub model.eval()

machine-learning deep-learning pytorch autograd

Jak zastosować Drop Out w Tensorflow, aby poprawić dokładność sieci neuronowej?

Drop-Out to techniki regularyzacji. I chcę zastosować go do danych notMNIST, aby zmniejszyć nadmiar dopasowania, aby zakończy ... racy: 0.8775 Valid data accuracy: 0.8069 Jak mogę zastosować DropOut by TensorFlow aby poprawić dokładność sieci? Dziękuję!

neural-network tensorflow deep-learning

Z jakiego powodu Convolution 1x1 jest stosowany w głębokich sieciach neuronowych?

Patrzę na architekturę Inceptionv3 (GoogLeNet) i nie mogę zrozumieć, po co nam warstwy conv1x1? Wiem jak działa splot, ale widzę zysk z rozmiarem patcha > 1.

neural-network tensorflow deep-learning convolution conv-neural-network

Jak szybko wykonać TensorFlow + Keras za pomocą zestawu danych TFRecord?

Jaki jest przykład użycia TensorFlow TFRecord z Modelem Keras i tf.sesja.run() utrzymując zbiór danych w tensorach w / queue ... ds: tf_records.py próba uruchomienia modelu unet sesja tf Z TFRecords i model Keras jest w densenet_fcn.py (nie działa)

machine-learning tensorflow deep-learning keras keras-layer

Funkcje ekstrakcji za pomocą wstępnie wytrenowanego (Tensorflow) CNN

[7]}Deep Learning został z powodzeniem zastosowany na kilku dużych zestawach danych do klasyfikacji garstki klas (koty, psy, ... co jest czym, ponieważ spodziewałbym się, że wyszkolona sieć neuronowa będzie deterministyczna (ale co najwyżej chaotyczna).

machine-learning computer-vision tensorflow deep-learning

Monitorowanie procesu szkolenia/walidacji w Caffe

Trenuję model odniesienia Caffe do klasyfikacji obrazów. Moja praca wymaga od mnie monitorowania procesu treningowego poprzez ... u LMDB zamiast obrazów raw. Jednak nie mogę znaleźć dokumentacji / kodu o robieniu klasyfikacji w C++ za pomocą formatu LMDB.

c++classification deep-learning conv-neural-network caffe

Jak uzyskać wymiary tensora (w TensorFlow) w czasie budowy wykresu?

Próbuję operacji, która nie zachowuje się zgodnie z oczekiwaniami. graph = tf.Graph() with graph.as_default(): train_datas ... bed. Wiem, że można to zrobić w czasie pracy, ale to zbyt dużo pracy jak na tak prostą operację. Jaki jest łatwiejszy sposób?

python tensorflow deep-learning tensor

jak rozpakować plik pkl

Mam plik pkl z zestawu danych MNIST, który składa się z odręcznych obrazów cyfr. Chciałbym rzucić okiem na każde z tych zdję ... więc muszę rozpakować plik pkl, tylko nie mogę się dowiedzieć jak. Czy jest sposób na rozpakowanie / rozpakowanie pliku pkl?

python deep-learning pickle mnist

Rola "spłaszczenia" w Keras

Próbuję zrozumieć rolę Flatten funkcji w Kerasie. Poniżej znajduje się mój kod, który jest prostą dwuwarstwową siecią. Przyjm ... 4). Więc jeśli wyjście pierwszej warstwy jest już "płaskie" i kształtu (1, 16), dlaczego muszę dalej ją spłaszczać? Dzięki!

machine-learning neural-network tensorflow deep-learning keras

Co to jest meta parametr 'weight decay' w Caffe?

Patrząc na przykład 'solver.prototxt', posted on BVLC / caffe git, there is a training meta parameter weight_decay: 0.04 Co oznacza ten meta parametr? Jaką wartość powinienem mu przypisać?

machine-learning neural-network deep-learning gradient-descent caffe

Jak projektować Głębokie konwolucyjne sieci neuronowe?

Jak rozumiem, wszystkie CNN są dość podobne. Wszystkie mają warstwę konwolucyjną, a następnie warstwę pooling i Relu. Niektór ... i błędów, czy też istnieją pewne szczególne zasady, których nie znam? Jeśli czy mógłbym to wyjaśnić, byłbym bardzo wdzięczny.

neural-network deep-learning convolution conv-neural-network caffe

Jak korzystać z modeli z keras.wnioski o przeniesienie nauki?

Chcę uzyskać wstępnie przygotowany model VGG16 w Keras, usunąć jego warstwę wyjściową, a następnie umieścić nową warstwę wyjś ... dal oczekuje starego kształtu. Jak miałbym to zrobić? Czy jest jakiś sposób aby przekonwertować ten typ modelu na Sequential?

python deep-learning keras

Jak zwiększyć dokładność walidacji za pomocą deep neural net?

Próbuję zbudować klasyfikator obrazów klasy 11 z 13000 obrazami treningowymi i 3000 obrazami walidacyjnymi. Używam głębokiej ... ność walidacji mieści się w zakresie 54-57% i nie wzrasta. W czym może być problem? Czy powinienem zwiększyć liczbę obrazów?

deep-learning caffe mxnet

Adam optimizer po 200 tys. partiach traci na treningach

Widziałem bardzo dziwne zachowanie podczas treningu sieci, gdzie po kilku 100k iteracji (8 do 10 godzin) nauki dobrze, wszyst ... ą tasowane ponownie jako dobrze-skutkuje tym samym zachowaniem. Trening zawsze wydaje się zachowywać w tym momencie podobnie.

neural-network tensorflow deep-learning conv-neural-network

TensorFlow-wprowadzenie zarówno regularyzacji L2, jak i opuszczania sieci. Czy to ma jakiś sens?

Obecnie gram z ANN, która jest częścią kursu Udactity DeepLearning. [1]}udało mi się zbudować i trenować Sieć i wprowadzić r ... valid_prediction.eval(), valid_labels)) print("Test accuracy: %.1f%%" % accuracy(test_prediction.eval(), test_labels))

machine-learning neural-network tensorflow deep-learning regularized

Co to jest warstwa "Python" w caffe?

Caffe ma typ warstwy "Python". Na przykład, ten typ warstwy może być używany jako warstwa stratna . W innych przypadkach jest używany jako warstwa wejściowa . Co to jest ten typ warstwy? Jak można użyć tej warstwy?

python machine-learning neural-network deep-learning caffe

Jak wdrożyć Głębokie dwukierunkowe LSTM z Keras?

[2]}próbuję zaimplementować rozpoznawanie mowy oparte na LSTM. Do tej pory mogłem skonfigurować dwukierunkowy LSTM (myślę, że ... in shape:', (100, 99, 13)) ('X_test shape:', (20, 99, 13)) ('y_train shape:', (100, 99, 11)) ('y_test shape:', (20, 99, 11))

deep-learning keras lstm