deep-learning

Jak wykorzystać opcję return sequences i TimeDistributed layer w Keras?

Mam korpus dialogowy jak poniżej. I chcę zaimplementować model LSTM, który przewiduje działanie systemu. Działanie systemu je ... TMs, czy model jest taki sam jak "my many-to-many(2)" poniżej? Myślę więc, że do każdego wyjścia nakładane są gęste warstwy.

Dlaczego wejście jest skalowane w tf.nn.rezygnacja w tensorflow?

Nie rozumiem, dlaczego dropout działa tak w tensorflow. Blog CS231n mówi, że "dropout is implemented by only keeping a neur ... ob? Dlaczego nie zachować elementu wejściowego tak, jak jest z prawdopodobieństwem, a nie skalować go za pomocą 1/keep_prob?

Korzystanie z Dropout w Pytorch: nn.Dropout vs. F. dropout

Za pomocą pyTorch są dwa sposoby na porzucenie torch.nn.Dropout i torch.nn.functional.Dropout. Trudno mi dostrzec różnicę między ich użyciem: Kiedy używać czego? Czy to coś zmienia? Nie widzę żadnej różnicy w wydajności, kiedy je zamieniłem.

Ocena modeli pytorcha: "z torch.no model grad 'vs'.eval ()"

Kiedy chcę ocenić wydajność mojego modelu na zestawie walidacji, czy preferowane jest użycie: with torch.no_grad: Lub model.eval()

Jak zastosować Drop Out w Tensorflow, aby poprawić dokładność sieci neuronowej?

Drop-Out to techniki regularyzacji. I chcę zastosować go do danych notMNIST, aby zmniejszyć nadmiar dopasowania, aby zakończy ... racy: 0.8775 Valid data accuracy: 0.8069 Jak mogę zastosować DropOut by TensorFlow aby poprawić dokładność sieci? Dziękuję!

Z jakiego powodu Convolution 1x1 jest stosowany w głębokich sieciach neuronowych?

Patrzę na architekturę Inceptionv3 (GoogLeNet) i nie mogę zrozumieć, po co nam warstwy conv1x1? Wiem jak działa splot, ale widzę zysk z rozmiarem patcha > 1.

Jak szybko wykonać TensorFlow + Keras za pomocą zestawu danych TFRecord?

Jaki jest przykład użycia TensorFlow TFRecord z Modelem Keras i tf.sesja.run() utrzymując zbiór danych w tensorach w / queue ... ds: tf_records.py próba uruchomienia modelu unet sesja tf Z TFRecords i model Keras jest w densenet_fcn.py (nie działa)

Funkcje ekstrakcji za pomocą wstępnie wytrenowanego (Tensorflow) CNN

[7]}Deep Learning został z powodzeniem zastosowany na kilku dużych zestawach danych do klasyfikacji garstki klas (koty, psy, ... co jest czym, ponieważ spodziewałbym się, że wyszkolona sieć neuronowa będzie deterministyczna (ale co najwyżej chaotyczna).

Monitorowanie procesu szkolenia/walidacji w Caffe

Trenuję model odniesienia Caffe do klasyfikacji obrazów. Moja praca wymaga od mnie monitorowania procesu treningowego poprzez ... u LMDB zamiast obrazów raw. Jednak nie mogę znaleźć dokumentacji / kodu o robieniu klasyfikacji w C++ za pomocą formatu LMDB.

Jak uzyskać wymiary tensora (w TensorFlow) w czasie budowy wykresu?

Próbuję operacji, która nie zachowuje się zgodnie z oczekiwaniami. graph = tf.Graph() with graph.as_default(): train_datas ... bed. Wiem, że można to zrobić w czasie pracy, ale to zbyt dużo pracy jak na tak prostą operację. Jaki jest łatwiejszy sposób?

jak rozpakować plik pkl

Mam plik pkl z zestawu danych MNIST, który składa się z odręcznych obrazów cyfr. Chciałbym rzucić okiem na każde z tych zdję ... więc muszę rozpakować plik pkl, tylko nie mogę się dowiedzieć jak. Czy jest sposób na rozpakowanie / rozpakowanie pliku pkl?

Rola "spłaszczenia" w Keras

Próbuję zrozumieć rolę Flatten funkcji w Kerasie. Poniżej znajduje się mój kod, który jest prostą dwuwarstwową siecią. Przyjm ... 4). Więc jeśli wyjście pierwszej warstwy jest już "płaskie" i kształtu (1, 16), dlaczego muszę dalej ją spłaszczać? Dzięki!

Co to jest meta parametr 'weight decay' w Caffe?

Patrząc na przykład 'solver.prototxt', posted on BVLC / caffe git, there is a training meta parameter weight_decay: 0.04 Co oznacza ten meta parametr? Jaką wartość powinienem mu przypisać?

Jak projektować Głębokie konwolucyjne sieci neuronowe?

Jak rozumiem, wszystkie CNN są dość podobne. Wszystkie mają warstwę konwolucyjną, a następnie warstwę pooling i Relu. Niektór ... i błędów, czy też istnieją pewne szczególne zasady, których nie znam? Jeśli czy mógłbym to wyjaśnić, byłbym bardzo wdzięczny.

Jak korzystać z modeli z keras.wnioski o przeniesienie nauki?

Chcę uzyskać wstępnie przygotowany model VGG16 w Keras, usunąć jego warstwę wyjściową, a następnie umieścić nową warstwę wyjś ... dal oczekuje starego kształtu. Jak miałbym to zrobić? Czy jest jakiś sposób aby przekonwertować ten typ modelu na Sequential?

Jak zwiększyć dokładność walidacji za pomocą deep neural net?

Próbuję zbudować klasyfikator obrazów klasy 11 z 13000 obrazami treningowymi i 3000 obrazami walidacyjnymi. Używam głębokiej ... ność walidacji mieści się w zakresie 54-57% i nie wzrasta. W czym może być problem? Czy powinienem zwiększyć liczbę obrazów?

Adam optimizer po 200 tys. partiach traci na treningach

Widziałem bardzo dziwne zachowanie podczas treningu sieci, gdzie po kilku 100k iteracji (8 do 10 godzin) nauki dobrze, wszyst ... ą tasowane ponownie jako dobrze-skutkuje tym samym zachowaniem. Trening zawsze wydaje się zachowywać w tym momencie podobnie.

TensorFlow-wprowadzenie zarówno regularyzacji L2, jak i opuszczania sieci. Czy to ma jakiś sens?

Obecnie gram z ANN, która jest częścią kursu Udactity DeepLearning. [1]}udało mi się zbudować i trenować Sieć i wprowadzić r ... valid_prediction.eval(), valid_labels)) print("Test accuracy: %.1f%%" % accuracy(test_prediction.eval(), test_labels))

Co to jest warstwa "Python" w caffe?

Caffe ma typ warstwy "Python". Na przykład, ten typ warstwy może być używany jako warstwa stratna . W innych przypadkach jest używany jako warstwa wejściowa . Co to jest ten typ warstwy? Jak można użyć tej warstwy?

Jak wdrożyć Głębokie dwukierunkowe LSTM z Keras?

[2]}próbuję zaimplementować rozpoznawanie mowy oparte na LSTM. Do tej pory mogłem skonfigurować dwukierunkowy LSTM (myślę, że ... in shape:', (100, 99, 13)) ('X_test shape:', (20, 99, 13)) ('y_train shape:', (100, 99, 11)) ('y_test shape:', (20, 99, 11))