Datamart vs. reporting Cube, jakie są różnice?

Terminy są używane wszędzie i nie znam ich definicji. Jestem prawie pewien, że wiem, co to jest data mart. I stworzyłem kostki raportowania z narzędziami takimi jak Business Objects i Cognos.

Ludzie mówili mi też, że datamart to coś więcej niż zbiór kostek.

Ludzie mi też mówili, że datamart to kostka raportująca, nic więcej.

Jakie są rozróżnienia, które rozumiesz?

Author: S.Lott, 2008-12-12

8 answers

Cube może (i prawdopodobnie powinien) oznaczać coś dość specyficznego - artefakty OLAP prezentowane za pośrednictwem serwera OLAP , takiego jak ms Analysis Services lub Oracle (nee Hyperion) Essbase . Jednak używa się go również znacznie luźniej. Kostki OLAP tego typu używają narzędzi zapytań opartych na kostkach, które używają innego API niż standardowa relacyjna baza danych. Zazwyczaj serwery OLAP utrzymują własne zoptymalizowane struktury danych (znane jako MOLAP), choć mogą być implementowane jako front-end do relacyjnego źródła danych (znanego jako ROLAP) lub w różnych trybach hybrydowych (znanych jako HOLAP)

Staram się być konkretny i używać' cube ' specjalnie w odniesieniu do kostek na serwerach OLAP, takich jak SSAS.

Business Objects działa poprzez odpytywanie danych za pośrednictwem jednego lub więcej źródeł (które mogą być relacyjnymi bazami danych, kostkami OLAP lub plikami płaskimi) i tworzenie struktury danych w pamięci zwanej Mikrokubą , której używa do wspieraj interaktywne działania typu "plaster i kostka". Usługi analityczne i MSQuery mogą tworzyć cube (.cub) plik , który może być otwarty przez oprogramowanie klienta AS lub Excel i pokrojony w plasterki w podobny sposób. IIRC mogą również otwierać się najnowsze wersje obiektów biznesowych .cub files.

Aby być pedantycznym, myślę, że obiekty biznesowe znajdują się w "półstrukturalnej przestrzeni raportowania" gdzieś pomiędzy prawdziwym systemem OLAP, takim jak ProClarity, a narzędziem do raportowania ad-hoc, takim jak Report Builder , Oracle Discoverer lub Brio . Round trips to the Query Panel make it as some clunky as a pure stream-of-thought OLAP tool but it does offer a level of interactivity that traditional reports don ' t. I see the sweet spot of Business Objects as sitting in two places: raportowanie ad-hoc przez pracowników niekoniecznie zaznajomionych z SQL i provding a schedule report delivered in a interactive format that allows some drill-down into the data.

'Data Mart' jest również dość luźno używany termin i może oznaczać dowolny nośnik dostępu do danych dla systemu hurtowni danych. Definicja może obejmować narzędzia raportowania i warstwy metadanych, tabele warstw raportowania lub inne elementy, takie jak kostki lub inne systemy analityczne.

Zazwyczaj myślę o data mart jako bazie danych, z której odbywa się raportowanie, szczególnie jeśli jest to łatwo definiowalny podsystem ogólnej architektury hurtowni danych. Jednak jest to całkiem rozsądne, aby myśleć o tym jako użytkownik stojący przed warstwą raportowania, szczególnie jeśli istnieją narzędzia do raportowania ad-hoc, takie jak obiekty biznesowe lub systemy OLAP, które pozwalają użytkownikom końcowym uzyskać bezpośredni dostęp do danych.

 27
Author: ConcernedOfTunbridgeWells,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2008-12-26 14:16:08

Termin "data mart" stał się nieco niejednoznaczny, ale jest tradycyjnie związany z subiektywnym podzbiorem systemów informatycznych organizacji. Data mart nie implikuje wyraźnie obecności technologii wielowymiarowych, takich jak OLAP i data mart nie implikuje wyraźnie obecności podsumowanych danych liczbowych.

Z drugiej strony kostka ma tendencję do sugerowania, że dane są prezentowane przy użyciu nomenklatury wielowymiarowej (zazwyczaj technologia OLAP) i że dane są ogólnie podsumowane jako przecięcia wielu hierarchii. (tj. wartość netto Twojej rodziny vs. Twoja osobista wartość netto i wszystko pomiędzy) Ogólnie rzecz biorąc, "cube" oznacza coś bardzo konkretnego, podczas gdy "data mart" wydaje się być trochę bardziej ogólne.

Przypuszczam, że w OOP speak można dokładnie powiedzieć, że data mart "ma - "kostkę", ma - "relacyjną bazę danych", ma- " sprytny interfejs raportowania itp.... ale mniej poprawne byłoby stwierdzenie, że każdy z tych indywidualnie" is-a " data mart. Termin data mart jest bardziej inkluzywny.

 8
Author: J.Biard,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-01-07 03:52:02

Jak sama nazwa wskazuje, sześcian jest uporządkowanym wielowymiarowym zbiorem danych (zwykle trzy wymiary reprezentujące trzy boki sześcianu). Data mart jest tylko kontenerem, a nie strukturą samą w sobie, chociaż zawiera zbiory danych uporządkowane płasko (jako tabele) w wymiarach i faktach.

Struktura sześcianu ułatwia wizualizację lub konceptualizację danych wzdłuż różnych wymiarów sześcianu. W ten sposób większość analityków biznesowych lub programistów łatwo odpytywać i wchodzić w interakcje z sześcianem.

Ponieważ data mart jest tylko kontenerem z mnóstwem tabel, użytkownicy muszą najpierw konceptualizować i rozumieć struktury wymiarowe przed zapytaniem i analizą danych.

 4
Author: connectHeavenAndEarth,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2012-11-20 22:26:04

Data mart tradycyjnie oznacza dane statyczne, Zwykle zorientowane na datę i godzinę, używane przez analityków do statystyk, budżetowania, raportowania wyników i sprzedaży oraz innych działań związanych z planowaniem.

Kostka jest bazą danych OLAP, która dość wyczerpująco przekształca dane OLTP w statyczny, zorientowany na datę/czas schemat, który używa języka zapytań, który nie jest SQL, ale zbudowany specjalnie do odpowiadania na pytania typu data mart. Używa terminów takich jak miary, wymiary, schemat Gwiazdy itp. zamiast tabel, kolumny i wiersze. Najlepiej znaną analogią mogą być tabele przestawne w arkuszu kalkulacyjnym.

 3
Author: dkretz,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-01-07 04:27:33

Data mart jest zbiorem danych określonego procesu biznesowego. Nie ma znaczenia, w jaki sposób dane są przechowywane. Kostka przechowuje dane w specjalny sposób, wielowymiarowy, w przeciwieństwie do tabeli z wierszem i kolumną. Sześcian w bazie danych olap jest jak Tabela do tradycyjnej bazy danych. Data mart może mieć tabele lub kostki. Kostki sprawiają, że analiza jest szybsza, ponieważ wstępnie oblicza agregacje z wyprzedzeniem.

 3
Author: Mathew nguyen,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2011-09-30 07:37:22

Zapamiętaj:

Hurtownia danych to proces pobierania danych ze starszych i transakcyjnych systemów baz danych i przekształcania ich w zorganizowane informacje w przyjaznym dla użytkownika formacie, aby zachęcić do analizy danych i wspierać podejmowanie decyzji biznesowych opartych na faktach.

A Hurtownia danych jest systemem, który wyodrębnia, czyści, dostosowuje i dostarcza danych źródłowych do wymiarowego magazynu danych, a następnie wspiera i wdraża zapytania i analizy w celu podejmowanie decyzji.

KIMBALL na przykład konsekwentnie zdefiniował data mart jako zorientowany na proces podzbiór ogólnych danych organizacji opartych na fundamencie danych atomowych, a to zależy tylko od fizyki zdarzeń pomiaru danych, a nie od przewidywanych pytań użytkownika.

  • Data marts są oparte na źródle danych, a nie na widoku danych Departamentu.
  • Data marts zawierają wszystkie atomowe detale potrzebne do wsparcia wiercenia w dół do najniższych poziom.
  • Data marts mogą być sterowane centralnie lub zdecentralizowane.

POPRAWNA DEFINICJA

  • oparte na procesie
  • Atomic Data Foundation
  • Pomiar Danych

BŁĘDNA DEFINICJA

  • Dział Oparty
  • Tylko Dane Zbiorcze
  • Pytanie Użytkownika Na Podstawie
 3
Author: Ageu,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2014-01-03 00:43:33

Dla mnie datamart to po prostu miejsce, gdzie dane są wrzucane w stosunkowo płaskim, bezużytecznym formacie.

Cube bierze te dane i sprawia, że tańczą.

 1
Author: Brian Knoblauch,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2008-12-11 21:07:43

Zgadzam się z Mateuszem. Zwykle używamy terminu "Data Mart" dla każdego źródła danych, które przechowuje ogólne Dane i mapowania używane w różnych aplikacjach w przedsiębiorstwie. Nie przechowujemy mierzalnych danych w data mart, więc widzę data mart jako jedno z wielu źródeł danych dla sześcianu. Tak jednak robimy . Jestem pewien, że nic nie stoi na przeszkodzie, aby przechowywać mierzalne dane w data mart.

 1
Author: wnSarah-Marie Nothling,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2012-05-03 12:26:35