EMC rozpoczęło dystrybucję Hadoop pod nazwą Pivotal HD i tym samym konkuruje z Cloudera, która wraz z wieloma partnerami jest czasami określana jako „Red Hat for Big Data”. Jako dystrybutor EMC chce przede wszystkim skrócić czas odpowiedzi na zapytania. Oprogramowanie i urządzenia z serii Greenplum mają na celu przyciągnięcie dodatkowych klientów.

Pivotal HD będzie dostępny zarówno jako oprogramowanie, jak i urządzenie. EMC obiecuje integrację Apache Hadoop z bazą danych Greenplum przetwarzania równoległego, a także wsparcie dla tradycyjnych narzędzi Business Intelligence. Eksplorację danych można przeprowadzić za pomocą SQL i nadal korzystać z systemu plików Hadoop. Usługi baz danych dla Hadoop są również planowane w ramach Project Hawk. A zarządzanie klastrem powinno pomóc w tworzeniu i zarządzaniu zadaniami.

Według EMC, Pivotal HD jest bardziej wydajny niż jakakolwiek inna dystrybucja Hadoop, ponieważ wykorzystuje technologię dynamicznego potokowania EMC. Czasy odpowiedzi można poprawić o współczynnik od 10 do 600 w porównaniu z czystymi interfejsami SQL dla Hadoop. Częścią pakietu są również rozszerzenia wirtualizacji Hadoop firmy VMware — nic dziwnego, ponieważ VMware jest częścią EMC.

Josh Klahr, wiceprezes serii EMC Greenplum, jasno określił konkurencję: „Chcemy konkurować z Cloudera. Nasz beta test może już uniemożliwić podjęcie decyzji o zakupie Cloudery. Każdy z naszych klientów wykazuje coraz większe zainteresowanie Hadoop. Oczywiście waha się to od eksperymentów po wdrożenie w produkcji na szeroką skalę.” Oprócz Hadoop, kod od 100 programistów EMC pracujących nad projektem jest również w Pivotal HD.

Jednak rywale już teraz tłoczą się na rynku dystrybucji Hadoop. Cloudera, IBM i Hortonworks są uważane za liderów. Ale na przykład Microsoft stworzył również swój własny wariant Hadoop.

[z materiałem Larry'ego Dignana, ZDNet.com]

Wskazówka: Jak dobrze znasz firmy high-tech, które są notowane na giełdzie? Sprawdź swoją wiedzę - za pomocą 15 pytań na stronie silicon.de.