Usługa Big Data Cloud Dataflow firmy Google ułatwia analizowanie dużych ilości danych. Usługa skierowana jest również do małych i średnich firm.

Pod koniec czerwca 2014 r. firma Google po raz pierwszy zaprezentowała swoją nową usługę zarządzaną Google Cloud Dataflow na konferencji deweloperów Google I/O. Usługa skierowana jest do firm każdej wielkości, które analizują duże ilości danych, zwłaszcza tych generowanych online i nie chcą martwić się o wykorzystywaną infrastrukturę. Głównym celem Cloud Dataflow jest ułatwienie wykonywania tych zadań:

Integracja danych z różnych źródeł i ich przygotowanie do dalszych analiz Analiza strumieni danych w czasie rzeczywistym w celu identyfikacji podejrzanych wzorców lub działań np. Wieloetapowe obliczenia do dogłębnej analizy

Prawie wszystkie firmy oceniają dane: Dziewięć na dziesięć firm ocenia dane podstawowe, transakcyjne i inne za pomocą IT. Cloud Dataflow jest odpowiedni na przykład dla działu marketingu, który chce oceniać strumienie na Twitterze lub Facebooku, dla sklepu internetowego lub banku, który chce wykrywać oszustwa lub ataki phishingowe na podstawie cech behawioralnych, lub dla menedżerów IT, którzy chcą korzystać z Want aby odfiltrować wzorce w plikach dziennika centrum danych. Dzięki usługom w chmurze, takim jak Google Cloud Dataflow, obliczenia te są również przystępne dla mniejszych firm.

Prawie wszystkie firmy oceniają dane: Dziewięć na dziesięć firm ocenia dane podstawowe, transakcyjne i inne za pomocą IT.

Dataflow może tworzyć, przetwarzać, przekształcać i analizować równoległe potoki danych zarówno w trybie wsadowym, jak i strumieniowym. Kod programu i zasoby powinny być automatycznie optymalizowane, udostępniane i zarządzane. Faktyczna kalkulacja odbywa się transparentnie w tle. Dataflow automatycznie pobiera zasoby i rozdziela zadania, aby analiza mogła przebiegać optymalnie.

Ponieważ usługa jest obecnie nadal w fazie beta, nie ma precyzyjnych oświadczeń dotyczących wydajności ani nawet sformułowanych umów dotyczących poziomu usług (SLA). Na konferencji deweloperów mówiono jednak o „kilkusekundowym” opóźnieniu w przypadku żądań przesyłania strumieniowego. Nawet jeśli wszystkie procesy przebiegają automatycznie, użytkownik ma możliwość łączenia się z serwerami lub maszynami wirtualnymi przez SSH (Secure Shell) i podglądu procesów obliczeniowych.

„Cloud Dataflow ułatwia użytkownikom wyodrębnianie z ich danych informacji o krytycznym znaczeniu dla firmy, przy niższych kosztach operacyjnych i bez kłopotów z budowaniem, zarządzaniem i skalowaniem własnej infrastruktury” — pisze Greg DeMichillie z zespołu Google Platform na blogu programistów. . Google nie opublikowało jeszcze cen Cloud Dataflow.