Analiza w czasie rzeczywistym dzięki przetwarzaniu strumienia danych-StacjaUczeniaSięDanych

Coraz ważniejsza dla sukcesu firmy staje się natychmiastowa ocena danych. Oznacza to, że decyzje mogą być podejmowane lokalnie i tak szybko, jak to możliwe.

Źródło: Seagate/IDC Dzisiaj prawie nic nie działa bez analizy danych: Każda firma, która chce odnieść trwały sukces w szybko zmieniającej się i przyspieszającej gospodarce, musi ocenić swoje dane i wykorzystać je z zyskiem. Ale eksplodujące ilości danych stają się również poważnym problemem dla coraz większej liczby firm. Według prognozy producenta pamięci masowej Seagate i analityków z IDC, globalna ilość danych osiągnie w 2025 roku ogromne 163 zetabajty. Aby zilustrować: Odpowiada to ruchowi danych, który powstałby, gdyby cała biblioteka wideo Netflix została obejrzana 489 milionów razy.

Za tę eksplozję odpowiadają przede wszystkim same firmy: podczas gdy w 2015 roku około 30 procent globalnej ilości danych było generowanych przez firmy, to w 2025 roku powinno to być 60 procent. Firmy mają do czynienia z coraz większą ilością danych, które wymagają oceny i na które należy odpowiedzieć. I właśnie ze względu na samą objętość, w nadchodzących latach będzie coraz trudniej zapisywać i przetwarzać wszystkie dane.

W zakresie analizy danych firmy stoją przed zupełnie nowymi zadaniami. „Głównym wyzwaniem jest określenie, które strumienie danych będą w ogóle przetwarzane”, mówi Björn Bartheidel, dyrektor ds. Internetu rzeczy i produkcji w firmie Freudenberg IT, dostawcy usług IT. Shawn Rogers, starszy dyrektor ds. strategii analitycznej w firmie Tibco, dostawcy oprogramowania analitycznego, również potwierdza trudności w tym zakresie. Ważne jest, aby wszystkie firmy decydowały, w którym momencie dane powinny być analizowane - „potrzebują elastyczności, aby przeprowadzać analizy w źródle danych i móc łączyć dane z innymi źródłami w celu zwiększenia wartości dodanej wyników ”.

Shawn Rogers Starszy Dyrektor ds. Strategii Analitycznej w Tibco Software www.tibco.com/de Zdjęcie: Tibco Software „Decyzje są oparte na czasie i wartości: im szybciej są podejmowane, tym większa wartość dla firmy”.

Tak zwane przetwarzanie strumienia danych lub strumieniowanie danych staje się zatem coraz ważniejsze w świecie big data. Zamiast przechowywać dane w bazie danych, jak ma to miejsce w przypadku konwencjonalnej procedury, i odpytywać i analizować je tylko wtedy, gdy jest to konieczne, przy przetwarzaniu strumienia danych dane są przetwarzane i analizowane w czasie rzeczywistym w miarę ich występowania.

Wybitnym przykładem jest chińska platforma e-commerce Alibaba. Jego sprzedaż wyniosła 30,8 miliarda dolarów w ciągu 24 godzin ostatniego dnia singli. Singles 'Day to coroczne wydarzenie w listopadzie, a także najlepiej sprzedający się dzień zakupów online w roku. Aby infrastruktura IT poradziła sobie z takim zakupowym szaleństwem, niezbędne jest natychmiastowe przetwarzanie i analiza dużej ilości danych. Na przykład wyszukiwanie i rekomendacje produktów na stronach sklepu były dostosowywane do działań kupujących w czasie rzeczywistym. Korzystając z platformy przetwarzania strumieniowego, Alibaba był w stanie obliczyć wszystkie dane w ciągu milisekund od ich wygenerowania.

Trend w kierunku przetwarzania w czasie rzeczywistym potwierdzają wskaźniki wzrostu: według firmy zajmującej się badaniem rynku Markets and Markets oczekuje się, że globalny rynek analiz strumieniowych wzrośnie z około 3,1 miliarda dolarów w 2016 roku do ogromnej 13,7 miliarda dolarów w 2021 roku.

Björn Bartheidel z Freudenberg IT zna ze swojej codziennej praktyki presję firm na jak najszybsze przetwarzanie danych: „Szybkość jest kluczem”, mówi Bartheidel. Analizy powinny być zasadniczo dostępne bezpośrednio – opóźnienia czasowe mogą szybko stać się prawdziwym problemem w tym obszarze. „Obecnie nie jest to już kwestia dni czy godzin, ale znacznie mniejszych okien czasowych. Przetwarzanie strumieni pomaga tutaj, ponieważ dane przetwarzane są bezpośrednio – w systemie.”

Jednak przetwarzanie danych w czasie rzeczywistym w strumieniowym przesyłaniu danych nie oznacza, że wszystkie dane muszą być zawsze przetwarzane natychmiast i bez opóźnień. Podczas gdy na przykład w samojezdnym samochodzie czas reakcji wynoszący zaledwie kilka milisekund może być tolerowany, może minąć kilka sekund podczas oceny czujnika, który mierzy na przykład poziom oleju w maszynie. Przetwarzanie strumieni danych tak naprawdę nie musi odbywać się w czasie rzeczywistym, w zależności od celu, ale raczej z wystarczającą szybkością.