Mentionsy

KajoData - Analiza danych dla każdego
KajoData - Analiza danych dla każdego
19.10.2025 17:00

Data Engineer vs AI | Big Data - granice bezpieczeństwa, prywatności i kontroli | Marek Czuma

KajoData:

🟨 Społeczność analityków KajoDataSpace

🟦 Kursy - Excel, Power Query, SQL, PowerBI, Python, Tableau

Marek Czuma

🟩 Akademia Big Data

🟫 Big Data Po Polsku


W tym odcinku spotkałem się z Markiem Czumą – inżynierem danych, twórcą Akademii Big Data i podcastu „Big Data po polsku”. To rozmowa o świecie ogromnych zbiorów danych, technologii rozproszonych i granicach tego, co możemy dziś przetworzyć. Zaczynamy od pytania, czy danych nie jest po prostu za dużo – i czy w tej „danej ropie XXI wieku” nie zaczynamy się powoli topić. Marek tłumaczy, jak naprawdę wygląda branża Big Data, na czym polega przetwarzanie rozproszone i dlaczego dodanie „kolejnych serwerów” nie zawsze rozwiązuje problem.


Rozmawiamy też o różnicach między analitykiem danych a inżynierem danych – gdzie kończy się Excel, a zaczyna Apache Spark. Marek pokazuje, że Big Data to nie tylko programowanie, ale sposób myślenia – inżynierski, systemowy, zrozumiały dopiero wtedy, gdy wiesz, co dzieje się „pod spodem”.


Zastanawiamy się też, jak wygląda ścieżka rozwoju od analityka do inżyniera danych i które umiejętności są tu naprawdę kluczowe.


W drugiej części schodzimy na meta-poziom – rozmawiamy o przyszłości zawodów IT w erze sztucznej inteligencji, o tym, co AI może zmienić (a czego raczej nie ruszy), i które systemy robią na Marku największe wrażenie – od Google Maps po infrastrukturę NSA. To szczera, inspirująca rozmowa o tym, jak wygląda świat danych od środka – technicznie, organizacyjnie i... filozoficznie.

Szukaj w treści odcinka

Znaleziono 9 wyników dla "Google"

Moja odpowiedź, a właściwie odpowiedź inżynierów Google'a, którzy mieli te same pewnie rozmowy, to czyli co my teraz, tylko w realu i 25-26 lat temu mniej więcej, jest taka, że żeby, bo twoje rozwiązanie jest dobre, dołożyć nowy komputer.

Bo podstawowe, takie on-premise'owe, open-source'owe technologie, przede wszystkim Apache Hadoop, który był, można powiedzieć, ekwiwalentem tego, co wymyślili w Google,

Google wymyśli kilka technologii, które pozwalały przechowywać dane w trybie rozproszonym i przetwarzać dane w trybie rozproszonym.

I te same odpowiedniki tych dokładnie technologii wymyślono potem w fundacji Apache, odwzorowując architektonicznie to, co było w Google i udostępniając na cały świat.

Microsoft Azure jest jedną z trzech największych chmurowni, dostawców chmur obok AWS'a i Google'a.

Najmniej kontrowersyjne to są mapy Google.

Mówiąc mapy, Google mam też na myśli, bo mapy to jest aplikacja, tak jak mamy w komórce, jedziemy nad morze, sobie włączamy, ale to jest też dużo innych rzeczy, które są powiązanych wokół takich jak Street View i tego typu rzeczy, gdzie po prostu jak sobie wejdziesz, tam może...

Google Maps, ja zgłębiałem kiedyś ten temat w ramach podcastu i ja chyba do tego wrócę, bardzo bym chciał, bo to mnie naprawdę fascynuje.

Google Maps i wszystkie te rzeczy wokół, no, to jest niesamowite.