Mentionsy

KajoData - Analiza danych dla każdego
KajoData - Analiza danych dla każdego
18.08.2025 15:30

Czy Data Engineer boi się AI? | ETL & Data Pipelines | Gość: Darek Butkiewicz [ "Nieinformatyk⁩" ]

🟦 Darka znajdziesz na: https://nieinformatyk.pl/

🟨 KajoData znajdziesz na: https://kajodata.com/


W tym odcinku zaprosiłem do rozmowy Darka Butkiewicza, znanego szerzej jako Nieinformatyk – twórcę popularnych kursów o bazach danych i doświadczonego inżyniera danych. Rozmawiamy o jego ścieżce do zawodu, która nie była wcale oczywista – od pracy w call center, przez fascynację rozwojem osobistym, aż po specjalizację w Oracle i obecnie pracę w środowisku chmurowym. To świetna historia dla tych, którzy myślą o przebranżowieniu lub dopiero wchodzą do świata IT.


Z Darkiem rozkładamy też na czynniki pierwsze codzienność data inżyniera – od budowania pipeline’ów, przez procesy ETL/ELT, aż po pracę z hurtowniami danych i współpracę z analitykami. Rozmawiamy też o tym, dlaczego SQL mimo upływu lat ciągle trzyma się mocno, a także jak wygląda praktyczne korzystanie z narzędzi AI w pracy inżyniera danych.


To odcinek, w którym łączymy perspektywę techniczną, karierową i trochę filozoficzną. Jeśli chcesz dowiedzieć się, jak wygląda nowoczesna praca z danymi „od kuchni” i co sprawia, że ta ścieżka może być naprawdę satysfakcjonująca – koniecznie posłuchaj tej rozmowy.

Szukaj w treści odcinka

Znaleziono 11 wyników dla "Cloud"

To są momenty, że się zastanawiam, a czy ja nie mogłem wcześniej tutaj wskoczyć w ten świat clouda.

Bo to, że Ty nie mówiłeś w tym momencie, nie wiem, o Google Cloudzie, to ja miałem przekonanie, że Ty masz o wszystkim taką wiedzę jak o Oracle'u, nie?

Ja teraz rzucam trochę pojęciami, ale jest klasyczne podejście, kiedy te dane ładujemy już prosto do hurtowni danych, albo takie bardziej nowoczesne, kiedy dane wrzucamy właśnie na jakąś usługę chmurową, czy to jest Amazon S3, czy to jest Azure Data Lake, Google Cloud Storage, po prostu jakiś taki fizyczny, znaczy wirtualny dysk, na którym wrzucamy pliki.

Wydaje mi się, że podstawą to będzie chyba podobnie, nawet jak w roli analityka, taka fundament, fundament, no to będzie ten SQL, będzie Cloud, czyli jakieś takie po prostu rozumienie, czym jest chmura i znajomość podstawowych usług w Cloudzie i Python.

Python jest mniej więcej zrozumiały, ok, jakiś tam język programowania, wybieramy sobie te biblioteki, których potrzebujemy, to z tym Cloudem ja mam zawsze problem.

I takie jest, dobra, ale to co ja jakby, ok, rozumiem, jest Azure, jest jakby AWS, jest Google Cloud, co ja konkretnie mam umieć?

Jeśli mamy ten proces ingestion i gdzieś tam na rozmowie się pojawia albo na refinement-cie temat, że na przykład dobra, no to musimy te dane teraz zapisać i musimy stworzyć nowy bucket na Google Cloud Storage.

No to jeśli ktoś nie wie, czym jest Google Cloud Storage, nie ma tej, teoretycznie nie rozumie, czym jest Data Lake, nie wie, bo się po prostu nie pracował z tym, że dane tam przechowujemy na przykład w formie bucketów, no to to wszystko brzmi niezrozumiale.

Sformułowanie z ingestu i dane do bucketu w Google Cloud Storage, jeśli nie rozumiemy tych wszystkich trzech pojęć, jest niezrozumiałe.

A w Cloudzie, to dlatego mi się wydaje, że większość ofert o pracę ma takie wymaganie...

Kontakt, znajomość, doświadczenie z Cloudem.