Mentionsy
Projektowanie narzędzi dla modeli językowych i agentów AI | LIVE AI_devs 4
Dołącz do AI_devs 4 👉 https://www.aidevs.pl/ Zapraszamy Was na świąteczny webinar AI_devs 4, a zarazem pierwszy, który opowie o edycji Builders. Co na was czeka tego wieczoru? Pełna moc modeli językowych i agentów ujawnia się dopiero w połączeniu z aplikacjami, usługami, internetem czy urządzeniami. Tak jak nie zobaczymy wszystkich możliwości, dopóki nie zbudujemy tych narzędzi, tak samo nie zobaczymy trudności, dopóki nie skonfrontujemy się z produkcyjną rzeczywistością. Podczas spotkania pokażemy Wam praktyczne spojrzenie na budowanie narzędzi. Jeżeli już tworzysz takie rozwiązania, zobaczysz, jak robić to skutecznie i jak uniknąć pułapek. Jeżeli jeszcze tego nie robisz, zrozumiesz, jakie są możliwości i poznasz główną ideę AI_devs 4. Co zobaczysz? ✅ Wyzwania stosowania Function Calling w praktyce ✅ Zasady projektowania interfejsów narzędzi oraz MCP ✅ Konflikty pomiędzy narzędziami oraz wzmacnianie modelu ✅ Zestawy danych testowych i ewaluacja skuteczności narzędzi ✅ Złożoność środowiska produkcyjnego oraz zewnętrznych ograniczeń I nie tylko! Powiemy też o mapowaniu API, roli opisów w logice agentów, kontrolowaniu kontekstu w rozbudowanych zadaniach, rozszerzaniu narzędzi o własny kontekst i budowaniu ich dla mniejszych modeli LLM. Jeszcze jedna rzecz... 🚀 Te zaawansowane tematy i wiele więcej będą stanowić główny trzon AI_devs 4! Opowiemy więcej o pełnym programie nowej edycji, na którą zapisało się już ponad 600 osób. Do zobacz
Szukaj w treści odcinka
Opowiemy o AI Devs 4, opowiemy wam o tym, jaka dzisiaj jest niespodzianka, ale wszystko oczywiście w swoim czasie.
Czasami jest to na przykład dodaj zadanie do mojej listy zadań albo stwórz mi wydarzenie w kalendarzu albo sprawdź, jakie maile dostałem ostatnio.
Tam gdzie są te karty graficzne w data center, w OpenAI, w Antropiku, w Google, w innych miejscach?
Mówiąc nasz, mam na myśli to, co sami zaimplementowaliśmy albo dostarczone przez kogoś innego, bo na przykład mamy możliwość taką, te słynne konektory w Clodzie czy w ChargeGPT, podłączyć je na przykład do kalendarza Google'a, do Google Drive'a, do GitHub'a, więc ktoś może za nas to zaimplementować.
W przypadku serwera MCP on wystawia jakby dwa elementy, czyli mamy definicję tych funkcji, w jakimś tam manifestie jest opisane co on jest w stanie nam dostarczyć, plus jeszcze może to czasami jakieś strzyknąć, prompta dodatkowego i inne urozmaicenia.
Albo tworzyć jedną aplikację, a potem zastanawiać się, jak to udostępniać innym aplikacjom, innym agentom AI, no to w tym przypadku sprowadza się to w zasadzie do pliku konfiguracyjnego albo jakiegoś prostego instalatora.
Widzimy w nim zapytanie http do API OpenAI, w przypadku którego po prostu przesyłamy treść wiadomości użytkownika oraz odbieramy odpowiedź.
Patrząc na to wszystko może wydawać się, że posługiwanie się narzędziami służy tylko i wyłącznie do tego, aby łączyć chatboty z listami zadań, kalendarzami czy mailami.
Ewentualnie można to jeszcze przenieść w kontekst agentów AI, czyli autonomicznych bądź częściowo autonomicznych systemów,
Okazuje się jednak, że duże modele językowe można stosować poza kontekstami chatbotów czy agentów AI, albo też można powiedzieć, że ich logikę oraz koncepcję można wykorzystać wewnątrz aplikacji, która zupełnie nie posiada interfejsu czatu, ale wykonuje jakieś operacje w tle.
profilami użytkowników, komentarzami na blogu, wiadomościami e-mail, raportami bądź innymi dokumentami.
Oczywiście, że kod zostanie wysłany mailem, wszystko dostaniecie od nas mailem.
I to był prawdziwy Adam, nie żadne AI, a to dlatego, że sobie pokasłujemy w tak zwanym międzyczasie.
Część osób, która była z nami na AI Devs 3 czy na 3Loaded, spokojnie będziemy wchodzić głębiej, zaraz będzie dużo, dużo głębiej niż to.
Zobaczmy teraz jak w praktyce wygląda działanie narzędzia, które pozwala w tym przypadku agentowi AI zarządzać linearem, uwzględniając przy tym dostęp do praktycznie dowolnej funkcji tego systemu, oczywiście o ile jest dostępna w API.
Tymczasem patrząc na złożoność tego narzędzia, można zadać sobie pytanie, dlaczego te zmiany ma wprowadzać nam agent AI, a dlaczego nie możemy wprowadzać ich sami?
Oznacza to, że te wydarzenia zostały połączone z instrukcją znajdującą się tutaj i rzeczywiście otrzymaliśmy takiego maila.
Mianowicie agent podjął decyzję o tym, aby poinformować mnie o bieżącym statusie prac, a następnie o potwierdzenie wysyłki maila, co zresztą zrobiłem w oddzielnej wiadomości i wówczas główny agent przekazał moje potwierdzenie do subagenta i finalnie dostałem potwierdzenie wysyłki wiadomości, którą widzieliśmy przed chwilą.
Czyli narzędziem jest zarówno pamięć, czyli w moim przypadku linear, możliwość wzywania agentów, posługiwania się kalendarzem, linearem, komunikacji pomiędzy agentami, pisania draftów, w tym przypadku maili.
A tylko dziś, jeżeli chcecie dołączyć do AI Devs 4, które startuje w marcu przyszłego roku, to wyślemy do Was taką czapeczkę i dodatkowo 20% ze sprzedaży oddajemy na wybrany dom dziecka.
Powiemy, jak to wyszło jutro w mailach.
agentom AI Sandbox, w ramach którego będą w stanie uruchamiać kod i narzędzia będą dostępne właśnie w formie takich paczek, które będą w stanie sobie eksplorować np.
No i tutaj właśnie wchodzi do gry cały szeroko rozumiany kontekst engineering, czyli zarządzanie kontekstem i wymyślanie technik, które pozwalają agentom AI na utrzymywanie czy poruszanie się w tak obszernej treści bez uderzania w ten limit.
z mapami, z kalendarzami, z listami zadań, z mailami i tak dalej.
są wymagane do tego, żeby odnaleźć się w tym systemie wieloagentowym, czyli na przykład komunikacji pomiędzy agentami oraz dodatkowo posiada na przykład jeden integrację z kalendarzem, inny z mailem, a jeszcze inny na przykład posiada serię narzędzi odpowiedzialnych za jakiś konkretny obszar.
Tutaj otwiera się w zasadzie historia całego AI Desktop 4.
W ten sposób duży model językowy czy też agent AI będą w stanie przy wykorzystaniu Function Coring poprawnie zdecydować o tym kiedy z danego narzędzia należy skorzystać.
Jest to sytuacja, w której użytkownik prosi o pozornie prostą akcję przypisania nowej etykiety do wpisu o nazwie X. Model czy też agent AI w pierwszej kolejności musi odnaleźć identyfikator danego wpisu.
Czyli zbudowaniu interfejsu, który zwiększa szanse tego, że agent AI czy model językowy będzie w stanie skutecznie posłużyć się narzędziami, które próbujemy z nim zintegrować.
No i oczywiście, jeżeli już jesteś agentem piątym i chcesz czapeczkę, to napisz na kontakt małpa aidevs.pl albo aidevs małpa bravecourses i oczywiście taką czapeczkę dostaniesz.
Agent poprosił o potwierdzenie wysłania maila, ale nie poprosił o zmianę priorytetu w linearze.
No kiedy jest ten... Powiem tylko, tutaj dodam, że to, że wysłał maila, jeszcze wysłał dodatkową prośbę, to jest jedno.
maila do ciebie, tylko na listę adresów, które w tym przypadku akurat należą do mnie.
Jeżeli priorytet w zadaniu zostanie niezmieniony, to nawet agent sam może się zorientować, że to jednak nie to zadanie i po prostu to odwróci, a w sytuacji, gdy mamy wysyłkę maila, to jest to z założenia akcja nieodwracalna, o ile nie mamy jakichś tam czekadełek wgranych, gdzie
Natomiast z założenia wysłanie maila jest fired and forget.
Ja bym właśnie płynnie przeszedł do tego, bo jak czytam czat, to jest kilka pytań, no jakie będzie tutaj porównanie AI Devs 3, AI Devs 4, to to będzie właśnie w AI Devs 4?
Słuchajcie, tego typu informacje mamy już na naszej stronie, to znaczy jeżeli chcecie zerknąć i zobaczyć jak wygląda agenda AI Devs 4, to oczywiście na AI Devs.pl wszystkie te kwestie są opisane.
Czyli jak spojrzycie sobie na agendę i na przykład byliście już w AI Devs 3, to zobaczycie, że
Także to jest ta różnica pomiędzy AI Devs 3, gdzie realizowaliśmy
Także już podrzucam Wam link, jeżeli potrzebujecie przekonać szesostwo swoje, że fajnie jest wpaść na AI Devs 4 i pobudować narzędzia.
edytora kodu, gdzie mamy agenta AI, który pisze nam kod, generuje i posługuje się jakimiś narzędziami.
I jak powiadał Jakub ostatnio na Inforzerze, opowiadając o AI Devs od środka też, naszym celem jest to, żeby było jak najwięcej krwi, potu i łez, bo im więcej się nauczycie, im więcej przejdziecie przez tą ścieżkę, tym więcej z wami zostanie.
To nie jest tak, że przeklejane są wszystkie JSON-y z narzędzia, bo jak na przykład użyjemy narzędzia do pobierania maili z Gmaila, to tam jest parę megabajtów danych tak naprawdę.
Albo wpada nam mail, treść maila to jest komenda i coś się dzieje.
W trzeciej edycji AIDF-sa mieliśmy takie narzędzie, znaczy takie zadanie do stworzenia, do parsowania grafik.
Jeszcze więcej takich kawałków Adama znajdziecie na AI Devs 4 już w marcu.
Czy dobrze rozumiem, że jak w AI Devs 3 uczyliśmy się jak tworzyć agentów wraz z tworzeniem dla nich narzędzi, to w AI Devs 4 będziemy się skupiać głównie na tworzeniu samych narzędzi?
A w zasadzie zastanawiając się i odpowiadając na pytanie, dlaczego AIDF4 miałoby w ogóle powstać, zidentyfikowałem taki problem, który zarówno mnie dotyka, jak i pojawiał się w rozmowach z innymi osobami.
No i cały program zaprojektowałem w taki sposób, aby dostarczał tą najnowszą możliwą wiedzę, jeżeli chodzi o generatywne AI i wykorzystanie modeli do projektowania logiki, czy w zasadzie w logice aplikacji.
Norbert 5389 pyta, jak pokazać szefostwu nietechnicznemu, że MCP i Gen AI nie jest takie straszne, tak aby security się nie przyczepiło?
To znaczy, mówię inaczej, że to nie jest tak, że nagle wielkie procesy będą zawiązane bez AI, ale w wielkim procesie, który może być wielo...
I tutaj takie największe ryzyko jest, że jeżeli AI coś zrobi, no to my bierzemy na siebie konsekwencje za to.
Także jeżeli zarząd albo osoby, które gdzieś funkcjonują w firmie i są przeciwne AI, to nie do końca jest to samo w sobie złe, tylko rzeczywiście tam trzeba dokonać pewnej pracy do tego, żeby AI mogło być stosowane.
to wymaga dość dogłębnej analizy, ale żeby podjąć w ogóle decyzję, czy jest w ogóle jakieś zagrożenie, no to trzeba wiedzieć, jakie ono może być, w sensie jakie potencjalne zagrożenia istnieją, jakie możliwości mają na przykład modele, bo może się okazać, że to, co my planujemy na przykład zautomatyzować z użyciem AI, to jest technicznie niemożliwe, bo ja na przykład spotkałem się z czymś takim, że ludzie patrzą, ludzie nie techniczni, bo o nich mówimy, o menadżera głównie,
Oni patrzą na narzędziach, z których korzystają, czyli znają Chata GPT, Gemini'a, Cloud AI.
Teraz widzą, że te narzędzia mają pewne możliwości i teraz twierdzą, że ich programiści dokładnie te same możliwości zaimplementują teraz na poziomie API.
W trzeciej edycji na przykład jedno z takich zadań, pamiętam, było, gdzie ludzie trochę narzekali, o co tutaj wpisywać w ogóle AI jakiegoś, po co nam jest tu potrzebna sztuczna inteligencja.
Okazało się, że 90% tego zadania dało się zrobić klasycznie, a te 10% wymagało AI.
trzeba było tak naprawdę obudzić się, że nie potrzebujesz używać tutaj AI, tylko potrzebujesz wyodrębnić ten element niewykonalny w sposób klasyczny i tylko ten jeden malutki elemencik delegować, wszystko resztę oprogramować naturalnie.
I w sumie to jest dobra wiadomość, bo cała idea wejścia w AI Devs 4 jest taka, że to ma być maksymalnie praktycznie.
Totalnie się zgadzam i tutaj AI Desk 4 nawet robi ukłon właśnie w stronę osób, które dopiero wchodzą
Tam się dzieje ta nauka, tam się dzieje to poznawanie generatywnego AI, ale tam też uruchamia się
Czy jeśli mam doświadczenie w programowaniu, ale nie tworzyłem nigdy agentów AI, to na kursie dam radę?
Natomiast jak zaczniecie korzystać z tego MCP w codzienności, to zobaczycie, że część akcji jest niedostępna, część akcji jest źle zaimplementowana, a na przykład po części API zaczyna zwracać błędy, bo na przykład w wyniku podjęcia zbyt dużej liczby interakcji jest limit API.
i tak jakby w ogóle ten temat samej technologii jest dla was czymś nowym, no to wówczas AI Devs nie jest dla was.
Tym bardziej, że byłem na spotkaniu AI Devs w Gdańsku, gdzie jak się przedstawiliśmy i trochę pogadaliśmy, to się okazało, że połowa ekipy z dwudziestu paru osób w ogóle nie programuje.
Ale wyjście produkcyjne to znaczy jak tworzyć lepsze oprogramowanie zintegrowane z AI.
Czy w AI Devs 4 będziemy wszystko pisać samemu, czy będziemy korzystać z frameworków?
Czyli na przykład Vercel AI SDK jest przykładem rozwiązania, które może się pojawić.
Przypominam, że dzisiaj do końca dnia, jeżeli będziecie chcieli do nas dołączyć, to 20% ze sprzedaży przekazujemy na wybrany dom dziecka w Krakowie i jeszcze będą czapeczki, choć już piszą mi tu, że podobno jest takie zainteresowanie, że mogą się skończyć, więc tak, zachęcam, ale nie zachęcam, a zachęcam.
Jeszcze do AI Devs 4 trochę, a my już tutaj mocno rozważamy nad fabułą.
Chodzi o jakieś pipeliny czy rozwiązania typu AIS za Judge.
Był człowiek, który brał ślub na samym początku AI Devsów.
Byli tacy, którzy mówili tam, że rodzina z powrotem wita po AI Devsach.
I rzeczywiście, MrTN3270, jak ktoś chce zobaczyć, jakie rzeczy się wcześniej pojawiały, jest na GitHubie trochę repozytoriów, które nazywają się AI Devs 3.
Ja przypominam, że kod do tego, co dzisiaj Adam pokazywał, jutro poślemy mailem, jutro wam wszystko podsumujemy.
Słuchajcie, function calling, MCP, budowanie narzędzi, te wszystkie rzeczy będą w AI Devsach 4.
Nie no, ja spotykając się z ludźmi, których gdzieś tam po AI Devsach spotykamy w różnych miejscach, czy na konferencjach, czy w pracy, część osób przychodzi do nas po pigułkę, to znaczy po to, żeby podsumować to w takim, co się wydarzyło w ostatnim czasie.
Także rzeczywiście AI Devs jest tą pigułką wiedzy.
Natomiast, czyli rzeczywiście perspektywa, to jak patrzymy na generatywne AI różni się od punktu siedzenia.
Wiemy już na przykład, że jak użyje słowa rack, to już każdy będzie wiedział plus minus o co chodzi, jak to działa, jak to zaimplementować.
To prawda, kierunek jest dobrym określeniem, bo na przykład mam taką grupkę znajomych, robiących, powiedziałbym, dość hardkorowe rzeczy, jeżeli chodzi o generatywne AI.
Trochę ukryty rate limit, bo one nie failują, tylko one wracają na przykład po minucie, gdzie normalnie cała reszta wykonuje się po 10 sekundach na przykład albo po 5.
zaczęliśmy się tam zastanawiać nad tym, że co tutaj w ogóle się dzieje, dlaczego te zapytania w ogóle w ten sposób przechodzą i rzeczywiście na forum OpenAI są takie wątki i co ciekawe na Microsoft Azure również są takie wątki mówiące, że w przypadku takich grupowych zapytań część po prostu tak jakby cicho failuje, ale nie do końca.
standardyzacji i produktyzacji i tak dalej, ale rzeczywiście jak... Nawet kierunek failowania idą w tym samym kierunku, nie?
Ostatnie odcinki
-
Krótko o Paragonie
22.02.2026 17:00
-
TL;DR 01 Jak AI zmienia życie dewelopera? feat....
16.02.2026 15:01
-
Czy to już cenzura? Hiszpanie się w tańcu nie…
15.02.2026 23:53
-
🔍 Internet sprawdza powiązania z Epsteinem
11.02.2026 12:01
-
💣 Fałszywe alarmy bombowe
08.02.2026 12:01
-
🎧 Posłuchaj o 18:00
04.02.2026 14:01
-
👀 Jak obejść detektor AI?
04.02.2026 06:01
-
🏴☠️ Piracić to Was, nie nas!
03.02.2026 06:01
-
🔎 Analiza porównawcza dwóch encyklopedii
01.02.2026 12:01
-
💡 Kilka słów o ataku na polskie elektrownie
30.01.2026 17:01