Mentionsy

Mateusz Chrobok
Mateusz Chrobok
21.12.2025 17:31

Projektowanie narzędzi dla modeli językowych i agentów AI | LIVE AI_devs 4

Dołącz do AI_devs 4 👉 https://www.aidevs.pl/ Zapraszamy Was na świąteczny webinar AI_devs 4, a zarazem pierwszy, który opowie o edycji Builders. Co na was czeka tego wieczoru? Pełna moc modeli językowych i agentów ujawnia się dopiero w połączeniu z aplikacjami, usługami, internetem czy urządzeniami. Tak jak nie zobaczymy wszystkich możliwości, dopóki nie zbudujemy tych narzędzi, tak samo nie zobaczymy trudności, dopóki nie skonfrontujemy się z produkcyjną rzeczywistością. Podczas spotkania pokażemy Wam praktyczne spojrzenie na budowanie narzędzi. Jeżeli już tworzysz takie rozwiązania, zobaczysz, jak robić to skutecznie i jak uniknąć pułapek. Jeżeli jeszcze tego nie robisz, zrozumiesz, jakie są możliwości i poznasz główną ideę AI_devs 4. ​Co zobaczysz? ​✅ Wyzwania stosowania Function Calling w praktyce ​✅ Zasady projektowania interfejsów narzędzi oraz MCP ​✅ Konflikty pomiędzy narzędziami oraz wzmacnianie modelu ​✅ Zestawy danych testowych i ewaluacja skuteczności narzędzi ​✅ Złożoność środowiska produkcyjnego oraz zewnętrznych ograniczeń ​I nie tylko! Powiemy też o mapowaniu API, roli opisów w logice agentów, kontrolowaniu kontekstu w rozbudowanych zadaniach, rozszerzaniu narzędzi o własny kontekst i budowaniu ich dla mniejszych modeli LLM. ​Jeszcze jedna rzecz... ​🚀 Te zaawansowane tematy i wiele więcej będą stanowić główny trzon AI_devs 4! Opowiemy więcej o pełnym programie nowej edycji, na którą zapisało się już ponad 600 osób. ​Do zobacz

Szukaj w treści odcinka

Znaleziono 3 wyniki dla "Langfuse"

Innymi słowy, ja osobiście stosuję to narzędzie, które było widoczne na drugim nagraniu, czyli narzędzie Langfuse, które pozwala mi monitorować pełen przebieg interakcji z modelem językowym, odtwarzać ją i nawet robić takie snapshoty, gdzie mogę sobie cofnąć się tak jakby w czasie, w cudzysłowie, i na przykład sprawdzić zachowanie modelu przy modyfikacji promptu.

i zestaw danych uwzględnia na przykład wybrane z Langfuse moje zapytania o prośbę modyfikacji kalendarza i na tej podstawie dochodzi do weryfikowania tego, czy dany model radzi sobie przynajmniej w takim otoczeniu z obsługą tego narzędzia.

Natomiast LangFuse oraz np.