Mentionsy

Opanuj.AI Podcast

03.04.2026 06:43

TEGO AI NIE POTRAFI - ARC-AGI-3 i koniec epoki SaaS | Opanuj.AI

Czy AI naprawdę rozumie świat, skoro oblewa testy, które człowiek rozwiązuje bez większego problemu? I czy jednocześnie właśnie na naszych oczach kończy się era klasycznych SaaS-ów?W najnowszym odcinku opanuj.ai bierzemy na warsztat dwa tematy, które dziś najmocniej rozgrzewają świat sztucznej inteligencji i technologicznego biznesu.Najpierw analizujemy ARC-AGI-3 - nowy benchmark, o którym w środowisku AI zrobiło się głośno dosłownie kilka dni po premierze. To test, który ludzie przechodzą relatywnie łatwo, podczas gdy najlepsze modele AI osiągają wyniki bliskie zera. Co tak naprawdę mierzy ARC-AGI-3? Dlaczego współczesne modele zawodzą na nim tak spektakularnie? Czy da się poprawić ich wyniki i najważniejsze: czy ten benchmark faktycznie mówi nam coś istotnego o realnych możliwościach AI w 2026 roku?W drugiej części odcinka przechodzimy do pytania, które coraz częściej wraca w rozmowach founderów, inwestorów i liderów produktów: czy SaaSy naprawdę umierają? Przez lata obowiązywał prosty model - użytkownik korzystał z interfejsu, firma płaciła za seaty, a dostawca skalował przewidywalny przychód. Dziś ten porządek zaczyna się kruszyć. AI radykalnie obniża koszt budowy oprogramowania, zmienia oczekiwania klientów i przesuwa wartość z samego narzędzia na dostarczanie konkretnego wyniku. Rozkładamy więc na czynniki pierwsze, kto w nowym świecie będzie kontrolował relację z klientem, dlaczego pricing per-seat przestaje działać i czemu wiele firm SaaS będzie musiało wykonać głęboki pivot.To odcinek o tym, gdzie dziś naprawdę są granice AI i jak AI zmienia ekonomię budowy software’u.

Intro

ARC-AGI 3 – nowy benchmark AI

Historia ARC-AGI 1 i 2

ARC-AGI 3 – format gry i kontrowersje

Szybkie newsy: Anthropic, OpenAI, Pentagon

Przyszłość SaaS i migracja wartości

Szybkie newsy: NVIDIA GTC, Cursor, Chiny

Podsumowanie i zakończenieProgramuj z AI: https://10xdevs.plZapisz się na newsletter Opanuj.AI: https://opanuj.ai/newsletter💌 Podobało się? Zostaw suba 🚀

AI AGI Arc AGI ARC Arc harness Arc AGI Anthropic Software as a Salesforce'a ARR Service Salesforce Pentagon Przemku

Sponsorzy odcinka (1)

Opanuj.AI, TEGO post-roll

"Odpowiedź w komentarzach. Dziękujemy też za wszelkie wsparcie. No wielu z Was pisze do nas miłe słowa pod adresem tego podcastu, że go lubicie, że wnosi Wam wartość."

Szukaj w treści odcinka

Znaleziono 178 wyników dla "AI"

Opanuj.AI, TEGO.

Opanuj.AI,

Cześć, witajcie w kolejnym odcinku podcastu Opanuj.AI.

Tym razem przygotowaliśmy do Was podsumowanie marca w świecie sztucznej inteligencji, kodowania z AI i uczenia maszynowego.

ARC-AGI-3, czyli benchmarka, który miał swoją premierę zaledwie kilka dni temu i już stał się obiektem gorących debat w środowisku AI.

Opanuj.AI, TEGO.

Będzie o konflikcie na linii Anthropic, Pentagon i też udziale Opanuj.AI w tym całym zamieszaniu.

Będzie o premierze GPT 5.4 oraz zmiany strategii Opanuj.AI, które postanowiło zamknąć projekt Sora.

Będzie również o rekordowych rundach finansowania dla Opanuj.AI i Antropik.

Nie jest wykluczone, że AI dzisiaj byłaby w stanie stworzyć usługę internetową lub jakąś ciekawą aplikację, której nagle zaczęłyby używać miliardy ludzi.

No bo kiedy Arc-AGI-3 został wydany, to okazało się, że ludzie, którzy brali udział w tym badaniu, którzy byli taką próbką kontrolną dla agentów AI, byli w stanie przejść 100% środowisk testowych, czyli można powiedzieć takich plansz, po których poruszamy się, rozwiązując zadania w tym benchmarku.

Opanuj.AI

No i pytanie brzmi, dlaczego AI tego nie potrafi?

Natomiast, żeby porozmawiać o całym temacie testowania AI i całej historii Arc-AGI, to na początku chcemy Wam przedstawić autora tego badania, czyli właśnie François Chollet.

Opanuj.AI, TEGO.

Opanuj.AI

Opanuj.AI, TEGO.

Opanuj.AI

Obecne front-end models od Opanuj.AI, Google i Anthropic notowały poniżej 5% w tym benchmarku, czyli mamy faktycznie ostry reset i zaczynamy tak naprawdę od nowa.

Opanuj.AI

Opanuj.AI, TEGO.

Ta metryka nazywa się LHAI, czyli Relative Human Action Efficiency.

I mierzymy, ile ruchów AI potrzebuje w porównaniu do człowieka.

W ten sposób mierzymy efektywność AI.

Chcemy, żeby to AI było na podobnym poziomie jak drugi najlepszy człowiek z dziesięciu testowanych dla danego zadania.

Opanuj.AI, TEGO.

Opanuj.AI

Opanuj.AI, TEGO.

Opanuj.AI

Fair point.

I mamy tutaj rozróżnienie na Base LLM i LLM z Chain of Thoughtem.

I na Base LLM mamy modele, które tego Chain of Thoughta, czyli dodatkowych łańcuchów myśli, nie realizowały.

Natomiast kiedy włączymy sobie Chain of Thought, to nagle okazuje się, że np.

No i teraz moje pytanie brzmi, czym jest tak naprawdę chain of thought jakby w relacji do harnessu, do całej tej dyskusji?

Chain of Thought pojawił się jako po prostu naturalne rozszerzenie modeli, jako sposób na ominięcie ograniczeń tej technologii.

Wydaje mi się dla mnie osobiście, że harness jest takim kolejnym etapem w całej tej grze pod tytułem robimy modele, one mają swoje ograniczenia, potem wprowadzamy Chain of Thought, uczymy te modele rozumowania w taki, a nie inny sposób.

Natomiast można pewnie to odbić w ten sposób, że Chain of Thought też nie był tutaj tworzony pod rozwiązywanie Arc AGI.

Opanuj.AI, TEGO.

Rozwiązanie symbolika AI, które tutaj proponuje architekturę orkiestratora i subagentów zostało zdyskwalifikowane z oficjalnego leaderboardu jako benchmark specific harness, czyli takie rozwiązanie, które po prostu działało, ale zostało stworzone tylko po to, żeby rozwiązywać Arc-AGI-3.

Opanuj.AI, TEGO.

Widzieliśmy też, że zespół był w Kalifornii, współpracują z Opanuj.AI, więc to jest super i idźmy w tym kierunku.

Osoby, które chcą mieć z nami kontakt częściej niż raz na miesiąc, to mają taką możliwość, zapisując się na newsletter Opanuj.AI, łamane na newsletter, tam właśnie się można zapisać i co poniedziałek otrzymywać od nas wydanie newslettera, gdzie znajdziecie trzy wyselekcjonowane newsy, narzędzia, techniki AI, które możecie wykorzystać jako specjalistę.

Opanuj.AI

Można się w ciągu pięciu tygodni nauczyć wspólnie z nami AI Native Software Engineering, czyli tego, jak efektywnie, świadomie programować z AI.

TEGO temu, jak my odpracujemy z AI, a jesteśmy osobami, które w temacie siedzą głęboko od lat trzech, więc przygotowaliśmy dla Was dużo nowości.

Opanuj.AI, TEGO.

Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI

Opanuj.AI Opanuj.AI Opanuj.AI

Opanuj.AI, TEGO.

Przypominam, mówimy o jednym z liderów AI na świecie, nie tylko w Stanach Zjednoczonych.

OpenAI zgodził się na podpisanie, firma OpenAI zgodziła się na podpisanie tego.

Opanuj.AI, TEGO.

Natomiast sporo się podziało, szefowa robotyki Katelyn Kalinowski odeszła, również prawie 100 pracowników podpisało list protestacyjny, 900 pracowników Google'a i OpenAI podpisało taką międzyfirmową petycję i pojawił się oczywiście ruch społeczny QuitGPT zachęcający użytkowników do odinstalowania czata GPT.

Anthropic odmówił, wylądował w sądzie, Opanuj.AI podpisało.

Jeśli chodzi o narzędzie AI do kodowania, jest to również najbardziej lubiane narzędzie.

Czyli rozszerzenia computer use, computer use również w cloud codzie, obsługa voice mode w 20 językach, również push to talk, commanda slash voice lub do monitoringu, więcej kontekstu dla opusa, auto mode do lepszego zarządzania uprawnieniami, między innymi o tym był również nasz najnowszy newsletter Opanuj.AI.

Opanuj.AI, TEGO.

I też Anthropic mówi, że to nie jest iteracja, a osobna nowa klasa rozwiązań AI.

No i też troszkę nadganiając w Opanuj.AI również nowości GPT-5.4.

Tutaj kodeks od Opanuj.AI potroił liczbę użytkowników.

Opanuj.AI mówi, że mają 2 miliony użytkowników plus tygodniowo, a zużycie tokenów wzrasta pięciokrotnie.

Jest na pewno ten ekosystem, gdzieś tam narzędzie dla programistów OpenAI, to jest też istotny element rozwoju tej firmy.

Mieliśmy taką alternatywę dla TikToka opartą na Generative AI.

Natomiast, jak wskazują różne źródła w Opanuj.AI, pojawił się ban na questy poboczne, na jakieś zadania niezwiązane z misją firmy, z tym poszukiwaniem AGI i tutaj CEO of Applications, bo tak się nazywa stanowisko tej pani, pani Fiji Simon.

Opanuj.AI, TEGO.

Wycofał swoją inwestycję w OpenAI, no i będziemy tylko czekać na to, jak właśnie firma podwoi, potroi wysiłki w takich kierunkach, które są dla nich bardziej istotne, czyli narzędziach do kodowania, rozwiązaniach Enterprise i chyba jeszcze poszukiwania tego AGI, bo myślę, że to cały czas też w grze.

AI tak naprawdę przeczy SaaSowi rozwijanie tego typu produktów.

Co AI tutaj zmienia?

Opanuj.AI, TEGO.

Opanuj.AI

Opanuj.AI, TEGO.

Opanuj.AI

Opanuj.AI, TEGO.

Opanuj.AI

Opanuj.AI, TEGO.

I to raczej AI tego nie zmieni, bo to nie wynika z technologii, tylko bardziej z całej dynamiki organizacji i ludzi, którzy ją tworzą.

Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI Opanuj.AI

Opanuj.AI, TEGO.

Opanuj.AI

Opanuj.AI, TEGO.

Nie wiem, różne są warianty, są jakieś kredyty na akcje, jest rozliczanie za tokeny, no różne takie proxy na tą działalność AI są tworzone, ale to zwykle i tak jest obarczone wieloma problemami, zmieniają się modele i mamy po prostu kolejne zmiany w tych cennikach i tak dalej, i tak dalej, a z drugiej strony ciężko wycenić ten outcome, nie?

Opanuj.AI, TEGO.

Opanuj.AI

Opanuj.AI, TEGO.

Opanuj.AI

Natomiast ta historia nie polegała wyłącznie na tym, że dodali AI, gdzieś tam dokleili to AI i rzeczy się działy.

Opanuj.AI

Opanuj.AI, TEGO.

Oni wspominają, że agenci AI są u nich wdrażani w 75% workspace'ów enterprise, wolumen pracy, którą agenci wykonują wzrósł 5-krotnie w 3 miesiące, a sami agenci generują 25% nowych zgłoszeń, więc to już nie jest tak, że agentów gdzieś tam dodajemy do jakichś pitch'y inwestorskich albo do slide deck'ów, tylko że mamy faktycznie zmiany w sposobie korzystania z produktu.

No i sam Werser, który mówi, że mieli sporo poddostawców, sporo usług zewnętrznych, teraz po prostu zastępują to generowanymi interfejsami AI.

One to API mają świetnie rozwinięte no i zaliczyły właśnie pod wpływem wzrostu zainteresowania i użycia agentów.

Opanuj.AI

Opanuj.AI, TEGO.

Opanuj.AI

Opanuj.AI i Anthropic zebrało rekordowe rundy finansowania, zwłaszcza Opanuj.AI, która w ogóle jest największa runda w historii, 110 miliardów.

Amazon, Softbank, Nvidia brały udział właśnie w tym finansowaniu dla Opanuj.AI.

Opanuj.AI, TEGO.

Jeżeli chodzi o Opanuj.AI, to również nie mogą narzekać na brak użytkowników.

Coraz więcej ludzi korzysta z AI i firmy mają z tego konkretne przychody.

Opanuj.AI, TEGO.

gdzie mamy takie end-to-endowe rozwiązanie pod trening AI, chipy, raki, całość, po prostu taka gotowa fabryka AI, która ma obniżyć koszt treningu modeli nawet dziesięciokrotnie i jest ona stworzona z myślą o tych największych modelach o miliardach parametrów.

Jego zdaniem jest to kolejny ChargeGPT, tylko w wydaniu autonomiczni agenci i NVIDIA we współpracy z Opanuj.AI, do którego teraz OpenCore należy, a w zasadzie do tego jest opieką, bo OpenCore pozostało projektem OpenSource, ale NVIDIA stworzyła na tej podstawie...

Opanuj.AI, TEGO.

A propos agentów asynchronicznych, a propos treningu AI w dużej skali, to również na koniec chcę powiedzieć o Chinach.

To ma być finansowane przez lokalne rządy, rozwijane przez firmy, które właśnie taki robotic AI rozwijają.

Opanuj.AI, TEGO.

I AI, można powiedzieć, cielesnego, takiego gdzieś tam zagnieżdżonego w ciele, Embodied AI z angielskiego.

Opanuj.AI, TEGO.

Ostatnie odcinki

TEGO AI NIE POTRAFI - ARC-AGI-3 i koniec epoki ...
03.04.2026 06:43
Programowanie w epoce AI z Claude Code, Cursore...
19.03.2026 16:35
OpenClaw, SWE-AGI i zmierzch chatbotów - Opus 4...
04.03.2026 14:08
Doktor AI nadchodzi - ChatGPT Health vs Google ...
01.02.2026 18:45
Wielkie Podsumowanie AI w 2025 - Modele, Narzęd...
09.01.2026 05:00
GPT-5.2 to GEMINI KILLER? Google VS OpenAI, MCP...
01.01.2026 10:51
Gemini 3 to hit, ale konkurencja nie śpi! GPT-5...
01.12.2025 12:38
Cursor 2.0 vs Windsurf SWE-1.5 - dobrze, szybko...
04.11.2025 05:00
Czy agenci AI zdominują branżę e-commerce? Chat...
04.10.2025 06:10
Czy agenci AI zdominują branżę e-commerce? Chat...
03.10.2025 05:05