Mentionsy

Better Dev Club
Better Dev Club
01.01.2026 09:00

Better Dev Club #9 - Benchmarki AI, czyli wydajność vs. cena

Zapisz się na newsletter żeby zawsze być na bieżąco z nowościami: https://betterdevclub.pl/newsletter

🔗do 9 odcinka Better Dev Club Weekly:

GDPval-AA Leaderboard | Artificial AnalysisHumanity's Last Exam

Dwóch MS MVP:

Piotr Stapp

Kajetan Duszyński

zajmują się przeglądem nowości z zakresu szeroko pojętego AI, nowoczesnych narzędzi.

Szukaj w treści odcinka

Znaleziono 8 wyników dla "Clod"

Miałem moment zakochania się o Clodzie.

I mówiąc szczerze, Cloda, właśnie na pytanie, które najbardziej lubię, to Cloda na przykład najbardziej lubię, dlatego że jest europejski.

No i tutaj mamy sytuację taką, że możemy sobie porównać GPT-5 II High, Cloda Opus 4-5 i Gemini 3 Pro.

Żeby było zabawnie, jak spojrzymy na te benchmarki, to też podobnie jest z Clodem.

To znaczy Clod w tej chwili 4,5, też akurat w tym miejscu, w którym gadamy, ale to nie jest tak, że to jest jedyny taki benchmark.

Oczywiście Clod też jest drogi, natomiast Geminarie są tańsze.

Może to jest kwestia po prostu jakiejś preferencji tego, w jaki sposób on odpowiada, bo Cloda na przykład już miałem dosyć, jak go wykorzystywałem, bo robił swoje i pierdzielił jeszcze przez dwie strony o jakichś głupotach dodatkowo i ta odpowiedź była taka rozmyta, a tutaj faktycznie jest to bardzo wygodne.

Natomiast fajnie, że są, fajnie, że coraz więcej mówi się o takich benchmarkach i coraz bardziej zwracamy na to uwagę, to znaczy jak nieduże różnice są tak naprawdę pomiędzy tymi modelami, bo w przypadku SWE Bench różnica pomiędzy Clodem, Gemini a GPT jest naprawdę minimalna, a cena jednak robi swoje.