Mentionsy
Better Dev Club #9 - Benchmarki AI, czyli wydajność vs. cena
Zapisz się na newsletter żeby zawsze być na bieżąco z nowościami: https://betterdevclub.pl/newsletter
🔗do 9 odcinka Better Dev Club Weekly:
GDPval-AA Leaderboard | Artificial AnalysisHumanity's Last ExamDwóch MS MVP:
Piotr Stapp
Kajetan Duszyński
zajmują się przeglądem nowości z zakresu szeroko pojętego AI, nowoczesnych narzędzi.
Szukaj w treści odcinka
Miałem moment zakochania się o Clodzie.
I mówiąc szczerze, Cloda, właśnie na pytanie, które najbardziej lubię, to Cloda na przykład najbardziej lubię, dlatego że jest europejski.
No i tutaj mamy sytuację taką, że możemy sobie porównać GPT-5 II High, Cloda Opus 4-5 i Gemini 3 Pro.
Żeby było zabawnie, jak spojrzymy na te benchmarki, to też podobnie jest z Clodem.
To znaczy Clod w tej chwili 4,5, też akurat w tym miejscu, w którym gadamy, ale to nie jest tak, że to jest jedyny taki benchmark.
Oczywiście Clod też jest drogi, natomiast Geminarie są tańsze.
Może to jest kwestia po prostu jakiejś preferencji tego, w jaki sposób on odpowiada, bo Cloda na przykład już miałem dosyć, jak go wykorzystywałem, bo robił swoje i pierdzielił jeszcze przez dwie strony o jakichś głupotach dodatkowo i ta odpowiedź była taka rozmyta, a tutaj faktycznie jest to bardzo wygodne.
Natomiast fajnie, że są, fajnie, że coraz więcej mówi się o takich benchmarkach i coraz bardziej zwracamy na to uwagę, to znaczy jak nieduże różnice są tak naprawdę pomiędzy tymi modelami, bo w przypadku SWE Bench różnica pomiędzy Clodem, Gemini a GPT jest naprawdę minimalna, a cena jednak robi swoje.
Ostatnie odcinki
-
Better Dev Club #16 - Projekty AI za kokosy $$$...
19.02.2026 08:00
-
Better Dev Club #15 - Skille AI: Hype czy Game ...
12.02.2026 08:00
-
Better Dev Club #14 - Clawdbot - Moltbot - Open...
05.02.2026 08:00
-
Better Dev Club #13 - Piekło zamarzło. Linus To...
29.01.2026 08:00
-
Better Dev Club #12 - Czy AI może analizować sen?
22.01.2026 08:00
-
Better Dev Club #11 - Drama w Tailwindzie i upa...
15.01.2026 08:00
-
Better Dev Club #10 - AI Przewidywania na 2026
08.01.2026 08:00
-
Better Dev Club #9 - Benchmarki AI, czyli wydaj...
01.01.2026 09:00
-
Better Dev Club Weekly #8 - Co nas urzekło
25.12.2025 08:00
-
Better Dev Club Weekly #7 - Agentic AI Foundation
18.12.2025 08:00