Mentionsy

Better Dev Club
Better Dev Club
01.01.2026 09:00

Better Dev Club #9 - Benchmarki AI, czyli wydajność vs. cena

Zapisz się na newsletter żeby zawsze być na bieżąco z nowościami: https://betterdevclub.pl/newsletter

🔗do 9 odcinka Better Dev Club Weekly:

GDPval-AA Leaderboard | Artificial AnalysisHumanity's Last Exam

Dwóch MS MVP:

Piotr Stapp

Kajetan Duszyński

zajmują się przeglądem nowości z zakresu szeroko pojętego AI, nowoczesnych narzędzi.

Szukaj w treści odcinka

Znaleziono 3 wyniki dla "SWE Bench"

A SWE Bench jest bardziej niezależny, z tego co wiem.

Także jak rozmawiamy sobie programista do programisty, to pewnie dla nas bardziej wartościowym jest SWE Bench.

Natomiast fajnie, że są, fajnie, że coraz więcej mówi się o takich benchmarkach i coraz bardziej zwracamy na to uwagę, to znaczy jak nieduże różnice są tak naprawdę pomiędzy tymi modelami, bo w przypadku SWE Bench różnica pomiędzy Clodem, Gemini a GPT jest naprawdę minimalna, a cena jednak robi swoje.