Mentionsy

Opanuj.AI Podcast
Opanuj.AI Podcast
04.11.2025 05:00

Cursor 2.0 vs Windsurf SWE-1.5 - dobrze, szybko i tanio? Nowa era programowania z AI już tu jest (+ DGX Spark, ChatGPT Atlas i nanochat)

Cursor 2.0 rozszerza tradycyjne środowisko programistyczne na rzecz rewolucyjnej platformy wieloagentowej, fundamentalnie zmieniając podejście do pisania kodu. Cognition natychmiast kontratakuje, wypuszczając Windsurf SWE-1.5 – model kodujący z oszałamiającą prędkością 950 tokenów na sekundę. Analizujemy ten pojedynek gigantów i sprawdzamy, które podejście zdominuje AI-assisted development. W odcinku również: premiera taniego i szybkiego Haiku 4.5, rozczarowujące testy superkomputera DGX Spark, krytyka przeglądarki Atlas od OpenAI oraz wielkie podsumowanie 10xDevs II.

Szukaj w treści odcinka

Znaleziono 3 wyniki dla "SWI Bench"

Tutaj twórcy Windsurfa przytaczają znany benchmark SWI Bench Pro, który ma pokazywać jak modele, w zasadzie agenci rozwiązują takie problemy w ramach repozytorium end-to-end, czyli od zapoznania się z jakimś opisem problemu aż do zaproponowania pull requesta.

I mamy 40% skuteczności na SWI Bench i aż 950 tokenów na sekundę w przypadku SWI 1.5.

To, o czym również wspominałem, to jest to, że oni poszli troszkę w przeciwnym kierunku niż reszta branży, mianowicie nie skupiali się wyłącznie na optymalizowaniu tego benchmarku SWI Bench, który jest właśnie takim wąskim zestawem zadań wyłącznie w Pythonie, ale starali się jak najbardziej odwzorować to, jak wygląda praca programisty i ten model ma się po prostu dopasować, w zasadzie ten agent ma się dostosować do tego, jak ta praca