Mentionsy
Brew #64: Niebezpieczny Model Mythos. Tokenmaxxing w Meta. mSzyfr. AIR i PRAGMA - LLMy w Revolut.
Czy nadeszła era, w której inteligencję można po prostu kupić na godziny? W dzisiejszym odcinku Tomek, Wojtek i Sebastian analizują, dlaczego największe firmy świata przestały walczyć o benchmarki, a zaczęły o realną przewagę w cyberbezpieczeństwie i adopcji wewnętrznej.
W tym odcinku, między innymi:
🛡️ Anthropic Mythos: Poznajcie nowy poziom modeli (wyżej niż Opus!), który w ramach Project Glasswing trafia tylko do wybranych gigantów i rządów. Wykrywa luki zero-day z przerażającą skutecznością.
📈 Tokenmaxxing w Meta: Dlaczego pracownicy Marka Zuckerberga palą tokeny za blisko miliard dolarów miesięcznie? Wyjaśniamy fenomen "Token Legends" i to, czy palenie compute faktycznie podnosi produktywność.
🔐 mSzyfr & mObywatel: Polska buduje własny standard bezpiecznej komunikacji dla administracji. Analizujemy stos technologiczny oparty na protokole Matrix i plany wdrożenia mSzyfru.
🇪🇺 Weryfikacja wieku w UE: Rozbieramy na części protokół oparty o Zero Knowledge Proof. Jak udowodnić, że jest się pełnoletnim, nie pokazując dowodu tożsamości?
💳 Revolut PRAGMA & AIR: Jak model trenowany na 24 miliardach zdarzeń bankowych zmienia interfejs finansowy w osobistego agenta AI.
🎙️ Jensen Huang (NVIDIA): O nowej ekonomii, w której dolary zamienia się bezpośrednio w "jednostki myślenia".
🔗 Linki:
OpenAI President Greg Brockman - https://www.youtube.com/watch?v=J6vYvk7R190
Jensen u Lexa - https://www.youtube.com/watch?v=vif8NQcjVf0
Jensen u Dwarkesha - https://www.youtube.com/watch?v=Hrbq66XqtCo
PRAGMA - Revolut Foundation Model - https://arxiv.org/html/2604.08649v1
📖 Rozdziały:
- Start
- Intro
- AI w służbie CyberSec
- Technical Behavioral Interview
- Greg Brockman wychodzi z szafy
- Jensen w dwóch podcastach
- Weryfikacja wieku po europejsku
- Tokenmaxxing
- Claude Mythos - (nie)bezpieczny model
- mSzyfr - polski komunikator
- PRAGMA i AIR - LLMy wg Revoluta
#Brew64 #AI #Cybersecurity #TokenMaxing #AnthropicMythos #mSzyfr #Revolut #NVIDIA #TechTrends2026 #Mythos
Rozdziały (11)
Szukaj w treści odcinka
Mark Zuckerberg zrobił AI dla pracowników, które replikuje jego, żeby sobie z nim gadali.
Ale słuchajcie, teraz się strasznie wszystko rozpędziło, ale mój snak też jest, bo sprawdziłem sobie takie ciekawostki, które się działy i troszeczkę z innej perspektywy chciałbym wam powiedzieć, bo takie dwa spójne dla mnie newsy i jeden dodatkowy, czyli nie wiem czy kojarzycie, ale niedawno OpenAI wypuściło tego GPT 5.4 Cyber.
Jakby to powiedzieć, ugruntowić te modele w firmach, gdzie faktycznie, wiesz, na przykład próbowano już jednej rewolucji, AI nie udała się, dobrze, mamy jednak faktycznie modele, które pomagają nam z różnymi innymi rzeczami, z bezpieczeństwem, jakimiś audytami, więc spróbujmy jeszcze raz.
Trzeci mini-news, taki też AI-owy, który znalazłem, to jest Meta przedłuża współpracę z Broadcomem, jeżeli chodzi o własne czipy.
Machine Learning System Design Interview, Generative AI System Design Interview.
Brockmanem oczywiście jest OpenAI, jeżeli ktoś nie pamięta.
Opowiada też, jak OpenAI rozumie super app.
I że każdy kraj będzie musiał tą aplikację sobie zaimplementować.
Wiesz, Wielka Brytania jest chyba żywie zainteresowana, bo oni mają dokładnie ten sam temat na warsztacie.
I tam ma być docelowo też funkcjonalność potwierdzania claimów o tobie.
Ja samej aplikacji czy temu, co oni robią, będę się przyglądał i na tym poziomie, jak oni to pokazali, jak to jest zaimplementowane, to według mnie to jest dobra robota.
I ktoś prawdopodobnie robi to, z czego się uśmiechaliśmy już przez dłuższy czas, transformację AI w oparciu o to, że faktycznie palimy te tokeny, nie do końca uzupełniając o dodatkowe prawdopodobnie metryki.
Używam AI w tej chwili, tutaj z boku.
Adopcja AI, jak w naszej życiu adopcja AI, tak?
Czyli powiedzieli, używaj tego AI przez pół roku, to czy to jest złe?
Bardzo łatwa metryka do wzięcia i problem jest taki, że w wielu firmach produktywność nie jest ugryziona, tak jak mówisz, ale na przykład ktoś dostanie KPI na wdrożenie AI i dosłownie weźmie przykład, bo przecież robi tak Meta, NVIDIA i wiele innych firm.
Są dostępne może jakieś raporty, tak jak teraz wspomniany Jellyfish, ale nie ma oficjalnego, tak jak powiedziałeś Tomek, oficjalnej publikacji, która przedstawia jak dać boost programistom, nie wiem, specjalistom AI.
Brytyjski AI Security Institute potwierdził realny skok, że Mythos osiągnął w ich wewnętrznych badaniach 73% skuteczności na expert level CTF.
No i między innymi efektem ubocznym można by powiedzieć, że OpenAI tydzień, niecały tydzień później wypuścił oczywiście tego 5,4 cyber, którego wcześniej wspomniałem i stworzył tak zwany Trusted Access for Cyber.
Jeżeli taki model, który jest na tyle dobry w znajdowaniu błędów, zakładając, że claims Anthropica są dobre, to wypuszczenie go na świat po prostu byłoby dużym po prostu problemem, bo jak wspomniałem na początku, ransomware to po prostu by siedział i zacierał ręce.
Czyli mamy Haiku, Sonnet, Opus i powyżej tego postawili Mythos.
Anthropic Cloud 5.0 i właśnie z tymi poziomami Haiku, być może nie, Haiku zniknie jako najniższy, Sonet, Opus, Mythos.
Tam od ręki był taki fajny claim FFMPG, nie?
Więc jeżeli słucha nas ktoś, kto pracuje w firmie, która ma na przykład release train raz na kwartał, to myślę, że, a już szczególnie w bankowości,
Na zasadzie takiej puściliśmy AI, który potrafi szukać błędy i je eksploatować.
Czyli wiesz, był E coś tam, E coś tam, E coś tam, teraz jest M. AI też było.
AI było, tak.
Czy nie pamiętacie już afery, że wysyłano maile z Gmaila i z prywatnych kont po to, żeby ominąć jakiekolwiek protokoły, które są specjalnie przygotowane do tego typu komunikacji?
Znaczy, mam jeden komentarz merytoryczny tego, co powiedziałeś, albo semi-merytoryczny, jak to ja, ale jak już o tym mówisz, to jest taka anegdota, że jedna z komercyjnych firm wdrażała bardzo fajne rozwiązanie, które zabezpieczało jej pocztę mailową lata temu, nie?
Prezes powiedział, że nie będzie korzystał i postawili osobny serwer mailowy dla niego, który nie miał tego wdrożonego True Story z naszego kraju.
Nie, takiego... Ukraina zrobiła taki ruch, nie wiem czy pamiętacie, niedawno, że wzięła takiego człowieka ze świata startupów i technologii i zrobiła go tam odpowiedzialnym za obronę.
Na przykład właśnie Estonia, którą zawsze wszyscy przypominają, ale potem Ukraina, nie?
Pojawił się w Stanach claim, znaczy ten pozew, który mówi, że WhatsApp czyta tam, znaczy firmy pracujące dla mety typu Accenture czytają wiadomości na WhatsAppie, czy chcą, czy nie chcą, bo jest backdoor.
Więc Grok potrzebuje retrainingu.
Drugie, od razu będę chciał rozszerzyć tą dyskusję szybko o Revolut Air.
Bo wiem, Tomku, z naszych dyskusji, że będziesz chciał skręcić, gdzie AI ma się w bankach.
I to jest taka ciekawostka, Revolut jest faktycznie pierwszą instytucją, no teraz już bankiem oficjalnie nawet brytyjskim, który zbudował tego typu model, zbudował go jako foundation model, a nie retraining i zbudował go właśnie z NVIDIA i pokazał go na tak wielkim wydarzeniu, więc to jest taka ciekawostka.
Natomiast ja od razu chciałem Was zaprosić do dyskusji na temat AIR'a.
Jeszcze szybko przedstawię AIR'a.
Więc AIR'a mam.
AIR to jest, można by powiedzieć, chatbot w tym momencie, który ma dostęp do wszystkich funkcjonalności całej naszej historii wszystkich transakcji i do całego kontekstu chatbota wspierającego nas w aplikacji.
Można powiedzieć, jest to produkt, który łączy wszystko w jeden spójny interfejs, tak żebyśmy mogli zarówno zadać pytanie, hej, ile w poprzednim miesiącu wydałem na kawę w Starbucksie, a ile bym zyskał, jeżeli bym zainwestował to na przykład w NVIDIA, tak?
Zainspirowany Sknerusem Makwaczem, pogadaj ze swoimi pieniędzmi.
AIR dostał dostęp do wszystkich nalaż zrównolegle, a tych produktów będzie jeszcze więcej.
Ale to mówisz o AIR, czy o tym modelu?
O tym modelu, bo szczerze mówiąc, samo AIR jako już, nie wiem, czad bakrzyż, tak?
Tak, tylko że Tomek, teraz weź pod uwagę, różnica polega na tym, że ten... Nie, nie, nie, teraz chciałem powiedzieć, że właśnie czym się różni AIR i PRAGMA?
To naturalnie będzie największe wdrożenie AI od razu w polskiej bankowości tak od strzału.
Ostatnie odcinki
-
Brew #64: Niebezpieczny Model Mythos. Tokenmaxx...
22.04.2026 04:00
-
Brew #63: Skanowanie Mózgu przez Metę, Mistral ...
09.04.2026 10:10
-
Brew #62: Europejskie Delaware wg Ursuli. Wizja...
26.03.2026 05:00
-
Brew #61: Koniec anonimowości w sieci? Dewelope...
09.03.2026 05:00
-
Brew #60: Koniec pisania kodu? Czy OpenClaw to ...
23.02.2026 05:00
-
Brew #59: Siri ma Gemini. Upadek modelu Open-So...
03.02.2026 05:00
-
Brew #58: Podsumowanie roku 2025. Zwycięzcy i p...
13.01.2026 05:00
-
Brew #57: Disney w OpenAI. Świąteczna paczka od...
29.12.2025 09:35
-
Brew #56: Afera Saule. OpenAI Traci Tron. AWS G...
15.12.2025 05:00
-
Brew #55: Awaria Cloudflare, Google Gemini 3.0,...
25.11.2025 17:00