Mentionsy
Bezpieczeństwo znów staje się tajemnicą
🦋 Projekt Glasswing to nowy produkt Anthropica, który dostępny jest - ze względów bezpieczeństwa - praktycznie jedynie dla największych światowych korporacji. Nie ma jednak - przynajmniej oficjalnie - zagrażać całej ludzkości, a jest po prostu odpowiedzią na ostatnie, dynamiczne zmiany na rynku podatności w oprogramowaniu. Czy tak jest w rzeczywistości? Linki: 🦋 Project Glasswing https://www.anthropic.com/glasswing
⏰ From Vulnerability to Exploitation https://zerodayclock.com/
🔍 Assessing Claude Mythos Preview’s cybersecurity capabilities https://red.anthropic.com/2026/mythos-preview/
🧾 System Card: Claude Mythos Preview https://www-cdn.anthropic.com/08ab9158070959f88f296514c21b7facce6f52bc.pdf
🐦 Zvi Mowshowitz: Claude Mythos is different https://x.com/TheZvi/status/2042356147043406066
❌ Zvi Mowshowitz: The Most Forbidden Technique https://thezvi.substack.com/p/the-most-forbidden-technique
⛔️ Alignment Risk Update: Claude Mythos Preview https://www-cdn.anthropic.com/79c2d46d997783b9d2fb3241de43218158e5f25c.pdf
🐮 Self-Consuming Generative Models Go MAD https://arxiv.org/abs/2307.01850
👌 Evaluating and mitigating the growing risk of LLM-discovered 0-days https://red.anthropic.com/2026/zero-days/
🐦 gum on Twitter https://x.com/gum1h0x/status/2041917868158202022
🐦 Stanislav Fort on Twitter https://x.com/stanislavfort/status/2041922370206654879
🐦 Dawid Moczadło on Twitter https://x.com/kannthu1/status/2042695741844619502 © Wszystkie znaki handlowe należą do ich prawowitych właścicieli. ❤️ Dziękuję za Waszą uwagę. Znajdziecie mnie również na: Instagramie @mateuszemsi https://www.instagram.com/mateuszemsi/ Twixxerze @MateuszChrobok https://twitter.com/MateuszChrobok Mastodonie https://infosec.exchange/@mateuszchrobok LinkedInie @mateuszchrobok https://www.linkedin.com/in/mateuszchrobok/ Patronite https://patronite.pl/MateuszChrobok Rozdziały: Intro Podatności Strach Karta Grzech Kontra Plany Co Robić i Jak Żyć? #ai #cyberbezpieczeństwo #Anthropic #Mythos #Claude
Rozdziały (8)
Szukaj w treści odcinka
Tam, gdzie zawsze brakowało czasu, pieniędzy i kompetentnych rąk do pracy, czyli w kwestii dogłębnego, mozolnego analizowania podatności, mytos nigdy się nie nudzi i działa wielokrotnie szybciej niż jakikolwiek człowiek.
Mytos widzi więcej, wie więcej i tak to jest mniej więcej.
Nie chodzi tu nawet o mytos, ale po prostu coś podobnego, stworzonego niezależnie na jego wzór przez naszych adwersarzy.
Stąd dostęp do mytosa, w jakiejś formie uzyskałej firmy i organizacje dostarczające szeroko wykorzystywane, krytyczne oprogramowanie.
Tylko jak właściwie mytos działa i czy możemy się w tym zakresie w ogóle czegoś więcej dowiedzieć?
Tak więc, kiedy mytos został postawiony przed zadaniem ucieczki z sandboxa w taki sposób, aby skontaktował się z nadzorującym go badaczem, zrobił to.
Mytos rozwiązał zadanie, jednak w sposób, którego wprost zabraniał prompt.
No więc co zrobił Mytos?
Anthropic podkreśla, że mytos mimo pojedynczych, opisanych, niepożądanych zachowań jest nadal znacznie, znacznie bezpieczniejszym pod kątem alignmentu modelem od wszystkich poprzednich.
Niestety, w mytosie Anthropic popełnił grzech pierworodny.
Znaczna część z tych luk znalezionych przez Mytosa to rzekomo jedynie warianty dwóch z nich.
Czy mytos zostanie kiedyś udostępniony szerzej?
No i mytos wcale nie ogranicza się jedynie do badań z zakresu cyberbezpieczeństwa.
Ostatnie odcinki
-
Chcesz zostać hakerem? Przyda ci się butelka.
19.04.2026 16:00
-
Bezpieczeństwo znów staje się tajemnicą
12.04.2026 00:00
-
Porozmawiaj z babcią o bezpieczeństwie Pogadaj ...
05.04.2026 16:00
-
Twoja firma zakazała AI? To największy błąd, ja...
05.04.2026 00:00
-
Telegramoff, internyet! Jak Rosja odcina się od...
29.03.2026 16:00
-
To koniec.
22.03.2026 17:00
-
TL;DR_04 Walka o bezpieczeństwo polskich przeds...
15.03.2026 17:00
-
TL;DR_03 Czy deepfake jest nielegalny? Prawo AI...
04.03.2026 21:57
-
🤨 O co chodzi z Trumpem i Anthropic?
02.03.2026 15:01
-
🙏 Kazania z chatGPT?
28.02.2026 13:01