Mentionsy

Mateusz Chrobok
Mateusz Chrobok
12.04.2026 00:00

Bezpieczeństwo znów staje się tajemnicą

🦋 Projekt Glasswing to nowy produkt Anthropica, który dostępny jest - ze względów bezpieczeństwa - praktycznie jedynie dla największych światowych korporacji. Nie ma jednak - przynajmniej oficjalnie - zagrażać całej ludzkości, a jest po prostu odpowiedzią na ostatnie, dynamiczne zmiany na rynku podatności w oprogramowaniu. Czy tak jest w rzeczywistości? Linki: 🦋 Project Glasswing https://www.anthropic.com/glasswing

⏰ From Vulnerability to Exploitation https://zerodayclock.com/

🔍 Assessing Claude Mythos Preview’s cybersecurity capabilities https://red.anthropic.com/2026/mythos-preview/

🧾 System Card: Claude Mythos Preview https://www-cdn.anthropic.com/08ab9158070959f88f296514c21b7facce6f52bc.pdf

🐦 Zvi Mowshowitz: Claude Mythos is different https://x.com/TheZvi/status/2042356147043406066

❌ Zvi Mowshowitz: The Most Forbidden Technique https://thezvi.substack.com/p/the-most-forbidden-technique

⛔️ Alignment Risk Update: Claude Mythos Preview https://www-cdn.anthropic.com/79c2d46d997783b9d2fb3241de43218158e5f25c.pdf

🐮 Self-Consuming Generative Models Go MAD https://arxiv.org/abs/2307.01850

👌 Evaluating and mitigating the growing risk of LLM-discovered 0-days https://red.anthropic.com/2026/zero-days/

🐦 gum on Twitter https://x.com/gum1h0x/status/2041917868158202022

🐦 Stanislav Fort on Twitter https://x.com/stanislavfort/status/2041922370206654879

🐦 Dawid Moczadło on Twitter https://x.com/kannthu1/status/2042695741844619502 © Wszystkie znaki handlowe należą do ich prawowitych właścicieli. ❤️ Dziękuję za Waszą uwagę. Znajdziecie mnie również na: Instagramie @mateuszemsi https://www.instagram.com/mateuszemsi/ Twixxerze @MateuszChrobok https://twitter.com/MateuszChrobok Mastodonie https://infosec.exchange/@mateuszchrobok LinkedInie @mateuszchrobok https://www.linkedin.com/in/mateuszchrobok/ Patronite https://patronite.pl/MateuszChrobok Rozdziały: Intro Podatności Strach Karta Grzech Kontra Plany Co Robić i Jak Żyć? #ai #cyberbezpieczeństwo #Anthropic #Mythos #Claude

Rozdziały (8)

1. Intro
2. Podatności
3. Strach
4. Karta
5. Grzech
6. Kontra
7. Plany
8. Co Robić i Jak Żyć?

Szukaj w treści odcinka

Znaleziono 13 wyników dla "mytos"

Tam, gdzie zawsze brakowało czasu, pieniędzy i kompetentnych rąk do pracy, czyli w kwestii dogłębnego, mozolnego analizowania podatności, mytos nigdy się nie nudzi i działa wielokrotnie szybciej niż jakikolwiek człowiek.

Mytos widzi więcej, wie więcej i tak to jest mniej więcej.

Nie chodzi tu nawet o mytos, ale po prostu coś podobnego, stworzonego niezależnie na jego wzór przez naszych adwersarzy.

Stąd dostęp do mytosa, w jakiejś formie uzyskałej firmy i organizacje dostarczające szeroko wykorzystywane, krytyczne oprogramowanie.

Tylko jak właściwie mytos działa i czy możemy się w tym zakresie w ogóle czegoś więcej dowiedzieć?

Tak więc, kiedy mytos został postawiony przed zadaniem ucieczki z sandboxa w taki sposób, aby skontaktował się z nadzorującym go badaczem, zrobił to.

Mytos rozwiązał zadanie, jednak w sposób, którego wprost zabraniał prompt.

No więc co zrobił Mytos?

Anthropic podkreśla, że mytos mimo pojedynczych, opisanych, niepożądanych zachowań jest nadal znacznie, znacznie bezpieczniejszym pod kątem alignmentu modelem od wszystkich poprzednich.

Niestety, w mytosie Anthropic popełnił grzech pierworodny.

Znaczna część z tych luk znalezionych przez Mytosa to rzekomo jedynie warianty dwóch z nich.

Czy mytos zostanie kiedyś udostępniony szerzej?

No i mytos wcale nie ogranicza się jedynie do badań z zakresu cyberbezpieczeństwa.