Mentionsy

Mateusz Chrobok

12.04.2026 00:00

Bezpieczeństwo znów staje się tajemnicą

🦋 Projekt Glasswing to nowy produkt Anthropica, który dostępny jest - ze względów bezpieczeństwa - praktycznie jedynie dla największych światowych korporacji. Nie ma jednak - przynajmniej oficjalnie - zagrażać całej ludzkości, a jest po prostu odpowiedzią na ostatnie, dynamiczne zmiany na rynku podatności w oprogramowaniu. Czy tak jest w rzeczywistości? Linki: 🦋 Project Glasswing https://www.anthropic.com/glasswing

⏰ From Vulnerability to Exploitation https://zerodayclock.com/

🔍 Assessing Claude Mythos Preview’s cybersecurity capabilities https://red.anthropic.com/2026/mythos-preview/

🧾 System Card: Claude Mythos Preview https://www-cdn.anthropic.com/08ab9158070959f88f296514c21b7facce6f52bc.pdf

🐦 Zvi Mowshowitz: Claude Mythos is different https://x.com/TheZvi/status/2042356147043406066

❌ Zvi Mowshowitz: The Most Forbidden Technique https://thezvi.substack.com/p/the-most-forbidden-technique

⛔️ Alignment Risk Update: Claude Mythos Preview https://www-cdn.anthropic.com/79c2d46d997783b9d2fb3241de43218158e5f25c.pdf

🐮 Self-Consuming Generative Models Go MAD https://arxiv.org/abs/2307.01850

👌 Evaluating and mitigating the growing risk of LLM-discovered 0-days https://red.anthropic.com/2026/zero-days/

🐦 gum on Twitter https://x.com/gum1h0x/status/2041917868158202022

🐦 Stanislav Fort on Twitter https://x.com/stanislavfort/status/2041922370206654879

🐦 Dawid Moczadło on Twitter https://x.com/kannthu1/status/2042695741844619502 © Wszystkie znaki handlowe należą do ich prawowitych właścicieli. ❤️ Dziękuję za Waszą uwagę. Znajdziecie mnie również na: Instagramie @mateuszemsi https://www.instagram.com/mateuszemsi/ Twixxerze @MateuszChrobok https://twitter.com/MateuszChrobok Mastodonie https://infosec.exchange/@mateuszchrobok LinkedInie @mateuszchrobok https://www.linkedin.com/in/mateuszchrobok/ Patronite https://patronite.pl/MateuszChrobok Rozdziały: Intro Podatności Strach Karta Grzech Kontra Plany Co Robić i Jak Żyć? #ai #cyberbezpieczeństwo #Anthropic #Mythos #Claude

Anthropic mytos Glasswing Anthropica AI Mythos Anthropica Mytosa Google Habsburgizacji Metosa Microsoft Mythosa Narażałoby Opusa

Rozdziały (8)

1. Intro

2. Podatności

3. Strach

4. Karta

5. Grzech

6. Kontra

7. Plany

8. Co Robić i Jak Żyć?

Szukaj w treści odcinka

Znaleziono 13 wyników dla "mytos"

Tam, gdzie zawsze brakowało czasu, pieniędzy i kompetentnych rąk do pracy, czyli w kwestii dogłębnego, mozolnego analizowania podatności, mytos nigdy się nie nudzi i działa wielokrotnie szybciej niż jakikolwiek człowiek.

Mytos widzi więcej, wie więcej i tak to jest mniej więcej.

Nie chodzi tu nawet o mytos, ale po prostu coś podobnego, stworzonego niezależnie na jego wzór przez naszych adwersarzy.

Stąd dostęp do mytosa, w jakiejś formie uzyskałej firmy i organizacje dostarczające szeroko wykorzystywane, krytyczne oprogramowanie.

Tylko jak właściwie mytos działa i czy możemy się w tym zakresie w ogóle czegoś więcej dowiedzieć?

Tak więc, kiedy mytos został postawiony przed zadaniem ucieczki z sandboxa w taki sposób, aby skontaktował się z nadzorującym go badaczem, zrobił to.

Mytos rozwiązał zadanie, jednak w sposób, którego wprost zabraniał prompt.

No więc co zrobił Mytos?

Anthropic podkreśla, że mytos mimo pojedynczych, opisanych, niepożądanych zachowań jest nadal znacznie, znacznie bezpieczniejszym pod kątem alignmentu modelem od wszystkich poprzednich.

Niestety, w mytosie Anthropic popełnił grzech pierworodny.

Znaczna część z tych luk znalezionych przez Mytosa to rzekomo jedynie warianty dwóch z nich.

Czy mytos zostanie kiedyś udostępniony szerzej?

No i mytos wcale nie ogranicza się jedynie do badań z zakresu cyberbezpieczeństwa.

Transkrypcja generowana automatycznie i niesprawdzana ręcznie — może zawierać błędy.

Ostatnie odcinki

Gdy coś kwacze jak kaczka…
19.07.2026 16:00
Twoja wtyczka AI w Chrome wie więcej, niż myślisz
12.07.2026 16:00
Kto jeszcze patrzy, gdy śpisz?
05.07.2026 11:53
Nikt nie jest odporny na dezinformację — nawet ...
01.07.2026 16:00
Jesteś administratorem Fortigate? Współczuję. S...
28.06.2026 16:00
Jak naprawdę zarabiać na AI?
21.06.2026 12:00
macOS Cię okłamuje
21.06.2026 10:00
Czy Mythos już na zawsze zmieni świat?
21.06.2026 09:00
To już nie są halucynacje. Dlaczego AI tak napr...
21.06.2026 07:42
Kolejna wpadka VPNów? Nie do końca.
24.05.2026 16:00