Przez lata największym problemem bezpieczeństwa było znajdowanie podatności. Dziś okazuje się, że to coś zupełnie innego – tempo ich naprawiania.

Bardzo dobrze pokazuje to projekt Glasswing od Anthropic. Firma ujawniła, że ich model AI o nazwie Claude Mythos pomógł wykryć ponad 10 tysięcy podatności o wysokim lub krytycznym poziomie zagrożenia w powszechnie używanym oprogramowaniu.

AI zaczyna działać szybciej niż proces patchowania

Według informacji opublikowanych przez Anthropic projekt objął około 50 partnerów i ponad tysiąc projektów open source. Model miał analizować kod, wyszukiwać potencjalne błędy i pomagać w ich walidacji. W rezultacie ponad 6200 podatności zostało sklasyfikowanych jako high lub critical severity, a ponad tysiąc uznano za prawdziwe, potwierdzone podatności.

Pokazuje to bardzo istotną zmianę. Jeszcze kilka lat temu znalezienie krytycznego błędu wymagało dużego doświadczenia, czasu i analizy manualnej. Dziś modele AI wykonują część tej pracy masowo i praktycznie bez przerwy. Problem polega na tym, że organizacje nadal łatają podatności zasobami ludzkimi, według wszelkich procedur zachowania ostrożności i wysokiej dostępności. Takie tempo może okazać się wkrótce zbyt wolne.

Wyszukiwanie podatności nabiera skali

Największą zmianą nie jest nawet jakość wykrywanych podatności, ale ich liczba. Jeśli AI potrafi analizować tysiące projektów równolegle, klasyczny model bezpieczeństwa zaczyna się powoli załamywać. Wąskim gardłem przestaje być odkrywanie nowych błędów, a rolę tę przejmują:

  • triage,
  • analiza wpływu,
  • przygotowanie patcha,
  • testowanie kompatybilności,
  • deployment fiksów.

I właśnie to coraz częściej podkreślają sami researcherzy. Znalezienie błędu staje się prostsze niż jego bezpieczne naprawienie.

Poniżej schemat ostatniego działania projektu GlassWing:

AI nie szuka już tylko prostych bugów

Wokół takich projektów często pojawia się argument, że AI znajduje głównie noise albo mało istotne problemy. Na przykładzie opisywanej iteracji GlassWing możemy stwierdzić, że nie jest to prawda. Według wcześniejszych materiałów dotyczących Claude Mythos model potrafił identyfikować błędy w systemach operacyjnych, przeglądarkach i bibliotekach kryptograficznych, w tym podatności mające kilkanaście albo nawet kilkadziesiąt lat.

Pojawiły się również informacje o analizie exploit chainów i automatycznym łączeniu kilku podatności w jeden scenariusz ataku. Jest to coraz ciekawsze, bo jeśli AI zaczyna rozumieć zależności między podatnościami, przestaje być tylko „skanerem”. Zaczyna przypominać autonomicznego członka zespołu bezpieczeństwa.

Offensive AI to już nie teoria

Największy problem z modelami takimi jak Claude Mythos polega na tym, że capability działa w obie strony. To samo AI, które pomaga znaleźć i załatać podatność, może potencjalnie zostać użyte do budowy exploitów albo automatyzacji researchu offensive security. I właśnie dlatego Anthropic nie udostępnił modelu publicznie.

Coraz więcej ekspertów zwraca uwagę, że największym problemem nie jest samo AI, ale koszt użycia takich możliwości. Jeszcze niedawno zaawansowany vulnerability research wymagał dużego zespołu specjalistów. Teraz część tego procesu zaczyna być automatyzowana. To oznacza obniżenie progu wejścia.

Cała sytuacja szczególnie mocno dotyka projektów open source. Wiele krytycznych komponentów Internetu jest utrzymywanych przez bardzo małe zespoły albo pojedynczych maintainerów. Jeśli AI zacznie generować tysiące nowych zgłoszeń bezpieczeństwa miesięcznie, takie projekty zwyczajnie mogą nie nadążyć z analizą i patchowaniem. I właśnie dlatego część ekspertów zaczyna mówić o nowym rodzaju technical debtsecurity debt generowanym przez AI-assisted vulnerability discovery. W takim modelu nie chodzi już tylko o brak wiedzy o podatnościach.
Chodzi o brak możliwości ich szybkiego usunięcia.

Podsumowanie

Najbardziej niepokojące jest to, że obecne modele to prawdopodobnie dopiero początek.

Już dziś AI potrafi analizować kod szybciej niż człowiek. W kolejnych latach modele prawdopodobnie będą coraz lepiej rozumiały:

  • zależności między komponentami,
  • błędy i luki w pamięci,
  • łańcuchy ataków (zależności),
  • logikę aplikacji,
  • mechanizmy sandbox escape.

…a wtedy różnica między skanerem podatności a autonomicznym offensive research agentem zacznie się bardzo szybko zacierać.

Projekt GlassWing i Claude Mythos pokazują bardzo wyraźnie, że cyberbezpieczeństwo wchodzi właśnie w nową erę. Erę, w której problemem przestaje być znalezienie podatności. Problemem staje się skala. Bo jeśli AI potrafi znajdować błędy szybciej, niż ludzie są w stanie je naprawiać, cały obecny model patch managementu może przestać działać. Zapewne dotyczy to praktycznie każdej branży, w której AI zaczyna odgrywać kluczową rolę. Tempo wzrostu produktywności i skala też mogą być destrukcyjne.