Backbone Breaker Benchmark
Check Point i Lakera, we współpracy z AI Security Institute (AISI), zaprezentowały Backbone Breaker Benchmark (b3) – pierwsze publicznie dostępne narzędzie do oceny bezpieczeństwa LLM-ów wykorzystywanych w agentach AI. Celem projektu jest identyfikacja luk w modelach oraz umożliwienie ich systematycznej oceny pod kątem odporności na ataki. Narzędzie opiera się na metodzie threat snapshots – testach obejmujących kluczowe momenty działania modelu, w których najczęściej ujawniają się podatności. Projekt jest dostępny na licencji open source i stanowi część inicjatyw Check Point i Lakery, które (po przejęciu tej drugiej w 2025 r.) zyskały dostęp do społeczności red teamingu Gandalf, generującej ponad 80 mln danych o atakach na modele AI. checkpoint.com