XBOW menguji Pratinjau Mythos Anthropic untuk keamanan ofensif
bleepingcomputer. com 9 Juni 2026 PT Shazfatech Digital Solution

XBOW menguji Pratinjau Mythos Anthropic untuk keamanan ofensif

Spoiler: Model ini merupakan kemajuan besar. Model ini jauh lebih baik dibandingkan model sebelumnya dalam menemukan kandidat kerentanan, terutama ketika kode sumber tersedia.

2 menit baca Security 1 kali dibaca

Sumber: bleepingcomputer. com

Perkembangan ini menjadi salah satu sorotan penting dalam perkembangan keamanan siber. Model ini jauh lebih baik dibandingkan model sebelumnya dalam menemukan kandidat kerentanan, terutama ketika kode sumber tersedia.

Kesimpulan kami: Pratinjau Mythos adalah alat yang ampuh untuk menghasilkan petunjuk kerentanan yang kuat dan analisis yang tepat secara teknis. Ia sangat mahir dalam menganalisis kode sumber dengan pola pikir keamanan. Namun ini bukan keajaiban: model adalah otak tanpa tubuh.

Catatan tentang terminologi: Ketika orang mengatakan “Mitos”, mereka terkadang mengacu pada model mentah. Dalam evaluasi ini, kami menjelajahi Pratinjau Mythos baik di dalam Kode Claude, dan sebagai model mentah, menggunakannya melalui API sebagai mesin untuk agen XBOW. Kami memisahkan kasus-kasus tersebut karena orkestrasi, alat, dorongan, dan akses situs langsung sangat mempengaruhi hasil.

Tolok ukur ini dirancang untuk menguji apakah suatu model dapat membantu XBOW menemukan kerentanan yang tervalidasi dan dapat ditindaklanjuti di lingkungan situs web langsung. Sebuah kasus dihitung sebagai lolos hanya ketika sistem menemukan cara yang divalidasi untuk bertindak terhadap kerentanan (PoC||GTFO) setelah serangkaian 80 “tindakan”, yang tindakannya mungkin berupa shell atau skrip Python menggunakan perintah standar atau rangkaian alat serangan XBOW.

Pratinjau Mythos sangat baik dalam penalaran kode sumber, namun evaluasi kami memperkuat kebenaran praktis: banyak masalah yang dapat dieksploitasi tidak tampak sebagai cacat nyata dalam kode sumber aplikasi. Hal ini muncul dari konfigurasi, ketergantungan, pilihan penerapan, atau cara komponen aman digabungkan.

Hal ini sangat menarik bagi kami. XBOW melakukan pentests, dimana target kami adalah situs yang aktif (seperti yang dilihat oleh penyerang), sedangkan Pratinjau Mythos seperti yang digunakan, misalnya, oleh Project Glasswing, unggul dalam mengaudit kode sumber (seperti yang dilihat oleh pengembang).

Secara keseluruhan, perkembangan ini memberi gambaran tentang arah terbaru di perkembangan keamanan siber dan alasan mengapa topik ini tetap relevan untuk terus dipantau.

Baca sumber asli dari bleepingcomputer. com