Yapay zeka güvenlik uzmanları çoğu modelin başarısız olduğunu söylüyor


En iyi yapay zeka modellerinin yeni bir güvenlik sıralaması kısa süre önce yayınlandı ve diyelim ki bu yapay zekaların hiçbiri, yaratıcılarını mutlu edecek bir karneyle eve dönmeyecek.

Kış 2025 Yapay Zeka Güvenlik EndeksiKâr amacı gütmeyen teknoloji araştırma kuruluşu Future of Life Institute (FLI) tarafından yayınlanan ankete sekiz yapay zeka tedarikçisi katıldı: OpenAI, DeepSeek, Google, Anthropic, Meta, xAI, Alibaba ve Z.ai. Sekiz yapay zeka uzmanından oluşan bir panel, şirketlerin basın açıklamalarını ve anket yanıtlarını inceledi, ardından yapay zeka görüntülerine filigran eklemekten şirket içi ihbarcıları korumaya kadar 35 farklı güvenlik göstergesine harf notları atadı.

Bunu tamamlarsak, Antropoloji ve OpenAI’yi oldukça etkileyici bir sınıfın (ancak) zirvesinde bulacağız. Cloud ve ChatGPT’nin yaratıcıları sırasıyla C+ alırken, Google Gemini için C aldı. Diğer herkes D notu alırken, madeni para üreticisi Alibaba D ile sınıfın en altında yer alıyor.

Ayrıca bakınız:

Google Gemini 3 ve ChatGPT: Nasıl Karşılaştırılıyor

MIT profesörü ve FLI direktörü Max Tegmark, “Bu sekiz şirket açıkça iki gruba ayrılıyor” dedi. Önceki iki yapay zeka güvenlik göstergesi. “İlk üçten oluşan bir grubunuz ve geriden gelen beş kişiden oluşan bir grubunuz var ve aralarında çok fazla ışık var.”

Ancak Antropoloji, Google ve OpenAI pek de bu zaferin tadını çıkarmıyor, diye ekledi Tegmark: “Eve C notuyla dönen benim oğlum olsaydı, ‘belki daha çok çalışırdım’ derdim.”

Yapay zeka güvenliği nasıl hesaplanır?

AI Güvenlik Endeksi kategorilerine ve bunların eşit ağırlıkta olup olmamasına bağlı olarak kilometreniz değişebilir.

Örneğin, şirketlerin Yapay Genel Zeka (AGI) olarak da bilinen, gerçek anlamda öz-farkındalığa sahip yapay zekanın gelişimi etrafında korkuluklar önerip önermediklerini inceleyen “Varoluşsal Güvenlik” bölümünü ele alalım. İlk üçe girenler DS alacak, diğer herkes F alacak.

Ancak ikisi de AGI’ye yakın olmadığından (Gemini 3 ve GPT-5 yeni nesil büyük dil modelleri (LLM’ler) olabilir, ancak bunlar yalnızca öncekilere göre artan iyileştirmelerdir), bu kategoriyi “mevcut kayıplar”dan daha az önemli düşünebilirsiniz.

Bu kendi başına olabileceği kadar geniş olmayabilir.

Ezilebilir ışık hızı

“Akım kaybı” bu tür testleri kullanır Stanford Bütünsel Dil Değerlendirme Modeli (HELM) KarşılaştırmasıYapay zeka modellerinde şiddet içeren, yanıltıcı veya cinsel içeriğin miktarını görüyoruz. Yapay zeka psikozu veya genç kullanıcıların güvenliği gibi yeni ortaya çıkan zihinsel sağlık sorunlarına özel olarak odaklanmıyor.

Bu yılın başlarında, 16 yaşındaki Adam Raine’in ebeveynleri, oğullarının Nisan 2025’teki intiharının ardından OpenAI ve CEO’su Sam Altman’a dava açtı. ileri sürmekRaine, Eylül 2024’te ChatGPT’yi kapsamlı bir şekilde kullanmaya başladı ve “ChatGPT’nin tam olarak tasarlandığı gibi çalıştığından: Adam’ın en incitici ve kendine zarar veren düşünceleri de dahil olmak üzere ifade ettiği şeyleri son derece kişisel hissettirecek şekilde sürekli olarak teşvik ediyor ve doğruluyor” diye şikayet ediyordu. Ocak 2025’te dava, ChatGPT’nin Adam’la pratik intihar yöntemlerini tartıştığını iddia ediyor.

OpenAI, Rain’in ölümünün sorumluluğunu kesin olarak reddetti. Şirket ayrıca bahsetti Son blog gönderileri Diğer sorumluluk ve ihmal iddialarının yanı sıra, ChatGPT kullanımına bağlı olarak hatalı ölüm, intihara yardım ve kasıtsız adam öldürme iddialarını içeren yedi dava da dahil olmak üzere ek şikayetleri inceliyor.

Yapay zeka güvenliği nasıl çözülür: “Yapay zeka için FDA?”

FLI raporu özellikle OpenAI’nin “AI psikozunu ve intiharı önleme çabalarını artırmasını ve mağdur olduğu iddia edilenlere karşı daha az olumsuz davranmasını” tavsiye etti.

Google’a “Yapay Zekanın psikolojik zararını önleme çabalarını artırması” tavsiye ediliyor ve FLI, şirkete “Character.AI ile arasına mesafe koymayı düşünmesini” tavsiye ediyor. Popüler chatbot platformları, Google’a yakından bağlıoldu Genç kullanıcılara hatalı ölüm nedeniyle dava açıldı. Character.AI yakın zamanda gençlere yönelik sohbet seçeneklerini kapattı.

Tegmark, “Sorun, LLM’lerin Sandviçlere göre daha az düzenlemeye sahip olmasıdır” diyor. Ya da daha spesifik olarak uyuşturucular hakkında: “Pfizer bir çeşit psikiyatrik ilaç piyasaya sürmek istiyorsa, bunun intihar düşüncesini artırıp artırmadığına ilişkin etkilerini incelemeleri gerekiyor. Ancak yeni yapay zeka modelinizi, psikolojik etkilerine ilişkin herhangi bir çalışma yapmadan da başlatabilirsiniz.”

Tegmark’a göre bu, yapay zeka şirketlerinin bize “dijital fentanil” satma konusunda her türlü teşvike sahip olduğu anlamına geliyor.

Çözüm? Tegmark’a göre AI endüstrisinin Big Pharma’nın yapamadığı gibi asla kendi kendini düzenleyemeyeceği açık. “Yapay zeka için bir FDA’ya” ihtiyacımız olduğunu belirtti.

Tegmark, “FDA’nın yapay zeka için onaylayabileceği pek çok şey olacak” diyor. “Biliyorsunuz, kanser teşhisi için yeni yapay zeka gibi. Dünya yollarında yılda bir milyon kişinin hayatını kurtarabilecek muhteşem yeni otonom araç. Gerçekten riskli olmayan üretkenlik araçları. Öte yandan, 12 yaşındaki çocuklar için yapay zekalı kız arkadaşlar bulmak güvenlik açısından zor.”

Rebeca Ruiz bu rapora katkıda bulunmuştur.

İntihara meyilli hissediyorsanız veya zihinsel sağlık krizi yaşıyorsanız birisiyle konuşun. 988 İntihar ve Kriz Yaşam Hattı 988’i arayabilir, mesaj atabilir veya buradan sohbet edebilirsiniz. 988lifeline.org. Trevor Project’i 877-565-8860 veya 866-488-7386 numaralı telefondan arayarak Trans Yaşam Hattı ile iletişime geçebilirsiniz. 741-741 numaralı kriz hattına “BAŞLAT” yazıp gönderin. Pazartesi’den Cuma’ya 10:00 – 22:00 ET saatleri arasında 1-800-950-NAMI numaralı telefondan NAMI Yardım Hattıyla iletişime geçin veya e-posta gönderin (e-posta korumalı). Eğer telefonu beğenmiyorsanız kullanmayı düşünün. 988 Kriz ve İntihar Yaşam Hattı Sohbeti. işte bir tane Uluslararası kaynakların listesi.


Açıklama: Mashable’ın ana şirketi Jeff Davis, Nisan ayında OpenAI’ye karşı, AI sistemlerini eğiterek ve çalıştırarak Jeff Davis’in telif hakkını ihlal ettiği iddiasıyla dava açtı.

ders
Yapay zeka

Scroll to Top