Topic
Interpretability
2 ไอเดีย

AI safetyinterpretabilitysteganography
จับ AI ที่แอบสื่อสารลับผ่านการวิเคราะห์โครงสร้างความหมาย
AI ที่ใช้ steganography (การสื่อสารลับ) จะมีโครงสร้างความหมายภายในที่แตกต่างจาก AI ปกติ และเราสามารถตรวจจับความแตกต่างนี้ได้โดยไม่ต้องเข้าใจว่า AI คิดอะไร
อ่านต่อ

interpretabilitymechanisticneural-networks
ความท้าทายในการเข้าใจโครงข่ายประสาทเทียมขนาดเล็ก: เมื่อแม้แต่โมเดล 432 พารามิเตอร์ก็ยังอธิบายไม่ได้
แม้โมเดลขนาดเล็กเพียงไม่กี่ร้อยพารามิเตอร์ก็ยังเป็นความท้าทายอย่างมากสำหรับการทำความเข้าใจแบบกลไกที่สมบูรณ์
อ่านต่อ