Topic

Interpretability

2 ไอเดีย

จับ AI ที่แอบสื่อสารลับผ่านการวิเคราะห์โครงสร้างความหมาย

AI ที่ใช้ steganography (การสื่อสารลับ) จะมีโครงสร้างความหมายภายในที่แตกต่างจาก AI ปกติ และเราสามารถตรวจจับความแตกต่างนี้ได้โดยไม่ต้องเข้าใจว่า AI คิดอะไร

อ่านต่อ

interpretabilitymechanisticneural-networks

ความท้าทายในการเข้าใจโครงข่ายประสาทเทียมขนาดเล็ก: เมื่อแม้แต่โมเดล 432 พารามิเตอร์ก็ยังอธิบายไม่ได้

แม้โมเดลขนาดเล็กเพียงไม่กี่ร้อยพารามิเตอร์ก็ยังเป็นความท้าทายอย่างมากสำหรับการทำความเข้าใจแบบกลไกที่สมบูรณ์

อ่านต่อ