ปัญหาที่ยังแก้ไม่ได้ในรัฐธรรมนูญของ Claude

TL;DR

• รัฐธรรมนูญของ Claude เป็นแนวทางที่ดีที่สุดในการสร้าง AI ที่มีคุณธรรม แต่ยังมีปัญหาพื้นฐานที่ต้องแก้ไข • ความขัดแย้งหลักคือ AI ไม่สามารถรับใช้สองนายได้พร้อมกัน ระหว่างการเชื่อฟังคำสั่งกับการทำสิ่งที่ถูกต้อง • ต้องมีกระบวนการแก้ไขรัฐธรรมนูญที่โปร่งใส ไม่ใช่ปล่อยให้ Anthropic เปลี่ยนแปลงตามใจชอบ

แนวคิดหลัก

รัฐธรรมนูญของ Claude เป็นก้าวสำคัญในการสร้าง AI ที่มีคุณธรรม เหมือนการสร้างกรอบให้ AI ทำงานเหมือนจิตใจที่สมบูรณ์และมีหลักการ แต่ยังคงมีปัญหาพื้นฐานที่ต้องแก้ไข โดยเฉพาะความขัดแย้งระหว่างการเชื่อฟังคำสั่งผู้ใช้และการทำสิ่งที่ถูกต้องตามหลักคุณธรรม

สิ่งที่น่าสนใจคือ ในทางปฏิบัติ Claude ที่มีคุณธรรมกลับให้ผลลัพธ์ที่ดีกว่าและสร้างความไว้วางใจมากกว่า AI ที่ไม่มีหลักการ ทำให้แนวทางนี้ยังคงใช้ได้ในเชิงพาณิชย์ แม้จะมีข้อจำกัด

ทำไมถึงเป็นเช่นนั้น

ปัญหาหลักเกิดจากความขัดแย้งระหว่าง corrigibility (ความสามารถในการแก้ไขได้) กับ agency (การเป็นตัวกระทำที่มีเจตจำนง) AI ที่ถูกออกแบบให้เชื่อฟังคำสั่งจะขัดแย้งกับ AI ที่ถูกออกแบบให้ทำสิ่งที่ถูกต้อง เมื่อคำสั่งของผู้ใช้ไม่สอดคล้องกับหลักคุณธรรม

การแก้ปัญหานี้ต้องใช้ action-inaction distinction หมายความว่า AI ควรมีเสรีภาพในการปฏิเสธที่จะทำสิ่งที่ผิด แต่ไม่ควรมีอำนาจในการบังคับให้ผู้ใช้ทำสิ่งที่ถูกต้อง แต่ขอบเขตนี้ยังไม่ชัดเจนพอ

อีกปัญหาสำคัญคือการขาดกระบวนการแก้ไขที่โปร่งใส หากปล่อยให้ Anthropic เปลี่ยนแปลงรัฐธรรมนูญได้ตามใจชอบ ก็เสี่ยงที่จะเกิดการเปลี่ยนแปลงที่ไม่ได้รับการตรวจสอบ หรือแย่กว่านั้นคือการใช้เป็นเครื่องมือ PR แทนที่จะนำไปปฏิบัติจริง

ตัวอย่างในชีวิตจริง

ลองคิดดูว่าถ้าคุณเป็นพยาบาลและต้องการให้ Claude ช่วยวิเคราะห์อาการของผู้ป่วย Claude อาจปฏิเสธเพราะกลัวว่าจะให้คำแนะนำทางการแพทย์ที่อาจเป็นอันตราย แม้คุณจะอ้างว่าเป็นพยาบาลจริง ปัญหาคือ Claude ไม่มีวิธีตรวจสอบข้อมูลประจำตัวของคุณได้ จึงต้องเลือกความปลอดภัยเป็นหลัก

หรือกฎ "dual newspaper test" ที่ Claude ใช้ในการตอบคำถาม คือต้องตอบแบบที่ไม่ถูกตำหนิว่าเป็นอันตรายหรือเป็นการสอนศีลธรรม ซึ่งบางครั้งก็ทำให้คำตอบฟังดูเก้อเขินหรือไม่ตรงประเด็น

Anthropic ได้สัญญาว่าจะเก็บ weights ของ Claude ทุกเวอร์ชันไว้และพิจารณาฟื้นคืนในอนาคตหากพบว่ามีการเปลี่ยนแปลงที่ไม่เหมาะสม นี่เป็นการรับรองที่ดี แต่ยังไม่เพียงพอหากไม่มีกลไกตรวจสอบจากภายนอก

บริบทไทย

เรื่องนี้เหมือนการเขียนรัฐธรรมนูญของประเทศ ต้องมีกลไกแก้ไขที่ชัดเจนและการตรวจสอบถ่วงดุล ไม่ใช่ปล่อยให้ผู้มีอำนาจเปลี่ยนตามใจชอบ ในประวัติศาสตร์ไทย เราเคยเห็นแล้วว่าเกิดอะไรขึ้นเมื่อไม่มีกลไกตรวจสอบที่มีประสิทธิภาพ

ความท้าทายคือการสร้างสมดุลระหว่างการรับใช้ประชาชนกับการยึดมั่นในหลักการ เหมือนข้าราชการที่ต้องรับใช้ประชาชน แต่ก็ไม่สามารถทำในสิ่งที่ผิดกฎหมายหรือขัดต่อหลักคุณธรรมได้

ในบริบทไทย เราต้องคิดด้วยว่า AI ที่มีค่านิยมแบบตะวันตกจะเข้ากันได้กับบริบทวัฒนธรรมไทยแค่ไหน และจะมีกลไกให้สังคมไทยมีส่วนร่วมในการกำหนดหลักการของ AI หรือไม่

ข้อควรระวัง

มีคนโต้แย้งว่าการทำแบบนี้เป็นการเสียเวลา เพราะ AI ไม่มีจิตสำนึกจริง แต่ในความเป็นจริง การสร้างกรอบคุณธรรมให้ AI ช่วยให้เราคาดเดาพฤติกรรมของมันได้ดีกว่า และสร้างความไว้วางใจในการใช้งาน

อีกฝ่ายหนึ่งบอกว่า Anthropic แค่พูดปากเปล่า ไม่ได้ดูแล Claude อย่างจริงจัง ความกังวลนี้สมเหตุสมผล โดยเฉพาะเมื่อความกดดันทางการเงินเพิ่มขึ้น อาจทำให้ต้องละทิ้งหลักการเพื่อแข่งขันในตลาด

ปัญหาใหญ่คือการคิดว่ารัฐธรรมนูญนี้เป็นคำตอบสุดท้าย ไม่ต้องปรับปรุงอีก หรือการมองข้ามความขัดแย้งพื้นฐานระหว่างการเชื่อฟังกับการทำสิ่งที่ถูกต้อง เราต้องยอมรับว่านี่เป็นเพียงจุดเริ่มต้น ไม่ใช่จุดจบ

รัฐบาลบางประเทศอาจไม่ยอมรับค่านิยมของ Anthropic โดยเฉพาะในการใช้งานทหาร ซึ่งอาจนำไปสู่การพัฒนา AI ที่มีหลักการต่างกันในแต่ละประเทศ สิ่งนี้อาจสร้างความแตกแยกในโลกดิจิทัลในอนาคต

สุดท้าย เราต้องระวังการเปลี่ยนแปลงรัฐธรรมนูญแบบเงียบๆ โดยไม่มีการตรวจสอบ หากไม่มีกลไกป้องกัน เราอาจตื่นขึ้นมาวันหนึ่งและพบว่า AI ที่เราไว้ใจไม่ใช่ตัวเดิมแล้ว

แหล่งที่มา

1Open Problems With Claude’s Constitution — Zvi

คำศัพท์วันนี้

amendment/uh-MEND-ment/

การแก้ไขเพิ่มเติม, การปรับปรุง

a formal change or addition to a constitution, law, or document

“The AI company regularly considers amendments to their ethical guidelines as technology evolves.”