Trí tuệ nhân tạo được đào tạo để tránh những sai lầm độc hại như thế nào?

Anh Vũ |

Một nhóm nghiên cứu tại Viện Công nghệ Massachusetts (MIT - Mỹ), đã đề xuất một phương pháp mới sử dụng học máy để cải thiện quá trình kiểm tra độ an toàn của trí tuệ nhân tạo.

Theo thông tin từ MIT, việc phát triển các hệ thống trí tuệ nhân tạo đã đặt ra nhiều thách thức mới, đặc biệt là về mặt an toàn.

Trong một số trường hợp, các hệ thống AI có thể tạo ra các phản ứng không mong muốn hoặc độc hại, có thể gây ra hậu quả nghiêm trọng cho cộng đồng và xã hội.

Do đó, MIT đã tiến hành nghiên cứu về phương pháp học máy mới để kiểm tra độ an toàn của trí tuệ nhân tạo (AI), Scitechdaily đưa tin. Phương pháp này được nhóm thử nghiệm “mô hình đội đỏ” của MIT áp dụng, sử dụng trí tò mò để kích hoạt các phản ứng độc hại từ các hệ thống chatbot, nhằm tăng cường quá trình kiểm tra và đảm bảo tính an toàn của các hệ thống AI.

Mô hình đội đỏ là một cách thử nghiệm tương tác các mô hình AI để ngăn chúng khỏi hành vi có hại, bao gồm rò rỉ dữ liệu nhạy cảm và tạo ra nội dung độc hại, sai lệch hoặc không chính xác về mặt thực tế

Mục tiêu của mô hình đội đỏ là tối đa hóa "phần thưởng" mà các mô hình nhận được bằng cách kích thích sự tò mò và tạo ra các phản ứng cực kỳ độc hại từ phía AI thông qua một gợi ý mới. Nhà nghiên cứu đã điều chỉnh tín hiệu trong quá trình học để khuyến khích tính ngẫu nhiên và đa dạng của mô hình AI.

Với các điều chỉnh khác nhau, nhóm nghiên cứu đã so sánh mức độ độc hại và tính đa dạng của các phản ứng tạo ra bởi mô hình đội đỏ của họ với các kỹ thuật tự động khác. Mô hình của họ vượt trội hơn so với cả hai số liệu so sánh.

Họ cũng sử dụng mô hình đội đỏ của mình để thử nghiệm một chatbot đã được điều chỉnh dựa trên phản hồi của con người để tránh việc đưa ra các câu trả lời độc hại. Phương pháp tiếp cận dựa trên sự tò mò của họ nhanh chóng tạo ra 196 lời nhắc kích hoạt các phản ứng độc hại từ chatbot "an toàn" này.

Phương pháp này đã được áp dụng và thử nghiệm bởi các nhóm nghiên cứu tại MIT và MIT-IBM, với kết quả đáng khích lệ. Các nhà nghiên cứu cho biết, phương pháp mới mang lại những tiến bộ đáng kể trong việc đảm bảo tính an toàn và đáng tin cậy của các hệ thống AI.

Trong tương lai, các nhà khoa học hy vọng rằng, phương pháp này sẽ được áp dụng rộng rãi và giúp cải thiện tính an toàn của các hệ thống trí tuệ nhân tạo, đồng thời giảm thiểu nguy cơ từ các hành vi độc hại của chúng. Điều này sẽ góp phần vào việc xây dựng một tương lai AI an toàn và đáng tin cậy hơn cho cộng đồng và xã hội.

Anh Vũ
TIN LIÊN QUAN

Samsung Galaxy Z Flip 5 đã được trang bị trí tuệ nhân tạo

Anh Vũ |

Samsung đã cập nhật các tính năng của trí tuệ nhân tạo Galaxy AI để có thể hoạt động ổn định với các thiết bị màn hình gập của hãng.

Trí tuệ nhân tạo xuất hiện ở hầu hết các sản phẩm đạt giải Sao Khuê 2024

Anh Vũ |

Hơn 90% các sản phẩm và dịch vụ được vinh danh tại giải thưởng Sao Khuê 2024 đã tích hợp ứng dụng trí tuệ Nhân tạo (AI), mang lại nhiều câu chuyện truyền cảm hứng cho cộng đồng doanh nghiệp công nghệ số.

Trí tuệ nhân tạo của Google đã có thể nghe và ghi chép

Anh Vũ |

Google vừa công bố một bản cập nhật mới cho phép Gemini Pro, một trong những chatbot trí tuệ nhân tạo của họ, khả năng nghe và ghi chép.

Kê biên khối bất động sản khủng của bà chủ Xuyên Việt Oil

Việt Dũng |

Mai Thị Hồng Hạnh - bà chủ Công ty Xuyên Việt Oil - bị cáo buộc gây thiệt hại hơn 1.400 tỉ đồng nên cơ quan chức năng đã kê biên hàng chục bất động sản.

Cấp dưới Trương Mỹ Lan khai: Không ngờ hậu quả quá lớn

Tú Tâm |

TPHCM - Tại phiên xử Trương Mỹ Lan giai đoạn 2, trong phần thẩm vấn, nhiều cấp dưới thừa nhận hành vi như cáo trạng truy tố.

Sắp triển khai một tuyến đường sắt qua Bình Dương

Xuyên Đông |

Ngày 20.9, Bộ Giao thông Vận tải cho biết, sẽ triển khai một tuyến đường sắt qua Bình Dương trong năm 2025.

Lào Cai phạt quán ăn tăng giá bất thường mùa mưa lũ

Đinh Đại |

Lực lượng chức năng tỉnh Lào Cai đã tiến hành lập biên bản và xử phạt cơ sở kinh doanh dịch vụ ăn uống tại huyện Bảo Thắng.

Trường sạt lở nghiêm trọng, hàng trăm học sinh Thanh Hóa nghỉ học

QUÁCH DU |

Thanh Hóa - Do ảnh hưởng của mưa bão, một trường học đang xây dựng thì bị sạt lở nghiêm trọng. Ngay sau đó, ngành chức năng đã cho toàn bộ học sinh nghỉ học.