“Đáng sợ” với công nghệ AI dựng lại khuôn mặt chính xác chỉ từ giọng nói
Chỉ bằng giọng nói của một người, công nghệ AI hiện nay đã đủ khả năng tái tạo lại chân dung của họ một cách chính xác.
Được phát triển bởi các nhà khoa học tại Học viện Công nghệ Massachusetts (MIT-Mỹ), thuật toán AI mang tên Speech2Face đã làm nên điều không tưởng khi chỉ cần dùng một đoạn ghi âm ngắn để tái tạo lại chân dung người nói. Đây là thuật toán AI được giới thiệu lần đầu vào năm 2019.
Đầu tiên, các nhà nghiên cứu sử dụng hàng triệu video từ YouTube và internet lúc mọi người đang nói chuyện để tạo nên một mạng neuron nhân tạo học sâu.
Trải qua quá trình đào tạo, AI đã học được mối tương quan giữa âm thanh của giọng nói và đặc điểm khuôn mặt người nói. Từ những mối tương quan đó, công nghệ thuật toán AI đã đưa ra phỏng đoán gần như chính xác về giới tính, độ tuổi, dân tộc và quốc tịch của người nói.
Để phân tích về độ chính xác công nghệ tái tạo khuôn mặt bằng giọng nói của AI, các nhà khoa học đã xây dựng “bộ giải mã khuôn mặt”. Đây là bộ giải mã giúp tái tạo tiêu chuẩn khuôn mặt của một người từ ảnh tĩnh của chính họ khi đã bỏ qua biến thể không liên quan như: tư thế chụp ảnh, ánh sáng,… Điều bất ngờ là “gương mặt tiêu chuẩn” và kết quả tái tạo gương mặt của AI từ giọng nói có sự “giống nhau đến đáng sợ” trong nhiều trường hợp nghiên cứu từ độ tuổi, dân tộc và giới tính.
Theo các nhà khoa học, công nghệ AI tái tạo khuôn mặt từ giọng nói có thể sử dụng cho thiết bị gia đình, trợ lý ảo. Đồng thời, đây cũng là một công nghệ tuyệt vời giúp cơ quan chức năng tái tạo chân dung kẻ tình nghi khi chỉ có bằng chứng duy nhất là giọng nói của người đó. Dĩ nhiên, việc ứng dụng công nghệ này sẽ gây nhiều tranh cãi liên quan đến quyền riêng tư của con người.
Winter (Nhóm truyền thông Tây nguyên)