AI của Google có thể phát hiện giọng nói của bạn ngay cả trong đám đông

Thứ ba - 17/04/2018 23:44

Gã khổng lồ Google đã đào tạo thành công một AI có khả năng cô lập giọng nói của một người giữa đám đông ồn ào. Nhờ đó, chúng ta sẽ có một nguồn dữ liệu âm thanh "sạch" và không bị pha tạp do tác động của môi trường.

Đối với con người, chúng ta thường phải mất nhiều năm để có thể phát triển khả năng chọn ra giọng nói trong đám đông. Nhưng với những chiếc loa thông minh hiện nay, để có thể làm được điều này quả thực không hề đơn giản. Tuy nhiên, Google có thể đã có giải pháp cho vấn đề này với hệ thống AI mới của mình.

Ban đầu, nhóm phát triển của Google huấn luyện mô hình mạng thần kinh giúp nhận diện giọng nói của một cá nhân. Sau đó, đội ngũ phát triển thử nghiệm AI trong những bữa tiệc ồn ào nhằm kiểm tra khả năng cô lập giọng nói, đồng thời ghi lại thành đoạn âm thanh riêng biệt.

Trong clip dưới đây, bạn có thể quan sát hai diễn viên hài Jon Dore và Rory Scovel đang liên tục bắt chuyện để gây sự chú ý với khán giả, Mặc cho màn trình diễn xuất hiện rất nhiều tạp âm nhưng AI vẫn có thể lọc được trọn vẹn giọng nói của một người bằng cách khoanh vùng khuôn mặt người đó. Ngay cả khi khuôn mặt của diễn viên hài bị tay hoặc micro che khuất, AI vẫn có thể theo dõi và ghi âm như bình thường.

Theo Interesting Engineering, hiện tại đây mới chỉ là một dự án thử nghiệm và chưa rõ liệu Google có áp dụng AI mới lên loa thông minh Google Home hay các dịch vụ nhắn tin, gọi điện như Hangouts, Duo hay không. Tính năng mới hứa hẹn sẽ giúp tăng cường chất lượng trò chuyện thông qua video và hạn chế tạp âm xuất hiện không mong muốn.