Tại sự kiện I/O 2018, Google đã giới thiệu một dự án rất thú vị: trợ lý ảo tên Duplex có khả năng... gọi điện thoại và lên lịch hẹn cho người dùng với cách nói chuyện không khác gì người thật.

Nếu đã xem qua màn demo này, hẳn bạn vẫn còn nhớ một màn hình rộng đến 18 mét xuất hiện trên sân khấu, hiển thị một thứ trông giống Google Assistant đang gọi điện đến một tiệm làm tóc và lên lịch hẹn. Tuy nhiên, điều khiến màn trình diễn này trở nên đặc biệt là trợ lý ảo này nói chuyện với ngữ điệu như người thật, cũng có những quãng ngắt, những tiếng "ừm" và "à", và nhiều điệu bộ giọng nói khác mà chúng ta chỉ có thể thấy khi hai con người nói chuyện với nhau. Nhân viên tiệm làm tóc có vẻ cũng chẳng hề biết mình đang nói chuyện với một chiếc máy tính bởi nó chẳng có vẻ gì là giống một chiếc máy tính cả. Một chút cũng không.

Đoạn demo nói trên quả thực rất tuyệt vời (và có phần hơi ám ảnh). Nhưng cụ thể thì Duplex là gì? Nó hoạt động ra sao? Hãy cùng tìm hiểu với bài tổng hợp của AndroidCentral.

Google Duplex là gì?

Đó là một công cụ mới từ Google, với mục đích sử dụng trí tuệ nhân tạo (AI) để "thực hiện các tác vụ đời thực thông qua điện thoại". Hiện tại, các tác vụ mà Duplex có thể làm được là các tác vụ rất cụ thể như đặt lịch hẹn chẳng hạn, nhưng công nghệ này đang được phát triển để mở rộng sang các lĩnh vực khác. Việc chi ra hàng tỷ USD để tạo ra một công cụ khá thú vị có chức năng đặt chỗ nhà hàng có thể là "chuyện thường ngày ở huyện" đối với Google, nhưng rõ ràng tiêu tiền hay thời gian vào một thứ như vậy chẳng xứng đáng là bao.

Duplex còn hơn cả những gì chúng ta thấy trong demo, và nếu nó được chính thức tung ra thị trường, Duplex cũng sẽ phức tạp hơn rất nhiều những gì chúng ta thấy hay nghe quảng cáo về nó. Đằng sau công cụ này là những ngân hàng dữ liệu khổng lồ cùng những cỗ máy để xử lý, mà quá trình xử lý này tất nhiên không hấp dẫn như kết quả cuối cùng, nhưng chúng lại tối quan trọng bởi việc làm một chiếc máy tính nói và nghĩ trong thời gian thực hệt như một con người là cực kỳ khó.

Chẳng phải nó chỉ là một hình thức biến lời nói thành văn bản sao?

Không. Gần như vậy cũng không. Và đó là lý do tại sao nó là một bước đột phá.

Mục tiêu của Duplex là làm mọi thứ nghe có vẻ tự nhiên và giúp Assistant tốc biến để tìm thời gian đặt lịch hẹn hợp lý. Nếu Joe nói, "Yeah, về việc đó - tôi không mở tiệm trước 10 giờ, vậy có ok không?", thì Assistant cần hiểu Joe đang nói gì, phân tích ra ý nghĩa của câu nói đó, và suy nghĩ xem những thứ Joe cung cấp có phù hợp với bạn hay không. Nếu bạn đang bận chạy loanh quanh lúc 10 giờ và mất 40 phút mới lái xe tới garage của Joe, Assistant cần phải phân tích ra điều đó và chốt lịch vào lúc 11h15!

Quan trọng hơn, Duplex phải trả lời sao cho nó giống như một người thật đang nói. Google cho biết họ muốn người ở đầu dây bên kia không biết mình đang nói chuyện với một chiếc máy tính, dù cuối cùng vẫn quyết định tốt nhất nên thông báo cho họ biết điều đó. Khi chúng ta nói chuyện với mọi người, chúng ta nói nhanh hơn và không quá trang trọng so với khi chúng ta nói với Assistant trên điện thoại. Duplex cần hiểu điều này và tái tạo lại cách nói đó khi nó trả lời người kia.

Cuối cùng, và ấn tượng nhất, là Duplex cần phải hiểu được bối cảnh."Thứ sáu", "Thứ sáu tới", và "Thứ sáu tuần sau nữa" đều là những khái niệm mà chúng ta dễ dàng hiểu được. Duplex cũng cần hiểu chúng. Nếu chúng ta nói theo cùng cách chúng ta gõ thì chẳng có vấn đề gì, nhưng mà...ờ thì....bạn biết đấy chúng ta không làm thế vì nghe có vẻ...có vẻ cứng nhắc quá...đúng đấy, không phải kiểu như khó hiểu vì chúng ta nghe mãi và quen rồi nên chẳng có vấn đề gì...ờ...để hiểu được nó hay sao đó....

Bạn có hiểu tôi đang nói gì không vậy? Duplex cần phải hiểu được khi người ta nói chuyện theo phong cách như vậy.

Duplex hoạt động như thế nào?

Từ góc độ người dùng, Duplex hoạt động tương tự như việc bạn yêu cầu Assistant làm việc gì đó. Hiện tại, Duplex chỉ có thể đặt lịch hẹn mà thôi, do đó chúng ta sẽ nói "Hey Google, đặt cho tôi lịch hẹn thay dầu xe tại garage của Joe vào sáng thứ ba", nó sẽ gọi cho garage của Joe và lên lịch cụ thể, sau đó thêm công việc này vào lịch của bạn.

Hấp dẫn đấy chứ? Nhưng những gì diễn ra đằng sau nó thậm chí còn hay ho hơn.

Duplex sử dụng thứ mà chúng ta gọi là "mạng thần kinh hồi quy", được xây dựng nên bằng công nghệ TensorFlow Extended của Google. Google đã huấn luyện mạng này bằng mọi cuộc gọi thoại ẩn danh và các đoạn hội thoại Google Voice mà bạn từng đồng ý cho nó nghe, cũng như khả năng xem xét lịch sử hội thoại và các chi tiết như thời gian và địa điểm của cả hai đầu cuộc gọi.

Về cơ bản, toàn bộ mạng lưới gồm các máy tính cực khủng đang "tiêu hóa" dữ liệu trên mây và nói thông qua Assistant trên điện thoại của bạn hay các sản phẩm khác tích hợp Assistant.

Về bảo mật và quyền riêng tư thì sao?

Tôi chỉ hỏi bạn một câu đơn giản thôi: bạn có tin Google không? Trí tuệ máy móc trên thiết bị là có thực, dù nó bị hạn chế và tương đối mở mẻ. Google đã phát triển ML Kit để giúp các nhà phát triển làm được nhiều thứ như vậy hơn ngay trên thiết bị, nhưng tựu chung lại, vấn đề ở đây chỉ là sức mạnh tính toán mà thôi. Để có thể đặt lịch hẹn làm tóc như Google đã demo, Duplex phải thực hiện một lượng lớn các tính toán, và không có cách nào nó có thể làm được điều đó trên điện thoại hay loa Google Home của bạn cả.

Google cần truy cập càng nhiều dữ liệu cá nhân của bạn càng tốt để làm những thứ đặc biệt mà Assistant hiện có thể làm được, và Duplex cũng vậy. Điểm mới ở đây là với Duplex, sẽ có thêm một bên nữa tham gia - chính là người ở đầu dây bên kia, những người có lẽ không hề cho phép Google nghe cuộc hội thoại của họ.

Nếu/khi Duplex thực sự trở thành một sản phẩm tiêu dùng mà bất kỳ ai cũng sử dụng được, nó chắc chắn sẽ bị chỉ trích và thậm chí còn có thể bị mang ra tòa. Nên như vậy, bởi để Google quyết định điều gì tốt nhất cho quyền riêng tư của chúng ta cũng giống như câu ngạn ngữ cổ, rằng hai con cáo và một con gà quyết định nên ăn tối bằng món gì.

Khi nào Duplex sẽ xuất hiện trên điện thoại?

Không ai biết cả. Có thể là chẳng bao giờ. Google hào hứng khi làm được điều gì đó tuyệt vời và muốn chia sẻ nó với cả thế giới, nhưng không có nghĩa nó sẽ thành công hay trở thành một sản phẩm thực sự.

Hiện tại, Duplex đang được thử nghiệm trong một môi trường đóng và được giám sát chặt chẽ. Nếu mọi thứ đều ổn, một bản thử nghiệm sẽ được tung ra cho người dùng để họ có thể đặt chỗ nhà hàng, đặt lịch làm tóc, hay thông báo nghỉ phép qua điện thoại vào cuối năm nay thông qua Assistant trên điện thoại.

Bạn muốn tìm hiểu thêm?

Google mở công nghệ mà họ dùng để tạo nên Duplex cho mọi người tham khảo. Bạn có thể xem tại các website dưới đây:

- Blog Google AI

- Deepmind

- Tensorflow.org

- Thư viện Đại học Cornell

- Google Research

- The Keyword

- ML Kit

Minh.T.T

Nguồn: vnreview.vn