Home Xe Ô tô Hệ thống SYNC trên xe Ford hiểu các khẩu lệnh bằng cách...

Hệ thống SYNC trên xe Ford hiểu các khẩu lệnh bằng cách nào?

SHARE

Công nghệ nhận diện giọng nói SYNC cho cảm giác an tâm khi biết người thân và bạn bè tập trung lái xe an toàn và không bị xao nhãng.

Công nghệ kích hoạt bằng giọng nói đã trở thành một phần của hệ thống SYNC ngay từ những phiên bản đầu tiên cách đây 13 năm. Chính thức ra mắt vào năm 2014, SYNC 3 đã và đang được cải tiến không ngừng. Hiện nay, với khả năng hỗ trợ lên tới 25 ngôn ngữ, hệ thống này đã đem đến cơ hội trải nghiệm cho nhiều người dùng trên toàn thế giới hơn.

Sau nhiều lần chứng kiến những hậu quả đến từ việc lái xe mất tập trung, ông Stephen Cooper, Trưởng nhóm nghiên cứu và phát triển công nghệ nhận diện giọng nói SYNC nhận ra sự cấp thiết trong việc tối ưu hóa công nghệ kích hoạt bằng giọng nói, giản lược thông tin đầu vào xuống chỉ còn một câu lệnh. Nhờ giảm thiểu tối đa sự phân tâm cũng như dễ dàng vận hành, hệ thống kích hoạt bằng giọng nói sẽ đảm bảo tài xế tập trung điều khiển xe một cách an toàn.

SYNC đã hiểu lời nói như thế nào?

Thiết kế cốt lõi SYNC là hệ thống nhận diện và ra lệnh bằng giọng nói – hoạt động giống như một bộ não nhận diện giọng nói. Cụm dữ liệu ngôn ngữ tích hợp với phần mềm giải mã sẽ chia nhỏ âm thanh để phân tích và hiểu từng câu mệnh lệnh của người dùng.

Cụm dữ liệu ngôn ngữ là một danh sách lớn các từ ngữ hoặc câu lệnh được lập trình để thực hiện một nhiệm vụ cụ thể. Ví dụ như câu lệnh “Gọi John Doe”, sẽ được ghi nhận bằng hơn 25 ngôn ngữ trên hệ thống SYNC. Ngoài ra, một lượng lớn câu lệnh tương ứng với các tính năng (có thể kích hoạt bằng giọng nói trong) trên xe cũng được lưu trữ trong cụm dữ liệu ngôn ngữ của SYNC.

Bên cạnh đó phần mềm giải mã giọng nói sẽ lọc ra đặc tính âm thanh của từng câu lệnh để khớp với danh sách các từ trong cụm dữ liệu ngôn ngữ. Như ví dụ trên, khi người dùng nói “Gọi John Doe”, phần mềm giải mã sẽ phân tích đặc tính của đoạn âm thanh thu được, sau đó tìm kiếm trong cụm dữ liệu ngôn ngữ để tìm ra mệnh lệnh (được lưu sẵn) có đặc tính âm thanh tương tự, qua đó giúp hệ thống SYNC hiểu được yêu cầu từ người sử dụng.

Giọng nói thuộc các vùng miền khác nhau trên cùng một quốc gia cũng được lưu ý. Ở những ngôn ngữ được hỗ trợ như tiếng Anh, tiếng Trung, tiếng Thái… có rất nhiều phương ngữ và giọng nói khác nhau giữa các vùng miền vì vậy dữ liệu ngôn ngữ cũng được cập nhật đa dạng để nâng cao khả năng nhận diện một câu lệnh của hệ thống.

Thông qua các nghiên cứu và phân tích chuyên sâu qua mạng không dây của SYNC, các kỹ sư có thể ghi nhận một nguồn dữ liệu âm thanh đều đặn về cách khách hàng sử dụng SYNC cho các mục đích khác nhau. Từ đó, họ có thể phát hiện các lỗi phổ biến mà người dùng hay gặp phải, từ đó, sắp xếp và cải tiến các tác vụ phù hợp hơn, thay vì bỏ mặc người dùng tự xoay sở. Tất cả dữ liệu được thu thập đều phải có sự chấp thuận của người dùng.