Tin mới

Dạy Galaxy AI học tiếng Việt: niềm tự hào và bước tiến lớn của trí tuệ Việt Nam

Trong vòng 4 tháng nhưng các kỹ sư Việt Nam của Trung tâm Nghiên cứu và phát triển Samsung Việt Nam (SRV) đã có thể đưa tiếng Việt vào trong tính năng dịch thuật của Galaxy AI.

Ứng dụng AI vào trong xử lý ngôn ngữ tự nhiên đã và đang là xu thế phát triển trên thế giới, giúp xóa bỏ khoảng cách do sự khác biệt về ngôn ngữ giao tiếp giữa con người. Samsung tiếp tục dẫn đầu xu thế bằng việc phát triển, trang bị tính năng AI trên Galaxy S24 - chiếc điện thoại AI đầu tiên trên thị trường. 

“Khi tiếng Việt ngạo nghễ đứng trong danh sách 13 ngôn ngữ đầu tiên của Galaxy AI được công bố, chả ai bảo trước với ai, cả khán đài sức chứa hàng nghìn người bỗng vỡ òa bởi niềm tự hòa của đoàn khách mời Việt Nam" - Reviewer Vinh Xô nhớ lại khi tham dự kiện toàn cầu Galaxy Unpacked của Samsung đầu năm 2024.

anh_chup_man_hinh_2024-04-12_luc_19.50.10.jpg (407 KB)Tự hào tiếng Việt là một trong những ngôn ngữ đầu tiên có mặt trên Galaxy AI

So với các ngôn ngữ được lựa chọn trước đó dựa trên số lượng người dùng và độ phổ biến trên thế giới, tiếng Việt có số lượng người dùng ít hơn. Quyết định đưa tiếng Việt vào Galaxy AI cho thấy Việt Nam là một thị trường quan trọng và có vị trí chiến lược trong kế hoạch phát triển của Samsung. Và Trung tâm Nghiên cứu và phát triển Samsung Việt Nam (SRV) tự hào khi được Tập đoàn đặt niềm tin, giao nhiệm vụ nghiên cứu phát triển cho ngôn ngữ tiếng Việt trên Galaxy AI.

Tới giờ, khi nhắc tới nhiệm vụ nghiên cứu phát triển cho ngôn ngữ tiếng Việt trên Galaxy AI, kỹ sư Trần Tuấn Minh, Trưởng nhóm nghiên cứu Language AI, Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam vẫn không quên được cảm xúc của bản thân. Ở thời điểm tháng 10/2023, khi hệ thống trí tuệ nhân tạo Galaxy AI đang được phát triển cho dòng điện thoại Galaxy S24 với kế hoạch là những ngôn ngữ phổ biến trên thế giới như tiếng Anh, tiếng Trung Quốc, tiếng Pháp…., Ban lãnh đạo Tập đoàn Samsung đã quyết định bổ sung thêm tiếng Việt vào Galaxy AI - một sự ưu ái đặc biệt.

anh_chup_man_hinh_2024-04-12_luc_19.50.24.jpg (411 KB)Kỹ sư Trần Tuấn Minh đang làm việc tại Trung tâm nghiên cứu và Phát triển Samsung Việt Nam

Kỹ sư Trần Tuấn Minh vẫn nhớ cảm giác vui mừng khi được chọn vào đội AI. Anh chia sẻ, đây là lần đầu tiên SRV nhận một dự án chiến lược liên quan đến AI. Đặc biệt hơn nữa, các kỹ sư Việt trong đó có Tuấn Minh cảm thấy vô cùng tự hào khi được phát triển ngôn ngữ Tiếng Việt, là ngôn ngữ mẹ đẻ của quốc gia mình, trên dòng điện thoại hiện đại bậc nhất bây giờ là những chiếc smartphone Galaxy S24.

Ngay sau đó, các kỹ sư trong nhóm nghiên cứu và phát triển AI được cử sang Hàn Quốc và Ấn Độ để nhận chuyển giao về kiến trúc mô hình AI, thuật toán cho AI, đào tạo AI, dữ liệu cho AI…. Bên cạnh đó, bộ phận kiểm thử về AI được Hàn Quốc trực tiếp sang chia sẻ kiến thức về AI, Phương pháp kiểm thử, Tool hỗ trợ kiểm thử, kinh nghiệm kiểm thử AI.

anh_chup_man_hinh_2024-04-12_luc_19.50.34.jpg (400 KB)Kỹ sư Trần Tuấn Minh cùng nhóm kỹ sư thực hiện dự án AI

Có câu “Phong ba bão táp không bằng ngữ pháp Việt Nam”, để giải được bài toán “ngữ pháp” cùng những vấn đề liên quan đến phương ngữ, từ lóng, từ đồng nghĩa, từ mượn, và những từ mới của thế hệ GenZ… trong tiếng Việt, SRV phải huy động hàng trăm người để xử lý dữ liệu cho AI. Các kỹ sư của Trung tâm phải liên tục tạo ra dữ liệu để đào tạo AI, giúp AI hiểu và cho kết quả đầu ra chính xác. Đặc biệt, những nguồn dữ liệu này phải đảm bảo tính hợp pháp chứ không đơn thuần là dữ liệu thu thập tự do.

Thành quả đáng ghi nhận sau những nỗ lực không ngừng nghỉ

Nhờ sự tập trung cao độ và huy động nguồn lực lớn cho dự án, chỉ trong một thời gian ngắn, các kỹ sư vừa hiệu chỉnh dữ liệu sẵn có, vừa tạo thêm nhiều dữ liệu mới để phục vụ đào tạo cho AI. “Chúng tôi đã thu âm hàng triệu tệp giọng nói của cả nam lẫn nữ để giúp Galaxy S24 Series thông minh hơn với người Việt Nam. Riêng về công tác kiểm thử, để đảm bảo tính năng dịch chính xác và đảm bảo mức độ nhận giọng nói trong các môi trường tiếng ồn khác nhau, nhóm kỹ sư không chỉ thực hiện kiểm thử trong môi trường phòng lab, mà còn đi đến nhiều địa điểm như Hồ Gươm, trung tâm thương mại, quán café để đảm bảo tính năng AI hoạt động tốt trong môi trường người dùng thực…” - Trần Tuấn Minh cho biết.

anh_chup_man_hinh_2024-04-12_luc_19.50.43.jpg (382 KB)Kỹ sư Trần Tuấn Minh và nhóm kỹ sư thường xuyên họp trao đổi trong quá trình thực hiện dự án

Nhờ những nỗ lực không ngừng nghỉ, chỉ trong vòng 4 tháng, các kỹ sư của SRV đã tự mình làm chủ công nghệ và hoàn thiện AI cho tiếng Việt cho dòng sản phẩm S24. Dự án nghiên cứu và phát triển Galaxy AI ở phần ngôn ngữ tiếng Việt đã hoàn thành ứng dụng AI trong việc nhận giọng nói và chuyển đổi giọng nói sang văn bản (text). Thiết bị Galaxy AI tự động nhận diện ngôn ngữ người dùng đang sử dụng thông qua tự động nhận diện giọng nói, sau đó nội dung giọng nói (Speech) sẽ chuyển sang dạng văn bản (Text), làm dữ liệu đầu vào (data) cho quá trình xử lý tiếp theo. On-device giữ cho các dữ liệu hoàn toàn riêng tư trên thiết bị.

Các kỹ sư cũng đã hoàn thành nhiệm vụ ứng dụng AI để dịch từ một ngôn ngữ gốc sang ngôn ngữ đích (target language). Dữ liệu đầu vào (data) là từ module tự động nhận diện giọng nói ASR ở trên, đầu ra là dữ liệu văn bản (Text) đã được dịch sang ngôn ngữ đích (Target language, là ngôn ngữ người dùng muốn dịch); Dùng AI để chuyển văn bản (Text) sang giọng nói. Đầu vào là văn bản (đã được dịch), đầu ra là âm thanh đọc ra từ văn bản đó.

Bước đệm cho tương lai

Đây không phải là dự án đầu tiên của trung tâm R&D tại Việt Nam nhưng sự thành công trong việc phát triển tiếng Việt cho Galaxy AI sẽ là điểm tựa để các kỹ sư Việt hoàn thành nhiệm vụ nghiên cứu sắp tới. “Galaxy AI không phải dự án toàn cầu đầu tiên mà các kỹ sư người Việt Nam tham gia. Trước đó, chúng tôi đã tham gia các dự án toàn cầu tại Trung tâm Nghiên cứu và Phát triển Điện thoại di động Samsung Việt Nam (SVMC), là tiền thân của Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam bây giờ. Trung tâm SVMC được thành lập từ năm 2012, đặt tại tòa nhà PVI tại Hà Nội. Theo như tên gọi này, lúc đó chúng tôi chỉ tập trung phát triển các giải pháp phần mềm công nghệ cho điện thoại di động, nhưng với Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam, lĩnh vực hoạt động của chúng tôi đã mở rộng ra, không chỉ cho thiết bị di động, mà còn với Note PC và thiết bị viễn thông. Điều này cho thấy sự tăng trưởng không ngừng của Trung tâm Nghiên cứu và phát triển Samsung Việt Nam.” Chia sẻ của ông Đỗ Đức Dũng, Giám đốc Bộ phận Phát triển phần mềm.

anh_chup_man_hinh_2024-04-12_luc_19.50.53.jpg (747 KB)Toàn cảnh Trung Tâm R&D Samsung Việt Nam

"Trong thời gian tới Samsung Việt Nam sẽ tiếp tục gia tăng các hoạt động đầu tư, xuất khẩu, tuyển dụng và nghiên cứu, phát triển tại Việt Nam", ông Choi Joo Ho Tổng Giám đốc Samsung Việt Nam khẳng định.

Thông tin về Trung tâm R&D của Samsung Việt Nam (SRV)

Trung tâm R&D của Samsung Việt Nam (SRV) được khánh thành và đi vào hoạt động từ cuối tháng 12 năm 2022 đã hiện thực hóa kế hoạch của Samsung trong việc đưa Việt Nam vượt qua vai trò là cứ điểm sản xuất toàn cầu để trở thành cứ điểm chiến lược về nghiên cứu và phát triển của tập đoàn. Với tổng vốn đầu tư hơn 220 triệu USD, SRV được thiết kế với 16 tầng nổi và 3 tầng hầm với tổng diện tích xây dựng là 11.603 m² và diện tích sàn là 79.511 m².

anh_chup_man_hinh_2024-04-12_luc_19.51.08.jpg (592 KB)Cơ sở vật chất hiện đại tại Trung tâm Nghiên cứu và phát triển Samsung Việt Nam

Samsung đề ra kế hoạch phát triển Trung tâm nghiên cứu và phát triển tại Việt Nam trở thành trung tâm nghiên cứu và phát triển số một toàn cầu thông qua việc đẩy mạnh quan hệ hợp tác chặt chẽ với các trường đại học trong hoạt động đào tạo và nghiên cứu:

▲ Hợp tác đào tạo môn học cốt lõi như Thuật toán ứng dụng và các môn công nghệ chủ chốt của cuộc Cách mạng công nghệ 4.0 như trí tuệ nhân tạo, dữ liệu lớn, internet vạn vật, truyền thông đa phương tiện, an toàn thông tin …

▲ Phối hợp nghiên cứu ứng dụng AI phục vụ tiện ích cho cộng đồng. Ngoài ra, thông qua Trung tâm nghiên cứu và phát triển, Samsung hy vọng sẽ đóng góp tích cực vào sự phát triển của lĩnh vực phần cứng (H/W), phần mềm (S/W) phù hợp với lĩnh vực công nghệ thông tin tiên tiến và cuộc cách mạng công nghiệp 4.0.

Hiện, Trung tâm R&D của Samsung Việt Nam khoảng 2.400 kỹ sư đang làm việc, trong đó các kỹ sư người Việt Nam luôn được Tập đoàn đánh giá cao về năng lực và là lực lượng nòng cốt trong việc nghiên cứu tính năng AI trong dòng điện thoại mới Galaxy S24. SRV hiện đang đảm nhận nhiều dự án quan trọng của tập đoàn. Lần đầu tiên, SRV nhận nhiệm vụ phát triển toàn diện cho sản phẩm Note PC cấp cơ sở, từ cơ khí, phần cứng và phần mềm. Đây là nền tảng để phát triển nhiều mẫu Note PC sau này. Ngoài ra, SRV cũng đã bắt đầu nhận các dự án phát triển cho các sản phẩm mạng viễn thông Network và tiếp nhận chuyển giao 2 mảng hoạt động chiến lược từ Hàn Quốc, bao gồm tính năng đa phương tiện và tính năng bảo mật trên điện thoại Samsung.