
Ứng dụng Google Gemini bổ sung hỗ trợ tệp âm thanh, mở rộng khả năng tìm kiếm AI
Ứng dụng Gemini giờ cho phép tải tối đa 10 tệp mỗi lần nhắc, kết hợp bản AI 2.5 mở rộng ngôn ngữ, nâng cao khả năng phân tích dữ liệu và tìm kiếm.
Google vừa tung ra bản cập nhật lớn cho ứng dụng Gemini, mang đến tính năng được người dùng yêu cầu nhiều nhất là hỗ trợ tải lên tệp âm thanh.
Đây được coi là bước tiến giúp công cụ AI này trở nên toàn diện hơn trong việc xử lý dữ liệu đa phương tiện.
Trước đó, Gemini cho phép tải lên hình ảnh, văn bản và nhiều loại tệp khác nhưng chưa hỗ trợ âm thanh, là một hạn chế khiến nhiều người dùng cảm thấy bất tiện.
Với bản cập nhật mới, người dùng trên Android, iOS và cả nền tảng web đều có thể tải trực tiếp tệp âm thanh để AI phân tích.
Theo Josh Woodward, Phó chủ tịch Google Labs và Gemini, tính năng này là yêu cầu số 1 từ cộng đồng người dùng.
Google đã đáp ứng bằng cách cho phép người dùng gói miễn phí tải lên tối đa 10 phút âm thanh với 5 lời nhắc mỗi ngày.
Trong khi đó, những ai sử dụng gói Google AI Pro hoặc AI Ultra có thể tải tệp dài đến 3 giờ, phục vụ nhu cầu phân tích chuyên sâu.
Không chỉ dừng lại ở âm thanh, Gemini còn tăng số lượng tệp tải lên trong mỗi lời nhắc lên tối đa 10 tệp, bất kể định dạng. Điều này cho phép người dùng cung cấp cho AI nhiều ngữ cảnh và dữ liệu hơn, từ đó tạo ra phản hồi sát nhu cầu thực tế.
Google cũng nâng cấp công cụ Tìm kiếm bằng cách bổ sung năm ngôn ngữ mới vào Chế độ AI.
Người dùng giờ đây có thể đặt truy vấn phức tạp bằng tiếng Hindi, Indonesia, Nhật, Hàn và Bồ Đào Nha Brazil... Các khả năng này được vận hành bởi mô hình Gemini 2.5, giúp nâng cao trải nghiệm tìm kiếm đa ngôn ngữ và mở rộng phạm vi ứng dụng AI đến nhiều thị trường hơn.
“Với bản mở rộng này, nhiều người có thể đặt câu hỏi bằng ngôn ngữ ưa thích và khám phá web sâu hơn”, Google nhấn mạnh trong thông báo.
Bản cập nhật lần này cho thấy, chiến lược của Google trong việc đẩy mạnh ứng dụng AI vào sản phẩm cốt lõi.
Gemini không chỉ đơn thuần là một công cụ hội thoại, mà đang tiến tới trở thành một nền tảng AI toàn diện, hỗ trợ đa phương tiện và đa ngôn ngữ, cạnh tranh trực tiếp với các đối thủ lớn trong lĩnh vực trí tuệ nhân tạo.
Ý kiến ()