Một tuần sau khi giới thiệu hàng loạt nâng cấp trong bộ công cụ AI Copilot dành cho doanh nghiệp, Microsoft bắt đầu đưa các tính năng AI mới trên Windows tới với mọi người dùng. Với các tính năng mới, Copilot không chỉ là một chatbot AI mà còn là một trợ lý ảo thực sự dành cho mỗi cá nhân người dùng khi có khả năng “nhìn” và “nói chuyện”.

Các khả năng này sẽ xuất hiện trong tính năng Copilot Vision và Copilot Voice mới, được tích hợp trong trình duyệt Microsoft Edge. Với tính năng này, Copilot có thể “thấy những gì bạn thấy, nghe những gì bạn nghe” trên trình duyệt web của bạn – theo lời Phó chủ tịch Microsoft, Yusuf Mehdi.

Microsoft tăng cường trí tuệ cho chatbot AI: Copilot có thể "thấy những gì bạn thấy, nghe những gì bạn nghe"- Ảnh 1.

Đúng như những gì ông Mehdi tuyên bố, Copilot Vision sẽ xem được những gì bạn đang xem trên trình duyệt Edge – từ đó, trợ lý AI này có thể tóm tắt được nội dung văn bản trên trình duyệt, phân tích hình ảnh đang hiển thị cũng như trả lời các câu hỏi trực tuyến.

Trên thực tế các tính năng này đều đã xuất hiện trong ứng dụng Google Lens trên Android và trình duyệt Chrome trên máy tính, nhưng với Copilot Vision, Microsoft hứa hẹn công nghệ của họ còn mạnh mẽ hơn nhiều – ví dụ đề xuất bước tiếp theo, giúp bạn giải quyết các tác vụ cần thiết.

Microsoft cho biết về một ví dụ đối với ứng dụng của tính năng mới: ” Thử tưởng tượng bạn đang muốn trang trí một căn phòng. Copilot Vision có thể giúp bạn tìm kiếm nội thất, đề xuất bảng màu phù hợp, đưa ra các lựa chọn về mọi thứ cần thiết và thậm chí đề xuất cách sắp xếp phù hợp cho các món đồ mà bạn đang nhìn vào.

Microsoft tăng cường trí tuệ cho chatbot AI: Copilot có thể "thấy những gì bạn thấy, nghe những gì bạn nghe"- Ảnh 2.

Bạn có thể đặt câu hỏi về bức ảnh này và Copilot Vision sẽ trả lời cho bạn

Tất nhiên với một tính năng có thể ảnh hưởng nghiêm trọng đến quyền riêng tư của người dùng, Microsoft tỏ ra rất thận trọng trong việc triển khai. Công ty nhấn mạnh rằng, Copilot Vision cần được người dùng chủ động bật lên. Ngoài ra nó sẽ xóa dữ liệu ngay sau khi cuộc hội thoại kết thúc, cũng như chỉ hoạt động trên một số website chọn trước và không áp dụng cho nội dung trả phí. Các âm thanh, hình ảnh và văn bản cũng không được lưu trữ hoặc để huấn luyện mô hình.

Hiện tại Copilot Vision mới chỉ được triển khai cho người dùng thuê bao Copilot Pro tại Mỹ.

Bên cạnh Copilot Vision, một tính năng khác cũng được Microsoft giới thiệu lần này là Copilot Voice. Tương tự như các đối thủ khác như ChatGPT, Gemini, Copilot Voice cũng cho người dùng chọn tông giọng phù hợp với cuộc hội thoại và cách trả lời. Nhờ đó người dùng có thể nói chuyện một cách trơn tru với trợ lý ảo AI này mà không cần nhờ tới bàn phím.

Microsoft tăng cường trí tuệ cho chatbot AI: Copilot có thể "thấy những gì bạn thấy, nghe những gì bạn nghe"- Ảnh 3.

Tuy nhiên, một điều cần chú ý là Copilot Voice có thời gian sử dụng giới hạn. Những người dùng thuê bao sẽ có thời gian sử dụng dài hơn nhưng số lượng cũng giới hạn tùy theo gói người dùng trả tiền.

Kết hợp với Copilot Voice, Microsoft còn ra mắt Copilot Daily – một trợ lý AI cung cấp tin tức buổi sáng cho bạn. Tính năng này có khả năng thu thập tin tức theo nhu cầu và cung cấp cho bạn vào buổi sáng, ví dụ như tình hình giao thông, thời tiết, cũng như tóm tắt qua các thông tin hàng ngày. Cả Copilot Voice và Daily mới chỉ được triển khai cho người dùng Windows tại Mỹ và Anh và cũng mới chỉ hỗ trợ tiếng Anh. Các ngôn ngữ khác sẽ xuất hiện trong thời gian tới.

Một tính năng mới đáng chú ý khác là Think Deeper, giúp Copilot xử lý các vấn đề phức tạp hơn. Microsoft cho biết tính năng này sử dụng “các mô hình lập luận” tiên tiến, có khả năng đưa ra câu trả lời chi tiết từng bước cho nhiều loại thách thức thực tế hàng ngày.

Microsoft cũng công bố tính năng cá nhân hóa mới cho Copilot. Khi được kích hoạt, Copilot sẽ dựa vào lịch sử tương tác của người dùng và các ứng dụng Microsoft khác để đề xuất cách sử dụng hiệu quả hơn. Tuy nhiên, tính năng này chưa được triển khai tại Vương quốc Anh và Liên minh Châu Âu do những lo ngại về quy định bảo vệ dữ liệu.