OpenAI hiện cho phép ChatGPT nói, nhìn, nghe. Đây là cách mọi người có thể sử dụng các tính năng giọng nói và hình ảnh mới !

Nguyễn Hoài Ngọc 27/09/2023

OpenAI hiện cho phép chatbot ChatGPT tương tác với người dùng bằng âm thanh và hình ảnh. Điều này có nghĩa là ChatGPT có thể nghe và hiểu những gì mọi người đang nói và xem liệu họ có tín hiệu trực quan hay không?

OpenAI đã nâng cao khả năng của ChatGPT, bot AI tổng hợp của nó lên khá nhiều bậc. Giờ đây, ChatGPT không chỉ có khả năng trò chuyện bằng giọng nói mà còn có thể xem và hiểu hình ảnh.

Về cơ bản, điều này có nghĩa là ChatGPT hiện có thể nghe, nói và xem nó đang tương tác với ai. Đây là cách các tính năng mới của ChatGPT hoạt động.

Cuộc trò chuyện bằng giọng nói

Cuộc trò chuyện bằng giọng nói với AI

Người dùng giờ đây có thể tận hưởng các cuộc đối thoại năng động và mang tính tương tác với trợ lý AI của mình, mở ra vô số khả năng thú vị. Cho dù bạn đang di chuyển, đang tìm kiếm một câu chuyện trước khi đi ngủ cho gia đình hay giải quyết một cuộc tranh luận trên bàn ăn tối, khả năng giọng nói của ChatGPT luôn sẵn sàng hỗ trợ.

Để bắt đầu tương tác bằng giọng nói, hãy điều hướng đến menu Cài đặt trong ứng dụng dành cho thiết bị di động, chọn “Tính năng mới” và chọn tham gia cuộc trò chuyện bằng giọng nói. Sau khi kích hoạt, chỉ cần chạm vào biểu tượng tai nghe ở góc trên bên phải màn hình chính để chọn từ năm giọng nói riêng biệt.

Những giọng nói này đã được các diễn viên lồng tiếng chuyên nghiệp chế tạo tỉ mỉ để mang lại trải nghiệm thính giác giống con người. Ngoài ra, Whisper, hệ thống nhận dạng giọng nói nguồn mở của OpenAI, chuyển lời nói thành văn bản, nâng cao chất lượng cuộc trò chuyện tổng thể.

Hình ảnh và ChatGPT

Người dùng hiện có thể hiển thị một hoặc nhiều hình ảnh cho ChatGPT để khắc phục sự cố, khám phá nội dung hoặc phân tích dữ liệu phức tạp. Cho dù bạn đang cố gắng chẩn đoán lý do tại sao món nướng của bạn không khởi động, lên kế hoạch cho bữa ăn dựa trên thực phẩm trong tủ lạnh của bạn hay giải mã biểu đồ dữ liệu cho công việc, ChatGPT luôn sẵn sàng hỗ trợ.

Để sử dụng tính năng này, hãy nhấn vào nút ảnh để chụp hoặc chọn ảnh. Trên iOS hoặc Android, ban đầu hãy nhấn vào nút dấu cộng để bao gồm nhiều hình ảnh hoặc sử dụng công cụ vẽ để hướng dẫn trợ lý của bạn.

Các khả năng hình ảnh này khai thác sức mạnh của các mô hình đa phương thức, bao gồm GPT-3.5 và GPT-4, áp dụng các kỹ năng suy luận ngôn ngữ cho nhiều nội dung trực quan, bao gồm ảnh, ảnh chụp màn hình và tài liệu chứa cả văn bản và hình ảnh.

Người dùng hiện có thể hiển thị một hoặc nhiều hình ảnh cho ChatGPT để khắc phục sự cố

An toàn và Phản hồi

Khả năng thoại và hình ảnh sẽ được triển khai theo từng giai đoạn cho người dùng Plus và Enterprise trong hai tuần tới. Chức năng giọng nói có sẵn trên cả nền tảng iOS và Android, có thể truy cập được thông qua cài đặt, trong khi khả năng hình ảnh sẽ có sẵn trên tất cả các nền tảng.

Có rất nhiều rủi ro tiềm ẩn liên quan đến những khả năng tiên tiến này. Liên quan đến giọng nói, trọng tâm là trò chuyện bằng giọng nói và công nghệ này đã được phát triển với sự hợp tác của các diễn viên lồng tiếng để đảm bảo tính xác thực và an toàn.

Về đầu vào hình ảnh, OpenAI đã thực hiện các biện pháp nhằm hạn chế khả năng phân tích và đưa ra tuyên bố trực tiếp của ChatGPT về các cá nhân nhằm tôn trọng quyền riêng tư của họ. Việc sử dụng trong thế giới thực và phản hồi của người dùng sẽ đóng vai trò then chốt trong việc tăng cường hơn nữa các biện pháp bảo vệ này đồng thời duy trì tiện ích của công cụ.

- Hoài Ngọc theo Firstpost -

 
 
Tags

Cùng chuyên mục

Đăng ký nhận tin

Những thông tin về sản phẩm mới, sự kiện và khuyến mãi


Gửi

VĂN PHÒNG HÀ NỘI

Số 14, Pháo Đài Láng, Đống Đa, Hà Nội.
Tel (+84 24) 3557.3636; 
Fax (+84 24) 3569.0588

Website: www.dtctech.vn
Đã thông báo với bộ công thương

Find us on

dtc-logo-w60.png

CÔNG TY TNHH CÔNG NGHỆ ỨNG DỤNG VÀ TRUYỀN THÔNG DTC. All Rights Reserved.