OpenAI đang chuẩn bị ra mắt tính năng mới mang tên “Live Camera”, hứa hẹn mở ra một kỷ nguyên mới cho ChatGPT với khả năng gọi video và nhận diện hình ảnh. Theo TechRadar, tính năng này sẽ tích hợp vào chế độ giọng nói nâng cao, cho phép AI không chỉ trò chuyện bằng âm thanh mà còn có thể quan sát, nhận diện và phản hồi chi tiết về hình ảnh.
“Live Camera” là gì?
Tính năng này lần đầu tiên được giới thiệu vào tháng 5/2024 trong một buổi trình diễn của OpenAI. Tại đây, AI đã thể hiện khả năng nhận diện hình ảnh xuất sắc, như xác định chính xác một chú chó, cung cấp thông tin về giống loài, đặc điểm và thậm chí là tên gọi. Kể từ đó, OpenAI không tiết lộ thêm bất kỳ thông tin chính thức nào cho đến khi mã nguồn từ bản beta v1.2024.317 hé lộ tham chiếu về tính năng “Live Camera”.
Tính năng giọng nói nâng cao của ChatGPT sẽ có khả năng tương tác với người dùng bằng cuộc gọi video trong tương lai gần
Điều này cho thấy OpenAI đang phát triển mạnh mẽ tính năng này và nhiều khả năng sẽ sớm triển khai thử nghiệm beta trước khi chính thức ra mắt người dùng toàn cầu.
Tiềm năng của “Live Camera”
- Hỗ trợ trực quan cho người khiếm thị: Tính năng này có thể trở thành công cụ hỗ trợ hiệu quả, giúp người khiếm thị nhận biết môi trường xung quanh thông qua mô tả chi tiết từ AI.
- Ứng dụng trong đời sống hàng ngày: Khả năng nhận diện hình ảnh theo thời gian thực hứa hẹn giúp người dùng giải quyết nhanh chóng các tình huống, từ nhận dạng vật thể đến cung cấp thông tin hữu ích.
- [*]Trải nghiệm gọi video thông minh hơn: Một số người thử nghiệm chế độ giọng nói nâng cao đã so sánh trải nghiệm với việc gọi FaceTime cùng một “người bạn siêu thông minh”. Đây là sự kết hợp giữa hội thoại tự nhiên và phân tích hình ảnh trực quan.
ChatGPT: Vượt xa vai trò chatbot thông thường
Tính năng “Live Camera” đánh dấu một bước tiến lớn, giúp ChatGPT thoát khỏi giới hạn của một chatbot và trở thành công cụ AI toàn diện hơn. Khả năng kết hợp giữa giọng nói, hình ảnh và trí tuệ nhân tạo không chỉ mang lại tiện ích vượt trội mà còn mở ra cơ hội ứng dụng rộng rãi trong nhiều lĩnh vực như giáo dục, y tế và hỗ trợ người khuyết tật.
Hiện tại, OpenAI vẫn chưa công bố thời gian ra mắt chính thức của tính năng này. Tuy nhiên, dữ liệu từ mã nguồn beta cho thấy “Live Camera” đang được thử nghiệm tích cực và có thể sớm ra mắt dưới dạng beta để thu thập phản hồi từ người dùng.
Hãy cùng chờ đón sự bùng nổ của “Live Camera”, tính năng hứa hẹn thay đổi cách chúng ta tương tác với công nghệ AI trong tương lai gần!
|
OpenAI vừa công bố một bản cập nhật quan trọng cho ứng dụng ChatGPT trên macOS, mang lại khả năng tích hợp mạnh mẽ với các công cụ lập trình phổ biến, giúp người dùng có thể viết code và tối ưu hóa công việc lập trình trực tiếp trên ứng dụng. Bản cập nhật này không chỉ mở rộng tính năng của ChatGPT mà còn đánh dấu một bước tiến lớn trong việc áp dụng trí tuệ nhân tạo (AI) vào quy trình làm việc hàng ngày.
Khả năng tương tác liền mạch với các công cụ lập trình
Một trong những điểm nổi bật của bản cập nhật lần này là ChatGPT trên macOS có thể đọc và xử lý nội dung hiển thị trên màn hình của các ứng dụng khác, giúp người dùng tiết kiệm thời gian và nâng cao hiệu quả công việc. Tính năng này hiện hỗ trợ các công cụ lập trình phổ biến như VS Code, Terminal, iTerm2, và Xcode của Apple. Điều này có nghĩa là ChatGPT có thể phân tích mã nguồn trong các dự án Xcode và đưa ra gợi ý tối ưu ngay lập tức, mà không cần phải sao chép thủ công hay thay đổi cửa sổ ứng dụng.
Ứng dụng công nghệ AI mới
ChatGPT sử dụng API trợ năng của macOS để truy cập nội dung từ các ứng dụng được hỗ trợ, bao gồm:
- Trình soạn thảo và IDE (Xcode, VS Code, TextEdit): ChatGPT có thể xử lý nội dung trong các khung soạn thảo mở và ưu tiên vùng văn bản được chọn.
- [*]Terminal (Terminal, iTerm2): Ứng dụng có thể truy cập 200 dòng cuối cùng trong các khung đang mở, đặc biệt là văn bản được chọn và các nội dung xung quanh.
Điều này giúp lập trình viên và người dùng có thể làm việc hiệu quả hơn, với khả năng nhận gợi ý và sửa lỗi trực tiếp mà không phải chuyển qua lại giữa các ứng dụng.
Tính năng quản lý dữ liệu và quyền riêng tư
Để đảm bảo quyền riêng tư, người dùng có thể kiểm soát hoàn toàn tính năng này thông qua các cài đặt. OpenAI cho phép người dùng tắt tính năng truy cập nội dung ứng dụng bất cứ lúc nào. Đồng thời, dữ liệu xử lý sẽ được lưu trữ dưới dạng lịch sử trò chuyện và được bảo vệ theo chính sách dữ liệu của OpenAI. Người dùng cũng có thể quyết định liệu dữ liệu này có được sử dụng để huấn luyện mô hình hay không.
Hướng tới tương lai mở rộng
Hiện tại, tính năng này chỉ có sẵn cho người dùng đăng ký ChatGPT Plus hoặc Team, và sẽ mở rộng cho người dùng Enterprise và Education trong vài tuần tới. OpenAI cũng cho biết họ đang lên kế hoạch để tích hợp thêm nhiều ứng dụng khác trong tương lai.
Với những cải tiến đáng chú ý trong bản cập nhật mới, ChatGPT trên macOS đang mang lại những trải nghiệm lập trình mượt mà và hiệu quả hơn bao giờ hết. Nếu bạn là lập trình viên hoặc người yêu thích công nghệ, đừng bỏ lỡ cơ hội sở hữu ChatGPT để nâng cao năng suất làm việc.