HÀ NỘI, ngày 15 tháng 9 năm 2023 – WiMi Hologram Cloud Inc. (NASDAQ: WIMI) (“WiMi” hoặc “Công ty”), một công ty công nghệ Thực tế ảo (“AR”) Hologram hàng đầu toàn cầu, hôm nay công bố rằng một hệ thống đề xuất video cá nhân đa chế độ đổi mới đã được phát triển. Nó sử dụng phương pháp học sâu và phân tích dữ liệu đa chế độ. Hệ thống sử dụng các thuật toán học sâu để khai thác các đặc điểm ẩn của phim ảnh và người dùng, và được đào tạo với dữ liệu đa chế độ để dự đoán xếp hạng video chính xác hơn nhằm cung cấp kết quả đề xuất cá nhân chính xác hơn.
Hệ thống đề xuất này, sử dụng học sâu và một mô hình quy trình tổng thể cho dữ liệu đa chế độ. Đầu tiên, chúng tôi thu thập các tập dữ liệu chứa thông tin đa chế độ về người dùng và video. Sau đó, chúng tôi chuyển đổi các tham số của người dùng và video thành các ma trận đơn giá trị chứa các giá trị riêng khác không. Tiếp theo, chúng tôi huấn luyện một mạng nơ-ron tích chập (CNN) với các bộ lọc tích chập đa lớp để cải thiện mức phân loại của dữ liệu. Bằng cách huấn luyện mô hình, chúng tôi sử dụng các đặc điểm được tinh chỉnh để tìm các mối quan hệ tiềm năng giữa người dùng và phim ảnh và đưa ra các đề xuất dựa trên các tiêu chí tương đồng. Cuối cùng, chúng tôi đề xuất các video cho người dùng dựa trên lý thuyết tương đồng.
Hệ thống đề xuất video bao gồm, thu thập và tiền xử lý dữ liệu, trích xuất đặc trưng và học biểu diễn, huấn luyện và tối ưu hóa mô hình, và thuật toán đề xuất và đề xuất cá nhân hóa.
Thu thập và tiền xử lý dữ liệu: Bằng cách chứa các tập dữ liệu đa chế độ của người dùng và video, bao gồm thông tin như mô tả văn bản, hình ảnh và âm thanh. Những dữ liệu này có thể được thu thập từ cơ sở dữ liệu video, hành vi của người dùng và các nguồn khả dụng khác. Trong giai đoạn tiền xử lý dữ liệu, dữ liệu được làm sạch, loại bỏ nhiễu và chuẩn hóa để đảm bảo tính nhất quán và khả dụng của dữ liệu.
Trích xuất đặc trưng và học biểu diễn: Để khai thác các đặc điểm ẩn của người dùng, một phương pháp học sâu được sử dụng để trích xuất đặc trưng và học biểu diễn. Thông qua xử lý ngôn ngữ tự nhiên như nhúng từ và mạng nơ-ron hồi tiếp (RNN) để chuyển đổi văn bản thành các vector biểu diễn phân tán. Đối với dữ liệu hình ảnh và âm thanh, sử dụng CNN và RNN để trích xuất đặc trưng.
Huấn luyện và tối ưu hóa mô hình: Xây dựng các mô hình mạng học sâu và huấn luyện và tối ưu hóa chúng bằng dữ liệu huấn luyện. Trong quá trình huấn luyện mô hình, trọng số và độ lệch của mô hình được cập nhật bởi thuật toán lan truyền ngược và bộ tối ưu hóa gradient để giảm thiểu sai số dự đoán. Đồng thời, ví dụ: điều chuẩn hóa và chuẩn hóa theo batch được sử dụng để cải thiện khả năng tổng quát hóa của mô hình và ngăn ngừa quá khớp.
Thuật toán đề xuất và đề xuất cá nhân hóa: Các đề xuất video có thể được thực hiện bằng cách sử dụng các đặc điểm và mẫu được học bởi một mô hình đã được huấn luyện. Các đề xuất cá nhân hóa được thực hiện bằng cách tính toán độ tương đồng giữa người dùng và video dựa trên hành vi lịch sử và sở thích của người dùng. Dựa trên tính toán tương đồng, một danh sách các đề xuất video được tạo ra cho người dùng và được tối ưu hóa dựa trên phản hồi và xếp hạng của người dùng.
Hệ thống đề xuất video cá nhân hóa của WiMi có độ chính xác đề xuất và sự hài lòng của người dùng tốt hơn so với thuật toán đề xuất truyền thống như lọc cộng tác, lọc dựa trên nội dung và phân rã giá trị riêng. Đồng thời, hệ thống cũng có thể giảm nhẹ vấn đề dữ liệu thưa thớt đến một mức độ nhất định và cải thiện sự đa dạng của các đề xuất.
Đối với sự phát triển trong tương lai, các nhà nghiên cứu của WiMi đã đưa ra một số gợi ý cải tiến. Thứ nhất, chất lượng và đa dạng dữ liệu cần được cải thiện hơn nữa để đảm bảo độ chính xác và phạm vi bao phủ của hệ thống đề xuất. Thứ hai, nâng cao khả năng giải thích cho các mô hình đề xuất cũng là một hướng quan trọng để cho phép người dùng hiểu được cơ sở của các kết quả đề xuất và tăng tính minh bạch và tin tưởng của hệ thống. Ngoài ra, với sự phổ biến của các thiết bị di động và sự tăng trưởng của các dịch vụ video trực tuyến, đề xuất thời gian thực và trực tuyến ngày càng quan trọng. Nghiên cứu trong tương lai có thể tìm hiểu cách thực hiện các đề xuất cá nhân hóa hiệu quả trong các môi trường thời gian thực, kết hợp các mô hình đề xuất và xử lý dòng dữ liệu thời gian thực để đạt được phản hồi đề xuất tức thì.
Hệ thống đề xuất video cá nhân hóa của WiMi cho thấy tiềm năng lớn trong việc giải quyết vấn đề quá tải thông tin. Nó không chỉ cung cấp các kết quả đề xuất chính xác và cá nhân hóa hơn, mà còn giảm nhẹ vấn đề dữ liệu lạnh thiếu và cải thiện trải nghiệm người dùng. Nghiên cứu và phát triển trong tương lai sẽ tiếp tục cải thiện thuật toán đề xuất để làm cho hệ thống đề xuất thông minh và đáng tin cậy hơn, và mang lại trải nghiệm xem tốt hơn cho người dùng.
Về WIMI Hologram Cloud
WIMI Hologram Cloud, Inc. (NASDAQ: WIMI) là một nhà cung cấp giải pháp kỹ thuật đám mây toàn diện hologram tập trung vào các lĩnh vực chuyên nghiệp bao gồm phần mềm ô tô HUD AR hologram, LiDAR xung hologram 3D, thiết bị ánh sáng trường đầu đeo, bán dẫn hologram, phần mềm đám mây hologram, hệ thống định vị xe hơi hologram và các lĩnh vực khác. Dịch vụ và công nghệ AR hologram của nó bao gồm ứng dụng ô tô AR hologram, công nghệ LiDAR xung hologram 3D, công nghệ bán dẫn thị giác hologram, phát triển phần mềm hologram, công nghệ quảng cáo AR hologram, công nghệ giải trí AR hologram, thanh toán ARSDK hologram, giao tiếp hologram tương tác và các công nghệ AR hologram khác.
Tuyên bố về cảnh báo
Thông cáo bá