Вы здесь

Молодые ученые МГУ предложили новый метод рекомендации фильмов

Версия для печатиSend by email

Молодые ученые факультета вычислительной математики и кибернетики МГУ предложили новый подход в работе с рекомендательной системой по подбору фильмов, который учитывает не только оценки пользователей, поставленные ими ранее просмотренным фильмам, но и описания сюжетов фильмов, а также жанровые предпочтения пользователей. Результаты исследования были представлены в рамках научной конференции «Тихоновские чтения».

С появлением сети Интернет объем информации, с которым человек ежедневно сталкивается, сильно увеличился. Это означает, что пользователи должны ориентироваться среди чрезвычайно большого количества доступных альтернатив, когда хотят, например, купить новый мобильный телефон или найти кинофильм для вечернего просмотра. В то же время, владельцы интернет-магазинов и различных интернет-сервисов заинтересованы в персональной рекламе и рекомендациях каждому конкретному пользователю, потому что такой подход может существенно увеличить прибыль компаний и повысить интерес к их продукту. Как результат, в последние годы значительно вырос интерес к разработке новых и улучшению существующих рекомендательных систем.

На данный момент большинство систем по подбору фильмов для просмотра строят рекомендации на основе оценок пользователей, которые те поставили ранее уже известным им фильмам. В результате такого подхода значительное количество дополнительной информации о пользователе и о фильме не учитывается. Исследования, в которых принимаются во внимание какие-либо признаки пользователей и объектов рекомендаций, проводятся в основном для английского языка или являются закрытыми.

Авторы предлагают формирование рекомендательной системы, которая в ходе своей работы использует оценки пользователей, описание сюжетов фильмов, как на русском, так и на английском языке, и жанровые предпочтения пользователей.

Перед разработкой рекомендательной системы необходимо было собрать набор данных, в котором хранилась бы необходимая информация. С помощью комбинации открытых наборов данных и информации с сайта Wikipedia данный набор был собран и выложен в открытый доступ. Для разработки рекомендательной системы использовались современные (state-of-art) методы построения рекомендаций и обработки естественного языка.

«Разработанная рекомендательная система состоит из двух модулей. Модуль построения рекомендаций для известных пользователей отвечает за подбор фильмов для пользователей, у которых уже оценены более 10 фильмов. Меньшее количество оценок не дает возможности учесть предпочтения пользователей и построить достаточно точные рекомендации», – рассказал магистрант факультета ВМК Владимир Дубинин.

Для целевого пользователя подбираются те фильмы, которые пользователь еще не смотрел, т.е. не оценил. Подбор осуществляется путем сравнения оценок разных пользователей для уже просмотренных (оцененных) фильмов. Среди всех пользователей особое внимание уделялось тем, оценки которых достаточно схожи с оценками фильмов целевого пользователя. Далее был проведен анализ оценки этих пользователей для фильмов, не просмотренных целевым пользователем. Если эти оценки высоки, то данные фильмы рекомендуются пользователю.  

Для фильмов, которые недавно добавлены в систему, может еще не быть достаточного количества оценок от пользователей. В данному случае используется текстовое описания сюжета этих фильмов, для того чтобы найти фильмы, известные системе и наиболее похожие на новые фильмы. Описания сюжетов обрабатываются с помощью современных языковых моделей (RuBert, MultilingualBert). При этом строятся векторные представления описаний, что позволяет находит близкие в полученном векторном пространстве объекты (т.е. похожие фильмы) с помощью, например, косинусного расстояния между векторами.

Модуль построения рекомендаций для неизвестных пользователей в своей работе опирается на жанровые предпочтения пользователей. Пользователю, у которого оценены менее 10 фильмов, предлагается однократно пройти небольшой опрос, указав его любимые киножанры. По этим данным модуль ищет пользователей, чьи жанровые предпочтения сходны с целевым пользователем, и строит первые рекомендации.

«Проведенные экспериментальные исследования показали, что рекомендательная система, которая учитывает дополнительную информацию о пользователях и фильмах, показывает результаты в среднем лучше, чем та, которая использует только оценки пользователей», – добавила ассистент кафедры алгоритмических языков факультета ВМК Наталья Ефремова.

В дальнейшем планируется модификация рекомендательной системы для совместного просмотра фильмов, что требует учета предпочтений нескольких пользователей.


Предложения по содержанию и функционированию сайта направляйте по адресу cmcproject@cs.msu.ru.