검토가 포함된 주의 인수분해 기계
홈페이지홈페이지 > 블로그 > 검토가 포함된 주의 인수분해 기계

검토가 포함된 주의 인수분해 기계

Jul 09, 2023

Scientific Reports 13권, 기사 번호: 13454(2023) 이 기사 인용

278 액세스

1 알트메트릭

측정항목 세부정보

추천 시스템에서 항목에 대한 사용자 리뷰에는 사용자의 선호도와 항목 기능을 표현할 수 있는 풍부한 의미 정보가 포함되어 있습니다. 그러나 기존 리뷰 기반 추천 방법은 정적 단어 벡터 모델을 사용하거나 리뷰에서 긴 시퀀스 특징을 효과적으로 추출하지 못하여 사용자 특징 표현 능력이 제한됩니다. 또한 사용자와 항목 간의 다르거나 쓸모 없는 기능 상호 작용이 추천 성능에 미치는 영향은 무시됩니다. 따라서 우리는 먼저 RoBERTa를 활용하여 각 사용자/항목 리뷰의 임베딩 기능을 얻고, 더 많은 것을 강조하기 위해 양방향 게이트 반복 단위를 주의 네트워크와 결합하는 AFMRUI(리뷰 기반 사용자-항목 추천 상호 작용을 갖춘 주의력 분해 기계를 제안합니다. 사용자 리뷰와 아이템 리뷰 모두에 유용한 정보입니다. 그런 다음 AFM을 채택하여 사용자-항목 기능 상호 작용을 학습하여 다양한 사용자-항목 기능 상호 작용의 중요성을 구별하고 더 정확한 평가 예측을 얻어 추천을 촉진합니다. 마지막으로 5개의 실제 데이터 세트에 대한 성능 평가를 수행했습니다. 5개 데이터 세트에 대한 실험 결과는 제안된 AFMRUI가 일반적으로 사용되는 두 가지 평가 지표와 관련하여 최첨단 검토 기반 방법보다 성능이 우수하다는 것을 보여주었습니다.

인터넷 산업과 빅데이터 기술의 급속한 발전으로 추천 시스템은 소셜 네트워크1, 학술 교육2, 전자상거래3 등에서 점점 더 중요한 역할을 하고 있습니다. 요즘에는 온라인 쇼핑4, 다음 관심 장소 추천5, 음악 추천6, 동영상 푸시7 등 추천 시스템이 일상생활에서 없어서는 안 될 부분이 되었습니다. 추천 시스템은 사용자의 과거 행동 데이터를 기반으로 사용자의 아이템 평가를 예측하고 개인화된 추천을 수행하여 사용자가 관심 있는 아이템을 빠르게 발견할 수 있도록 돕고 사용자 만족도를 높일 수 있습니다. 따라서 보다 나은 개인화 추천 서비스를 제공하기 위해서는 아이템에 대한 사용자의 평가를 어떻게 정확하게 예측하여 추천을 높이는 것이 어려운 문제가 됩니다.

위와 같은 문제를 해결하기 위해 연구자들은 다양한 항목 등급 예측 방법을 제안했는데, 그 중 협업 필터링(CF) 기반의 등급 예측 방법8은 가장 널리 사용되는 방법 중 하나이다. 대부분의 CF 방법은 행렬 인수분해9,10를 기반으로 하며 추천을 위해 행렬 모델에서 사용자 및 항목의 잠재 기능을 학습합니다. 항목에 대한 사용자 평가가 사용자의 상호 작용 행동과 명시적 특징을 반영한다는 점을 고려하여 Zhang et al.11은 심층 행렬 분해를 기반으로 사용자 항목 평가 정보에서 사용자 및 항목 특징을 얻었습니다. 그러나 사용자 수와 아이템 수가 급격히 증가함에 따라 평가 데이터의 희소성 등의 문제가 점점 더 많아지고 있습니다. 불행하게도 등급 데이터에서 추출된 정보는 제한적이므로 결과적으로 추천 성능이 제한됩니다.

평점 데이터에 비해 리뷰 정보에는 풍부한 의미가 포함되어 있어 아이템 품질과 기능에 대한 사용자 만족도를 반영할 수 있을 뿐만 아니라 사용자의 선호도와 아이템 기능을 간접적으로 표현할 수도 있습니다12. 따라서 리뷰 기반의 항목 평점 예측은 ConvMF13, DeepCoNN14, D-Attn15, NARRE16, DAML17 등의 연구자들로부터 많은 주목을 받고 있습니다. 이러한 방법은 리뷰 정보를 통해 평점 데이터로 인해 발생하는 희소성 문제를 완화할 수 있으며 이를 통해 추천에 대한 비교적 정확한 예측 등급. 그러나 다음과 같은 두 가지 주요 제한 사항이 있습니다.

사용자/아이템 특성 표현 능력이 부족합니다. 위의 연구에서 D-Attn15, DAML17 등은 word2vec 또는 Glove와 같이 정적으로 인코딩된 단어 벡터를 활용하여 희박한 특징 표현, 불충분한 의미 및 다의어를 초래하여 모델이 사용자 및 항목 특징을 추출하는 능력에 영향을 미칩니다. 또한 ConvMF13, DeepCoNN14, NARRE16 등의 모델은 CNN(Convolutional Neural Network)을 사용하여 리뷰에서 사용자 및 항목 특성을 추출하는데, 이는 리뷰에서 긴 시퀀스 텍스트 특성을 효과적으로 추출할 수 없으므로 사용자 또는 항목 특성을 정확하게 표현할 수 없어 모델 성능.