ANALYSIS OF CUSTOMER EXPERIENCE IN THE HOTEL BUSINESS
- Authors: Filippov R.A1, Sazonova A.S1, Lazareva D.E1, Filippova L.B1
- Affiliations:
- Bryansk State Technical University
- Issue: No 3 (2022)
- Pages: 127-140
- Section: ARTICLES
- URL: https://ered.pstu.ru/index.php/amcs/article/view/3525
- DOI: https://doi.org/10.15593/2499-9873/2022.03.07
- Cite item
Abstract
In the process of marketing research, it is necessary to process large volumes of accumulated reviews, so it is obvious that the process of processing and analysis should be automated. Modern technical capabilities allow you to create an information and analytical system for formalized analysis of consumer reviews about hotels. The analysis of consumer reviews contributes to the development of the hotel business, since reviews are a qualitative way to assess the effectiveness of the company. With their help, it becomes clear what elements of the hotel complex should be paid attention to with the aim of their possible improvement in the future. The trends observed in reviews also allow you to find out what consumers expect and how best of all you can live up to their expectations. In fact, the task of analyzing the tonality of the text is equivalent to the problem of text classification, where tonal estimates can be categories of texts. To teach the classification model, a set of marked data downloaded from the Internet was used. The set contains 18,500 reviews about the hotels of Europe in Russian with the tonality indicated for them. The article is devoted to the urgent problem of determining the consumer attitude to services provided in the hotel business based on reviews from the Internet. A solution to the problem of analyzing the tonality of the entities of the hotel, extracted from the reviews about the hotel. To solve the problem, the MLP algorithm is selected, since the task of analyzing tonality is reduced to the task of classification, where tonal estimates are classification classes. Particular attention is paid to the algorithm for teaching a classification model developed using the Keras library in Python. To solve the task of analyzing the tonality of entit
Full Text
Введение На сегодняшний день гостиничный бизнес представляет собой сферу, связанную с предоставлением не только услуг размещения клиентов, но и услуг питания, развлечения, отдыха, спорта. Современные отели, как правило, обладают целой экосистемой, состоящей из различных сервисов и услуг. Для того чтобы отелю отслеживать и регулировать удовлетворенность клиентов от каждой внедряемой услуги, требуется подключить много ресурсов. Сегодня решение данной задачи можно автоматизировать благодаря созданию информационной системы, которая сможет собирать обратную связь в виде отзывов от клиентов отеля из открытых источников сети Интернет и их анализировать. Для того чтобы более четко определить зоны неудовлетворенности клиентов отеля, при анализе отзывов из них должны быть извлечены основные сущности, являющиеся частью экосистемы отеля, и затем для каждой сущности должно быть определено эмоциональное отношение клиента к ней. Таким образом, у руководства отеля появляется возможность определить степень удовлетворенности клиента по отношению не к отелю в целом, а к каждой его сущности в отдельности. Это позволит точечно и своевременно улучшать сервис, которым клиент не удовлетворен, для повышения лояльности клиента и увеличения прибыли отеля. Также руководству отеля важно не только анализировать эффективность внутренних сервисов, но и учитывать внешние факторы, которые могут влиять на развитие отеля. В рамках маркетинговых исследований для отеля, как правило, проводится анализ конкурентов на рынке [1]. Проведение конкурентного анализа позволяет определить прямых конкурентов отеля и выполнить сравнительный анализ. Если руководство отеля будет понимать собственные конкурентные преимущества и недостатки, то сможет правильно сформировать стратегию развития отеля для достижения рейтинговых позиций на рынке. По мере расширения гостиничного бизнеса в нем формируется система маркетинга с целью развития основных компонентов гостиничного комплекса. Для достижения этой цели проводятся маркетинговые исследования - совокупность мероприятий, нацеленных на систематический сбор, обработку и анализ данных по различным аспектам маркетинговой деятельности компании [1]. В данном исследовании целевым аспектом является анализ отзывов потребителей об отелях, собранных из открытых источников. В данном исследовании основой для анализа послужат отзывы об отелях. В качестве задачи формализованного анализа выбрана задача определения тональности сущностей, извлеченных из отзывов об отеле. Сначала из отзывов выделяются сущности отеля на основе частотного анализа, а далее для полученных сущностей определяется их тональность. Теория На сегодняшний день существуют различные системы, занимающиеся анализом потребительского опыта в сфере гостиничного бизнеса. Наиболее популярными считаются TrustYou и GuestRevu [2]. Такие системы позволяют собирать и анализировать отзывы для того, чтобы получать информацию напрямую от клиентов, независимо от того, на каком языке был написан отзыв. К основным преимуществам данных систем относят мониторинг более 200 веб-ресурсов, включая Booking.com и TripAdvisor, и возможность оповещать о появлении новых отзывов и отвечать на них сразу в едином интерфейсе. Однако TrustYou и GuestRevu - это платные системы с закрытым исходным кодом, что является существенным недостатком. Компания по управлению репутацией отелей TrustYou в 2018 г. проводила исследование под названием TrustYou Study Emphasizes Importance of Online Feedback Management And Review Collection For Accommodations. По результатам исследования при сопоставимых ценах путешественники в 3,9 раза чаще выбирают отель с более высокой оценкой по отзывам. Таким образом, можно сделать вывод: анализ отзывов потребителей способствует развитию объектов гостиничного бизнеса, поскольку отзывы - это качественный способ оценки эффективности работы компании. Отзывы позволяют определить точки развития для отеля и в будущем увеличить прибыль компании. На данный момент существует множество сервисов, производящих агрегацию данных по отелям, что позволяет выполнять регулярный сбор отзывов потребителей для дальнейшего анализа. Также компании могут самостоятельно накапливать массивы данных за длительные периоды времени. В процессе маркетинговых исследований приходится обрабатывать большие объемы накопленных отзывов. А также, учитывая специфику отзывов, а именно - их написание на естественном языке, становится очевидным, что процесс их обработки и анализа должен быть автоматизирован. Наличие технических возможностей позволяет в данной ситуации создать информационно-аналитическую систему для автоматизированного сбора и анализа отзывов потребителей об отелях [1]. Методы и материалы исследования В рамках исследования разработана система анализа потребительского опыта в сфере гостиничного бизнеса, отличающаяся от аналогов использованием методов интеллектуального анализа. Основным преимуществом будет являться отчет, полученный в результате анализа тональности сущностей, извлеченных из отзывов об отеле. Для решения задачи сбора необходимых данных был написан парсер информации об отелях и их отзывах - программный комплекс для автоматического сбора данных и их структурирования. В качестве основного источника был выбран сервис по агрегации данных по отелям - Tripadvisor. В результате парсинга в базу данных ИАС были добавлены данные о более чем 1600 отелях. Общее количество отзывов об отелях составило более 56 000 штук. В процессе декомпозиции задачи была разработана архитектура информационной системы (рис. 1). Рис. 1. Схема архитектуры ИАС В качестве архитектуры программного комплекса была выбрана модель «клиент - сервер». Такая модель позволит выполнять анализ данных на сервере при минимуме нагрузки на клиентское приложение [3]. Для организации клиент-серверной архитектуры был создан модуль клиент-серверного взаимодействия. Внутри серверной части также был разработан модуль взаимодействия с базой данных ИАС. Основные модули ИАС - модуль визуализации данных и аналитические модули - отображены на диаграмме IDEF0 (рис. 2). Для передачи данных на вход алгоритму MLP им необходимо пройти процедуру предобработки. Данная процедура включает в себя следующие этапы: 1. Перевод всех букв в тексте в нижний регистр. Выполняется для того, чтобы одинаковые слова, написанные с заглавной и строчной букв, идентифицировались как одно слово. 2. Удаление пунктуации. Подразумевает удаление из отзывов символов из заранее заданного набора, в который включены наиболее распространенные знаки пунктуации. 3. Токенизация. Процедура токенизации представляет собой разбиение текста на более мелкие части, называемые токенами. К токенам относятся абзацы, слова, буквы [4]. В проекте токенизация выполняется путем приведения отзывов к массиву отдельных слов. 4. Удаление стоп-слов. В рамках данного исследования стоп-слова - это слова на русском языке, которые не придают особого значения предложению. Их можно смело игнорировать, не жертвуя смыслом отзыва. Рис. 2. Диаграмма модулей ИАС 5. Лемматизация. Основная идея лемматизации состоит в приведении слова к словарной форме - лемме [5]. Для полученных слов из отзывов сначала выполняется морфологический анализ на основе словаря для русского языка. С помощью результатов данного анализа слова приводятся в словарной форме. 6. Векторизация. Большинство математических моделей работают в векторных пространствах, поэтому необходимо отобразить текст в векторном пространстве. В разрабатываемой системе для векторизации обработанных отзывов используется модель Word2vec из библиотеки Python Gensim [6]. В качестве параметров для модели были заданы: • размер вектора - 50, • алгоритм обучения модели - Skip-gram. Для решения задачи классификации был выбран алгоритм многослойного перцептрона MLP. Многослойными персептронами называют нейронные сети прямого распространения. Как правило, все нейроны в слое соединены со всеми нейронами в соседнем слое однонаправленными соединениями [7]. Эти соединения характеризуются весами. Модель Математическая модель нейрона описывается следующим образом: 1. Расчет взвешенной суммы (1) где - k-й нейрон текущего слоя; - i-й нейрон следующего слоя; - вес, характеризующий соединение между k-м нейроном текущего слоя и i-м нейроном следующего слоя. 2. Расчет значения функции активации для взвешенной суммы (2) где F(x) - функция активации. Анализ тональности был выполнен на Python с помощью библиотеки Keras - часть библиотеки TensorFlow для анализа данных. Преимущество использования данной библиотеки состоит в том, что каждый слой нейронной сети задается и настраивается вручную [8]. Входной слой для многослойного перцептрона состоит из 50 нейронов, выходной слой - из одного нейрона. Задан один скрытый слой, и в качестве функции активации была выбран сигмоид. Путем тестирования разных комбинаций параметров модели она была настроена таким образом, что конечная точность модели была равна 0,88. После обучения модель была сохранена в файл, для того чтобы использовать ее при определении тональности сущностей, извлеченных из отзывов отеля, хранящихся в БД ИАС. Результаты исследований и их обсуждение В данной ИАС целевой характеристикой является оценка тональности сущности, которая представлена дробным числом в промежутке [0; 1]. Таким образом, можно сделать вывод: • если значение целевой характеристики ближе к 0, то сущность имеет отрицательный окрас, • если значение целевой характеристики ближе к 0,5, то сущность имеет нейтральный окрас, • если значение целевой характеристики ближе к 1, то сущность имеет положительный окрас. Аналитический модуль ИАС включает три вида результатов: 1. Отчет о тональностях сущностей, извлеченных из отзывов об отеле. Отчет представляет собой список иерархической структуры, элементами которого являются уровень сущности внутри иерархии, название сущности и ее тональность, средняя по всем отзывам отеля (рис. 3). 2. Гистограмма сравнения тональностей сущностей. Для построения гистограммы пользователь указывает необходимый набор ключевых слов по уровням. В результате будет получена гистограмма для сравнения тональностей ключевых слов одного уровня. Рис. 3. Отчет о тональностях сущностей отеля 3. График изменения тональности сущности. Для построения графика пользователь задает необходимые параметры: сущность и временной промежуток (дата начала и дата конца промежутка). В результате будет получен график зависимости тональности сущности от даты пребывания рецензента в отеле (рис. 4). Рис. 4. График изменения тональности на примере сущности «Рестораны и бары» Заключение В ходе научного исследования потребительского опыта в гостиничном бизнесе была разработана информационно-аналитическая система (ИАС), которая включает информацию о 1600 отелях. Общее количество отзывов об отелях составило более 56 000 штук. Разработанная ИАС позволяет проводить анализ тональности отзывов, таким образом можно получить информацию о наиболее интересующих клиентов вопросах, выяснить причины успешности построенного бизнеса, обратить внимание на критичные недостатки и исправить их. Представленная математическая модель может быть использована при проектировании подобных систем информационного анализа [9-17]. С помощью отзыва потребитель может объяснить, почему вернется в отель еще раз или, наоборот, больше не приедет. Важно понимать, как строить бизнес-стратегию так, чтобы развиваться и улучшать гостиничный сервис, и для этого необходимо анализировать то, что пишут клиенты. Полученные в ходе анализа отзывов результаты позволят компаниям достигнуть конкретных результатов, среди которых: • увеличение продаж; • выявление наиболее популярных товаров и услуг; • повышение качества обслуживания клиентов; • уменьшение расходов и повышение рентабельности бизнеса; • удержание клиентов. Анализ динамики изменения тональности отзывов конкретного бизнеса позволит повысить эффективность построенного бизнеса.About the authors
R. A Filippov
Bryansk State Technical University
A. S Sazonova
Bryansk State Technical University
D. E Lazareva
Bryansk State Technical University
L. B Filippova
Bryansk State Technical University
References
- Корнеевец В.С., Семенова Л.В. Маркетинг и продажи в гостиничном бизнесе: учебное пособие. - Калининград: Балтийский федеральный университет им. Иммануила Канта, 2008. - 172 c. - ISBN 978-5-88874-904-3. - Текст: электронный // Электронно-библиотечная система IPR BOOKS: [сайт]. - URL: https://www.iprbookshop.ru/3168.html (дата обращения: 26.06.2022).
- Система управления репутацией TrustYou [Электронный ресурс]. - URL: https://www.bigt.ru/trustyou (дата обращения: 26.06.2022).
- Технология клиент-сервер [Электронный ресурс]. - URL: https://it-black.ru/tekhnologiya-kliyent-server (дата обращения: 26.06.2022).
- Основы Natural Language Processing для текста [Электронный ресурс]. - URL: https://habr.com/ru/company/Voximplant/blog/446738/(дата обращения: 26.06.2022).
- Батура Т.В. Математическая лингвистика и автоматическая обработка текстов на естественном языке: учебное пособие. - Новосибирск: Новосибирский государственный университет, 2016. - 166 c. - ISBN 978-5-4437-0548-4. - Текст: электронный // Электронно-библиотечная система IPR BOOKS: [сайт]. - URL: https://www.iprbookshop.ru/93489.html (дата обращения: 26.06.2022).
- Word2Vec: как работать с векторными представлениями слов [Электронный ресурс]. - URL: https://neurohive.io/ru/osnovy-data-science/word2vec-vektornye-predstavlenija-slov-dlja-mashinnogo-obuchenija (дата обращения: 26.06.2022).
- Горожанина Е.И. Нейронные сети: учебное пособие. - Самара: Поволжский государственный университет телекоммуникаций и информатики, 2017. - 84 c. - Текст: электронный // Электронно-библиотечная система IPR BOOKS: [сайт]. - URL: https://www.iprbookshop.ru/75391.html (дата обращения: 26.06.2022).
- Маккинли, У. Python и анализ данных / пер. А. Слинкина. - 2-е изд. - Саратов: Профобразование, 2019. - 482 c. - ISBN 978-5-4488-0046-7. - Текст: электронный // Электронно-библиотечная система IPR BOOKS: [сайт]. - URL: https://www.iprbookshop.ru/88752.html (дата обращения: 26.06.2022).
- Intelligent System of Classification and Clusterization of Environmental Media for Economic Systems / A.A. Kuzmenko, L.B. Filippova, A.S. Sazonova, R.A. Filippov // Proceedings of the International Conference on Economics, Management and Technologies 2020 (ICEMT 2020). - Advances in Economics, Business and Management Research. - 2020. - Vol. 139. - P. 583-586 (дата обращения: 26.06.2022).
- Selection of rational schemes automation based on working synthesis instruments for technological processes / YU.A. Leonov, E.A. Leonov, A.A. Kuzmenko, A.A. Martynenko , E.E. Averchenkova, R.A. Filippov - Yelm, WA, USA: Science Book Publishing House LLC, 2019 - 192 p. - ISBN: 978-5-9765-4023-1.
- Основы инновационной деятельности предприятия: учебное пособие / Е.Э. Аверченкова, А.С. Сазонова, А.В. Аверченков, А.А. Кузьменко, А.А. Тищенко, Р.А. Филиппов - М.: ООО «Флинта», 2019. - 162 с. - ISBN: 978-5-9765-4212-9- Текст: непосредственный.
- Кузьменко А.А., Кондрашин Д.Е. Методы и подходы к разработке системы автоматизированного анализа динамики изменения площади лесных насаждений на основе методов автоматического распознавания образов. - Брянск: ЭРГОДИЗАЙН, 2019. - C. 230-240.
- Сазонова А.С., Филиппов Р.А., Филиппова Л.Б. Теория информационных процессов и систем: учебно-методическое пособие. - Брянск, 2016.
- Law R., Leung D., and Cheung C. A systematic review, analysis and evaluation of research articles in the Cornell Hospitality Quarterly // Cornell Hospitality Quarterly. - 2012. - Vol. 53 (4). - P. 365-381.
- Line N.D., and Runyan R.C. Hospitality marketing research: Recent trends and future directions // International Journal of Hospitality Management. - 2012. - Vol. 31 (2). - P. 477-488.
- Teng C.Commercial hospitality in restaurants and tourist accommodation: Perspectives from international consumer experience in Scotland // International Journal of Hospitality Management. - 2011. - Vol. 30(4). - P. 866-874.
- Paradigms in service research / B. Tronvoll, S.W. Brown, D.D. Gremler, B. Edvardsson // Journal of Service Management. - 2011. - Vol. 22 (5). - P. 560-585.
Statistics
Views
Abstract - 174
PDF (Russian) - 131
Refbacks
- There are currently no refbacks.