International scientific e-journal

ΛΌГOΣ. ONLINE

16 (December, 2020)

e-ISSN: 2663-4139
КВ №20521-13361Р

ECONOMICS

UDC 332.6

DOI 10.36074/2663-4139.16.17

МАСОВА ОЦІНКА ЖИТЛОВОЇ НЕРУХОМОСТІ З ВИКОРИСТАННЯМ МЕТОДІВ МАШИННОГО НАВЧАННЯ

ЧЕРНУШЕВИЧ Валентин Андрійович

здобувач вищої освіти факультету менеджменту та маркетингу

Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

 

УКРАЇНА


Анотація. Розглядається сутність поняття масова оцінка. Аналізується особливості оцінки нерухомості з метою оподаткування в Україні. Досліджується модель масової оцінки житлової нерухомості з використанням методів машинного навчання. Продемонстровані результати моделі масової оцінки на базі градієнтного підсилення.

Ключові слова: нерухомість; оцінка нерухомості; масова оцінка; машинне навчання.

Згідно чинного законодавства, в Україні, під час здійснення угод купівлі-продажі об’єктів нерухомості закріплене обов’язкове визначення оцінювальної вартості з метою оподаткування. Питання вдосконалення існуючої системи грошової оцінки в розробки в нашій державі ставиться вже протягом багатьох років. Це зумовило необхідність розробки методології процедури автоматизованої оцінки з метою визначення оцінювальної вартості об’єкта з використанням економіко-математичних моделей оцінки.

В Україні діє недосконала система індивідуальної оцінки об’єктів нерухомості, яка має свої недоліки. Достовірна масова оцінка і прогнозування ринкової вартості об'єктів житлової нерухомості є одним із способів підвищення ефективності ринку нерухомості. Однак процес визначення і прогнозування ринкової вартості має високу ступінь складності, що обумовлено залежністю ринкових процесів від безлічі макроекономічних факторів економіки а також складності формального опису об’єктів оцінки. Тому ці економічні процеси переважно досліджуються за допомогою методів економіко-математичного моделювання.

Варто відзначити ефективність статистичних моделей при побудові екстраполяційних прогнозів, коли дослідник має справу з стаціонарними процесами і монотонною динамікою. В цілому даний підхід характеризується тим, що в основу методу закладається гіпотеза про можливий характер протікання процесу, який моделюється. Однак отримані рівняння не виключають високу ймовірність помилки в разі зміни тенденції.

Альтернативним підходом до прогнозування є підхід, при якому використовується сімейство алгоритмів машинного навчання. Область завдань, що вирішуються із застосуванням алгоритмів машинного навчання багато в чому збігається з завданнями, в рішенні яких застосовуються традиційні статистичні методи.

Машинне навчання (machine learning) - це комплексне застосування статистики для пошуку закономірностей в даних і створення на їх основі потрібних прогнозів. До недавнього часу, з огляду на те, що базові алгоритми навчання вимагали дуже потужних обчислень, даний підхід широко не поширювався. Однак в середині 2000-х рр. в результаті зростання комп'ютерних ресурсів стало можливо реалізовувати на практиці ресурсномісткі алгоритми навчання.

Серед алгоритмів машинного навчання найбільш часто на практиці використовуються наступні:

– Лінійна регресія.

– Логістична регресія.

– Лінійний дискримінантий аналіз (LDA).

– Дерева прийняття рішень.

– Наївний Байєсівський класифікатор.

– K-найближчих сусідів (KNN).

– Мережі векторного квантування (LVQ).

– Метод опорних векторів (SVM).

– Рекуренті нейронні мережі.

– Беггінг і випадковий ліс.

– Бустінг і AdaBoost.

– XGBoost

Завдання моделювання ринку нерухомості можна сформулювати як економічну інтерпретацію впливу всіх існуючих факторів на об'єкт нерухомості в конкретний момент часу. Застосування побудови прогнозних моделей методами машинного навчання продиктовано їх властивостями відтворювати надзвичайно складні залежності нелінійним моделюванням. Специфіка даного підходу полягає у відсутності чіткого алгоритму побудови моделі на відміну від стандартних параметричних методів аналізу.

Загальним обмеженням використання методів машинного навчання є необхідність використання великого обсягу знань для навчання і тестування моделі. Це пов'язано з тим, що алгоритми в чистому вигляді базуються лише на даних, не привертаючи ніяких апріорних міркувань, і наявних даних може бути недостатньо для навчання.

Численні наукові та літературні джерела свідчать про те, що статистичні методи знаходять все більш широке застосування в задачах оцінки. Досвід використання моделей в міжнародній практиці в літературі представлений ширше, при цьому вказані конкретні приклади такого застосування.

Градієнтне підсилення (бустінг) - метод машинного навчання для задач регресії і класифікації, який дозволяє об’єднувати декілька простих і неточних моделей в ансамбль (суму), в якому кожна наступна модель виправляє помилки уже доданих в ансамбль моделей.

Найбільш популярним базовим алгоритмом для градієнтного підсилення є дерева прийняття рішень. Дерево ухвалення рішень — використовується в галузі моделювання та інтелектуального аналізу даних для прогнозних моделей.

Структура дерева складається з таких елементів: «листя» і «гілки». На ребрах дерева ухвалення рішення записані атрибути з бінарною умовою, які впливають на значення цільової функції, в «листі» записані значення які функція можу набувати, а в інших вузлах — атрибути, за якими розрізняються випадки. Щоб класифікувати новий випадок, треба опуститись по бінарним умовам дерева до листа і отримати відповідне значення цільової функції в листі.

Рис. 1. Приклад побудованого дерева прийняття рішень.

 

Градієнтне підсилення дерев рішень – це алгоритм за яким кожне наступне дерево додається в ансамбль таким чином, що мінімізувати похибку вже доданих, схематично це зображено на рис.2.

Рис. 2. Принцип побудови ансамбля дерев рішень.

 

Єдина база даних звітів по оцінці майна дає можливість отримати інформацію по виконаним оцінкам у всіх областях України за період з 18.07.2018 по 23.11.2020. За цей період по житловій нерухомості в базу було додано 631 458 записів. Використовуючи ці данні та мову програмування python (а саме набір інструменті sklearn) була побудована модель масової оцінки на базі алгоритму градієнтного підсилення. Результати оцінки моделі були порівняні с результатами з Єдиної бази. Для порівняння використовувались тільки ті дані, які не брали участь при навчанні моделі. Результати оцінки моделі наведені на рис. 3. На ілюстрації продемонстровано відхилення прогнозних значень від реальних.

Рис 3. Прогнозні та реальні значення оцінок

 

Загальна похибка моделі 3.22% - була оцінена за допомогою метрики MAPE.

В результаті дослідження було проаналізована проблема оцінки нерухомості України. Можна зробити висновок, що система грошової оцінки в Україні має недоліки і потребує покращень. Запропонована модель масової оцінки на базі алгоритму градієнтного підсилення є досить точною для використання на практиці.


СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ:

 

  • Про оцінку майна, майнових прав та професійну оціночну діяльність  (Закон України). Вилучено з https://zakon.rada.gov.ua/laws/show/2047-1246.

  • Arribas, I.; Garcia, F.; Guijaro, F.; Oliver, J.; Tamosiuniene, R. Mass Appraisal of Residential Real Estate Using Multilevel Modelling. Int. J. Strateg. Prop. Manag. 2016, 20, 77–87.

  • Wu, C.; Ye, X.; Ren, F.; Du, Q. Modified Data-Driven Framework for Housing Market Segmentation. J. Urban Plan. Dev. 2018, 144.

  • Bidanset, P.E.; Lombard, J.R.; Davis, P.; McCord, M.; McCluskey, W.J. Further Evaluating the Impact of Kernel and Bandwidth Specifications of Geographically Weighted Regression on the Equity and Uniformity of Mass Appraisal Models. In Advances in Automated Valuation Modeling: Avm after the Non-Agency Mortgage Crisis; Damato, M., Kauko, T., Eds.; Springer: Berlin, Germany, 2017; Volume 86, pp. 191–199.


MASS EVALUATION OF RESIDENTIAL REAL ESTATE USING MACHINE LEARNING METHODS

CHERNUSHEVYCH V.,
Student of the Faculty of Management and Marketing
National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
UKRAINE

Abstarct.
The essence of the concept of mass assessment is considered. The peculiarities of real estate valuation with the support of taxation in Ukraine are analyzed. The model of mass assessment of real estate with the use of machine learning methods is investigated. The results of modeling of mass estimation on the basis of gradient amplification are demonstrated.

Keywords: real estate; real estate appraisal; mass assessment; machine learning.

© Чернушевич В.А., 2020

© Chernushevych V., 2020

 

This work is licensed under a Creative Commons Attribution 4.0 International License.

PUBLISHED : 15.12.2020