Büyük veri analizinde etkin istatistiksel yöntemler

No Thumbnail Available

Date

2023

Journal Title

Journal ISSN

Volume Title

Publisher

Ankara Üniversitesi

Abstract

Bu tez çalışmasında, büyük veri kullanarak hedonik regresyon modeli ile bir ürünün fiyatını etkileyen faktörleri tespit edip her bir özelliğin fiyata olan katkısını ölçmek amaçlanmıştır. Büyük veri kaynağından elde edilen dizüstü bilgisayar ürün grubuna ait fiyat ve özellik bilgilerinden yararlanarak yapılan analizler çerçevesinde En Küçük Kareler (EKK) ve robust (Huber M ve MM tahmin edici) tahmin yöntemleri karşılaştırılmış ve en etkin tahmin edici ön plana çıkarılmıştır. Verilerde gözlenebilecek aykırı değerlerin etkisini en aza indiren robust yöntemler kullanılarak verilerdeki aykırı değerlerin analiz sonucunu en az şekilde etkilemesi hedeflenmiştir. Çalışmada kullanılan veri seti çerçevesinde; dizüstü bilgisayarın fiyatını ve özelliklerinin fiyata olan katkısını en etkin şekilde tahmin eden modelin Tam Logaritmik robust hedonik regresyon modeli olduğu gözlenmiştir. This thesis aims to use big data in order to determine the features affecting the price of a product with the hedonic regression model and to estimate the contribution of each feature to the price by using robust regression estimation methods. For the analysis, the price and features of the laptop product groups were obtained from the big data source by using the web scraping method. Four different alternatives of the hedonic regression model are used to determine the features affecting the price of the laptops. The contribution of each feature to the laptop price is estimated by using the robust estimation methods (M and MM) and the Ordinary Least Squares (OLS) estimation method, and the resulting estimates are compared for both methods. By using robust methods that minimize the effect of outliers that can be observed in the data, it is aimed that the outliers in the data will have the least effect on the analysis result. In the framework of the data set used in the study, it is observed that the effective model is the Logarithmic Robust Hedonic Regression Model.

Description

Keywords

Büyük veri, web kazıma, hedonik regresyon

Citation