Zobrazit minimální záznam

Aplikace metod strojového učení pro odhad cen bytů v České republice
dc.contributor.advisorKrištoufek, Ladislav
dc.creatorNikodym, Jakub
dc.date.accessioned2019-10-18T11:15:03Z
dc.date.available2019-10-18T11:15:03Z
dc.date.issued2019
dc.identifier.urihttp://hdl.handle.net/20.500.11956/110189
dc.description.abstractIn this thesis, we propose alternative ways to apartments' mass appraisal. This work enriches the current literature by combining several techniques of data extraction and price estimation. We are not aware of any similar work providing an in-depth overview of the Czech apartment market. Throughout the empirical analysis, five different methods (OLS, LASSO, decision tree, random forests, and kNN) are applied to the dataset of 15,848 classifieds. The aim of the study is to find the most accurate method of esti- mating offering prices, using structured variables as well as data extracted by text mining. We use various accuracy statistics and graphical analysis to vali- date our results. Tree-based methods, specifically the random forest algorithm, results with the highest accuracy in predicting offering prices. Additionally, text-based variables included in the model cause the reduction of errors on linear models. The last part of the analysis covers the main determinants of property value in Prague and the rest of the Czech Republic. We show that prices in Prague can be estimated with higher preciseness and with the lower number of independent variables.en_US
dc.description.abstractV této diplomové práci navrhujeme alternativní způsoby hromadného oceňování bytů. Práce obohacuje současnou literaturu pomocí využití několika způsobů sběru dat a odhadu cen. Autor nemá vědomí o žádné práci, která by poskytla podobný přehled o českém trhu s nemovitostmi. Pomocí empirické analýzy aplikujeme pět různých metod (metoda nej- menších čtverců, regresní metoda lasso, rozhodovací strom, náhodné lesy a al- goritmus k-nejbližších sousedů) na datovou sadu 15 848 inzerátů. Cílem studie je najít nejpřesnější způsob odhadu cen, pomocí strukturovaných proměnných a dat extrahovaných z textu. K ověření výsledků používáme několik statistik přesnosti a grafickou analýzu. Metody obsahující rozhodovací stromy, konkrétně pak metoda náhodného lesa, dosahuje při předpovídání nabídkových cen ne- jvyšší přesnosti. Obsažení textových proměnných v lineárních modelech navíc způsobuje zmenšení chyb v odhadech. Poslední část analýzy zahrnuje porovnání determinantů cen nemovitosti v Praze a ve zbytku České republiky. Ukazujeme, že ceny v Praze lze odhadnout s vyšší přesností a s nižším počtem nezávislých proměnných.cs_CZ
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Fakulta sociálních vědcs_CZ
dc.titleApplication of machine learning methods for estimating apartment prices in the Czech Republicen_US
dc.typediplomová prácecs_CZ
dcterms.created2019
dcterms.dateAccepted2019-09-16
dc.description.departmentInstitut ekonomických studiícs_CZ
dc.description.departmentInstitute of Economic Studiesen_US
dc.description.facultyFakulta sociálních vědcs_CZ
dc.description.facultyFaculty of Social Sciencesen_US
dc.identifier.repId203087
dc.title.translatedAplikace metod strojového učení pro odhad cen bytů v České republicecs_CZ
dc.contributor.refereeBaruník, Jozef
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineEkonomie a financecs_CZ
thesis.degree.disciplineEconomics and Financeen_US
thesis.degree.programEkonomické teoriecs_CZ
thesis.degree.programEconomicsen_US
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csFakulta sociálních věd::Institut ekonomických studiícs_CZ
uk.taxonomy.organization-enFaculty of Social Sciences::Institute of Economic Studiesen_US
uk.faculty-name.csFakulta sociálních vědcs_CZ
uk.faculty-name.enFaculty of Social Sciencesen_US
uk.faculty-abbr.csFSVcs_CZ
uk.degree-discipline.csEkonomie a financecs_CZ
uk.degree-discipline.enEconomics and Financeen_US
uk.degree-program.csEkonomické teoriecs_CZ
uk.degree-program.enEconomicsen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csV této diplomové práci navrhujeme alternativní způsoby hromadného oceňování bytů. Práce obohacuje současnou literaturu pomocí využití několika způsobů sběru dat a odhadu cen. Autor nemá vědomí o žádné práci, která by poskytla podobný přehled o českém trhu s nemovitostmi. Pomocí empirické analýzy aplikujeme pět různých metod (metoda nej- menších čtverců, regresní metoda lasso, rozhodovací strom, náhodné lesy a al- goritmus k-nejbližších sousedů) na datovou sadu 15 848 inzerátů. Cílem studie je najít nejpřesnější způsob odhadu cen, pomocí strukturovaných proměnných a dat extrahovaných z textu. K ověření výsledků používáme několik statistik přesnosti a grafickou analýzu. Metody obsahující rozhodovací stromy, konkrétně pak metoda náhodného lesa, dosahuje při předpovídání nabídkových cen ne- jvyšší přesnosti. Obsažení textových proměnných v lineárních modelech navíc způsobuje zmenšení chyb v odhadech. Poslední část analýzy zahrnuje porovnání determinantů cen nemovitosti v Praze a ve zbytku České republiky. Ukazujeme, že ceny v Praze lze odhadnout s vyšší přesností a s nižším počtem nezávislých proměnných.cs_CZ
uk.abstract.enIn this thesis, we propose alternative ways to apartments' mass appraisal. This work enriches the current literature by combining several techniques of data extraction and price estimation. We are not aware of any similar work providing an in-depth overview of the Czech apartment market. Throughout the empirical analysis, five different methods (OLS, LASSO, decision tree, random forests, and kNN) are applied to the dataset of 15,848 classifieds. The aim of the study is to find the most accurate method of esti- mating offering prices, using structured variables as well as data extracted by text mining. We use various accuracy statistics and graphical analysis to vali- date our results. Tree-based methods, specifically the random forest algorithm, results with the highest accuracy in predicting offering prices. Additionally, text-based variables included in the model cause the reduction of errors on linear models. The last part of the analysis covers the main determinants of property value in Prague and the rest of the Czech Republic. We show that prices in Prague can be estimated with higher preciseness and with the lower number of independent variables.en_US
uk.file-availabilityV
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Fakulta sociálních věd, Institut ekonomických studiícs_CZ
thesis.grade.codeA


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV