Mostrar el registro sencillo del ítem
Caracterización de los municipios de Colombia según el potencial de crecimiento del ingreso por impuesto predial utilizando Machine Learning
dc.contributor.advisor | Cardona Ortegón, Andrés Felipe | |
dc.contributor.author | Delgado Vargas, Daniel | |
dc.date.accessioned | 2024-02-29T14:22:42Z | |
dc.date.available | 2024-02-29T14:22:42Z | |
dc.date.issued | 2023-10-21 | |
dc.identifier.uri | http://hdl.handle.net/10818/59338 | |
dc.description | 49 páginas | es_CO |
dc.description.abstract | El presente trabajo explora el potencial de crecimiento de los municipios de Colombia, utilizando aprendizaje automático para generar una recomendación que permita identificar lugares con crecimiento acelerado en el mediano plazo y entender las características que hacen estos destinos interesantes, ya que es complejo reconocerlos por la falta de información integrada. Como objetivo se buscó realizar la caracterización de los municipios mediante metodología CRISP-DM, y para lograrlo, se definió un factor de potencial de crecimiento y se identificaron las variables que explican este comportamiento. Se dispuso de información de todos los municipios de Colombia de 2008 al 2020, teniendo como variable objetivo el crecimiento anual de ingresos por impuesto predial, complementado con 1971 variables provenientes de fuentes oficiales como el DANE, DNP, Ministerio de Educación y Salud entre otros. Se utilizó un novedoso ensamble de técnicas de selección de variables donde se ejecutaron algoritmos de PCA, XGBOOST, Random Forest, RFE y SelectKBest, para seleccionar finalmente 600 variables que permitieron entrenar modelos de clasificación y regresión, identificando el de mejor desempeño para lograr crear un factor de potencial de crecimiento, que generó la posibilidad de agrupar los municipios en 5 categorías e identificar como variables de salud, educación, población, seguridad, pobreza, agricultura, justicia y economía explican el éxito de unos municipios donde es conveniente buscar oportunidades de inversión. | es_CO |
dc.format | application/pdf | es_CO |
dc.language.iso | spa | es_CO |
dc.publisher | Universidad de La Sabana | es_CO |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject.other | Impuesto predial -- Características -- Colombia | |
dc.subject.other | Inversión | |
dc.title | Caracterización de los municipios de Colombia según el potencial de crecimiento del ingreso por impuesto predial utilizando Machine Learning | es_CO |
dc.type | master thesis | es_CO |
dc.type.hasVersion | publishedVersion | es_CO |
dc.rights.accessRights | openAccess | es_CO |
dc.subject.armarc | Municipios -- Colombia | |
dcterms.references | Alvarez, F., Roman-Rangel, E., & Montiel, L. V. (2022). Incremental learning for property price estimation using location-based services and open data. Engineering Applications of Artificial Intelligence, 107. https://doi.org/10.1016/j.engappai.2021.104513 | |
dcterms.references | Andrews, D. (2010). Real House Prices in OECD Countries: The Role of Demand Shocks and Structural and Policy Factors. OECD Economics Department Working Papers, 831. | |
dcterms.references | Asal, M. (2018). Long-run drivers and short-term dynamics of Swedish real house prices. International Journal of Housing Markets and Analysis, 11(1). https://doi.org/10.1108/IJHMA-08-2017-0070 | |
dcterms.references | Bilgilioğlu, S. S., & Yılmaz, H. M. (2023). Comparison of different machine learning models for mass appraisal of real estate. Survey Review, 55(388), 32–43. https://doi.org/10.1080/00396265.2021.1996799 | |
dcterms.references | Bro, R., & Smilde, A. K. (2014). Principal component analysis. In Analytical Methods (Vol. 6, Issue 9). https://doi.org/10.1039/c3ay41907j | |
dcterms.references | Chen, Z., Goh, H. S., Sin, K. L., Lim, K., Chung, N. K. H., & Liew, X. Y. (2021). Automated Agriculture Commodity Price Prediction System with Machine Learning Techniques. Advances in Science, Technology and Engineering Systems Journal, 6(4). https://doi.org/10.25046/aj060442 | |
dcterms.references | Égert, B., & Mihaljek, D. (2007). Determinants of House Prices in Central and Eastern Europe. Comparative Economic Studies, 49(3). https://doi.org/10.1057/palgrave.ces.8100221 | |
dcterms.references | Lee, C. (2021). Exploring uncertainty in land price through learning models. International Journal of Advances in Soft Computing and Its Applications, 13(2), 78–94. | |
dcterms.references | Levantesi, S., & Piscopo, G. (2020). The importance of economic variables on London real estate market: A random forest approach. Risks, 8(4). https://doi.org/10.3390/risks8040112 | |
dcterms.references | Li, Y., & Chen, W. (2020). A comparative performance assessment of ensemble learning for credit scoring. Mathematics, 8(10). https://doi.org/10.3390/math8101756 | |
dcterms.references | Ma, J., Cheng, J. C. P., Jiang, F., Chen, W., & Zhang, J. (2020). Analyzing driving factors of land values in urban scale based on big data and non-linear machine learning techniques. Land Use Policy, 94. https://doi.org/10.1016/j.landusepol.2020.104537 | |
dcterms.references | Otchere, D. A., Ganat, T. O. A., Ojero, J. O., Tackie-Otoo, B. N., & Taki, M. Y. (2022). Application of gradient boosting regression model for the evaluation of feature selection techniques in improving reservoir characterisation predictions. Journal of Petroleum Science and Engineering, 208. https://doi.org/10.1016/j.petrol.2021.109244 | |
dcterms.references | Piergallini, A. (2020). Demographic change and real house prices: a general equilibrium perspective. Journal of Economics/ Zeitschrift Fur Nationalokonomie, 130(1), 85–102. https://doi.org/10.1007/s00712-019- 00670-y | |
dcterms.references | Porkodi, R. (2014). Comparison of Filter Based Feature Selection Algorithms : an Overview. International Journal of Innovative Research in Technology & Science(IJIRTS), 2(2). | |
dcterms.references | Ravi, S., & Larochelle, H. (2017). Optimization as a model for few-shot learning. 5th International Conference on Learning Representations, ICLR 2017 - Conference Track Proceedings. | |
dcterms.references | Sandeep Kumar, E., Talasila, V., Rishe, N., Suresh Kumar, T. V., & Iyengar, S. S. (2019). Location identification for real estate investment using data analytics. International Journal of Data Science and Analytics, 8(3). https://doi.org/10.1007/s41060-018-00170-0 | |
dcterms.references | Yakub, A. R. A., Hishamuddin, M. A., Kamalahasan, A., Jalil, R. B. A., & Folake, A. F. (2020). The effect of adopting micro and macro-economic variables on real estate price prediction models using ann: A systematic literature review. In Journal of Critical Reviews (Vol. 7, Issue 11). https://doi.org/10.31838/jcr.07.11.88 | |
dcterms.references | Yu, L., & Liu, H. (2003). Feature Selection for High-Dimensional Data: A Fast Correlation-Based Filter Solution. Proceedings, Twentieth International Conference on Machine Learning, 2. | |
dcterms.references | Zhu, Z., & He, K. (2022). Prediction of Amazon’s Stock Price Based on ARIMA, XGBoost, and LSTM Models. Proceedings of Business and Economic Studies, 5(5). https://doi.org/10.26689/pbes.v5i5.4432 | |
dcterms.references | Bentéjac, C., Csörgő, A., & Martínez-Muñoz, G. (2019). A Comparative Analysis of XGBoost. https://www.researchgate.net/publication/337048557_A_Comparative_Analy sis_of_XGBoost. | |
dcterms.references | Henriksson, E., & Werlinder, K. (2021). Housing Price Prediction over Countrywide Data: A comparison of XGBoost and Random Forest regressor models. Independent thesis. | |
thesis.degree.discipline | Facultad de Ingeniería | es_CO |
thesis.degree.level | Maestría en Analítica Aplicada | es_CO |
thesis.degree.name | Magíster en Analítica Aplicada | es_CO |