Diskretizácia spojitých premenných v úlohe kreditného skóringu

Jelenčiak, Jakub

Continuous Variables Discretization in Credit Scoring
Diskretizace spojitých proměnných v úloze kreditního skóringu

diplomová práce (NEOBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (347.5Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/199284

Identifikátory

SIS: 269366

Konzultant práce

Kopa, Miloš

Oponent práce

Branda, Martin

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Finanční a pojistná matematika

Katedra / ústav / klinika

Katedra pravděpodobnosti a matematické statistiky

Datum obhajoby

3. 6. 2025

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Slovenština

Známka

Neprospěl/a

Klíčová slova (česky)

diskretizácia|kreditné riziko|pravdepodobnosť zlyhania

Klíčová slova (anglicky)

credit risk|discretization|probability of defaut

Diskretizácia spojitých premenných je v oblasti kreditného skóringu dôležitým kro- kom, ktorý ovplyvňuje nielen interpretovateľnosť, ale aj predikčnú silu výsledných mode- lov. Hlavnou úlohou tejto práce je spracovanie relevantnej teórie, porovnanie skúmaných metód diskretizácie spojitých premenných a výkonnosti vybraných modelov v úlohe kre- ditného skóringu. Najprv predstavujeme základné princípy kreditného rizika a najpouží- vanejšie modely na odhad pravdepodobnosti zlyhania, ako sú logistická regresia, XGBoost a neurónové siete. Následne sa zameriavame na teoretické zavedenie a popis vybraných diskretizačných algoritmov, ktorými sú Equal-Width, ChiMerge a MDLP. V empirickej časti porovnávame tieto metódy a modely na reálnych dátach z oblasti kreditného rizika a prezentujeme získané výsledky. 1

Abstrakt (anglicky)

Discretization of continuous variables is an important step in credit scoring that af- fects not only the interpretability but also the predictive power of the resulting models. The main objective of this thesis is to elaborate on the relevant theory, compare the investigated methods of discretization of continuous variables and the performance of the selected models in the credit scoring task. First, we introduce the basic principles of credit scoring and the most widely used models for estimating default probabilities, such as logistic regression, XGBoost and neural networks. We then focus on the theoretical overview and description of selected discretization algorithms, which are Equal-Width, ChiMerge and MDLP. In the empirical part, we compare these methods and models on real credit risk data and present the obtained results. 1

Citace dokumentu

Metadata

Zobrazit celý záznam