dc.contributor.advisor | Koupil, Pavel | |
dc.creator | Šimek, Jan | |
dc.date.accessioned | 2024-11-29T13:16:48Z | |
dc.date.available | 2024-11-29T13:16:48Z | |
dc.date.issued | 2024 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/192813 | |
dc.description.abstract | S rostoucím významem (multi-modelových) NoSQL systémů bez nebo s částečným schématem, které by přesně definovalo jednotlivé atributy v záznamech, je možnost zpět- ného odvození tohoto schématu z dat potřebná pro řadu aplikací. Projekt MM-infer, dříve vytvořený jako diplomová práce, umožňuje zpětně extrahovat toto schéma. Tento projekt však trpí nedostatky ve výkonosti, což limitovalo jeho použitelnost hlavně na velkých a komplexních datech. Tato práce pokračuje v projektu MM-infer a optimalizuje v první řadě jeho rychlost. Dále také opravuje některé chyby, které se nevyhnutelně vyskytly při jeho vytváření. Nakonec zvyšuje přesnost odvozovaného schéma přidáním další heuristiky identifikující hlavní prvky ve schématu do jednoho z algoritmů. 1 | cs_CZ |
dc.description.abstract | With the increasing importance of (multi-model) NoSQL systems without or with partial schema, which would precisely define each attribute in the records, is an option to reverse infer this schema from the data needed for plenty of applications. Project MM-infer created earlier as a master thesis enables to extract this schema. This project however suffers from faults in performance which limited its usability mainly on large and complex data. This thesis continues in MM-infer project and optimizes primaly its speed. It also fixes some bugs, which were inevitably created during its creation. At last it increases precision of the inferred schema by adding new heuristics which identify main elements in the schema from one of its algorithms. 1 | en_US |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | Optimalization|Schema inference|NoSQL databases|Profiling | en_US |
dc.subject | Optimalizace|Odvozování schéma|NoSQL databáze|Profilování | cs_CZ |
dc.title | Optimalizace přístupu pro odvozování schématu z multi-modelových dat | cs_CZ |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2024 | |
dcterms.dateAccepted | 2024-09-05 | |
dc.description.department | Department of Software Engineering | en_US |
dc.description.department | Katedra softwarového inženýrství | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 265066 | |
dc.title.translated | An optimization of an approach for the inference of schema from multi-model data | en_US |
dc.contributor.referee | Bártík, Jáchym | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Computer Science with specialisation in Programming and Software Development | en_US |
thesis.degree.discipline | Informatika se specializací Programování a vývoj software | cs_CZ |
thesis.degree.program | Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwarového inženýrství | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software Engineering | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Informatika se specializací Programování a vývoj software | cs_CZ |
uk.degree-discipline.en | Computer Science with specialisation in Programming and Software Development | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | S rostoucím významem (multi-modelových) NoSQL systémů bez nebo s částečným schématem, které by přesně definovalo jednotlivé atributy v záznamech, je možnost zpět- ného odvození tohoto schématu z dat potřebná pro řadu aplikací. Projekt MM-infer, dříve vytvořený jako diplomová práce, umožňuje zpětně extrahovat toto schéma. Tento projekt však trpí nedostatky ve výkonosti, což limitovalo jeho použitelnost hlavně na velkých a komplexních datech. Tato práce pokračuje v projektu MM-infer a optimalizuje v první řadě jeho rychlost. Dále také opravuje některé chyby, které se nevyhnutelně vyskytly při jeho vytváření. Nakonec zvyšuje přesnost odvozovaného schéma přidáním další heuristiky identifikující hlavní prvky ve schématu do jednoho z algoritmů. 1 | cs_CZ |
uk.abstract.en | With the increasing importance of (multi-model) NoSQL systems without or with partial schema, which would precisely define each attribute in the records, is an option to reverse infer this schema from the data needed for plenty of applications. Project MM-infer created earlier as a master thesis enables to extract this schema. This project however suffers from faults in performance which limited its usability mainly on large and complex data. This thesis continues in MM-infer project and optimizes primaly its speed. It also fixes some bugs, which were inevitably created during its creation. At last it increases precision of the inferred schema by adding new heuristics which identify main elements in the schema from one of its algorithms. 1 | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrství | cs_CZ |
thesis.grade.code | 1 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |