Detekcia anonymizovaných častí v zmluvách
Anonymized parts detection in contracts
Detekcia anonymizovaných častí v zmluvách
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/193191Identifiers
Study Information System: 256071
Collections
- Kvalifikační práce [11363]
Author
Advisor
Referee
Mírovský, Jiří
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computer Science with specialisation in Computer Graphics, Vision and Game Development
Department
Department of Software and Computer Science Education
Date of defense
6. 9. 2024
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Slovak
Grade
Excellent
Keywords (Czech)
PDF|segmentace|detekceKeywords (English)
PDF|segmentation|detectionPráca skúma problém detegovania anonymizovaných častí v PDF dokumentoch. Preskúmané boli rôzne prístupy na detekciu, primárne analýza obrazu a s ňou spojené rôzne algoritmy počítačového videnia. Najlepší z týchto prístupov sme implementovali a vyhodnotili na testovacích dátach. Výsledky ukázali, že implementovaný prístup dosiahol vysokú presnost ' a predbehol iné prístupy aj vzhl'adom na efektivitu. Tento výskum prispieva k rozvoju nástrojov pomáhajúcich analyzovat ' dokumenty, ktoré môžu byt ' aplikované v rôznych právnych či finančných oblastiach na zaručenie ochrany dát v súlade s reguláciami.
The work examines the problem of detecting anonymized parts in PDF documents. Various detection approaches, primarily image analysis and related computer vision algorithms, were explored. We implemented and evaluated the best of these approaches on test data. The results showed that the implemented approach achieved high accuracy and outperformed other approaches also in terms of efficiency. This research contributes to the development of tools to help analyze documents that can be applied in various legal or financial areas to guarantee data protection in accordance with regulations.