Context-Enriched Prompting Strategies for Automated Data Specification Adjustment in Dataspecer Using LLMs, RAG and MCP
Strategie kontextově obohaceného promptování pro automatizovanou úpravu datových specifikací v Dataspeceru s využitím LLM, RAG a MCP
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/207052Identifikátory
SIS: 286271
Kolekce
- Kvalifikační práce [12034]
Autor
Vedoucí práce
Oponent práce
Klímek, Jakub
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika - Softwarové a datové inženýrství
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
10. 2. 2026
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
velké jazykové modely|datové specifikace|rag|mcp|automatizace úpravKlíčová slova (anglicky)
large language models|data specifications|rag|mcp|automated adjustmentTato práce se zabývá aplikací velkých jazykových modelů (LLM) pro automatizovanou úpravu datových specifikací v reakci na změny v reálném prostředí, jako jsou aktualizace API a databázových schémat. Práce je zasazena do kontextu nástroje Dataspecer, který je navržen tak, aby správa datových specifikací byla intuitivnější a přirozenější. Výzkum se zaměřuje na návrh a vyhodnocení strategií pro vstupy a výstupy LLM při podpoře údržby specifikací, se zvláštním důrazem na techniky promptování, jako je řetězení promptů, role-based prompting a využití few-shot příkladů. Studie se rovněž zabývá integrací LLM do složitějších vývojových prostředí prostřednictvím Model Context Protocolu (MCP) a Retrieval-augmented generation (RAG) za uvedeným účelem. Očekávanými výstupy jsou metodologie a prototypové řešení pro efektivní úpravy specifikací pomocí LLM, doplněné o experimentální vyhodnocení navrženého přístupu z hlediska přesnosti detekce rozdílů, klasifikace a úsudku.
This thesis elaborates on the application of LLMs to the automated adjustment of data specifications in response to real-world changes, such as updates of APIs and database schemas. The work is situated in the context of Dataspecer, a tool designed to make data specifications management more intuitive and natural. Research focuses on de- signing and evaluating strategies for LLM input and output to support specification maintenance, with particular attention to prompting techniques such as chaining, role- based prompting, and few-shot examples. The study explores the integration of LLMs into more complex tool environments using the MCP and RAG for the stated purpose. The expected outcomes include a methodology and prototype solution for effective LLM- driven specifications adjustment, alongside an experimental evaluation of the proposed approach.
