Projects Относно проекта Практическа общност Е-обучение Играй и учи
''
''
Author Kristiyan S. Simeonov
Added by Sofia University "St. Kliment Ohridski"

PDF

Keywords:
Format: Print
Compiler:
Title information: a text mining expedition in Pliny's Natural history
URL address:
APA citation: Simeonov, K. (2024) Unraveling the threads of Thrace: a text mining expedition in Pliny's Natural history, Научни известия "Наследство БГ", 108-113
Harvard citation: Simeonov, K. (2024) Unraveling the threads of Thrace, Научни известия "Наследство БГ", с. 108-113
License:
Copyright: IN COPYRIGHT

This endeavor aims to create an innovative information extraction algorithm for Pliny’s “Natural History.” We used the state-of-the-art Python NLP library SpaCy and the Latin language models in LatinCy to develop a modern solution. The algorithm accepts a single lemma or a list of lemmas as input, producing a CSV dataset containing citations, context, and lemma variants. This facilitates efficient linguistic analysis of Pliny’s work, initially focusing on Moesia and Thrace. We curated datasets on ethnonyms, places, mountains, and waterways. Using Streamlit and Matplotlib, we improved user interaction and visualization, aiding researchers in exploring ancient Thrace in Pliny’s writings.

Проект BG05M2OP001-1.001-0001 „Изграждане и развитие на център за върхови постижения „Наследство БГ“, финансиран по Оперативна програма „Наука и образование за интелигентен растеж” 2014-2020, приоритетна ос 1 „Научни изследвания и технологично развитие“, съфинансирана от Европейския съюз чрез Европейския фонд за регионално развитие (ЕФРР)”