Формирование картографических материалов по текстам травелогов с использованием механизмов генерации с дополненной выборкой

Формирование картографических материалов по текстам травелогов с использованием механизмов генерации с дополненной выборкой

Картография и геоинформатика
УДК: 528.9:004.891.2
DOI: 10.33764/2411-1759-2025-30-5-33-40
1 Новосибирский государственный технический университет, языковой центр «Лингва», г. Новосибирск, Российская Федерация

Финансирование: -

Аннотация:

Предложено решение проблемы ограничений в ответах больших языковых моделей относительно актуальных и специализированных данных посредством использования методов генерации с дополненной выборкой. Рассмотрены существующие подходы и технические решения данного варианта построения запросов к базам данных, а также примеры использования в задачах картографирования маршрутов из травелогов, их анализа и проверки на основе существующих картографических и геоинформационных материалов. Описан механизм преобразования имеющихся картографических материалов в текстовое описание посредством использования типовых шаблонов для разных видов объектов, где отдельные параметры заполняются на основе конкретных текстовых и числовых значений, получаемых из геометрических характеристик и атрибутивных значений объектов векторной карты. Выполнена апробация предлагаемого подхода на основе геоинформационной системы QGIS, векторной базы данных FIASS, векторизатора и большой языковой модели YandexGPT.

Читать статью Скачать JATS XML

Библиографический список:

  1. Mai G., Huang W., Sun J., Song S., Mishra D., Liu N., Gao S., Liu T., Cong G., Hu Y., Cundy C., Li Z., Zhu R., Lao N. On the Opportunities and Challenges of Foundation Models for GeoAI (Vision Paper) // ACM Trans. Spatial Algorithms Syst, 2024. – 10(2)-11. – P. 46. – DOI 10.1145/3653070.
  2. Jonathan R., Luddecke T., Das S., Han K., Albanie S. GPT4GEO: How a Language Model Sees the World's Geography [Electronic resource] // ArXiv abs/2306.00020, 2023. – URL: https://arxiv.org/abs/2306.00020 (дата обращения: 05.11.2024).
  3. Li Z., Ning H. Autonomous GIS: the next-generation AI-powered GIS // International Journal of Digital Earth, 2023. – 16 (2). – P. 4668–4686. – DOI 10.1080/17538947.2023.2278895.
  4. Ran T., Xu J. Mapping with ChatGPT // ISPRS International Journal of Geo-Information. 2023. – Vol. 12. – No. 7. – P. 284. – DOI 10.3390/ijgi12070284.
  5. Sambandam P., Yuvaraj D., Padmakumari P., Swaminathan S. Deep attention based optimized Bi-LSTM for improving geospatial data ontology // Data & Knowledge Engineering. – 2023. – Vol. 144. – P. 102123. – DOI 10.1016/j.datak.2022.102123.
  6. Скрынникова И. В. Интерпретационные проблемы LLM: загадки образного языка // Когнитивные исследования языка. – 2024. – № 2-2 (58). – С. 638–642.
  7. Lewis P., Piktus A., Petroni F. Retrieval-augmented generation for knowledge-intensive NLP tasks // Advances in Neural Information Processing Systems (Virtual, Online, 06–12 декабря 2020 г.). – P. 34.
  8. Naraki Y., Yamaki R., Ikeda Y., Horie T., Naganuma H. Augmenting NER Datasets with LLMs: Towards Automated and Refined Annotation // ArXiv abs:2404.01334v1 [cs.CL], 2024. – URL: https://arxiv.org/abs/2404.01334 (дата обращения: 05.11.2024).
  9. Wang S., Sun X., Li X., Ouyang R., Wu F., Zhang T., Li J., Wang G. GPT-NER: Named Entity Recognition via Large Language Models // ArXiv abs: 2304.10428, 2023. – URL: https://arxiv.org/abs/2304.10428 (дата обращения: 05.11.2024).
  10. Zhichao Z., Zhao Q., Li J., Ge Y., Ding X., Gu T., Zou J., Lv S., Wang S., Yang J. Comparative Analysis of Large Language Models in Chinese Medical Named Entity Recognition // Bioengineering, 2024. – Vol. 11. – No. 10. – P. 982. – DOI 10.3390/bioengineering11100982.
  11. Ja P. Automating Threat Intelligence Analysis with Retrieval Augmented Generation (RAG) for Enhanced Cybersecurity Posture // International Journal of Science and Research, 2024. – Vol. 13, No. 5. – P. 251–255. – DOI 10.21275/sr24502103758.
  12. Mozharovskii E. Evaluating Retrieval-Augmented Generation (RAG) techniques in enhancing LMS for coding tasks // Universum: технические науки, 2024. – No. 6-6 (123). – P. 22–26.
  13. Томилов Н. А., Туров В. П., Бабаянц А. А., Платонов А. В. Метод хранения векторных представлений в сжатом виде с применением кластеризации // Научно-технический вестник информационных технологий, механики и оптики, 2024. – Т. 24, № 1. – С. 112–117. – DOI 10.17586/2226-1494-2024-24-1-112-117.
  14. Unlu O., Shin Ch. J., Mailly J. Retrieval-Augmented Generation–Enabled GPT-4 for Clinical Trial Screening // NEJM AI, 2024. – Vol. 1, No. 7. – DOI 10.1056/aioa2400181.
  15. Martin A., Witschel H. F., Mandl M., Stockhecke M. Semantic Verification in Large Language Model-based Retrieval Augmented Generation // Proceedings of the AAAI Symposium Series, 2024. – Vol. 3, No. 1. – P. 188–192. – DOI 10.1609/aaaiss.v3i1.31199.
  16. Федоров В. О., Поляков Р. А. Большие языковые модели с поисковой расширенной генерацией: обзор и перспективы // Оригинальные исследования. – 2023. – Т. 13, № 12. – С. 43–47.
  17. Kang S. H., Kim S. J. M-RAG: Enhancing Open-domain Question Answering with Metadata Retrieval-Augmented Generation // Journal of the Korea Institute of Information and Communication Engineering, 2023. – Vol. 27, No. 12. – P. 1489–1500. – DOI 10.6109/jkiice.2023.27.12.1489.

Образец цитирования:

Колесников А. А., Жданов C. C. Формирование картографических материалов по текстам травелогов с использованием механизмов генерации с дополненной выборкой // Вестник СГУГиТ. – 2025. – Т. 30, № 5. – С. 33–40. – DOI 10.33764/2411-1759-2025-30-5-33-40