Особенности формирования наборов данных для определения местоположения по фото- и видеоматериалам
Финансирование: -
Аннотация:
В статье рассматриваются особенности процесса сбора и разметки данных для обучения моделей компьютерного зрения, определяющих местоположение по фото- и видео-материалам. Обеспечение высокой точности и разнообразия данных критически влияет на качество обучения моделей, что является основной проблемой при составлении наборов данных. Целью исследования является выявление ключевых факторов, которые влияют на качество материалов, используемых для составления наборов данных, таких как аннотация данных, разнообразие изображений, контекстуальная информация и этические аспекты. В статье анализируются существующие практики и подходы к сбору и обработке данных, а также обсуждаются практические рекомендации по улучшению качества полученных материалов. В результате исследования выявлено, что разнообразие данных, высокое качество изображений и тщательная аннотация значительно повышают точность моделей; на основе этих данных сформированы критерии оценки качества материалов. Создание качественных наборов данных основывается на комплексном подходе от сборки точных и достоверных данных до их валидации и пространственной нормализации.
Ключевые слова (RU):
набор данных, определение местоположения, компьютерное зрение, геопространственные данные, классификация
Ключевые слова (EN):
datasets, location detection, computer vision, geospatial data, classification
Библиографический список:
- Workman S., Souvenir R., Jacobs N. Wide-Area Image Geo-Localization with Aerial Reference Imagery. Proceedings of the IEEE International Conference on Computer Vision (ICCV). 2015. P. 5007–5015. DOI 10.1109/ICCV.2015.451.
- Hays J., Efros A. F. im2GPS: estimating geographic information from a single image. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2008. P. 1–8.
- Lin T.-Y., Cui Y., Belongie S. Hays J. Learning deep representations for ground-to-aerial geolocalization. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2015. P. 5007–5015. DOI 10.1109/CVPR.2015.7299155.
- Thomee B., Shamma D. A., Friedland G., Elizalde B., Ni K., Poland D., Borth D., Li-Jia L., YFCC100M: The New Data in Multimedia Research. Communications of the ACM. 2016. Vol. 59, No. 2. P. 64–73. DOI 10.1145/2812802.
- Zheng Z., Wei Y., Yang Y. University-1652: A Multi-view Multi-source Benchmark for Dronebased Geo-localization. Proceedings of the 28th ACM International Conference on Multimedia. 2020. P. 1395–1403. DOI 10.1145/3394171.3413896.
- Astruc G., Dufour N., Siglidis I. et al. OpenStreetView-5M: The Many Roads to Global Visual Geolocation. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2024. P. 14521–14531. DOI 10.1109/CVPR52729.2024.01411.
- Zamir A. R., Shah M. Image geo-localization based on multiple nearest neighbor feature matching using generalized graphs. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2014. Vol. 36, № 8. P. 1546–1558. DOI 10.1109/TPAMI.2014.2300476.
- Neuhold G., Ollmann T. Rota Bulò S., Kontschieder. P. The Mapillary Vistas Dataset for Semantic Understanding of Street Scenes. Proceedings of the IEEE International Conference on Computer Vision (ICCV). 2017. P. 4990–4999. DOI 10.1109/ICCV.2017.534.
- Clark B., Kerrigan A., Kulkarni P. P., Cepeda V. V., Shah M. Where we are and what we`re looking at: query-based worldwide image geo-localization using hierarchies and scenes. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2023. P. 12578–12588. DOI 10.1109/CVPR52729.2023.01236.
- Ye J., Lv Z., Li W., Yu J., Yang H., Zhong H., He C. Cross-View Image Geo-localization with Panorama-BEV Co-Retrieval Netrowk. Proceedings of the European Conference on Computer Vision (ECCV). 2024. LNCS 14670. P. 532–548. DOI 10.1007/978-3-031-72657-0_32.
- Yao Y., Sun C. Wang T., Yang J., Zheng E. UAV Geo-Localization Dataset and Method Based on Cross-View Matching. Sensors. 2024. Vol. 24, № 21. P. 6905. DOI 10.3390/s24216905.
- Zhang X., Sultani W., Wshah S. Cross-View Image Sequence Geo-localization. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV). 2023. P. 1980–1989. DOI 10.1109/WACV56688.2023.00206.
- Khatib O., Lee S., Lee B. S., Yang J. A photo-realistic synthetic dataset for analyzing the effects of moving objects on visual localization algorithms for drones. Proceedings of the International Symposium on Robotics Research (ISRR). 2022. Springer Proceedings in Advanced Robotics. Vol. 20. P. 311–326. DOI 10.1007/978-3-030-95459-8_20.
- Li B., Xue Y., Shi M. Synthetic data generation based on local-foreground generative adversarial networks for surface defect detection. Journal of Electronic Imaging. 2020. Vol. 29, № 1. P. 013016. DOI 10.1117/1.JEI.29.1.013016.
- Mununi A., Mununi F., Gerrar N. K. A survey of synthetic data augmentation methods in computer vision. Machine Intelligence Research. 2024. P. 1–39. DOI 10.1007/s11633-022-1411-7.
- Shorten C., Khoshgoftaar T. M. A survey on image data augmentation for deep learning. Journal of Big Data. 2019. Vol. 6, № 60. P. 1–48. DOI 10.1186/s40537-019-0197-0.
- Пикалев Я. С. Обнаружение ключевых объектов и перекрестная геолокация: анализ наборов данных и методологические перспективы. Вестник компьютерных и информационных технологий. 2024. № 8. С. 53–60.
- Павленко Б. В., Пикалев Я. С. Методика создания набора аэрофотоснимков для задачи перекрестной геолокации. Сборник научных трудов. 2024. С. 115–122. DOI 10.24412/2413-7383-2024-4-101-112.
- Zhang X., Wang L., Su Y. Visual place recognition: A survey from a deep learning perspective. Pattern Recognition. 2021. Vol. 113. P. 107760. DOI 10.1016/j.patcog.2020.107760.
- Klomp S. R., van Rijn M. Wijnhoven R. G. J., Snoek C. G. M., de With P. H. N. Safe Fakes: Evaluating face anonymizers for face detectors. arXiv preprint. 2021. arXiv:2104.11721. DOI 10.48550/arXiv.2104.11721.
- Прасич А. В., Прасич В. А., Прасич И. В. Формирование обучающей выборки в задачах компьютерного зрения: практики и рекомендации. Информатика и управление системами. 2021. Т. 24, № 2. С. 34–43. DOI 10.31799/1684-8853-2021-4-61-70.
- Гельтман А. И., Горюнов М. Н., Мацкевич А. Г., Рыболовлев Д. А. Методика сбора обучающего набора данных для задач машинного обучения. Proceedings of the Institute for System Programming of the RAS (ISPRAS). 2021. Т. 33, № 5. С. 83–92. DOI 10.15514/ISPRAS-2021-33(5)-5.
- Пантюшин В. А. Создание элементов инфраструктуры пространственных данных по локальным участкам цифровых изображений. Землеустройство, кадастр и мониторинг земель. 2023. № 7. С. 45–51. DOI 10.33920/sel-04-2307-06.
- Хроль Е. В., Шаронова К. С. Распознавание изображений с помощью искусственного интеллекта. Вестник науки и образования. 2023. № 10. С. 99–104. DOI 10.47813/2782-2818-2023-3-4-0311-0321.
- Хлебникова Т. А., Арбузов А. С., Лисицкий Д. В., Опритова О. А. Использование материалов БВС для выявления фактов нарушения земельного законодательства на территории г. Новосибирска. Вестник СГУГиТ. 2023. Т. 28, № 5. С. 33–40.
Образец цитирования:
Гришин Р. В. Особенности формирования наборов данных для определения местоположения по фото- и видеоматериалам. Вестник СГУГиТ. 2026. Т. 31, № 1. С. 83–92. https://doi.org/10.33764/2411-1759-2026-31-1-83-92