OpenSource

Общая информация

SOIKA – это библиотека, нацеленная на обогащение цифровых моделей городов данными, получаемыми из текстовых данных цифрового следа горожан, а также на моделирование вернакулярной оценки качества городской среды. Основным ее элементом является конструируемый пространственно-семантический граф, пополняемый при помощи машинного распознавания городских сущностей и локаций.

SOIKA включает в себя группы методов: методы для обработки текстовых данных, методы для генерации пространственно-семантического графа и методы для моделирования социальных процессов с его помощью.

Инструменты/Опции

Анализ жалоб и обращений

Основные особенности

Модуль предназначен для получения наборов текстовых данных из социальной сети VK и геоданных c OSM об изучаемой территории.

Назначение

Модуль DataGetter предоставляет инструменты для извлечения и обработки данных из различных источников, включая геоданные из OpenStreetMap, комментарии и сообщения из социальной сети VK, а также данные об улицах.

Технические особенности

Модуль состоит из 3 классов:

  • GeoDataGetter

    Класс используется для извлечения пространственных данных из OpenStreetMap (OSM) на основе подаваемых на вход OSM ID и тегов.

  • Streets

    Класс извлекает данные об улицах для указанного города из OSM и обрабатывает их для получения полезной информации для дальнейшего геокодирования.

  • VKParse

    Класс предназначен для сбора текстовых данных (постов и комментариев) из групп в социальной сети VK. На вход подается домен группы и дата, до которой собирается информация. Также для использования этого инструмента необходим сервисный ключ созданного приложения VK. Полученные тексты объединяются в единый DataFrame.

Модуль использует библиотеки pandas, geopandas и osmnx для работы со структурированными и геоданными, а также библиотеку requests для сетевых запросов.