Анализ пространственной структуры

Обогащение данных имеет значение. Сотрудничество бизнеса и образования

Что мы ожидаем увидеть при визуализации данных о местоположении, впервые добавив их на карту? Я почти уверен, что наша цель - выяснить, существуют ли какие-либо пространственные закономерности: регионы с более высокой и меньшей интенсивностью объектов, кластеры и выбросы, общие направления, нерегулярные траектории, территории с более высокими или более низкими значениями и т. Д. Как только мы исследуя закономерности, мы готовы определить значимость признаков, построить прогностические модели и назвать себя учеными данных.

Подходы, используемые для обнаружения закономерностей, стоят отдельной статьи. В настоящее время я работаю над этим и собираюсь начать его с заголовка «Хватит использовать тепловые карты…». Итак, давайте представим, что исследователь знает алгоритмы анализа шаблонов и готов углубиться в мир ГИС.

В этой статье я упомяну анализ точечных шаблонов, покажу результаты алгоритмов анализа шаблонов и проблемы, с которыми столкнется профессионал, не являющийся ГИС, и опишу сотрудничество между бизнесом и наукой в ​​разработке решения для текущей некомпетентности программного обеспечения.

Анализ точечных паттернов. Кластеры интенсивности и выбросы

Давайте начнем с простого, но реального случая: у исследователя есть места краж (автомобильные аварии, экстренные вызовы, твиты, фотографии, птичьи гнезда или домики бобров. Абсолютно любые данные о местоположении) в городе (парке). , море, страна… несмотря ни на что). Задача исследователя состоит в том, чтобы исследовать, существуют ли пространственные закономерности и различать их, если они есть. Он или она построил сетку в области распределения, используя определенный размер ячейки, чтобы избежать случайности. На следующем этапе исследователь подсчитал количество объектов в каждой ячейке и, наконец, запустил анализ кластеров и выбросов и / или анализ горячих точек и холодных точек, это зависит от конкретной задачи.

Кроме того, он или она запускали NNA и Quadrat Analysis, поэтому исследователь почти уверен, что теперь объекты имеют кластерное распределение, и результаты показывают эти кластеры, а также выбросы.

Анализ паттернов краж. Скриншот из Aspectum

Я бы сказал, что исследователь в значительной степени удовлетворен результатом. Это достаточно хорошо, чтобы начать исследовать выбросы, однако область, покрытая кластерами высоких и низких значений, безумно огромна. Для людей, которые знают город, кластер высокой стоимости выглядит очевидным - это жилые и деловые районы. Кластер с низкими значениями (синяя часть) соответствует лесам, рекам и промышленным районам.

На данный момент, чтобы получить более точные результаты для кластерных областей, исследователь решает учитывать городские классы при анализе данных. Это может помочь в поиске кластеров на аналогичных территориях: сравнение распределения объектов в жилых районах отдельно от зеленой или водной зон.

Итак, представьте, что исследователь не использовал Aspectum и столкнулся со всеми проблемами, связанными с ГИС: шейп-файлы, проекции, неуклюжее программное обеспечение для настольных компьютеров, области векторных данных распределения, формула размера сетки, соответствующие алгоритмы с помощью плагинов или отдельных расширений (кстати, в случае используя Aspectum это просто необработанные данные).

Теперь он или она должен построить набор векторных данных для классификации городских земель. Но как? Где найти данные? Какие зоны следует различать? Какие параметры для классификации этой зоны? Как автоматизировать это для дальнейших задач?

Проект. Когда бизнес и образование обогащаются

Мы считаем, что задачей компаний-разработчиков программного обеспечения является создание продукта, способного дать ценный результат без необходимости обучать целевую аудиторию работе. А в случае ГИС, это обычно занимает 6 лет обучения в средней школе.

Аспектум решил инициировать проект по сбору данных о землепользовании в городах для всех населенных пунктов в мире. Такая амбициозная цель стала интересной для наших друзей и партнеров из Ровенской ноосферной инженерной школы. Команда студентов с программной инженерией, ГИС, урбанистическим опытом и, прежде всего, увлечением была организована под руководством лекторов.

Поскольку нет правильного подхода к задаче, мы начали разрабатывать итерациями, постоянно анализируя и обсуждая результаты. В этой статье будет представлена ​​основная идея реализации проекта и показаны результаты, доступные для тестирования.

В следующих статьях мы поделимся проверенными подходами, результатами, которые не сработали, идеями по улучшению и реализованными дополнительными функциями.

Концепт

Существуют огромные проекты с открытым исходным кодом, связанные с геопространственными данными. Наша цель - объединить данные и способы их обработки, чтобы получить наиболее точную и полную информацию об определенной области в населенных пунктах по всему миру. Просто чтобы уточнить - мы имеем дело не с типами землепользования, а с идеей сходства влияния на явления и процессы, происходящие в этих областях. Так как жилые районы могут быть абсолютно разными по всему городу, мы должны назначать им разные классы. С другой стороны, мы не имеем дело с подходом к зонированию - нет необходимости объединять торговые и бизнес-зоны в одну группу, а также не очевидно, имеет ли смысл разделять сферы образования и медицины с точки зрения влияния на пространственные закономерности в этих областях.

Текущие результаты

Сейчас мы тестируем версию продукта MVP, предоставляя информацию о 4 классах в области распространения данных. Перейдите в Aspectum, добавьте свои данные и выполните анализ классификации городских земель. Процесс обработки может занять некоторое время, и у нас все еще есть ряд ограничений, но мы постоянно совершенствуем алгоритм.

Проверьте карту с классами на местном и региональном уровне

Занятия на местном и региональном уровнях. Скриншот из Aspectum

За время выполнения этой задачи был сделан ряд изменений, и мы рады поделиться ими. Взгляните на нашу страницу GitHub, мы постоянно обновляем и добавляем туда проекты. osm2geojson, наше последнее обновление, является чистым Python-решением для обработки данных OpenStreetMap. Следуйте Aspectum, чтобы не пропустить следующие статьи.