Технологии

В США решают договориться об универсальном локационном стандарте

6 Октября 2020
В США решают договориться об универсальном локационном стандарте

Адреса неизменяемы. По крайней мере, так считает средний человек. Нас учат, что место – это отдельная точка на карте, неэластичная и постоянная, как горы. Но горы не такие твёрдые, как кажутся. При наличии достаточного количества времени и энергии даже самые большие валуны в конечном итоге разрушаются – как и вера человека в данные о местоположении, которая рушится, когда вы понимаете, насколько на самом деле адреса – аморфные и неопределённые понятия, рассуждает Росс Эпштейн-руководитель отдела кадров SafeGraph, компании, занимающейся геопространственными данными, которая создает наборы данных о физическом мире.

Рассмотрим, например, лишь несколько адресных особенностей, с которыми часто сталкиваются разработчики программного обеспечения. Иногда номера зданий появляются более одного раза в разных местах на одной улице. Иногда у одного здания есть несколько номеров. Некоторые адреса содержат дроби, обозначающие место внутри места. Названия улиц регулярно повторяются, иногда даже в одном городе. То же самое и с названиями городов, часто в одной стране, а иногда даже в одном штате. Некоторые дороги имеют несколько названий. Иногда здания, улицы, города, округа и страны переименовываются или им присваиваются новые почтовые индексы, в результате чего их прежнее «местоположение» не существует.

Достопримечательности, которые могут иметь или не иметь адреса, могут быть столь же неоднозначными. Возможно, даже более того. Самый загруженный аэропорт США, Хартсфилд-Джексон, Атланта, простирается на 4700 акров, включая в себя пять взлётно-посадочных полос средней длиной примерно 10 000 футов, более 30 000 общественных парковочных мест и терминальный комплекс площадью 156 акров, который включает в себя более 200 торговых площадок и семь вестибюлей с почти 200 воротами.

На стадионе Allegiant в Лас-Вегасе – 65 000 мест, 127 люксов, 297 туалетов и 2200 дверей. Конференц-центр Соединённых Штатов, McCormick Place в Чикаго, включает 2,6 миллиона квадратных футов выставочных залов, 173 конференц-зала и шесть бальных залов. А большой парк США, Центральный парк Нью-Йорка, занимает 843 акра с 136 акрами лесов, 250 акров лужаек, семь искусственных озер и прудов, 36 мостов и арок и 58 миль пешеходных дорожек. (Акр = 0,4 Га, прим. пер).

Если вы попросите друга встретиться с вами в любом из вышеупомянутых мест, названия или адреса будет недостаточно; с бесконечными возможными позициями, необходимы более точные инструкции или координаты. Вот почему так важны географические информационные системы и услуги на основе определения местоположения. Они позволяют легко ответить на вопрос: «Где?»

Во всяком случае, теоретически. На самом деле приложение геоинформационной системы (ГИС) настолько эффективно, насколько эффективна система кодирования местоположения, на которой оно основано. А системы кодирования местоположения так же несовершенны и неясны, как и местоположения, которые они пытаются кодировать. Это особенно очевидно во время объединения данных, когда программисты должны определить, являются ли две разные точки данных – например, 123 Main St. против 123 Main Street, 456 W. 1st Ave. против 456 West First Avenue или 789 Broadway St. с одним набором координат по сравнению с 789 Broadway St. с другим набором координат всего в нескольких метрах от вас – относятся к тем же или разным точкам на карте.

Чем больше вы думаете об этом, тем больше понимаете, что данные о местоположении похожи на картину импрессиониста: то, что кажется связным издалека, на самом деле чрезвычайно хаотично вблизи.

В сообществе ГИС последствия этого хаоса очевидны. Без простого способа кодирования, обмена и понимания данных о местоположении отдельные лица, предприятия, правительства и другие пользователи вынуждены тратить драгоценное время, деньги и таланты на объединение данных вместо анализа данных.

К счастью, с помощью правильных инструментов хаос можно контролировать. А в случае данных о местоположении лучший инструмент для работы – это универсальный стандартный идентификатор, бесплатный и открытый, который позволяет легко получать, обмениваться, объединять, управлять и, в конечном итоге, анализировать информацию о местоположении.

Есть только одна проблема: хотя было сделано много замечательных попыток создать универсальную систему кодирования местоположения, до сих пор ни одна из них не получила широкого распространения.

Одна из них – новый универсальный стандартный идентификатор сообщества ГИС Placekey – обещает сделать информацию о местоположении однозначной, доступной и совместимой. Вместо определения местоположений в соответствии с координатами, он определяет их в соответствии с контекстом.

Человечество веками пыталось найти эффективный стандарт кодирования местоположения. Еще в 600-е годы до н.э. финикийцы использовали солнце и звёзды для определения широты. Во втором веке до нашей эры греческий астроном Гиппарх впервые задумал вычислить долготу путём измерения разницы между местным временем и «абсолютным временем», хотя его метод не мог работать без наличия точных часов. В 18-м веке англичанин Джон Харрисон, наконец, создал их – часы с пружинным приводом, известные как морской хронометр.

Сегодня GPS использует те же принципы, основанные на времени, для вычисления широты и долготы из космоса. Но широта и долгота выражают только точечные местоположения, тогда как идеальная система кодирования местоположения также позволяет отображать неточечные местоположения, такие как ориентиры, регионы или конкретный офис на 29-м этаже здания. Итак, поиск альтернативы продолжается.

Повсеместное распространение данных и вычислений, а также растущая сложность вопросов, на которые стремится ответить наука о данных, сосредоточили внимание на необходимости идентификатора местоположения, который можно было бы легко объединить с наборами данных. Многие хорошо принятые и ценные идентификаторы уже существуют для решения других проблем, таких как навигация. Лоты можно изучать и эмулировать по идентификаторам, рассмотренным ниже. 

Вот некоторые из наиболее заметных попыток создания универсального стандартного идентификатора:

Geohash – метод геокодирования, при котором широта и долгота кодируются в строку чисел и букв, обозначающих область на карте; каждое десятичное место представляет такой порядок разрешения, при котором большее количество символов соответствует большей точности. Хотя этот подход идеально подходит для создания двумерных точек и участков на карте, он не учитывает третье измерение – например, многоквартирный дом с несколькими единицами в нескольких вертикальных этажах – и не даёт никакого контекста о людях и местах, которые занимают пространство. Другими словами: Geohashing описывает, где, но не кто или что.

Mapcode: разработанный, чтобы быть коротким, запоминающимся и доступным для совместного использования, mapcodes превращает места в короткие буквенно-цифровые коды, которые включают два набора букв и цифр, разделенных десятичной дробью. К сожалению, в некоторых местах может быть несколько кодов. И хотя коды карт бесплатны и открыты, их декодирование требует поддержки со стороны некоммерческой организации Mapcode Foundationе.

What3Words (W3W): основанный на предположении, что адреса улиц не всегда указывают на точное местоположение, W3W – это веб-служба определения местоположения, которая разделила Землю на участки по 3 квадратных метра, каждому из которых был присвоен уникальный и неизменяемый идентификатор из трёх слов. Результатом является простой способ кодирования, запоминания и обмена очень точными местоположениями, что делает W3W отличным инструментом для точной навигации и взаимодействия человека с машиной. Поскольку идентификаторы назначаются случайным образом, им не хватает согласованности и порядка, что означает отсутствие связи с местами, которые находятся рядом друг с другом, и это делает его менее подходящим для межмашинного взаимодействия. W3W не является ни бесплатным, ни открытым, что является дополнительным препятствием для принятия.

Открытый код местоположения (OLC): задуманная Google, OLC представляет собой систему геокодирования с открытым исходным кодом, основанную на идентификаторах местоположения, известных как «дополнительные коды», которые предназначены для работы как уличные адреса и для использования вместо них – особенно в местах,. где уличные адреса не существуют. Дополнительные коды выводятся из широты и долготы и выражаются в виде короткого буквенно-цифрового кода. Но поскольку дополнительные коды являются производными от широты и долготы, они в конечном итоге могут обозначать только географические координаты и не могут определять отдельные места, которые занимают эти координаты, и различать их.

CitoCode: как и многие другие системы кодирования местоположения, он был задуман для создания коротких геокодов, которые легче использовать, запоминать и передавать, чем сложные адреса или длинные наборы координат. Этот стандарт уникален во многих отношениях. Во-первых, геокоды могут быть закодированы не только с указанием местоположения, но и с контекстом, включая имена, номера телефонов, веб-сайты, адреса электронной почты и описательный текст. Кроме того, они создаются пользователями; коды выбираются, а не присваиваются. То, что они могут быть персонализированы, означает, что они хорошо работают для памяти и маркетинговых целей, но не для последовательной, универсальной адресации и навигации.

Подавляющее большинство существующих систем кодирования местоположения, включая Geohash, Mapcode, W3W и OLC, имеют один существенный недостаток: они основаны исключительно на сетках.

Сетки – полезный инструмент для поиска точек на карте и навигации между ними. Эти точки могут быть практически любыми: от места на пляже, где вы встречаетесь с друзьями, до заднего входа в музыкальное заведение. Однако, как отмечалось ранее, точки на карте передают только положение. Им не хватает контекста. А с точки зрения науки о данных это означает, что им также не хватает последовательности и правильности.

Представьте себе, например, собственный дом. Когда вы вводите свой адрес, сетка A помещает булавку местоположения в вашу гостиную. Сетка B падает всего в нескольких футах от вас в спальне. Когда они объединяют данные для создания сервиса или приложения на основе местоположения, специалисты по данным должны определить, принадлежат ли эти пины одному и тому же месту или нет. Один специалист по данным может решить, что да, потому что они находятся в одном доме. Другой может решить, что нет, потому что они находятся в разных комнатах. Если вы рассмотрите эту загадку в более широком масштабе, вы сможете начать понимать трудности, возникающие при объединении данных через чисто сеточные системы.

Поэтому необходима система кодирования местоположения, определяющая места.

Placekey уже насчитывает более 1000 организаций-членов, включая Esri, Carto, Nielsen, JLL, Dun & Bradstreet, SafeGraph, Landgrid, City of Boston и Experian.

Разработанный так, чтобы максимально упростить доступ, совместное использование и комбинирование данных о местоположении, а также сделать это гиперлокальным способом, бесплатный и открытый API Placekey может генерировать идентификаторы практически для любого места в мире: квартиры в многоэтажном здании, кафе в розничном магазине или ресторан внутри терминала аэропорта и, в конечном итоге, любое место в мире с почтовым адресом или без него.

Каждый Placekey включает в себя «Где часть?» и необязательную «Какая часть?». «Где часть?» кодирует географические координаты места в три уникальные последовательности символов по три символа в каждой, используя иерархическую систему шестнадцатеричной сетки Uber с открытым исходным кодом H3; крайняя левая последовательность символов обозначает большую область, средняя последовательность – немного меньшую область, а крайняя правая последовательность – ещё меньшую область, что позволяет судить о близости местоположений друг к другу, читая «Где часть?» слева направо и оценивая, сколько у них общих признаков.

Структура построена для создания контекста и согласованности, необходимой для обработки сопоставления различных типов наборов данных, и все это в одной строке, которую легко хранить в базах данных. Например, данные о погоде или высоте могут быть связаны с «Где часть?». «Какая часть?» может учитывать несколько точек интереса с одним и тем же адресом.

Согласно различным опросам на эту тему, специалисты по данным тратят от 20 до 80 процентов своего времени на сбор и подготовку данных. Представьте себе мир, в котором они могли бы вместо этого провести это время, анализируя его. В таких разнообразных областях, как реклама, управление чрезвычайными ситуациями, городское планирование, общественное здравоохранение, энергетика, транспорт и логистика, и это лишь некоторые из них, результатом будет более глубокое понимание мест, людей и сообществ, которые проживают в них и вокруг них, а также более эффективные решения для решения глобальных проблем, с которыми нам суждено столкнуться.


Подписывайтесь на журнал «Вестник ГЛОНАСС» и навигационный канал на TamTam

Короткая ссылка:  vestnik-glonass.ru/~itwRf
18.12.2024
Близка к завершению сделка, в рамках которой Индия закупает у России систему раннего предупреждения с дальностью обнаружения более 6000 километров. Цена вопроса – $4 млрд.
13.12.2024
Qianfan, похоже, спроектирован в таком же героическом масштабе. Документы, поданные в Международный союз электросвязи, который регулирует такие вещи, предполагают, что созвездие может в конечном итоге вырасти до почти 14 000 спутников.
11.12.2024
Городская среда постоянно создаёт проблемы для глобальных навигационных спутниковых систем (ГНСС) – высокие здания, автомобили и другие препятствия часто нарушают сигналы и вызывают ошибки вне прямой видимости.
10.12.2024
Космические силы США решили применить новый подход к отслеживанию ракет для противодействия системам вооружения противника, которые слабее, быстрее и манёвреннее баллистических ракет.

СТАТЬИ ГЛОНАСС

Необходим поиск отечественных специалистов в области кибербезопасности сельского хозяйства
Перспективы реализации дорожной карты одного из направлений Национальной технологической инициативы (НТИ) в области сельского хозяйства, по просьбе журнала «Вестник ГЛОНАСС», оценил эксперт в навигационно-информационной сфере Семён Видный. В современных, быстроизменяющихся условиях особого решения требуют вопросы безопасности (направление SafeNet), тем более на таком значимом для государства агросекторе. В этом направлении на данный момент – огромное количество профессиональных участников. Но большинство из них используют иностранные наработки, что в настоящий момент и на перспективу неприемлемо. Также все профессионалы никогда не занимались этим специфическим сектором экономики – сельским хозяйством. Так что здесь придётся ещё поискать участников.
Аграриям предстоит работать в одной системе координат
Как известно, основой современного цифрового агрокомплекса является картогорафирование. Семён Видный, эксперт в области применения современных навигационно-информационных технологий в сельском хозяйстве поделился с читателями журнала «Вестник ГЛОНАСС» с кругом решаемых проблем при обработке массивов картографических данных. Таким образом, выяснилось, что все используют данные в различных системах координат, но пытаются укладывать их на одну картографическую основу и, соответственно, получают нестыковки и ошибки. Всё это приводит к тому, что используемые данные из Роскадастра, из Центров химизации и от высокоточных источников (данные дистанционного зондирования Земли, данные с беспилотников и высокоточных навигационных или геодезических приборов) не состыковываются друг с другом и только вводят в заблуждение сельхозтоваропроизводителей и собственников сельхозземель. И это также отражается на отношениях со смежными землепользователями.