Современные подходы к определению качества топосъёмки пещер (Алексей Горбенко)

Современные подходы к определению качества топосъёмки пещер

Топографическая съёмка пещер – это комплекс топографо-геодезических работ для определения формы и размера пещеры. Обязательным этапом камеральной обработки является оценка качества топосъёмочных работ. Используемые для топосъёмки пещер приборы несовершенны, что приводит к ошибкам в полученных данных, которые необходимо выявить и учесть.

При топосъёмке пещер возможны три типа ошибок – случайные, систематические и грубые.

Типы ошибок

Случайные ошибки связаны с несовершенством методов топосъёмки и используемых приборов. Электронный компас всегда имеет погрешность, как и лазерный дальномер. Также существует проблема точного размещения прибора на пикете – в неудобном месте трудно чётко держать прибор в нужном месте. Да и в идеальных условиях прибор будет смещён относительно истинной точки, хоть и на минимально расстояние.

Снизить влияние случайных ошибок можно добросовестно подходя к процессу топосъёмки. Влияние случайных ошибок мы можем нивелировать только качественно проведённой калибровкой, бережным отношением к приборам и правильным их использованием. Ошибка используемых приборов известна и прописана к документации тех приборов, которые мы используем.

Грубые ошибки вносят наибольший вклад в полученный результат, но они редки и относительно легко идентифицируются и исправляются. С современными приборами количество грубых ошибок снизилось в разы, уже невозможно перепутать стрелку компаса или отмерить расстояние в дюймах, посмотрев не на ту сторону рулетки. Но появились и новые грубые ошибки, вернее появилось больше возможности для их совершения. Электронный компас, очень чувствительный к посторонним магнитным полям, и недосмотр за фонарём, снаряжением, планшетом и другими источниками полей может внести существенную ошибку в измерения. Привязывание топосъёмки или её частей не к тем пикетам – тоже грубая ошибка, и она иногда встречается.

Систематические ошибки – ошибки, которые влияют на топосъёмку постоянно (систематически). Они крайне трудно идентифицируются, а чаще всего и вовсе не идентифицируются. Анализ ошибок на кольцах в большинстве случаев не помогает, т.к. влияние обычно идёт на все замеры с одинаковой интенсивностью, что сводит на нет ошибку в кольце. Примеры систематических ошибок – ранее, при использовании рулеток были случаи измерения не от нуля. Было это связано иногда с конструкцией самой рулетки (она начиналась от -5 см), иногда от повреждённого начала рулетки. Ну или упоминавшаяся выше рулетка в дюймах. Если мы всю съёмку промерим в дюймах, а в пикетажный журнал запишем в сантиметрах – то это систематическая ошибка, а если разово сделаем замер в дюймах, то это грубая ошибка.

Систематические ошибки ранее были достаточно распространены. До сих пор есть старые карты пещер с зеркальным отображением ходов. Видимо, смотрели не на ту стрелку компаса. И не всегда это касалось невнимательности. Помнится, в нашем клубе был горный компас, у которого синяя стрелка смотрела на юг, а красная на север, причём окраска была явно заводская, видимо брак.

Такие ошибки легко исправляются при их обнаружении – вводится поправочный коэффициент. Но выявить их не всегда удавалось, топосъёмка браковалась (если были сомнения в её качестве) или попадала в общую съёмку пещеры и приносила в будущем много проблем с не замыканием других съёмок.

Не все ошибки укладываются чётко в рамки трёх типов. Представим ситуацию (видимо совсем нередкую), при которой мы провели калибровку прибора и начали топосъёмку. Прибор после калибровки не становится идеально точным прибором, даже если мы уберём влияние случайной ошибки. Калибровочная матрица в каком-то приближении исправляет снимаемые показатели, но её разрешение ограничено, а разрешение нашей последующей съёмки практически не ограничено. Т.е. всегда найдётся положение прибора, при котором измеренные значения будут смещены в ту или иную сторону. И если после калибровки у вас основные замеры будут направлены именно в эту сторону, то эта систематическая ошибка будет накапливаться. А при изменении направления съёмки ошибки нет, т.к. прибор в эту сторону откалиброван хорошо. Тогда создаётся ситуация, при которой ошибка присутствует только при съёмке в определённую сторону. С одной стороны, это систематическая ошибка, так как она систематически повторяется при съёмке в одну сторону, но с другой стороны «не совсем» систематическая, так как проявляется не на всех замерах.

Современная оценка ошибок и её адекватность

Общепринятым является максимальная минимизация ошибок при проведении топосъёмочных работ с использованием соответствующих средств. Конечно, можно принести в пещеру теодолиты, нивелиры и другие высокоточные приборы, что значительно снизит общую ошибку топосъёмки. Но надо быть реалистами – в топосъёмке определился круг устройств, которые мы используем. Используя различные топосъёмочные приёмы, можно снизить общую ошибку (методы для создания различных типов колец). Но крайне необходим показатель точности топосъёмки, который бы позволил оценить съёмку и принять решение о её дальнейшей судьбе.

Общепризнанным является ошибка кольца топосъёмки. При топосъёмке мы расставляем пикеты, идём по ходам пещеры и возвращаемся в исходную точку замыкая кольцо. Из-за наличия ошибок (случайных, грубых, систематических) мы вернёмся не чётко в исходную точку, хотя будем считать, что вернулись в неё. Эту ошибку достаточно легко мы можем вычислить в виде расстояния. Но данный показатель сам по себе малоинформативен. Чем больше длина кольца съёмки, тем больше эта ошибка (ниже это будет продемонстрировано на модели). Многие программы, да и мы в прошлом на бумаге, соотносили полученную ошибку к длине нитки кольца:

Именно на этот показатель в настоящее время ориентируются топосъёмщики. Большая ошибка в процентах – плохо снято, малая ошибка – хорошо снято. Но на сколько этот показатель адекватный?

Давайте построим модель топосъёмочных работ и оценим ошибки на кольцах в процентах (далее просто «ошибка») в зависимости от разных параметров. Модель и графики были построены на python.

Входные данные:

  • Длина замеров: 3-10 м;
  • Ошибка измерения длины: 0,002 м (Гауссово распределение ошибки);
  • Ошибка измерения углов: 0,5 градуса (Гауссово распределение ошибки);
  • Длина кольца: 10-1000 м с шагом 10 м;
  • Количество итераций: 300.

Ошибки измерения взяты из документации к прибору DistoX2. Гауссово распределение ошибок углов и расстояний взято по логическим соображениям и подтверждается упоминаниями в нижеперечисленных статьях.

Принцип работы модели – создаётся нитка хода указанной длины (длина замеров выбирается случайно из указанного диапазона). После этого создаётся вторая нитка хода по первой, но в каждое измерение (длина, азимут и угол наклона) вносится случайная ошибка в указанных пределах. После построения двух ниток хода (истинной и ошибочной) вычисляется расстояние между последними пикетами истинной и ошибочной нитки. Это и есть ошибка в метрах.

В первую очередь нас интересует влияние длины кольца, поэтому мы создаём кольца длиной от 10 до 1000 м с шагом 10 м. На каждой длине мы создаём 300 колец и анализируем абсолютную и относительную ошибку, затем усредняем значения всех 300 колец. Вот результат работы модели:

Видно, что при увеличении длины кольца увеличивается абсолютная ошибка в метрах, но снижается относительная ошибка в процентах. Особенно неравномерно это снижение наблюдается на первых 100 метрах, а именно такие кольца мы обычно имеем в большинстве случаев (при съёмки лабиринтовых пещер). Отсюда мы можем сделать неутешительный вывод – показатель ошибки в процентах, приводимый в TopoDroid, Survex, Therion и других программах, на который ориентируются топосъёмщики, в большинстве случаев может дать только выявление явно ошибочных съёмок, у которых очень высокий процент ошибки, и то не всегда.

Вот пример той же самой модели, но ошибка измерения углов установлена в 3 градуса (практически съёмка горным компасом). График расчётов не приводится. Тогда ошибка 0,5% на кольце (которая многими признаётся границей качественно проведённой топосъёмки современными приборами) наблюдается при длине кольца 900 м. Но съёмка с аналогичными погрешностями измерений и длиной колец от 30 до 100 м будет давать ошибку от 1,5 до 3% (что многими будет воспринято как низкокачественная топосъёмка).

А почему происходит такой процесс, почему с увеличением длины кольца снижается процент ошибки? Случайная ошибка на то и случайная, что она может сместить нитку хода в случайную сторону, а не только в одну, в сторону от истинной нитки. То есть случайная ошибка на каждом отрезке может как увеличить общую ошибку, так и уменьшить её. А длина кольца никогда не уменьшается, она всегда растёт. Другими словами – длина кольца накапливается быстрее, чем ошибка съёмки.

Но вернёмся к исходным данным модели и посмотрим влияние длины замеров.

Длина замеров. Бытует два распространённых мнения о выборе длины отрезков съёмки. Первое из них – не мельчить, то есть не делать короткие замеры, второе – не делать слишком длинные замеры. Слишком короткие замеры действительно могут дать большую ошибку при измерении (ниже точность визирования), но так как замер короткий, то и абсолютная ошибка будет небольшой. Давайте проверим на модели два случая – все замеры длиной 3 м или 10 м:

Удивительно, но чем короче замеры, тем меньше накапливается абсолютная ошибка и ниже относительная ошибка.

Относительная ошибка – это показатель качества съёмки (ну или попытка подобрать такой показатель), то есть это оценка уже существующего отснятого кольца. Другое дело – абсолютная ошибка (на графике Средняя ошибка в метрах), она непосредственно влияет на качество съёмки. Если мы видим уменьшение абсолютной ошибки при снижении длины замеров, то можно сделать вывод: хотите иметь точнее топосъёмку – не увлекайтесь длинными замерами.

Другие способы оценки качества топосъёмки

Неадекватность показателя относительной ошибки известна давно. Были предприняты попытки ввести другие показатели качества съёмки. Британская ассоциация исследования пещер (BCRA) в своё время предложила использовать показатель класса топосъёмочных работ, в зависимости от используемых приборов. Эта система распространилась в Британии и ряде других стран. На многих картах из этих стран указывается соответствующий класс точности. Но Thrun в 2009 г. в статье «A Statistical Study of Survey Errors and Closure Adjustments or How Accurate are our Cave Surveys?» проанализировал 94 пещерные съёмки и пришёл к выводу, что ни одна карта не соответствует указанным классам точности. И это неудивительно, так как заявленная точность используемых приборов будет соответствовать реальной точности только при идеальных условиях – очень хорошая калибровка, крайне бережное отношение к приборам и так далее. Но если прибор откалиброван плохо, то не стоит ожидать качественной топосъёмки. Но вопрос всё тот же – как определить, с какой точностью снята пещера? Британская система на этот вопрос ответа не даёт. Какие-либо другие предполагаемые системы не получили хоть какого-то серьёзного распространения. Так мы и остались с двумя несовершенными системами.

В статье Larry Fish «How common are blunders in cave survey data?» предложил использовать оригинальный подход, взяв за основу анализ топосъёмочных колец из приложения COMPASS. COMPASS анализирует топосъёмочные кольца и определяет, являются ли они ошибочными. Для этого анализируются все замеры кольца, считая их как будто истинными и не имеющими ошибок. В каждый замер вносится ошибка измерения приборов. В итоге мы получаем максимально возможную ошибку всего кольца и сравниваем её с реально полученной ошибкой. Если полученная ошибка превышает значение 2s, то кольцо считается неверным. Превышение 2s – это вероятность 97,7% (в случае одностороннего распределения), что ошибка получена не случайно, а выходит за пределы допустимых значений (про s можно подробно почитать в статистике). Но LarryFish пошёл дальше, и предлагает увеличивать погрешности приборов до тех пор, пока ошибка кольца не попадёт в пределы 2s. Именно эти значения погрешностей будут «истинными» для данного кольца. Конечно, это немного натянутое утверждение, так как мы точно не знаем погрешность каких параметров необходимо увеличивать.

Но вернёмся к методу, предлагаемому программой COMPASS. Давайте попробуем рассчитать данный показатель в модели, а затем применить его к реальным данным. Построим сначала график распределения ошибки в % для проверки нормальности (можно и в метрах, это не имеет значения, график будет аналогичный, но так как программы нам выдают в %, то мы этот показатель и будем использовать). Параметры такие, как в исходной модели, только строить будем на длине нитки 1000 м, итераций – 3000. В итоге мы получаем такой график нормальности распределения ошибок и Q-Q график:

Видно, что с нормальностью распределения значений есть проблема, хотя это модельные данные и мы теоретически ожидали получить качественную нормальность. Но необходимо учесть, что % ошибки никак не может уйти в отрицательные значения и левого «хвоста» нет. Это не сильно портит нормальность распределения ошибки, оставим как есть.

Теперь перейдём к реальным данным.

Логика тестирования следующая – будем анализировать топосъёмку пещеры Большая Орешная с общей длиной ходов, отснятых на июль 2024 года, почти 50 км и имеющей 1016 топосъёмочных колец. Для каждого кольца мы создаём 10000 итераций, в которые случайным образом вносим погрешность измерения (описано выше). Далее вычисляем среднюю ошибку, откладываем 2s и оцениваем, превышает ли ошибка кольца, вычисленная классическим способом, полученное значение 2s. Если превышает, то делаем вывод, что полученная ошибка с вероятностью более 97,7% является неслучайной из-за погрешности приборов. Причины выхода за допустимые пределы могут быть различными, от некачественной калибровки прибора (или его раскалибровки в процессе съёмки) до наличия грубых ошибок.

Построим точечный график зависимости средней «идеальной» ошибки (рассчитанной в анализе 10000 итераций) и «реальной» ошибки (классический расчёт ошибки). При этом красным цветом отметим ошибочные кольца, ошибка которых превышает 2s «идеальной» ошибки.

Около 20% колец являются ошибочными. Много это или мало? Если мы обратимся к статье Larry Fish, то увидим у него анализ 16 пещер (США и Мексика) с общей длиной ходов более 500 км и общим количеством колец 3959. Из всех колец 22,4% были ошибочными. Этот показатель очень близок к нашему показателю. Давайте порассуждаем о его значении. Пещеры в США и Канаде снимались приборами прошлого поколения и погрешности приборов составляли 2 градуса для углов и 3 см для измерения длины. Эти показатели значительно выше наших погрешностей. Если бы мы ввели эти показатели в нашу модель, то получили бы количество ошибочных колец значительно меньше. Но всё-таки мы снимаем современными приборами. И логика подсказывает, что процент ошибочных колец зависит не от погрешности приборов, а от качества работы топосъёмщиков – как они откалибровались, как аккуратно снимают, как часто делают грубые ошибки. То есть мы отошли от показателя точности приборов, так как при использовании более точных приборов снижаем размер допустимой ошибки. Но вывод неутешителен – 20% наших топосъёмочных колец несут ошибки, которые невозможно объяснить погрешностью прибора, а основаны на «человеческом факторе».

Давайте теперь построим график зависимости «идеальной» ошибки от длины кольца с цветовой градацией правильных и ошибочных колец. Для наглядности шкалы переведём в логарифмический вид.

Здесь мы наблюдаем, что при одной и той же длине колец «идеальная» ошибка этих колец имеет значительный разброс. Разброс связан с разным количеством замеров и разным расстоянием этих замеров. Это лишний раз подтверждает, что для определения качества топосъёмки необходимо не только анализировать длину кольца (как в классической невязке колец), но и индивидуальные замеры.

Было предположение, что можно наблюдать распределение ошибочных колец (красные точки) в сторону больших по длине колец, так как вероятность в долгой съёмке совершить грубую ошибку выше, и выше вероятность раскалибровки прибора со временем. Но этого не наблюдается. Это можно объяснить тем, что значительная часть крупных колец – это не индивидуальные кольца одной топосъёмки, а сборная разных топосъёмок, мелких и крупных.

Предлагаемый параметр оценки качества топосъёмки

Давайте подытожим и применим статистический подход к анализируемым данным. Имея некое кольцо, мы можем внести в каждое измерение случайные погрешности в пределах известных ошибок прибора. Проведя 10000 итераций, мы получим распределение ошибки на конечной точке. В качестве нулевой гипотезы (Н0) принимаем, что полученное значение ошибки на кольце значимо не отличается от значений с допустимыми уровнями разброса значений прибора. Используя статистический анализ будем пытаться опровергнуть эту гипотезу. Имея распределение ошибки в модели и зная реальную ошибку на кольце, вычисленную классическим методом, мы можем вычислить, на сколько это значение отличается от средней ошибки модели в стандартных отклонениях. Этот показатель в статистике называется z-значение (z-оценка). По z-значению определяют p‑значение, смысл которого заключается в показателе вероятности принятия нулевой гипотезы.

Для медико-биологических исследований критический уровень p-значения принят 0,05, что интерпретируется так – с вероятностью 5% полученные значения соответствуют модели, описанной в нулевой гипотезе. Все значения с p<0,05 считаются статистически отличимыми от нулевой гипотезы, то есть опровергают её. Показатель p=0,05 соответствует z=2, то есть двум стандартным отклонениям (2s). В разных научных областях принимаются разные критические уровни. Нередко в физических науках границу ставят на уровне 6s.

Не всегда 2s – это уровень значимости 5%. В наших данных мы используем одностороннее тестирование, так как нас интересует отклонение реальной ошибки от средней модельной ошибки только в большую сторону, а если ошибка смещается в противоположную сторону (то есть ошибка на кольце получилась намного меньше, чем допускалась при указанных погрешностях приборов), то это только хорошо и не опровергает нулевую гипотезу. Для одностороннего тестирования 2s – это p=0,02275 (вероятность принятия нулевой гипотезы 2,275%).

Выбор критического уровня – это задача исследователей. Оставим её на уровне 2s, как и в ранее упомянутых статьях. Но p-значение неудобно использовать ввиду плохо запоминающегося значения 0,02275. Кроме того, хочется иметь не только критическую границу, которая покажет ошибочные кольца, но и удобный показатель, который будет показывать уровень отклонения от нормального состояния. Такой уровень и показывает p‑значение, но числа будут крайне низкими. Намного более удобно анализировать ошибку в стандартных отклонениях, то есть использовать z-значение.

Как анализировать z? Если z<2, то можно считать, что ошибка на кольце связана с погрешностью приборов и в кольце нет грубых ошибок. Такие кольца можно считать правильными, то есть топосъёмка их проведена качественно. Если z>2, то топосъёмка таких колец проведена неправильно. Уровень z показывает, на сколько кольцо ошибочно, чем больше z, тем больше ошибка.

В заключении давайте посмотрим на распределение колец пещеры Большая Орешная построив зависимость классической ошибки кольца и z-значения:

Здесь стоит отметить, что не все кольца, имеющие высокий z (то есть несущие существенные ошибки топосъёмки) имеют высокую классическую ошибку. Это доказывает, что классический способ (вычисление невязки колец) мало пригоден для определения качества топосъёмки.

Заключение

Таким образом, в настоящей статье показано, что широко распространённый классический способ оценки качества топосъёмки по невязке кольца, не всегда точно отражает реальную ошибку, а позволяет лишь примерно оценить качество. Поэтому предложен новый способ оценки качества топосъёмки – по значению статистического критерия z, что позволит более точно оценить реальную ошибку и в целом существенно повысить качество картирования.

07.2024 Алексей Горбенко