Часть 2
Докладчик начал говорить о том, что есть две области: теория вероятности и математическая статистика. Обе оперируют вероятностями, прогнозами – вроде бы обо дном и том же. Первая использует логику и рассуждения, вторая основана на наблюдениях и проведении экспериментов. И тут…докладчик делает неожиданные утверждения типа: теоретическая вероятность отличается от экспериментальной вероятности…Как это совмещать я не знаю, - говорит докладчик.
А не надо придумывать того, чего нет, и не надо будет искать выход, зайдя в тупик.
Теория вероятностей – наука, изучающая такие объекты как случайные события и случайные величины, закономерности, которым они подчиняются. Определение случайного события и случайной величины даётся в теории вероятностей. Каждой случайной величине соответствует какая-то генеральная совокупность. Генеральная совокупность в теории вероятности может воспроизводится посредством некоторой модели. Например, модели монеты. Идеальная модель монеты – это идеальный круг с нулевой толщиной и равномерным распределением плотности материала. Реальная объект, необходимо отметить, никогда не бывает тождественен своей модели. Реальная монета имеет толщину, имеет какие-то отклонения от симметричности, имеет смещенный центр тяжести.
И при этом использование модели идеальной монеты хорошо описывает поведение реальных монет. В достаточной мере хорошо. Что бы таким образом полученные теоретические результаты использовать для реальных объектов. Поведение объектов, имеющее достаточно малое отклонение от идеальных параметров, в практических целях мало отличается от поведения идеальных объектов. В этом есть сила и практическая ценность теории вероятности.
Математическая статистика решает задачу обратную задачи теории вероятности. Теория вероятностей, исходя из заранее заданных параметров случайной величины изучает её свойства и делает прогнозы относительно того какие значение примет случайная величина и с какой вероятностью в некоторых определённых условиях. Математическая статистика определяет, исходя из наблюдаемых данных, то какая случайная величина описывает наблюдаемое явление. Для этого в первую очередь вычисляются параметры, которые могут характеризовать случайную величину. Это, например, среднее значение, медиана, дисперсия и множество других, как, например, моменты различных порядков.
И важно понимать, что все эти вычисляемые на наблюдаемых данных, параметры сами являются случайными величинами. Они принимают различные значения на разных наборах данных, полученных в разных наблюдениях, опытах, экспериментах. И это нормальное, естественное поведение этих параметров! В теории вероятностей параметры с помощью которых производится описание случайной величины являются константами – это не случайные величины. Например, математическое ожидание.
Для того, чтобы произвести оценку математического ожидания, на наблюдаемом наборе данных вычисляют среднее значение. Среднее значение – это оценка математического ожидания, полученного в конкретном наблюдении. При другом аналогичном наблюдении, на полученных в другой раз данных, среднее значение окажется, почти наверняка, другим. В третьем наблюдении – будет третья значение и так далее…Все они будут принимать разные значения, и это не повод говорить, что раз так, то это значит, что математического ожидание не существует (это если не принимать во внимание некоторые специфические случаи). Значения средних будут «кучковаться», будут как-то распределены вокруг математического ожидания. А среднее средних уже будет ближе к математическому ожиданию.
Пример из доклада про вероятность выпадение орла. В разных сериях испытаний, подбрасывания монетки по 10 раз, количество случаев выпадения орла будет различно. В одно может выпасть пять раз, в другом, три, в третьем восемь раз. То есть частота выпадения может быть: 0,5; 0,3; 0,8 и так далее. И это относительная частота выпадения орла, а не вероятность!
Вероятность – это константа в теории вероятности, конкретно для модели идеальной моменты.
А относительная частота — это случайная величина, для которой эта вероятность является математическим ожиданием! Можно говорить, что относительная частота — это оценка вероятности! И нельзя говорить, что относительная частота – это вероятность! И нельзя говорить, что раз всё так, то и вероятности никакой не существует!
Это я уже перехожу к точности теста. Точность теста это одна из характеристик случайной величины, которая описывает тест на популяции проверяемых, и популяции полиграфологов. Точность теста, вычисленная на конкретных данных, конкретного полиграфолога – это оценка точности на популяции. Вероятность выпадения орла у реальной монетки отличатся от вероятности выпадения орла у идеальной монеты. Потому что параметры реальной монеты всегда имеют какие-то отклонения от идеальных значений. Но у хорошей монеты это отклонение не велико и в практических целях им можно пренебречь. И пренебрегают, получая при этом замечательные практические результаты.
Вот так же и полиграфный тест, какие-то отклонения, из-за личности полиграфолога могут быть, но они должны быть незначительны, и в практических целях их можно не учитывать. А как этого достичь? Полиграфологи должны единообразно соблюдать методику проведения теста. В противном случае, если кто в дуду, кто в барабан о точности теста на популяции полиграфологов действительно говорить смысла нет.
Тогда заказчик не может рассчитывать на определённую точность. А он ведь у полиграфолога не просто информацию покупает, он рассчитывает на то, что информация эта в достаточной мере точна.
По сути, тогда надо ставить крест на полиграфе, как на антинаучном явлении. Идея докладчика, что полиграфологи должны проводить внутренние исследования и сами определять свою точность…ну как бы сказать…интересна
Давайте завтра дадим такое задание всем полиграфологам. Я не сомневаюсь, что каждый проведет своё внутреннее исследование и придёт к выводу, что его точность, если не 100%, то уж 99% - можно даже не гадать.
Говорить, что раз в разных экспериментах наблюдалась разная точность теста, то значит точности теста нет - нельзя. В целом сравнивать разные наблюдаемые точности теста можно только на предмет определения статистически значимой разницы между ними – проводить статистические тесты. Если такой разницы нет, то и беспокоится не о чем. А если обнаруживается, то надо искать в чём причина, а не делать скоропалительные выводы грандиозных масштабов.