Волей случая, так звёзды сошлись, свой блог я начал с ответа на критику собственных работ, касающихся ДЛД (длины линии дыхания) Часть 1, Часть 2. Но читатель не присутсвоваший на онлайн-конференции, организованной Уральским бюро "Полигарф" в 2024 году, может быть совсем не в курсе их содержания. Для того, что бы сделать этот вопрос более ясным, выкладываю содержание моего доклада на этой конференции (с небольшими правками)

Исследования длины линии дыхания в различных тестовых методиках

Здравствуйте, коллеги! Скажу пару слов о себе, что бы было понятней происхождение части материала, на котором проводились наши исследования. В настоящее время я практикующей частный полиграфолог, и, кроме того, занимаюсь исследованиями в вопросах принятия решений полиграфологом по полиграмме. С 1998 года по 2019 год я был полицейским полиграфологом и провёл сотни оперативных проверок, тестирований на полиграфе по совершенным преступлениям. Часть преступлений, в рамках расследования которых проводились тестирования на полиграфе, в дальнейшем оказалась раскрыта, установлены преступники, и таким образом у меня на руках накопилась некоторое количество полиграмм, относительно которых стало известно лгали или отвечали правду опрашиваемые лица на релевантные вопросы тестов.

Таким образом у меня на руках, например, оказалась выборка тестов знания виновного (ТЗВ). Эти тесты проводились для выяснения известны ли проверяемому детали и подробности преступления, которые должен знать человек совершивший это преступление, и которые не получили огласку. В полицейской практике один тест на знание определенной детали, как правило, повторяется не менее двух раз. Чаще всего вопросы в тесте задавались в форме «Вам достоверно известно, что …». Каждый конкретный вопрос теста проверяемому не зачитывался. Вопросы обсуждались лишь в общем виде. Выяснялось имеется ли у проверяемого какие-либо догадки, версии и предположения относительно темы теста. Если такие обнаруживались, и были верны, то тест не проводился. Вопросы в тестах подбирались таким образом, чтобы ни один из них не выделялся на фоне других для непричастного проверяемого. Проверяемый отвечал на все вопросы теста «НЕТ».

Такая методика отличатся от методики проведения ТЗВ, которую предложил его создатель американский психофизиолог Дэвид Ликкен. По замыслу Д. Ликкена ТЗВ не является тестом на ложь или правду, а является тестом на узнавание. Исходя из этого, как нам известно, он инструктировал проверяемого повторять предлагаемый стимул вслед за полиграфологом. Важным ограничением накладываемым Ликкеном на анализ результатов ТЗВ является то, что он предписывал использовать для этого исключительно канал ЭДА. И утверждал, что каналы дыхания и сердечно-сосудистой активности в этой связи являются бесполезными. Информацию, излаженную выше, мы почерпнули из его книги «Тремор в крови». Но насколько нам известно Ликкен испытывал свои тесты только дважды в лабораторных условиях. И в ходе расследования реальных преступлений он не участвовал, используя свой авторский ТЗВ

Ликкен создал, как нам известно, две числовых оценки своего теста. Одна из них называется «2-1-1», а вторую он называл методом средних рангов. В этом методе амплитуды КГР стимулов одного ТЗВ ранжируются, и таким образом вычисляется ранг релевантного стимула. Затем полученные ранги релевантных стимулов всех ТЗВ (или их повторов) суммируются и делятся на количество ТЗВ. Таким образом получается средний суммарный ранг релевантного стимула. В книге «Тремор в крови» имеется таблица, составленная Д.Ликкен, в которой каждому среднему рангу сопоставлена вероятность того. Что невиновный подозреваемый получит тот или иной средний ранг на релевантный вопрос.

Описание картинки

Описание картинки

Для анализа результатов ТЗВ, которые были проведены по раскрытым уголовным делам. Мы использовали такой же подход – с ранжированием реакций, используя формулу, которую мы назвали «формулой Ликкена» мы вычислили аналогичную таблицу, но с более точными значениями.

С помощью методики вычисления суммарного ранга мы ранжировали не только амплитуду КГР, но и длину линии грудного дыхания. Длина измерялась от начала задавания вопроса и до истечения 10 секунд. Мы изучали поведение ВДЛД а выборке из 47 ТЗВ с пятью стимулами, которые были проведены с 20 причастными лицами. В среднем приблизительно по два теста с одного проверяемого лица. Все тесты повторялись дважды.

Ранжирование ВДЛД производилось в СППРП Сокол, использовался алгоритм Combi Calc v1. Самой короткой ДЛД в ТЗВ присваивался ранг 1, самой длиной ранг 5. Таким образом самая сильная реакция в канале дыхания получала минимальный ранг. Затем ранги стимулов суммировались по повторам ТЗВ. Например, таким образом получены ранги стимулов ТЗВ, которые представлены в табличке на рисунке. Релевантный стимул в табличке обозначен красным цветом. Как можно видеть о получил ранг 3. Это значит, что в одном из двух повторов ТЗВ он получил ранг 1 – проверяемый в канале дыхания сильнее всего отреагировал на релевантный стимул, а в другом повторе теста релевантному стимулу был присвоен ранг 2 – вторая по силе реакция. На диаграмме к этому тесту высота столбиков вычислена с использованием «формулы Ликкена» и суммарного ранга стимула ТЗВ. Чем выше столбик – тем сильнее реакция в канале дыхания. Кроме всего прочего с помощью этой диаграммы можно увидеть картину реагирования в канале дыхания, которая соответствует так называемому «пику напряжения».

Описание картинки

Если суммарный ранг релевантного стимула и какого ни будь другого, полученные таким образом, оказывались одинаковыми, то меньший ранг присваивался тому стимулу, средняя длина ВДЛД, которого была минимальной. В результате была получена следующая картина. Наименьший ранг у лиц с доказанной причастностью ВДЛД получило 32 раз. То есть, в 32 тестах наиболее сильная реакция в дыхании была на релевантный стимул. В 7-ми тестах - вторая по величине на релевантный стимул. 3-я по величине реакция была в 6 тестах, 4-я и 5-я – по одному тесту.

В итоге, имеем – минимальный ранг в дыхании у причастных лиц получен 32 раза, на остальные варианты пришлось 15 случаев. Если бы, как утверждал Д.Ликкен дыхание было бы бесполезно для анализа ТЗВ, то распределение суммарных рангов по местам было бы равномерным. Тогда на каждый вариант должно приходится равное количество случаев. Для данной выборки – это примерно по 9 случаев. Тогда самая сильная реакция в двух повторах ТЗВ должна была произойти 9 раз. На остальные варианты приходилось бы порядка 38-ми случаев.

Описание картинки

Что бы понять насколько статистически значимо наблюдаемый результат отличается от ожидаемого в случае, если прав Ликкен, и дыхание бесполезно для анализа ТЗВ, можно использовать тест χ2. Получаемое p-значение = 1,7·10-16. Биномиальный тест даёт достигаемый уровень значимости равный 1,3·10-12. Результаты статистических тестов однозначно свидетельствуют в пользу того, что точка зрения Дэвида Ликкена в случае ТЗВ с лицами совершившими преступные деяния не совсем правильна. Результаты по ВДЛД можно сравнить с результатами по КГР на этой же выборке. Амплитуда КГР присваивался ранг 1, если она была самой большой в повторе теста, следующей по величине ранг 2 и так далее. Минимальной амплитуде КГР присваивался ранг 5. Таким образом самая сильная реакция в канале КГР получала ранг 1, так же, как и в случая ВДЛД. Далее вычислялся суммарный ранг по двум повторам теста. В результате получено, что минимальный ранг амплитуда КГР получила в 37 случаях из 47, что всего на 5 случаев лучше, чем для ВДЛД.

Описание картинки

Далее мы посмотрели сколько было случаев, когда и КГР, и ВДЛД получали одновременно минимальный суммарный ранг, когда либо КГР, либо ВДЛД получали минимальный суммарный ранг. И количество случаев, когда ни КГР, ни ВДЛД не получали минимальный суммарный ранг.



Описание картинки

Таким образом, если принимать решение только по максимуму амплитуды КГР, то на данной выборке ТЗВ будет допущено 10 ошибок, или примерно 21% ошибок в определении знания причастным лицом релевантного признака совершенного деяния. Если же использовать и ВДЛД, принимать решение по минимальному рангу либо ВДЛД, либо КГР (и конечно по обоим минимальным рангам), то количество ошибок сокращается в два раза, их становиться 5 или примерно 11%. Таким образом, использование канала дыхания при принятии решения в ТЗВ по уголовным делам и расследованиям, может сократить количество ошибок до 2-x раз.

Для примера покажем результаты ранжирования ВДЛД и амплитуды ЭДА в недавнем служебном расследовании, по событию произошедшему в компании, намеренное отношение к которому проверяемого сейчас известно и подтверждено его признаниями, и признаниями других лиц. Сперва результаты ранжирования стимулиционно-адаптационного теста, входе которого спрашивалось имя проверяемого лица. Слева диаграмма с результатами ВДЛД, справа – КГР. Напомню, что самый большой столбик означает самую сильную реакцию. Из соображений конфиденциальности содержание вопросов скрыто.

Описание картинки

По амплитуде ЭДА нельзя выделить имя проверяемого лица. Но это можно сделать уверенно по ВДЛД.

Первый ТЗВ.

Центрированное изображение

По дыханию релевантный признак выделить можно уверенно, а по КГР сложнее – реакция на релевантный стимул вторая по силе.

Второй ТЗВ

Центрированное изображение

Третий ТЗВ

Центрированное изображение

Снова дыхание уверенно указывает на релевантный признак, кроме того, можно снова увидеть картину реагирования схожую с «пиком напряжения». Амплитуда ЭДА ведёт себя крайне неубедительно. Реакция вторая по силе, да ещё значительно меньше максимальной.

Дэвид Ликкен исследовал свои тесты в лабораторных условиях, и возможно сделал вывод о бесполезности дыхания, основываясь на них. Поэтому мы так же исследовалось поведение ВДЛД на 36 тестах ТЗВ проведенных в лабораторных условиях. Тестируемые брали карточки с различными изображениями и пытались скрыть от полиграфолога, то какую карточку они взяли.

Описание картинки

Тесты повторялись дважды. В этих тестах суммарный ранг ВДЛД в 13 случаях принимал наименьшее значение, что соответствует самой сильной реакции в дыхании на релевантный стимул. Ожидаемое значение при бесполезности дыхания примерно семь случаев. Расхождение наблюдаемых значений с ожидаемыми в лабораторных тестах значительно меньше, чем в случае тестов по уголовным расследованиям. В лабораторных условиях расхождение в 1,8 раза, в уголовных расследованиях в 3,4 раза.

Достигаемый уровень значимости в лабораторных тестах 0,016 (χ2), в биномиальном тесте – 0,018. На уровне 0,05 можно говорить о том, что и в этом случае Д.Ликкен был не прав. Но в лабораторных условиях эффект значительно меньше, чем в случае ТЗВ по уголовным делам. Результаты лабораторных тестов и тестов по уголовным делам в части ВДЛД имеют статистически значимую разницу на уровне 0,004 в χ2 тесте, 0,009 в биномиальном тесте. Таким образом эффект полезности ВДЛД присутствует и в лабораторных тестах, но он значительно уступает таковому в ТЗВ по уголовным расследованиям. Объяснение, по-видимому, состоит в том, что проверяемые, причастные к совершенным преступным деяниям, испытываю значительно больший стресс при предъявлении релевантного стимула в ТЗВ.

Продолжение