1. С учетом различных подходов к организации процесса оказания медицинской помощи, считаете ли Вы корректным сопоставление показателей по здравоохранению, или необходимо применять различные коэффициенты, корректирующие специфику различных стран?
Проиллюстрировать ответ на этот вопрос можно в двух различных контекстах. Один из них связан с сравнением показателей с точки зрения различных организационных структур/уровней предоставления услуг здравоохранения. Например, количество амбулаторных посещений имеет очень разное значение в контексте первичного медико-санитарного обслуживания и в больнице (как вторичная помощь), а также различается по существу: профессионально, административно и финансово. Поэтому у нас есть разнообразные наборы показателей, отражающие различные аспекты системы здравоохранения - состояние здоровья населения, факторы риска, охват услугами, эффективность системы здравоохранения, расходы на здравоохранение, KPI для измерения прогресса в достижении некоторых стратегических целей (например, национальной стратегии здравоохранения и т.д.), данные о потребностях потребителей и т.д. Национальные система анализа данных в области здравоохранения должна позволять создавать механизмы для удовлетворения всех этих аспектов.
Также я понимаю этот вопрос как - имеет ли смысл сравнивать некоторые стандартные показатели (например, 100 показателей ВОЗ) между странами с очень разными организациями здравоохранения. С одной стороны, да, потому что многие из таких индикаторов применимы в любой системе организации здравоохранения. Например, ожидаемая продолжительность жизни - это ожидаемая продолжительность жизни, независимо от того, какое медицинское обеспечение у вас есть. Никто не утверждает, что организация здравоохранения является единственным фактором, который влияет на ожидаемую продолжительность жизни, однако если у Вас низкая ожидаемая продолжительность жизни по сравнению с некоторыми другими странами, разумно подумать о реформировании вашей системы здравоохранения. Некоторые из таких показателей более специфичны (например, коэффициент материнской смертности), и сравнение Вашей страны с другими странами, конечно, поможет. К тому же, как бы ни выглядела организация здравоохранения в двух странах, некоторые фундаментальные составляющие все равно есть - всегда есть покупатель, поставщик услуг, пациент. Так, например, можно утверждать, что модель финансирования здравоохранения в одной стране более приемлема, чем в другой, но в конечном итоге, например, общие расходы на здравоохранение как процент от ВВП определенно сопоставимы с другими. С другой стороны, нет, но в основном это связано с пониманием общих экономических и социальных условий конкретной страны. Например, от таких обстоятельств может в значительной степени зависеть интерпретация уровня охвата вакцинации по тому или иному заболеванию. В одной стране охват в 90% может рассматриваться как неудача, а в другой - как большой успех. Но организация здравоохранения, конечно, не является оправданием - наоборот, в случае, если какой-то показатель низкий, это намек на то, что, вероятно, что-то не так и с организацией здравоохранения.
2. С учетом вариативности трактовки показателей отрасли здравоохранения, видите ли Вы перспективу развития процесса открытости данных? И если да, какими, на ваш взгляд, являются основные риски данного процесса?
Я бы сказал не столько "трактовка показателей", сколько "интерпретация данных". Нужен сдвиг парадигмы - потребители данных должны интерпретировать данные, а не показатели. Традиционный способ сбора статистических данных и отчетности через "жесткий" набор показателей здравоохранения позволил обеспечить стабильную сопоставимость данных и сыграл большую роль для понимания исторического развития здравоохранения. Но и этого оказалось недостаточно для более сложной аналитики данных, проводимой современными информационными технологиями. Сегодня у нас гораздо больше оцифрованных данных, и потребители нуждаются в открытом и динамичном доступе к необработанным данным. Мы никак не можем предвидеть все возможные варианты использования наборов данных (один и тот же набор данных может иметь очень разное использование и интерпретацию в зависимости от цели и модели обработки), поэтому нам лучше держать их открытыми для потребителей данных. Поэтому страны должны перейти к системам анализа данных, которые в меньшей степени ориентированы на статистику. Основной риск - это, конечно, нарушение правил доступа к данным и конфиденциальности. Другая причина заключается в наличии четких национальных рамок анализа данных для решения правовых, организационных и технических вопросов в этой области. В концептуальных основах должно быть проведено четкое различие (следует иметь в виду, что доступ к необработанным наборам данных не является тем же самым, что и к открытым наборам данных):
Наборы первичных данных. Речь идет о полных клинических или административных наборах данных (или базах данных), которые непосредственно не используются для анализа данных за пределами институциональных (или личных) границ владельцев данных. Это обычные данные о медицинских учреждениях, которые собираются и обрабатываются в медицинских учреждениях или других учреждениях и используются для оценки работы учреждения и планирования качества предоставляемых им услуг. Первичные наборы данных предназначены для сбора информации о медицинских услугах или другой деятельности, связанной с медицинским обслуживанием, и обмена такой информацией. Наборы первичных данных используются в медицинских учреждениях непосредственно во время оказания конкретной медицинской услуги, прежде чем они в конечном итоге направляются в качестве информации для аналитической обработки.
Наборы вторичных данных. Вторичные наборы данных о здоровье и/или медицинском обслуживании, или аналитические наборы данных, представляют собой группу отдельных, но обезличенных элементов данных, собираемых в соответствии с определенными правилами конкретного домена/приоритетной темы или поддомена, которые позволяют собирать наиболее репрезентативные данные о различных событиях в области здравоохранения или о состоянии здоровья соответствующего лица. Аналитические наборы данных являются основой для разработки показателей и докладов, которые собираются и представляются для анализа и улучшения показателей общественного здравоохранения и состояния здоровья населения. Собранные данные должны иметь контекст, придающий смысл сбору. Добавление контекста к данным помогает в получении информации. Одни и те же данные могут нести различную информацию в зависимости от домена и метаданных. Наборы аналитических данных динамически определяются и формируются для удовлетворения конкретных потребностей в конкретном контексте, но могут быть также преобразованы, чтобы быть полезными в другом контексте. Поскольку невозможно предвидеть все потребности во всех контекстах, наборы аналитических данных будут доступны потребителям данных в необработанном виде (не обобщенном в виде показателей или предварительно обработанном) для дальнейшей обработки данных (например, для создания специальных показателей и отчетов, принятия клинических решений, анализа больших объемов данных, ввода данных для машинного обучения и анализа с помощью искусственного интеллекта (ИИ), ввода данных для академических исследований и т.д.), которые соответствуют конкретным потребностям потребителей данных в конкретном контексте. Аналитические (вторичные) наборы данных должны быть независимыми и свободно доступными для использования авторизованными и сертифицированными пользователями.
Открытые наборы данных. Открытыми данными в контексте анализа данных об охране здоровья являются неограниченные данные об охране здоровья населения, доступные для широкой общественности с разрешения на повторное использование и распространение таких данных как в коммерческих, так и некоммерческих целях. Открытые данные должны быть в машиночитаемой форме и должны быть доступны каждому человеку для бесплатного и публичного использования.
3. Как Вы считаете, возможно ли использование искусственного интеллекта в аналитических системах оценки здоровья населения и насколько оно обосновано?
Да, возможно, и это происходит все больше и больше. Например, Израиль использовал прогностическую аналитику, основанную на идентификационных, продольных, полных жизненных циклов, гео-кодированных, электронных клинических данных о более чем половине населения Израиля - 4,4 млн. человек за два десятка лет. Данные были использованы для прогнозирования того, каким здоровым пациентам потребуется диализ в течение 5 лет - целевой < 1% населения - расширенный анализ на диабет, пневмонию, рак. Это позволило снизить рецидивы высокого риска с 37% до 13% в течение года. Это также сократило различия в качестве медицинской помощи среди пациентов с наименьшими доходами на 10% в профилактической медицине и на 60% в качественной. Еще один пример: Мэриленд, США, использовал АИ для выявления 5% пациентов, на которых приходилось 70% реадмиссии, и работал в 24 местных департаментах здравоохранения по отслеживанию и ведению этих пациентов без реадмиссии. Они сократили реадмиссии на 17%. (Источник: Наука о данных и цифровые инновации: A Global Perspective, Marelize Görgens and David Wilson | Всемирный банк, 2019).
Что касается обоснования, то полученная полезность очевидна. Если вы имели в виду в смысле замены человеческого интеллекта искусственным интеллектом - это общая тема, связанная с искусственным интеллектом, а не только в здравоохранении. До тех пор, пока баланс сохраняется, риски будут управляемыми.