Перейти к:
Возможности машинного обучения в прогнозировании акушерских кровотечений
https://doi.org/10.17749/2313-7347/ob.gyn.rep.2024.491
Аннотация
Акушерские кровотечения (АК) представляют собой основную предотвратимую причину заболеваемости, смертности и случаев «near miss» среди акушерских осложнений во всем мире. Своевременные профилактические меры, основанные на прогнозировании АК, позволяют существенно снизить уровень смертности и заболеваемости женщин, а также предотвратить экономические затраты на интенсивную терапию, гемотрансфузию, оперативное лечение и длительную госпитализацию пациенток. Наиболее частый вариант всех АК – послеродовое кровотечение (ПРК), обусловленное одной из четырех основных причин: нарушение тонуса матки, травмы родовых путей, аномалии плацентации и нарушения в системе гемостаза. Несмотря на многочисленные попытки разработать эффективную систему прогнозирования АК, сохраняется необходимость дальнейшего поиска точного и надежного метода прогноза. Для решения этой задачи целесообразно рассмотреть возможности технологий искусственного интеллекта (англ. artificial intelligence, AI). Это компьютерные технологии, основанные на нейросетях, способные генерировать выводы, подобно процессам мышления человека. Одним из частных вариантов AI является машинное обучение (англ. machine learning, ML), которое при помощи компьютерного анализа позволяет разрабатывать модели прогнозирования. В основе ML лежат компьютерные алгоритмы. Самые распространенные из них в медицинской сфере – это дерево решений (англ. decision tree, DT), наивный байесовский классификатор (англ. naive Bayes classifier, NBC), случайный лес (англ. random forest, RF), машина опорных векторов (англ. support vector machine, SVM), искусственная нейронная сеть (англ. artificial neural network, ANNs), глубокая нейронная сеть (англ. deep neural network, DNN) или глубокое обучение (англ. deep learning, DL) и сверточная нейронная сеть (англ. convolutional neural network, CNN). В обзоре представлены основные этапы ML, принципы работы алгоритмов и построения предиктивных моделей, а также перспективы применения AI для прогнозирования АК в реальной клинической практике.
Ключевые слова
Для цитирования:
Болдина Ю.С., Ившин А.А. Возможности машинного обучения в прогнозировании акушерских кровотечений. Акушерство, Гинекология и Репродукция. 2024;18(3):365-381. https://doi.org/10.17749/2313-7347/ob.gyn.rep.2024.491
For citation:
Boldina Yu.S., Ivshin A.A. Machine learning opportunities to predict obstetric haemorrhages. Obstetrics, Gynecology and Reproduction. 2024;18(3):365-381. (In Russ.) https://doi.org/10.17749/2313-7347/ob.gyn.rep.2024.491
Введение / Introduction
К акушерским кровотечениям (АК) относят кровотечения, возникающие во время беременности, в процессе родов, а также в раннем и позднем послеродовом периоде. Частота АК варьирует в разных странах и составляет от 3 до 8 % по отношению к общему числу родов, при этом 2–4 % АК связаны с гипотонией матки в последовом и раннем послеродовом периоде, около 1 % кровотечений возникают при преждевременной отслойке нормально расположенной плаценты и предлежании плаценты [1]. Тем не менее АК остаются основной предотвратимой причиной заболеваемости и смертности женщин во всем мире.
Ежедневно в мире от акушерского кровотечения умирает около 830 женщин [2]. Несмотря на общую положительную тенденцию к снижению числа АК, по некоторым данным за последние 20 лет отмечается изменение их структуры, преимущественно за счет увеличения частоты послеродовых кровотечений (ПРК) [3][4]. В Российской Федерации (РФ) прослеживается снижение числа АК в структуре материнской смертности (МС) и снижение показателя МС в целом. Так, по данным Росстата, в 2019 г. показатель МС в РФ составил 9,0 на 100 тыс. родившихся живыми, т. е. снизился на 1,1 % от уровня показателя в 2018 г. (9,1 на 100 тыс. родившихся живыми). Число случаев МС снизилось со 146 в 2018 г. до 134 в 2019 г [5]. Однако кровотечения сохраняют лидирующую позицию среди ведущих причин МС во время беременности, родов и послеродового периода [6]. По данным литературы, в РФ до 5 % родов осложняются кровотечением, которое, в свою очередь, до 20 % случаев становится причиной МС [7]. По данным Росстата, в 2019 г. АК заняли второе место в структуре МС и составили 14,5 %. При этом из 21 случая смерти от кровотечений 5 случаев (23,8 %) расценены как предотвратимые и 9 (42,9 %) как условно предотвратимые [5].
В результате систематического обзора причин МС за период с 2003 по 2009 гг., проведенного Всемирной организацией здравоохранения (ВОЗ), кровотечение являлось ведущей прямой причиной МС во всем мире, что составило в среднем 27,1 % (19,9–36,2 %) [8]. По данным анализа, проведенного ВОЗ в 2017 г., кровотечение также сохраняет лидирующую позицию в структуре показателя МС [9–11]. При этом более ⅔ всех зарегистрированных случаев смерти от кровотечения были классифицированы как ПРК.
Определение и предикторы послеродового кровотечения / Definition and predictors of postpartum hemorrhage
Согласно определению ВОЗ, ПРК – это кровопотеря в объеме более 500 мл после консервативных родов и более 1000 мл после операции кесарева сечения (КС). Американская коллегия акушеров-гинекологов (англ. American College of Obstetricians and Gynecologists, ACOG) в настоящее время определяет ПРК как общую кровопотерю не менее 1000 мл, или признаки или появление симптомов гиповолемии в течение 24 ч после родов [6]. АК приводят к формированию критических состояний, а также случаев «near miss» («едва не погибшие» женщины). Это происходит, как правило, при острой массивной кровопотере и запуске патологических каскадов в системе гемостаза, в тех ситуациях, когда объем акушерской помощи был оказан несвоевременно или в недостаточном объеме [12].
При развитии тяжелого кровотечения пациентке требуется гемотрансфузия, внушительный объем оперативной помощи, включая гистерэктомию, наблюдение в отделении интенсивной терапии, коррекция гемостаза и мониторинг витальных функций, что сопряжено с высоким риском неблагоприятного исхода.
Согласно клиническим рекомендациям Российского общества акушеров-гинекологов (РОАГ) «Послеродовое кровотечение», все причины ранних послеродовых кровотечений можно классифицировать по мнемонике «4T»: «тонус» (гипотония и атония матки), «травма» (повреждение родовых путей, сопровождающееся кровотечением), «ткань» (задержка частей последа в полости матки) и «тромбин» (нарушение свертывающей системы крови). Кровотечение в позднем послеродовом периоде возникает по одной из причин: остатки плацентарной ткани в полости матки, субинволюция матки, присоединение послеродовой инфекции либо наличие наследственных дефектов системы гемостаза [13]. Самыми частыми причинами ПРК являются атония матки (до 60 %) и осложнения со стороны отделения плаценты (36 %) [14].
К факторам атонии матки относят растяжение матки в результате многоплодной беременности, многоводия и макросомии плода, патологию прикрепления плаценты, отслойку плаценты, воспалительные процессы в полости матки. Кроме того, предрасполагающими факторами атонии матки являются рубец на матке, оперативные вагинальные роды, миома матки, тяжелая анемия [15], нарушение жирового обмена [16]. Атонические ПРК развиваются в результате так называемой «послеродовой метропатии», обусловленной дефектом процессов инволюции миометрия и маточных сосудов. Существуют данные, указывающие на взаимосвязь аномальной инволюции матки с длительным третьим периодом родов и отсутствием профилактики окситоцином [17].
Факторы риска, которые могут привести к вывороту матки, включают чрезмерное натяжение пуповины и короткую пуповину. Факторы риска травмы половых путей включают оперативные вагинальные роды и преждевременные роды [18].
К предикторам ПРК в результате коагулопатии относятся наследственные заболевания, связанные с нарушением свертывания крови: болезнь Виллебранда, носительство гемофилии, дефицит X фактора свертывания и редкие нарушения свертывающей системы. Факторами риска коагулопатии являются также HELLP-синдром (гемолиз, повышение ферментов печени и низкий уровень тромбоцитов), применение антикоагулянтов, амниотическая эмболия и массивная кровопотеря [19][20].
Традиционные статистические методы в прогнозировании послеродового кровотечения / Traditional statistics methods in predicting postpartum hemorrhage
Формирование целевой группы риска по развитию ПРК может способствовать проведению адекватных профилактических мероприятий и позволит обеспечить своевременное применение кровесберегающих технологий у данной категории пациенток, что положительным образом скажется на снижении заболеваемости и смертности, приведет к сокращению экономических затрат на лечение и в итоге улучшит исходы. Прогнозирование ПРК на основе доступной информации представляет собой перспективный ресурс для снижения развития данного осложнения. Применение разработанных прогностических математических моделей позволит оценивать риски кровотечения в клинической практике. Такие срочные прогнозы в режиме реального времени будут эффективно влиять на принятие решения. Например, своевременное изменение плана родов в сторону операции КС, профилактическое назначение утеротонических и гемостатических средств или дородовая госпитализация в стационар, оказывающий более высокий уровень медицинской помощи и обладающий широким спектром технических возможностей для оказания помощи пациенткам с высоким риском массивных АК [21].
Вопрос поиска эффективного способа прогнозирования АК является актуальным для акушерского научного сообщества во всем мире. С этой целью ученые рассматривают анализ анамнестических и объективных данных и результаты инструментальных и лабораторных исследований. Так, например, американские ученые изучали возможность прогнозировать ПРК посредством ультразвукового исследования послеродовой матки. Исследование было применимо для женщин после консервативных родов при сроке беременности свыше 34 нед. Ученые оценивали взаимосвязь между шириной полости матки и снижением уровня гемоглобина. В ходе анализа было выявлено, что значимым прогностическим порогом для развития ПРК является ширина полости матки 4,1 см (100 % чувствительность и 97 % специфичность) [22].
Стратификация риска посредством оценки анамнестических и физикальных данных является наиболее актуальным методом прогнозирования ПРК. Достижение оптимальной прогностической способности может быть осуществлено как с помощью применения традиционных статистических методов, так и с использованием современных цифровых технологий посредством анализа больших массивов медицинских данных [14].
Например, испанские исследователи разработали и проверили на клинической практике модель прогнозирования кровотечений, возникающих после родов через естественные родовые пути. С этой целью был проведен ретроспективный анализ электронных медицинских карт 2336 женщин после одноплодных консервативных родов. В качестве критерия кровопотери выступало снижение уровня гемоглобина менее 35 г/л. Анализ проводился с помощью традиционных методов медицинской статистики, таких как критерий χ2 и t-критерий Стьюдента, критерий Лемешоу и бинарная логистическая регрессия. В результате в качестве основных предикторов ПРК были определены возраст, первородящие женщины, затяжное течение первого и второго периода родов, масса тела новорожденного и исходно низкий уровень гемоглобина [23].
Китайские ученые провели ретроспективное исследование «случай–контроль» с целью выявления факторов риска тяжелого ПРК, используя логистический регрессионный анализ записей медицинских карт 33344 женщин, у которых произошли роды при сроке после 28 нед в период с января 2015 г. по август 2019 г. Критериями тяжелого ПРК являлись кровопотеря более 1000 мл и переливание крови 4 и более единиц. Число пациенток, у которых произошло ПРК, составило 532 (1,56 %). В ходе исследования наиболее значимыми факторами риска тяжелого ПРК стали возраст матери менее 18 лет, предыдущая операция КС, ПРК в анамнезе, зачатие посредством экстракорпорального оплодотворения, дородовая анемия, мертворождение, затяжные роды, предлежание плаценты, отслойка плаценты и макросомия [24].
В результате исследования, проведенного N.L. Ambounda с соавт., в котором был выполнен ретроспективный анализ 42 728 записей медицинских карт пациенток, основными факторами риска ПРК стали многоплодие, первые роды, переношенная беременность и крупный плод [25].
S. Helman с соавт. провели ретроспективное исследование на основе баз данных и банка крови за период с 2005 по 2014 гг. Были проанализированы данные 113 342 женщин, из которых у 0,1 % возникло массивное кровотечение. На основе логистической регрессии была построена пошаговая прогностическая модель акушерских кровотечений. Среди факторов риска наибольший вклад составили предшествующая операция КС, самопроизвольный выкидыш, многоплодие, индукция родов, выполняемое КС, инструментальное родоразрешение. Преимущество данного исследования заключалось в большой численности выборки и применении статистических моделей с высокой точностью [26].
Ученые из Саудовской Аравии провели ретроспективное исследование данных медицинских карт женщин, родивших в период с января 2015 г. по декабрь 2018 г. В качестве критерия кровотечения использовались кровопотеря более 500 мл при консервативных родах и более 1000 мл при оперативном абдоминальном родоразрешении. Для анализа применялись традиционные статистические методы с использованием критерия χ2 и логистической регрессии. В качестве значимых предикторов, увеличивающих частоту ПРК, были определены эпидуральная аналгезия, индуцированные роды, использование родостимуляции и эпизиотомия [27].
Несмотря на многочисленные исследования, вопрос выявления факторов риска и прогнозирования АК остается актуальным. Традиционные статистические методы имеют ряд ограничений, из-за которых в реальной клинической практике не всегда возможно использование даже теоретически проверенных прогностических моделей. К таким ограничениям относятся неоднородность исследований, ограниченное количество данных для анализа, что не всегда способно отразить реальную клиническую ситуацию. Стандартные статистические методы оценивают вклад каждого из ограниченного числа предикторов по отдельности и не принимают во внимание их взаимоотношения между собой [28].
Прогнозирование кровотечений остается сложной задачей для акушерского научного сообщества. Перспективной видится дальнейшая работа в этой области с использованием новых знаний и современных методик. Совокупность современных научных достижений и новейших компьютерных технологий, которые включают искусственный интеллект, базы больших данных («big data») и облачные вычисления, открывают широкие возможности для прогноза акушерских осложнений, включая кровотечения. Применение технологий искусственного интеллекта (англ. artificial intelligence, AI) представляется эффективным методом прогнозирования в реальной клинической практике, который позволит клиницистам принимать своевременные решения по профилактике и объему оказания медицинской помощи.
Искусственный интеллект / Artificial intelligence
Искусственный интеллект – это направление информатики, которое рассматривает применение компьютеров и информационных технологий для моделирования интеллектуального поведения и критического мышления, сопоставимого с человеческим [28].
Почти сразу после появления первых компьютеров люди стали задаваться вопросом, возможно ли создать машину, способную проявлять интеллектуальные возможности, аналогичные человеческим. Еще в 1950 г. английский математик Алан Тьюринг разработал и опубликовал в статье «Вычислительные машины и разум» тест, доказывающий способность машин имитировать человеческое поведение и мышление [29].
А в 1956 г. Джон Маккарти впервые описал термин «Artifitial intelligence» как науку и технику создания интеллектуальных машин [30]. В 1980-х и 1990-х годах наблюдался всплеск интереса к AI во многих сферах, в том числе и в сфере здравоохранения. Методы AI, такие как нечеткие экспертные системы, байесовские сети, искусственные нейронные сети и гибридные интеллектуальные системы использовались в различных клинических условиях в медицине. На сегодняшний день уровень вычислительных возможностей машин возрос до моментальных вычислений и способности анализировать данные в режиме реального времени [30].
Практически все аспекты современной жизни так или иначе связаны с большими данными и машинным обучением. Netflix знает, какие фильмы люди любят смотреть, Google знает, что люди хотят узнать, на основе истории их поиска [31], без AI трудно представить современное автоматизированное производство, коммуникации, системы наблюдения; бытовая техника («Smart-home») и личные помощники работают на основе AI. Безусловно, медицинская сфера не могла обойти стороной этот сравнительно новый, подающий большие надежды, инструмент. В 2016 г. на приложения для здравоохранения пришлось больше всего инвестиций в исследования AI по сравнению с другими отраслями [31]. Алгоритмы AI используются в медицинской сфере в виде онлайн-записи на прием, онлайн-регистрации в медицинских центрах, оцифровки медицинских записей, напоминаний о последующих визитах и дат иммунизации для детей, контроля приема лекарств [31].
Искусственный интеллект уже широко применяется в кардиологии [32][33], радиологии, онкологии [34, 35], эндокринологии [36], офтальмологии [37] и других областях медицины. Основными направлениями исследований и разработок в сфере программного обеспечения на основе технологий AI являются диагностика и прогнозирование развития заболеваний и их осложнений, подбор персонифицированной терапии, работа персональных медицинских помощников для мониторинга и оценки состояния больных в режиме реального времени, разработка новых лекарственных средств и поддержка их клинических испытаний. В настоящее время развитие AI в медицине является приоритетным стратегическим направлением в РФ, что продиктовано «Национальной стратегией развития искусственного интеллекта на период до 2030 года» [38].
Машинное обучение (англ. machine learning, ML) – это раздел AI, в котором математические и статистические подходы применяются с целью повышения производительности компьютеров. Термин «machine learning» ввел в 1959 г. Артур Сэмюэль и описал его как предоставление компьютерам способность обучаться без явной поддержки человека [39].
При работе с ML существует следующее правило: чем больший объем данных анализируется, тем более точный прогноз можно ожидать. В медицинской сфере данные представляют собой массивный ресурс, соответственно, следует ожидать от применения ML высокую прогностическую точность. Применение ML в здравоохранении является экономически выгодным. По оценкам экспертов, ML с применением больших данных в медицине и фармацевтике может приносить доход до 100 млрд долларов США в год [40].
В отличие от традиционных статистических моделей прогнозирования, ML не только вычисляет прогноз относительно новых данных, но и выявляет взаимоотношения между различными предикторами, а также предсказывает исход событий на основе уже имеющегося опыта. Кроме того, ML отличается от статистических методов возможностью обучения на примерах, а не при помощи заданных правил [41].
Основная концепция ML – введение алгоритмов, использующих входные данные, применение компьютерного анализа для прогнозирования выходных значений в пределах приемлемого диапазона точности, выявление закономерности и тенденции в данных и, наконец, извлечение уроков из предыдущего опыта [39].
Существуют многочисленные варианты моделей ML и, как правило, они относятся к одному из перечисленных типов:
- Обучение с учителем (англ. supervised learning)
- Обучение без учителя (англ. unsupervised learning)
- Полуавтоматическое обучение (англ. semi-super-vised learning)
- Обучение с подкреплением (англ. reinforcement learning).
Контролируемое обучение или обучение с учителем / Supervised learning or associative learning
При обучении с учителем предоставляется компьютер с функциями, относящимся к цели обучения (например, демографические данные пациента и факторы риска) и результаты, которые должны быть достигнуты (такие, как диагноз или клиническое событие) с целью выявления связи между двумя этими наборами данных. Этот процесс вывода переменных из предыдущих известных примеров позволяют проводить регрессионный анализ. Данная концепция обычно используется в статистике, позволяя улучшить точность предсказания. При обучении алгоритм прогнозирования способен оценивать все большее количество переменных и создавать сложные модели нелинейных отношений между независимыми и зависимыми переменными. Технология контролируемого обучения ориентирована на классификацию (classification) для определения категории нового наблюдения, основанного на обучающей выборке, и регрессию (regression) – прогнозирование значений для переменной на основе обучающего набора с известными значениями. Например, такое обучение может быть использовано для расчета риска сердечно-сосудистых заболеваний, прогноза определения размера опухоли, оценки индивидуального риска заболевания или прогнозирования продолжительности пребывания в стационаре [39].
Неконтролируемое обучение или обучение без учителя / Unsupervised learning
При обучении без учителя предоставляется компьютер с неклассифицированными записями данных для распознавания, который определяет, присутствуют ли скрытые паттерны, заданные исследователями.
С технической точки зрения, в отличие контролируемого обучения, связанного с классификацией и регрессией, неконтролируемое обучение в основном занимается кластеризацией (clustering) и снижением размерности (dimensionality reduction). Кластеризация – это идентификация групп внутри данных, т. е. алгоритм анализирует предоставленные данные и определяет любые скрытые подобия и различия, которые позволяют сгруппировать субъекты в подразделы. В медицине такой процесс применяется при исследовании сложных взаимосвязей между генетическими, биохимическими процессами в гистологии и патологии [39].
Полууправляемое (полуавтоматическое) обучение / Semi-supervised learning
Это сочетание контролируемого и неконтролируемого ML, которое может анализировать большое количество немаркированных данных, одновременно расширяя возможности распознавания образов небольшим количеством помеченных данных. С медицинской точки зрения этот подход ценен, так как присвоение меток в информации (например, истории болезни) может быть трудоемким и дорогостоящим, учитывая сложность и обилие медицинских данных. Кроме того, полууправляемое обучение может увеличить скорость и точность извлечения информации из больших наборов данных. Полуавтоматическое обучение используется, например, для анализа научных статей на предмет включения в систематические обзоры изучаемой темы [40].
Обучение с подкреплением / Reinforcement learning
Это обучение представляет собой один из частных вариантов обучения с учителем. В данной модели в качестве учителя является среда (а не специальная система управления с подкреплением), при этом между средой и алгоритмом обучения формируется контур с обратной связью.
Этапы процесса машинного обучения / Machine learning stages
Процесс машинного обучения представляет собой последовательные этапы:
- Импорт входных данных и их подготовка («очищение», упорядочивание) для дальнейшего анализа, в ходе чего формируются матрицы терминов [42]. Информация может быть получена из баз данных, содержащих массивный объем как структурированных, так и неструктурированных данных. Используемые данные проходят процедуру деперсонификации.
- Выбор необходимых алгоритмов ML и их обучение. Наиболее распространенными в медицине алгоритмами являются дерево решений (англ. decision tree, DT), наивный байесовский классификатор (англ. naive Bayes classifier, NBC) случайный лес (англ. random forest, RF), машина опорных векторов (англ. support vector machine, SVM), искусственная нейронная сеть (англ. artificial neural network, ANNs), глубокая нейронная сеть (англ. deep neural network, DNN) или глубокое обучение (англ. deep learning, DL) и сверточная нейронная сеть (англ. convolutional neural network, CNN) [43]. Более подробное описание данных алгоритмов будут приведены ниже.
- Тестирование алгоритмов ML. Производится проверка путем сравнения прогнозов, полученных при помощи алгоритмов, с истинными прогнозами, составленными на основе уже имеющихся данных.
- Оценка эффективности алгоритмов. Проводится при помощи показателей чувствительности (доля истинно положительных результатов), точности (доля верно классифицированных случаев) и специфичности метода (доля истинно отрицательных результатов), построение кривых рабочих характеристик приемника (англ. receiver operating characteristic, ROC, кривая ошибок). Она показывает зависимость количества положительных случаев от количества неверно классифицированных отрицательных случаев. При визуальном сравнении нескольких кривых ROC не всегда возможно выявить наиболее эффективную модель. В таком случае используется метод сравнения кривых, называемый оценкой площади под кривой (англ. area under curve, AUC). При этом можно считать, что чем выше показатель AUC, тем более высокой прогностической ценностью обладает модель (все прогнозы верны, если AUC = 1).
- Применение протестированных моделей на новых данных с целью прогноза и дальнейшего обучения.
Алгоритмы машинного обучения / Machine learning algorithms
- Деревья решений (решающие деревья, деревья классификации) – это структура, представленная в виде блок-схемы по методу ветвления, отображающая каждый возможный итог принятия решений. Дерево решений состоит из внутренних узлов, ветвей и конечных узлов. Деревья классификации позволяют решать задачу прогнозирования качественного признака (иначе такая задача называется задачей классификации). Как правило, задача классификации в медицинских исследованиях используется, когда выяснение реального значения качественного признака является либо очень дорогим, опасным для здоровья человека, либо в принципе затруднительным по каким-либо причинам (долгое по времени и т. д.) [44].
- Наивный байесовский классификатор (NBC) рассчитывает прогнозы на основе теоремы Байеса. Суть теоремы в том, что вероятность зависимой переменной при определенных значениях независимых переменных может быть получена из вероятностей этих переменных, исходя из заданного значения зависимой переменной [44]. Этот алгоритм позволяет определять более точный прогноз относительно новой информации на основе уже имеющихся данных.
- Случайный лес (RF) – это комбинация нескольких деревьев решений, каждое из которых строится из исходной обучающей выборки с помощью бутстрапирования (bootstrap – метод определения доверительных интервалов статистических оценок). Сущность метода сводится к использованию ансамбля деревьев решений, при этом каждое дерево получает не всю выборку, а лишь определенный набор наблюдений; также деревья получают не все признаки для предсказания, а количество, равное квадратному корню из общего числа признаков. При таком подходе каждое отдельное дерево дает классификацию, и за счет их большого числа итоговый результат получается достаточно точным. Достоинствами данного метода являются: возможность обработки данных с большим количеством признаков; отсутствие чувствительности к изменению значений признаков; применимость к дискретным и непрерывным признакам; легкость распараллеливания и масштабируемости. Из недостатков метода стоит отметить большой размер выходных моделей, отсутствие контроля над моделью [45].
- Машина опорных векторов (SVM) создает «гиперплоскость» в виде линии или пространства, которое разделяет данные с максимальным расстоянием между разными группами [46]. Суть метода заключается в сортировке данных на подгруппы при помощи алгоритма. При этом используется набор обучающих примеров, которые помечены как принадлежащие к той или иной подгруппе. После обу-
чения алгоритм строит модель, которая будет относить новые данные к одной из подгрупп. - Искусственная нейронная сеть (ANNs) представляет собой сеть узлов ввода и вывода («нейронов»), связанных между собой. Этот алгоритм имитирует работу головного мозга человека. ANNs содержит один входной слой, один, два или три скрытых слоев и один выходной слой. Связь нейронов осуществляется на основании «весов» (числовых значений, показывающих, какое влияние оказывают нейроны предыдущего слоя на нейроны последующего) от входного слоя с каждым последующим. Этот процесс называется алгоритмом прямой связи. Затем эти «веса» корректируются в зависимости от того, какой вклад они внесли в «потери» (разница между фактическими и прогнозируемыми конечными результатами). Алгоритмы будут повторяться до тех пор, пока не сформируется определенная модель, обеспечивающая точный прогноз [47].
- Глубокая нейронная сеть (DNN) или глубокое обу-
чение (DL) – это вариант искусственной нейронной сети, которая содержит более 5 скрытых нейронных слоев [47]. - Сверточная нейронная сеть (CNN) представляет собой специальную архитектуру нейронных сетей, предназначенную для эффективного распознавания образов [47].
Для повышения производительности ML применяются различные функции, такие как бустинг (boosting, усиление градиента) – это техника построения ансамблей, в которой предсказатели построены последовательно. При этом каждая последующая модель учится на ошибках предыдущей. Одним из высокоэффективных, частных вариантов бустинга является экстремальное усиление градиента (XGBoost). Наиболее часто используется для таких алгоритмов, как дерево решений или случайный лес.
Примеры применения машинного обучения в прогнозировании акушерских кровотечений / Machine learning in predicting obstetric hemorrhage
Китайские ученые (отделение акушерства, Пекинская больница акушерства и гинекологии Столичного медицинского университета, Китай) изучили возможности ансамблевого ML в контексте прогнозирования ПРК. Исследование проводилось на данных 3842 родов за 2017 г., в 361 случаях было зарегистрировано ПРК. Важно отметить, что данные имели дисбаланс положительных и отрицательных случаев, что приближает исследование к условиям реальной клинической практики. Для анализа были подобраны 23 характеристики как связанные с беременностью, так и непосредственно с родами: возраст, паритет, срок беременности, наличие анемии и уровень гемоглобина, характер околоплодных вод, методы преиндукции и индукции, своевременность излития околоплодных вод, методы обезболивания, родоусиление окситоцином и длительность его применения, продолжительность родов, целостность родовых путей, тонус матки и масса тела плода. Все полученные данные были разделены на 2 группы – 65 % для обучения и 35 % для тестирования. Для анализа применялось ансамблевое обучение, включающее случайный лес, экстремальное усиление градиента, дерево решений с усилением градиента, SVM. Разработанная модель показала высокую прогностическую способность в отношении ПРК, точность метода составила 96,7 %, для ДВС-синдорома (диссеминированного внутрисосудистого свертывания) точность составила 90,3 %. Среди наиболее значимых факторов риска ПРК были выявлены нарушение тонуса матки, длительность родов, наличие травм родовых путей и длительность применения окситоцина. Ученые ожидают, что благодаря результатам прогнозов при помощи разработанной модели у акушеров появится возможность применения методов для того, чтобы справиться с потенциальным кровотечением [48].
K.K. Venkatesh с соавт. (кафедра акушерства и гинекологии Университета Дьюка, Северная Каролина, США) провели внушительное ретроспективное исследование по оценке прогностической способности моделей машинного обучения в прогнозировании ПРК. Для исследования были запрошены обезличенные данные электронных медицинских карт 152279 родов из Национального института детского здоровья и развития человека (анл. National Institute of Child Health and Human Development, NICHD) в период с 2002 по 2008 гг., извлеченные из 12 клинических баз 19 больниц в девяти округах США. Исследуемую группу составляли роды, произошедшие на сроке беременности 23 недель и более, при этом под ПРК подразумевалась кровопотеря не менее 1000 мл независимо от способа родоразрешения. Этим критериям соответствовали 7279 случаев. В качестве предикторов кровотечений были рассмотрены факторы риска, заявленные Калифорнийской организацией по обеспечению качества материнского медицинского обслуживания (англ. California Maternal Quality Care Collaborative, CMQCC) и ACOG, а также дополнительные факторы, такие как возраст, раса, наличие акушерских осложнений (предлежание плаценты, макросомия плода, преэклампсия), экстрагенитальная патология (хроническая артериальная гипертензия и сахарный диабет). Для прогноза были разработаны 2 статистические модели: традиционная статистическая модель на основе логистической регрессии и регрессии Лассо и модель на основе ML, включающая случайный лес и экстремальное усиление градиента. В ходе анализа были выявлены наиболее значимые факторы, способствующие развитию ПРК; к ним были отнесены масса тела матери до беременности и на момент поступления, индекс массы тела (ИМТ), температура тела при поступлении, макросомия плода, многоплодие, уровень систолического артериального давления, наличие анемии. Наилучшую прогностическую эффективность показали экстремальное усиление градиента, AUC которого составила 0,93, а точность 95 %, и случайный лес – AUC = 0,92, точность – 95 %, что превышало показатели регрессии Лассо (AUC = 0,87, точность – 95 %). Исследователи считают внедрение моделей ML перспективным методом прогноза ПРК как в сочетании с традиционными статистическими методами, так и отдельно. Прогноз ПРК может позволить провести сортировку беременных по группам риска, а также применить профилактические меры по предупреждению кровотечений. Ученые рассматривают целесообразность интеграции подобных моделей в онлайн-калькулятор или автоматически совмещенный ввод в электронную медицинскую карту для немедленного использования их при поступлении пациента в стационар [49].
J. Liu с соавт. (Наньчанский университет, Китай) провели первое исследование с использованием методов глубокого обучения и МРТ-изображений матки. Исследование направлено на прогнозирование уровня кровотечения во время операции КС у пациенток с предлежанием плаценты в области рубца после предшествующего КС. Данные получены из первой дочерней больницы Наньчанского университета. Всего было 210 образцов, для которых объем кровопотери составил 500 мл и более, из них 82 положительных случая. Количество отрицательных образцов с объемом кровопотери менее 500 мл составило 128 случаев. Исследование проводилось в 2 этапа. В первую очередь беременным было выполнено МРТ брюшной полости, получено 9 изображений МРТ с толщиной среза 7 мм. При помощи искусственной нейронной сети и компьютерной программы (Deep Lab-V3 + network) производилось распознавание и сегментирование области матки от исходных МРТ-изображений. После этого данные были разделены на 2 группы – 168 изображений для обучения и 42 для тестирования, затем проведена 5-кратная перекрестная проверка. Второй этап исследования был направлен на прогнозирование кровотечения на основе полученных МРТ-изображений интересующей области матки. Каждый кейс содержал по 9 изображений в виде независимой выборки. Таким образом, было 630 положительных и отрицательных изображений для обучения и 108 положительных и отрицательных изображений для тестирования. Анализ проводился на платформе Tensor Flow, в ходе которого было проведено 6 последовательных шагов обучения сверточной нейронной сети VGGNet-16. В результате исследования была разработана прогностическая модель кровопотери. При сравнении ручного и автоматического метода прогнозирования автоматический метод показал наилучшие результаты. Точность метода составила 75,6 %, чувствительность – 73,7 %, специфичность – 74,46 %. Разработанная модель не только автоматически определяет необходимую область матки, но и объективно указывает уровень интраоперационного кровотечения, благодаря чему возможно повышение точности заключения экспертов об уровне кровотечения во время операции КС и выборе необходимых способов гемостаза [50].
Японские ученые (Медицинский университет Сайтамы) провели исследование с применением AI для качественного соотношения между распределением фибриногена и продуктов деградации фибриногена как индикаторов массивного АК. Данные были извлечены из 8 национальных перинатальных центров Японии за период с 2011 по 2015 гг. Количество родов составило 22 330, а число зарегистрированных массивных кровотечений – 154. Это случаи кровотечения объемом 2000 мл и более, исключая те, при которых развился ДВС-синдром. Всего было 83 случая для КС и 71 случай для вагинальных родов. Полученные данные были разделены на 2 группы по уровню фибриногена. Группа, где уровень фибриногена был меньше значения критерия, определена как «группа с низким фибриногеном»; группа, где уровень фибриногена соответствовал критериям или превышал их, определена как «группа с нормальным фибриногеном». Распределение данных в обеих группах было исследовано при помощи алгоритмов AI. В каждой группе определены медиана, 95-й процентиль, среднее значение, стандартное отклонение, коэффициенты асимметрии и эксцесса уровней продуктов деградации фибрина. Исследование проводилось на платформе Mac под управлением OS X 10.11.6 (Apple, Inc) и Mathematica 12.0.0.0 (Wolfram Research). Производство продуктов деградации фибрина описывалось дифференциальными уравнениями с использованием набора данных из двух групп. AI теоретически не обязателен в этом исследовании, но его применение обеспечило высокую эффективность и было более выгодно на практике. Критерий фибриногена при массивном кровотечении в родах составил 2,37 г/л. Предполагается, что при достижении этого значения фибриногена следует ожидать развития коагулопатии. В то время как для небеременных, по данным руководящих принципов Японского общества по тромбозам и гемостазу, коа-
гулопатия ожидается при уровне фибриногена менее 1,5 г/л. В будущих исследованиях ученые планируют исследовать эти критерии с наборами данных, включающими ДВС-синдром, а также оценку других маркеров коагуляции, таких как D-димер, плазмин-α2, ингибитор активатора плазминогена, протромбиновое время [51].
J.M. Westcott с соавт. (отделение материнско-фетальной медицины, отделение акушерства и гинекологии, Нью-Йорк) провели ретроспективное когортное исследование в медицинском центре NYU Langone Health по прогнозированию АК при помощи алгоритмов ML. Они проанализировали при помощи компьютерных технологий данные 30867 электронных медицинских карт, полученные в период с июля 2013 г. по октябрь 2018 г. При исследовании оценивались
демографические показатели, медицинский, акушерский, хирургический анамнез, результаты лабораторных исследований и применяемые лекарственные препараты. Критерием кровотечения была определена кровопотеря объемом более 1000 мл. Среди всех исследуемых кровотечение возникло в 2179 случаях. Все данные были разделены на 2 группы – 70 % для обучения и 15 % для проверки. Для оценки эффективности применялись показатели точности, чувствительности и AUC. Прогнозирование осуществлялось путем контролируемого обучения с использованием логистической регрессии, случайного леса, дерева решений с градиентом усиления (XGBoots), а также машины опорных векторов. В ходе работы были созданы 2 модели: 1) для данных, полученных до родов; 2) для данных, доступных до второго периода родов, на момент принятия решения в отношении акушерской тактики. В результате исследования были выявлены наиболее важные факторы риска АК, такие как ИМТ, уровень гематокрита, срочное и плановое КС, уровень тромбоцитов в родах. Наилучший результат показало дерево решений с градиентом усиления; для первой модели точность составила 98,1 %, чувствительность – 0,763, AUC = 0,979; для второй модели точность составила 98 %, чувствительность – 0,737, AUC = 0,955. Первая модель оказалась способна успешно предсказать почти 3 из каждых четырех пациенток с ПРК. Важно отметить, что среди всех оцениваемых факторов риска многие не вошли в окончательную оценку риска в связи с их невысокой прогностической ценностью; к ним относились, например, многоплодная беременность, оперативные вагинальные роды и кровотечение в анамнезе. Это указывает на то, что многие факторы риска не вносят столь высокий вклад в развитие АК, как это считалось ранее. Следовательно, существует необходимость дальнейших исследований в данной области с целью определения действительно значимых факторов риска АК [52].
M. Akazawa с соавт. (Япония) изучили модели ML для прогнозирования ПРК среди женщин после консервативного родоразрешения в Восточном центре Токийского женского медицинского университета. Для исследования была сформирована выборка, включавшая роды через естественные родовые пути, произошедшие в период с 1995 по 2020 гг. Всего в исследование было включено 9894 пациентки, у которых роды произошли через естественные родовые пути, при этом в 188 (1,9 %) случаях кровопотеря составляла более 1000 мл. Для прогнозирования ПРК были использованы как непрерывные, так и категориальные переменные, включающие возраст, паритет, рост матери, массу тела матери до беременности и во время родов, массу тела плода на момент родов, гендер (пол) ребенка, предлежание (головное или ягодичное), использование окситоцина в родах, способ вагинальных родов (самостоятельные роды, вакуум-экстракция плода или наложение акушерских щипцов). Для анализа данных была разработана модель глубокого обучения, состоящая из двух слоев нейронных сетей, которая основывалась на 5 классификаторах ML, включая логистическую регрессию, машину опорных векторов, случайный лес, деревья решений и градиент усиления (XGBoots). Для оценки производительности авторы использовали следующие параметры: площадь под кривой рабочей характеристики приемника (AUC), точность, частота ложных срабатываний (англ. false positive rate, FPR) и частота ложных отрицательных результатов (англ. false negative rate, FNR). Среди классификаторов ML лучшую производительность продемонстрировала логистическая регрессия (AUC = 0,708; точность – 0,686; FPR = 0,312; FNR = 0,398). В ходе анализа наиболее значимыми предикторами ПРК после консервативного родоразрешения стали срок гестации на момент родов, масса тела матери до беременности и во время родов, а также возраст матери. Ученые подчеркивают необходимость дальнейших научных исследований в данной области и уделяют наибольшее внимание консолидации больших массивов данных, исчисляющихся в сотнях тысяч случаев, для наиболее точного прогнозирования ПРК [53].
Американские ученые (Университет Джорджа Вашингтона) сравнили методы ML и традиционные статистические методы с целью повышения качества прогнозирования ПРК и гемотрансфузий. Для исследования были использованы данные родов, произошедших в 12 больницах США в период с 2002 по 2008 гг. Для разработки модели были использованы 50 признаков, включающих антенатальные и интранатальные характеристики, а также характеристики родов, в которых произошли роды. Модели прогнозирования были разработаны на основе следующих алгоритмов: логистическая регрессия, машины опорных векторов, многослойный персептрон, случайный лес и повышение градиента. Для оценки производительности были использованы область рабочей характеристики приемника под кривой (ROC-AUC) и область точности/отзыва под кривой (PR-AUC). При этом критериями служили послеродовое кровотечение 1000 мл и более, либо переливание компонентов крови. В результате анализа среди 228 438 родов у 5760 (3,1 %) женщин произошло ПРК, у 5170 (2,8 %) женщин было переливание крови, а 10344 (5,6 %) женщины соответствовали критериям комбинации трансфузия-ПРК. Наилучший прогностический результат показала модель ML с градиентным усилением (ROC-AUC = 0,833; PR-AUC = 0,210), которая превосходила результаты традиционных статистических методов. Среди предикторов кровотечения и гемотрансфузии наиболее существенными стали способ родоразрешения, повышение дозы окситоцина в родах, оснащенность больницы оборудованием и персоналом [54].
J. Liu с соавт. (Университет Цзинань, Гуанчжоу, Китай) применили модель ML для повышения точности прогнозирования ПРК при консервативных родах. Исследование проводилось на данных 10520 медицинских карт родов через естественные родовые пути, зарегистрированных с 2016 по 2020 гг. Среди всех родов, были отобраны 850 случаев ПРК (объем кровопотери более 500 мл) и 54 случая тяжелого ПРК (объем кровотечения более 1000 мл). В ходе работы ученые моделировали характеристики кривой контрактильной активности матки на основе 49 переменных с использованием моделей ML. Данные были разделены на обучающий и тестовый набор в отношении 90 % и 10 % соответственно. Точность модели сравнивалась с классическими статистическими моделями (логистическая регрессия). В качестве моделей ML использовались случайный лес, метод k-ближайших соседей (англ. k-nearest neighbors, KNN) и модель, интегрированная с Lightgbm (LGB) + LR. Среди протестированных инструментов модель машинного обучения LGB + LR показала наилучшие результаты в прогнозировании ПРК (AUC = 0,800). Наиболее значимыми прогностическими признаками стали гематокрит, индекс шока, частота сокращений матки, количество лейкоцитов, гестационная гипертензия, масса тела новорожденного, сила схваток, общее количество околоплодных вод и ИМТ. В ходе исследования существенное значение в повышении прогностической точности стала контрактильная активность матки (частота и интенсивность схваток) [55].
A.B Zheutlin с соавт. (Медицинская школа Икан на горе Синай, Нью-Йорк, США) дообучили разработанную ими ранее модель ML для повышения качества прогнозирования ПРК. В ходе работы ученые объединили результаты нескольких методов ML (деревовидных и регрессионных) для надежного выбора функций, назвав ее моделью «интегрированного машинного обучения». Относительно каждого случая беременности были использованы сведения, доступные за 8 мес до беременности и до момента родов включительно. В разработке модели были отобраны 24 клинических переменных. Когорта включала 70 948 родов, при этом распространенность ПРК составила 9 %. Все данные были разделены на обучающую (80 %) и тестовую (20 %) выборки. Производительность разработанной модели составила AUС-ROC = 0,73 в обу-
чающем наборе и AUС-ROC = 0,72 в тестовом наборе. Среди используемых клинических переменных КС, анемия, снижение гематокрита, время от госпитализации до родоразрешения, показатели артериального давления, а также ширина распределения эритроцитов, количество эритроцитов и средний корпускулярный гемоглобин были наиболее значимыми в прогнозировании ПРК [56].
Калифорнийские ученые G.J. Escobar с соавт. разработали модель, которую можно было бы использовать для прогнозирования различных акушерских осложнений, в том числе кровотечений. Прогноз должен был строиться путем анализа регулярно вводимых анамнестических данных и осуществляться в режиме реального времени при работе с электронными медицинскими записями. Ученые провели ретроспективное когортное исследование с раздельной проверкой. Модель должна была прогнозировать как неблагоприятные события со стороны матери (например, разрыв матки, послеродовое кровотечение) и плода (например, мертворождение), так и неонатальные (например, гипоксически-ишемическая энцефалопатия). Используемая выборка (n = 303 678) включала в себя роды, произошедшие в период с 1 января 2010 г. по 31 марта 2018 г. в 15 исследуемых больницах, при этом 4 130 (1,36 %) имели одно или более акушерское осложнение. Для обучения модели были использованы данные 209 611 родов, для проверки – 52 398. Затем обученная модель была применена к данным 41 669 родов, произошедших в период с 1 апреля 2017 г. по 31 марта 2018 г. для проведения валидации. Модель была построена на 35 различных переменных, включавших демографические данные, данные анамнеза, лабораторные анализы, показатели родоразрешения. В ходе исследования модель с градиентным усилением несколько превзошла по эффективности модель логистической регрессии (AUC-ROC = 0,786 против 0,778). С использованием разработанной модели удалось выявить 51 % неблагоприятных исходов. Авторы отмечают высокую пользу данных электронных медицинских карт для разработки автоматизированных моделей прогнозирования и необходимость дальнейших исследований в данной области [57].
Результаты приведенных выше исследований представлены в таблице 1.
Таблица 1 (начало). Результаты исследований по применению методов машинного обучения в прогнозировании акушерских кровотечений.
Table 1 (beginning). Study data on using machine learning methods in predicting obstetric hemorrhage.
Исследование (cтрана) Study (country) | Выборка (кол-во) Sample size | Методы ML ML methods | Оценка эффективности Efficacy assessment | Факторы риска Risk factors |
Y. Zhang et al. [48] Китай (Пекин) China (Peking) | 3842 | XGBoost Дерево решений Decision tree SVM | Точность 96,7 % Accuracy 96.7 % | Снижение тонуса матки, длительность родов, длительность введения окситоцина, травмы Decreased uterine tone, duration of labor, duration of oxytocin administration, trauma |
K.K. Venkatesh et al. [49] США (Северная Каролина) USA (North Carolina) | 7279 | XGBoost | Точность 95 % Accuracy 96.7 % AUC = 0,93 | ИМТ, температура тела, макросомия плода, уровень САД, анемия BMI, body temperature, fetal macrosomia, SBP level, anemia |
Случайный лес Random forest | Точность 95 % Accuracy 96.7 % AUC = 0,92 | |||
J. Liu et al. [50] Китай (Нанкин) China (Nanking) | 210 | ИНС ANN | Точность 75,6 %, чувствительность 73,6 %, специфичность 74,46 % Accuracy 75.6 %, sensitivity 73.6 %, specificity 74.46 % | Предлежание плаценты в области рубца на матке по МРТ MRI-based placenta previa in uterine scar |
Y. Miyagi et al. [51] Япония (Медицинский университет Сайтамы) Japan (Saitama Medical University) | 22330 (150) | AI | – | Уровень фибриногена менее 237 мг/дл Fibrinogen level below 237 mg/dL |
J.M. Westcott et al. [52] США (Нью-Йорк) USA (New York) | 2179 | Случайный лес Random forest Дерево решений Decision tree SVM | Первая модель – прогноз до родов: точность 98,8 % чувствительность 0,76, AUC = 0,97 (до родов) Model 1 – antenatal prognosis: accuracy 98.8 %, sensitivity 0.76, AUC = 0.97 (before delivery) | ИМТ, гематокрит, кесарево сечение, уровень тромбоцитов BMI, hematocrit, cesarean section, platelet level |
Вторая модель – прогноз во 2-м периоде родов: точность 98 %, чувствительность 0,737 %, AUC = 0,955 Model 2 – labor stage 2 prognosis: accuracy 98 %, sensitivity 0.737 %, AUC = 0.955 | ||||
M. Akazawa et al. [53] Япония (Восточный центр Токийского женского медицинского университета) Japan (Tokyo Women's Medical University Center East) | 9894 | ИНС (логистическая регрессия, SVM, случайный лес, деревья решений, XGboost) ANN (logistic regression, SVM, random forest, decision trees, XGboost) | AUC-ROC = 0,708 Точность 0,686 Accuracy 0.686 FPR = 0,312 FNR = 0,398 | Срок гестации на момент родов, масса тела матери до беременности, масса тела матери во время родов, возраст матери Gestational age at delivery, maternal body weight before pregnancy, maternal body weight during delivery, mother's age |
Таблица 1 (окончание). Результаты исследований по применению методов машинного обучения в прогнозировании акушерских кровотечений.
Table 1 (ending). Study data on using machine learning methods in predicting obstetric hemorrhage.
Исследование (cтрана) Study (country) | Выборка (кол-во) Sample size | Методы ML ML methods | Оценка эффективности Efficacy assessment | Факторы риска Risk factors |
H. Ahmadzia et al. [54] США (Университет Джорджа Вашингтона) USA (George Washington University) | 228438 | Модель с градиентым усилением Gradient boost model | ROC-AUC = 0,833 PR-AUC = 0,210 | Способ родоразрешения, повышение дозы окситоцина в родах, оснащенность больницы оборудованием и персоналом Method of delivery, escalating oxytocin dose during delivery, hospital equipment and personnel |
J. Liu et al. [55] Китай (Университет Цзинань, Гуанчжоу) China (Jinan University, Guangzhou) | 10520 | Случайный лес, Random forest, KNN LightGBM-integrated model (LGB)+LR | AUC = 0,800 | Гематокрит, индекс шока, частота и сила сокращений матки, количество лейкоцитов, гестационная гипертензия, масса тела новорожденного, общее количество околоплодных вод, ИМТ Hematocrit, shock index, frequency and strength of uterine contractions, white blood cell count, gestational hypertension, neonate weight, total amount of amniotic fluid, BMI |
A.B. Zheutlin et al. [56] США (Медицинская школа Икан на горе Синай Нью-Йорк) USA (Icahn School of Medicine at Mount Sinai, New York) | 70948 | Модель «интегрированного машинного обучения» на основе регрессионных и древовидных алгоритмов Integrated machine learning using regression and tree algorithms | AUС-ROC = 0,72 | Кесарево сечение, анемия, снижение гематокрита, время от госпитализации до родоразрешения, показатели артериального давления, ширина распределения эритроцитов, количество эритроцитов и средний корпускулярный гемоглобин Caesarean section, anemia, decreased hematocrit, time from hospitalization to delivery, blood pressure, red blood cell distribution width, red blood cell count and mean corpuscular hemoglobin |
G.J. Escobar et al. [57] США (Калифорния) USA (California) | 303678 | Модель с градиентым усилением Gradient boost model | AUC-ROC = 0,786 | 35 различных факторов риска акушерских осложнений 35 different risk factors for obstetric complications |
Примечание: ML – машинное обучение; XGBoost – алгоритм экстремального градиентного бустинга; ИМТ – индекс массы тела; САД – систолическое артериальное давление; ИНС – искусственная нейронная сеть; МРТ – магнитно-резонансная томография; AI – искусственный интеллект; SVM – метод опорных векторов; ROC-AUC – площадь под кривой ошибок; PR-AUC – площадь под PR-кривой (PR-кривая – соотношение точности (Precision) и полноты (Recall); FPR – частота ложных результатов; FNR – частота ложных отрицательных результатов; KNN – метод k-ближайших соседей; LGB – классификатор повышения градиента в машинном обучении c использованием древовидных алгоритмов обучения;
LR – логистическая регрессия.
Note: ML – machine learning; XGBoost – extreme gradient boosting; BMI – body mass index; SBP – systolic blood pressure; ANN – artificial neural network; MRI – magnetic resonance imaging; AI – artificial intelligence; SVM – support vector machine; ROC-AUC – ROC-area under curve; PR-AUC – area under the curve precision/recall; FPR – false positive rate; FNR – false negative rate; KNN – k-nearest neighbors; LGB – gradient boosting classifier in machine learning using decision trees; LR – logistic regression.
Ограничения применения алгоритмов искусственного интеллекта / Limitations for use of artificial intelligence algorithms
Несмотря на успешные попытки внедрения AI в различные области медицины, применение этого метода относительно прогнозирования АК еще не получило достаточного распространения. Связано это с рядом ограничений. В первую очередь, это проблема внед-
рения AI в реальную клиническую практику. Производительность ML зависит от множества факторов, ключевыми из которых являются количество и качество данных [36]. В реальной практике данные зачастую носят неструктурированный характер, а работа с электронными базами данных среди практикующих врачей все еще не до конца налажена. Этот фактор может существенно влиять на размер выборки. Небольшие по размеру обучающие наборы данных могут привести к неправильным результатам и решениям. Следовательно, даже качественно разработанный и проверенный в лабораторных условиях алгоритм может не сработать в реальных условиях и на данных другого качества. Проблема переноса алгоритмов машинного обучения на реальную клиническую практику носит название «AI chasm» («Пропасть AI»).
С другой стороны, ограничения могут быть обусловлены неверной работой самих алгоритмов ML. Это может быть связано с изначально неправильно выбранной моделью обучения, например, при выборе слишком сложной модели вероятность ошибки алгоритма в процессе тестирования значительно выше, чем средняя ошибка, полученная при обучении, это носит название «переобучение». Если же выбрать недостаточно сложную модель обучения, алгоритм не полностью использует данные и не обеспечит достаточно малой величины средней ошибки на обучающей выборке, это носит название «недообучение».
Кроме того, работа с медицинскими данными всегда связана с определенной степенью конфиденциальности. Необходимо проводить обезличивание данных, но при этом сохранить доступ к клинически важной информации. Данная проблема сопряжена с этическими и юридическими рисками и проблемами ответственности, что может привести к недоверию пациентов и врачей к AI [36].
Следует иметь в виду, что AI не способен заменить врача, а является лишь вспомогательным инструментом, решающим повторяющиеся задачи и выполняющим точные математические расчеты, который значительно экономит время и усилия людей.
Заключение / Conclusion
Прогнозирование тяжелых акушерских осложнений, таких как кровотечения, остается важной медицинской, демографической и экономической проблемой во всем мире. Во времена высоких технологий искусственный интеллект представляется перспективным инструментом для решения данной проблемы. В акушерстве, как и в любой области медицины, ценным ресурсом являются массивные объемы данных. Применение алгоритмов AI для анализа этих массивов данных позволит их структурировать, классифицировать, а также разработать модели прогнозирования. Разработанные модели могут быть внедрены в электронные медицинские системы. Соответственно, уже при первом обращении пациента к специалисту при помощи автоматизированной системы он будет отнесен к определенной группе риска. В руках практикующих врачей окажется инструмент, который сможет помочь принять верные решения и своевременно назначать необходимые профилактические меры. В настоящее время ведется активная работа по изучению возможностей алгоритмов ML и внедрению их в медицинскую сферу. Однако даже имеющиеся разработки позволяют создавать эффективные и качественные модели прогнозирования медицинских осложнений. Очевидно, существует необходимость дальнейших исследований в разработке моделей для прогноза АК при помощи AI.
Список литературы
1. Хашукоева А.З., Смирнова Л.Ю., Протопопова Л.О., Хашукоева З.З. Акушерские кровотечения. Лечащий врач, 2004. Режим доступа: https://www.lvrach.ru/2004/10/4531880. [Дата обращения: 26.01.2024].
2. Sebghati M., Chandraharan E. An update on the risk factors for and management of obstetric haemorrhage. Womens Health. 2017;13(2):34– 40. https://doi.org/10.1177/1745505717716860.
3. Pettersen S., Falk R.S., Vamgen S., Nyflot L.T. Exploring trends of severe postpartum haemorrhage: a hospital-based study. BMC Pregnancy Childbirth. 2023;23(1):363. https://doi.org/10.1186/s12884-023-05702-6.
4. Thams A.B., Larsen M.H., Rasmssen S.C. et al. Incidence of postpartum hemorrhage and risk factors for recurrence in the subsequent pregnancy. Arch Gynecol Obstet. 2023;307(4):1217–24. https://doi.org/10.1007/s00404-022-06591-4.
5. Филиппов О.С., Гусева Е.В. Материнская смертность в Российской Федерации в 2019 г. Проблемы репродукции. 2020;26(6–2):8–26. https://doi.org/10.17116/repro2020260628.
6. Материнская смертность в Российской Федерации в 2018 году (методическое письмо от 18.09.2019 №15-4/л/2-8714). М.: Министерство здравоохранения Российской Федерации, 2019. 100 с. Режим доступа: https://oblzdrav.volgograd.ru/upload/iblock/79c/Metodicheskoe_pismo_po_MS_2018.pdf. [Дата обращения: 26.01.2024].
7. Зиганшин А.М., Кулавский В.А., Нагимова Э.М. и др. Материнская смертность от послеродовых кровотечений. Медицинский вестник Башкортостана. 2019;(6):53–7.
8. Say L., Chou D., Gemmill A. et al. Global causes of maternal death: a WHO systematic analysis. Lancet Glob Health. 2014;2(6):e323–33. https://doi.org/10.1016/S2214-109X(14)70227-X.
9. Trends in maternal mortality: 2000 to 2017. Estimates by WHO, UNICEF, UNFPA, World Bank Group and the United Nations Population Division. Geneva: World Health Organization, 2019. 119 р. Режим доступа: https://www.unfpa.org/sites/default/files/pub-pdf/Maternal_mortality_report.pdf. [Дата обращения: 26.01.2024].
10. Барановская Е.И. Материнская смертность в современном мире. Акушерство, Гинекология и Репродукция. 2022;16(3):296–305. https://doi.org/10.17749/2313-7347/ob.gyn.rep.2022.279.
11. Committee on Practice Bulletins-Obstetrics. Practice Bulletin No. 183: Postpartum Hemorrhage. Obstet Gynecol. 2017;130(4):e168–e186. https://doi.org/10.1097/AOG.0000000000002351.
12. Сурина М.Н., Марочко Т.Ю. Акушерские кровотечения как основная причина критических состояний и материнской смертности. Фундаментальная и клиническая медицина. 2016;1(3):81–7.
13. Клинические рекомендации – Послеродовое кровотечение – 2021- 2022-2023 (16.01.2023). М.: Министерство здравоохранения Российской Федерации, 2023. 56 с. Режим доступа: http://disuria.ru/_ld/12/1271_kr21O67O72MZ.pdf. [Дата обращения: 26.01.2024].
14. Мочалова М.Н., Сидоркина А.Г., Мудров В.А. Современные методы прогнозирования и диагностики послеродового кровотечения. Сибирское медицинское обозрение. 2022;(4):13–21. https://doi.org/10.20333/25000136-2022-4-13-21.
15. Glonnegger H., Glenzer M.M., Lancaster L. et al. Prepartum anemia and risk of postpartum hemorrhage: a meta-analysis and brief review. Clin Appl Thromb Hemost. 2023;29:10760296231214536. https://doi.org/10.1177/10760296231214536.
16. Maghami N.G., Helfenstein F., Manegold-Brauer G. et al. Risk factors for postpartum haemorrhage in women with histologically verified placenta accreta spectrum disorders: a retrospective single-centre cross-sectional study. BMC Pregnancy Childbirth. 2023;23(1):786. https://doi.org/10.1186/s12884-023-06103-5.
17. Heller D.S., Cramer, S.F., Turner, B.M. Abnormal uterine involution may lead to atony and postpartum hemorrhage: a hypothesis, with review of the evidence. Pediatr Dev Pathol. 2023;26(5):429–36. https://doi.org/10.1177/10935266231194698.
18. Wormer K.C., Jamil R.T., Bryant S.B. Acute postpartum hemorrhage. In: StatPearls [Internet]. Treasure Island (FL): StatPearls Publishing, 2024.
19. James A.H., Pacheco L.D., Konkle B.A. Management of pregnant women who have bleeding disorders. Hematology. Hematology Am Soc Hematol Educ Program. 2023;2023(1):229–36. https://doi.org/10.1182/hematology.2023000475.
20. Камилова М.Я., Аминзода Н.З. Особенности диагностики и лечения акушерских кровотечений, сопровождающихся коагулопатией. Вестник Авиценны. 2020;22(1):120–6. https://doi.org/10.25005/2074-0581-2020-22-1-120-126.
21. Westcott J.M., Hughes F., Liu W. et al. 638: Prediction of maternal hemorrhage: using machine learning to identify patients at risk. Am J Obstet Gynecol. 2020;222(1):S407. https://doi.org/10.1016/j.ajog.2019.11.653.
22. Hcini N., Mchirgui A., Pomar L. et al. Early prediction of blood loss and postpartum hemorrhage after vaginal delivery by ultrasound measurement of intrauterine content. Ultrasound Med Biol. 2020;46(11):3145–53. https://doi.org/10.1016/j.ultrasmedbio.2020.07.017.
23. Rubio-Álvarez A., Molina-Alarcón M., Arias-Arias Á., Hernández-Martínez A. Development and validation of a predictive model for excessive postpartum blood loss: a retrospective, cohort study. Int J Nurs Stud. 2018;79:114–21. https://doi.org/10.1016/j.ijnurstu.2017.11.009.
24. Liu C.-N., Yu F.-B., Xu Y.-Z. et al. Prevalence and risk factors of severe postpartum hemorrhage: a retrospective cohort study. BMC Pregnancy Childbirth. 2021;21(1):332. https://doi.org/10.1186/s12884-021-03818-1.
25. Ambounda N.L., Woromogo S.H., Yagata-Moussa F.-E. et al. Primary postpartum haemorrhage at the Libreville University Hospital Centre: epidemiological profile of women. PLoS One. 2021;16(9):e0257544. https://doi.org/10.1371/journal.pone.0257544.
26. Helman S., Drukker L., Fruchtman H. et al. Revisit of risk factors for major obstetric hemorrhage: insights from a large medical center. Arch Gynecol Obstet. 2015;292(4):819–28. https://doi.org/10.1007/s00404-015-3725-y.
27. Almutairi W.M. Incidences of atonic postpartum hemorrhage and related risk factors at a Tertiary Hospital in Saudi Arabia. Nurs Rep. 2020;10(2):164–71. https://doi.org/10.3390/nursrep10020020.
28. Ившин А.А., Болдина Ю.С., Гусев А.В. Роль искусственного интеллекта в прогнозировании преждевременных родов. Проблемы репродукции. 2021;27(5):121–9. https://doi.org/10.17116/repro202127051121.
29. Mintz Y., Brodie R. Introduction to artificial intelligence in medicine. Minim Invasive Ther Allied Technol. 2019;28(2):73–81. https://doi.org/10.1080/13645706.2019.1575882.
30. Amisha M.P., Pathania M., Rathaur V.K. Overview of artificial intelligence in medicine. J Family Med Prim Care. 2019;8(7):2328–31. https://doi.org/10.4103/jfmpc.jfmpc_440_19.
31. Beam A.L., Kohane I.S. Big Data and Machine Learning in Health Care. JAMA. 2018;319(13):1317–8. https://doi.org/10.1001/jama.2017.18391.
32. Мишкин И.А., Концевая А.В., Гусев А.В., Драпкина О.М. Прогнозирование сердечно-сосудистых событий с помощью моделей пропорциональных рисков и моделей машинного обучения: систематический обзор. Современные проблемы здравоохранения и медицинской статистики. 2023;(2):804–29. https://doi.org/10.24412/2312-2935-2023-2-804-829.
33. Дружилов М.А., Кузнецова Т.Ю., Дружилова О.Ю. и др. Результаты ретроспективного анализа частоты ишемического инсульта и назначения антикоагулянтной терапии пациентам с фибрилляцией предсердий в зависимости от индекса массы тела. Российский кардиологический журнал. 2023;28(5):46–54. https://doi.org/10.15829/1560-4071-2023-5359.
34. Shimizu H., Nakayama K.I. Artificial intelligence in oncology. Cancer Sci. 2020;111(5):1452–60. https://doi.org/10.1111/cas.14377.
35. Сапожников К.В., Сорокина И.В., Гусев А.В. и др. Профилактика фебрильной нейтропении у онкологических пациентов: данные реальной клинической практики. Современная онкология. 2023;25(1):115–22. https://doi.org/10.26442/18151434.2023.1.202138.
36. Contreras I., Vehi J. Artificial intelligence for diabetes management and decision support: literature review. J Med Internet Res. 2018;20(5):e10775. https://doi.org/10.2196/10775.
37. Ting D.S.W., Pasquale L.R., Peng L. et al. Artificial intelligence and deep learning in ophthalmology. Br J Ophthalmol. 2019;103(2):167–75. https://doi.org/10.1136/bjophthalmol-2018-313173.
38. Гусев А.В., Владзимирский А.В., Шарова Д.Е. и др. Развитие исследований и разработок в сфере технологий искусственного интеллекта для здравоохранения в Российской Федерации: итоги 2021 года. Digital Diagnostics. 2022;3(3):178–94. https://doi.org/10.17816/DD107367.
39. Handelman G.S., Kok H.K., Chandra R.V. et al. eDoctor: machine learning and the future of medicine. J Intern Med. 2018;284(6):603–19. https://doi.org/10.1111/joim.12822.
40. Rajula H.S.R., Verlato G., Manchia M. et al. Comparison of conventional statistical methods with machine learning in medicine: diagnosis, drug development, and treatment. Medicina (Kaunas). 2020;56(9):455. https://doi.org/10.3390/medicina56090455.
41. Sidey-Gibbons J.A.M., Sidey-Gibbons C.J. Machine learning in medicine: a practical introduction. BMC Med Res Methodol. 2019;19(1):64. https://doi.org/10.1186/s12874-019-0681-4.
42. Lanera C., Berchialla P., Sharma A. et al. Screening PubMed abstracts: is class imbalance always a challenge to machine learning? Syst Rev. 2019;8(1):317. https://doi.org/10.1186/s13643-019-1245-8.
43. Lee K.-S., Ahn K.H. Application of artificial intelligence in early diagnosis of spontaneous preterm labor and birth. Diagnostics (Basel). 2020;10(9):733. https://doi.org/10.3390/diagnostics10090733.
44. Наркевич А.Н., Виноградов К.А., Гржибовский А.М. Интеллектуальные методы анализа данных в биомедицинских исследованиях: деревья классификации. Экология человека. 2021;(3):54–64. https://doi.org/10.33396/1728-0869-2021-3-54-64.
45. Попов М.С. Реализация случайного леса для решения задач прогнозирования с помощью языка программирования R. Modern Science. 2020;(8–2):305–9.
46. Han J., Micheline K. Classification and prediction. In: Data mining: concepts and techniques (2nd edition). Elsevier: San Francisco, CA, USA, 2006. 285–378.
47. Иванов Н.В. Нейронные сети в медицине. Сложные системы. 2018;(4):46–70.
48. Zhang Y., Wang X., Han N., Zhao R. Ensemble learning based postpartum hemorrhage diagnosis for 5G remote healthcare. IEEE Access. 2021;9:18538–48. https://doi.org/10.1109/ACCESS.2021.3051215.
49. Venkatesh K.K., Strauss R.A., Grotegut C.A. et al. Machine learning and statistical models to predict postpartum hemorrhage. Obstet Gynecol. 2020;135(4):935–44. https://doi.org/10.1097/AOG.0000000000003759.
50. Liu J., Wu T., Peng Y., Luo R. Grade prediction of bleeding volume in cesarean section of patients with pernicious placenta previa based on deep learning. Front Bioeng Biotechnol. 2020;8:343. https://doi.org/10.3389/fbioe.2020.00343.
51. Miyagi Y., Tada K., Yasuhi I. et al. New method for determining fibrinogen and FDP threshold criteria by artificial intelligence in cases of massive hemorrhage during delivery. J Obstet Gynaecol Res. 2020;46(2):256–65. https://doi.org/10.1111/jog.14166.
52. Westcott J.M., Hughes F., Liu W. et al. Prediction of maternal hemorrhage using machine learning: retrospective cohort study. J Med Internet Res. 2022;24(7):e34108. https://doi.org/10.2196/34108.
53. Akazawa M., Hashimoto K., Katsuhiko N., Kaname Y. Machine learning approach for the prediction of postpartum hemorrhage in vaginal birth. Sci Rep. 2021;11(1):22620. https://doi.org/10.1038/s41598-021-02198-y.
54. Ahmadzia H.K., Dzienny A.C., Bopf M. et al. Machine learning for prediction of maternal hemorrhage and transfusion: model development study. JMIR Bioinform Biotech. 2024;5:e52059. https://doi.org/10.22541/au.166479488.87844494/v1.
55. Liu J., Wang C., Yan R. et al. Machine learning-based prediction of postpartum hemorrhage after vaginal delivery: combining bleeding high risk factors and uterine contraction curve. Arch Gynecol Obstet. 2022;306(4):1015–25. https://doi.org/10.1007/s00404-021-06377-0.
56. Zheutlin A.B., Vieira L., Shewcraft R.A. et al. Improving postpartum hemorrhage risk prediction using longitudinal electronic medical records. J Am Med Inform Assoc. 2022;29(2):296–305. https://doi.org/10.1093/jamia/ocab161.
57. Escobar G.J., Soltesz L., Schuler A. et al. Prediction of obstetrical and fetal complications using automated electronic health record data. Am J Obstet Gynecol. 2021;224(2):137–147.e7. https://doi.org/10.1016/j.ajog.2020.10.030.
Об авторах
Ю. С. БолдинаРоссия
Болдина Юлия Сергеевна – аспирант, старший преподаватель кафедры акушерства и гинекологии, дерматовенерологии Медицинского института имени профессора А.П. Зильбера ФГБОУ ВО «Петрозаводский государственный университет», Петрозаводск, Россия; врач акушер-гинеколог ГБУЗ Республики Карелия «Республиканский перинатальный центр имени Гуткина К.А.»
185035 Петрозаводск, проспект Ленина, д. 33;
185002 Петрозаводск, ул. Сыктывкарская, д. 9
А. А. Ившин
Россия
Ившин Александр Анатольевич – к.м.н., доцент, зав. кафедрой акушерства и гинекологии, дерматовенерологии Медицинского института имени профессора А.П. Зильбера
185035 Петрозаводск, проспект Ленина, д. 33
Что уже известно об этой теме?
► Акушерское кровотечение – тяжелое жизнеугрожающее осложнение, которое является одной из лидирующих причин материнской заболеваемости и смертности. Надлежащая оценка риска кровотечений позволит обеспечить более точную диагностику, своевременную профилактику и эффективную лечебную тактику.
► В качестве инструментов для расчета риска акушерских кровотечений все большую ценность приобретают разработки на основе новейших компьютерных технологий. Основной целью многочисленных научных исследований является поиск значимых факторов риска, оказывающих наибольшее влияние на возникновение кровотечений во время беременности, родов или в послеродовом периоде.
Что нового дает статья?
► Этот научный обзор отечественной и зарубежной литературы раскрывает перспективы использования методов машинного обучения для прогнозирования акушерских кровотечений, а также результаты недавних исследований по данному направлению.
Как это может повлиять на клиническую практику в обозримом будущем?
► Ожидается, что разработка прогностических моделей в цифровом формате при помощи алгоритмов машинного обучения откроет новые пути повышения точности определения персонифицированного риска кровотечения. Это предположение основано на успешном отечественном и мировом опыте внедрения интегральных систем предиктивной аналитики в такие области медицины, как онкология, кардиология, офтальмология, репродуктивная медицина.
► Выявление женщин из группы высокого риска позволит более рационально проводить дородовое наблюдение и своевременное родоразрешение, определить верный план родов и применить лекарственные препараты с профилактической целью или осуществить перевод пациенток в медицинский центр, оказывающий более высокий уровень акушерской помощи.
Рецензия
Для цитирования:
Болдина Ю.С., Ившин А.А. Возможности машинного обучения в прогнозировании акушерских кровотечений. Акушерство, Гинекология и Репродукция. 2024;18(3):365-381. https://doi.org/10.17749/2313-7347/ob.gyn.rep.2024.491
For citation:
Boldina Yu.S., Ivshin A.A. Machine learning opportunities to predict obstetric haemorrhages. Obstetrics, Gynecology and Reproduction. 2024;18(3):365-381. (In Russ.) https://doi.org/10.17749/2313-7347/ob.gyn.rep.2024.491

Контент доступен под лицензией Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.