Исследователи MIT используют новые методы машинного обучения для улучшения качества жизни пациентов путем снижения токсической химиотерапии и дозирования лучевой терапии для глиобластомы, самой агрессивной формы рака мозга.

Глиобластома - злокачественная опухоль, которая появляется в мозге или спинном мозге, а прогноз для взрослых - не более пяти лет. Пациенты должны выносить комбинацию лучевой терапии и нескольких препаратов, принимаемых каждый месяц. Медицинские специалисты обычно используют максимально безопасные лекарственные дозы, чтобы уменьшить опухоль. Но эти сильные фармацевтические препараты по-прежнему вызывают изнурительные побочные эффекты у пациентов.

Для получения информации о том, как проводят лечение глиобластомы в Израиле лучшие специалисты страны, оставьте заявку и мы свяжемся с Вами в ближайшее время.

В статье, представленной на следующей неделе на конференции Machine Learning for Healthcare 2018 в Стэнфордском университете, исследователи MIT Media Lab подробно описывают модель, которая может сделать схемы дозирования менее токсичными, но все же эффективными. Приведенная в основе «самообучающейся» техники машинного обучения, модель рассматривает схемы лечения, которые в настоящее время используются, и итеративно корректирует дозы. В конечном счете, модель находит оптимальный план лечения с наименьшей возможной эффективностью и частотой доз, которые все равно должны уменьшать размеры опухолей до степени, сравнимой с традиционными режимами.

В имитационных испытаниях для 50 пациентов модель машинного обучения разработала циклы лечения, которые уменьшали до четверти или половины почти всех доз, сохраняя при этом тот же потенциал сокращения опухоли. Много раз он пропускал дозы вообще, планируя только два раза в год вместо ежемесячных.

«Мы сохранили цель, когда мы должны помогать пациентам, уменьшая размеры опухоли, но в то же время мы хотим убедиться, что качество жизни - токсичность дозирования - не приводит к подавляющей болезни и вредным побочным эффектам», говорит Пратик Шах, главный исследователь Лаборатории СМИ, который руководил этим исследованием.

Модель исследователей использует метод под названием усиленное обучение (RL), метод, основанный на поведенческой психологии, в котором модель учится поддерживать определенное поведение, которое приводит к желаемому результату.

Эта техника включает в себя искусственно интеллектуальные «агенты», которые завершают «действия» в непредсказуемой, сложной среде, чтобы достичь желаемого «результата». Всякий раз, когда он завершает действие, агент получает «вознаграждение» или «штраф» в зависимости от того, ведет ли действие к результату. Затем агент корректирует свои действия для достижения этого результата.

Вознаграждения и штрафы в основном положительные и отрицательные числа, скажем +1 или -1. Их значения варьируются в зависимости от предпринятых действий, вычисленных по вероятности успеха или неудачи при исходе, среди других факторов. Агент по существу пытается количественно оптимизировать все действия на основе значений вознаграждения и штрафа, чтобы получить максимальный балл результата для данной задачи.

Этот подход был использован для обучения компьютерной программе DeepMind.

Исследователи адаптировали модель RL для лечения глиобластомы, которые используют комбинацию препаратов темозоломида (TMZ) и прокарбазина, ломустина и винкристина (ПВХ), вводимых в течение недель или месяцев.

Агент модели расчесывает традиционно применяемые режимы. Эти схемы основаны на протоколах, которые использовались клинически в течение десятилетий и основаны на испытаниях на животных и различных клинических испытаниях. Онкологи используют эти установленные протоколы, чтобы предсказать, сколько доз давать пациентам по весу.

Поскольку модель исследует режим, при каждом запланированном интервале дозирования, скажем, раз в месяц, он решает одно из нескольких действий. Он может, во-первых, либо инициировать, либо удерживать дозу. Если он управляет, он затем решает, нужна ли вся доза или только часть. При каждом действии он использует другую клиническую модель, часто используемую для прогнозирования изменения размера опухоли в ответ на лечение - чтобы увидеть, уменьшает ли действие средний диаметр опухоли. Если да, то модель получает вознаграждение.

Тем не менее, исследователи также должны были убедиться, что модель не просто убирает максимальное количество и эффективность доз. Всякий раз, когда модель решает управлять всеми полными дозами, она наказывается, поэтому вместо этого она выбирает меньше доз. «Если все, что мы хотим сделать, это уменьшить средний диаметр опухоли, и пусть он принимает любые действия, которые он хочет, он будет принимать наркотики безответственно», - говорит Шах. «Вместо этого мы сказали: « Нам нужно уменьшить вредные действия, которые требуются для достижения этого результата».

Это представляет собой «неортодоксальную модель RL, описанную в статье в первый раз», - говорит Шах, который взвешивает потенциальные негативные последствия действий (доз) против исхода (уменьшение опухоли). Традиционные модели RL работают с одним результатом, таким как выигрыш в игре, и предпринимают любые действия, которые максимизируют этот результат. С другой стороны, модель исследователей при каждом действии имеет гибкость, чтобы найти дозу, которая не обязательно исключительно максимизирует уменьшение опухоли, но которая обеспечивает идеальный баланс между максимальным снижением опухоли и низкой токсичностью. Этот метод, добавляет он, имеет различные медицинские и клинические исследования, где действия по лечению пациентов должны регулироваться для предотвращения вредных побочных эффектов.

Исследователи подготовили модель для 50 моделируемых пациентов, случайно выбранных из большой базы данных пациентов с глиобластомой, которые ранее подвергались традиционным методам лечения. Для каждого пациента модель проводила около 20 000 пробных пробных испытаний. После завершения обучения модель изучила параметры для оптимальных режимов. При применении новых пациентов модель использовала эти параметры для формулирования новых схем, основанных на различных ограничениях, которые предоставили исследователи.

Затем исследователи проверили модель на 50 новых имитируемых пациентов и сравнили результаты с результатами обычного режима с использованием как TMZ, так и PVC. При отсутствии штрафа за дозировку модель разработала почти идентичные схемы для специалистов. Тем не менее, учитывая небольшие и большие дозы, он существенно снижает частоту и ихэффективность, уменьшая размеры опухоли.

Исследователи также разработали модель для лечения каждого пациента индивидуально, а также в одной когорте и достигли аналогичных результатов (медицинские данные для каждого пациента были доступны исследователям). Традиционно один и тот же режим дозирования применяется к группам пациентов, но различия в размере опухоли, истории болезни, генетических профилях и биомаркерах могут все изменить, как лечить пациента. Эти переменные не учитываются при традиционных клинических испытаниях и других методах лечения, что часто приводит к плохой реакции на терапию в больших популяциях, говорит Шах.

Источник: https://medicalxpress.com/news/2018-08-machine-learning-fewest-smallest-doses-brain.html

 

Дата публикации: 
пятница, августа 10, 2018