Перейти к содержимому
AUTHORВЫПУСК №008 → АВТОМАТИЗАЦИЯ АГЕНТАМИ: 90% НЕ ПРОМПТ / имейте совесть, когда будете делиться или копировать
>AISTUDY_

Модуль md.1

Достоверность — фундамент всего

Почему медицинский LLM галлюцинирует и чем это опасно для пациента. RAG и опора на источники: как заставить агента цитировать, а не выдумывать. Бенчмарки MedQA, PubMedQA, MedHallu — как измерять качество и не обманываться

3 уроков · ~2 часа

Уроки

  1. 1 Почему медицинский LLM галлюцинирует и чем это опасно
    35 мин
  2. 2 RAG и опора на источники: заставить агента цитировать
    40 мин
  3. 3 Бенчмарки и проверка: MedQA, PubMedQA, MedHallu
    40 мин

Обзор модуля

Ядро трека. Сквозная боль медицинского AI, на которую указывают все источники, — достоверность и галлюцинации. Этот модуль учит главному навыку: заставить агента опираться на проверяемые источники и уметь измерять, насколько ему можно доверять.

Уровень: Средний Время: ~2 часа Предварительные знания: Модуль md.0, базовое понимание работы LLM


Чему вы научитесь

После прохождения модуля вы сможете:

  • Объяснять механизм галлюцинаций LLM и почему в медицине они особенно опасны
  • Строить RAG-конвейер, который заземляет ответ агента на источники с цитатами
  • Различать виды галлюцинаций и распознавать «уверенный, но ложный» ответ
  • Читать результаты медицинских бенчмарков (MedQA, PubMedQA, MedHallu) без самообмана

Контекст: почему этот модуль второй

После того как задана рамка ответственности, достоверность — следующий по важности слой. Все последующие модули (RAG, мультиагентность, offline) опираются на навык «не доверяй, проверяй», который мы отрабатываем здесь.

// Обсуждение

Можно писать анонимно. Укажите email, чтобы получать уведомления об ответах.