Достоверность — фундамент всего

Почему медицинский LLM галлюцинирует и чем это опасно для пациента. RAG и опора на источники: как заставить агента цитировать, а не выдумывать. Бенчмарки MedQA, PubMedQA, MedHallu — как измерять качество и не обманываться

3 уроков · ~2 часа

Обзор модуля

Ядро трека. Сквозная боль медицинского AI, на которую указывают все источники, — достоверность и галлюцинации. Этот модуль учит главному навыку: заставить агента опираться на проверяемые источники и уметь измерять, насколько ему можно доверять.

Уровень: Средний Время: ~2 часа Предварительные знания: Модуль md.0, базовое понимание работы LLM

Чему вы научитесь

После прохождения модуля вы сможете:

Объяснять механизм галлюцинаций LLM и почему в медицине они особенно опасны
Строить RAG-конвейер, который заземляет ответ агента на источники с цитатами
Различать виды галлюцинаций и распознавать «уверенный, но ложный» ответ
Читать результаты медицинских бенчмарков (MedQA, PubMedQA, MedHallu) без самообмана

Контекст: почему этот модуль второй

После того как задана рамка ответственности, достоверность — следующий по важности слой. Все последующие модули (RAG, мультиагентность, offline) опираются на навык «не доверяй, проверяй», который мы отрабатываем здесь.

Достоверность — фундамент всего

Уроки

Обзор модуля

Чему вы научитесь

Контекст: почему этот модуль второй

// Обсуждение