В докладе будет рассказано о некоторых исследовательских проектах лаборатории Машинного обучения и семантического анализа Института искусственного интеллекта МГУ.
1. Вероятностное тематическое моделирование и его применения в цифровых гуманитарных исследованиях. Примеры задач и открытые проблемы. Почему задача мягкой кластеризации больших текстовых корпусов не теряет актуальности в эпоху LLM — больших языковых моделей?
2. Автоматизация контент-анализа. Возможно ли по небольшой выборке размеченных экспертами фрагментов научить LLM детектировать нужные исследователю смыслы в миллионах текстов? Возможно ли построить одну универсальную модель для любых задач контент-анализа в любых предметных областях?
3. Мастерская знаний. Когда одни говорят о необходимости сохранения целеполагания за человеком, другие совершенствуют технологии полной замены человека в научных исследованиях. Как найти компромисс? Из каких компонент строить информационные системы будущего для поиска и анализа научной информации? Как научить искусственный интеллект выделять «главное» в море информации, если мы сами недостаточно владеем этим навыком?
Воронцов Константин Вячеславович — доктор физико-математических наук, профессор РАН, руководитель лаборатории машинного обучения и семантического анализа Института искусственного интеллекта МГУ (персональная страница).
Дискутантом по докладу выступит доктор технических наук Олеслав Александрович Антамошкин, заведующий кафедрой программной инженерии, профессор кафедры информационных технологий в креативных и культурных индустриях СФУ.
Ведущий семинара «Цифровая среда» DHRI@SFU — Андрей Юрьевич Володин (МГУ/СФУ).
Следить за новостями Института цифровых гуманитарных исследований (DHRI) удобно в телеграм-канале «Гуманитарии в цифре».
Вы будете получать информацию о предстоящих мероприятиях в онлайне в выбранных категориях.
Обещаем, никакого спама! Вы сможете отписаться в любое время.