🔴 Исследователи из лаборатории Yandex Research разработали новую нейросетевую архитектуру для работы с табличными данными — TabM. Она успешно конкурирует с классическими моделями градиентного бустинга — CatBoost, XGBoost и LightGBM, которые долгое время считались лучшим решением для табличных данных.
Где её можно использовать: в бизнесе, исследованиях и медицине. Модели для работы с табличными данными помогают оптимизировать поставки, спрогнозировать энергопотребление, классифицировать пациентов по риску заболеваний.
Например, на Kaggle — платформе для международных соревнований по ML и анализу данных — TabM применяли, чтобы предсказывать выживаемость пациентов после трансплантации костного мозга. Призёры и победители, которые использовали TabM для этой и других задач, получили призовые в 60 тысяч долларов.
Важная особенность: в TabM эффективно реализован «ансамбль моделей». То есть несколько моделей проводят свой анализ, после чего прогноз усредняется. Это позволяет как давать точные прогнозы, так и эффективно использовать вычислительные ресурсы.
↗️ Архитектура TabM доступна разработчикам и исследователям — на GitHub. Подробнее о ней читайте в научной статье — на arXiv.
Подписывайтесь 🔴 @yandex
