July 21, 09:26

🔴 Исследователи из лаборатории Yandex Research разработали новую нейросетевую архитектуру для работы с табличными данными — TabM. Она успешно конкурирует с классическими моделями градиентного бустинга — CatBoost, XGBoost и LightGBM, которые долгое время считались лучшим решением для табличных данных.

Где её можно использовать: в бизнесе, исследованиях и медицине. Модели для работы с табличными данными помогают оптимизировать поставки, спрогнозировать энергопотребление, классифицировать пациентов по риску заболеваний.

Например, на Kaggle — платформе для международных соревнований по ML и анализу данных — TabM применяли, чтобы предсказывать выживаемость пациентов после трансплантации костного мозга. Призёры и победители, которые использовали TabM для этой и других задач, получили призовые в 60 тысяч долларов.

Важная особенность: в TabM эффективно реализован «ансамбль моделей». То есть несколько моделей проводят свой анализ, после чего прогноз усредняется. Это позволяет как давать точные прогнозы, так и эффективно использовать вычислительные ресурсы.

↗️ Архитектура TabM доступна разработчикам и исследователям — на GitHub. Подробнее о ней читайте в научной статье — на arXiv.

Подписывайтесь 🔴 @yandex