Платформа, на которой работают сервисы Яндекса, стала доступной всем. Мы выложили исходный код YTsaurus в опенсорс.
Что такое YTsaurus? Платформа для хранения и обработки очень большого количества данных. Её разработкой в Яндексе занимаются с 2010 года и продолжают совершенствовать до сих пор.
Что она делает в Яндексе? Почти каждый сервис Яндекса работает с помощью YTsaurus. Поиск использует её для построения поискового индекса, то есть для каждого слова составляет список сайтов, где оно встречается. Беспилотные автомобили используют платформу, чтобы обрабатывать данные о поездках и улучшать алгоритмы.
Что умеет YTsaurus? Обучать нейросети, выполнять различные аналитические расчёты и тяжёлые вычисления по модели MapReduce. Платформа поможет компаниям, которые накопили большой объём информации, и стартапам, если они собираются масштабировать свои сервисы или ищут универсальное и надёжное решение.
Что ещё? Команда YTsaurus нанимает бэкенд-разработчиков с уверенным знанием структур данных и алгоритмов, а также с опытом разработки распределённых систем.
YTsaurus — платформа распределенного хранения и обработки больших данных
YTsaurus — платформа с открытым исходным кодом, способная хранить и обрабатывать большие данные для десятков тысяч пользователей одновременно. Выполняйте задачи по Batch-обработке, Ad hoc аналитике, OLTP, машинному обучению, построению хранилищ данных и ETL!