Исследование ИТМО: стали известны лидеры Open Source в России

Специалисты исследовательского центра «Сильный ИИ в промышленности» ИТМО изучили особенности и тенденции в развитии и использовании общемирового опенсорса в области машинного обучения и работы с данными в России. По результатам исследования, в тройке компаний-лидеров среди российских разработчиков опенсорс-решений оказались Яндекс, Сбер и Т-Банк.
Исследование ИТМО: стали известны лидеры Open Source в России
Freepik
Исследователи также назвали топ-5 проектов в разных категориях на основе мнений экспертов ведущих российских бигтехов и университетов, а также открытых данных на GitHub и PyPI.

Исследование разделили на две части. В первой авторы проанализировали, как используется опенсорс в России. Выяснилось, что почти все компании-разработчики открытых решений в Data/ML целятся не только на внутренний, но и на международный рынок. Пользователи, в свою очередь, также выбирают решения, исходя из их эффективности, а не принадлежности разработчика к конкретной стране.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

На основе мнений экспертов и открытых данных на GitHub и PyPI был составлен топ-5 проектов в разных категориях:

  • ML и алгоритмы;
  • математика;
  • инфраструктура;
  • визуализация BI;
  • хранение данных и MLOps.

В список лидеров вошли разработки как отечественных, так и международных компаний, например, CatBoost, LangChain, Spark, MetaBase, Numpy, ClickHouse.

Во второй части исследования авторы определили лидеров среди российских компаний-разработчиков, опираясь на несколько критериев. Среди них – количество open-source проектов по тематическим категориям в области Data/ML, показатели используемости этих проектов в России, а также уровень качества реализации репозиториев, количество контрибьюторов и их активность. По большинству показателей тройкой лидеров стали Яндекс, Сбер и Т-Банк. В топ-10 также вошли Postgres Pro, VK, Авито, Evrone, МТС, Selectel и топовые университеты, в том числе ИТМО.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
лучшие разработчики в области машинного обучения и больших данных в России
Freepik
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

В исследовании также приняли участие эксперты из Яндекса, Сбера, Т-Банка, VK, Wildberries, Рокет Контрол, CodeScoring и МФТИ. С их помощью удалось выделить сильные и слабые стороны опенсорса, определить работающие и неработающие способы популяризации и продвижения опенсорс-решений, а также сформулировать нюансы взаимодействия с сообществом.

По результатам экспертного опроса исследователи сформировали основные тенденции и мнения, связанные с общемировым опенсорс-движением.

Основной тезис по использованию платформ — GitHub по прежнему считается стандартом де-факто для открытого кода, но интерес к альтернативным площадкам (Gitee, GitVerse) не спадает. Среди перспектив развития опенсорса эксперты выделяют сохранение ключевой роли человека на фоне ИИ, запрос на демократизацию и автоматизацию применения ИИ-решений, а также «международность» open source сообщества. Кроме того, участники исследования отмечают, что тезис «вклад в опенсорс – помощь конкурентам» уходит в прошлое — все больше компаний нацелены на развитие отрасли в целом. Также, по словам экспертов, необходимо вкладываться в опенсорс-проекты финансово — у бигтехов есть для этого ресурсы, но сейчас им важно сохранить позицию на рынке. Авторы исследования входят в сообщество ITMO OpenSource — одного из крупнейших в стране сообществ открытого кода, включающего около 1000 участников.

Экосистема открытого кода в области ИИ, созданная в ИТМО, — одна из самых проработанных и масштабных среди академических. ITMO OpenSource проводит регулярные митапы, сотрудничает с сообществом Open Data Science, привлекает студентов и аспирантов к реализации открытых проектов. Исследование даст новым участникам опенсорс-движения представление о происходящем в этой области, познакомит с точками входа и лучшими практиками.